Introducción
La estadística descriptiva es una forma práctica y eficiente de organizar conjuntos de datos de forma gráfica, que permite encontrar características importantes de dichos datos, con la menor pérdida posible de información. Dichas gráficas son herramientas visuales que permiten dar cuenta del comportamiento de la distribución de datos.
Existen tres propiedades que describen la distribución de datos y son: las medidas de tendencia central, la dispersión y la forma.
Lo que se pretende con esta unidad es caracterizar conjuntos de datos numéricos usando como herramienta las medidas de tendencia central, ya que los datos tienen a agruparse en torno a un valor llamado centro de la distribución. Se tendrán en cuenta las medidas de variabilidad para ver la forma en la que los valores se dispersan alrededor del centro y las medidas de forma se establecen si la distribución de frecuencias presenta un comportamiento simétrico o sesgado. Finalmente, se estudia el teorema de Tchebysheff (Chebyshev) y la regla empírica que permiten estimar la cantidad de datos dentro de los intervalos definidos a partir de la desviación estándar entorno a la media.
Propósitos de aprendizaje
Propósito general
Analizar diferentes características propias de un conjunto de datos usando como herramienta las medidas de tendencia central.
Propósitos específicos
- Calcular las medidas de tendencia central para datos originales sin agrupar y para datos organizados en una tabla de distribuciones de frecuencia.
- Utilizar otras medidas de posición para descubrir propiedades de grandes conjuntos de datos cuantitativos.
- Interpretar las medidas obtenidas y sacar conclusiones acerca de las características de la variable que interviene.
- Hallar las medidas de dispersión para datos sin agrupar y para datos organizados en una distribución de frecuencias.
- Determinar la posición relativa de una observación dada a través de los valores estandarizados.
- Analizar si la distribución es simétrica o no conociendo las medidas de tendencia central.
- Calcular el grado de apuntamiento o de curtosis de un conjunto de datos.
- Aplicar el teorema de Tchebysheff y la regla empírica en la descripción de un conjunto de datos.
Medidas de tendencia central
Dado que los conjuntos de datos muestran una tendencia a agruparse alrededor de un punto "central" es posible encontrar un valor promedio que describa todo el conjunto de datos analizados, ese valor típico descriptivo, es llamado una medida de tendencia central y permite dar una característica relevante del conjunto de datos.
Normalmente se utilizan cuatro tipos de promedios como medidas de tendencia central, que son: media aritmética, mediana, moda y rango medio, pero además de estos existen otras clases de promedios o medidas de posición: media cuadrática, media cúbica, media geométrica, media armónica, cuartiles, deciles y percentiles.
Medidas de tendencia central
Media Aritmética o promedio x̄
Es el promedio de un conjunto de datos numéricos, que se obtiene sumando todos los valores numéricos o datos (x1 + x2 + …….xn) y dividiendo el resultado entre el número total de datos (n), a continuación se presenta su fórmula:
Entonces, el cálculo de la media se basa en todas las observaciones (x1, x2, x3,..., xn), del conjunto de datos y ninguna otra medida de tendencia central posee esta característica, veamos este ejemplo.
Ahora bien, la media aritmética descrita anteriormente se encontró para una serie de datos sin agrupar, pero cuando los datos se obtienen a partir de una distribución de frecuencias, es decir, que los datos están ordenados, el cálculo de la media es un poco diferente.
Donde (fi) representa la frecuencia del dato, xi son los valores que toma la variable y n es la suma de las frecuencias de los datos, veamos un par de ejemplos para comprenderla mejor.
Por su parte, la media aritmética ponderada se usa en el caso de que los datos del conjunto (xi) tengan valores o pesos diferentes (wi), que hacen referencia a su importancia.
Se calcula de la siguiente forma:
Estudiemos el siguiente ejemplo de un profesor.
Medidas de tendencia central
Mediana
La mediana de un grupo de datos se entiende como el valor ubicado en el centro de un conjunto de datos ordenado. No se ve afectada por los datos de los extremos como es el caso de la media aritmética, por ello es más útil en algunos casos.
En ocasiones los datos no se encuentran en su estado natural sino que se encuentran agrupados. Cuando la cantidad de datos es grande, se hace necesario organizarlos de alguna manera que permita un manejo más eficiente. Un forma de organizarlos puede ser agrupándolos en intervalos.
Medidas de tendencia central
Moda
En ocasiones es útil saber cuál es el valor que más se repite en un conjunto de datos, a ese valor se le conoce como la moda de la distribución.
La moda para datos agrupados se encuentra determinada como la clase modal; es decir, la clase correspondiente a la mayor frecuencia absoluta de la distribución. Luego se determina por interpolación usando la siguiente expresión:
Lm = Límite real inferior de la clase modal (la clase de mayor frecuencia)
d1 = Diferencia entre la frecuencia de la clase modal y la clase que le antecede.
d2 = Diferencia entre la frecuencia de la clase modal y la clase que le sigue.
C = Longitud o tamaño del intervalo.
Estudiemos un ejemplo de la moda a partir de una distribución de frecuencia.
Otras medidas de posición para el análisis de datos
Aparecen también algunas medidas útiles de posición "no central " que se utilizan para resumir o descubrir propiedades de grandes conjuntos de datos. A estas medidas se les denominan cuartiles.
Algunos de los cuartiles más utilizados son los deciles, que dividen los datos ordenados en décimos, y los percentiles, que los dividen en céntimos. Veamos el siguiente video.
![]() |
De acuerdo con lo anterior, se presenta el siguiente ejemplo para hallar cuartiles. |
Uso y aplicaciones de las medidas de posición
Para realizar una correcta aplicación de las medidas de posición es útil conocer las ventajas y desventajas de las mismas:
- Media Aritmética.
- Mediana.
- Moda.
Actividad de aprendizaje
![]() |
Le invitamos a realizar la siguiente actividad relacionada con los conceptos vistos hasta este punto en este ejercicio y con ello, fortalece tus conocimientos. |
Medidas de dispersión
La dispersión porque proporciona información adicional para juzgar la confiabilidad de la medida de tendencia central. En conjuntos de datos también es posible encontrar medidas de dispersión, que indican el grado de variación o diseminación en un conjunto de datos.
Si el valor de dispersión es pequeño significa que hay una gran uniformidad entre los datos, si se encuentra un gran valor, entonces indica poca uniformidad y cuando es cero quiere decir que todos los datos son iguales.
Las cuatro medidas de dispersión más comunes son:
- El rango o amplitud.
- La varianza.
- La desviación estándar.
- El coeficiente de variación.
Medidas de dispersión
Medidas de variabilidad absoluta
Su propósito es el proceso de cálculo de la desviación y se entiende como la media aritmética de los valores absolutos de las desviaciones respecto de la media. Es una aproximación a la cuantificación de la dispersión.
Para un conjunto de datos con n observaciones x1, x2, xn, la desviación media (DM) se calcula como sigue:

En donde:
x̄= Media aritmética de la muestra
n = Tamaño de la muestra
xi= i- ésimo valor de la variable aleatoria x
La desviación media incluye todos los datos y tiene en cuenta una medida de posición que puede ser la media o la mediana, veamos el siguiente ejemplo.
Para conjuntos de datos que están agrupados la desviación media se calcula de la misma forma que para datos no agrupados con la diferencia de que dicha expresión se multiplica adicionalmente por la frecuencia del intervalo, es decir:

En donde:
g = Número de intervalos o clases de la distribución de frecuencia.
xi = Punto medio de la i- ésima clase, o marca de clase de cada intervalo.
fi = Número de observaciones clasificadas en cada clase o intervalo (frecuencia absoluta).
Medidas de dispersión
Medidas de variabilidad relativa
Coeficiente de variación
El coeficiente de variación es una medida relativa de dispersión y se expresa como porcentaje y no en términos de unidades de los datos de la distribución. Se usa para comparar la variabilidad de dos o más grupos de datos que tienen diferentes unidades.
El coeficiente de variación (CV), mide la dispersión de los datos con respecto a la media y se calcúla mediante:

Puntaje típico o estandarizado z
Conjuntos de datos diferentes asociados por lo general a diferentes medidas y con el propósito de reducir los datos a un mismo punto de referencia y a una escala común. Se hace una transformación llamada estandarización donde a cada dato xi se le resta la media x̄, se divide entre la desviación estándar S y se obtiene un número Z que se llama el valor estandarizado de xi.
Esto es:

Medidas de forma
Las medidas de forma permiten conocer la manera en que los datos se distribuyen. Ofrecen las características especiales de la distribución como: simetría y asimetría (sesgo) y nivel de concentración de los datos del conjunto. De tal forma, que si la distribución de los datos no es simétrica, se le denomina asimétrica, o sesgada.
Lo que se debe realizar para conocer si una distribución de datos es simétrica o sesgada, es una comparación entre la media y la mediana de forma tal, que si la media y la mediana son iguales la distribución de datos es simétrica, si la media es mayor a la mediana la distribución tiene un sesgo hacia la derecha (positivo) y si la media es menor que la mediana entonces la distribución tiene un sesgo hacia la izquierda (negativo), tal como se muestra en la gráfica y se presenta en este ejemplo.
La media, la mediana y la moda de una distribución de datos están relacionadas por
Media - Moda = 3 (Media - Mediana)
Solo para las curvas de frecuencias unimodales y moderadamente sesgadas.

Medidas de forma
Grado de asimetría
Mide la desviación de la simetría del conjunto de datos en términos del cociente entre la diferencia de la media y la mediana con la desviación estándar, dando como resultado un número, del cual a partir de su signo se puede determinar si hay simetría o sesgo en la distribución.
![]() |
Ahora estudiemos dos ejemplos que calculan el coeficiente. |
Medidas de forma
Apuntamiento o curtosis
Hace referencia a qué tanto apunta una curva de frecuencia, da cuenta de la mayor o menor cantidad de datos que se agrupan al rededor de la moda.
La curtosis está representada por el cuarto momento de la media que da cuenta de la altura de la curva. El cálculo de la curtosis es determinado en función de la desviación típica y de los momentos unidimensionales de orden cuatro con respecto a la media aritmética.
Si el coeficiente de apuntamiento o curtosis es:
- Igual a 3 la distribución es normal o mesocúrtica.
- Mayor que 3 la distribución es leptocúrtica o apuntada.
- Menor que 3 la distribución es platicúrtica o achatada.
Teorema de Tchebysheff y regla empírica
El teorema de Tchebysheff (Chebyshev) y la regla empírica permiten describir una muestra o población. Específicamente, se utilizan para inferir el porcentaje mínimo de datos dentro de diferentes regiones de la distribución de frecuencias, limitadas por un número k de desviaciones estándar con relación a la media aritmética.
La idea principal del teorema es determinar un número k≥1 y un conjunto n de mediciones, en donde por lo menos
de las mediciones de la muestra o población están dentro de las k desviaciones estándar de su correspondiente media aritmética.
La regla empírica se utiliza en variables normalmente distribuidas, tal como una campana. Su explicación se detalla en el gráfico que acompaña esta pantalla. Veamos el siguiente caso.
Actividad de aprendizaje
![]() |
Le invitamos a realizar la siguiente actividad relacionada con todo lo estudiado resolviendo el siguiente crucigrama. |
Resumen
La media aritmética \bar { x } , la mediana \tilde { x } y la moda \hat { x } , son medidas de posición, que suelen ser aplicadas juntas en numerosos estudios. Otras veces se calculan independientemente, teniendo en cuenta la naturaleza y característica de la distribución.
La media aritmética es un promedio afectado por todos los valores de la distribución; la mediana será un valor que supera al 50%. La moda corresponde a aquel valor de la variable que representa el mayor número de observaciones, es decir la mayor frecuencia. En cualquier distribución el valor de la mediana se localiza entre la media y la moda.
La distancia entre la media y la moda, es tres veces la distancia entre la media y la mediana. Esta relación se denomina de Pearson, y es utilizada para calcular cualquiera de ellos, conociendo los otros dos.

En esta unidad se mostraron otras medidas de posición de tendencia no central como los cuartìles, centíles y percentiles, que generalmente se aplican en variables continuas cuando tiene un número grande tanto de intervalos como de observaciones y se examina tan solo una parte de la distribución que presenta una característica especial de ser estudiada.
Bibliografía ()
- Canavos, G.C. (1987) Probabilidad y estadística: aplicaciones y métodos. México: Mc Graw Hill.
- DeGroot, M.H. & Schervish, M.J. (2012) Probability and Statistics. (4ª ed.). Boston: Addison-Wesley-Pearson.
- Fisz, M. (1967) Probability Theory and Mathematical Statistics. (3ª ed.). United States of America: John Wiley & Sons, Inc.
- Milton, J.S. & Arnold, J. C. (2004) Probabilidad y estadística. (4ª ed.) México: Mc Graw Hill.
- Webster, A. (2000). Estadistica aplicada a los negocios y a la economía.(3ra Ed.), McGraw-Hill Interamericana S.A: Santafé de Bogotá. [PDF].
- Walpole, R.E. & Meyers, R.H. (2004) Probabilidad y estadística para ingenieros. (8ª ed). México: Prentice Hall.
Referencias Web
- ApruebaEstadística. [ApruebaEstadística]. Estadistica descriptiva: tipificación. Valores tipificados. [Archivo de video]. Recuperado de: https://youtu.be/rxs6oOYYWDA.]
- Becerra, J. (s.f.) La nueva familia de monedas del Banco de la República. Banco de la República, Actividad Cultural [online] Recuperado de:https://bit.ly/OOEvk0
- Chaparro S, E. y Vargas N., J.A. (2000) Graficos de control para la media de un proceso en poblaciones con distribución asimétrica. Revista Colombiana de Estadística [PDF]. Recuperado de: https://bit.ly/2D0ThjG.
- Estadística para todos (s.f.) Gráfica Estadísticas: Diagrama de Caja y Bigotes [online]. Recuperado de: https://bit.ly/1emwI3p.
- Estadística Básica FEET-ULPGC. [Estadística Básica FEET-ULPGC]. Practica Variable unidimensional continua 05/06 Medidas de forma [Archivo de video]. Recuperado de: https://youtu.be/KaH93zS9n7M.
- Mydoryfierro. [Mydoryfierro]. La regla empírica [Archivo de video]. Recuperado de: https://youtu.be/j287OsBna84.]
- Paz K. S. La media aritmética simple. Facultad de ingeniería, Universidad Rafael Landívar [PDF]. Disponible en: https://bit.ly/2WQ4uek
- Rodríguez L. J. (2010) Métodos Estadísticos de la Ingeniería Tema 3: Medidas Estadísticas Grupo B. [PDF] Disponible en:https://bit.ly/2KtCT18
- Psicometría y estadística - proclapar.com [Psicometría y estadística - proclapar.com]. (2013, marzo 12). Estadística, media armónica [archivo de video]. Recuperado de: https://youtu.be/j5--SaGxxg8
- saborcbta91 [saborcbta91]. (2011, octubre 11). Cuartil, decil, pertenciar , datos aislados [archivo de video]. Recuperado de: https://youtu.be/AfB4OUcGNtc
- Universidad Michoacana de San Nicolás de Hidalgo (s.f.) Capítulo 14. Medidas de tendencia central [PDF]. Recuperado de: https://bit.ly/2ORxmAl.













