FAEDIS

Introducción

La estadística es la ciencia que estudia los fenómenos colectivos y el comportamiento de las variables que explican los estados de la naturaleza en ciencias como física, química y astronomía.El estudio y aplicación de la estadística comprende la observación de los fenómenos, la ordenación de los datos obtenidos como producto de dicha observación, la clasificación y análisis de los datos, y la identificación de relaciones causales y propiedades de tipo general; así como la aplicación a elementos individuales de la población estudiada.

La observación genera los datos estadísticos, referente fáctico del método científico que busca generalizar y trascender el conocimiento más allá de los hechos. La inferencia estadística estudia el comportamiento de muestras tomadas aleatoriamente e infiere sobre la estimación de parámetros de la población.

La estadística es una ciencia relacionada con la recopilación, el procesamiento y presentación de cifras en forma de gráficos y tablas. También considera el análisis de la información, la estimación de parámetros de la población y la validación de modelos estadísticos que expliquen el comportamiento real de los estados de la naturaleza.

En dicho análisis la estadística descriptiva facilita el análisis de los datos para describirlos sin rebasar sus propios límites. El paso previo es la presentación y el análisis de los datos de las características fundamentales de los grupos de estudio.

La inferencia estadística proporciona las normas para obtener resultados válidos sobre un determinado fenómeno, sin necesidad de registrar la información asociada a toda la población. Por ejemplo, no se deben realizar pruebas destructivas a toda la producción para determinar cuáles máquinas requieren ajuste, en razón de la producción de productos fuera de especificaciones o baja calidad. Es conveniente seleccionar muestras aleatorias, estimar los parámetros de dichas muestra y con estas estimaciones inferir sobre los parámetros de la población, mediante la estimación por intervalos y la aplicación de pruebas de contraste de hipótesis que garanticen la confiabilidad de los resultados.

Igualmente serán evaluadas las metodologías para el manejo de series de tiempo, enfocadas al estudio de la tendencia, ciclicidad, estacionalidad y aleatoriedad del comportamiento de las variables de estudio, bajo el supuesto que el análisis histórico de las variables genera un mejor conocimiento de las alternativas y permite estimar las consecuencias de las diferentes decisiones, mediante la aplicación sistemática de modelos estadísticos.

Objetivos

Objetivo General

Analizar los conceptos estadísticos, fundamentales para el proceso de toma de decisiones.

Objetivos Específicos

Revisar los conceptos básicos de la estadística descriptiva.
Aplicar los elementos teóricos de probabilidad, dispersión, correlación, por intervalos, estimación puntual, inferencia estadística y series de tiempo.
Desarrollar la capacidad de realizar una prueba de contraste de hipótesis y validación de modelos estadísticos.
Estimar parámetros por intervalos de confianza.
Analizar series de tiempo al descomponer una serie en estacionalidad, ciclicidad, tendencia y componente aleatorio.

Estadística descriptiva

El análisis descriptivo de los datos en grupos o colectividades tiende a comportarse de manera variable (aspectos evidentes en la elaboración de tablas estadísticas) pero con rasgos, características o tendencias de una determinada población de estudio que poseen cierta regularidad y son descritos por medidas o estadísticos que caracterizan la población en su conjunto.

Estas medidas estudian la tendencia central de los datos, la variabilidad o el grado de dispersión, concentración y forma. El estudio conjunto características permite obtener una visión completa del fenómeno que se está estudiando. Por ejemplo, para obtener datos sobre la distribución de salarios en una empresa, es conveniente saber cuál es el salario medio de un trabajador o lo que gana un grupo de trabajadores individualmente, así como determinar qué trabajadores tienen mayor o menor salario. Estas medidas son las medidas de tendencia central pues se ocupa de valores centrales como salario medio, salario más frecuente, trabajadores que ganan más o menos salario del promedio, salario promedio de los obreros y salario promedio de los ejecutivos.

Estas características se miden mediante los estadísticos de tendencia central denominados promedios. Igualmente, hay que cuantificar la mayor o menor dispersión de los salarios de los trabajadores, cuál es el salario más alto, el más bajo y el salario más frecuente (el rango de salarios donde se encuentra la mayor parte de los trabajadores). Sin embargo, las medidas de dispersión son indicativos de la desigualdad de salarios que se da en la empresa; es decir, las características de concentración de los salarios.

Material
de apoyo

Probabilidad

En un espacio muestral (S), definido como el conjunto de todos los resultados posibles de un experimento aleatorio, cada elemento de dicho espacio se denomina punto muestral. El lanzamiento de dos monedas es un experimento aleatorio, en el que el espacio muestral posee cuatro posibles resultados –cara (C) y sello (S)-: CC,CS,SC,SS.

El suceso es un subconjunto del espacio muestral, como que caiga cara en el primer lanzamiento y sello en el segundo (CS), o que caiga cara en el primer lanzamiento y cara en el segundo (CC). Ambos sucesos son mutuamente excluyentes si la ocurrencia de uno, excluye la ocurrencia de otro. Si ocurre CC, no es posible que ocurran SS, CS o SC simultáneamente. Los sucesos de un experimento aleatorio son exhaustivos, si se agotan todos los resultados posibles de un experimento, como en el lanzamiento de dos monedas, donde cuatro son los resultados posibles del experimento, que a su vez son exhaustivos.
Probabilidad: sea A un suceso en un espacio muestral y P(A) la probabilidad de ocurrencia del suceso A; es decir, la proporción de veces que el suceso A ocurra en lanzamientos repetidos de las monedas. En otras palabras, en un total de n resultados posibles de un experimento aleatorio, si m de ellos son favorables a la ocurrencia, el cociente n/m es la frecuencia relativa de A. Si el experimento se realiza un gran número de veces -es decir, si n tiende a infinito-, la frecuencia relativa es una buena aproximación de la probabilidad de A.
Función de densidad de probabilidad: Si X es una variable aleatoria que toma los valores x₁,x₂,x₃,…..,x_n, la función de distribución define probabilidad como: f(x) = P(x = x₁)
La función de densidad de probabilidad discreta (fdp) son las funciones de distribución de probabilidad más comunes: homogénea, geométrica, hipergeométrica, Poisson, variables discretas y las distribuciones (normal, t-Studentt, Chi cuadrada y distribución F para variables continuas.
Valor esperado
Varianza
Covarianza

Análisis de correlación

Una correlación es la asociación lineal entre dos o más variables. En el caso de dos variables, el coeficiente de correlación p es la medida del grado de asociación lineal entre las variables.

El coeficiente de correlación tiene valores que situados entre -1 y +1, donde -1 indica una asociación perfecta negativa, mientras que +1 es una asociación perfecta positiva. Cuando el coeficiente de correlación toma el valor de 0, no existe asociación lineal entre las dos variables. Sin embargo, una correlación de 0 no infiere que no haya correlación entre las variables, puesto que puede existir una asociación no lineal entre las variables. Para el caso de una muestra, el estimador de máxima verosimilitud del coeficiente de correlación es definido como:

La ecuación evidencia que el coeficiente de correlación se puede expresar en términos de la covarianza entre dos variables y las desviaciones estándar de cada una de ellas.

Es importante mencionar que el proceso de estimación de asociación entre dos variables, pretende que el coeficiente de correlación sea muy cercano a 1; sin embargo, este tipo de apreciaciones dependen en gran medida del impacto de las decisiones en las variables de estudio.

Hay algunas áreas del conocimiento en las que un coeficiente de correlación de 0,95 pudiera resultar bajo (como medicina, farmacología o algunas ramas de ingeniería donde son valorados aspectos relacionados con la vida de las personas), mas en los estudios sociales y económicos, que deciden sobre aspectos de comportamiento de los humanos o conductas de grupo, una correlación de 0,6 pudiera resultar suficientemente alta para el estudio.

Análisis de dispersión

Tanto la varianza como la desviación estándar miden la dispersión de una serie de datos (como referencia considere que los datos tienen una distribución normal). La dispersión es un indicador de cómo están distribuidos los datos. Por ejemplo, una desviación estándar alrededor de la media agrupa el 68% de la población, dos desviaciones estándar el 95% y 3 desviaciones el 99,7%.

Las medidas de forma se refieren básicamente a la asimetría y apuntamiento.

La asimetría de una distribución de datos está relacionada con la distancia de los datos respecto a la media. Hay asimetría a la derecha o a la izquierda, según la posición más larga de la cola (derecha o izquierda). El coeficiente directo de asimetría:
se calcula a partir de la media; la desviación estándar y las diferencias de los valores de la variable, respecto a la media elevada al cubo. Una medida sencilla de asimetría se conoce como el coeficiente de asimetría de Pearson.
Apuntamiento o kurtosis: es un indicador de distribuciones planas o altas. Existen diferentes indicadores de apuntamiento, entre los que el más común es el indicador de kurtosis K mayor.

Las distribuciones de probabilidad con:

K menor que 3 se denominan platicúrticas (anchas o mesocúrticade colas cortas)
k mayor que 3, leptocúrticas (delgadas o de colas largas)
K igual a 3, mesocúrtica (distribución normal es el mejor ejemplo).

Inferencia estadística

Los criterios utilizados en esta unidad están íntimamente relacionados al proceso de estimación puntual y por intervalos, lo que requiere el conocimiento de las diferentes distribuciones de probabilidad de las variables de estudio:

Por ejemplo: si X sigue una distribución normal, se desconoce el valor de la media y la varianza de la población. Para estimar los parámetros, hay que tomar una muestra aleatoria de un tamaño n, con la misma distribución de probabilidades conocida y la información muestral, luego calcular los parámetros media y varianza para estimar los parámetros de la población. Este proceso se conoce como estimación, que puede ser puntual y por intervalos.

Series de tiempo

El estudio de los datos busca interpretar estadísticas a partir de las series de tiempo. Este es un trabajo imprescindible, en razón a que el análisis posee una serie temporal nueva. En los estudios económicos o sociales la información se presenta en series de tiempo, como el conjunto de datos representativos de la evolución a lo largo del tiempo de una variable relacionada con estos campos del conocimiento.

El primer fenómeno evidencia que en dichas series hay determinados movimientos que se repiten en forma periódica; movimientos denominados componentes estacionales, que pueden estar causados por factores climáticos, como el incremento del uso de energía en épocas de invierno, factores institucionales como el pago de primas y bonificaciones a fin de año, la terminación e inicio de años escolares, los períodos de vacaciones de verano y otros. Las secuencias temporales de los fenómenos estacionales aparecen en procesos económicos como la inversión, el consumo, los mercados financieros.

En las series de tiempo predominan tendencias seculares de largo plazo de las variables económicas, como consecuencia de la dinámica económica del sistema; en el largo plazo estas tendencias determinan ciclos de expansión y contracción, movimientos oscilatorios de la variable de estudio, conocidas como el componente cíclico de una serie temporal.

La sucesión de períodos de auge y depresión es un hecho fácilmente detectable en la realidad, así como en el manejo sistemático de las series temporales. El comportamiento de largo plazo de una serie temporal se denomina componente de tendencia (Tt), relacionado con un comportamiento estructural de las variables, que durante varios años presenta características similares.

Sobre los movimientos de estacionalidad, ciclicidad y tendencia se superpone el componente irregular, debido a factores aleatorios u otros que no se pueden identificar, que dificultan el diagnóstico de la economía en un momento dado. Estas variaciones son movimientos sistemáticos y, por lo tanto, son de difícil control. En la práctica se consideran como tales todas aquellas variaciones que no pueden ser explicadas por los factores anteriores.

Resumen

La estadística es la ciencia que estudia los fenómenos colectivos y el comportamiento de las variables que explican los estados de la naturaleza en ciencias como física, química y astronomía.El estudio y aplicación de la estadística comprende la observación de los fenómenos, la ordenación de los datos obtenidos como producto de dicha observación, la clasificación y análisis de los datos, y la identificación de relaciones causales y propiedades de tipo general; así como la aplicación a elementos individuales de la población estudiada.

La observación genera los datos estadísticos, referente fáctico del método científico que busca generalizar y trascender el conocimiento más allá de los hechos.

La inferencia estadística estudia el comportamiento de muestras tomadas aleatoriamente e infiere sobre la estimación de parámetros de la población.