¿Cómo se determinan los valores de distribuciones de probabilidad?

Ejemplo

Un ingeniero informático necesita conocer el tiempo promedio que servirá un nuevo dispositivo. Mediante la prueba de la versión beta del mismo, pudo concluir que la función de distribución de probabilidad asociada a la variable aleatoria X corresponde a:

f\left( x \right)=\left\{ \begin{matrix} 0.004{{e}^{1-0.004x}}~~x\ge 250 \\ 0~~~~~~~~~~~~~~~~x \textless 250 \\ \end{matrix} \right.

Calcular el valor esperado que obtiene el ingeniero y le permite conocer cuál debe ser la producción de los repuestos. Además, calcule la varianza de los datos.

Desarrollo

Por definición, el valor esperado corresponde a:

\mu =\underset{250}{\overset{\infty }{\mathop \int }}\,0.004x{{e}^{1-0.004x}}~dx=~\left[ -x{{e}^{1-0.004x}}-250{{e}^{1-0,004x}} \right]_{x=250}^{\infty }=0-\left[ -250-250 \right]=500

Es decir, el ingeniero puede esperar que el número de horas promedio que el dispositivo va a servir correctamente corresponde a 500 horas. Ahora, veamos qué tan dispersos se encuentran los datos, para esto, calculamos la varianza usando una identidad que permite simplificar algunas operaciones:

{{\sigma }^{2}}=\underset{-\infty }{\overset{\infty }{\mathop \int }}\,{{x}^{2}}f\left( x \right)~dx-{{\mu }^{2}}

Así, la varianza sería:

{{\sigma }^{2}}=\underset{250}{\overset{\infty }{\mathop \int }}\,0.004~{{x}^{2}}{{e}^{1-0.004x}}~dx-{{500}^{2}}=~\left[ -{{x}^{2}}{{e}^{1-0.004x}}+500{{e}^{1-0.004x}}-125000{{e}^{1-0.004x}} \right]_{250}^{\infty }-250000

{{\sigma }^{2}}=312500-250000=62500.

Como la varianza es muy alta, significa que los datos están muy dispersos. Si vemos la gráfica de la función de distribución de probabilidades, es más sencillo entender esta medida de dispersión:

Función de distribución exponencial con media de 500 unidades.

(Para ampliar la imagen haga clic sobre ella)

Como es posible visualizar en la gráfica anterior, la “mitad” de los datos están antes de 500, es decir, relativamente cerca, pero después de 500, se encuentra la otra “mitad” de los datos, estos pueden alejarse infinitamente, lo que implica que la varianza es muy alta.