Ejemplo #8: correlación poblacional

Con el mismo planteamiento del Ejemplo #7 y la misma información recolectada por el investigador para el modelo estadístico que está desarrollando entre el número de opciones ordenadas para los laptops y el tiempo de entrega. Se pide determinar si existe una relación lineal entre las variables utilizando el coeficiente de correlación muestral. Utilice un nivel de significancia del 5%.

Solución:

Se realizan los cálculos necesarios para la prueba solicitada:

X Y XY X2 Y2
3 25 75 9 625
4 32 128 16 1024
4 26 104 16 676
7 38 266 49 1444
7 34 238 49 1156
8 41 328 64 1681
9 39 351 81 1521
11 46 506 121 2116
12 44 528 144 1936
12 51 612 144 2601
14 53 742 196 2809
16 58 928 256 3364
17 61 1037 289 3721
20 64 1280 400 4096
23 66 1518 529 4356
25 70 1750 625 4900
\sum X=192 \sum Y=748 \sum XY=10391 \sum {{X}^{2}}=2988 \sum {{Y}^{2}}=38026

Utilizando uno de los modelos explicados en secciones anteriores, se procede a calcular r:

r=\frac{n\sum xy-\sum x\sum y}{\sqrt{[n\sum {{x}^{2}}-{{(\sum x)}^{2}}][n\sum {{y}^{2}}-{{(\sum y)}^{2}}]}}=


~\frac{16\left( 10391 \right)-\left( 192 \right)\left( 748 \right)}{\sqrt{\left[ 16\left( 2988 \right)-\left( 192{{)}^{2}} \right] \right[16\left( 38026 \right)-{{\left( 748 \right)}^{2}}]}}\cong .9785~

Por lo tanto, el coeficiente de determinación corresponde a:

{{r}^{2}}={{\left( .9785 \right)}^{2}}=~.9575

Con un nivel de significancia del 5%, el valor obtenido en la distribución de t de Student de tc = ±2.145 (con 14 grados de libertad). Se plantean entonces las hipótesis:

{{H}_{0}}:\rho =0 No hay correlación

{{H}_{1}}:\rho \ne 0 Hay correlación

Al igual que en el Ejemplo #7, se aceptará la hipótesis nula H0, si-2.145 ≤ tp ≤2.145. Se debe entonces calcular el estadístico de prueba:

{{t}_{p}}=\frac{r}{\sqrt{\frac{1-{{r}^{2}}}{n-2}}}

{{t}_{p}}=\frac{0.9785}{\sqrt{\frac{1-0.9575}{14-2}}}\cong 17,759

Como el estadístico es mayor que 2.145 (tp = 17.759 > 2.145) se rechaza entonces la hipótesis nula, lo cual conduce a aceptar la hipótesis alternativa H1. Se concluye entonces que existe una correlación alta positiva entre las dos variables consideradas por el investigador.