Ejemplo #4: coeficiente de correlación
El administrador general de redes de una cadena hotelera desea determinar el efecto de tener dispositivos intermedios apagados sobre el throughput de salida de la red. Para este fin, se tomó una muestra de 12 hoteles de similar tamaño de los cuales se obtuvieron los siguientes resultados:
Hotel | Dispositivos intermedios apagados X | Throughput de salida (bps) |
1 | 5 | 160 |
2 | 5 | 220 |
3 | 5 | 140 |
4 | 10 | 190 |
5 | 10 | 240 |
6 | 10 | 260 |
7 | 15 | 230 |
8 | 15 | 270 |
9 | 15 | 280 |
10 | 20 | 260 |
11 | 20 | 290 |
12 | 20 | 310 |
Determine el coeficiente de correlación entre las variables “Dispositivos intermedios apagados” con “Throughput de salida”.
Solución:
Se procede a hacer los cálculos necesarios para así aplicar alguno de los modelos del coeficiente de correlación:
Dispositivos intermedios apagados X | Throughput de salida (bps) Y | XY | X2 | Y2 | Ŷ | (Y - Ŷ)2 | {{\left( x-\bar{x} \right)}^{2}} |
5 | 160 | 800 | 25 | 25600 | 182 | 484 | 56.25 |
5 | 220 | 1100 | 25 | 48400 | 182 | 1444 | 56.25 | 5 | 140 | 700 | 25 | 19600 | 182 | 1764 | 56.25 |
10 | 190 | 1900 | 100 | 36100 | 219 | 841 | 6.25 |
10 | 240 | 2400 | 100 | 57600 | 219 | 441 | 6.25 |
10 | 260 | 2600 | 100 | 67600 | 219 | 1681 | 6.25 |
15 | 230 | 3450 | 225 | 52900 | 256 | 676 | 6.25 |
15 | 270 | 4050 | 225 | 72900 | 256 | 196 | 6.25 |
15 | 280 | 4200 | 225 | 78400 | 256 | 576 | 6.25 |
20 | 260 | 5200 | 400 | 67600 | 293 | 1089 | 56.25 |
20 | 290 | 5800 | 400 | 84100 | 293 | 9 | 56.25 |
20 | 310 | 6200 | 400 | 96100 | 293 | 289 | 56.25 |
\sum X=150 | \sum Y=2850 | \sum XY=38400 | \sum {{X}^{2}}=2250 | \sum {{Y}^{2}}=706900 | \sum {{(Y-\hat{Y})}^{2}}=9490 | \sum {{\left( x-\bar{x} \right)}^{2}}=375 |
Ahora se puede proceder a aplicar los dos primeros modelos explicados:
Los dos modelos conducen a la misma respuesta como era de esperarse. El valor 0.827 indica que existe una correlación alta positiva entre las variables, ya que se aproxima al valor +1. El tercer modelo no se aplicó porque no han sido calculados los coeficientes de regresión a y b.