Ejemplo #4: coeficiente de correlación

El administrador general de redes de una cadena hotelera desea determinar el efecto de tener dispositivos intermedios apagados sobre el throughput de salida de la red. Para este fin, se tomó una muestra de 12 hoteles de similar tamaño de los cuales se obtuvieron los siguientes resultados:

Hotel Dispositivos intermedios apagados X Throughput de salida (bps)
1 5 160
2 5 220
3 5 140
4 10 190
5 10 240
6 10 260
7 15 230
8 15 270
9 15 280
10 20 260
11 20 290
12 20 310

Determine el coeficiente de correlación entre las variables “Dispositivos intermedios apagados” con “Throughput de salida”.

Solución:

Se procede a hacer los cálculos necesarios para así aplicar alguno de los modelos del coeficiente de correlación:

Dispositivos intermedios apagados X Throughput de salida (bps) Y XY X2 Y2 Ŷ (Y - Ŷ)2 {{\left( x-\bar{x} \right)}^{2}}
5 160 800 25 25600 182 484 56.25
5 220 1100 25 48400 182 1444 56.25
5 140 700 25 19600 182 1764 56.25
10 190 1900 100 36100 219 841 6.25
10 240 2400 100 57600 219 441 6.25
10 260 2600 100 67600 219 1681 6.25
15 230 3450 225 52900 256 676 6.25
15 270 4050 225 72900 256 196 6.25
15 280 4200 225 78400 256 576 6.25
20 260 5200 400 67600 293 1089 56.25
20 290 5800 400 84100 293 9 56.25
20 310 6200 400 96100 293 289 56.25
\sum X=150 \sum Y=2850 \sum XY=38400 \sum {{X}^{2}}=2250 \sum {{Y}^{2}}=706900 \sum {{(Y-\hat{Y})}^{2}}=9490 \sum {{\left( x-\bar{x} \right)}^{2}}=375

n=12~datos


\bar{x}=\frac{\sum {{x}_{i}}}{n}=\frac{150}{12}=12.5~dispositivos~apagados


\bar{y}=\frac{\sum {{y}_{i}}}{n}=\frac{2850}{12}=237.5~bps


Ahora se puede proceder a aplicar los dos primeros modelos explicados:

Primer~modelo:~r=\frac{\sum ({{x}_{i}}-\bar{x})({{y}_{i}}-\bar{y})}{\sqrt{\sum {{({{x}_{i}}-\bar{x})}^{2}}}~~\sqrt{\sum {{({{y}_{i}}-\bar{y})}^{2}}}}=\frac{2775~}{\sqrt{\left( 375 \right)\left( 30025 \right)}}


=\frac{2775}{3355.499218}\cong 0.8270


Segundo~modelo:~r=\frac{n\sum xy~-\sum x~\sum y}{\sqrt{[n\sum {{x}^{2}}-{{(\sum x)}^{2}}][n\sum {{y}^{2}}-{{(\sum y)}^{2}}]}~~}=\frac{12\left( 38400 \right)-\left( 150 \right)\left( 2850 \right)}{\sqrt{\left[ 12\left( 2250 \right)-{{\left( 150 \right)}^{2}} \right][12\left( 706900 \right)-{{\left( 2850 \right)}^{2}}}}


=\frac{\left( 460800 \right)-\left( 427500 \right)}{\sqrt{4500\left( 360300 \right)}}=\frac{33300}{40265.99061}\cong 0.8270


Los dos modelos conducen a la misma respuesta como era de esperarse. El valor 0.827 indica que existe una correlación alta positiva entre las variables, ya que se aproxima al valor +1. El tercer modelo no se aplicó porque no han sido calculados los coeficientes de regresión a y b.