Ejemplo #3: desviación estándar en regresión

Se ha implementado un algoritmo para clasificar imágenes diagnósticas en un hospital. El algoritmo es evaluado en una escala de 0 a 10 con respecto a su rendimiento frente a la clasificación. Se han realizado 10 pruebas del algoritmo en funcionamiento en dos días diferentes y los resultados son los siguientes:

Algoritmo en el primer día de evaluación 6 5 8 8 7 6 10 4 9 7
Algoritmo en el segundo día de evaluación 8 7 7 10 5 8 10 6 8 6

Determine syx.

Solución:

Para encontrar el valor de syx se efectúan los cálculos necesarios para los 10 datos de cada uno de los días. La ecuación de regresión para estos datos es: \hat{Y}=4+.5X

Algoritmo en el primer día de evaluación X Algoritmo en el segundo día de evaluación Y Ŷ (Y - Ŷ)2 Y2 XY
6 8 7 1 64 48
5 7 6.5 0.25 49 35
8 7 8 1 49 56
8 10 8 4 100 80
7 5 7.5 6.25 25 35
6 8 7 1 64 48
10 10 9 1 100 100
4 6 6 0 36 24
9 8 8.5 0.25 64 72
7 6 7.5 2.25 36 42
\sum Y=75 \sum {{(Y-\hat{Y})}^{2}}=17 \sum {{Y}^{2}}=587 \sum XY=540

{{s}_{yx}}=~\sqrt{\frac{\sum {{({{Y}_{i}}-{{{\hat{Y}}}_{i}})}^{2}}}{n-2}}=\sqrt{\frac{17}{8}~}\cong 1.4577~puntos

{{s}_{yx}}=~\sqrt{\frac{\sum Y_{i}^{2}-a~\sum {{Y}_{i}}-b\sum {{X}_{i}}{{Y}_{i}}}{n-2}}=\sqrt{\frac{587-4\left( 75 \right)-.5\left( 540 \right)}{10-2}}=

\sqrt{\frac{17}{8}~}\cong 1.4577~puntos

(Para ampliar la imagen haga clic sobre ella)

La línea de regresión es y = 0.5x + 4, las dos líneas rojas corresponden a rectas paralelas donde se ha sumado y restado respectivamente una desviación estándar de regresión. La mayoría de los datos se encuentran dentro de este intervalo, lo cual corresponde con la analogía realizada al caso de estadística descriptiva.