Ejemplo #3: desviación estándar en regresión
Se ha implementado un algoritmo para clasificar imágenes diagnósticas en un hospital. El algoritmo es evaluado en una escala de 0 a 10 con respecto a su rendimiento frente a la clasificación. Se han realizado 10 pruebas del algoritmo en funcionamiento en dos días diferentes y los resultados son los siguientes:
Algoritmo en el primer día de evaluación | 6 | 5 | 8 | 8 | 7 | 6 | 10 | 4 | 9 | 7 |
Algoritmo en el segundo día de evaluación | 8 | 7 | 7 | 10 | 5 | 8 | 10 | 6 | 8 | 6 |
Determine syx.
Solución:
Para encontrar el valor de syx se efectúan los cálculos necesarios para los 10 datos de cada uno de los días. La ecuación de regresión para estos datos es: \hat{Y}=4+.5X
Algoritmo en el primer día de evaluación X | Algoritmo en el segundo día de evaluación Y | Ŷ | (Y - Ŷ)2 | Y2 | XY |
6 | 8 | 7 | 1 | 64 | 48 |
5 | 7 | 6.5 | 0.25 | 49 | 35 |
8 | 7 | 8 | 1 | 49 | 56 |
8 | 10 | 8 | 4 | 100 | 80 |
7 | 5 | 7.5 | 6.25 | 25 | 35 |
6 | 8 | 7 | 1 | 64 | 48 |
10 | 10 | 9 | 1 | 100 | 100 |
4 | 6 | 6 | 0 | 36 | 24 |
9 | 8 | 8.5 | 0.25 | 64 | 72 |
7 | 6 | 7.5 | 2.25 | 36 | 42 |
\sum Y=75 | \sum {{(Y-\hat{Y})}^{2}}=17 | \sum {{Y}^{2}}=587 | \sum XY=540 |
La línea de regresión es y = 0.5x + 4, las dos líneas rojas corresponden a rectas paralelas donde se ha sumado y restado respectivamente una desviación estándar de regresión. La mayoría de los datos se encuentran dentro de este intervalo, lo cual corresponde con la analogía realizada al caso de estadística descriptiva.