Contrastar la hipótesis nula
En el caso tal, que la hipótesis nula fuera verdadera, la secuencia de diferencias + y – se podría entender como una muestra aleatoria extraída de una población, en la cual las probabilidades de + y – corresponderían a 0,5 en ambos casos. Por tanto, las observaciones podrían ser definidas como una muestra aleatoria de una población binomial (en la cual, las dos opciones, + y – tienen la misma probabilidad). En consecuencia, si la proporción de + en la población se representa con la letra P, es posible definir la hipótesis nula como:
El número de observaciones positivas sigue entonces una distribución binomial. EI estadístico del contraste de signos de muestras pareadas es:
Donde S sigue una distribución binomial, donde P = 0,5 y n = número de diferencias no nulas. Después de evaluar la hipótesis nula y la alternativa, se debe calcular el estadístico de contraste, luego se debe calcular el p-valor y obtener las conclusiones correspondientes según la regla de decisión.
El p-valor de un contraste de signos se calcula con ayuda de la distribución binomial con n = número de diferencias no nulas, S = número de diferencia positiva y P = 0,5.
- Para un contraste de cola superior:
{{H}_{1}}:P>0,5~~~~~~~~~~~~~~p-valor=P\left( x\ge S \right)
- Para un contraste de cola inferior:
{{H}_{1}}:P<0,5~~~~~~~~~~~~~~p-valor=P\left( x\le S \right)
- Para el caso donde se utilizan dos colas:
{{H}_{1}}:P\ne 0,5~~~~~~~~~~~~~2\left( p-valor \right)~~
Ejemplo #22
Una empresa colombiana cercana a la Universidad Militar Nueva Granada está considerando la posibilidad de utilizar un nuevo algoritmo de recomendación para sus visitantes que buscan nuevas tendencias en el cine. Se eligió una muestra de 8 personas y se le pidió a cada una que valorara en una escala de 1 - 10 su opinión sobre el algoritmo actual y el propuesto. En la siguiente tabla se evidencian los valores obtenidos para cada algoritmo, donde un número alto indica mayor preferencia por uno de ellos. ¿Según los datos registrados hay alguna tendencia de preferencia sobre los algoritmos?
Solución.
La tabla muestra las diferencias de valoración de las personas y los signos de estas diferencias. Así, se asigna un + si se prefiere el algoritmo original, un – si se prefiere el nuevo y 0 si se valoran los dos por igual. En este experimento, dos personas prefieren el algoritmo original y cinco el nuevo; uno las valora por igual.
VALORACIÓN | ||||
Estudiante | Algoritmo Original | Algoritmo Nuevo | Diferencia (original. Nuevo) | Signo de la diferencia |
A | 6 | 8 | -2 | - |
B | 4 | 9 | -5 | - |
C | 5 | 4 | 1 | + |
D | 8 | 7 | 1 | + |
E | 3 | 9 | -6 | - |
F | 6 | 9 | -3 | - |
G | 7 | 7 | 0 | 0 |
H | 5 | 9 | -4 | - |
La hipótesis nula en este caso establece que de la población encuestada no existe una tendencia a preferir un algoritmo por encima del otro. Para la evaluación de esta hipótesis, se deben comparar los números que expresan una preferencia por cada algoritmo, y se deben descartar aquellos que valoran los algoritmos por igual. En este caso, se omiten los valores de la persona G, por tanto, el tamaño de la muestra es n = 7. De la tabla, se puede ver que tan solo dos de las siete personas escogieron el algoritmo original, luego el estadístico es S = 2.
La hipótesis nula es que la mediana poblacional de las diferencias es 0. Si esta hipótesis fuera verdadera, las probabilidades de + y - son del 50% cada una, ya que como se explicó antes correspondería a una distribución binomial. En consecuencia, si P representa la verdadera proporción de + en la población, la hipótesis nula se puede plantear como:
Para evaluar si existe una tendencia de preferir un algoritmo por encima del otro, se utiliza un contraste de una cola (unilateral). La alternativa de interés es que la mayoría de la población prefiere el nuevo algoritmo, de tal forma que se puede plantear:
Ahora, se puede calcular el valor p del contraste, representando con P(x) la probabilidad de tener x éxitos (signo +) en las 7 pruebas de tipo binomial, en la que cada una cuenta con una probabilidad de 0,5. El valor P se calcula por medio de la siguiente ecuación:
Con este p-valor no es posible rechazar la hipótesis nula, por tanto, es posible concluir que no se cuenta con la suficiente cantidad de datos que sugieran que las personas prefieren el nuevo algoritmo. De la misma forma, se había podido utilizar la regla de decisión «rechazar Ho si hay dos o menos + en la muestra», por lo tanto la probabilidad de que la hipótesis nula se rechace cuando en realidad es verdadera es 0,2266. La decisión en este ejemplo se debe al pequeño número de observaciones muéstrales.