Está en la página 1de 4

PRUEBA DE KRUSKAL-WALLIS

El test de Kruskal-Wallis es el test adecuado cuando los datos tienen un orden natural, es
decir, cuando para darles sentido tienen que estar ordenados o bien cuando no se satisfacen las
condiciones para poder aplicar un ANOVA. Por ejemplo, si se quiere estudiar la diferencia entre
hombres y mujeres en una carrera, se puede disponer de dos tipos de datos: los tiempos de cada
participante (análisis con ANOVA) o las posiciones en las que ha terminado la carrera cada
participante (análisis con Kruskal-Wallis test).

Supóngase que se dispone de k grupos cada uno con n observaciones. Si se ordenan todas las
observaciones de menor a mayor y se le asigna a cada una de ellas su rango, cuando se obtenga
la suma de rangos para cada uno de los grupos (Ri) es de esperar que, si se cumple la hipótesis
nula, todos los grupos tengan un valor similar. Partiendo de esta idea se calcula el estadístico H
como:

H=12N(N+1)∑i=1kR²ini−3(N+1)

Condiciones

Homocedasticidad: dado que la hipótesis nula asume que todos los grupos pertenecen a una
misma población y que por lo tanto tienen las mismas medianas, es requisito necesario que todos
los grupos tengan la misma varianza. Se puede comprobar con representaciones gráficas o con
los test de Levenne o Barttlet.

Misma distribución para todos los grupos: la distribución de los grupos no tiene que ser
normal pero ha de ser igual en todos (por ejemplo que todos muestren asimetría hacia la
derecha).

Si estos requerimientos se cumplen, el estadístico H del test de Kruskal-Wallis se compara


con:

Si el tamaño de grupos k es igual a 3 y el número de observaciones en cada uno no es mayor


que 5, se recurre a tablas tabuladas con valores teóricos de H.
En el resto de casos se asume que el estadístico H sigue una distribución χ2 con k-1 grados de
libertad (siendo k el número de grupos a comparar).

En la mayoría de la bibliografía consultada consideran que el ANOVA es bastante robusto a


la falta de normalidad sobre todo con muestras medianas o grandes. Solo recomiendan el uso del
test de Kruskal-Wallis cuando las poblaciones a comparar sean claramente asimétricas, se
cumpla que todas lo sean en la misma dirección y que la varianza sea homogénea. Si la varianza
no es homogénea el test adecuado es un ANOVA con corrección de Welch. En los casos en los
que se trata de datos puramente ordinales el ANOVA no es una opción.

Aquí se prueba si varias muestras independientes (más de dos muestras o lo que es lo mismo
decir k muestras independientes) provienen o no de la misma población. Puede ser considerada
como una generalización de la prueba de la Suma de rangos de Wilcoxon.

Asume que la variable tiene una distribución continua y requiere que esté medida en una
escala ordinal o cuantitativa discreta.

Hipótesis:

 H0: Med1= Med2=…=Medk


 H1: Medi ≠ Medj al menos para un par (i,j)

El estadígrafo H de Kruskal Wallis que para 3 o más grupos de tamaño 5 o mayor tiene una
distribución χ2 con k-1 grados de libertad.

Otra forma de declarar las hipótesis puede ser:

Hipótesis:

 H0: Las muestras provienen de poblaciones idénticas


 H1: Las muestras provienen de poblaciones diferentes

Ejemplo: Los efectos de dos drogas con respecto al tiempo de reacción a cierto estímulo
fueron estudiados en tres grupos de animales experimentales. El grupo III sirvió como control
(C), mientras que a los grupos I y II les fueron aplicadas las drogas A y B respectivamente, con
anterioridad a la aplicación del estímulo. Puede afirmarse que los tres grupos difieren en cuanto
al tiempo de reacción.

Hipótesis:

 H0: Las tres muestras provienen de la misma población


 H1: Al menos una de las muestras proviene de una población con mediana
diferente.

Grupos A B C
17 8 2
Tiempo de 20 7 5
Reacción 40 9 4
(Seg.) 31 8 3
35    

Interpretación: (los resultados a comentar los destaqué en las tablas en amarillo): En la tabla
titulada “Rangos” vemos que se analizaron 13 personas, cinco en el Grupo A y cuatro en los
Grupo B y C. El rango promedio mayor fue para el Grupo A, en tanto el menor fue para el Grupo
C.

En la tabla titulada “Estadístico de contraste” se observa el valor del estadístico H, que para 2
grados de libertad fue de 10, 711. Se observa en la fila Sig. asintót. y su valor de 0,005.

Podemos decir que, como el valor de p (Sig. asintót.) es menor que 0,05, entonces se rechaza
la hipótesis nula y se concluye que existen evidencias suficientes para plantear que la mediana
del tiempo de reacción difiere entre los grupos, con un nivel de significación del 5%.

Como en este ejemplo anterior la mediana del tiempo de reacción difiere entre los grupos hay
que realizar la prueba Kruskal-Wallis a posteriori con el objetivo de ver entre cuáles grupos
difiere la mediana. Pasemos a ver esta prueba:
Esta prueba sí permite conocer dónde están las diferencias y qué muestras provocan el
rechazo.

Se realiza para dos muestras independientes, cuando la variable es ordinal o cuantitativa


discreta y sólo se realiza cuando se rechaza la hipótesis nula de la prueba KruskalWallis.

También podría gustarte