Está en la página 1de 9

Prueba de Kruskal-Wallis para K Muestras Independientes

La prueba de rango de Kruskal-Wallis es una generalización de la Prueba de

Mann-Whitney para dos muestras independientes.

La Prueba de Kruskal-Wallis compara el rango medio alcanzado en cada

subgrupo con los demás y determina si estas diferencias son suficientemente

significativa como para rechazar la hipótesis nula.

Frecuentemente hace falta decir si varias muestras independientes deben

considerarse como procedente de una misma población, esto debido a que los

valores de las muestras casi siempre difieren en cierto grado y el problema es

determinar si tras las diferencias muestrales observadas hay diferencias entre

poblaciones o si son solo variaciones al azar que se esperaría entre muestras

aleatorias de la misma población.

ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Prueba de Kruskal-Wallis para K Muestras Independientes

La prueba de rango de Kruskal-Wallis es una generalización de la Prueba de

Mann-Whitney para dos muestras independientes.

La Prueba de Kruskal-Wallis compara el rango medio alcanzado en cada

subgrupo con los demás y determina si estas diferencias son suficientemente

significativa como para rechazar la hipótesis nula.

Frecuentemente hace falta decir si varias muestras independientes deben

considerarse como procedente de una misma población, esto debido a que los

valores de las muestras casi siempre difieren en cierto grado y el problema es

determinar si tras las diferencias muestrales observadas hay diferencias entre

poblaciones o si son solo variaciones al azar que se esperaría entre muestras

aleatorias de la misma población.

ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

La hipótesis a contrastar es:

H0 :Las K medianas de los grupos son todas iguales

(las muestras provienen de la misma población, o poblaciones con

medianas iguales, o existe igualdad en los efectos de los tratamientos ).


H1 : Al menos una de las medianas de los grupos es diferente

(alguna de las k muestras proviene de una población diferente, o de

poblaciones con mediana diferente a las demás, o que los tratamientos

no tienen el mismo efecto).

Muestra 1 x11 x12

Muestra 2 x21 x22 …

……

Muestra k xk1 xk2 …

11nx

22nx

k kn x

Las k muestras en estudio son representadas en una tabla como la siguiente :

donde : N=n1+n2+…+nk , N: número total de observaciones

ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Procedimiento para el calculo del valor del estadístico:

- Se ordenan las observaciones de menor a mayor como si fueran una

sola muestra, asignando a cada una de ellas su rango (1 para la menor,

2 para la siguiente, ... hasta asignar un rango al mayor de las

observaciones).

- Para cada una de las muestras, se calcula Rj

, j=1,2..,k , como la suma

de los rangos de las observaciones que les corresponden a cada

muestra.

- Se reemplazan los datos en la formula arriba indicada y obtenemos el

valor del estadístico de prueba H.

()()
3N1

NN1

12 H

j1j

j−+

+ = ∑=

Estadístico de Prueba:

ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

REGLA DE DECISION:

bajo un nivel de significancia “α”

- Si el número de muestras es k=3 y el número de observaciones en cada

una de ellas no pasa de 5, utilizaremos los valores de tabla 9:

Se rechaza H0 si: el valor de H supera el valor teórico que encontramos en

la tabla de Kruskall-Wallis (H>Htabla, α).

-Para cualquier otro caso diferente al anterior, se compara el valor de H

con el de la tabla de la χ2 con (k-1) g.l.

Se rechaza H0 si el valor del estadístico supera el valor teórico de tabla

H > χ2

tabla((k-1) g.l; α)

ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Observaciones Ligadas:

-Si existen un alto numero de observaciones ligadas (empates) que

represente un porcentaje significativo de la muestra, es necesario corregir el

efecto determinando cuantos grupos ligados ocurrieron y cuantos puntajes


estaban ligados en cada grupo (tamaño del grupo ligado).

Se define:

ti: Número de observaciones ligadas en un grupo “i” (tamaño del grupo ligado)

Ti = t3

i - ti

Factor de corrección para el estadístico “H”:

()

()

13

NN

Factor

−=−

∑=

]()

()

[NN

HH

i1

corregido

−−

=
∑=

ΣTi

: Indica sumar en todos los grupos de liga

N=n1+n2+…+nk , N: número total de observaciones

ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Aplicativo:

Se desea probar la hipótesis que los administradores, profesores orientado a

la enseñanza y profesores orientados a la administración muestran grados de

autoritarismo diferentes. Para eso el investigador divide sus 14 sujetos de

muestra en tres grupos: Profesores orientados a la enseñanza (profesores que

desean permanecer en la enseñanza), profesores orientados a la

administración (profesores que aspiran a ser administradores) y

administradores. Se aplica un test a cada grupo para obtener los puntajes de

autoritarismo.

Profesores

orientados a la

enseñanza

Profesores

orientados a la

administración

Administradores

96 83 115

128 128 149

83 132 166

83 115 147

101 109

Puntajes de autoritarismo de tres grupos de educadores

ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Solución:
Planteamos las hipótesis:

H0 : No hay diferencia entre las medianas de puntajes de autoritarismo de

los profesores orientados a la enseñanza, los profesores orientados a

la administración y los administradores.

H1 : Al menos uno de los grupos de educadores tiene mediana distinta a los

otros.

Calculo del estadístico de prueba:

1) Ordenar de menor a mayor todas las observaciones de los tres grupos

en una sola serie y asignamos rangos :

ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Grupos Puntajes Rango

(Ri

A 83 2

B 83 2

A 83 2

A 96 4

A 101 5

B 109 6

C 115 7.5

B 115 7.5

B 128 9.5

A 128 9.5

B 132 11

C 147 12

C 149 13

C 166 14

A: Profesores orientados a la

enseñanza

B: Profesores orientados a la

administración
C: Administradores

2) Reagrupamos los rangos :

10

ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Profesores

orientados a la

enseñanza

Profesores

orientados a la

administración

Administrador

es

4 2 7.5

9.5 9.5 13

2 11 14

2 7.5 12

56

R1=22.5 R2=36 R3=46.5

Rangos

3) Calculamos el valor del estadístico de prueba:

()()

3N1

NN1

12 H

j1j

j−+

+ = ∑=
3(14 1) 6.49

(46.5)

(36)

(22.5)

14(14 1)

12 2 2 2

−+=⎥


⎤⎢


++

H=

ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Se empieza a determinar cuántos grupos ligados han ocurrido y cuántos

puntajes estaban ligados en cada grupo. La primera liga ocurrió entre 3

puntajes a quienes se les asignó el rango de 2, entonces , “t” el número de

puntajes ligados =3 entonces:

T1 = t3 – t = (3)3 – 3 = 24

La siguiente liga ocurrió entre 2 puntajes a los que se les asignó el rango

promedio de 7.5, entonces “t” = 2

T2= t3 – t = (2)3-2 = 6

H =6.49

Como se presentan ligas entre dos o más puntajes,

corregimos el valor de H de los efectos de ligas con el

factor de corrección: ( )

()
NN

13

i1

−−

∑=

También podría gustarte