Está en la página 1de 13

ANÁLISIS DE VARIANZA UNIFACTORIAL POR

RANGOS, DE KRUSKAL-WALLIS

Icelis Mestra López 1 Rosa De La Rosa2

Marzo 30 del 2015

Icelis Mestra López , Rosa De La Rosa


Kruskal y Wallis elaboraron una estadística basada en rangos para
llevar a cabo la prueba de hipótesis que compara t medias de
tratamientos o poblaciones independientes. La hipótesis nula es que
todas las poblaciones tienen la misma localización. Esta hipótesis
es equivalente a probar:

H0 : µ1 = µ2 = · · · = µt vs H1 : µi 6= µj
Se supone que las variables tiene la misma distribución y la escala
de medida para las t poblaciones debe ser al menos ordinal.

Icelis Mestra López , Rosa De La Rosa


Racionalización y Método

Los datos se presentan en una tabla de doble entrada donde cada


columna representa un grupo o muestra sucesiva. Se deben arreglar
de la sig. manera:

Grupos
1 2 ··· t
x11 x12 ··· x1t
x21 x22 ··· x2t
.. ..
. .
..
xn 1 . ··· xnt
xn2

Donde xij es el dato para la i − ésima observación en el j − ésimo


grupo y ni j es el número de observaciones en el j − ésimo grupo.

Icelis Mestra López , Rosa De La Rosa


Para llevar a cabo la prueba de Kruskal y Wallis, primero se debe
asignar un rango, de menor a mayor, a cada observación, con el
rango o valor 1 a la observación más pequeña, de todas las
observaciones que se tienen sin tener en cuenta la población de
donde proviene, el rango 2 a la segunda observación más pequeña,
y así hasta llegar a la última observación o valor más grande de
todos los obtenidos. En caso de empates, varias observaciones con
el mismo valor, se asigna el rango promedio a cada observación
empatada.

Icelis Mestra López , Rosa De La Rosa


Las dos formas para la prueba Kruskal-Wallis y sus términos
necesarios para calcular el estadístico de Kruskal-Wallis

12 h
H= ∑ rj (R̄j − R̄)2
n(n + 1) j= 1
o

R.j2
" #
12 t
H= ∑ rj − 3(n + 1)
n(n + 1) j=1

Donde
t = Es el número de muestras o grupos (tto)
rj = Número de casos en la j − ésima muestra (repeticiones)
n = Número de casos en la muestra combinada ( suma de los rj )
Rj = Sumatoria de los rangos en la j − ésima muestra
R̄j = Promedio de los rangos en la j − ésima muestra
R̄ = (N + 1)/2 =Promedio de los rangos de la muestra combinada
(la gran media)
Icelis Mestra López , Rosa De La Rosa
Cuando se tiene como mínimo 5 repeticiones por tratamiento la
estadística H tiene aproximadamente distribución χt−2 , es decir, la
1
hipótesis nula H0 es rechazada a un nivel de signicancia α .
Si H > χt−2
1 cuando t = 3 y los rj ≥ 5, Kruskal y Wallis presentan
una tabla con las probabilidades correspondientes, esta tabla
también sirve para el caso cuando los rj ≤ 5.

Icelis Mestra López , Rosa De La Rosa


Observaciones Empatadas

En el caso en que ocurran empates entre dos o más observaciones


el estadístico de prueba H debe corregirse de la siguiente forma:
H
H1 =
C

∑Ti
C = 1− i
n3 − n
Siendo Ti = ti (ti + 1)(ti =1) para cada grupo de empates, donde ti
es el número de observaciones empatadas en el grupo. Dos
estadísticas de prueba H y H1 son muy parecidas.

Icelis Mestra López , Rosa De La Rosa


Ejemplo

Se llevó a cabo un ensayo donde tomaron siete puntos de muestreo


en 4 sectores o zonas diferentes, el objetivo del ensayo era medir el
contenido de magnesio y comparar este contenido en las cuatro
zonas. Los datos registrados se presentan en la siguiente tabla, se
desea probar la hipótesis

H0 : µ1 = µ2 = µ3 = µ4 vs H1 : Almenos una media es distinta

Icelis Mestra López , Rosa De La Rosa


Ejemplo

Rep/Zona Zona1 Zona2 Zona3 Zona4


1 85, 6(21) 91, 6(22, 5) 28(5) 28, 8(6)
2 69, 2(20) 40, 6(9, 5) 27, 6(4) 115, 2(26)
3 49, 6(11) 146, 8(27, 5) 39, 6(8) 91, 6(22, 5)
4 57, 6(18) 54, 4(14, 5) 11, 2(1) 40, 6(9, 5)
5 50, 8(12, 5) 92, 8(24, 5) 56, 8(14) 146, 8(27, 5)
6 62, 4(19) 20, 4(2) 34(7) 54, 4(14, 5)
7 55, 2(16) 50, 8(12, 5) 22(3) 92, 8(24, 5)
R.j 117, 5 113 45 130, 5
R̄.j 16, 78 16, 14 6, 42 18, 64

Icelis Mestra López , Rosa De La Rosa


 
12 R.j2
H= t
n(n+1) ∑j=1 rj − 3(n + 1)
(117,5)2
+ (113 + (457) + (1307,5)
h i
12 )2 2 2

= 12(12+1) 7 7 − 3(28 + 1) = 9, 33
Como χ(20.05,t−1) = χ(20.05,3) = 7, 41 < 9, 33 se concluye que al nivel
de signicancia del 5% existen diferencias signicativas entre los
tratamientos o zonas.

Icelis Mestra López , Rosa De La Rosa


Ejemplo

En una serie de estudios donde se les pidió a los sujetos que


aprendieran la relación de dos señales respecto a un resultado
probabilistico, una tarea requería que los sujetos aprendieran
relaciones funcionales del tipo X + Y + c = Z , en las que X y Y
estaba relacionadas probabilisticamente con el criterio Z y c una
constante arbitraria.

Icelis Mestra López , Rosa De La Rosa


Entrenamiento
Primera señal irrelevante Primera señal valida Ambas señales
0.44 (5.5) 0.70 (10) 0.80 (17)
0.44 (5.5) 0.77 (15) 0.76 (14)
0.54 (8) 0.48 (7) 0.34 (4)
0.32 (3) 0.64 (9) 0.80 (17)
0.21 (1) 0.71 (11) 0.73 (12)
0.28 (2) 0.75 (13) 0.80 (17)
Rj 25 65 81
R̄j 4.17 10.83 13.50

Icelis Mestra López , Rosa De La Rosa


3
n1 = n2 = n3 = 6 y N = ∑ rj = 18 con estos datos podemos
j=1
calcular
 el valor de H:
12 R.j2
H= n(n+1) ∑tj=1 rj− 3(n + 1)
(25)2
+ (656) + (816) − 3(18 + 1) = 9.72
h i
12 2 2

= 18(18+1) 6
C = 1 − (2 −18 2)+(33 −3)
3

3
−18
= 0.995 ⇒ H1 = H/C = 9.72/0.995 = 9.769
2 2
y χ(0.05,t−1) = χ(0.05,2) = 5.99
En conclución se rechaza H0 , ya que H1 > χ(20.05,t−1) = 5.99,
entonces existe diferencias entre los grupos entrenados de manera
distinta.

Icelis Mestra López , Rosa De La Rosa