Está en la página 1de 44

TETS DE KRUKAL WALLIS

Marco Antonio Rojas Paredes


Variable de resultado
Nominal Categórica (>2 Cuantitativa No- Cuantitativa normal
categorías)
Ordinal Cuantitativa
discreta normal

X2 o de X2 tendencia o Mann- Mann-Whitney o


Nominal X2 Mann-Whitney
Prueba t de student
Fisher Whitney log-rank (a)
Categórica (>2
Kruskal- Kruskal- Kruskal- Análisis de la varianza
categorías) X2 X2
Wallis (b) Wallis (b) Wallis (b) (ANOVA) (c)

Ordinal X2 de Rangos de Rangos de Rangos de Rangos de Spearman o


tendencia o
(e)
(categorías Spearman Spearman Spearman regresión lineal (d)
Variable de ordenadas) Mann –
entrada Whitney

Cuantitativa Regresión (e) (e) Rangos de Rangos de Rangos de Spearman o


Discreto Logística Spearman Spearman regresión lineal (d)

Ploteo de datos,
(e) (e) (e) Ploteo de datos, Pearson o
Cuantitativa Regresión Pearson o rangos
Rangos de Spearman y
no-normal Logística de Spearman
regresión lineal

Cuantitativa Regresión Pearson y regresión lineal


Regresión (e) (e) (e)
normal Logística lineal (d)
• William Kruskal • Wilson Allen Wallis

1.919- 2.005 1.912-1.998


❑ Cuando se presenta el problema de comparar más de dos
muestras con el propósito de conocer si proceden de la misma
población, o bien, comparar si existen diferencias entre las
medidas de tendencia central de más de dos poblaciones y no se
justifica la suposición de normalidad y de igualdad de varianzas,
el químico analista podrá recurrir a un procedimiento alternativo
al de la prueba F del análisis de la variancia y que no depende de
esta suposición.
❑ Kruskal y Wallis (1952) desarrollaron un procedimiento como
alternativa para dar solución a este problema, conocido como la
prueba de Kruskal – Wallis.
La prueba de Kruskal–Wallis constituye una alternativa no
paramétrica al análisis de varianza usual y se considera como una
extensión del procedimiento de suma de rangos de Wilcoxon como
se verá en su desarrollo (MILLER y FREUND, 1989, cap. 10)

La hipótesis nula para la prueba de Kruskal-Wallis es que no existe


diferencia entre los tratamientos (µ1 = µ2 = …. = µa), mientras que
la hipótesis alternativa es que exista diferencia entre al menos un
par de tratamientos ((µi ≠ µj).
Para realizar la prueba de Kruskal–Wallis los datos pueden
agruparse como se presenta en la tabla a continuación
(MONTGOMERY, 1991, cap. 4
Las observaciones se organizan posteriormente, en orden
ascendente y se asignan las posiciones (o rangos) con el rango 1
correspondiente a la observación más pequeña.
En caso de empate (varias observaciones con el mismo rango o
posición), se asigna el rango promedio a cada observación empatada
(MONTGOMERY, 1991, cap. 4)

El estadístico de prueba de Kruskal-Wallis está dado por la expresión


(MONTGOMERY, 1991, cap. 4):
❑ Ri, es la suma de los rangos de las observaciones del i-ésimo
tratamiento
❑ Ni, es el número de observaciones del i-ésimo tratamiento
❑ N es el número total de observaciones y (MONTGOMERY, 1991, cap. 4)
Método no paramétrico que permite comparar, en un solo test,
las medianas de un conjunto de k muestras independientes.

ANOVA
Método paramétrico para comparar
las medias de 3 o más grupos
independiente
Comprobación de supuestos

Normalidad Homogeneidad de varianzas


Prueba Shapiro- Wilks (si n<50) Prueba F de Levene
Prueba de Kolmogorov-Smirnov (si n>50)

Cumplimiento de supuestos
Si No

Método paramétrico: Método no paramétrico:


ANOVA Test de Kruskal- Wallis

Si rechazo H0
Pruebas pos-hoc Comparaciones
Prueba de Scheffe con U de Mann-Whitney
Penalizado por
corrección de Bonferroni
Escenario de aplicación

❑No se cumplen supuestos de normalidad y homogeneidad de


varianzas

❑Muestra pequeña

❑Datos ordinales
Hipótesis

• H0: las tres o más poblaciones de las que proceden los


grupos tienen idéntica mediana
H0: m1 = m2 = .. = m k
• Ha: las tres o más poblaciones de las que proceden los
grupos tienen medianas diferentes*
*No implica que un grupo en concreto sea superior que otro

H0: mCIT seguros=mCITinseguros leves= mCITinseguros moderados=mCIT inseguros severos


❑ La prueba de Kruskal-Wallis en realidad está probando la hipótesis
nula de que las poblaciones de las que se seleccionan las muestras
de grupo son iguales en el sentido de que ninguna de las
poblaciones de grupo es dominante sobre las demás.
❑ Un grupo es dominante sobre los demás si cuando un elemento se
extrae al azar de cada una de las poblaciones del grupo, es más
probable que el elemento más grande esté en ese grupo.

❑ H 0 : las poblaciones del grupo tienen el mismo dominio; es decir,


cuando un elemento se extrae al azar de cada grupo de población,
es igualmente probable que el elemento más grande (o más
pequeño, o el segundo más pequeño, etc.) provenga de cualquiera
de las poblaciones del grupo
❑ H 1 : Al menos una de las poblaciones del grupo es dominante
sobre las demás
PASOS PARA CALCULAR LA PRUEBA KRUSKALL
WALLIS

❑ Planteamiento de hipótesis.
❑ Se ordenan las n observaciones de menor a mayor, y se les
asignan rangos desde 1 hasta n.
❑ Se obtiene la suma de los rangos correspondientes a los
elementos de cada muestra, Rj y se halla el rango promedio.
❑ Calcular estadístico de prueba.
❑ Buscar H en la Tabla de chi cuadrado.
❑ Conclusiones.
Ejemplo: Se han valorado los cambios de presión arterial sistólica
(mmHg) a seis meses de seguimiento con tres regímenes
terapéuticos

Tratamiento A Tratamiento B Tratamiento C


+ 3,5 -4 0
3 -4,5 -0,5
+2,5 -5 -1
0 -5,5 -31
-2 -7
Media = +1,4 Media = -5,2 Media = -8,125
Ordenación de datos.
❑Se ordenan de menor a mayor todos los valores observados en
k muestras.
❑Asignación de rangos
❑Se asigna el rango 1 al valor inferior, el rango 2 al 2º y así
sucesivamente. En caso de empates (mismo valor para dos o
más casos) se asigna la media de los números de orden de los
individuos empatados
VALORES TRATAMIENTO RANG RANG
-31 C 1 1
-7 B 2 2
-5.5 B 3 3
-5 B 4 4
-4.5 B 5 5
-4 B 6 6
-2 A 7 7
-1 C 8 8
-0.5 C 9 9
0 C 10 10.5
0 A 11 10.5
2.5 A 12 12
3 A 13 13
3.5 A 14 14
Cálculo de la suma de rangos.
❑Se suman los rangos asignados para cada grupo

TRATAMIENTO RANGOS SUMA n RANGOS MEDIOS


A 7 10.5 12 13 14 56.5 5 11.3
B 2 3 4 5 6 20 5 4
C 1 8 9 10.5 28.5 4 7.125
SUMA 105 14 7.5

Ecuación para comprobar correcta asignación de rangos


Suma total de rangos = N (N+1)/2 =14 (15)/2 = 105
Cálculo de un test ji cuadrado
❑Si la Ho fuese cierta, los rangos medios de cada grupo
coincidirían con el rango medio total.
Numerador: la diferencia entre lo observado y lo esperado
para cada grupo se eleva al cuadrado.
Además debe ponderarse por el tamaño muestral de cada
grupo

Denominador: usar una medida de error

sumatoria ni (Rmedi – Rmed TOTAL)2


X2 =
N (N+1)/12
5(11,3-7,5) 2 + 5(4-7,5) 2 + 4(7,1-7,5) 2
X2 = = 7.7
14(15)/12
X2 = 7.7
g.l.= k-1
X2c = 16.98
Para hallar p usando Excel: =DISTR.CHI(7.7;2)
p=0.02
Ventajas e inconveniente
❑Puede usarse si:
❑Los datos son ordinales
❑No hay normalidad
❑El tamaño de muestra es muy pequeño

❑Menor potencia y sensibilidad para


detectar diferencias entre grupos
❑No es fácil construir intervalos de
confianza
PRUEBA DE FRIEDMAN

Marco Antonio Rojas Paredes


Pasos a seguir en una prueba de Friedman

1. Planteamiento de hipótesis

❑ Nula: Las respuestas asociadas a cada uno de los


tratamientos tienen la misma distribución de
probabilidad o distribuciones con la misma mediana

❑ Alterna: Por lo menos la distribución de una de las


respuestas difiere de las demás
1. Planteamiento de hipótesis

❑ Hₒ: R₁ = R₂ = … Rₖ

❑ Hₒ: R₁ ≠ R₂ ≠ … Rₖ

La prueba de Friedman determina la diferencia significativa


de los totales de rango
Un nutricionista esta interesado en conocer el efecto de tres
fuentes de proteína sobre la producción de leche, se cuenta
con seis vacas a las cuales se les suministro las tres fuentes de
proteína. Cada fuente se suministro por un periodo de 7 días,
y se registro su producción respectiva. Después de cada
periodo se deja un tiempo de descanso pare evitar el efecto
residual de la fuente aplicada anteriormente. Los datos se
muestran en el cuadro siguiente

VACAS MEDIDA 1 MEDIDA 2 MEDIDA 3


1 40 32 15
2 31 19 10
3 19 21 23
4 30 26 28
5 41 38 35
6 11 12 19
Se arreglan los datos en una tabla de dos entradas
K columnas (producciones) y N filas (vacas)

VACAS MEDIDA 1 MEDIDA 2 MEDIDA 3


1 40 3 32 2 15 1
2 31 19 10
3 19 21 23
4 30 26 28
5 41 38 35 VACAS MEDIDA 1 MEDIDA 2 MEDIDA 3
6 11 12 19
1 40 3 32 2 15 1
R₁ R₂ R₃ 2 31 3 19 2 10 1
3 19 21 23
4 30 26 28
5 41 38 35
6 11 12 19
R₁ R₂ R₃
Reemplazar los datos de cada vaca por su
respectivo rango en cada fila

VACAS MEDIDA 1 MEDIDA 2 MEDIDA 3


1 40 3 32 2 15 1
2 31 3 19 2 10 1
3 19 1 21 2 23 3
4 30 3 26 1 28 2
5 41 3 38 2 35 1
6 11 1 12 2 19 3
R₁ R₂ R₃
Sumar los rangos por columna

VACAS MEDIDA 1 MEDIDA 2 MEDIDA 3


1 40 3 32 2 15 1
2 31 3 19 2 10 1
3 19 1 21 2 23 3
4 30 3 26 1 28 2
5 41 3 38 2 35 1
6 11 1 12 2 19 3
14 11 11
Calcular el X²ӻᵣ

12
X²ӻᵣ= ∑(Rj)² - 3N(k + 1)
𝑁∗𝑘(𝐾+1)

N = Número de filas
K = Número de columnas
Rj = Suma de los rangos en la columna
∑ = Suma de los cuadrados de los rangos en todas
las K condiciones
VACAS MEDIDA 1 MEDIDA 2 MEDIDA 3 12
1 40 3 32 2 15 1 X²ӻᵣ= ∑(Rj)² - 3*N(k + 1)
𝑁∗𝑘(𝐾+1)
2 31 3 19 2 10 1
3 19 1 21 2 23 3
4 30 3 26 1 28 2
5 41 3 38 2 35 1
6 11 1 12 2 19 3
14 11 11

12
X²ӻᵣ= ∑(14² + 11² + 11²) - 3*6(3 + 1)
6∗3(3+1)
N = Número de filas
X²ӻᵣ= 1 K = Número de columnas
Rj = Suma de los rangos en la columna
∑ = Suma de los cuadrados de los rangos en todas
las K condiciones
Encontrar en la tabla de X² para (K – 1) grados
de libertad

X²ӻᵣ= 1

X²t = 5,9915
1. Planteamiento de hipótesis

❑ Nula: Las respuestas asociadas a cada uno de los


tratamientos tienen la misma distribución de
probabilidad o distribuciones con la misma mediana

❑ Alterna: Por lo menos la distribución de una de las


respuestas difiere de las demás

X²ӻᵣ= 1 X²t = 5.9915


X²ӻᵣ ˂ X²t Se acepta la hipótesis nula

X²ӻᵣ ˃ X²t Se rechaza la hipótesis nula


Un médico esta interesado en conocer el efecto de cuatro
tipos medicamentos sobre el VIH, contando con cuatro
personas voluntarias con VIH.
Se aplico los cuatro medicamentosa las 4 personas. Cada
medicamento se administro por 5 días, posterior a cada
administración se realizo el conteo de células CD4.
El médico, después de cada conteo dejo de administrar el
medicamento para que las personas retornaran al estado
inicial y así poder aplicar el siguiente medicamento
Los datos se muestran en el cuadro siguiente:
1. Planteamiento de hipótesis

❑ Nula: Las respuestas asociadas a cada uno de los


tratamientos tienen la misma distribución de
probabilidad o distribuciones con la misma mediana

❑ Alterna: Por lo menos la distribución de una de las


respuestas difiere de las demás

❑ Nula: Los cuatro medicamentos no producen efectos


diferenciales sobre el VIH

❑ Alterna: Los cuatro medicamentos producen efectos


diferenciales sobre el VIH

❑ Nivel de confianza 99%


❑Nivel de significación 0.01
12
X²ӻᵣ= ∑(Rj)² - 3*N(k + 1)
𝑁∗𝑘(𝐾+1)
PERSONAS MEDIDA 1 MEDIDA 2 MEDIDA 3 MEDIDA 4
A 224 300 400 550
B 250 350 450 560
C 255 325 468 600
D 260 299 450 650

Reemplazar los datos de cada persona por su


respectivo rango en cada fila

PERSONAS MEDIDA 1 MEDIDA 2 MEDIDA 3 MEDIDA 4


A 224 1 300 2 400 3 550 4
B 250 1 350 2 450 3 560 4
C 255 1 325 2 468 3 600 4
D 260 1 299 2 450 3 650 4
PERSONAS MEDIDA 1 MEDIDA 2 MEDIDA 3 MEDIDA 4
A 224 1 300 2 400 3 550 4
B 250 1 350 2 450 3 560 4
C 255 1 325 2 468 3 600 4
D 260 1 299 2 450 3 650 4
R₁ R₂ R₃ R₄

Sumar los rangos por columna

PERSONAS MEDIDA 1 MEDIDA 2 MEDIDA 3 MEDIDA 4


A 224 1 300 2 400 3 550 4
B 250 1 350 2 450 3 560 4
C 255 1 325 2 468 3 600 4
D 260 1 299 2 450 3 650 4
4 8 12 16
Calcular el X²ӻᵣ

12
X²ӻᵣ= ∑(Rj)² - 3N(k + 1)
𝑁∗𝑘(𝐾+1)

N = Número de filas
K = Número de columnas
Rj = Suma de los rangos en la columna
∑ = Suma de los cuadrados de los rangos en todas
las K condiciones
12
PERSONAS MEDIDA 1 MEDIDA 2 MEDIDA 3 MEDIDA 4 X²ӻᵣ=
𝑁∗𝑘(𝐾+1)
∑(Rj)² - 3*N(k + 1)
A 224 1 300 2 400 3 550 4
B 250 1 350 2 450 3 560 4
C 255 1 325 2 468 3 600 4
D 260 1 299 2 450 3 650 4
4 8 12 16

12
X²ӻᵣ= ∑(4² + 8² + 12² + 16²) - 3*4(4 + 1)
4∗4(4+1)

X²ӻᵣ= 12
Encontrar en la tabla de X² para (K – 1) grados
de libertad

X²ӻᵣ= 12

X²t = 7.8147
❑ Nula: Los cuatro medicamentos no producen efectos
diferenciales sobre el VIH

❑ Alterna: Los cuatro medicamentos producen efectos


diferenciales sobre el VIH

❑ Nivel de confianza 99%


❑Nivel de significación 0.01

X²ӻᵣ= 12 X²t = 7.8147


X²ӻᵣ ˂ X²t Se acepta la hipótesis nula

X²ӻᵣ ˃ X²t Se rechaza la hipótesis nula

También podría gustarte