Está en la página 1de 7

MÉTODOS NO PARAMÉTRICOS

PRUEBA DE KRUSKAL WALLIS

ESTADÍSTICA
DEPARTAMENTO DE CIENCIAS EXACTAS - ESPE
CLASE Nro. 17.1

CONTENIDO

Título Pruebas no Paramétricas.

Duración 90 minutos

Información general Prueba de signos.

Objetivo Definir una prueba no paramétrica y saber cuándo se ha aplicado


una.

11
CLASE Nro. 17.1

Prueba de Kruskal-Wallis: análisis de la varianza por rangos


El procedimiento del análisis de la varianza (ANOVA) que se estudió se relaciona con la igualdad de
las medias de varias poblaciones. Los datos estaban en un nivel de intervalo o de razón. Asimismo, se
supuso que las poblaciones seguían la distribución normal de probabilidad y que sus desviaciones
estándar eran iguales. ¿Qué sucede si los datos están a escala ordinal y/o las poblaciones no siguen una
distribución normal? En 1952, W.H. Kruskal y W.A. Wallis reportaron una prueba no paramétrica que
sólo requería datos de nivel ordinal (clasificados). No se requieren suposiciones acerca de la forma de
las poblaciones. A la prueba se le conoce como análisis en una dirección de la varianza por rangos de
KruskalWallis.
Para la aplicación de la prueba de Kruskall-Wallis, las muestras seleccionadas de la población deben ser
independientes.

Ejemplo 2: El Hospital System of the Carolinas opera tres hospitales en el área de Great Charlotte: St.
Luke’s Memorial, en el lado poniente de la ciudad, Swedish Medical Center, al Sur, y el Piedmont
Hospital en el lado Este. El director de administración está preocupado acerca del tiempo de espera de
los pacientes con lesiones de tipo deportivo, que no ponen en peligro la vida, y que llegan durante las
tardes entre semana a los tres hospitales. Específicamente ¿existe una diferencia en los tiempos de espera
en los tres hospitales?
Para averiguarlo, el director seleccionó una muestra aleatoria de pacientes en los tres hospitales y
determinó el tiempo, en minutos, en que se entra a un hospital y el momento en que termina el
tratamiento. Los tiempos en minutos se reportan en la tabla.
Swedish
St. Luke’s Piedmont
Medical
Memorial Hospital
Center
56 103 42
39 87 38
48 51 89
38 95 75
73 68 35
60 42 61
62 107
89

El primer paso en la prueba de hipótesis es formular las hipótesis nula y alternativa.


Ho: Las distribuciones de las poblaciones de los tiempos de espera son iguales para los tres hospitales.

H1: No todas las distribuciones de las poblaciones son iguales.

Prueba de Kruskal – Wallis

11
CLASE Nro. 17.1

con k - 1 grados de libertad (k es el número de poblaciones), donde:


∑R1, ∑R2 , ……,∑Ri son las sumas de los rangos de las muestras 1, 2, . . . , i, respectivamente.
n1, n2, ……, ni son los tamaños de las muestras 1, 2, . . . i, respectivamente.
n es el número combinado de observaciones de todas las muestras.
Es preferible que cada muestra incluya al menos 5 observaciones. Utilice ji cuadrada para formular la
regla de decisión. En este ejemplo hay tres poblaciones: Por lo tanto, hay k - 1, es decir, 3 - 1 = 2
grados de libertad. Consulte la tabla de ji cuadrada de los valores críticos. El valor crítico de 2 grados
de libertad y el nivel de significancia de 0.05 es 5.991.

St. Luke’s Memorial Swedish Medical Center Piedmont Hospital

Tiempo de Tiempo de Tiempo de


Rango Rango Rango
espera espera espera
56 9 103 20 42 5.5
39 4 87 16 38 2.5
48 7 51 8 89 17.5
38 2.5 95 19 75 15
73 14 68 13 35 1
60 10 42 5.5 61 11
62 12 107 21
89 17.5
∑R1 58.5 ∑R2 120 ∑R3 52.5

12 58.52 1202 52.52


𝐻𝐻 = � + + � − 3(21 − 1) = 5.38
21(21 + 1) 7 7 7

Como el valor calculado de H (5.38) es menor que el valor crítico de 5.991, no se rechaza la hipótesis
nula. No hay evidencia suficiente para concluir que existe una diferencia entre los tiempos de espera
en los tres hospitales.
Correlación por orden de rango
Charles Spearman, estadístico británico, introdujo una medida para correlacionar datos de nivel ordinal.
Esta medida permite describir la relación entre conjuntos de datos clasificados. Recuerde que r mide la
asociación entre dos variables en escala de intervalo o de razón.

6 ∑ 𝑑𝑑 2
Coeficiente de Correlación por Rangos de Spearman 𝑟𝑟𝑠𝑠 = 1 − 2
𝑛𝑛(𝑛𝑛 −1)

donde:
d es la diferencia entre los rangos por cada par.
n es el número de observaciones por pares.

11
CLASE Nro. 17.1

Al igual que el coeficiente de correlación, el coeficiente de correlación por rangos adopta cualquier valor
en el intervalo de -1.00 a +1.00.
Ejemplo3: Una fábrica de plásticos, contrata a gerentes en capacitación provenientes de universidades.
A cada aspirante el reclutador le asigna una calificación durante la entrevista en el campus. Esta
calificación es una expresión del potencial futuro y varía de 0 a 200; la calificación más alta indica más
potencial. Si el aspirante es contratado por el gerente, ingresa a un programa de capacitación en la planta.
Al terminarlo, recibe otra calificación compuesta, con base en pruebas, opiniones de líderes de grupo y
de personal de entrenamiento, cuyo rango va de 0 a 100. Nuevamente, una calificación más alta indica
un mayor potencial. La calificación en el campus y las calificaciones en la planta aparecen en la tabla.
Calificación
Calificación en de
Graduado
campus, X capacitación,
Y
Spina, Sal 83 45

Gordon, Ray 106 45

Althoff, Roberta 92 45

Alvear, Ginny 48 36

Wallace, Ann 127 68


Lyons, George 113 83

Harbin, Joe 118 88


Davison, Jack 78 61

Brydon, Tom 83 66
Bobko, Jack 193 94

Koppel, Marty 101 56

Nyland, Patricia 123 91

Determine la asociación entre las calificaciones en el campus y en la planta. ¿Los recluta dos que
obtienen mayores calificaciones en la entrevista en el campus obtienen también las puntuaciones más
altas durante su entrenamiento en la planta?

Diagrama de dispersión
100

90

80

70
Calificación de capacitación

60

50

40

30

20

10

0
0 20 40 60 80 100 120 140 160 180 200
Calificación en campus

11
CLASE Nro. 17.1

Calificación Rangos Diferencia

capacitación, en al cuadrado,
Graduado campus, X en campus rangos, d
Y capacitación d^2

Spina, Sal 83 45 3.5 3 0.5 0.25


Gordon, Ray 106 45 7 3 4 16
Althoff, Roberta 92 45 5 3 2 4
Alvear, Ginny 48 36 1 1 0 0
Wallace, Ann 127 68 11 8 3 9
Lyons, George 113 83 8 9 -1 1
Harbin, Joe 118 88 9 10 -1 1
Davison, Jack 78 61 2 6 -4 16
Brydon, Tom 83 66 3.5 7 -3.5 12.25
Bobko, Jack 193 94 12 12 0 0
Koppel, Marty 101 56 6 5 1 1
Nyland, Patricia 123 91 10 11 -1 1
∑=0 ∑ = 61.5

El coeficiente de correlación de rangos es 0.785, obtenido mediante:

6 ∑ 𝑑𝑑2 6(61.50)
𝑟𝑟𝑠𝑠 = 1 − =1− = 0.785
𝑛𝑛(𝑛𝑛2 − 1) 12(122 − 1)
El valor de 0.785 indica una asociación positiva fuerte entre las calificaciones del reclutador en el
campus y las del personal de capacitación. Los graduados que recibieron calificaciones altas del
reclutador en el campus también fueron los que recibieron calificaciones altas del personal de
capacitación. Sería razonable concluir que existe una asociación entre ambos grupos de calificaciones.
Prueba de significancia de rs
En el caso de datos clasificados surge la duda de que la correlación entre la población en realidad sea
cero. ¿Es posible que la correlación sea casual, y que la correlación entre los rangos en la población de
verdad sea 0? Ahora realizará una prueba de significancia para despejar esa duda.
La distribución de muestreo de rs sigue la distribución t con n – 2 grados de libertad.

𝑛𝑛−2
Prueba de Hipótesis, correlación por rangos: 𝑡𝑡 = 𝑟𝑟𝑠𝑠 � 2
1−𝑟𝑟 𝑠𝑠

Las hipótesis nula y alternativa son:


Ho: La correlación por rangos entre la población es cero.
H1: Hay una asociación positiva entre los rangos.
La regla de decisión es rechazar H0 si el valor calculado de t es mayor que 1.812 (con un nivel de
significancia de 0.05, prueba de una cola y 10 grados de libertad, determinado mediante n – 2 = 12 – 2
= 10).
El valor calculado de t es 4.007:

11
CLASE Nro. 17.1

𝑛𝑛 − 2 12 − 2
𝑡𝑡 = 𝑟𝑟𝑠𝑠 � 2 = 0.785� = 4.007
1 − 𝑟𝑟𝑠𝑠 1 − 0.7852

Se rechaza H0 debido a que el valor t calculado de 4.007 es mayor que 1.812. Se acepta H1. Hay
evidencia de una correlación positiva entre los rangos del reclutador en el campus y los rangos asignados
durante la capacitación.

REFERENCIAS BIBLIOGRÁFICAS

1. Anderson, D. Sweeney, D. y Williams, T. (2009). Estadística para Administración y


Economía. CENGAGE Learning Editores, SA. 10ma Ed.
2. Lind, D. Marchall, W. y Wathen, S. (2008). Estadística Aplicada a los Negocios y la
Economía. Mc Graw Hill. 13va Ed.
3. Montgomery, D. Runger, G. (2010). Probabilidad y Estadística aplicadas a la Ingeniería.
Mc Graw Hill. 5ta Ed.
4. Walpole, R. Myers, R. Myers, S. (2007). Probabilidad y Estadística para Ingeniería.
Pearson. 8va Ed.
5. Wackerly, D. Mendenhall, W. Scheaffer, R. (2010). Estadística matemática con
aplicaciones. CENGAGE. 7ma Ed.
6. Canovos, G. (1998). Probabilidad y Estadística Aplicaciones y Métodos. Mc Graw Hill.
1ra Ed.

11

También podría gustarte