Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Métodos Estadísticos
Bradley Efron
(1938-?)
1
Capítulo IV: Pruebas No Paramétricas
Pruebas de Hipótesis (Parte III)
1. Introducción
2. Prueba de hipótesis para una muestra k relacionada
a. Prueba Q de Cochran
b. Prueba de Friedman
c. Prueba W de Kendall
3. Prueba de hipótesis para k muestras independientes
a. Prueba de la Mediana
b. Prueba de Kruskal Wallis
c. Prueba de Jonckheere-Terpstra
d. Prueba de Levene
e. Prueba de Fligner-Killeen
f. Prueba de Cochran
2
Por otro lado, las pruebas estadísticas para k
muestras independientes se utilizan principalmente
para comparar si un parámetro de posición es
similar en todas las poblaciones o al menos uno es
diferente a los demás.
En el caso paramétrico se puede hacer uso de la
prueba F de k muestras independientes. Sin
embargo, en las pruebas no paramétricas hay
varias alternativas algunas mas poderosas que otras
y estas se eligen dependiendo del objetivo del
estudio.
Aspectos Generales:
Es una extensión de la prueba de Mc Nemar.
Evalúa si tres o más grupos de datos difieren o no entre ellos.
El diseño es simple a n sujetos se les toma k medidas
dicotómicas o k medidas dicotómicas son medidas en una
muestra.
Estamos por lo tanto en un diseño idéntico al DBCA pero aquí
la variable respuesta es dicotómica.
Supuestos:
La muestra es seleccionada al azar.
Las observaciones deben ser susceptibles de
transformación dicotómica.
3
Hipótesis:
H0: 1= 2 =… = k
H1: Al menos un i es diferente a los demás i=1,2..,k
Prueba Estadística:
k k
2
k 1 k G j G j
2
j 1 j 1
Q n n
~ 21 ,k 1
k Li Li 2
i 1 i 1
donde: Gj es la suma correspondiente al grupo j, Li es la
suma correspondiente al individuo i.
En R existe la función cochran.qtest del paquete
RVAideMemoire
Ejemplo
Se desea verificar si 4 preguntas de una prueba de
rendimiento poseen o no el misma nivel dificultad. Para ello
se evalúan a 10 individuos anotando su desacierto (0) o
acierto (1). Realice la prueba respectiva use =0.05.
Sujeto Pregunta 1 Pregunta 2 Pregunta 3 Pregunta 4
1 1 1 1 1
2 1 0 0 0
3 1 0 1 0
4 1 1 1 0
5 0 0 1 0
6 0 1 1 0
7 1 0 1 1
8 0 0 1 0
9 1 1 1 0
10 0 1 1 0
4
Ejemplo
H0: 1= 2 =3= 4
H1: Al menos un i es diferente a los demás i=1,2,3,4
=0.05
Pvalor = 0.019 < se rechaza H0
Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para rechazar H0.
Por lo tanto, se puede afirmar que las preguntas de dicha
evaluación no poseen igual nivel de dificultad.
Aspectos Generales:
Esta prueba es apropiada siempre que los datos pueden
disponerse significativamente en una clasificación de dos
criterios, es decir es el equivalente no paramétrico de un
análisis de dos vías o Diseño de Bloques Completos al
Azar (DBCA).
Supuestos:
La muestra es seleccionada al azar.
Los b bloques son mutuamente independientes, es
decir los resultados de un bloque no influyen en los
resultados de los otros bloques.
La escala de medida es al menos ordinal.
5
Procedimiento:
Para cada uno de los b bloques, las k grupos son
ordenadas en un rango de 1 a k.
Los rangos asignados a las observaciones en cada uno de
los k grupos se suman por separado para dar k sumas de
rangos.
Aplicar el estadístico de la prueba que se basa en estos
rangos
R:
En R se utiliza la función friedman.test(respuesta, tratamiento,
bloque). Esta función se puede complementar con la función
friedmanmc del paquete pgirmess
En el paquete agricolae se encuentra la función friedman que
permite realizar las pruebas de comparación.
friedman(bloque, tratamiento, respuesta)
Hipótesis:
H0: Me1=Me2=…=Mek
H1: Al menos una Mei es diferente a las demás i=1,2,…,k
Prueba Estadística:
1 k 2
A R X ij Ri
k b
B
2
i 1 j 1 b i 1
b 2 k k 1
2
k 1 bB
4
T ~ 21 ,k 1
bk k 1
2
A
4
donde: b es el número de bloques y k es el número de
grupos.
6
Si se rechaza H0 una inquietud es determinar cual o
cuales son los mejores tratamientos, para eso se debe
realizar la prueba de comparación.
Hipótesis de Comparación:
H0: Mei=Mej i j i,j=1,2,…,k
H1: MeiMej
Criterio de Decisión Estadística:
2b A B
Si Ri R j t se rechaza H0
1 , b 1 k 1
2
b 1 k 1
Ejemplo
Se realizó un experimento para analizar el sabor de una
nueva marca de cola antes de que se lance al mercado. Las
marcas de colas en comparación fueron dadas a 5 jueces
especializados y se estableció una escala de valores de (1-5)
donde 1 es el de peor sabor y 5 el de mejor sabor
Los resultados del experimento se muestran a continuación:
Marcas de gaseosas colas
Jueces Cola 1 Cola 2 Cola 3 Nueva
Cola
1 5 2 3 2
2 4 1 3 4
3 5 2 2 3
4 5 1 3 2
5 5 2 3 3
Realice la prueba de Friedman de sus conclusiones a un nivel
de significación de 0.05.
7
Ejemplo
H0: Me1=Me2=Me3=Me4
H1: Al menos una Mei es diferente a las demás i=1,2,3,4
=0.05
Pvalor = 0.008 < se rechaza H0
Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para rechazar H0.
Por lo tanto, se puede afirmar que el sabor es diferente en
al menos una de las marcas de sabor cola en estudio.
Cuadro resumen
a 1 19.5
b 4 12.5
b 3 12
c 2 6
8
Aspectos Generales:
El W de Kendall sirve para estudiar la relación entre k
conjuntos de rangos.
Por ejemplo cuando una muestra es clasificada según k
características o cuando b jueces evalúan una muestra de
tratamientos según una característica. Se puede decir que hay
concordancia perfecta cuando todos los jueces valoran todos
los tratamientos de igual manera, caso contrario no habría
concordancia.
Supuestos:
La muestra es seleccionada al azar.
Los valores muestrales deben esta al menos en la escala
ordinal.
Hipótesis:
H0: Me1=Me2=…=Mek
H1: Al menos una Mei es diferente a las demás i=1,2,…,k
k
Prueba Estadística: 12 R 2j
j 1 3 n 1
W
k n n 1
2 2
n 1
k n 1W ~ 21 ,k 1
2
9
Ejemplo
Un experimento fue diseñado para estudiar el efecto del paso del
tiempo sobre la calidad del recuerdo. A un grupo de 9 sujetos se le hizo
memorizar una historia compuesta por una cierta cantidad de palabras
durante 20 minutos. Posteriormente, al cabo de una, dos, tres y cuatro
horas, se le piden que anoten lo recordado. Un grupo de expertos
evalúa lo recordando, contabilizando el número de palabras
correctamente recordadas, encontrando los siguientes datos:
Sujeto Una hora Dos horas Tres horas Cuatro horas
1 16 8 8 12
2 12 9 9 10
3 12 10 10 8
4 15 13 7 11
5 18 12 12 12
6 13 13 8 10
7 18 16 10 13
8 15 9 6 6
9 20 9 11 8
Evalúe los niveles de recuerdo en los distintos tiempo en evaluación a
un nivel de significación de 0.05.
Ejemplo
H0: Me1=Me2=Me3=Me4
H1: Al menos una Mei es diferente a las demás i=1,2,3,4
=0.05
Pvalor = 0 < se rechaza H0
Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para rechazar H0.
Por lo tanto, se puede afirmar que existe diferencia entre
los niveles de recuerdo en al menos uno de los tiempos en
evaluación.
10
Aspectos Generales:
Otra alternativa similar a la prueba de Kruskal Wallis es la
prueba de la Mediana. Por lo tanto, esta prueba puede
utilizarse para probar la hipótesis nula de que k muestras
independientes se han extraído de poblaciones con medianas
iguales.
Supuestos:
Las observaciones deben expresarse en al menos escala
de intervalo.
Las muestras son aleatorias e independientes.
Las poblaciones tienen la misma distribución, difiriendo
solo en su localización.
Procedimiento:
Calcular la mediana común de las k muestras (o grupos) es
decir de todo el conjunto de observaciones sin importar a
que grupo pertenezcan.
Para cada grupo se determina en una fila el número de
observaciones que son menores o iguales a mediana
común y en otra columna aquellas observaciones que son
mayores a ella.
Las frecuencias resultantes se disponen en una tabla 2 x k.
Aplicar la prueba estadística.
11
Hipótesis:
H0: Me1=Me2=…=Mek
H1: Al menos una Mei es diferente a las demás i=1,2,…,k
Prueba Estadística:
2
2 k
o
ij eij
2
2k 1,1
c
i 1 j 1 eij
Ejemplo
Quince alumnos en un curso técnico son aleatoriamente
asignados a tres tipos diferentes de métodos de
instrucción, todos los cuales persiguen el desarrollo de
un nivel específico de habilidad en diseño asistido por
computadora. Las calificaciones de la prueba de
aprovechamiento al término de la unidad de instrucción
se reportan en la siguiente tabla:
Método A1 Método A2 Método A3
86 90 82
79 86 68
81 88 73
70 82 71
84 89 81
Verifique a un =0.05 si algún método es mejor a los
demás.
12
Ejemplo
H0: Me1=Me2=Me3
H1: Al menos una Mei es diferente a las demás i=1,2,3
=0.05
Pvalor = 0.036 < se rechaza H0
Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para rechazar H0.
Por lo tanto, se puede afirmar que algún método es mejor a
los demás.
Aspectos Generales:
Esta prueba sirve para probar la hipótesis nula de que varias
poblaciones tienen las mismas medianas. Es el equivalente no
paramétrico del Diseño Completamente al Azar de un factor.
Es decir esta prueba puede ser utilizada cuando no se
cumplen las suposiciones de que las poblaciones de las
cuales se extraen las muestras no están distribuidas
normalmente con varianzas iguales, o cuando los datos
constan solo de rangos.
.
Supuestos:
Las observaciones deben expresarse en al menos escala
de intervalo.
Las muestras son aleatorias e independientes.
Las k poblaciones tienen la misma forma y dispersión
13
Procedimiento:
Las n1, n2,…nk observaciones de los k grupos se combinan
en una sola serie de tamaño n y se disponen en orden de
magnitud desde la más pequeña hasta la más grande.
Cuando dos o más observaciones tienen el mismo valor, a
cada una de ellas se le asigna la media de los rangos con
los cuales está relacionado.
Los rangos asignados a las observaciones en cada uno de
los k grupos se suman por separado para dar k sumas de
rangos.
Aplicar la prueba estadística.
Hipótesis:
H0: Me1=Me2=…=Mek
H1: Al menos una Mei es diferente a las demás i=1,2,…,k
Prueba Estadística:
1 k ni 2 n n 1
ni
Ri R X ij
2
S
2
R X ij
n 1 i 1 j 1 4
j 1
1 k Ri2 n n 1
2
T 2 ~ 1 ,k 1
2
S i 1 ni 4
14
Si se rechaza H0 se debe realizar la prueba de
comparación.
Hipótesis de Comparación:
H0: Mei=Mej i j i,j=1,2,..k
H1: MeiMej
Criterio de Decisión Estadística:
Si Ri R j t S n 1 T 1 1 se rechaza H 0
2
nk ni n j
ni nj 1 , n k
2
R:
En R se usa la función kruskal.test(respuesta, tratamiento),
que se puede complementar con la función kruskalmc del
paquete pgirmess.
En el paquete agricolae se encuentra la función kruskal que
permite realizar las pruebas de comparación.
kruskal(respuesta, tratamiento)
Ejemplo
Quince alumnos en un curso técnico son aleatoriamente
asignados a tres tipos diferentes de métodos de
instrucción, todos los cuales persiguen el desarrollo de
un nivel específico de habilidad en diseño asistido por
computadora. Las calificaciones de la prueba de
aprovechamiento al término de la unidad de instrucción
se reportan en la siguiente tabla:
Método A1 Método A2 Método A3
86 90 82
79 86 68
81 88 73
70 82 71
84 89 81
Verifique a un =0.05 si algún método es mejor a los
demás.
15
Ejemplo
H0: Me1=Me2=Me3
H1: Al menos una Mei es diferente a las demás i=1,2,3
=0.05
Pvalor = 0.018 < se rechaza H0
Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para rechazar H0.
Por lo tanto, se puede afirmar que algún método es mejor a
los demás.
Cuadro resumen
Groups, Treatments and mean of the ranks
a 2 12.4
b 1 7
b 3 4.6
16
Aspectos Generales:
Prueba la hipótesis de que las muestras se encuentran
ordenados en una secuencia específica a priori.
A fin de asegurar el uso adecuado de la prueba, el
investigador debe ser capaz de especificar el orden de los
grupos. El orden debe ser especificado antes de recabar los
datos.
Supuestos:
Las observaciones deben expresarse en al menos escala
de intervalo.
Las muestras son aleatorias e independientes.
Las muestras provienen de una misma población.
Procedimiento:
Para cada una las k muestras (o tratamientos) de manera
independiente ordenar las observaciones de menor a mayor.
Formar todos los diferentes pares de muestras.
En cada par fijar una muestra, para cada una de las
observaciones de esta muestra contabilizar cuantas
observaciones de la otra muestra son superiores (o
inferiores). Repetir este proceso para cada uno de los pares.
Calcular la suma de las contabilizaciones de cada par.
Determinar el estadístico J que es la sumatoria de los
recuentos determinados en el paso anterior.
R:
En R se utiliza la función jonckheere.test del paquete
clinfun
jonckheere.test(respuesta, grupo, alternativa)
17
Hipótesis:
Unilateral izquierda Bilateral Unilateral derecha
H0: Me1 Me2 =…= Mek H0: Me1 Me2 =…= Mek H0: Me1 Me2 =…= Mek
H1: Al menos un Mei es
H1: Me1 <Me2 < …< Mek H1: Me1 Me2 …> MeK
diferente i=1,2,..,k
Prueba Estadística:
Muestras
n pequeñas
U ij # X hi , j
i
Muestras Grandes
k k
n 2 n 2j n 2 (2n 3) n 2j (2n j 3) J J
j 1 j 1 Z ~N(0,1)
J J2 J
4 72
Ejemplo
Se desea realizar un experimento para verificar si los juicios
de salinidad se incrementarían conforme se disminuye la
proporción de NaCl (cloruro de sodio) en los ensayos de
prueba. Los datos se presentan a continuación:
18
Ejemplo
H 0 : Me1 Me2 Me3 Me4
H1 : Me1 < Me2 < Me3 < Me4
=0.05
Pvalor = 0.0003 < se rechaza H0
Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para rechazar H0.
Por lo tanto, se puede afirmar que los juicios de salinidad
se incrementarían conforme se disminuye la proporción de
NaCl (cloruro de sodio) en los ensayos de prueba.
19
Supuestos: muestras elegidas al azar e
independientes.
n k ni Z i Z
k 2
Estadístico de prueba:
W i 1
~ F1 ,k 1,n k
k 1 Zij Z i
k ni 2
1 an, j
i n an , j
an,i 1 ai a
2 2 n 1 jGi ni j 1 n
Pvalor=P(2(k-1)>2cal)
20
Supuestos: muestras al azar e independientes
Estadístico de prueba:
max Si2
H t
S
i 1
i
2
21
Otras pruebas Estadísticas:
Brown Forsythe (1974)
O´Brien (1981)
Mudholkar-McDermott-Aumont (1993)
Neuhauser-Hothorn (2000)
22