Está en la página 1de 22

Escuela de Posgrado

Maestría en Estadística Aplicada

Métodos Estadísticos

Mg Sc Jaime Carlos Porras Cerrón

Bradley Efron
(1938-?)

1
Capítulo IV: Pruebas No Paramétricas
Pruebas de Hipótesis (Parte III)
1. Introducción
2. Prueba de hipótesis para una muestra k relacionada
a. Prueba Q de Cochran
b. Prueba de Friedman
c. Prueba W de Kendall
3. Prueba de hipótesis para k muestras independientes
a. Prueba de la Mediana
b. Prueba de Kruskal Wallis
c. Prueba de Jonckheere-Terpstra
d. Prueba de Levene
e. Prueba de Fligner-Killeen
f. Prueba de Cochran

Las pruebas estadísticas de una sola muestra que


implican k medidas, se utiliza cuando el investigador
desea analizar datos provenientes de un estudio de
tipo longitudinal con el fin de determinar si hubo
un cambio en las mediciones en situaciones
temporales distintas o para la evaluación de un
mismo grupo de personas a varios tratamientos.
En el caso paramétrico se puede hacer uso de la
prueba F mediante el Diseño de Bloques Completos
al Azar (DBCA). Sin embargo, las pruebas no
paramétricas para k muestras relacionadas se
pueden utilizar cuando no se cumplen los supuestos
que exige la prueba F.

2
Por otro lado, las pruebas estadísticas para k
muestras independientes se utilizan principalmente
para comparar si un parámetro de posición es
similar en todas las poblaciones o al menos uno es
diferente a los demás.
En el caso paramétrico se puede hacer uso de la
prueba F de k muestras independientes. Sin
embargo, en las pruebas no paramétricas hay
varias alternativas algunas mas poderosas que otras
y estas se eligen dependiendo del objetivo del
estudio.

 Aspectos Generales:
Es una extensión de la prueba de Mc Nemar.
Evalúa si tres o más grupos de datos difieren o no entre ellos.
El diseño es simple a n sujetos se les toma k medidas
dicotómicas o k medidas dicotómicas son medidas en una
muestra.
Estamos por lo tanto en un diseño idéntico al DBCA pero aquí
la variable respuesta es dicotómica.
 Supuestos:
 La muestra es seleccionada al azar.
 Las observaciones deben ser susceptibles de
transformación dicotómica.

3
 Hipótesis:
H0:  1= 2 =… = k
H1: Al menos un i es diferente a los demás i=1,2..,k

 Prueba Estadística:
 k  k  
2

 k  1 k  G j    G j  
2

 j 1  j 1  
Q n n
~  21 ,k 1
k  Li   Li 2

i 1 i 1
donde: Gj es la suma correspondiente al grupo j, Li es la
suma correspondiente al individuo i.
En R existe la función cochran.qtest del paquete
RVAideMemoire

 Ejemplo
Se desea verificar si 4 preguntas de una prueba de
rendimiento poseen o no el misma nivel dificultad. Para ello
se evalúan a 10 individuos anotando su desacierto (0) o
acierto (1). Realice la prueba respectiva use =0.05.
Sujeto Pregunta 1 Pregunta 2 Pregunta 3 Pregunta 4
1 1 1 1 1
2 1 0 0 0
3 1 0 1 0
4 1 1 1 0
5 0 0 1 0
6 0 1 1 0
7 1 0 1 1
8 0 0 1 0
9 1 1 1 0
10 0 1 1 0

4
 Ejemplo
H0:  1= 2 =3= 4
H1: Al menos un i es diferente a los demás i=1,2,3,4

  =0.05
 Pvalor = 0.019 <  se rechaza H0

Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para rechazar H0.
Por lo tanto, se puede afirmar que las preguntas de dicha
evaluación no poseen igual nivel de dificultad.

 Aspectos Generales:
Esta prueba es apropiada siempre que los datos pueden
disponerse significativamente en una clasificación de dos
criterios, es decir es el equivalente no paramétrico de un
análisis de dos vías o Diseño de Bloques Completos al
Azar (DBCA).

 Supuestos:
 La muestra es seleccionada al azar.
 Los b bloques son mutuamente independientes, es
decir los resultados de un bloque no influyen en los
resultados de los otros bloques.
 La escala de medida es al menos ordinal.

5
 Procedimiento:
 Para cada uno de los b bloques, las k grupos son
ordenadas en un rango de 1 a k.
 Los rangos asignados a las observaciones en cada uno de
los k grupos se suman por separado para dar k sumas de
rangos.
 Aplicar el estadístico de la prueba que se basa en estos
rangos
 R:
En R se utiliza la función friedman.test(respuesta, tratamiento,
bloque). Esta función se puede complementar con la función
friedmanmc del paquete pgirmess
En el paquete agricolae se encuentra la función friedman que
permite realizar las pruebas de comparación.
friedman(bloque, tratamiento, respuesta)

 Hipótesis:
H0: Me1=Me2=…=Mek
H1: Al menos una Mei es diferente a las demás i=1,2,…,k
 Prueba Estadística:
1 k 2
A    R  X ij    Ri
k b
B
2

i 1 j 1 b i 1
 b 2 k  k  1 
2

 
k  1 bB  
 4 
T ~ 21 ,k 1
bk  k  1
2

A
4
donde: b es el número de bloques y k es el número de
grupos.

6
Si se rechaza H0 una inquietud es determinar cual o
cuales son los mejores tratamientos, para eso se debe
realizar la prueba de comparación.

 Hipótesis de Comparación:
H0: Mei=Mej  i  j i,j=1,2,…,k
H1: MeiMej
 Criterio de Decisión Estadística:
2b  A  B 
Si Ri  R j  t  se rechaza H0

1 , b 1 k 1 
 2 
 b  1 k  1

 Ejemplo
Se realizó un experimento para analizar el sabor de una
nueva marca de cola antes de que se lance al mercado. Las
marcas de colas en comparación fueron dadas a 5 jueces
especializados y se estableció una escala de valores de (1-5)
donde 1 es el de peor sabor y 5 el de mejor sabor
Los resultados del experimento se muestran a continuación:
Marcas de gaseosas colas
Jueces Cola 1 Cola 2 Cola 3 Nueva
Cola
1 5 2 3 2
2 4 1 3 4
3 5 2 2 3
4 5 1 3 2
5 5 2 3 3
Realice la prueba de Friedman de sus conclusiones a un nivel
de significación de 0.05.

7
 Ejemplo
H0: Me1=Me2=Me3=Me4
H1: Al menos una Mei es diferente a las demás i=1,2,3,4

  =0.05
 Pvalor = 0.008 <  se rechaza H0

Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para rechazar H0.
Por lo tanto, se puede afirmar que el sabor es diferente en
al menos una de las marcas de sabor cola en estudio.

H0: Mei=Mej  i  j i,j=1,2,3,4


H1: MeiMej

Cuadro resumen
a 1 19.5
b 4 12.5
b 3 12
c 2 6

Se puede afirmar que la marca de cola 1 es la que presenta


mejor sabor.

8
 Aspectos Generales:
El W de Kendall sirve para estudiar la relación entre k
conjuntos de rangos.
Por ejemplo cuando una muestra es clasificada según k
características o cuando b jueces evalúan una muestra de
tratamientos según una característica. Se puede decir que hay
concordancia perfecta cuando todos los jueces valoran todos
los tratamientos de igual manera, caso contrario no habría
concordancia.
 Supuestos:
 La muestra es seleccionada al azar.
 Los valores muestrales deben esta al menos en la escala
ordinal.

 Hipótesis:
H0: Me1=Me2=…=Mek
H1: Al menos una Mei es diferente a las demás i=1,2,…,k
k
 Prueba Estadística: 12 R 2j
j 1 3  n  1
W 
k n  n  1
2 2
n 1
  k  n  1W ~ 21 ,k 1
2

En R se encuentra en el paquete vegan en la función


kendall.global(t(datos)) o el paquete irr con la función
kendall(t(datos))
 Otras pruebas:
Prueba de Quade
Prueba de Pages

9
 Ejemplo
Un experimento fue diseñado para estudiar el efecto del paso del
tiempo sobre la calidad del recuerdo. A un grupo de 9 sujetos se le hizo
memorizar una historia compuesta por una cierta cantidad de palabras
durante 20 minutos. Posteriormente, al cabo de una, dos, tres y cuatro
horas, se le piden que anoten lo recordado. Un grupo de expertos
evalúa lo recordando, contabilizando el número de palabras
correctamente recordadas, encontrando los siguientes datos:
Sujeto Una hora Dos horas Tres horas Cuatro horas
1 16 8 8 12
2 12 9 9 10
3 12 10 10 8
4 15 13 7 11
5 18 12 12 12
6 13 13 8 10
7 18 16 10 13
8 15 9 6 6
9 20 9 11 8
Evalúe los niveles de recuerdo en los distintos tiempo en evaluación a
un nivel de significación de 0.05.

 Ejemplo
H0: Me1=Me2=Me3=Me4
H1: Al menos una Mei es diferente a las demás i=1,2,3,4

  =0.05
 Pvalor = 0 <  se rechaza H0

Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para rechazar H0.
Por lo tanto, se puede afirmar que existe diferencia entre
los niveles de recuerdo en al menos uno de los tiempos en
evaluación.

10
 Aspectos Generales:
Otra alternativa similar a la prueba de Kruskal Wallis es la
prueba de la Mediana. Por lo tanto, esta prueba puede
utilizarse para probar la hipótesis nula de que k muestras
independientes se han extraído de poblaciones con medianas
iguales.

 Supuestos:
 Las observaciones deben expresarse en al menos escala
de intervalo.
 Las muestras son aleatorias e independientes.
 Las poblaciones tienen la misma distribución, difiriendo
solo en su localización.

 Procedimiento:
 Calcular la mediana común de las k muestras (o grupos) es
decir de todo el conjunto de observaciones sin importar a
que grupo pertenezcan.
 Para cada grupo se determina en una fila el número de
observaciones que son menores o iguales a mediana
común y en otra columna aquellas observaciones que son
mayores a ella.
 Las frecuencias resultantes se disponen en una tabla 2 x k.
 Aplicar la prueba estadística.

11
 Hipótesis:
H0: Me1=Me2=…=Mek
H1: Al menos una Mei es diferente a las demás i=1,2,…,k

 Prueba Estadística:

  
2
2 k
o
ij  eij 
2

 2k 1,1 
c
i 1 j 1 eij

Se rechaza H0 si 2c >  2crit


 R:
En R existe la función mood.medtest del paquete
RVAideMemoire

 Ejemplo
Quince alumnos en un curso técnico son aleatoriamente
asignados a tres tipos diferentes de métodos de
instrucción, todos los cuales persiguen el desarrollo de
un nivel específico de habilidad en diseño asistido por
computadora. Las calificaciones de la prueba de
aprovechamiento al término de la unidad de instrucción
se reportan en la siguiente tabla:
Método A1 Método A2 Método A3
86 90 82
79 86 68
81 88 73
70 82 71
84 89 81
Verifique a un =0.05 si algún método es mejor a los
demás.

12
 Ejemplo
H0: Me1=Me2=Me3
H1: Al menos una Mei es diferente a las demás i=1,2,3

  =0.05
 Pvalor = 0.036 <  se rechaza H0

Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para rechazar H0.
Por lo tanto, se puede afirmar que algún método es mejor a
los demás.

 Aspectos Generales:
Esta prueba sirve para probar la hipótesis nula de que varias
poblaciones tienen las mismas medianas. Es el equivalente no
paramétrico del Diseño Completamente al Azar de un factor.
Es decir esta prueba puede ser utilizada cuando no se
cumplen las suposiciones de que las poblaciones de las
cuales se extraen las muestras no están distribuidas
normalmente con varianzas iguales, o cuando los datos
constan solo de rangos.
.
 Supuestos:
 Las observaciones deben expresarse en al menos escala
de intervalo.
 Las muestras son aleatorias e independientes.
 Las k poblaciones tienen la misma forma y dispersión

13
 Procedimiento:
 Las n1, n2,…nk observaciones de los k grupos se combinan
en una sola serie de tamaño n y se disponen en orden de
magnitud desde la más pequeña hasta la más grande.
Cuando dos o más observaciones tienen el mismo valor, a
cada una de ellas se le asigna la media de los rangos con
los cuales está relacionado.
 Los rangos asignados a las observaciones en cada uno de
los k grupos se suman por separado para dar k sumas de
rangos.
 Aplicar la prueba estadística.

 Hipótesis:
H0: Me1=Me2=…=Mek
H1: Al menos una Mei es diferente a las demás i=1,2,…,k
 Prueba Estadística:
1  k ni 2 n  n  1 
ni
Ri   R  X ij 
2

S 
2
 R  X ij   
n  1  i 1 j 1 4 
j 1 

1  k Ri2 n  n  1 
2

T  2    ~  1 ,k 1
2

S  i 1 ni 4 

donde: ni es el tamaño de cada grupo y k es el número de


grupos.

14
Si se rechaza H0 se debe realizar la prueba de
comparación.
 Hipótesis de Comparación:
H0: Mei=Mej  i  j i,j=1,2,..k
H1: MeiMej
 Criterio de Decisión Estadística:
Si Ri  R j  t    S  n  1  T   1  1  se rechaza H 0
 2 
nk  ni n j  
ni nj 1 , n  k 
 2   
 R:
En R se usa la función kruskal.test(respuesta, tratamiento),
que se puede complementar con la función kruskalmc del
paquete pgirmess.
En el paquete agricolae se encuentra la función kruskal que
permite realizar las pruebas de comparación.
kruskal(respuesta, tratamiento)

 Ejemplo
Quince alumnos en un curso técnico son aleatoriamente
asignados a tres tipos diferentes de métodos de
instrucción, todos los cuales persiguen el desarrollo de
un nivel específico de habilidad en diseño asistido por
computadora. Las calificaciones de la prueba de
aprovechamiento al término de la unidad de instrucción
se reportan en la siguiente tabla:
Método A1 Método A2 Método A3
86 90 82
79 86 68
81 88 73
70 82 71
84 89 81
Verifique a un =0.05 si algún método es mejor a los
demás.

15
 Ejemplo
H0: Me1=Me2=Me3
H1: Al menos una Mei es diferente a las demás i=1,2,3

  =0.05
 Pvalor = 0.018 <  se rechaza H0

Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para rechazar H0.
Por lo tanto, se puede afirmar que algún método es mejor a
los demás.

H0: Mei=Mej  i  j i,j=1,2,3


H1: MeiMej

Cuadro resumen
Groups, Treatments and mean of the ranks
a 2 12.4
b 1 7
b 3 4.6

Se puede afirmar que el Método A2 es el mejor.

16
 Aspectos Generales:
Prueba la hipótesis de que las muestras se encuentran
ordenados en una secuencia específica a priori.
A fin de asegurar el uso adecuado de la prueba, el
investigador debe ser capaz de especificar el orden de los
grupos. El orden debe ser especificado antes de recabar los
datos.

 Supuestos:
 Las observaciones deben expresarse en al menos escala
de intervalo.
 Las muestras son aleatorias e independientes.
 Las muestras provienen de una misma población.

 Procedimiento:
 Para cada una las k muestras (o tratamientos) de manera
independiente ordenar las observaciones de menor a mayor.
 Formar todos los diferentes pares de muestras.
 En cada par fijar una muestra, para cada una de las
observaciones de esta muestra contabilizar cuantas
observaciones de la otra muestra son superiores (o
inferiores). Repetir este proceso para cada uno de los pares.
 Calcular la suma de las contabilizaciones de cada par.
 Determinar el estadístico J que es la sumatoria de los
recuentos determinados en el paso anterior.
 R:
En R se utiliza la función jonckheere.test del paquete
clinfun
jonckheere.test(respuesta, grupo, alternativa)

17
 Hipótesis:
Unilateral izquierda Bilateral Unilateral derecha
H0: Me1 Me2 =…= Mek H0: Me1 Me2 =…= Mek H0: Me1 Me2 =…= Mek
H1: Al menos un Mei es
H1: Me1 <Me2 < …< Mek H1: Me1 Me2  …> MeK
diferente i=1,2,..,k

 Prueba Estadística:
Muestras
n pequeñas
U ij   #  X hi , j 
i

#(Xi j,j ) es el número de veces que el dato Xhi precede


h 1 al dato de las muestras j donde i<j.
ni k 1 k
.
J  U ij    U ij
i< j i 1 j i 1

Muestras Grandes
k k
n 2   n 2j n 2 (2n  3)   n 2j (2n j  3) J  J
j 1 j 1 Z ~N(0,1)
J   J2  J
4 72

 Ejemplo
Se desea realizar un experimento para verificar si los juicios
de salinidad se incrementarían conforme se disminuye la
proporción de NaCl (cloruro de sodio) en los ensayos de
prueba. Los datos se presentan a continuación:

Realice la prueba respectiva use =0.05.

18
 Ejemplo
 H 0 : Me1  Me2  Me3  Me4

 H1 : Me1 < Me2 < Me3 < Me4
 =0.05
 Pvalor = 0.0003 <  se rechaza H0

Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para rechazar H0.
Por lo tanto, se puede afirmar que los juicios de salinidad
se incrementarían conforme se disminuye la proporción de
NaCl (cloruro de sodio) en los ensayos de prueba.

19
 Supuestos: muestras elegidas al azar e
independientes.
 n  k   ni  Z i  Z  
k 2

 Estadístico de prueba:
W i 1
~ F1 ,k 1,n k 
 k  1   Zij  Z i 
k ni 2

Donde Zij puede ser: Y i


i 1 j 1

Zij  Yij  Y i donde puede ser la media, mediana o


media podada de la i-ésima muestra.
Z  : Es la media global de Zij.
Z i : Es la media de la i-ésima muestra.
 Pvalor=P(Fk-1,n-k>Fcal)
 En R se puede usar el paquete lawstat la función es
levene.test(datos,grupos) o el paquete car con la función es leveneTest,
LeveneTest del paquete DescTools.

 Supuestos: muestras al azar e independientes.


 Estadístico de prueba:
 n a 
k 2
i i a
2  i 1
~ 21 ,k 1
a 
n
 n  1
2
a
Donde: j 1
n, j

1  an, j

i n an , j
an,i   1    ai  a
 2 2  n  1  jGi ni j 1 n
 Pvalor=P(2(k-1)>2cal)

 En R se puede obtener con la función fligner.test(datos,


grupos) que se encuentra dentro del paquete stats.

20
 Supuestos: muestras al azar e independientes
 Estadístico de prueba:
max Si2 
H t

S
i 1
i
2

Esta prueba requiere el uso de la tabla de Cochran,


cuando los ni de las muestras son iguales
(r=n1=n2=…=nt) se busca con n, k y 1-. Cuando el
número de observaciones en cada tratamiento no son
iguales pero relativamente cercanos se puede tomar el
mayor ni…

Una forma aproximada para calcular el pvalor haciendo


uso de la distribución F se puede obtener mediante la
siguiente expresión:
k
  

  k  1  
pvalor  1   P  Fni 1, k 1 ni 1   
  1
  
1 

   H cal  

 En R se puede obtener con la función cochran.test


(coldedatos~grupos, datos) que se encuentra dentro del
paquete outliers.

21
 Otras pruebas Estadísticas:
 Brown Forsythe (1974)
 O´Brien (1981)
 Mudholkar-McDermott-Aumont (1993)
 Neuhauser-Hothorn (2000)

La primera se encuentra en el paquete HH y se


debe utilizar la función hov.
Las dos últimas pruebas de hipótesis se
encuentran en el paquete lawstat.

22

También podría gustarte