Mes 11

Escuela de Posgrado
Maestría en Estadística Aplicada
Métodos Estadísticos y Simulación
Mg Sc Jaime Carlos Porras Cerrón

1
Sir Ronald Fisher

(1890-1962)
1
Unidad IV: Pruebas No Paramétricas (Parte I)
1. Introducción
2. Uso de las pruebas no paramétricas.
3. Pruebas para datos provenientes de una
muestra
a. Prueba Binomial
b. Prueba de Proporciones o Frecuencias
c. Prueba de Rachas
d. Prueba de Kolmogorov-Smirnov
e. Prueba de Simetría
f. Prueba de Signos
g. Prueba de Wilcoxon
Las técnicas de inferencia que requieren el

cumplimiento de ciertas suposiciones acerca de la
distribución teórica F(X) de las variables que se
desean analizar se denominan pruebas
paramétricas.
Mientras que las técnicas de inferencia que no
hacen suposiciones acerca de la distribución teórica
de las variables que se analizarán se denominan
pruebas no paramétricas o de libre distribución.
2
❑ Cuando no se cumplen los supuestos que las
pruebas paramétricas exigen.
❑ Cuando se trabajan con variables medidas en
escala ordinal o nominal, por lo general no
existen pruebas paramétricas para analizar
variables medidas en esas escalas.
❑ Cuando se trabaja con muestras pequeñas y por
lo tanto no se puede hacer uso del Teorema
Central del Límite.
Cuando se analiza una muestra se puede responder

preguntas como:
¿El parámetro de locación difiere significativamente
de un valor hipotético de interés?
¿Hay una diferencia significativa entre las frecuencias
observadas y las frecuencias esperadas?
¿Es razonable creer que esta muestra fue obtenida
de una población que presenta cierta distribución
teórica?
¿Es razonable creer que esta muestra fue tomada al
azar?
3
◼ Aspectos Generales:
Esta prueba se emplea cuando los resultados de n
experimentos se expresan en forma dicotómica.
Cada resultado pertenece a una de las clases “1” o “2”
pero no a ambos. El número de observaciones de la
clase 1 es O1 y el número de observaciones de la clase 2
es O2 = n-O1.
◼ Supuestos:
✓ La muestra de tamaño n es seleccionada al azar.
✓ Las n pruebas son mutuamente independientes.
✓ Cada prueba tiene probabilidad  de que resulte de la
clase 1, siendo  el mismo para las n pruebas.
◼ Hipótesis:
Unilateral izquierda Bilateral Unilateral derecha
H0:  ≥ 0 H0:  = 0 H0:  ≤ 0
H1:  < 0 H1:  ≠ 0 H1:  > 0
◼ Prueba Estadística:
Dependiendo de la hipótesis alterna, el pvalor se puede calcular
utilizando B(n, 0).
pvalor = P(X  O1) Una cola izquierda
pvalor = P(X  O1) Una cola derecha
4
Para muestras grandes (n0(1-0)9) se puede hacer uso del
estadístico basado en la distribución normal.
Z=
( x  0.5) − n 0
n 0 (1 −  0 )
Donde: x+0.5 si x<n0 y x-0.5 si x>n0
◼ R:
En R se utiliza la función binom.test.
binom.test(O1,n, 0, alternativa)
◼ Ejemplo
A una muestra de 26 degustadores igualmente entrenados se
les dió a probar un nuevo sabor de refresco en tres vasos, los
cuales les fueron proporcionados de manera aleatoria. Dos
de los vasos tenían igual cantidad del saborizante
(ingrediente base del refresco) y un vaso tenia una mayor
cantidad de saborizante. A los degustadores se les pidió que
identifiquen el vaso que contenía la mayor cantidad de
saborizante. Dieciocho degustadores identificaron
correctamente que vaso contenía mayor cantidad de
saborizante.
Pruebe si más de 1/3 de los degustadores realizan la
identificación correcta.
De sus conclusiones a un nivel de significación de 0.05.
10
5
◼ Ejemplo
 1  1
 H 0 :   3
Y ~ B  26, 
 3

 H1 :   1
 3 26− y
 26   1   2 
26 y
^
 = P (Y  18) =   y   3 
y =18 
 
 3
= 0.000197

Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para rechazar H0.
Por lo tanto, se puede afirmar que la probabilidad de que
los degustadores realicen la prueba correcta es mayor a
1/3.
1-pbinom(17,26,1/3)
binom.test(18,26,1/3,alternative="greater")
11
Esta prueba se aplica cuando se desea verificar si al
menos una de las frecuencias observadas (oi)
perteneciente a la i-ésima categoría (mutuamente
excluyentes) difiere significativamente de su respectiva
frecuencia teórica o frecuencia esperada (ei) .
Cada frecuencia esperada (ei) se obtiene multiplicando el
tamaño de la muestra n por la probabilidad teórica
correspondiente (i)
.
◼ Supuestos:
✓ La muestra de tamaño n es seleccionada al azar.
✓ La variable en estudio presenta k categorías o puede
ser categorizada en k categorías (k>2).
12
6
◼ Hipótesis:
H0: 1 = 01 , 2 = 02 , 3 = 03 = ….= k = 0k
H1: Al menos un i es diferente a los especificados i=1,..,k
𝑘
(𝑜𝑖 − 𝑒𝑖 )2 2
𝜒𝑐2 = ෍ ~𝜒(1−𝛼,𝑘−1)
𝑒𝑖
𝑖=1
◼ R:
En R se utiliza la función chisq.test.
chisq.test(x,p)
x: Vector de frecuencias observadas
p: Vector de probabilidades teóricas
13
◼ Ejemplo
En una fábrica se cuenta con tres máquinas que producen el
mismo producto. El jefe de producción desea determinar si
las máquinas están produciendo en diferentes proporciones.
Para despejar sus dudas selecciona al azar 135 artículos de
la última semana de producción y los clasifica según la
máquina que lo ha producido. A continuación se presenta la
tabla de frecuencia de las cantidades producidas por cada
máquina:
Máquina A Máquina B Máquina C
43 53 39
Use nivel de significación 5% para probar si la cantidad

producida no es la misma en las 3 máquinas.
14
7
◼ Ejemplo
H0: 1 = 1/3, 2 = 1/3, 3 = 1/3
H1: Al menos un i es diferente a los especificados i=1,2,3
◼  = 0.05
3
𝑜𝑖 − 𝑒𝑖 2
𝜒𝑐2 = ෍ = 2.3111
𝑒𝑖
𝑖=1
pvalor=0.3149 > no se rechaza H0

Conclusión
A un nivel de significación del 5% no se puede afirmar que
las 3 máquinas no producen en igual proporción.
x <-c(43,53, 39)
prob <- c(1/3,1/3,1/3)
chisq.test(x,p=prob)
15
◼ Observaciones:
Esta prueba no da buenos resultados cuando:
✓ Mas del 20% de las frecuencias esperadas son
menores a 5.
✓ Cuando la muestra es pequeña (por lo general menor
a 50).
Una solución a estos problemas es utilizar la
corrección de Yates.
( o −e − 0.5)
2
k
 = ~  (12 − ,k −1)
2 i i
c
i =1 ei
El procedimiento exacto se encuentra utilizando la
función multinomial.test del paquete RVAideMemoire.
16
8
La prueba de Rachas o corridas se usa para probar la
aleatoriedad de una serie de observaciones cuando cada
observación puede ser asignada a una de dos categorías.
Por rachas (r) se entiende a una sucesión de símbolos
idénticos que pueden estar separados o no por otro tipo de
símbolos.
El número total de rachas indica si una muestra es o no
aleatoria. Si se da un número pequeño o grande de rachas
puede deberse a una falta de independencia o a una
tendencia temporal.
◼ Supuestos:
✓ Las observaciones deben ser susceptibles de
transformación dicotómica.
17
◼ Hipótesis:
H0: La secuencia de observaciones es aleatoria
H1: La secuencia de observaciones no es aleatoria
El estadístico de prueba es el número de rachas r.
Para muestras pequeñas: Se puede hacer uso de tablas
que contienen los valores críticos de la distribución
muestral de las rachas (r).
18
9
Para muestras grandes se puede hacer uso de la
aproximación a la distribución Normal.
r − r
Zc =
r 2n1 n2 (2n1 n2 − n1 − n2 )
2n n
r = 1 2 + 1 r =
n1 + n2 (n1 + n2 ) 2 (n1 + n2 − 1)
En R se puede hacer uso de la función runs.test del

paquete lawstat. Esta función tiene el inconveniente que
no permite evaluar las rachas con respecto a un valor
referencial. Sin embargo, la función runs.test del paquete
tseries si.
runs.test(vector)
runs.test(as.factor(datos>valor de referencia))
19
◼ Ejemplo
En un laboratorio de investigación se prueba un
antiinflamatorio nuevo. Los resultados son aceptables si al
segundo día de aplicado al paciente se observa una
reducción del 90% en la inflamación; se le asigna (+) a ese
caso. Los datos de 24 pacientes analizados fue la siguiente:
X: % de reducción de la inflamación.
Paciente 1 2 3 4 5 6 7 8 9 10 11 12
X 92 82 96 98 92 96 85 93 94 95 75 72
Paciente 13 14 15 16 17 18 19 20 21 22 23 24
X 62 77 96 67 62 93 94 99 76 74 84 82
Pruebe si las observaciones no siguen una secuencia

aleatoria a un nivel de significación de 0.05.
20
10
◼ Hipótesis:
H0: La secuencia de observaciones es aleatoria
H1: La secuencia de observaciones no es aleatoria
Paciente 1 2 3 4 5 6 7 8 9 10 11 12
Signo + - + + + + - + + + - -
1 2 4
◼ Pvalor=0.210 Racha 3 5 6
Paciente 13 14 15 16 17 18 19 20 21
Signo - - + - - + + + -
Racha 6 7 8 9 10
Conclusión
A un nivel de significación del 5% no se puede afirmar que las
observaciones no siguen una secuencia aleatoria.
En R: library(tseries)
runs.test(as.factor(datos>90))
21
Esta prueba es utilizada para determinar que tan bien se
ajusta la distribución de los datos de la muestra a alguna
distribución teórica F(X).
La prueba consiste en hacer una comparación entre alguna
función de distribución acumulada y teórica, FT(x) y la función
de distribución acumulada de una muestra, FS(x).
Si existe una estrecha concordancia entre las distribuciones
acumuladas teórica y de la muestra, se apoya la hipótesis de
que la muestra se extrajo de la población con la función de
distribución acumulada que se especifica
◼ Supuestos:
✓ La muestra de tamaño n es aleatoria.
✓ Las observaciones se encuentran medidas en una escala
al menos intervalo.
22
11
◼ Hipótesis:
H0: F(x) = FT(x), (Las observaciones siguen una distribución
teórica específica)
H1: F(x)  FT(x), (Las observaciones no siguen una
distribución teórica específica)
D = sup FS ( x) − FT ( x)
x
La cual se lee, “D es igual al supremo sobre todos los x, del

valor absoluto de la diferencia FS(x) menos FT(x).
23
◼ R:
En R se utiliza la función ks.test
ks.test (x, dist, para)
X: Vector de datos
dist: Distribución teórica (ejemplo “pnorm”)
para: Parámetros de la distribución teórica sin son
conocidos.
En el paquete goftest existen otras dos pruebas de

bondad de ajuste: Anderson-Darling y Cramer-Von Mises
su sintaxis es parecida a la prueba de Kolmogorv-
Smirnov.
24
12
La simetría de la distribución de donde provienen los datos es
un requisito que exigen varias pruebas no paramétricas.
Existen diferentes pruebas de simetría entre las que se tienen:
Cabilio-Masaro (1996), Mira (1999) y Miao Gel-Gastwirth
(2006).
◼ Supuestos:
Bilateral Unilateral
Caso A Caso B Caso C
𝐻0 : 𝐴𝑠 = 0 𝐻0 : 𝐴𝑠 = 0 𝐻0 : 𝐴𝑠 =0
𝐻1 : 𝐴𝑠 ≠ 0 𝐻1 : 𝐴𝑠 > 0 𝐻1 : 𝐴𝑠 < 0
25
◼ Estadístico de prueba de MGG:
(𝑋 − 𝑀𝑒) ∗ 𝑛 ∗ 0.5708
𝑇= ,
𝐽𝑛
𝑛
𝑐 𝜋
𝐽𝑛 = ෍ |𝑋𝑛 − 𝑀𝑒|, 𝑐=
𝑛 2
𝑖=1
En R: symmetric.test del paquete lawstat. Se debe

tener cuidado al ejecutar estas pruebas porque tienen
implementado por defecto el concepto de Bootstrap.
26
13
La Prueba de Signos es un caso particular de la prueba
Binomial cuando =0.5.
Por esta razón, esta prueba puede utilizarse para probar una
hipótesis nula referente al valor de la mediana de la población
(Me).
En consecuencia, es el equivalente no paramétrico a la
prueba de hipótesis referente al valor de la media poblacional.
◼ Supuestos:
✓ Las observaciones deben expresarse en al menos escala
intervalo.
27
◼ Procedimiento:
✓ Se aplica un signo más (+) a cada valor muestral observado
mayor que el valor hipotético de la mediana y un signo
menos (-) a cada valor menor que el valor hipotético de la
mediana. Si un valor muestral es exactamente igual al de la
mediana hipotética, no se aplica ningún signo, con lo que el
tamaño de muestra efectivo se reduce.
✓ Determinar el tamaño de la muestra (n) definitivo excluyendo
aquellos valores que son similares a la mediana.
Hallar la probabilidad de ocurrencia (p-value) de la hipótesis
nula formulada con ayuda de la función de distribución
Binomial con =0.5 y compararlo con el nivel de significación
() adoptado por el investigador para el experimento.
28
14
◼ Hipótesis:
A: Unilateral izquierda B: Bilateral C: Unilateral derecha
H0: Me ≥ Me0 H0: Me = Me0 H0: Me ≤ Me0
H1: Me < Me0 H1: Me ≠ Me0 H1: Me > Me0
utilizando B(n, 0.5).
n
Caso A:
c
p − valor = P  B ( n,0.5)  c  =    2 − n
i =0 i 
Caso B: Se toma el menor número de signos c´ ya sea (+) o (-)

c´
n
p − valor = 2 P( X  c´) = 2  2 −n
x =0  x 
Caso C: n
n
p − valor = P  B ( n,0.5)  c  =    2 − n
i =c  i 
29
Para muestras grandes se puede hacer uso del estadístico
basado en la distribución normal.
Z=
( x  0.5) − 0.5n
0.5 n
Donde: x+0.5 si x<n0 y x-0.5 si x>n0
◼ R:
En R se utiliza la función SIGN.test del paquete BSDA
SIGN.test(x, valor hipotético, alternativa)
30
15
◼ Ejemplo
Se afirma que el número de unidades ensambladas con un
nuevo sistema rediseñado será mayor que el número de
unidades ensambladas con el antiguo sistema, cuya mediana
poblacional es de 80 unidades por turno laboral.
Pruebe si dicha afirmación es cierta al nivel de significación
del 5%.
Los datos muestrales del número de unidades ensambladas
con el nuevo sistema se reportan en la siguiente tabla:
75 85 92 80 94 90 91 76 88 82 96 83
31
◼ Ejemplo
 H 0 : Me  80 Y ~ B (11,0.5)

 H1 : Me  80
 = 0.05
11 1 
11
n 11
=     = 0.0327
n
p − valor = P  B ( n,0.5)  c  =    2 − n
i =c  i  i =9  i  2 
Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para rechazar H0.
Por lo tanto, se puede afirmar que el número mediano de
unidades ensambladas es superior a 80.
SIGN.test(x,md=80,alternative="greater")
32
16
La Prueba de Wilcoxon al igual que la Prueba de Signos,
puede usarse para probar una hipótesis nula referente al valor
de la mediana de la población.
Pero dado que la prueba de Wilcoxon considera la magnitud
de la diferencia entre el valor muestral y el valor hipotético de
la mediana, es una prueba más sensible que la Prueba de
Signos.
◼ Supuestos:
✓ Las observaciones deben expresarse en al menos escala
de intervalos.
✓ La muestra es aleatoria.
✓ Los datos provienen de una distribución simétrica.
33
◼ Procedimiento:
✓ Determinar la diferencia entre cada valor observado y el valor
hipotético de la mediana, diferencia que con el signo
aritmético que le corresponda, se designa como
d = (X - Med0). Si alguna diferencia es igual a cero, la
observación asociada se excluye del análisis y el tamaño de
muestra efectivo se reduce.
✓ Se calcula los rangos de las diferencias sin tomar en cuenta
el signo de las mismas (en valor absoluto). En caso de haber
empate se asigna un rango promedio a todas las
diferencias empatadas.
✓ Se obtiene la suma de los rangos en forma separada para
las diferencias positivas y para las negativas; la suma de los
rangos positivos (w) será utilizado para determinar el valor de
p-value y compararlo con el nivel de significación .
34
17
◼ Hipótesis:
Unilateral izquierda Bilateral Unilateral derecha
H0: Me ≥ Me0 H0: Me = Me0 H0: Me ≤ Me0
H1: Me < Me0 H1: Me ≠ Me0 H1: Me > Me0
dela siguiente manera:
35
✓ Cuando la hipótesis alterna es "mayor que" y la suma de los rangos

correspondientes a las diferencias positivas es mayor que el de las
diferencias negativas, entonces el “p-value” se calcula por
P1=P(W≥Wc),
Cuando la suma de los rangos correspondientes a las diferencias
positivas es menor que el de las diferencias negativas, entonces el “p-
value” se calcula por P2=P(W≤Wc).
✓ Si la hipótesis alterna es "menor que", y la suma de los rangos
diferencias negativas, entonces “p-value”=P2. En caso contrario
“pvalue”=P1
✓ Cuando la hipótesis alterna es de dos lados y la suma de los rangos

diferencias negativas, entonces el “p-value”=2P2, si la suma de los
rangos correspondientes a las diferencias positivas es la menor
entonces “pvalue”=2P1 y si las sumas de los rangos correspondientes
a las diferencias positivas y negativas son iguales entonces “p-
value”=1.0.
36
18
Para muestras grandes se puede hacer uso del estadístico
basado en la distribución normal.
w+ − w n(n + 1) w =
n(n + 1)(2n + 1)
Zc = w =
w 4 24
Si hubiera empates se usa la siguiente desviación estándar:

n(n + 1)(2n + 1) g ( ti − ti )
3
w = −
24 i =1 2
Donde: g es el número de grupos empatados y ti es el tamaño
del i-ésimo grupo empatado.
◼ R:
En R se utiliza la función wilcox.test o wilcox.exact del
paquete exactRankTests
wilcox.test(x, valor hipotético, alternativa)
37
◼ Ejemplo
A una muestra de 19 alumnos se les evaluó su aprendizaje de
un nuevo sistema computacional obteniendo los siguientes
puntajes:
76 96 92 80 84 80 91 76 88 92
86 83 88 84 99 87 68 87 78
Se considera que el programa de estudios ha sido

provechoso si el puntaje mediano es superior a los 90 puntos.
Pruebe si el programa ha sido provechoso a un nivel de
significación de 0.05.
38
19
◼ Ejemplo
 H 0 : Me  90

 H1 : Me  90
 = 0.05
pvalor= 0.995 > se rechaza H0
Conclusión
A un nivel de significación de 0.05 existe suficiente
evidencia estadística para no rechazar la hipótesis nula.
Por lo tanto no se puede afirmar que el programa de
estudios haya sido provechoso
wilcox.test(x, mu=90,alternative="greater")
39
20

Mes 11

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Mes 11

Cargado por

Copyright:

Formatos disponibles

Escuela de Posgrado

Maestría en Estadística Aplicada

Métodos Estadísticos y Simulación

Mg Sc Jaime Carlos Porras Cerrón

Sir Ronald Fisher

Las técnicas de inferencia que requieren el

Cuando se analiza una muestra se puede responder

pvalor = P(X  O1) Una cola derecha

Donde: x+0.5 si x<n0 y x-0.5 si x>n0

Use nivel de significación 5% para probar si la cantidad

pvalor=0.3149 > no se rechaza H0

En R se puede hacer uso de la función runs.test del

Pruebe si las observaciones no siguen una secuencia

La cual se lee, “D es igual al supremo sobre todos los x, del

En el paquete goftest existen otras dos pruebas de

◼ Estadístico de prueba de MGG:

En R: symmetric.test del paquete lawstat. Se debe

Caso B: Se toma el menor número de signos c´ ya sea (+) o (-)

Donde: x+0.5 si x<n0 y x-0.5 si x>n0

✓ Cuando la hipótesis alterna es "mayor que" y la suma de los rangos

✓ Cuando la hipótesis alterna es de dos lados y la suma de los rangos

Si hubiera empates se usa la siguiente desviación estándar:

Se considera que el programa de estudios ha sido

También podría gustarte