Está en la página 1de 20

Escuela de Posgrado

Maestría en Estadística Aplicada

Métodos Estadísticos y Simulación

Mg Sc Jaime Carlos Porras Cerrón


1

Sir Ronald Fisher


(1890-1962)

1
Unidad IV: Pruebas No Paramétricas (Parte I)

1. Introducción
2. Uso de las pruebas no paramétricas.
3. Pruebas para datos provenientes de una
muestra
a. Prueba Binomial
b. Prueba de Proporciones o Frecuencias
c. Prueba de Rachas
d. Prueba de Kolmogorov-Smirnov
e. Prueba de Simetría
f. Prueba de Signos
g. Prueba de Wilcoxon

Las técnicas de inferencia que requieren el


cumplimiento de ciertas suposiciones acerca de la
distribución teórica F(X) de las variables que se
desean analizar se denominan pruebas
paramétricas.
Mientras que las técnicas de inferencia que no
hacen suposiciones acerca de la distribución teórica
de las variables que se analizarán se denominan
pruebas no paramétricas o de libre distribución.

2
❑ Cuando no se cumplen los supuestos que las
pruebas paramétricas exigen.
❑ Cuando se trabajan con variables medidas en
escala ordinal o nominal, por lo general no
existen pruebas paramétricas para analizar
variables medidas en esas escalas.
❑ Cuando se trabaja con muestras pequeñas y por
lo tanto no se puede hacer uso del Teorema
Central del Límite.

Cuando se analiza una muestra se puede responder


preguntas como:
¿El parámetro de locación difiere significativamente
de un valor hipotético de interés?
¿Hay una diferencia significativa entre las frecuencias
observadas y las frecuencias esperadas?
¿Es razonable creer que esta muestra fue obtenida
de una población que presenta cierta distribución
teórica?
¿Es razonable creer que esta muestra fue tomada al
azar?

3
◼ Aspectos Generales:
Esta prueba se emplea cuando los resultados de n
experimentos se expresan en forma dicotómica.
Cada resultado pertenece a una de las clases “1” o “2”
pero no a ambos. El número de observaciones de la
clase 1 es O1 y el número de observaciones de la clase 2
es O2 = n-O1.
◼ Supuestos:
✓ La muestra de tamaño n es seleccionada al azar.
✓ Las n pruebas son mutuamente independientes.
✓ Cada prueba tiene probabilidad  de que resulte de la
clase 1, siendo  el mismo para las n pruebas.

◼ Hipótesis:
Unilateral izquierda Bilateral Unilateral derecha
H0:  ≥ 0 H0:  = 0 H0:  ≤ 0
H1:  < 0 H1:  ≠ 0 H1:  > 0
◼ Prueba Estadística:
Dependiendo de la hipótesis alterna, el pvalor se puede calcular
utilizando B(n, 0).
pvalor = P(X  O1) Una cola izquierda

pvalor = P(X  O1) Una cola derecha

4
◼ Prueba Estadística:
Para muestras grandes (n0(1-0)9) se puede hacer uso del
estadístico basado en la distribución normal.

Z=
( x  0.5) − n 0
n 0 (1 −  0 )

Donde: x+0.5 si x<n0 y x-0.5 si x>n0

◼ R:
En R se utiliza la función binom.test.
binom.test(O1,n, 0, alternativa)

◼ Ejemplo
A una muestra de 26 degustadores igualmente entrenados se
les dió a probar un nuevo sabor de refresco en tres vasos, los
cuales les fueron proporcionados de manera aleatoria. Dos
de los vasos tenían igual cantidad del saborizante
(ingrediente base del refresco) y un vaso tenia una mayor
cantidad de saborizante. A los degustadores se les pidió que
identifiquen el vaso que contenía la mayor cantidad de
saborizante. Dieciocho degustadores identificaron
correctamente que vaso contenía mayor cantidad de
saborizante.
Pruebe si más de 1/3 de los degustadores realizan la
identificación correcta.
De sus conclusiones a un nivel de significación de 0.05.

10

5
◼ Ejemplo
 1  1
 H 0 :   3
Y ~ B  26, 
 3

 H1 :   1
 3 26− y
 26   1   2 
26 y
^
 = P (Y  18) =   y   3 
y =18 
 
 3
= 0.000197

Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para rechazar H0.
Por lo tanto, se puede afirmar que la probabilidad de que
los degustadores realicen la prueba correcta es mayor a
1/3.
1-pbinom(17,26,1/3)
binom.test(18,26,1/3,alternative="greater")

11

◼ Aspectos Generales:
Esta prueba se aplica cuando se desea verificar si al
menos una de las frecuencias observadas (oi)
perteneciente a la i-ésima categoría (mutuamente
excluyentes) difiere significativamente de su respectiva
frecuencia teórica o frecuencia esperada (ei) .
Cada frecuencia esperada (ei) se obtiene multiplicando el
tamaño de la muestra n por la probabilidad teórica
correspondiente (i)
.
◼ Supuestos:
✓ La muestra de tamaño n es seleccionada al azar.
✓ La variable en estudio presenta k categorías o puede
ser categorizada en k categorías (k>2).

12

6
◼ Hipótesis:
H0: 1 = 01 , 2 = 02 , 3 = 03 = ….= k = 0k
H1: Al menos un i es diferente a los especificados i=1,..,k

◼ Prueba Estadística:
𝑘
(𝑜𝑖 − 𝑒𝑖 )2 2
𝜒𝑐2 = ෍ ~𝜒(1−𝛼,𝑘−1)
𝑒𝑖
𝑖=1

◼ R:
En R se utiliza la función chisq.test.
chisq.test(x,p)
x: Vector de frecuencias observadas
p: Vector de probabilidades teóricas

13

◼ Ejemplo
En una fábrica se cuenta con tres máquinas que producen el
mismo producto. El jefe de producción desea determinar si
las máquinas están produciendo en diferentes proporciones.
Para despejar sus dudas selecciona al azar 135 artículos de
la última semana de producción y los clasifica según la
máquina que lo ha producido. A continuación se presenta la
tabla de frecuencia de las cantidades producidas por cada
máquina:
Máquina A Máquina B Máquina C
43 53 39

Use nivel de significación 5% para probar si la cantidad


producida no es la misma en las 3 máquinas.

14

7
◼ Ejemplo
H0: 1 = 1/3, 2 = 1/3, 3 = 1/3
H1: Al menos un i es diferente a los especificados i=1,2,3
◼  = 0.05
3
𝑜𝑖 − 𝑒𝑖 2
𝜒𝑐2 = ෍ = 2.3111
𝑒𝑖
𝑖=1

pvalor=0.3149 > no se rechaza H0


Conclusión
A un nivel de significación del 5% no se puede afirmar que
las 3 máquinas no producen en igual proporción.
x <-c(43,53, 39)
prob <- c(1/3,1/3,1/3)
chisq.test(x,p=prob)
15

◼ Observaciones:
Esta prueba no da buenos resultados cuando:
✓ Mas del 20% de las frecuencias esperadas son
menores a 5.
✓ Cuando la muestra es pequeña (por lo general menor
a 50).
Una solución a estos problemas es utilizar la
corrección de Yates.
( o −e − 0.5)
2
k
 = ~  (12 − ,k −1)
2 i i
c
i =1 ei
El procedimiento exacto se encuentra utilizando la
función multinomial.test del paquete RVAideMemoire.

16

8
◼ Aspectos Generales:
La prueba de Rachas o corridas se usa para probar la
aleatoriedad de una serie de observaciones cuando cada
observación puede ser asignada a una de dos categorías.
Por rachas (r) se entiende a una sucesión de símbolos
idénticos que pueden estar separados o no por otro tipo de
símbolos.
El número total de rachas indica si una muestra es o no
aleatoria. Si se da un número pequeño o grande de rachas
puede deberse a una falta de independencia o a una
tendencia temporal.
◼ Supuestos:
✓ Las observaciones deben ser susceptibles de
transformación dicotómica.

17

◼ Hipótesis:
H0: La secuencia de observaciones es aleatoria
H1: La secuencia de observaciones no es aleatoria

◼ Prueba Estadística:
El estadístico de prueba es el número de rachas r.
Para muestras pequeñas: Se puede hacer uso de tablas
que contienen los valores críticos de la distribución
muestral de las rachas (r).

18

9
◼ Prueba Estadística:
Para muestras grandes se puede hacer uso de la
aproximación a la distribución Normal.
r − r
Zc =
r 2n1 n2 (2n1 n2 − n1 − n2 )
2n n
r = 1 2 + 1 r =
n1 + n2 (n1 + n2 ) 2 (n1 + n2 − 1)

En R se puede hacer uso de la función runs.test del


paquete lawstat. Esta función tiene el inconveniente que
no permite evaluar las rachas con respecto a un valor
referencial. Sin embargo, la función runs.test del paquete
tseries si.
runs.test(vector)
runs.test(as.factor(datos>valor de referencia))
19

◼ Ejemplo
En un laboratorio de investigación se prueba un
antiinflamatorio nuevo. Los resultados son aceptables si al
segundo día de aplicado al paciente se observa una
reducción del 90% en la inflamación; se le asigna (+) a ese
caso. Los datos de 24 pacientes analizados fue la siguiente:
X: % de reducción de la inflamación.
Paciente 1 2 3 4 5 6 7 8 9 10 11 12
X 92 82 96 98 92 96 85 93 94 95 75 72

Paciente 13 14 15 16 17 18 19 20 21 22 23 24
X 62 77 96 67 62 93 94 99 76 74 84 82

Pruebe si las observaciones no siguen una secuencia


aleatoria a un nivel de significación de 0.05.

20

10
◼ Hipótesis:
H0: La secuencia de observaciones es aleatoria
H1: La secuencia de observaciones no es aleatoria
◼ Prueba Estadística:
Paciente 1 2 3 4 5 6 7 8 9 10 11 12
Signo + - + + + + - + + + - -
1 2 4
◼ Pvalor=0.210 Racha 3 5 6

Paciente 13 14 15 16 17 18 19 20 21
Signo - - + - - + + + -
Racha 6 7 8 9 10
Conclusión
A un nivel de significación del 5% no se puede afirmar que las
observaciones no siguen una secuencia aleatoria.
En R: library(tseries)
runs.test(as.factor(datos>90))
21

◼ Aspectos Generales:
Esta prueba es utilizada para determinar que tan bien se
ajusta la distribución de los datos de la muestra a alguna
distribución teórica F(X).
La prueba consiste en hacer una comparación entre alguna
función de distribución acumulada y teórica, FT(x) y la función
de distribución acumulada de una muestra, FS(x).
Si existe una estrecha concordancia entre las distribuciones
acumuladas teórica y de la muestra, se apoya la hipótesis de
que la muestra se extrajo de la población con la función de
distribución acumulada que se especifica
◼ Supuestos:
✓ La muestra de tamaño n es aleatoria.
✓ Las observaciones se encuentran medidas en una escala
al menos intervalo.
22

11
◼ Hipótesis:
H0: F(x) = FT(x), (Las observaciones siguen una distribución
teórica específica)
H1: F(x)  FT(x), (Las observaciones no siguen una
distribución teórica específica)

◼ Prueba Estadística:

D = sup FS ( x) − FT ( x)
x

La cual se lee, “D es igual al supremo sobre todos los x, del


valor absoluto de la diferencia FS(x) menos FT(x).

23

◼ R:
En R se utiliza la función ks.test
ks.test (x, dist, para)
X: Vector de datos
dist: Distribución teórica (ejemplo “pnorm”)
para: Parámetros de la distribución teórica sin son
conocidos.

En el paquete goftest existen otras dos pruebas de


bondad de ajuste: Anderson-Darling y Cramer-Von Mises
su sintaxis es parecida a la prueba de Kolmogorv-
Smirnov.

24

12
◼ Aspectos Generales:
La simetría de la distribución de donde provienen los datos es
un requisito que exigen varias pruebas no paramétricas.
Existen diferentes pruebas de simetría entre las que se tienen:
Cabilio-Masaro (1996), Mira (1999) y Miao Gel-Gastwirth
(2006).
◼ Supuestos:
✓ La muestra de tamaño n es aleatoria.

Bilateral Unilateral
Caso A Caso B Caso C

𝐻0 : 𝐴𝑠 = 0 𝐻0 : 𝐴𝑠 = 0 𝐻0 : 𝐴𝑠 =0
𝐻1 : 𝐴𝑠 ≠ 0 𝐻1 : 𝐴𝑠 > 0 𝐻1 : 𝐴𝑠 < 0

25

◼ Estadístico de prueba de MGG:

(𝑋 − 𝑀𝑒) ∗ 𝑛 ∗ 0.5708
𝑇= ,
𝐽𝑛
𝑛
𝑐 𝜋
𝐽𝑛 = ෍ |𝑋𝑛 − 𝑀𝑒|, 𝑐=
𝑛 2
𝑖=1

En R: symmetric.test del paquete lawstat. Se debe


tener cuidado al ejecutar estas pruebas porque tienen
implementado por defecto el concepto de Bootstrap.

26

13
◼ Aspectos Generales:
La Prueba de Signos es un caso particular de la prueba
Binomial cuando =0.5.
Por esta razón, esta prueba puede utilizarse para probar una
hipótesis nula referente al valor de la mediana de la población
(Me).
En consecuencia, es el equivalente no paramétrico a la
prueba de hipótesis referente al valor de la media poblacional.
◼ Supuestos:
✓ Las observaciones deben expresarse en al menos escala
intervalo.
✓ La muestra de tamaño n es aleatoria.

27

◼ Procedimiento:
✓ Se aplica un signo más (+) a cada valor muestral observado
mayor que el valor hipotético de la mediana y un signo
menos (-) a cada valor menor que el valor hipotético de la
mediana. Si un valor muestral es exactamente igual al de la
mediana hipotética, no se aplica ningún signo, con lo que el
tamaño de muestra efectivo se reduce.
✓ Determinar el tamaño de la muestra (n) definitivo excluyendo
aquellos valores que son similares a la mediana.
Hallar la probabilidad de ocurrencia (p-value) de la hipótesis
nula formulada con ayuda de la función de distribución
Binomial con =0.5 y compararlo con el nivel de significación
() adoptado por el investigador para el experimento.

28

14
◼ Hipótesis:
A: Unilateral izquierda B: Bilateral C: Unilateral derecha
H0: Me ≥ Me0 H0: Me = Me0 H0: Me ≤ Me0
H1: Me < Me0 H1: Me ≠ Me0 H1: Me > Me0
◼ Prueba Estadística:
Dependiendo de la hipótesis alterna, el pvalor se puede calcular
utilizando B(n, 0.5).
n
Caso A:
c
p − valor = P  B ( n,0.5)  c  =    2 − n
i =0 i 

Caso B: Se toma el menor número de signos c´ ya sea (+) o (-)



n
p − valor = 2 P( X  c´) = 2  2 −n
x =0  x 

Caso C: n
n
p − valor = P  B ( n,0.5)  c  =    2 − n
i =c  i 

29

◼ Prueba Estadística:
Para muestras grandes se puede hacer uso del estadístico
basado en la distribución normal.

Z=
( x  0.5) − 0.5n
0.5 n

Donde: x+0.5 si x<n0 y x-0.5 si x>n0

◼ R:
En R se utiliza la función SIGN.test del paquete BSDA
SIGN.test(x, valor hipotético, alternativa)

30

15
◼ Ejemplo
Se afirma que el número de unidades ensambladas con un
nuevo sistema rediseñado será mayor que el número de
unidades ensambladas con el antiguo sistema, cuya mediana
poblacional es de 80 unidades por turno laboral.
Pruebe si dicha afirmación es cierta al nivel de significación
del 5%.
Los datos muestrales del número de unidades ensambladas
con el nuevo sistema se reportan en la siguiente tabla:

75 85 92 80 94 90 91 76 88 82 96 83

31

◼ Ejemplo
 H 0 : Me  80 Y ~ B (11,0.5)

 H1 : Me  80
 = 0.05
11 1 
11
n 11
=     = 0.0327
n
p − valor = P  B ( n,0.5)  c  =    2 − n
i =c  i  i =9  i  2 

Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para rechazar H0.
Por lo tanto, se puede afirmar que el número mediano de
unidades ensambladas es superior a 80.
SIGN.test(x,md=80,alternative="greater")

32

16
◼ Aspectos Generales:
La Prueba de Wilcoxon al igual que la Prueba de Signos,
puede usarse para probar una hipótesis nula referente al valor
de la mediana de la población.
Pero dado que la prueba de Wilcoxon considera la magnitud
de la diferencia entre el valor muestral y el valor hipotético de
la mediana, es una prueba más sensible que la Prueba de
Signos.
◼ Supuestos:
✓ Las observaciones deben expresarse en al menos escala
de intervalos.
✓ La muestra es aleatoria.
✓ Los datos provienen de una distribución simétrica.

33

◼ Procedimiento:
✓ Determinar la diferencia entre cada valor observado y el valor
hipotético de la mediana, diferencia que con el signo
aritmético que le corresponda, se designa como
d = (X - Med0). Si alguna diferencia es igual a cero, la
observación asociada se excluye del análisis y el tamaño de
muestra efectivo se reduce.
✓ Se calcula los rangos de las diferencias sin tomar en cuenta
el signo de las mismas (en valor absoluto). En caso de haber
empate se asigna un rango promedio a todas las
diferencias empatadas.
✓ Se obtiene la suma de los rangos en forma separada para
las diferencias positivas y para las negativas; la suma de los
rangos positivos (w) será utilizado para determinar el valor de
p-value y compararlo con el nivel de significación .

34

17
◼ Hipótesis:
Unilateral izquierda Bilateral Unilateral derecha
H0: Me ≥ Me0 H0: Me = Me0 H0: Me ≤ Me0
H1: Me < Me0 H1: Me ≠ Me0 H1: Me > Me0
◼ Prueba Estadística:
Dependiendo de la hipótesis alterna, el pvalor se puede calcular
dela siguiente manera:

35

✓ Cuando la hipótesis alterna es "mayor que" y la suma de los rangos


correspondientes a las diferencias positivas es mayor que el de las
diferencias negativas, entonces el “p-value” se calcula por
P1=P(W≥Wc),
Cuando la suma de los rangos correspondientes a las diferencias
positivas es menor que el de las diferencias negativas, entonces el “p-
value” se calcula por P2=P(W≤Wc).
✓ Si la hipótesis alterna es "menor que", y la suma de los rangos
correspondientes a las diferencias positivas es mayor que el de las
diferencias negativas, entonces “p-value”=P2. En caso contrario
“pvalue”=P1

✓ Cuando la hipótesis alterna es de dos lados y la suma de los rangos


correspondientes a las diferencias positivas es mayor que el de las
diferencias negativas, entonces el “p-value”=2P2, si la suma de los
rangos correspondientes a las diferencias positivas es la menor
entonces “pvalue”=2P1 y si las sumas de los rangos correspondientes
a las diferencias positivas y negativas son iguales entonces “p-
value”=1.0.
36

18
◼ Prueba Estadística:
Para muestras grandes se puede hacer uso del estadístico
basado en la distribución normal.
w+ − w n(n + 1) w =
n(n + 1)(2n + 1)
Zc = w =
w 4 24

Si hubiera empates se usa la siguiente desviación estándar:


n(n + 1)(2n + 1) g ( ti − ti )
3

w = −
24 i =1 2
Donde: g es el número de grupos empatados y ti es el tamaño
del i-ésimo grupo empatado.
◼ R:
En R se utiliza la función wilcox.test o wilcox.exact del
paquete exactRankTests
wilcox.test(x, valor hipotético, alternativa)
37

◼ Ejemplo
A una muestra de 19 alumnos se les evaluó su aprendizaje de
un nuevo sistema computacional obteniendo los siguientes
puntajes:
76 96 92 80 84 80 91 76 88 92
86 83 88 84 99 87 68 87 78

Se considera que el programa de estudios ha sido


provechoso si el puntaje mediano es superior a los 90 puntos.
Pruebe si el programa ha sido provechoso a un nivel de
significación de 0.05.

38

19
◼ Ejemplo
 H 0 : Me  90

 H1 : Me  90
 = 0.05
pvalor= 0.995 > se rechaza H0

Conclusión
A un nivel de significación de 0.05 existe suficiente
evidencia estadística para no rechazar la hipótesis nula.
Por lo tanto no se puede afirmar que el programa de
estudios haya sido provechoso
wilcox.test(x, mu=90,alternative="greater")

39

20

También podría gustarte