Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística no paramétrica.
Prueba del signo: de la mediana, muestras
pareadas.
Prueba de rango con signo de Wilcoxon:
aproximación para muestras grandes y
observaciones pareadas.
Práctica 1, examen final
Prueba corta
II semestre 10
Objetivos de aprendizaje y mapa
conceptual
CUIDADO!!!!!
Los métodos con distribuciones libres no están libres de supuestos … porque
algunos de los métodos más comunes, como la prueba del rango con signo y de
suma de rangos que vemos en nuestro curso, parten del supuesto de simetría .
Lo que nos lleva a que en realidad los métodos son algo restrictivos con respecto
a las violaciones moderadas de ese supuesto … resultando que no
son aplicables de modo universal!!!
Navidi
II semestre 10
Desventajas de las pruebas no paramétricas
II semestre 10
Antes de iniciar con las pruebas no paramétricas
específicas que vamos a tratar en este curso,
conviene una prueba preliminar para determinar
si el procedimiento de extracción de la muestra
es efectivamente aleatorio, requisito de
cualquiera de las pruebas estadísticas robustas.
II semestre 10
Dato Clasificación v
0,08 Eliminar Contar
8 n2
0,07 me 1 M
Contar
0,09 Ma 2 7 n1
m
0,08 Eliminar De la tabla A.19 0,514
Nota aclaratoria:0,05 me Como v<11, R ≤ R a un 95% de confianza
3
En nuestro curso tratamos la prueba
0,04 me de “cantidad deNocorridas” o “prueba
hay evidencia de rachas”
que rechace para de
la hipótesis
tamaños de muestra
0,11 menores Ma de 20. aleatoriedad
En este caso la 0,10
Ho: el proceso Maes aleatorio, contra TRES posibles H1:
4
a): se observa agrupamiento
0,08 o patrón de tendencia”. Estamos ante comportamientos del tipo
Eliminar
Ma, Ma, Ma, Ma; 0,11me, me, me, Maetc. ) Tendríamos una cantidad menor de corridas. En este caso
se debe utilizar 0,05
la cola inferiorme( izquierda) de la distribución como región de rechazo, es decir la
región crítica tiene
0,04 la forma Rme ≤ R 5
b) se observa mezclado
0,03 (también
me conocido por “patrón cíclico”, del tipo Ma; me; Ma; me; Ma;
me, etc.) Tendríamos
0,09 una cantidad Ma mayor de corridas. En este caso se debe utilizar la cola
superior ( derecha)
0,11 de la distribución
Ma como
6 región de rechazo, es decir, la región crítica tiene la
forma R R1-0,10 Ma
H1 c): se observa0,08agrupamiento
Eliminaro mezclado, la prueba debe ser bilateral, donde la región crítica
tiene la forma R0,07R1-/ 2 o R ≤meR /2 7
0,90 Ma 8
EnMediana
casos de muestras
0,08 grandes, entendidasv como aquellas con n=n1+n2>20, con n1 y n2 >8
(algunos autores indican que solamente se requiere que n>20, y otros que n1 y n 2 >10 ; en esos
II semestre 10
σv2={2n1n2(2n1n2-n1-n2}/{(n1+n2)2 (n1+n2-1)}
z= (v- µv)/σv
para la MEDIANA
II semestre 10
Prueba de signos
Cuando se requiere realizar la prueba:
H 0 : 0 H1: μ ≠ μ0
H1: μ < μ0
H1: μ > μ0
Pero no se cumple el requisito de normalidad
La
prueba de signos se utiliza para probar
hipótesis sobre una mediana poblacional
II semestre 10
Prueba de signos
La mediana poblacional se representa con el símbolo
˜
Dada una variable continua aleatoria X, la mediana
poblacional se define como
P ˜ P(X
X ˜ ) 0.5
II semestre 10
Prueba de signos
Metodología
Se sustituye cada valor muestral mayor que la mediana
muestral con un signo más.
Se sustituye cada valor muestral menor que la mediana
muestral con un signo menos.
Los valores muestrales iguales a la mediana se
descartan.
Se prueba la hipótesis nula de que estos signos de más y de
menos son el resultado de ensayos binomiales con p=½
II semestre 10
Prueba de signos
Metodología
Para realizar la prueba, si la muestra es pequeña se
realiza directamente con la tabla binomial.
Si la muestra es grande (n mayor que 10) se realiza la
prueba con la distribución normal de acuerdo al método
de prueba de hipótesis de una proporción, con el
estadístico
X np0
Z
np0 1 p0
II semestre 10
Prueba de signos
Ejemplo
Usted es el ingeniero en jefe de un proyecto que produce
baterías y afirma que la vida media de un tipo de estas es
superior a 250 horas. El defensor de los consumidores
desea saber si esta afirmación es justificada y para ello
mide la vida media de 24 baterías, con los resultados que se
presentan en la tabla a continuación. Supuesto que la
muestra fue aleatoria, justifique su afirmación con un nivel
de significancia de 0.05.
II semestre 10
Prueba de signos
Muestreo de vida las baterías en horas
II semestre 10
Prueba de signos
Solución
~ ~
H 0 : 0 250
~ ~
H1 : 0
Con un nivel de significancia de 0.05 el Z crítico sería
Z= -1.645
II semestre 10
Prueba de signos
271 230 198 275 282 225 284 219
Alt e c comparar
a so la tabla del muestreo contra la vida
En es sa la
no imedia lapropuesta se tiene la siguiente tabla
nt e r e
ud de
it
magn ia
nc
difere
+ - - + + - + -
271 – 250 = + - + + - + + -
+ 21 + + - + + - + +
II semestre 10
Prueba de signos
Solución
˜ 98.0
H 0 :
˜ 98.0
H1 :
Criterio: Determinar la cantidad de signos más
(+) denotados por x. Rechazar la hipótesis nula si
la probabilidad de obtener x o más signos de más
es menor o igual a 0.01
II semestre 10
99 102.3 99.8 100.5 99.7 96.2 99.1 102.5
Prueba de signos
103.3 97.4 100.4 98.9 98.3 98 101.6
Dado que 0.0009 es menor que 0.01 debemos rechazar la hipótesis nula y
concluimos
II semestre 10
que la calificación mediana de octanaje excede los 98.0
Prueba de rango con signo
A diferencia de la prueba de signos, la prueba de
rangos y signos considera la magnitud de la
diferencia, no solo la dirección:
II semestre 10
Prueba de rango con signo
Se prueba la hipótesis nula:
˜
H 0 : ˜0
Los pasos son los siguientes:
1. Se resta μ0 de cada valor muestral y se
descartan todas las diferencias igual a cero.
2.Se clasifican las diferencias sin importar el
signo
II semestre 10
Prueba de rango con signo
3. Se asigna un rango de 1 a la menor
diferencia absoluta, un rango de 2 a la
siguiente más pequeña.
4. Cuando la diferencia de dos o más valores
muestrales es el mismo, se asigna a cada uno
el promedio de los rangos que se asignarían si
las diferencias fueran distinguibles.
Veamos el siguiente ejemplo …
II semestre 10
Supongamos que se dan los siguientes resultados
parciales .. (3+4+5)/3 =4
1 1 1 1
2 2 2 2
-4 4 4 34
-4 4 4 4
4 4 4 54
6 6 6 6
7 7 7 7
8,5 8,5 8,5 8
8,5
8,5 8,5 8,5 9
8,5
II semestre 10
10 10 10 10
Prueba de rango con signo
5. Se suman todas las diferencias positivas, esta
sumatoria se denotará w+. La suma de todas las
diferencias negativas se denotará w- .
El menor valor entre w+ y w- se designa como w.
6. Comparar la sumatoria correspondiente con el valor
crítico de la tabla de valores críticos para la prueba de
rangos con signos (A17), si w es menor o igual que el
valor crítico, se rechaza la hipótesis nula de
¡¡¡¡La presentación de nuestra tabla A17
igualdad. puede variar entre libros de texto!!!
II semestre 10
Datos
muestrales
Ejemplo 494,6
510,8
487,5
Un fabricante de planchas eléctrica necesita probar la
493,2
precisión del control del termostato a 500 °F. Hace
pruebas a 15 planchas mediante un termopar, obteniendo 502,6
las siguientes mediciones. 485
Se entiende razonable que una desviación de temperatura 495,9
desde los 500 °F sea positiva o negativa (suposición de 498,2
simetría), pero se desea protegerse contra posibles 501,6
anormalidades de la distribución real de temperatura.
497,3
Verifique si los datos sugieren una incorrecta
492
calibración a un nivel de significancia de 0.05.
504,3
499,2
493,5
505,8
II semestre 10
Mag.
Datos Magnitud Abs.
muestrales Diferencia absoluta orden Rango Signo w+ w-
Ho: u = 500 494,6 -5,4 5,4 0,8 1 - 1
Hi: u 500 510,8 10,8 10,8 1,6 2 + 2
487,5 -12,5 12,5 1,8 3 - 3
eso
493,2 -6,8 6,8 2,6 4 + 4
o r
y 0 p os 502,6 2,6 2,6 2,7 5 - 5
o ha inam
N lim 485 -15 15 4,1 6 - 6
e
no res.
o
val poco os 495,9 -4,1 4,1 4,3 7 + 7
Tam ntram 498,2 -1,8 1,8 5,4 - A17 para8
De8 la tabla
o s
enc rencia tre si, n=15, = 0.05, bilateral,
dife les en o 501,6 1,6 1,6 5,8 9 + 9
el valor crítico es 25.
a
igu nces n ue 497,3 -2,7 2,7 6,5 10
Como -
w=35>25, 10
o
ent mos q
e
ten ediar 492 -8 8 6,8 entonces
11 - no se puede
11
m rechazar la hipótesis a
pro os. 504,3 4,3 4,3 8 12 - 12
g ese nivel de significancia
ran
499,2 -0,8 0,8 10,8 13 + 13
Dada la suposición de
simetría, esperaríamos 493,5 -6,5 6,5 12,5 14 - 14
que las diferencias + y – 505,8 5,8 5,8 15 15 - 15
fueran aproximadamente
II semestre 10
35 85
equivalentes w 35
Prueba de rango con signo
Muestras pareadas
H0 H1 Calcule
˜
˜0 w+
w-
˜
˜0 ˜
˜0
Toma de w
decisiones: ˜
˜0
w+
˜1
˜2 ˜1
˜2
˜1
˜2 w-
˜1
˜2
II semestre 10
w
Prueba de rango con signo
Toma de decisiones
•Siempre que n<5 y el nivel de significancia no exceda
0.05 en pruebas de una cola o 0.1 en pruebas de dos
colas, la hipótesis nula se acepta.
•Se utiliza la tabla A17 si “n” está entre 5 y 30 (algunos
autores indican 20) Se rechaza la hipótesis nula si el valor
calculado w+, w- o w es menor o igual que el valor
tabulado apropiado.
II semestre 10
Prueba de rango con signo
Tronco 1 2 3 4 5 6 7 8
Disolvente 1 3.92 3.79 3.70 4.08 3.87 3.95 3.55 3.76
Disolvente 2 4.25 4.20 4.41 3.89 4.39 3.75 4.20 3.90
nn 1 2 n n 12n 1
w w
4 24
II semestre 10
Prueba de rango con signo
II semestre 10
xi-u Rango con signo w+
-10 -1 xi-u Rango con
136 14 signo w+
14
-27 -2 -10 -1
-150 -15
36 3 3
-155 -16
55 -4
-159 -17
73 5 5
165 18 18
77 -6
81 -7
-178 -19
90 8 8 -183 -20
95 -9 -192 -21
-99 -10 -199 -22
113 11 11 -212 -23
-127 -12 -217 -24
-129 -13 -229 -25
136 14 14 59
II semestre 10
n n 1 2525 1
w w 162.5
4 4
w w 59 162.5
z z 2.78
w 1381.25
Recuerde: interesa contrastar Ho:µ=50.000, Hi: µ<50.000 a un = 0.01
nn 12n 1 1
2
w * ( i 1) * i * ( i 1)
24 48
Donde i corresponde a los
conjuntos empatados
II semestre 10
Supongamos que se dan los siguientes resultados
parciales … para n=10
Magnitud Mag. Abs.
Diferencia absoluta ordenadas Rango En este caso hay dos conjuntos
1 1 1 1 empatados con 1 = 3 y 2 = 2
2 2 2 2
nn 12n 1 1
-4 4 4 4 w2 * ( i 1) * i * ( i 1)
24 48
-4 4 4 4
4 4 4 4
6 6 6 6
7 7 7 7
8,5 8,5 8,5 8,5
8,5 8,5 8,5 8,5
10 10 10 10
II semestre 10
Prueba Suma de Rangos de Wilcoxon
Se pretende probar
˜1
H 0 : ˜2
II semestre 10
Prueba Suma de Rangos de Wilcoxon (también
conocida como prueba U de Mann-Whitney)
1. Seleccionar una muestra aleatoria para cada una de las
poblaciones
2. Se llamará n1 a las observaciones de la muestra más
pequeña. Si la muestras son del mismo tamaño, se
elige aleatorio.
3. Ordenar las n1 + n2 observaciones de las muestras
combinadas en orden ascendente
4. Sustituir un rango de 1, 2,…, n1 + n2 para cada
observación. Si hay empates se reemplazan las
observaciones por la media de los rangos.
II semestre 10
Prueba Suma de Rangos de Wilcoxon
5. La suma de rangos de la muestra más pequeña se
denotará w1
w1 w 2
n1 n 2 n1 n 2 1
2
II semestre 10
Prueba Suma de Rangos de Wilcoxon
7. Por esta razón, si se calcula el valor de w1, la
muestra más pequeña, se puede calcular el valor
de w2 por medio de la fórmula
w2
n1 n 2 n1 n 2 1
w
1
2
II semestre 10
Prueba Suma de Rangos de Wilcoxon
7. Esto es importante porque para la prueba de suma
de rangos de Wilcoxon utilizaremos para tomar
decisión los siguientes estadísticos
n1 n1 1 n 2 n 2 1
U1 w1 U2 w2
2 2
II semestre 10
Prueba Suma de Rangos de Wilcoxon
Toma de decisiones:
H0 H1 Calcule
U1
˜1
˜2
˜1
˜2
˜1
˜2 U2
˜1
˜2
U
II semestre 10
Prueba Suma de Rangos de Wilcoxon
Ejemplo
La concentración de fluoruro en la orina de ganado
(partes por millón) se midió para una muestra de
ganado que pasta en un área expuesta antes a
contaminación de fluoruro y para una muestra que
pasta en una región no contaminada
II semestre 10
Prueba Suma de Rangos de Wilcoxon
II semestre 10
Solución x y
x 14.2 1
˜1
H 0 : ˜2
y 16.8 2
˜1
H1 : ˜2 y 17.1 3
La hipótesis nula nos da x 17.2 4
la alternativa de que la x 18.3 5
contaminación causa un
aumento en la x 18.4 6
concentración y 18.7 7
y 19.7 8
x w 1 25 x 20.0 9
y 20.9 10
y w 2 53 y 21.3 11
y 23.0 12
II semestre 10
Solución
˜1
H1 : ˜2
Debemos calcular U1:
n1 n1 1 55 1
U1 w1 25 10
2 2
De acuerdo a la tabla A18, para la prueba unilateral con
alfa de 0.01; n1 =5 y n2 =7, el valor crítico es 3. Por lo
tanto, no hay suficiente evidencia para rechazar la
hipótesis
II semestre 10
nula, la contaminación es igual.
Prueba Suma de Rangos de Wilcoxon
Teoría normal de aproximación para dos
muestras
Cuando n1 y n2 exceden 8, las distribuciones
muestrales de U1 (o U2) se aproxima a la
distribución normal, con
U1 uU1
Z
U1
II semestre 10
Prueba Suma de Rangos de Wilcoxon
Ejemplo
En un estudio de rocas sedimentarias se
obtuvieron los siguientes diámetros, en milímetros,
de dos tipos de arena
Arena I 0.63 0.17 0.35 0.49 0.18 0.43 0.12
0.20 0.47 1.36 0.51 0.45 0.84 0.32 0.40
˜1
H 0 : ˜2
Criterio: rechazar Ho si
˜1
H1 : ˜2 Z<-2.575 o Z>2.575
II semestre 10
Solución
0.12 I 1 0.48 II 13 1.01 II 25
Primero
debemos 0.17 I 2 0.49 I 14 1.07 II 26
buscar el valor 0.18 I 3 0.51 I 15 1.11 II 27
de U1 para 0.20 I 4 0.53 II 16 1.13 II 28
poder calcular 0.26 II 5 0.54 II 17 1.36 I 29
el valor de Z
0.32 I 6 0.58 II 18
n1=14 0.35 I 7 0.63 I 19
0.39 II 8 0.84 I 20 w1=273
n2=15 0.40 I 9 0.88 II 21
0.43 I 10 0.89 II 22 w2=162
Note que el valor
n1 corresponde a 0.45 I 11 0.92 II 23
la muestra de 0.47 I 12 0.96 II 24
arena II
II semestre 10
Solución
n1 n1 1 14 14 1
U1 w1 273 168
2 2
n1n 2 14 *15
uU1 105
2 2
II semestre 10
Ahora vamos a trabajar con
pruebas no paramétricas
para la VARIANZA
II semestre 10
Prueba Kruskal - Wallis
Métodos no paramétricos en al análisis de
varianza
También llamada prueba H de Kruskal – Wallis.
Es la generalización de la prueba de suma de
rangos, cuando se quieren comparar tres o más
poblaciones.
Se utiliza para probar la hipótesis de que k
muestras independientes provienen de poblaciones
idénticas.
II semestre 10
Prueba Kruskal - Wallis
Supuestos
Los datos son por lo menos ordinales, esto quiere
decir, que pueden ordenarse de manera creciente o
decreciente.
Independencia entre las observaciones de una
muestra
Independencia entre las observaciones de las
distintas muestras.
NO requiere supuesto de homogeneidad de varianzas
II semestre 10 71
Prueba Kruskal - Wallis
Para probar la hipótesis nula H0 de que k muestras
independientes provienen de poblaciones idénticas,
calcule k 2
12 ri
h
n n 1 i1 n i
3n 1
II semestre 10
Prueba Kruskal - Wallis
Ejemplo
A 68 72 77 42 53
B 72 53 63 53 48
C 60 82 64 75 72
D 48 61 57 64 50
E 64 65 70 68 53
II semestre 10
Prueba Kruskal - Wallis
Solución
Hay 5 muestras (A,B,C,D y E), k=5. N =25, porque son 5 muestras
con 5 valores cada una.
Ordenando todos los valores en orden creciente de magnitud y
asignando rangos apropiados, incluso en las coincidencias,
obtenemos la siguiente tabla
Suma de
rangos
A 17.5 21 24 1 6.5 70
B 21 6.5 12 6.5 2.5 48.5
C 10 25 14 23 21 93
D 2.5 11 9 14 4 40.5
E 14 16 19 17.5 6.5 73
II semestre 10
Prueba Kruskal - Wallis
Solución
Con estos valores, podemos sustituir en la fórmula y
calcular es estadístico de prueba
12
2 2 2 2
70 48.5 93 40.5 73
2
H 326
2526 5 5 5 5 5
H 6.44
K-1=4 grados de libertad y 95% de confianza se
tiene χ0.952 =9.49. Puesto que 6.44<9.49 no
podemos rechazar la hipótesis de igualdad entre
II semestre 10
1
T 3
T
3
N N
T es el número de coincidencias correspondientes a
cada observación
II semestre 10
Prueba Kruskal - Wallis
II semestre 10
Prueba Kruskal - Wallis
Corrección por coincidencias
Ejemplo
La tabla para realizar la corrección es la siguiente
Observación 48 53 64 68 72
(T3-T) 6 60 24 6 24 T 120
T 3
II semestre 10
Prueba Kruskal - Wallis
Corrección por coincidencias
Ejemplo
1
T 3
T
1
120
0.9923
3
25 25
3
N N
6.44
Hc 6.49
0.9923
La corrección no es suficiente para cambiar la
decisión, porque sigue siendo menor que 9.49
II semestre 10