Está en la página 1de 77

ESTADÍSTICA NO PARAMÉTRICA

• La Estadística no paramétrica es una parte de la estadística


inferencial, donde a priori NO se hacen supuestos
relacionados a la distribución estadística que tienen los
datos.
• No se hacen supuestos paramétricos de la población de la
que se toma la muestra. Excepto que sea
continua.(Pruebas que están libres de distribución)
• Las pruebas no paramétricas se pueden usar en
condiciones más generales que las pruebas estándar a las
que reemplazan.
• Son de fácil aplicación y cálculo.
• Funciona mejor con tamaños de muestras grandes.
Estadística no paramétrica

• En general la mayoría de las pruebas de hipótesis que se


presentaron previamente se basan en que la muestra
aleatoria se selecciona de una población normal o si el
tamaño de la muestra n es grande(n≥30).
• Si n es menor a 30 y la población no es normal debemos
recurrir a métodos no paramétricos.
• Lo bueno es que la mayoría de la pruebas paramétricas son
confiables cuando se experimentan ligeras desviaciones de la
normalidad, en particular cuando el tamaño de muestra es
grande. Esto es cierto para la prueba t y la F.
• Las diferencias serias de normalidad hacen al método no
paramétrico más eficiente que el método paramétrico.
Estadística no paramétrica

• La principal desventaja es que en algunos casos desperdician


información, en general, los procedimientos no paramétricos
no utilizan toda la información contenida en la muestra.
• Esto hace que la eficiencia de un método no paramétrico sea
menor que la de un método paramétrico. Como consecuencia
de lo anterior para lograr la misma potencia, una prueba no
paramétrica requiere un tamaño mayor de muestra que el que
requerirá la correspondiente prueba paramétrica.
• En general si es posible aplicar un método no paramétrico y
paramétrico a un problema particular, se prefiere el método
paramétrico.
• Nótese, que el método no paramétrico también es posible
aplicarlo a muestras grandes cuando no se cumplen los
supuestos de normalidad.
Ventajas que ofrecen los métodos no
paramétricos

• Debemos reconocer que las suposiciones de normalidad


y que no siempre se pueden justificar y que no siempre
tenemos mediciones cuantitativas.
• Variables tipo rango, como puntuar de mayor a menor
un producto o servicio es poco probable que satisfagan
los supuestos de normalidad.
• Muchos métodos no paramétricos incluyen el análisis de
rangos y por tanto se ajustan muy bien para resolver un
problema en particular.
Métodos no paramétricos o de
distribución libre

• Son procedimientos, entre ellos tenemos:


• Proporciones
• Prueba del signo (una mediana y observaciones pareadas)
• Prueba del rango con signo de Wilcoxon (una media y
observaciones pareadas)
• Prueba de la suma de Rangos de Wilcoxon-Mann-
Whitney o Prueba U.(Dos muestras independientes)
• Prueba de Kruskal Wallis (Equivalente a ANOVA de un
factor en prueba paramétrica)
Prueba del signo

• La prueba de los signos se utiliza para probar la


hipótesis de:
– Una mediana
– Dos medianas

• En el caso de muchos procedimientos no paramétricos,


la media se reemplaza por la mediana como el
parámetro de ubicación.
• La población o poblaciones de las que se toma la
muestra son continuas
Si una distribución es simétrica la
media, la mediana y la moda son iguales

Gráfica de distribución
Normal; Media=0; Desv.Est.=1

0,4

0,3
Densidad

0,2

0,1

0,0
-3 -2 -1 0 1 2 3
media=mediana=moda=0
Definición de la mediana poblacional: 

• Dada una variable aleatoria X

1 1
P( X   ) = = P( X   ) =
2 2
Procedimiento de la Prueba de signo
para una mediana , una sola muestra.
• Se tiene una muestra de tamaño n. Al probar la Hipótesis nula: H 0 :  = 0
• Contra una hipótesis alternativa adecuada
• Si a cada observación de la muestra la restamos la mediana que se postula en
la hipótesis nula(Xi-  0) , i=1,2..,n

• Se contabiliza a quienes obtengan un valor de diferencia positivo, y se etiqueta


con un signo +, y a quienes obtengan una diferencia negativa con un signo –


• En el caso de ocurrir empates(diferencia cero) se elimina la observación y se
trabaja todo el análisis con las observaciones que no empatan.

• Si la hipótesis Nula es verdadera la cantidad de los signos + debe ser igual a la


cantidad de los signos menos.

• Cuando un signo aparece con más frecuencia de lo que debería dada la


aleatoriedad, rechazamos la hipótesis nula.
Prueba del signo para una
mediana, una sola muestra.

• Si la hipótesis Nula es verdadera , X tiene una


distribución Binomial(x, n, p=1/2)
• El estadístico de Prueba para la prueba de la prueba del
signo es la variable aleatoria X que Binomial(x, n, p=1/2)
• X: representa el número de signos + en la diferencia
• Esto es, el número de sucesos que ocurren en la n
repeticiones.
• Podemos representar a X por R+
• A partir de la distribución Binomial se puede calcular
directamente el valor p.
Prueba del signo de 1 cola

H 0 :  = 0 H 0 :  = 0
vs vs
H1 :    0 H1 :    0
• Rechazamos Ho a favor • Rechazamos Ho a favor
de H1 si y solo si la de H1 si y solo si la
proporción de signos + proporción de signos +
es bastante menor que es bastante mayor que
½ en otras palabras ½ en otras palabras
siempre que el número siempre que el número
observado de signos + observado de signos +
sea muy pequeño sea muy grande
1 1
Valor p = P(R + r + );cuando p = Valor p = P(R + r + );cuando p =
2 2
Prueba del signo: Dos colas

H 0 :  = 0
vs
H1 :    0
• Rechazamos Ho a favor de H1 si y solo si la proporción de
signos + es bastante mayor o menor a ½. Esto es
equivalente a que r+ sea bastante pequeña o grande.
• Por tanto si r+<n/2 el valor p es:
Valor p = 2P(R +  r + ) cuando p = 1/ 2
• Si r+>n/2 el valor p es
Valor p = 2P(R +  r + ) cuando p = 1/ 2
Ejercicio 1

Se toman datos del número de horas que una marca de batería de celular
dura antes de tener una recarga.
Utilice la prueba del signo para probar la hipótesis que estas baterías operan
con una mediana de 8 horas.
H0 :  =8
Ejercicio1 vs
H1 :   8
Utilice la prueba del signo para probar la hipótesis
que estas baterías operan con una mediana de 8
horas

H 0 :  =8 El estadístico de Prueba para la prueba


del signo es la variable aleatoria R+ que
vs Binomial(r+, n, p=1/2)
H1 :   8 R+ : representa el número de signos + en
• r+=3 la diferencia
• n=10: n/2=5
• r+<n/2 entonces el valor p es calculado a través de
Valor p = 2P(R +  r + ) cuando p =1/ 2
Valor p = 2P(R +  3)
Ejercicio 1

Valor p = 2P(R +  3)
R + es binomial(r+ , n =10, p =1/ 2)

Valor p = 0,3438
• El valor p es mayor a 0,05 por lo que existe evidencia estadística para
no rechazar H0 a favor de H1 y se concluye que el tiempo medio de
operación de las baterías es estadísticamente igual a 8 horas.
Prueba de Signos: Muestras pareadas

• Las observaciones son medidas de manera pareada, de


tal manera que a cada Xi le corresponde un Yi
obteniéndose así un conjunto de n observaciones
pareadas, esto es:

(X1 Y1); (X2 Y2); … ; (Xi Yi); … ; (Xn Yn)


• Todo esto define una Nueva Variable Aleatoria D, cuyos n
valores observados son:

Di = Xi - Yi ; i = 1 ; 2 ; … ; n.
(es la diferencia de los valores pareados)
Prueba de Signos: Muestras pareadas

• Se quiere probar la Hipótesis que las dos Poblaciones


tienen una mediana común o igual, esto es:

1 =  2
• Que es equivalente a probar que la mediana de las
diferencias es igual a cero.
D = 0
• La prueba del signo puede aplicarse a observaciones
pareadas obtenidas de poblaciones continuas
Prueba de Signos: Muestras
pareadas

• En este caso probamos:

2) Estadístico de Prueba :
1) H 0 : 1 = 2 R+ que Binomial(r+, n, p=1/2)

si r+<n/2 : 2P(R +  r + ) o
vs H1 : 1  2 3) Valor p Si r+>n/2 2P(R +  r + )

1  2 P(R +  r + )
1   2 P(R +  r + )
Prueba del signo aproximación con
la v.a Normal

H0 :  = 0   0 H 0 : 1 = 2 1  2
vs H1 :
vs H1 :   0 1  2
  0
1   2
• Siempre que n>10 y p=0,5 una distribución normal es
una buena aproximación de la distribución Binomial.
R + es Binomial(r+ , n, p =1/ 2)
R +  = np ; 2 = np(1− p)
Región Crítica r +
−np
Z=
    np(1− p)

    Cuando tratamos con datos pareados, la
prueba del rango con signo también
   − se puede usar
Estadística Inferencial 22
Ejercicio 2

• Una compañía de taxis trata de decidir si el uso de


llantas radiales en lugar de llantas regulares con cinturón
mejora la economía de combustible.
• Se equipan 16 automóviles con llantas radiales y se
manejan por un recorrido de prueba establecido. Sin
cambiar de conductores, se equipan los mismos autos
con las llantas regulares con cinturón y se maneja una
vez más para el recorrido de prueba. Se registra el
consumo de gasolina en km por litro.

Estadística Inferencial 24
Ejercicio: Datos
Llantas radiales: Llantas con cinturón:
X1:Consumo de gasolina X2:Consumo de gasolina
Automóvil en km x litro en km x litro
1 4,2 4,1
2 4,7 4,9
3 6,6 6,2
4 7 6,9
5 6,7 6,8
6 4,5 4,4
7 5,7 5,7
8 6 5,8
9 7,4 6,9
10 4,9 4,9
11 6,1 6
12 5,2 4,9
13 5,7 5,3
14 6,9 6,5
15 6,8 7,1
16 4,9 4,8
Ejercicio 2

• ¿Podemos concluir que los autos equipados con llantas


radiales obtienen mejor economía de combustible que
los autos equipados con llantas regulares con cinturón?

H 0 : 1 =  2 : 1 − 2 = 0 D =0
vs vs vs

H1 : 1   2 : 1 − 2  0 D 0

• Estadístico de prueba R+ es Binomial con p=1/2


Ejercicio 2

• Tamaño muestral n
• n=16
Procedemos a calcular las diferencias y con el objeto de
contabilizar las diferencias positivas.

27
Llantas Llantas con
Automóvil radiales: cinturón: Diferencia Signo
Consumo de Consumo de
gasolina en km gasolina en km
x litro x litro
1 4,2 4,1 0,1 +
2 4,7 4,9 -0,2 -
3 6,6 6,2 0,4 +
4 7 6,9 0,1 +
5 6,7 6,8 -0,1 -
6 4,5 4,4 0,1 +
7 5,7 5,7 0
8 6 5,8 0,2 +
r+=11
9 7,4 6,9 0,5 + 2
10 4,9 4,9 0 empates
11 6,1 6 0,1 +
12 5,2 4,9 0,3 +
13 5,7 5,3 0,4 +
14 6,9 6,5 0,4 +
15 6,8 7,1 -0,3 -
Estadística Inferencial 11/01/2019
16 4,9 4,8 0,1 +
Ejercicio 2

Dos observaciones fueron eliminadas ahora


Nuevo n: n=14
r+=11
n>10
• Estadístico de prueba r + −np
Z=
np(1− p)

(11−14*0,5) (11− 7) 4
Z= = = = 2,14
14*0,5*0,5 3,5 1,87
Valor p = P(R + 11) P(Z  2,14) = 0.016
• Rechazar H0 a favor de H1 y concluir que en promedio las llantas
radiales mejoran la economía del combustible.
Prueba de Rango con signo de
Wilcoxon

• Las pruebas anteriores no toman en cuenta la magnitud


de las diferencias solo el signo, cuando los datos
presentan alta variabilidad en la diferencia la magnitud
importa. En los procedimientos de la Prueba del rango
con signo sí se toma en cuenta la magnitud.
• Esta prueba es preferible a la prueba de signos
• Para estas pruebas los datos deben ser continuos y
simétricos, con lo que la media y la mediana son
iguales.
• La prueba se utiliza para probar la hipótesis de:
– Una media o mediana
– Dos medias o medianas(muestras pareadas)
Prueba de Rango con signo de
Wilcoxon

• Se toma una muestra aleatoria de tamaño n de una


población simétrica continua con desconocida media o
mediana H 0 :  = 0
• Deseamos un test de hipótesis:
• Los contrastes de hipótesis son los mismos que en la prueba
del signo.
• Cambia que aquí tomamos en cuenta a más del signo de la
diferencia, la magnitud de la misma.
• Entonces:
• La prueba del rango con signos se basa en T+ , esto es, la
suma de los rangos asignadas a las diferencias positivas, y en
T−, la suma de los rangos asignadas a las diferencias
negativas T+ - T− o T=mín(T+, T−).
…viene Prueba de Rango con signo de
Wilcoxon

• Puesto que
n(n +1)
T+ + T− =
2

• Y ambas son variables aleatorias que asumen valores en


el intervalo de 0 a n ( n + 1 )
2

• Con distribuciones que son simétricas alrededor de n(n +1)


4

• Así es posible construir la distribución de T+ y T−


Obtener
…viene Prueba de Rango con signo de Wilcoxon :
distribución de T+ para distintos tamaños n
• La configuración de los signos van a estar dada por la
permutaciones de los signos positivos y negativos porque
importa el orden.
• Se tienen n rangos o rankings con n signos asociados a las
diferencias que son colocados aleatoriamente 2n diferentes
maneras de colocar los n
signos en cada rango todos con
igual probabilidad  1  cuando H0 es verdadera.
 2 
• Así en el caso de n= 3 serán 23=8 posibles resultados o
formas de colocar los signos (8 signos + y −) para los n=3
rangos o rankings asociados a los valores de T+
n 2n
1 21=2
2 22=4
11/01/2019
3 33
3 2 =8
Obtener la
…viene Prueba de Rango con signo de Wilcoxon :
distribución de T+ para n=1

• Tendremos 21=2 posibles resultados o formas de


arreglar los signos en el ranking, esto es, 2
permutaciones de signos para n=1, un solo rango que
está asociados a los valores de T+. Rango o Ranking
1
-
+

• Recordemos T+ es la suma de los rangos positivos y que


toma valores entre 0 a n ( n + 1 ) , entre 0 y 1
2
Rango Probabilidad
1 T+ bajo H0
- 0 1/2
+ 1 1/2 11/01/2019 34
…viene Prueba de Rango con signo de Wilcoxon :
Distribución de T+ para n=1

• Los valores que toma la variable aleatoria T+ están entre


0 y 1 , la probabilidad asociada es ½ respectivamente

1
P(T+=t+)

0,5

0
0 t+ 1
…viene Prueba de Rango con signo de Wilcoxon :
Distribución de T+ para n=2

• Tendremos que colocar 22=4 signos en 2 rangos y T+


toma valores entre 0 y n ( n + 1 ) , entre 0 y 3
2
Rangos T+ Probabilidad bajo H0:
1 2
- - 0 1/4
+ - 1 1/4
- + 2 1/4
+ + 3 1/4
0,5 P(T+= t+)

0,25

0
0 1 2 3
11/01/2019 t+ 36
…viene Prueba de Rango con signo de Wilcoxon :
Distribución de T+ para n=3

• Tendremos que colocar 23=8 signos en 3 rangos y T+


toma valores entre0 y n ( n + 1 ) , entre 0 y 6
2
Probabilidad
T+ bajo H0:
Rangos
1 2 3
- - - 0 1/8 0,50 P(T+= t+)
+ - - 1 1/8
0,38
- + - 2 1/8
- - + 3 1/8 0,25
+ + - 3 1/8
0,13
+ - + 4 1/8
- + + 5 1/8 0,00
+ + + 6 1/8 0 1 2 t+3 4 5 6
…viene Prueba de Rango con signo de Wilcoxon :
Distribución de la variable aleatoria T+
para n=4 y n=5
0,25 T+,n=4
0,19
0,13
0,06
0,00
0 1 2 3 4 5 6 7 8 9 10

0,13
0,09 T +,n=5
0,06
0,03
0,00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Media y
…viene Prueba de Rango con signo de Wilcoxon :
Varianza de la variable aleatoria T+

n(n +1)
• La variable aleatoria T+ tiene: =
4
n(n +1)(2n +1)
 =
2

24
…viene Prueba de Rango con signo de
Wilcoxon :

Para una Media o mediana

1) H 0 :  = 0 3) Estadístico de Prueba : T+ o T- o T

  0  T=Min(T+ , T-)


2) H1: 4) Región Crítica −   
  0
+   
  0
Prueba de Rango con signo de
Wilcoxon

• Se ordenan las diferencias absolutas 𝑿𝒊 − 𝝁𝟎 de menor a


mayor.
• En el caso de empates se elimina la observación y se procede
a asignar cada rango o diferencia de menor a mayor, esto es,
asignamos el rango o ranking 1 a la diferencia en valor
absoluto más pequeña, rango 2 a la segunda diferencia más
pequeña y así sucesivamente hasta llegar a la diferencia más
grande en valor absoluto que le asignamos rango n.
• Si la diferencia en valor absoluto de dos o más diferencias son
iguales se procede a sumar los rangos asignados a las
diferencias y a dividir para la cantidad de diferencias iguales,
que es lo mismo que decir obtener la media de los rangos
iguales.
41
Ejercicio 3

Se toman datos del número de horas que una marca de batería de celular dura antes
de tener una recarga.
Utilice la prueba del rango con signo de Wilcoxon para probar la hipótesis que
estas baterías operan con una media de 8 horas.
Ejercicio 3

• Utilice la prueba del rango con signo de Wilcoxon


para probar la hipótesis que estas baterías operan con
una media de 8 horas.
H0 :  = 8
vs
H1 :   8
• Estadístico de Prueba : T=min(T+,T−)
Ejercicio 3
Observación: Tiempo de
Celular i duración de X i- 0
la batería
en horas
1 5 -3
2 9 1
3 7 -1
4 3 -5 Ahora
5 10 2
6 7 -1 n=10
7 5 -3
8 9 1
9 6 -2
10 7 -1
a Inferencial 11 8 0
Ordenamos las diferencias absolutas de
menor a mayor y asignamos el rango

T+=3+3+6,5=12,5
T−=42,5
T=min(T+,T−)
T=12,5
Utilice la prueba del rango con signo de Wilcoxon
para probar la hipótesis que estas baterías operan
con una media de 8 horas

H0 :  =8 El Estadístico de Prueba T=12,5


vs
H1 :   8
• Región crítica:
• Rechace H0 en favor de H1 si: 
• Utilizaremos la Tabla T para el valor crítico =0,05 y n=10
• 12,5≤T0,05
• 12,5 ≤8
• Con 95% de Confianza. Existe evidencia estadística para
concluir que la media de duración de las baterías es 8 horas
11/01/2019 47
Prueba del Rango con Signo de
Wilcoxon: Muestras pareadas

• Las observaciones son medidas de manera pareada, de


tal manera que a cada Xi le corresponde un Yi
obteniéndose así un conjunto de n observaciones
pareadas, esto es:

(X1 Y1); (X2 Y2); … ; (Xi Yi); … ; (Xn Yn)


• Todo esto define una Nueva Variable Aleatoria D, cuyos n
valores observados son:

Di = Xi - Yi ; i = 1 ; 2 ; … ; n.
(es la diferencia de los valores pareados)
Prueba del Rango con Signo de
…viene

Wilcoxon: Muestras pareadas

• Cuando tratamos con datos pareados, la prueba del


rango con signo de Wilcoxon también se puede usar.
• En este caso probamos:

H 0 : 1 =  2 3) Estadístico de Prueba : T+ o T- o T
(  )  T=Min(T+ , T-)
H1: (  ) 4) Región Crítica −   
(  ) +   
…vienePrueba del Rango con Signo de
Wilcoxon:Muestras grandes

• Para n≥15 se considera razonable suponer que T+ es un


valor de una variable aleatoria que tiene
aproximadamente una distribución normal n(n +1)
=
Estadístico de Prueba : Z =
T −
+
4
H0 :  =  0 n(n +1)(2n +1)
  = 2
24
Región Crítica
  0   
H1:   0   
  − 
  0
• Para muestras pareadas también se usa el mismo
tamaño 15 en cada n1 y n2
Ejercicio 4

Antes Después
• Estos son los pesos en libras,
antes y después, de 16 147.0 137.9
personas que siguieron por 183.5 176.2
semanas un régimen alimenticio 232.1 219.0
161.6 163.8
de reducción de peso: 197.5 193.5
206.3 201.4
177.0 180.6
215.4 203.2
147.7 149.0
208.1 195.4
166.8 158.5
131.9 134.4
150.3 149.3
197.2 189.1
159.8 159.1
11/01/2019 5
171.7 173.2
Ejercicio 4

• Use la prueba de rangos con signos para probar si el


régimen alimenticio de reducción de peso es eficaz.
H0 : 1 = 2
vs
H0 : 1  2

• Estadístico de Prueba : Z = T +
− =
n(n +1) 16(17)
= = 68
4 4

• Región crítica:  2 =
n(n +1)(2n +1) 16(17)(33)
= = 374
24 24
• Rechace H0 en favor de H1 si   
Calculamos la diferencia
Antes Después Diferencia
147 137.9 9.1
183.5 176.2 7.3
232.1 219 13.1
161.6 163.8 -2.2
197.5 193.5 4
206.3 201.4 4.9
177 180.6 -3.6
215.4 203.2 12.2
147.7 149 -1.3
208.1 195.4 12.7
166.8 158.5 8.3
131.9 134.4 -2.5
150.3 149.3 1
197.2 189.1 8.1
159.8 159.1 0.7
171.7 173.2 -1.5
Ordenamos por el valor absoluto de la
diferencia y asignamos el rango respectivo
Ejercicio 4

• Conclusion:
• Con 95% de confianza, existe evidencia estadística para
Rechazar la hipótesis nula en favor de la alterna. El
régimen alimenticio es eficaz para reducir de peso.
Prueba de la suma de Rangos de Wilcoxon-
Mann-Whitney o Prueba U
(Dos muestras independientes)

• También es conocido como prueba de dos muestras de


Wilcoxon.
• Este procedimiento se utiliza para muestras aleatorias de
dos poblaciones independientes y continuas y sin
tener que suponer que las dos poblaciones muestreadas
son normales.(No hay pareamientos)
• Es posible utilizar esta prueba en lugar de la prueba t
paramétrica de diferencia de medias para poblaciones
normales. No se restringe a las poblaciones normales.
Eso sí la potencia de la prueba será menor.
…viene Prueba
de la suma de Rangos de
Wilcoxon
(Dos muestras independientes)

• Sean X11,X12,…,X1n y X21,X22,…X2n dos muestras


aleatorias independientes de tamaño n1 y n2 donde n1 es
menor o igual a n2
• Para los siguientes contrastes de Hipótesis:

H 0 : 1 =  2
(  )
H1: (  )
(  )
…viene Prueba Suma de Rangos de Wilcoxon-
Mann-Whitney
(Dos muestras independientes)

• En general el Estadístico de Prueba


(n1 + n 2 )(n1 + n 2 +1)
w1 + w 2 =
2
• La suma aritmética de n1+n2 enteros positivos. Una vez
determinada w1, puede ser más fácil de encontrar w2
mediante la expresión matemática.
(n1 + n 2 )(n1 + n 2 +1)
w2 = − w1
2
• Se obtiene la suma de los n1 rangos de la muestra de
menor tamaño y a esto se le denomina W1
Prueba Suma de Rangos de Wilcoxon- Mann-
Whitney
(Dos muestras independientes)

• En la práctica es poco común basarse en los estadísticos de prueba W1


y W2 y se basa la decisión en los estadísticos de prueba relacionadas en
el valor u1 de U1 y u2 de U2 o u de U que es el mínimo de U1 y U2.

n1 (n1 +1)
u1 = w 1 −
2
o
n 2 (n 2 +1)
u2 = w2 −
2
• Estos estadísticos de prueba simplifican la construcción de tabla de
valores críticos. U1 y U2 tienen distribuciones muestrales simétricas y
toman valores en el intervalo de 0 a n1n2 tal que u1+u2=n1n2.Estas
variables aleatorias tienen distribuciones idénticas, las cuales son
simétricas alrededor de (n1n2)/2
Prueba Suma de Rangos de Wilcoxon-
Mann-Whitney o Prueba U

1) H0: =  n1 (n1 +1)


U1 = w 1 −
2
3) Estadístico de Prueba:
vs
n 2 (n 2 +1)
U2 = w 2 −
2
2) H1: (  ) U  U U=Mín(U1,U2)
(  ) 4) Región Crítica U2  U 
(  ) U1  U 

Todas las pruebas basadas en U1 , U2 , o U son equivalentes a las


basadas en W1 y W2
Prueba Suma de Rangos de Wilcoxon-
Mann-Whitney

• U, U1,U2 son variables aleatorias con


n1n2
=
2
n n (n + n 2 +1)
2 = 1 2 1
12
Prueba Suma de Rangos de Wilcoxon- Mann-Whitney

Aproximación con muestras grandes

• Cuando n1 y n2 son cada una mayores a 8


• La distribución muestral de U1 o U2 o U se aproxima a la
distribución normal
nn
= 1 2
2
n n (n + n 2 +1)
2 = 1 2 1
12 Región Crítica
• Entonces    
U − 
Z=   

   − 
Pasos Prueba Suma de Rangos de
Wilcoxon- Mann-Whitney.

• Se juntan y ordenan las n1+n2 observaciones en orden de magnitud


ascendente y se les asigna rangos.
• Si dos o mas observaciones están empatadas(son idénticas, se
utiliza la media de los rangos asignados que se les hubiere asignado
si las observaciones difirieran.
• Se obtiene la suma de los n1 rangos de la muestra de menor tamaño
y a esto se le denomina W1.
• Cuando las muestras son de igual tamaño se puede escoger
cualquiera de ellas de forma aleatoria, para decidir con que datos se
obtiene W1.
• Se obtiene también la suma de los n2 rangos de la muestra de
mayor tamaño y a esto se le denomina W2.
• El total W1+W2 depende de la suma del número de observaciones
de las dos muestras y no resulta afectado por los resultados del
experimento.
Ejercicio 5

• Se encuentra que el contenido de nicotina de dos


marcas de cigarrillo, medido en miligramos, es el
siguiente:

Marca A 2.1 4.0 6.3 5.4 4..8 3.7 6.1 3.3


Marca B 4.1 0.6 3.1 2.5 4.0 6.2 1.6 2.2 1.9 5.4

• Pruebe la hipótesis, en el nivel de significancia de 0.05


de que el contenido promedio de nicotina de las dos
marcas es igual, contra la alternativa de que son
diferentes
…viene Ejercicio 5
…viene Ejercicio 5

• Conclusión:
• Existe evidencia estadística para no rechazar H0 y
concluir que no hay deferencia estadísticamente
significativa en el contenido promedio de la nicotina en
las dos marcas de cigarrillo analizadas.
Estadística Inferencial 11/01/2019
ferencial 11/01/2019
Prueba de Kruskal Wallis

• El modelo de análisis de varianza de un solo factor que visto


previamente para comparar las medias de los tratamientos de
un factor es:
• Yij =  + i + ij i=1,2,…,a y j=1,2…,ni
• En este modelo se supone que los términos de error ij tienen
una distribución normal e independiente con media cero y
varianza 2
• En el análisis de varianza se debe suponer normalidad a fin de
que la prueba F sea teóricamente correcta
• La Prueba de Kruskal Wallis es una alternativa no paramétrica
a la prueba F.
• Se requiere que las muestras tengan la misma distribución
continua para todos los niveles de factores de i=1,2,…,a.
…viene Prueba de Kruskal Wallis

• Se quiere probar la igualdad de medias en el análisis de


varianza de un factor cuando las poblaciones de las que
se toma las a muestras no son normales(las poblaciones
serían cada nivel del factor).
• Que es equivalente a contrastar la hipótesis que todos
los tratamientos tienen el mismo efecto
H0 : 1 = 2 = … = a = 0
vs
H1 : Al menos uno de los “alfas” no es cero
…viene Prueba de Kruskal Wallis

• Esta prueba también es llamada prueba H de Kruskal-


Wallis.
• Es una generalización de la prueba de las suma de los
rangos o Mann-Whitney cuando se tienen más de dos
muestras independientes en este caso esto se traduce
mas de 2 niveles del factor.
Procedimiento Prueba de Kruskal
Wallis

• Cómo en la prueba U, los datos se ordenan conjuntamente


de menor a mayor como si constituyeran una muestra.
• Esto es combinamos la n observaciones de los a niveles de
factor o muestras del factor de menor a mayor.
• Sea rij denotado por el rango o ranking de Yij en el
conjunto de rangos unidos
• Sea Ri la suma de los rangos recibidos para cada
tratamiento i: ni

R i =  rij
j=1

• Ri. es la media del rango de valores de cada tratamiento o


muestra i R
R i . = i i = 1,2,..,a
ni
Procedimiento Prueba de Kruskal
Wallis

• El Estadístico de prueba: H =
12

a R2
 i − 3(n
n(n +1) i=1 n i
+1)

• Donde n=n1+n2+…+na y a es el número de poblaciones


muestrales o niveles del factor.

• Con (1-)100% de Confianza rechace Ho a favor H1

H > χ 2
α,(a-1)
…viene Prueba de Kruskal Wallis

• En la práctica se utiliza la aproximación para muestras


grandes teniendo en cuenta:

• a=3 y ni≥6 para i=1,2,3


• a>3 y ni ≥5 para i=1,2,…,a

• Otro criterio también utilizado es que al menos cada


muestra contenga 5 observaciones o réplicas.

• Para valores menores a los mostrados previamente se


deben basar en tablas especiales.
Ejercicio 6

• Estas son tres muestras aleatorias de las calificaciones


del examen final de tres grupos de estudiantes de
ingeniería de una Escuela Politécnica a quienes se les
enseño Estadística Inferencial con tres métodos
diferentes:
• 1) Instrucción en salón de clase y laboratorio de
Estadística(Software Estadístico),
• 2) Solo instrucción en salón de clase;
• 3) Solo autoaprendizaje
Observaciones o Repeticiones en
Tipo de Método este caso Calificaciones
Primer Método 94 88 91 74 87 97
Segundo
al
Método 85 82 79 84 61 72 80
11/01/2019
Solución

H0 : 1 = 2 = … = a = 0
vs
H1 : Al menos uno de los “alfas” o efectos del tratamiento
no es cero
• Y: Calificaciones obtenidas en los exámenes
• X o factor: Tipo de método
• Niveles del factor a=3:
• Unidad experimental: Estudiantes de Ingeniería
• n1=6 n2=7 n3=5 n=18
11/01/2019
Muestras originales Muestra global ordenada Rangos
Tipo de Tipo de
calificación método calificación método rij
94 m1 61 m2 1
88 m1 67 m3 2
91 m1 69 m3 3
74 m1 72 m2 4,5
87 m1 72 m3 4,5
97 m1 74 m1 6
85 m2 76 m3 7
82 m2 79 m2 8
79 m2 80 m2 9
84 m2 82 m2 10
61 m2 84 m2 11
72 m2 85 m2 12
80 m2 87 m1 13
89 m3 88 m1 14
67 m3 89 m3 15
72 m3 91 m1 16
76 m3 94 m1 17
69
Estadística Inferencial
m3 97 m1 18
11/01/2019
…viene Ejercicio 6

• Con (1-a)100% de Confianza rechace Ho a favor H1


H > χ
2
α,(a-1)
• Decisión basada en el valor p

Siendo:  = 0.10

 = 0.05
 = 0.01
0 2 4 6
* 8 10

Esto nos lleva a un Valor p < 0.05


El mismo que proporciona evidencia estadística para rechazar la Hipótesis Nula
Estadística Inferencial
que postula que
11/01/2019 82
los efectos de los tratamientos son iguales a cero. Entonces al menos uno es estadísticamente

También podría gustarte