Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ø Introducción.
Estadística ADE/EE.
En este tema veremos:
• Contraste de Kruskal-Wallis.
Estadística ADE/EE.
En inferencia paramétrica se necesita bien suponer que la variable sigue una
distribución normal o bien que los tamaños muestrales sean lo suficientemente
grandes para poder asumir la distribución normal.
ü Son rápidos, ya que las operaciones matemáticas necesarias son ordenar, contar,
sumar y restar.
ü Tienen un campo de aplicación muy amplio, ya que las hipótesis necesarias son
muy generales y mucho menos exigentes que las de los contrastes paramétricos.
Estadística ADE/EE.
Inferencia no paramétrica para una variable
𝑁(𝑥)
𝐹# 𝑥 =
𝑛
Estadística ADE/EE.
Ejemplo
Dada la m.a.s. (3, 8, 5, 4, 5), obtener la función de distribución empírica y representarla
gráficamente.
0 1 2 3 4 5 6 7 8
Estadística ADE/EE.
El estadístico del contraste es la mayor de las diferencias en valor absoluto entre la
función de distribución empírica de los datos y la propuesta en la hipótesis nula:
𝑅𝐶 = [𝐷#,( , +∞)
Estadística ADE/EE.
𝐹$ 𝑥
𝐹& 𝑥
𝐹$ 𝑥%
𝐹$ 𝑥% − 𝐹&(𝑥% )
𝐹& 𝑥%
𝐹$ 𝑥%'( − 𝐹&(𝑥% )
𝐹$ 𝑥%'(
𝑥!"# 𝑥!
Estadística ADE/EE.
Ejemplo
Se desea contrastar si la siguiente muestra observaciones se seleccionó o no de una
normal estándar (𝑁(0,1)).
−2.46, −1.23, −0.39, −0.10, −0.02, 0.40, 0.44, 0.82, 1.39, 1.76
Las hipótesis son 𝐻$ : 𝐹 = 𝐹$ = 𝑁(0,1)
3
𝐻# : 𝐹 ≠ 𝐹$ = 𝑁(0,1)
En la siguiente tabla se obtienen los elementos necesarios para resolver el contraste
(hay que ordenar las observaciones de menor a mayor):
𝑖 𝑥% 𝐹(&(𝑥% ) 𝐹(&(𝑥%'() 𝐹&(𝑥% ) 𝐹𝟏𝟎 𝑥% − 𝐹&(𝑥% ) 𝐹𝟏𝟎 𝑥%'𝟏 − 𝐹&(𝑥% )
1 −2.46 0.1 0 0.0069 0.0931 0.0069
2 −1.23 0.2 0.1 0.1093 0.0907 0.0093
3 −0.39 0.3 0.2 0.3483 0.0483 0.1483
4 −0.10 0.4 0.3 0.4602 0.0602 0.1602
5 −0.02 0.5 0.4 0.4920 0.0080 0.0920
6 0.40 0.6 0.5 0.6554 0.0554 0.1554
7 0.44 0.7 0.6 0.6700 0.0300 0.0700
8 0.81 0.8 0.7 0.7910 0.0090 0.0910
9 1.39 0.9 0.8 0.9177 0.0177 0.1177
10 1.76 1.00 0.9 0.9608 0.0392 0.0608
Estadística ADE/EE.
Estadístico del contraste
Región crítica
No se rechaza la hipótesis nula. Podemos concluir que los datos proceden de una
distribución 𝑁(0,1).
Nota:
Para contrastar el ajuste a cualquier otra distribución, se obtendrá el valor de 𝐹! ,
usando la distribución de la variable que corresponda.
Estadística ADE/EE.
Contrastes de posición: Test de los rangos signados de Wilcoxon
Sean
𝐻! : 𝑀 ≤ 𝑀! 𝐻! : 𝑀 ≥ 𝑀! 𝐻! : 𝑀 = 𝑀!
" " "
𝐻" : 𝑀 > 𝑀! 𝐻" : 𝑀 < 𝑀! 𝐻" : 𝑀 ≠ 𝑀!
Estadística ADE/EE.
Para resolver el contraste seguimos los siguientes pasos:
𝑊 = 𝑊,
Si 𝐻0 es cierta (si 𝑀 = 𝑀! ) es lógico que 𝑊 , y 𝑊 & sean iguales (habrá igual
número a un lado que a otro del 0). Si 𝑊 , es grande (𝑊 & pequeño) la mediana
será mayor que 𝑀! y si 𝑊 , es pequeño (𝑊 & grande) la mediana será menor
que 𝑀! .
Estadística ADE/EE.
④ Para el contraste unilateral a la derecha
𝐻! : 𝑀 ≤ 𝑀!
"
𝐻" : 𝑀 > 𝑀!
𝑅. 𝐶. = [𝑊#,( , +∞)
𝑅. 𝐶. = (0, 𝑊#,"&( ]
Estadística ADE/EE.
Para el contraste bilateral
𝐻! : 𝑀 = 𝑀!
"
𝐻" : 𝑀 ≠ 𝑀!
Estadística ADE/EE.
Ejemplo
En general, la distancia mediana que alcanzan los lanzadores de peso es de 21
metros. Se está estudiando un nuevo material con el que se cree que puede aumentar
esta distancia. Se anota esta distancia para 10 lanzadores, y los resultados son
24.1 25.8 20.5 20.9 27.3 21.5 20.1 28.9 19.2 26.3
El contraste es 𝐻$ : 𝑀 ≤ 21
3
𝐻# : 𝑀 > 21
Los valores que corresponderían a los rangos 2 y 3 son los mismos (0.5), deshacemos el
empate asignando a cada uno la media de los rangos, 2.5.
Estadística ADE/EE.
Estadístico del contraste
𝑊 = 𝑊 , = i 𝑅% = 6 + 7 + 9 + 2.5 + 10 + 8 = 42.5
/%0.1!
Región crítica
Estadística ADE/EE.
Inferencia no paramétrica para dos variables
Se trata de contrastar mediante dos muestras aleatorias (𝑋1, … , 𝑋𝑚) y (𝑌1, … , 𝑌𝑛) si dos
variables aleatorias siguen la misma distribución; es decir si la variable es homogénea.
Las hipótesis son
𝐻! : 𝐹2 = 𝐹3
"
𝐻" : 𝐹2 ≠ 𝐹3
𝑅𝐶 = [𝐷4,#,( , +∞)
Estadística ADE/EE.
Ejemplo
Se observaron 12 niñas y 12 niños de 4 años durante dos sesiones de juegos de 15
minutos. Durante estos dos periodos se cuantificó el juego de cada niñ@ según su
agresividad, dándose los siguientes resultados
Contrastar la hipótesis de que hubo diferencias entre los sexos según la cantidad de
agresividad mostrada mediante el test de Kolmogorov-Smirnov.
Se trata de contrastar
𝐻! : 𝐹2 = 𝐹3
"
𝐻" : 𝐹2 ≠ 𝐹3
Estadística ADE/EE.
Calculamos el estadístico a partir de la siguiente tabla:
𝐹2,"+ (𝑥) 𝐹3,"+ (𝑥) 𝐹2,"+ 𝑥 𝐹3,"+ (𝑥)
𝑥 𝐹2,"+ (𝑥) − 𝐹3,"+ (𝑥) 𝑥 𝐹2,"+ (𝑥) − 𝐹3,"+ (𝑥)
Niños Niñas Niños Niñas
7 0 1/12 1/12 50 3/12 10/12 7/12
9 0 2/12 2/12 55 3/12 11/12 8/12
15 0 3/12 3/12 58 3/12 1 9/12
16 0 5/12 5/12 65 5/12 1 7/12
20 0 6/12 6/12 69 6/12 1 6/12
22 0 7/12 7/12 72 7/12 1 5/12
26 0 8/12 8/12 86 8/12 1 4/12
36 0 9/12 9/12 104 9/12 1 3/12
40 0 10/12 10/12 113 10/12 1 2/12
41 1/12 10/12 9/12 118 11/12 1 1/12
45 2/12 10/12 8/12 141 1 1 0
#$
Estadístico del contraste 𝐷#%,#% = 𝑚á𝑥 𝐹',#% (𝑥) − 𝐹(,#% (𝑥) =
#%
Estadística ADE/EE.
Región crítica
, = 𝑚á𝑥 𝐹
𝐻2 : 𝐹3 ≤ 𝐹4 Estadístico del contraste 𝐷4,# 2,4 (𝑥) − 𝐹3,# (𝑥)
!
𝐻5 : 𝐹3 > 𝐹4 ,
Región crítica 𝑅𝐶 = 𝐷4,#,( , +∞
&
𝐻2 : 𝐹3 ≥ 𝐹4 Estadístico del contraste 𝐷4,# = 𝑚á𝑥 𝐹3,# (𝑥) − 𝐹2,4 (𝑥)
!
𝐻5 : 𝐹3 < 𝐹4 &
Región crítica 𝑅𝐶 = 𝐷4,#,( , +∞
Estadística ADE/EE.
Contraste de U de Mann-Whitney-Wilcoxon – Comparación de medianas
Dadas dos variables aleatorias ordinales o continuas, 𝑋 e 𝑌, y dos m.a.s. (𝑋1, … , 𝑋𝑚) y
(𝑌1, … , 𝑌𝑛) se contrastan las siguientes hipótesis:
𝐻! : 𝑀2 ≤ 𝑀3 𝐻! : 𝑀2 ≥ 𝑀3 𝐻! : 𝑀2 = 𝑀3
" " "
𝐻" : 𝑀2 > 𝑀3 𝐻" : 𝑀2 < 𝑀3 𝐻" : 𝑀2 ≠ 𝑀3
Sean
1 𝑠𝑖 𝑋! < 𝑌)
𝑍!) = D 𝑖 = 1, … 𝑚; 𝑗 = 1, … 𝑛
0 𝑠𝑖 𝑋! > 𝑌)
+
M 𝑍!) = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑌) 𝑞𝑢𝑒 𝑠𝑜𝑛 𝑚𝑎𝑦𝑜𝑟𝑒𝑠 𝑞𝑢𝑒 𝑋!
!*#
𝑈 varía entre 0 (si todos los valores de 𝑋𝑖 son mayores que los 𝑌𝑗) y 𝑚×𝑛 (si todos los
𝑋𝑖 son menores que los 𝑌𝑗).
Estadística ADE/EE.
Ejemplo de cálculo del estadístico
3 4 5 6 7 8 10
𝑥 𝑥 𝑦 𝑦 𝑥 𝑦 𝑥
Entonces
𝑈 =3+3+1+0=7
𝑈 grande indica que los valores de la segunda muestra tienden a ser más grandes que
los de la primera, rechazamos 𝐻0: 𝑀𝑋 ≥ 𝑀𝑌
Si 𝑈 es pequeño los valores de la primera muestra tienden a ser más grandes que los
de la segunda y se deberá rechazar 𝐻0: 𝑀𝑋 ≤ 𝑀𝑌
Estadística ADE/EE.
Para el contraste unilateral a la derecha:
𝐻! : 𝑀2 ≤ 𝑀3
"
𝐻" : 𝑀2 > 𝑀3
la región crítica es
𝑅𝐶 = (−∞, 𝑈4,#,"&( ]
𝐻! : 𝑀2 ≥ 𝑀3
"
𝐻" : 𝑀2 < 𝑀3
la región crítica es
𝑅𝐶 = [𝑈4,#,( , +∞)
la región crítica es
𝑅𝐶 = (−∞, 𝑈4,#,"&(∕+ ] ∪ [𝑈4,#,(∕+ , +∞)
Estadística ADE/EE.
Ejemplo
Se quiere averiguar si el número de horas que dedican los estudiantes a estudiar las
asignaturas de Economía Española y Estadística son las mismas. Los datos son los
siguientes:
Economía Española (𝑋) Estadística (𝑌)
10 13
6 17
8 14
10 12
12 10
13 9
11 15
9 16
5 11
11
El contraste es
𝐻! : 𝑀2 = 𝑀3
"
𝐻" : 𝑀2 ≠ 𝑀3
Estadística ADE/EE.
Estadístico del contraste
𝑚 = 10, 𝑛 = 9, 𝛼 = 0.1
6 6 8 9 9 10 10 10 11 11 11 12 12 13 13 14 15 16 17
𝑥 𝑥 𝑥 𝑥 𝑦 𝑥 𝑥 𝑦 𝑥 𝑥 𝑦 𝑥 𝑦 𝑥 𝑦 𝑦 𝑦 𝑦 𝑦
𝑈 = 9 + 9 + 9 + 8 + 7 + 7 + 6 + 6 + 5 + 4 = 70
Región crítica
𝑈"!,7,!.!* = 65
⇒ 𝑅. 𝐶. = 0,25 ∪ [65, +∞)
𝑈"!,7,!.7* = 𝑚 w 𝑛 − 𝑈"!,7,!.!* = 10 w 9 − 65 = 25
Estadística ADE/EE.
Inferencia no paramétrica para dos variables dependientes
El problema del contraste en muestras apareadas se resuelve de forma similar a como
se hizo en el caso paramétrico; es decir trabajando con la muestra obtenida como la
diferencia entre las muestras de ambas poblaciones. Posteriormente utilizaremos el
contraste de los rangos signados de Wilcoxon para resolver el problema.
Ejemplo
Un fabricante de alubias precocinadas está considerando una nueva receta para la
salsa utilizada en su producto. Elige una muestra aleatoria de 8 individuos y a cada uno
de ellos le pide que valore en una escala de 1 a 10 el sabor del producto original y el
del nuevo producto. Los resultados son
Individuo 1 2 3 4 5 6 7 8
Producto Original (𝑋) 6 4 5 8 3 6 7 5
Producto Nuevo (𝑌) 8 9 4 7 9 9 7 9
𝐻! : 𝑀8 ≥ 0 (𝑀9 ≥ 𝑀: )
", 𝐷 =𝑋−𝑌
𝐻" : 𝑀8 < 0 (𝑀9 < 𝑀: )
Estadística ADE/EE.
Estadístico del contraste
Individuo 1 2 3 4 5 6 7 8
Producto Original (𝑋) 6 4 5 8 3 6 7 5
Producto Nuevo (𝑌) 8 9 4 7 9 9 7 9
𝑑% −2 −5 1 1 −6 −3 0 −4
𝑑% − 0 2 5 1 1 6 3 0 4
Rango 3 6 1.5 1.5 7 4 5
Signo − − + + − − −
𝑠𝑢𝑚𝑎 𝑑𝑒 𝑟𝑎𝑛𝑔𝑜𝑠 𝑑𝑒
𝑊 = 𝑊, = = 1.5 + 1.5 = 3
𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎𝑠 > 0
Región crítica
En la tabla obtenemos que para 𝑛 = 7 y 𝛼 = 0.05 es 𝑊;,!.!* = 24. Entonces,
𝑛 w (𝑛 + 1) 7w8
𝑊;,!.7* = − 𝑊;,!.!* = − 24 = 28 − 24 = 4 ⇒ 𝑅. 𝐶. = 0, 𝑊#,"&( = (0,4]
2 2
Como el valor del estadístico es menor que 4, se rechaza la hipótesis nula. Los
consumidores prefieren el nuevo producto.
Estadística ADE/EE.
Independencia entre dos variables
Contraste del coeficiente de correlación τ de Kendall
El coeficiente de la 𝜏 de Kendall mide la asociación entre dos variables ordinales o
continuas.
Sean (𝑥1, … , 𝑥𝑛) e (𝑦1, … , 𝑦𝑛) las observaciones correspondientes a dos variables X e Y.
La asociación es positiva (pares concordantes, 𝑁< ) cuando
𝑥% < 𝑥6 𝑦 𝑦% < 𝑦6
ó
𝑥% > 𝑥6 𝑦 𝑦% > 𝑦6
𝑥% < 𝑥6 𝑦 𝑦% > 𝑦6
ó
𝑥% > 𝑥6 𝑦 𝑦% < 𝑦6
Estadística ADE/EE.
El numero total de parejas que se pueden formar con las observaciones es
𝑛 𝑛(𝑛 − 1)
𝑁𝑃 = =
2 2
Ejemplo
Se tiene una muestra de parejas de jóvenes con la siguiente distribución de alturas
Pareja 1 2 3 4 5 6 7 8 9 10
Hombre 80 70 73 72 62 65 74 71 63 64
Mujer 72 60 76 62 63 46 68 71 61 65
𝑛(𝑛 − 1) 10 w 9
𝑁𝑃 = = = 45
2 2
Estadística ADE/EE.
Obtención del número de pares concordantes, NC:
Se asigna a cada observación de cada muestra (por separado) el rango
correspondiente
Pareja 1 2 3 4 5 6 7 8 9 10
Hombre 80 70 73 72 62 65 74 71 63 64
Rango 10 5 8 7 1 4 9 6 2 3
Mujer 72 60 76 62 63 46 68 71 61 65
Rango 9 2 10 4 5 1 7 8 3 6
(1,5) (2,3) (3,6) (4,1) (5,2) (6,8) (7,4) (8,10) (9,7) (10,9)
Estadística ADE/EE.
(1,5) (2,3) (3,6) (4,1) (5,2) (6,8) (7,4) (8,10) (9,7) (10,9)
Luego
𝑁𝐶 = 5 + 6 + 4 + 6 + 5 + 2 + 3 + 0 + 1 = 32
𝑁8 = 4 + 2 + 3 + 2 + 2 = 13
Estadística ADE/EE.
Contraste
𝐻0: 𝐿𝑎𝑠 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑠𝑜𝑛 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒𝑠
"
𝐻1: 𝐿𝑎𝑠 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑛𝑜 𝑠𝑜𝑛 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒𝑠
Para el ejemplo:
𝑆 = 𝑁< − 𝑁8 = 32 − 13 = 19
No se rechaza la hipótesis de independencia. Las alturas entre los hombres y mujeres que
forman cada pareja son independientes.
Estadística ADE/EE.
Inferencia no paramétrica para varias variables: Contraste de Kruskall-Wallis
El procedimiento es el siguiente:
① Ordenar de menor a mayor los datos combinados de todas las variables mezclados.
Estadística ADE/EE.
④ Obtener el número de grupos de datos empatados, 𝑚
⑤ Calcular
>
1 12 𝑅%+
𝐻= i − 3(𝑛 + 1)
𝐿 𝑛(𝑛 + 1) 𝑛%
%5"
donde
𝑘 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑒𝑠
𝑛% = 𝑡𝑎𝑚𝑎ñ𝑜 𝑚𝑢𝑒𝑠𝑡𝑎𝑙 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑖
𝑛 = 𝑡𝑎𝑚𝑎ñ𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 𝑡𝑜𝑡𝑎𝑙: 𝑛 = 𝑛" + ⋯ + 𝑛>
y
4
1
𝐿 =1− ? i 𝐿?% − 𝐿%
𝑛 −𝑛
%5"
+
La región crítica es 𝑅𝐶 = [𝜒>&",( , +∞)
Estadística ADE/EE.
Comparaciones múltiples
𝐻! : 𝑀% = 𝑀6
" para todo i ≠ 𝑗; 𝑖, 𝑗 = 1, … 𝑘
𝐻" : 𝑀% ≠ 𝑀6
𝑅𝐶 = [𝑍(∕@ , +∞),
Estadística ADE/EE.
Ejemplo
Una compañía quiere comparar cinco estrategias de venta diferentes en sus tiendas.
Aplica a cada tienda una estrategia distinta durante un mes. Los datos corresponden
a las ventas mensuales en cada establecimiento en miles de euros.
Estadística ADE/EE.
Calculamos el valor de 𝐿: 𝑚 = 2, 𝐿" = 2 , 𝐿+ = 2
4
1 1 12
𝐿 =1− ? i 𝐿?% − 𝐿% = 1 − ? 2? − 2 + 2? − 2 =1− = 0.9996
𝑛 −𝑛 31 − 31 29760
%5"
/
𝑅!%
Estadístico del contraste M = 9754
𝑛!
!*#
>
1 12 𝑅%+ 1 12
𝐻= i − 3(𝑛 + 1) = 9754 − 3 w 32 = 22
𝐿 𝑛(𝑛 + 1) 𝑛% 0.9996 31 w 32
%5"
Región crítica
+ +
𝑅𝐶 = 𝜒>&",( , +∞ = 𝜒A,!.!* , +∞ = 9.487, +∞
Estadística ADE/EE.
𝛼
Comparaciones múltiples Nº de comparaciones 𝑐 = 10 ⇒ 𝛼 = 0.05 ⇒ = 0.005
𝑐
𝑅% 𝑅6
𝑛% − 𝑛6 Tienda 𝑛% 1 ∕ 𝑛% 𝑅% 𝑅% ∕ 𝑛%
𝑇%6 =
1 5 0,2 31 6,2
𝑛(𝑛 + 1) 1 1
𝐿 12 𝑛% + 𝑛6 2 6 0,1667 37.5 6,25
57.!7 3 6 0,1667 99 16,5
4 7 0,1429 158.5 22,643
Comparación Estadístico Conclusión 5 7 0,1429 170 24,286
𝐻! : 𝑀" = 𝑀+ 0.0091 No significativo
𝐻! : 𝑀" = 𝑀? 1.8712 No significativo
𝐻! : 𝑀" = 𝑀A 3.0892 Significativo
𝐻! : 𝑀" = 𝑀* 3.3978 Significativo 𝐸# 𝐸% 𝐸0 𝐸1 𝐸2
𝐻! : 𝑀+ = 𝑀? 1.9530 No significativo
𝐻! : 𝑀+ = 𝑀A 3.2414 Significativo
𝐻! : 𝑀+ = 𝑀* 3.5662 Significativo No hay ninguna estrategia
𝐻! : 𝑀? = 𝑀A 1.2146 No significativo de venta que sea mejor ni
𝐻! : 𝑀? = 𝑀* 1.5395 No significativo peor que las demás.
𝐻! : 𝑀A = 𝑀* 0.3381 No significativo
Estadística ADE/EE.
Contrastes no paramétricos para una variable
Estadística ADE/EE.
Contrastes no paramétricos para varias variables
Ri R j
−
Comparaciones ni n j ⎛ ⎞
H 0 : M i = M j ; i, j = 1,…,k T= [Zα /C ,+∞); C = ⎜ k ⎟
Múltiples ⎝ 2 ⎠
n(n + 1) 1 1
L +
12 ni n j
Estadística ADE/EE.