Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA INFERENCIAL
PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS
INTRODUCCIÓN Y
CONCEPTOS BÁSICOS
PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS
CLASIFICACIÓN DE LA ESTADÍSTICA INFERENCIAL
Estadística Inferencial
4
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
INTRODUCCIÓN: CONCEPTO
Suponen normalidad en la
población y requieren estimar
parámetros
H0: = Valor
H1: Valor
21
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
DETERMINACIÓN DEL TAMAÑO DE MUESTRA
Uno de los aspectos a resolver, antes de realizar la
prueba, es determinar el tamaño de muestra, esto es
importante ya que:
a) A mayor tamaño de muestra menores serán las
probabilidades de error Tipo I y de error Tipo II.
b) A mayor tamaño de muestra mayor será el costo
de la misma.
Para conciliar estos aspectos antagónicos, se debe elegir
el menor tamaño de muestra que permita los niveles de
error mas bajos.
Las curvas OC son una alternativa para poder hacer esto,
no siempre es necesario construirlas ya que en algunas
fuentes bibliográficas existen curvas estandarizadas que
facilitan este proceso.
22
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
OBTENCIÓN DE DATOS Y ESTABLECIMIENTO DE CONCLUSIONES
Como en todas las técnicas de estadística inferencial, una
de las condiciones para que las conclusiones sean válidas
al nivel de precisión estadística que se estableció, es decir
los valores de las probabilidades de error Tipo I y de error
Tipo II, es que los datos se obtengan aleatoriamente.
La técnica de muestreo probabilístico que se utilizará, en
una prueba en particular, depende de las características de
la población que se esté analizando, de los recursos
técnicos y económicos con los que se cuente y sobre todo
de la experiencia del responsable de la realización del
trabajo.
Lo adecuado de la técnica seleccionada, del número y
calidad de los datos, así como de la experiencia de los
involucrados, serán los factores que permitan tener éxito
en su realización.
23
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
INTRODUCCIÓN: TÉCNICA DE LA PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS
PARA UN PARÁMETRO
PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS PARA LA MEDIA (MUESTRA GRANDE)
1) Planteamiento de la Hipótesis
:· Se rechaza Ho
28
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS PARA LA MEDIA (EJEMPLO 1)
Otra alternativa para tomar la decisión acerca de una prueba
de hipótesis, es el cálculo del llamado Valor P (P Value). Este
valor representa la probabilidad de estar cometiendo error Tipo
I en base a la muestra obtenida. Si esta probabilidad es menor
que el nivel de significancia preestablecido: α, H0 se puede
rechazar.
P= DISTR.NORM.ESTAND(-2.436) =0.0074
P(Z<-2.436) = 0.0074
= 0.02 :· Se rechaza Ho
29
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS PARA LA MEDIA (EJEMPLO 1)
Una alternativa mas, para tomar la decisión acerca de una
prueba de hipótesis, puede hacerse a partir de comparar el
estimador obtenido de la muestra contra el intervalo de
confianza del parámetro bajo análisis. Si el estimador cae
fuera de dicho intervalo esto permitiría concluir que se puede
rechazar H0. s
X - Z m = 1-
Ho: m ≥ 5.6 n
H1: m < 5.6 -Z0.02= DISTR.NORM.ESTAND.INV(0.02) =-2.054
1.7
5.6 - 2.054 m = 0.98
35
(5.01 m ) = 0.98
X = 4.9
:· Se rechaza Ho
30
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS PARA LA MEDIA (EJEMPLO 2)
Para verificar si los equipos a las que se les ha dado
mantenimiento han cambiado su desempeño inicial en el que
al ejecutar una cierta operación tardaba 45 segundos, se han
elegido 40 equipos mediante un muestreo aleatorio simple, el
cual ha dado como resultado un tiempo medio de 47 segundos
con una desviación estándar de 5. Se quiere un nivel de
significancia del 1%.
Ho: m = 45 Zona Crítica: |Z| > Z/2 Zona Crítica: P<
H1: m ≠ 45 Z/2 = Z0.01/2 = Z0.005 = 2.576 Z=
X - m0 47 - 45
=
s = 2.53
DISTR.NORM.ESTAND.INV(0.005)=2.576 5 40
n
DISTR.NORM.ESTAND.N(-2.53,1)*2=0.0114
One-Sample Z
Test of mu = 45 vs not = 45
The assumed standard deviation = 5 :· No se rechaza Ho
N Mean SE Mean 99% CI Z P
40 47.0000 0.7906 (44.9636, 49.0364) 2.53 0.011
31
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS PARA LA MEDIA: CÁLCULO DE BETA
Si al concluir una prueba de hipótesis, esta no rechaza H0, es
importante examinar la probabilidad del error tipo II:
β = P(Error Tipo II) = P(No rechazar Ho/Ho es falsa)
Para calcular β se debe tener una hipótesis alternativa específica;
esto es, debe tenerse un valor particular del parámetro. Por
ejemplo, supóngase que es importante rechazar la hipótesis nula
Ho: μ = 50 si la rapidez promedio de combustión es μ > 52 cm/s o
es μ < 48 cm/s.
Ahora puede responderse a ¿Cómo trabajará el procedimiento de
prueba si se desea rechazar Ho, para un valor medio de μ = 52 o
de μ = 48. Dada la simetría, sólo es necesario evaluar uno de los
dos casos. Suponiéndose que se desea evaluar para un tamaño
de muestra de 10, con una desviación estándar de la población de
2.5 cm/s y un nivel de significancia de 0.06.
Ho: μ = 50
H1: μ ≠ 50 32
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS PARA LA MEDIA: CÁLCULO DE BETA
Z / 2s
XL = m
n
Z (2.5) (1.88)(2.5)
= 50 0.03 = 50
10 10
= 50 1.487 = (48.513 m 51.487)
Datos:
μ = 70
σ = 8.9 Hipótesis:
Ẋ = 71.8 H0: μ = 70
N = 100 H1: μ > 70
α = .05
Entre más se
Z / 2s
XL = m
n
aleja el valor
verdadero de la
media del valor
de H0, menor es
, para un
tamaño de
muestra y nivel
de significancia
dadas.
35
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS PARA LA MEDIA: CURVA OC
Si se grafican todas las probabilidades de no rechazar H0
calculadas para diferentes valores de m, se obtiene la curva
OC para la prueba.
36
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS PARA LA MEDIA: CURVA OC
En algunos libros de estadística existen curvas OC para
diferentes tamaños de muestra para algunos a, los mas
comunes son α = 0.05 y α = 0.01.
Para poder utilizar las curvas se define un parámetro
llamado d, que estandariza para cualquier valor de μ y σ:
m - m0
d= =
s s
Si se quisiera consultar en una gráfica de curvas OC,
¿Cuál es la probabilidad de cometer el error tipo II
o β cuando la media verdadera es de 72?, se tendría que
calcular d y buscar en las curvas la que pertenezca a un
tamaño de muestra de 100 con un α = 0.05:
37
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS PARA LA MEDIA: CURVA OC
Si en la gráfica de la curva OC anteriormente obtenida, se
cambian en el eje X los valores de las m por sus equivalentes
de d, se tendría:
38
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS PARA LA MEDIA: CURVA OC
Z s
=
n
-d
Z0 =
s
n
= P( Z Z 0 )
39
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS PARA LA MEDIA: CURVA OC
Para obtener el tamaño de muestra óptimo, primero se debe
encontrar la gráfica que corresponda al parámetro, al nivel de
significancia establecido y al tipo de prueba que se desea
realizar. Posteriormente se busca la curva mas cercana a la
intersección de los valores de y d.
Suponiendo que se desea
hallar el tamaño de muestra
óptimo para una prueba
bilateral con: =0.01, =60% y
d=1.
La curvas mas cercanas son
n=4 y n=5, generalmente se
elige la de mayor tamaño ya
que por la propiedad de
consistencia mejora el nivel de
estimación. 40
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS PARA LA MEDIA: CURVA OC
44
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS PARA LA VARIANZA
1) Planeamiento de la Hipótesis
Bilateral Unilateral Superior Unilateral Inferior
H0: s2 = s20 H0: s2 ≤ s20 H0: s2 ≥ s20
H1: s2 ≠ s20 H1: s2 > s20 H1: s2 < s20
2) Estadístico de Prueba 3) Elegir / Zona Crítica
(n - 1) S 2
2 2 2 2
Bilateral: - ó - 2, n -1
=
0 2, n 1 0 1
2
Un Parámetro
02 2 ,n -1
0
s 2
0
Unilateral Superior:
Unilateral Inferior: 02 12- ,n -1
Su uso es semejante a
las de la media, pero
para la varianza el
parámetro que se utiliza
es l: s
l=
s0
46
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS PARA LA VARIANZA (EJEMPLO 5)
El supervisor sospecha que la línea está saliéndose de
control, por lo que obtiene una muestra sistemática de 26
empaques de donde obtiene que la desviación estándar es de
1.25 kg, ¿Cuál es la conclusión a un nivel de significancia de
4%?, si se sabe que el valor establecido para el proceso es de
1.1 kg. N Desv.Est. Varianza
26 1.25 1.56
s2
Ho: ≤ 1.21 96% Intervalos de confianza unilaterales
H1: s2 > 1.21 Límite Límite
inferior inferior
para para
Zona Crítica: Método Desv.Est. varianza
Chi-cuadrada 1.01 1.01
2 > 2, n-1
Pruebas
=PRUEBA.CHI.INV(0.04,25)=38.642 Estadística
Método de prueba GL Valor p
2 0.04, 25 = 38.642 Chi-cuadrada 32.28 25 0.150
(n - 1) S 2 (26 - 1)(1.25) 2
=
2
=
2
= 32.283 :· No Se rechaza Ho
0
s 02 0
1.21
47
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS PARA LA PROPORCIÓN
1) Planeamiento de la Hipótesis
Bilateral Unilateral Superior Unilateral Inferior
H0: p = p 0 H0: p ≤ p 0 H0: p ≥ p 0
H1: p ≠ p 0 H1: p > p 0 H1: p < p 0
𝑝ො − 𝑝0 Bilateral: | Z | > |Z /2 |
𝑍=
Un Parámetro 𝑝0 1 − 𝑝0 Unilateral Superior: Z > Z
𝑛
Unilateral Inferior: Z < -Z
:· No Se rechaza Ho
49
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
Actividades Recomendadas
• PRÁCTICAS:
o EI-PH-01, Prueba de Hipótesis para la media, muestra grande
o EI-PH-02, Prueba de Hipótesis para la media, muestra pequeña
o EI-PH-03, Prueba de Hipótesis para la Varianza
o EI-PH-04, Prueba de Hipótesis para la Proporción
PRUEBA DE HIPÓTESIS
PARA DOS PARÁMETROS
PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS PARA LAS m1-m2 MUESTRAS GRANDES
Z=
( X 1 - X 2 ) - ( m1 - m2 ) Bilateral: | Z | > | Z /2 |
Dos
Parámetros s 12 s 22 Unilateral Superior: Z > Z
+
n1 n2 Unilateral Inferior: Z < -Z
54
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
55
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS PARA LAS m1-m2, MUESTRAS PEQUEÑAS
Bilateral Unilateral Superior Unilateral Inferior
H0: m1 = m2 H0: m1 ≤ m2 H0: m1 ≥ m2
H1: m1 ≠ m2 H1: m1 > m2 H1: m1 < m2
Dos Parámetros t= 1
Unilateral Superior: t > t , n + n -2
1 1
+
1 2
Sp
n1 n2 Unilateral Inferior: t < - t , n + n -2 1 2
Error
estándar
de la
N Media Desv.Est. media
ConTratamiento 5 2.86 1.97 0.88
SinTratamiento 4 2.07 1.17 0.58
58
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
59
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
60
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS PARA LAS VARIANZAS
2 Bilateral: F0 F 2, n -1 ó F0 F1- 2, n -1
S
Dos Parámetros F= 1
2
Unilateral Superior: F F ,n -1,n -1 1 2
1-DISTR.F(2.04,24,19)=0.9416
Método
Hipótesis nula σ(Primero) / σ(Segundo) = 1
Hipótesis alterna σ(Primero) / σ(Segundo) < 1
Nivel de significancia α = 0.05
Estadísticas
Límite superior
de 95% para
Muestra N Desv.Est. Varianza Desv.Est.
Primero 25 1.020 1.040 1.343
Segundo 20 0.714 0.510 0.979
Pruebas
Estadística
Método GL1 GL2 de prueba Valor p
F 24 19 2.04 0.941
63
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
El parámetro para
obtenerlas es semejante
al de la prueba 2
64
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS PARA LAS PROPORCIONES
Bilateral Unilateral Superior Unilateral Inferior
H0: p1 = p2 H0: p1 ≤ p2 H0: p1 ≥ p2
H1: p1 ≠ p2 H1: p1 > p2 H1: p1 < p2
( p1 - p2 ) - (p 1 - p 2 ) (0.8433 - 0.6533) - 0
Z= = = 5.36
1 1 1 1
pq + (0.7483)(0.2517) +
n1 n2 300 300
Puesto que 5.36 > 2.575, se rechaza la hipótesis nula y se concluye con un
nivel de significancia de 0.01 que los dos fluidos para pulir son diferentes.
66
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
EJERCICIOS
Datos:
p1= 253/300= 0.8433
p2 = 196/300= 0.6533
n1=n2 = 300
Prueba de hipótesis:
Ho; p1-p2 = 0
H1; p1-p2 ≠ 0
67
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS PARA MUESTRAS APAREADAS
Bilateral: | t | > |
t /2, n-1 |
Dos Parámetros Unilateral Superior: t > t , n-1
Unilateral Inferior: t < - t , n-1
Ensayo de hipótesis
H0: µD = 0
H1: µD ≠ 0
2
𝑛 2
σ2𝑗=1 𝐷𝑗 −1 2
Puesto que -2.365 ≤ -0.284 ≤ 2.365,
σ𝑗=1 𝐷𝑗 − 11 −
𝑆𝐷2 = 𝑛 = 8 = 1.55 no se puede rechazar la hipótesis
𝑛−1 7 nula y se concluye con un nivel de
𝑑ҧ −0.125 significancia de 0.05 que las dos
𝑡= = = −0.284
𝑆𝐷 2 1.55 puntas producen las mismas lecturas
8 de dureza media.
𝑛
69
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
EJERCICIOS
Ensayo de hipótesis
H0: µD = 0
H1: µD ≠ 0
Paired T for C1 - C2
N Mean StDev SE Mean
C1 8 3.12500 0.83452 0.29505
C2 8 3.25000 1.03510 0.36596
Difference 8 -0.125000 1.246423 0.440677
T-Test of mean difference = 0 (vs not = 0): T-Value = -0.28 P-Value = 0.785
70
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
EJERCICIOS
71
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA DE DISTRIBUCIÓN
LIBRE
PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS
PRUEBAS DE DISTRIBUCIÓN LIBRE
(Oi - Ei ) 2
k
=
2
2 ,k - p -1 Dado que se cumple la zona crítica,
Ei se rechaza Ho, los datos no siguen
i =1
una distribución normal.
75
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA DE BONDAD DE AJUSTE: EJEMPLO
Realice un análisis para los siguientes datos Máximo=9.77
Mínimo=4.66
8.51 7.82 9.77 8.02 5.82 4.66 7.96 5.71 7.12 6.95
Rango=5.11
7.10 6.63 6.51 7.20 8.07 7.85 7.84 7.86 7.62 8.74
Media=7.364
8.05 7.03 6.67 7.50 7.80 5.39 8.52 6.26 7.11 7.62
Desv. Estd.=1.104
8.86 7.06 6.37 5.51 6.75 5.98 7.18 6.57 5.92 9.35
Intervalo=0.730
8.91 7.37 7.58 9.01 5.46 5.86 7.29 8.75 5.99 6.71
6.08 9.14 8.36 6.91 7.23 6.44 6.76 6.47 6.78 6.89 40
9.11 7.58 8.72 7.53 6.84 7.36 8.90 5.66 7.21 8.50 30
Valores
6.68 8.33 6.27 6.44 4.90 6.92 6.93 7.28 9.26 8.11 20 esperados
Valores
8.25 7.19 7.10 8.05 7.04 6.80 9.70 7.44 8.95 9.25 10 observados
7.57 6.90 9.64 6.13 7.55 8.33 7.33 7.25 7.66 6.53 0
4 9
Límites reales Límites f F Valores estandarizados Probabilidad Ei JI((O-E)^2/E)
4.625 5.365 4.63 5.36 2 2 -2.481 -1.811 0.0065 0.0351 2.8539 0.25550
5.365 6.105 5.37 6.10 11 13 -1.811 -1.140 0.0351 0.1270 9.1959 0.35394
6.105 6.845 6.11 6.84 18 31 -1.140 -0.470 0.1270 0.3191 19.2076 0.07592
6.845 7.585 6.85 7.58 30 61 -0.470 0.200 0.3191 0.5793 26.0197 0.60887
7.585 8.325 7.59 8.32 17 78 0.200 0.870 0.5793 0.8080 22.8656 1.50467
8.325 9.065 8.33 9.06 14 92 0.870 1.541 0.8080 0.9383 13.0338 0.07163
9.065 9.805 9.07 9.80 8 100 1.541 2.211 0.9383 0.9865 4.8171 2.10307
Ji calculado 4.97359
9.488
Dado que no se cumple la zona crítica con =5%, no se Ji tablas=
7.815
rechaza Ho, los datos siguen una distribución normal.
76
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA DE BONDAD DE AJUSTE: EJEMPLO
Realice un análisis para los siguientes datos Máximo=33.95
8.35 4.42 3.88 4.14 2.83 8.41 10.07 1.62 3.04 1.89 Mínimo=0.39
4.18 4.12 3.14 9.51 0.79 4.32 2.69 1.58 1.41 6.57 Rango=33.56
6.48 6.34 0.43 15.30 4.04 2.90 7.94 17.95 2.86 1.69 Media=8.41
15.56 4.93 10.06 0.43 20.07 1.89 16.09 1.06 8.00 9.11 Desv. Estd.=7.9835
2.83 2.76 13.36 11.85 13.69 15.16 5.47 7.20 4.13 20.80
50
9.76 6.98 17.98 3.26 8.80 0.84 19.25 2.13 0.65 0.98
40 Valores
6.55 3.47 18.56 3.18 33.28 8.22 5.75 7.42 3.64 32.31
30 esperados
5.48 6.14 23.10 5.43 4.95 8.64 14.98 1.25 0.50 10.92
8.78 0.39 8.25 9.22 3.25 25.67 3.29 4.43 1.90 1.30 20
Valores
1.32 32.92 14.05 8.72 33.95 3.47 5.73 27.90 12.50 22.11 10 observado
s
0
0 20 40
Límites reales
0.365 5.165
Límites
0.37 5.16
f
46
F
46
Prob.
0.4589
Ei
45.8900
JI((O-E)^2/E)
0.000
Dado que no se
5.165 9.965 5.17 9.96 27 73 0.2353 23.5300 0.512 cumple la zona
9.965 14.765
14.765 19.565
9.97 14.76
14.77 19.56
8
9
81
90
0.133
0.0752
13.3000
7.5200
2.112
0.291 crítica con =5%, no
19.565 24.365
24.365 29.165
19.57 24.36
24.37 29.16
4
2
94
96
0.0424
0.024
4.2400
2.4000
0.014
0.067
se puede rechaza
29.165 33.965 29.17 33.96 4 100 0.0312 3.1200 0.248 Ho, los datos siguen
0 1 Ji calculado 3.244
11.07 una distribución
ji de tablas= 9.49
7.81
exponencial.
77
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA DE BONDAD DE AJUSTE: EJEMPLO
Se considera hipotéticamente que el número de fallas por turno de
telares en una fábrica de tejidos sigue una distribución Poisson.
Se han obtenido los siguientes datos:
No. de fallas Frec. Observada
0 32
No. de fallas Prob. Frec. esperada
1 15
0 0.472 28.32
2 9
1 0.354 21.24
3 4
2 0.133 7.96
3 0.033 1.98
i =1 j =1 Eij
5. Comparar el estadístico de prueba contra el valor en
tablas, siendo la zona crítica: 2
2
,( r -1)( c -1)
79
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
TABLAS DE CONTINGENCIA
La tabla de datos, llamada Tabla de Contingencia debe ser:
1 2 ⋯ c Total La probabilidad marginal
1 O11 O12 ⋯ O1c O1. será:
2 O21 O22 ⋯ O2c O2. •Renglones: Pi = Oi· / O··
⋮ ⋮ ⋮ ⋮ ⋮ •Columnas : Pj = O·j / O··
r Or1 Or2 ⋯ Orc Or.
La probabilidad conjunta
Total O.1 O.2 ⋯ O.c O..
será: Pij = Pi * Pj
De donde el valor esperado se obtiene mediante:
1 2 ⋯ c
1 E11 E12 ⋯ E1c
Oi. O. j Oi.O. j
E ij = nPij = n Pi Pj = n = 2 E21 E22 ⋯ E2c
n n n
⋮ ⋮ ⋮ ⋮
r Er1 Er2 ⋯ Erc
80
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
TABLAS DE CONTINGENCIA: EJEMPLO
2 =
r c (O ij - Eij )
2
= 2.6814
Dado que no se cumple la zona
Eij crítica no se puede rechazar Ho,
i =1 j =1
los datos son independientes.
81
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
TABLAS DE CONTINGENCIA: EJERCICIO
Número de Hijos
Educación 0 a 1 2a3 más de 3
Primaria 14 37 32
Secundaria 19 42 17
Universitaria 12 17 10
r
2 =
c (O
ij - Eij )
2
2 2 ,( r -1)( c -1)
i =1 j =1 Eij
82
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
Actividades Recomendadas
PRUEBA DE HIPÓTESIS
NO PARAMÉTRICAS
PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS
PRUEBA NO PARAMÉTRICAS
Como lo sugiere su nombre, no estiman parámetros para obtener el
estadístico de prueba, lo hacen observando alguna característica que se
comporta de manera análoga al parámetro que se está estimando.
Dentro de estas existe un gran número, algunas de las mas importantes
son:
• La prueba de Wilcoxon para muestras independientes, para probar
diferencia de medias
• La prueba de corrida o de rachas , para probar aleatoriedad
• La prueba de Kolmogorov-Smirnov, para probar si los datos siguen
una cierta función de densidad.
• La prueba de Kruskal-Wallis, para probar si k muestras provienen
de la misma población , etc.
85
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA DE WILCOXON PARA MUESTRAS INDEPENDIENTES
Permite probar si las medias de dos poblaciones que no son
normales son iguales entre si, utilizando muestras extraídas de
manera independiente de cada una de ellas. En caso de que sean
de tamaño diferente se considera que n1<n2.
Técnica
1. Ordenar en forma ascendente las n1+ n2 observaciones, sin
importar de que muestra sean pero manteniendo identificado a
cual pertenece cada dato.
2. Asignarle a cada dato su ordinal iniciando en 1 y promediando
los ordinales de aquellos valores que sean iguales.
3. Obtener la suma de los ordinales de cada muestra, los que se
representan por R1 y R2 y obteniendo R=min(R1, R2)
4. Se concluye comparando R con el valor R* , que se obtiene
de tablas especiales calculadas por Wilcoxon, siendo la zona
crítica: R < R*
86
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA NO PARAMÉTRICAS: TABLA DE WILCOXON 2 MUESTRAS
87
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA NO PARAMÉTRICAS: EJEMPLO WILCOXON
Al comparar los aciertos obtenidos por dos grupos diferentes de
alumnos, seleccionados al azar, se obtuvieron los siguientes datos,
¿Cuál es la conclusión final utilizando Wilcoxon?
Pob. Valor Ordinal Ajuste
1 15.3 1 1
Aciertos Promedio
Grupos 1 2 2 15.4 2 2
17.6 16.8 1 15.9 3 3
19.4 20.0 2 16 4 4
19.5 18.2 1 16.3 5 5
17.1 16.4 2 16.4 6 6
15.3 16.0 2 16.4 7 7 R1 158.5
15.9 15.4 2 16.5 8 8 R2 141.5
16.3 16.5 2 16.7 9 9
18.4 18.0 2 16.8 10 10 mínimo 141.5
17.3 16.4 1 17.1 11 11
19.1 20.1 1 17.3 12 12 Tablas 115
17.8 16.7 1 17.6 13 13
18.2 17.9 1 17.8 14 14
2 17.9 15 15
2 18 16 16
1 18.2 17 17.5
Cuando Rmin < R*0.05 se rechaza H0 2 18.2 18 17.5
1 18.4 19 19
1 19.1 20 20
Para el problema esto no se cumple, no 1 19.4 21 21
1 19.5 22 22
puede rechazarse H0 las medias son 2 20 23 23
iguales. 2 20.1 24 24
88
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA NO PARAMÉTRICA: PRUEBA DEL SIGNO
Se aplica a observaciones por pares extraídas de
poblaciones continuas. Sea (X1j, X2j), j = 1,2,…, n un conjunto
de observaciones por pares, y sean Dj = X1j – X2j, j = 1,2,…,n
las diferencias para cada par. La hipótesis que se desea
probar es que las diferencias Dj tienen una distribución
probabilística con mediana cero.
Técnica
1.Para cada diferencia Dj se registra el signo de la diferencia.
2.Calcule R+ como el número de signos positivos y R- como
el número de signos negativos.
3.Obtener R = min (R+, R-), cuando ocurran empates, se
elimina la diferencia, se reduce en uno n y la prueba se
aplicará al resto de los datos.
4.Se concluye comparando R con el valor R*, que se
obtiene de tablas, siendo la zona crítica: R < R* 89
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA NO PARAMÉTRICA: TABLA DE LA PRUEBA DEL SIGNO
91
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA NO PARAMÉTRICA: WILCOXON DE RANGO CON SIGNO
92
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA NO PARAMÉTRICA: TABLA DE RANGO CON SIGNO
α Prueba Unilateral
0.025 0.01 0.005
n
α Prueba Bilateral
0.05 0.02 0.01
6 0 -- --
7 2 0 --
8 4 2 0
9 6 3 2
10 8 5 3
11 11 7 5
12 14 10 7
13 17 13 10
14 21 16 13
15 25 20 16
16 30 24 20
17 35 28 23
18 40 33 28
19 46 38 32
20 52 43 38
21 59 49 43
22 66 56 49
23 73 62 55
24 81 69 61
25 89 77 68 93
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA NO PARAMÉTRICAS EJEMPLO RANGO CON SIGNO
Se desea comparar dos dispositivos de medición de inyección de
combustible seleccionados al azar, se obtuvieron los siguientes datos,
¿Cuál es la conclusión?
Auto 1 2 Diferencia Signo Auto Diferencia Rango con
1 17.6 16.8 0.8 + signo
Bilateral 2 19.4 20.0 -0.6 - 7 -0.2 -1
12 0.3 2
H0: m1 = m2 3 19.5 18.2 1.3 +
4 17.1 16.4 0.7 + 8 0.4 3
6 0.5 4
H1: m1 ≠ m2 5 15.3 16.0 -0.7 -
2 -0.6 -5
6 15.9 15.4 0.5 +
7 16.3 16.5 -0.2 - 4 0.7 6.5
8 18.4 18.0 0.4 + 5 -0.7 -6.5
9 17.3 16.4 0.9 + 1 0.8 8
10 19.1 20.1 -1.0 - 9 0.9 9
11 17.8 16.7 1.1 + 10 -1.0 -10
12 18.2 17.9 0.3 + 11 1.1 11
3 1.3 12
R+ 55.5
R- 22.5
n 12 Como la zona crítica es Rmin > R*0.05
Estadísticos: Para el ejemplo no se cumple. No se
Rmin 22.5
Tablas 14 rechaza H0 , las medias son iguales
Decisión:
No Rechazamos Ho
94
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA NO PARAMÉTRICA: KOLMOGOROV-SMIRNOV
Esta técnica también permite probar si una población sigue cierta
función de densidad a partir de los datos de una muestra
aleatoria, no puede aplicarse a funciones de probabilidad
discretas.
Se basa en probar el comportamiento de la muestra en relación a
la función de densidad acumulada F(x), comparando las
desviaciones en cada punto de la función escalonada.
95
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA NO PARAMÉTRICA: TÉCNICA KOLMOGOROV-SMIRNOV
97
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA NO PARAMÉTRICA: EJEMPLO KOLMOGOROV-SMIRNOV
Probar a un nivel de significancia del 5% si los resultados
registrados siguen una distribución normal
Oi
Clases fi P(Z<Z2) Fi Fi tilde a1 a2
0 10 7 0.01916629 7 0.02 0.01916629 0.00083371
11 20 13 0.05542458 20 0.05714286 0.03542458 0.00171828
21 30 35 0.13189126 55 0.15714286 0.07474841 0.02525159
31 40 42 0.26089034 97 0.27714286 0.10374749 0.01625251
41 50 53 0.43497957 150 0.42857143 0.15783671 0.00640814
51 60 70 0.62292886 220 0.62857143 0.19435743 0.00564257
61 70 50 0.78525793 270 0.77142857 0.1566865 0.01382935
71 80 44 0.8974165 314 0.89714286 0.12598793 0.00027364
81 90 25 0.95940823 339 0.96857143 0.06226537 0.0091632
91 100 11 0.98681613 350 1 0.0182447 0.01318387
350 a= 0.19435743
Media= 53.4329
DesvEstd= 20.9691 d(.05,k=10)= 0.409
Dado que no se cumple la zona de rechazo, se concluye que los datos
siguen una distribución normal.
98
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA NO PARAMÉTRICA: EJEMPLO KOLMOGOROV-SMIRNOV
Cierta empresa productora de champiñones ha registrado la
demanda diaria de champiñón fresco en toneladas, obteniéndose
los valores que se anexan. Utilizar la prueba Kolmogorov-
Smirnov para probar que la de manda diaria de champiñones tiene
una distribución normal con media de 50 y desviación estándar de
13, usando un nivel de significancia de 5%.
38 67 28 49 47 59 51 57 52 56
35 76 58 48 63 34 68 53 25 36
32 61 33 48 42 72 66 59 43 44
99
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA NO PARAMÉTRICA: EJEMPLO KOLMOGOROV-SMIRNOV
No se hacen clases, se usa el orden en su lugar y por lo mismo sólo se calcula a2
i X(i) S(x)=i/n Fo(x)=P(X<X(i) ǀ S(x) - Fo(x) ǀ
1 25 0.0333 0.0272 0.0061 16 51 0.5333 0.5307 0.0026
2 28 0.0667 0.0453 0.0214 17 52 0.5667 0.5611 0.0056
3 32 0.1 0.0831 0.0169 18 53 0.6 0.5913 0.0087
4 33 0.1333 0.0955 0.0378 19 56 0.6333 0.6778 0.0445
5 34 0.1667 0.1092 0.0575 20 57 0.6667 0.7049 0.0382
6 35 0.2 0.1243 0.0757 21 58 0.7 0.7308 0.0308
7 36 0.2333 0.1408 0.0925 22 59 0.7333 0.7556 0.0223
8 38 0.2667 0.178 0.0887 23 59 0.7667 0.7556 0.0111
9 42 0.3 0.2692 0.0308 24 61 0.8 0.8013 0.0013
10 43 0.3333 0.2951 0.0382 25 63 0.8333 0.8413 0.008
11 44 0.3667 0.3222 0.0445 26 66 0.8667 0.8908 0.0241
12 47 0.4 0.4087 0.0087 27 67 0.9 0.9045 0.0045
13 48 0.4333 0.4389 0.0056 28 68 0.9333 0.9169 0.0164
14 48 0.4667 0.4389 0.0278 29 72 0.9667 0.9547 0.012
15 49 0.5 0.4693 0.0307 30 76 1 0.9772 0.0228
Máximo= 0.0925
De donde Do,n = 0.093 Como n está cercano a 40 puede
De tablas Dn,α = D30,0.05 = 0.24 obtenerse aproximadamente el valor de
tablas por:
V - mv
z= Z 2
sv
101
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
EJEMPLO
Probar a un nivel de significancia del 5% si los resultados
registrados de lanzar una moneda son aleatorios:
A S S A S A A A S A A S S A S A S A A S S A S S A S AA S A S
102
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA DE ALEATORIEDAD 2
103
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA NO PARAMÉTRICAS: TABLA ALEATORIEDAD
104
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA NO PARAMÉTRICAS: PRUEBA DE ALEATORIEDAD 2
Se desea comparar dos dispositivos de medición de inyección de
combustible seleccionados al azar, se obtuvieron los siguientes datos,
¿Cuál es la conclusión final utilizando aleatoriedad o rachas?
Auto 1 2
1 17.6 16.8
Bilateral 2 19.4 20.0
H0: m1 = m2 3 19.5 18.2
4 17.1 16.4
H1: m1 ≠ m2 5 15.3 16.0
6 15.9 15.4
7 16.3 16.5
8 18.4 18.0
9 17.3 16.4
10 19.1 20.1
11 17.8 16.7
12 18.2 17.9
Valor 15.3 15.4 15.9 16 16.3 16.4 16.4 16.5 16.7 16.8 17.1 17.3 17.6 17.8 17.9 18 18.2 18.2 18.4 19.1 19.4 19.5 20 20.1
Disp. 1 2 1 2 1 2 2 2 2 2 1 1 1 1 2 2 1 2 1 1 1 1 2 2
Rachas 12
Estadísticos:
Rmin 7
Rmax 19
Como la zona crítica es: Rmin < R*0.05 < Rmax , no puede
Decisión:
rechazarse H0, las medias son iguales
No se rechaza Ho
105
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA DE MANN-WHITNEY
Se aplica a observaciones por pares extraídas de poblaciones continuas
como en las pruebas anteriores. Sea (X1j, X2j), j = 1,2,…, n un conjunto de
observaciones por pares.
Técnica
1. Asigne rango a las (n1+n2) observaciones en orden de magnitud,
asignado un 1 a la observación más pequeña, un 2 a la siguiente, etc.
En caso de empate, se promedian los rangos que corresponderían.
2. Se calculan las sumas de los rangos TA y TB para las dos muestras.
3. Se calculan RA y RB :
n1 (n2 + 1)
RA = n1n2 + -T A
2
n1 (n2 + 1)
RB = n1n2 + -T B = n1n2 - RA
2
4. Obtener R = min (RA , RB ).
5. Se concluye comparando R con el valor R* , que se obtiene de tablas,
siendo la zona crítica: R < R*
106
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
EJERCICIOS
107
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA NO PARAMÉTRICAS: EJEMPLO MANN-WHITNEY
Se desea comparar dos dispositivos de medición de inyección de
combustible seleccionados al azar, se obtuvieron los siguientes datos,
¿Cuál es la conclusión? Auto Inyección No
Auto 1 2 1 15.3 1
1 17.6 16.8 Bilateral 2 15.4 2
2 19.4 20.0 1 15.9 3
3 19.5 18.2 H0: m1 = m2 2 16 4
4 17.1 16.4
5 15.3 16.0 H1: m1 ≠ m2 1 16.3 5 TA= 158.5
6 15.9 15.4 2 16.4 6 TB= 141.5
7 16.3 16.5 2 16.4 7
8 18.4 18.0 2 16.5
n1 (n2 + 1) 8 RA= 63.5
9 17.3 16.4 RA = n1n2 + -T A 16.7
10 19.1 20.1 2 2 9 RB= 80.5
11 17.8 16.7 n (n + 1) 2 16.8 10
RB = n1n2 + 1 2 -T B = n1n2 - RA
1 17.1
12 18.2 17.9 2 11 Rmin 63.5
1 17.3 12
1 17.6 13 R0.05 37
1 17.8 14
2 17.9 15
2 18 16
Como la zona crítica Rmin < R*0.05 1 18.2 17.5
2 18.2 17.5
Para el ejemplo, No se rechaza H0 , 1 18.4 19
las medias son iguales 1 19.1 20
1 19.4 21
1 19.5 22
2 20 23
2 20.1 24 108
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA DE KRUSKALL-WALLIS
Es una prueba que compara tres o más poblaciones para determinar si existe una
diferencia en la distribución de las poblaciones. Es análoga a la prueba F utilizada en las
pruebas ANDEVA. No importa la restricción de que las poblaciones tienen que estar
distribuidas normalmente.
Las hipótesis son:
H0: Todas las k poblaciones tienen la misma distribución.
H1: No todas las k poblaciones tienen la misma distribución.
Técnica
1. Asigne rango a las observaciones en orden de magnitud, asignado un 1 a la observación
más pequeña, un 2 a la siguiente, etc. En caso de empate, se promedian los rangos que
corresponderían.
2. Se calculan las sumas de los rangos para las muestras.
3. Se calcula el valor estadístico de prueba:
12 Ri2
K= - 3(n + 1)
n(n + 1) ni
donde ni es el número de observaciones en la i-ésima muestra
n es el número total de observaciones en todas las muestras.
Ri es la suma de los rangos de la i-ésima muestra.
4. Comparar K con un valor crítico, su distribución es aproximada por una ji-cuadrada con
k – 1 grados de libertad. Si K > 2,k-1, se rechaza la hipótesis.
109
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA NO PARAMÉTRICAS: EJEMPLO KRUSKALL-WALLIS
Un nuevo gerente de Avon debe comparar el tiempo que les toma a tres clientes
pagar los envíos del nuevo producto New-Face Cream, ofrecido por la empresa.
Se seleccionan aleatoriamente varias compras de cada cliente, junto con el
número de días que cada uno se tomó en liquidar su cuenta.
Muestra 1 2 3 Muestra. Valor Ordinal Ajustado
1 28 26 37 2 11 1 1
1 13 2 2
2 19 20 28 02.05 ,2 = 5.99
3 13 11 26 2 14 3 3
4 28 14 35 1 19 4 4
5 29 22 31 2 20 5 5
6 22 21 1 21 6 6.5
7 21 2 21 7 6.5
1 22 8 8.5
Muestra Ri ni Ri2 / n i
2 22 9 8.5
2 26 10 10.5 1 62 7 549.143
3 26 11 10.5 2 34.5 6 198.375
H0: Las k poblaciones 1 28 12 13 3 74.5 5 1,110.05
1 28 13 13 18 1,857.57
provienen de la misma
población. 3 28 14 13
1 29 15 15
H1: Al menos una población
proviene de otra 3 31 16 16
3 35 17 17
población.
3 37 18 18
Como k = 8.18 > 5.99, se rechaza la hipótesis
(62) (34.5) (74.5)
2 2 2
nula de que no hay diferencia en el tiempo
- 3(18 + 1) = 8.18 que toma a tres clientes pagar sus cuentas
12
K= + +
18(18 + 1) 7 6 5
con Avon.
110
mayo de 2020 Dr. Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
PRUEBA DE HIPÓTESIS
PRUEBA DE KRUSKALL-WALLIS
En el caso de que se rechace la hipótesis nula, el siguiente paso lógico es determinar
cuáles diferencias son estadísticamente significativas y cuales se deben a un error de
muestreo.
Esto involucra una comparación de todos los pares posibles. Los pasos para la
comparación son los siguientes:
Actividades Recomendadas