Documentos de Académico
Documentos de Profesional
Documentos de Cultura
3 Comparación de proporciones 14
3.1 Prueba de Hipótesis para la diferencia de proporciones de dos
poblaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.2 Intervalos de confianza para la diferencia de proporciones de
dos poblaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Página 1 de 19
1 Inferencia Estadística para dos muestras
1.1 Diferencia de medias de dos distribuciones normales
con varian-zas conocidas
La población 1 tiene media µ1 y varianza σ12 , por otro lado la población 2
tiene media µ2 e varianza σ22 . Inferencias son basadas en dos muestras alea-
torias de tamaños n1 e n2 , respectivamente. O sea, X11 , X12 , · · · , X1n1 es
una muestra aleatoria de n1 observaciones provenientes de la población 1 y
X21 , X22 , · · · , X2n2 es una muestra aleatoria de n2 observaciones provenien-
tes de la población 2.
E(X̄1 − X̄2 ) = µ1 − µ2
σ12 σ2
V ar(X̄1 − X̄2 ) = + 2.
n1 n2
Página 2 de 19
Así, tenemos que
X̄1 − X̄2 − (µ1 − µ2 )
Z= s (1)
σ12 σ2
+ 2
n1 n2
tiene una distribución N (0, 1).
Hipótesis nula: H0 : µ1 − µ2 = ∆0
X̄1 − X̄2 − ∆0
Z0 = s
σ12 σ2
+ 2
n1 n2
Página 3 de 19
= 112 minutos, respectivamente. Cuáles son las conclusiones que el investi-
gador de los productos puede sacar sobre la eficiencia del nuevo ingrediente,
usando α=0.05?
H0 : µ1 − µ2 = 0 o H0 : µ1 = µ2 .
x̄1 − x̄2 − 0
z0 = s
σ12 σ2
+ 2
n1 n2
(6) Cálculo de z0 :
121 − 112
z0 = r = 3, 98.
82 82
+
25 25
(7) Conclusión: Tenemos que z0 = 3,98.
Luego, el p-valor de la prueba es p-valor = 1-Φ(3,98) < 0.001.
Por tanto, al nivel de significancia de 5%, rechazamos H0 .
Interpretación: Concluimos que la adición del nuevo ingrediente a la tinta
reduce significativamente el tiempo de secado.
Página 4 de 19
tendrá una distribución normal estándar si las dos poblaciones son normales, o
tendrá uma distribución aproximadamente normal estándar si las condiciones
del Teorema Central del Limite se aplican, respectivamente. Eso implica que
P (−zα/2 ≤ Z ≤ zα/2 ) = 1 − α
o sea,
X̄1 − X̄2 − (µ1 − µ2 )
P −zα/2 ≤
s =1−α
≤ zα/2
σ12 σ22
+
n1 n2
que es equivalente a
s s
σ12 σ22 σ12 σ22
P X̄1 − X̄2 − zα/2 + ≤ µ1 − µ2 ≤ X̄1 − X̄2 + zα/2 + = 1−α.
n1 n2 n1 n2
Página 5 de 19
1.2.1 Pruebas de Hipótesis (para la diferencia de medias de dos distri-
buciones normales, com varianzas desconocidas)
E(X̄1 − X̄2 ) = µ1 − µ2
σ2 σ2
1 1
V ar(X̄1 − X̄2 ) = 1 + 2 = σ 2 + .
n1 n2 n1 n2
Note que Sc2 es una media ponderada de las dos varianzas muestrales S12 y
S22 , com pesos que dependem de los tamaños muestrales.
Sabemos que
X̄1 − X̄2 − (µ1 − µ2 )
Z= r (2)
1 1
σ +
n1 n2
tiene una distribución N (0, 1). Cambiando σ por Sc tenemos que
Página 6 de 19
Hipótesis nula: H0 : µ1 − µ2 = ∆0
X̄1 − X̄2 − ∆0
T0 = r
1 1
Sc +
n1 n2
H0 : µ1 − µ2 = 0 o H0 : µ1 = µ2 .
Página 7 de 19
(3) Hipótesis alternativa:
H1 : µ1 6= µ2 .
x̄1 − x̄2 − 0
t0 = r
1 1
sc +
n1 n2
(7) Conclusión: Temos que t0 = -0,35 e t0,025,14 = 2,14. Como t0 < t0,025,14 ,
al nivel de significación de 5%, no debemos rechazar H0 .
Interpretación: A un nivel de significancia de 5%, no tenemos evidencia
para concluir que el catalizador 2 tiene un rendimiento medio diferente del
catalizador 1.
E(X̄1 − X̄2 ) = µ1 − µ2
σ12 σ2
V ar(X̄1 − X̄2 ) = + 2.
n1 n2
Página 8 de 19
Sabemos que
X̄1 − X̄2 − (µ1 − µ2 )
Z= s (4)
σ12 σ2
+ 2
n1 n2
tiene una distribución N (0, 1). Cambiando σ1 por S1 y σ2 por S2 tenemos que
Hipótesis nula: H0 : µ1 − µ2 = ∆0
X̄1 − X̄2 − ∆0
T0∗ = s
S12 S2
+ 2
n1 n2
Note que para el caso de varianzas desconocidas, si σ12 y σ22 no son consi-
deradas iguales, las hipótesis sobre las diferencias de médias de dos distribu-
ciones normales son probadas como en el caso de varianzas iguales, excepto
que T ∗ es usado como un estadístico de la prueba y n1 + n2 − 2 es cambiado
por ν en la determinación de los grados de libertad para la prueba.
Página 9 de 19
Ejemplo. La concentración de arsénico en los suministros de agua potable es
un riesgo potencial de salud. Un artículo reportó las concentraciones, en par-
tes por mil millones (ppb), de arsénico en agua potable para 10 comunidades
metropolitanas de Fenix y 10 comunidades rurales de Arizona. Los resultados
fueron:
(a) Fénix: x̄1 = 12, 5 e s1 = 7, 63.
(b) Arizona: x̄2 = 27, 5 e s2 = 15, 3.
¿Hay alguna diferencia entre los promedios de la concentración de arsénico
de Fenix y Arizona? Sigue el gráfico con las observaciones:
H0 : µ1 − µ2 = 0 ou H0 : µ1 = µ2 .
x̄1 − x̄2 − 0
t∗0 = s
s21 s2
+ 2
n1 n2
Página 10 de 19
(5) Rechaze H0 si: Rechaze H0 : µ1 = µ2 si el p-valor es menor que 0,05.
(7) Conclusión: Tenemos que t∗0 = -2,77 y t0,025,13 = 2,16. Como t∗0 < −t0,025,13
= 2,16, al nivel de significancia de 5%, debemos rechazar H0 .
Interpretación: A nivel de significancia del 5%, hay evidencias para con-
cluir que la concentración media de arsénico en el agua potable en la zona
rural de Arizona es diferente de la concentración media de arsénico en el
agua potable en el área metropolitana de Fenix. Además, la concentración
media de arsénico es mayor en las comunidades rurales de Arizona. El
p-valor de la prueba es 0,016.
donde s
[(n1 − 1)s21 + (n2 − 1)s22 ]
sc = .
n1 + n2 − 2
Página 11 de 19
Caso II: σ12 6= σ22 (varianzas no necesariamente iguales)
En muchas situaciones, no es razonable suponer que σ12 = σ22 . Podemos
entonces encontrar un intervalo de confianza de 100(1-α)% para µ1 − µ2 , con-
siderando el hecho de que
donde 2
s21 s2
+ 2
n1 n2
ν= 2
(s1 /n1 )2 (s2 /n2 )2
+ 2
n1 − 1 n2 − 1
S12 /σ12
F =
S22 /σ22
Página 12 de 19
Definición. Prueba para la razón de Varianzas de dos distribuciones nor-
males
S12
F0 =
S22
(1) Parámetros de interes: Los parámetros de interés son las varianzas, σ12
y σ22 , del grosor de las capas de óxido. Consideraremos que el grosor de
óxido sea una variable aleatoria normal para ambas mezclas de gases.
s21
f0 =
s22
Página 13 de 19
(6) Cálculo de t0 : Ya que s21 = (1, 96)2 =3,84 y s22 = (2, 13)2 =4,54, el estadís-
tico de la prueba es
s2 3, 84
f0 = 21 = = 0, 85.
s2 4, 54
(7) Conclusión: Como f0,975;15;15 =0,35 < f0 =0,85 < f0,025;15;15 , no debemos
rechazar H0 , o sea, no hay evidencias para indicar un gas que resulte en
una varianza menor del grosor del óxido.
3 Comparación de proporciones
3.1 Prueba de Hipótesis para la diferencia de proporciones
de dos poblaciones
Suponga que dos muestras aleatorias independientes, de tamaños n1 e
n2 , seam retiradas de dos poblaciones y que Y1 e Y2 seam los números de
observaciones que pertencen a la clase de interés en las muestras 1 e 2,
respectivamente.
Además, considere que la aproximación de la binomial por la normal sea
aplicada a cada población, de modo que los estimadores
E(p̂1 − p̂2 ) = p1 − p2
p1 (1 − p1 ) p2 (1 − p2 )
V ar(p̂1 − p̂2 ) = + .
n1 n2
Página 14 de 19
Considerando n1 y n2 grandes, podemos aproximar p1 e p2 en el cálculo de
la varianza por p̂1 e p̂2 , respectivamente. Luego, tenemos que
Hipótesis nula: H0 : p1 − p2 = ∆0
p̂1 − p̂2 − ∆0
Z0 = r
p̂1 (1 − p̂1 ) p̂2 (1 − p̂2 )
+
n1 n2
p̂1 − p̂2
Z0 = s
1 1
p̂(1 − p̂) +
n1 n2
Y1 + Y2
p̂ =
n1 + n2
Página 15 de 19
Ejemplo. (Ejemplo en Jay Devore, página 355) Algunos acusados en proce-
sos criminales se declaran culpables y son sentenciados sin un juicio en tanto
que otros que se declaran inocentes de manera subsecuente son encontra-
dos culpables y entonces son sentenciados. En años recientes, los eruditos
en leyes han especulado en cuanto si las sentencias de aquellos que se de-
claran culpables difieren en severidad de las sentencias de aquellos que se
declaran inocentes y subsecuentemente son juzgados culpables. Considere
los datos adjuntos sobre acusados de robo en el condado de San Francisco,
todos con antecedentes penales previos ("Does It Pay to Plead Guilty? Diffe-
rential Sentencing and the Functioning of Criminal Courts", Law and Society
Rev., 1981-1982: 45- 69). ¿Sugieren estos datos que la proporción de todos
los acusados en estas circunstancias que se declaran culpables y son envia-
dos a prisión difiere de la proporción que son enviados a prisión después de
declararse inocentes y que son encontrados culpables?
p̂1 − p̂2
Z=r
p̂1 (1 − p̂1 ) p̂2 (1 − p̂2 )
+
n1 n2
P (−zα/2 ≤ Z ≤ zα/2 ) = 1 − α.
s
p̂1 (1 − p̂1 ) p̂2 (1 − p̂2 )
p̂1 − p̂2 + zα/2 +
n1 n2
Página 16 de 19
4 Prueba t-pareada para dos distribuciones nor-
males
4.1 Diferencia de medias de dos distribuciones normales
pareadas
Sea (X11 , X21 ), (X12 , X22 ), · · · , (X1n , X2n ) un conjunto de n observaciones
pareadas, donde consideramos que la media y la varianza de la población
representada por X1 seam µ1 y σ12 es la media y la varianza de la población
representada por X2 seam µ2 y σ22 . Considere las diferencias entre cada par
de observaciones como Dj = X1j − X2j , j = 1, 2, · · · , n.
Considere D̄ la media de las diferencias muestrales y σd2 la varianza pobla-
cional de las diferencias. Luego,
E(D̄) = µ1 − µ2 = µd
σd2
V ar(D̄) = V ar(X̄1 − X̄2 ) = .
n
Sabemos que
D̄ − µd
Z= r (6)
σd2
n
tiene una distribución N (0, 1). Cambiando σd por Sd , la varianza muestral de
las diferencias, tenemos que
D̄ − µd
T = r (7)
Sd2
n
sigue una distribución t, con n − 1 grados de libertad.
Suponga que estamos interesados en probar la diferencia de medias µd
como igual a un valor especificado ∆0 . Así, la hipótesis nula será establecida
como H0 : µd = ∆0 .
Hipótesis nula: H0 : µd = ∆0
Estadístico de la prueba:
D̄ − ∆0
T = p 2
Sd /n
Página 17 de 19
Hipótesis p-valor Criterio de rechazo para
alternativas pruebas con niveles fijos
H1 : µD 6= ∆0 Probabilidad por encima de |t0 | e t0 > tα/2,n−1 ou
Probabilidad debajo de −|t0 | t0 < −tα/2,n−1
H1 : µD > ∆0 Probabilidad encima de t0 , t0 > tα,n−1
H1 : µD < ∆0 Probabilidad por debajo de −|t0 |, t0 < −tα,n−1
H0 : µ1 − µ2 = 0 ou H0 : µd = 0.
d¯
t0 = √
sd / n
Página 18 de 19
prueba es:
d¯ 0, 2739
t0 = √ = √ = 6, 08.
sd / n 0, 1350/ 9
(7) Conclusión: Tenemos que t0 = 6,08 y t0,025;8 = 2,306. Como t0 > t0,025;8 ,
debemos rechazar H0 , o sea, hay diferencia en la resistencia media a la
cizalla entre los dos métodos.
P (−tα/2,n−1 ≤ T ≤ tα/2,n−1 ) = 1 − α
Página 19 de 19