INFERENCIA ParaDosMuestras PDF

Sumário
1 Inferencia Estadística para dos muestras 2

1.1 Diferencia de medias de dos distribuciones normales con varian-
zas conocidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.1 Prueba de Hipótesis (para la diferencia de medias de dos
distribuciones normales com varianzas conocidas) . . . . 3
1.1.2 Intervalos de confianza (para la diferencia de medias,
com varianzas conocidas) . . . . . . . . . . . . . . . . . . 4
1.2 Diferencia de medias de dos distribuciones normales con vari-
anzas desconocidas . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.1 Pruebas de Hipótesis (para la diferencia de medias de
dos distribuciones normales, com varianzas desconocidas) 6
1.2.2 Intervalos de confianza (para la diferencia de medias de
dos distribuciones muestrales, con varianzas desconoci-
das) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2 Inferencia para las varianzas de dos distribuciones normales. 12
3 Comparación de proporciones 14
3.1 Prueba de Hipótesis para la diferencia de proporciones de dos
poblaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.2 Intervalos de confianza para la diferencia de proporciones de
dos poblaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
4 Prueba t-pareada para dos distribuciones normales 17

4.1 Diferencia de medias de dos distribuciones normales pareadas 17
4.2 Intervalo de confianza para µD (muestras pareadas) . . . . . . . 19
Página 1 de 19
1 Inferencia Estadística para dos muestras
1.1 Diferencia de medias de dos distribuciones normales
con varian-zas conocidas
La población 1 tiene media µ1 y varianza σ12 , por otro lado la población 2
tiene media µ2 e varianza σ22 . Inferencias son basadas en dos muestras alea-
torias de tamaños n1 e n2 , respectivamente. O sea, X11 , X12 , · · · , X1n1 es
una muestra aleatoria de n1 observaciones provenientes de la población 1 y
X21 , X22 , · · · , X2n2 es una muestra aleatoria de n2 observaciones provenien-
tes de la población 2.
Figura 1: Dos poblaciones independentes.
En esta sección, consideraremos las inferencias estadísticas para la dife-

rencia de medias µ1 − µ2 de dos distribuciones normales, en que las varianzas
σ12 y σ22 son conocidas. Las suposiciones para esta sección son resumidas a
seguir:
Definición. Suposiciones para Inferencia con dos muestras
(1) X11 , X12 , · · · , X1n1 es una muestra aleatoria proveniente de la población

1.
(2) X21 , X22 , · · · , X2n2 es una muestra aleatoria proveniente de la población

2.
(3) Las dos poblaciones representadas por X1 e X2 son independentes.
(4) Ambas poblaciones son normales.
Un estimador lógico para µ1 − µ2 es la diferencia de las medias muestrales

X̄1 − X̄2 . De este modo,
E(X̄1 − X̄2 ) = µ1 − µ2
σ12 σ2
V ar(X̄1 − X̄2 ) = + 2.
n1 n2
Página 2 de 19
Así, tenemos que
X̄1 − X̄2 − (µ1 − µ2 )
Z= s (1)
σ12 σ2
+ 2
n1 n2
tiene una distribución N (0, 1).
1.1.1 Prueba de Hipótesis (para la diferencia de medias de dos distribu-

ciones normales com varianzas conocidas)
Suponga que estamos interesados em probar la diferenia de medias µ1 −µ2

como igual a un valor especificado ∆0 . Asi, la hipótesis nula será establecida
como H0 : µ1 − µ2 = ∆0 . Note que si nuestro interés es probar la igualdad de
las medias, especificaremos ∆0 = 0.
Considere dos poblaciones normales independientes, com medias desco-
nocidas µ1 e µ2 e varianzas conocidas σ12 y σ22 , respectivamente.
Sea X11 , X12 , · · · , X1n1 una muestra aleatoria de n1 observaciones prove-
nientes de la población 1 y X21 , X22 , · · · , X2n2 una muestra aleatoria de n2
observaciones provenientes de la población 2.
Definición. Prueba para la diferencia de medias, con varianzas conocidas
Hipótesis nula: H0 : µ1 − µ2 = ∆0
Estadístico de la prueba (bajo H0 ):
X̄1 − X̄2 − ∆0
Z0 = s
σ12 σ2
+ 2
n1 n2
Hipótesis p-valor Criterio de rechazo para

alternativas pruebas com niveles fijos
H1 : µ1 − µ2 6= ∆0 Probabilidad por encima de |z0 | e z0 > zα/2 ou
Probabilidad por abajo de −|z0 |, z0 < −zα/2
H1 : µ1 − µ2 > ∆0 Probabilidad por encima de |z0 |, z0 > zα
H1 : µ1 − µ2 < ∆0 Probabilidad por abajo de −|z0 |, z0 < −zα
Ejemplo. Una persona que desarrolla productos está interesada en reducir el

tiempo de secado de una pintura en superficies de hierro. Dos fórmulas de
tintas son probadas. La fórmula 1 tiene una composición química estándar y
la fórmula 2 tiene un nuevo ingrediente para secado. Por experiencia se sabe
que la desviación estándar del tiempo de secado es igual a 8 minutos y esa
variabilidad inherente no debe ser afectada por la adición de un nuevo ingredi-
ente. 25 ejemplares son pintados con la fórmula 1 y otros 25 ejemplares son
pintados con la fórmula 2. Los 50 ejemplares son pintados en forma aleatoria.
Los tiempos medios de secado de las dos muestras son x̄1 = 121 minutos e x̄2
Página 3 de 19
= 112 minutos, respectivamente. Cuáles son las conclusiones que el investi-
gador de los productos puede sacar sobre la eficiencia del nuevo ingrediente,
usando α=0.05?
(1) Parámetros de interés: Queremos probar la diferencia en tiempos medios

de secado, µ1 − µ2 , donde ∆0 = 0.
(2) Hipótesis nula:
H0 : µ1 − µ2 = 0 o H0 : µ1 = µ2 .
(3) Hipótesis alternativa:

H1 : µ1 > µ2 .
Queremos rechazar H0 si el nuevo ingrediente reduce el tiempo medio de
secado.
(4) Estadístico de la prueba:
x̄1 − x̄2 − 0
z0 = s
σ12 σ2
+ 2
n1 n2
sendo σ12 = σ22 = 82 = 64 e n1 = n2 = 25.
(5) Rechaze H0 si: Rechaza H0 : µ1 = µ2 si el p-valor es menor que 0.05.
(6) Cálculo de z0 :
121 − 112
z0 = r = 3, 98.
82 82
+
25 25
(7) Conclusión: Tenemos que z0 = 3,98.
Luego, el p-valor de la prueba es p-valor = 1-Φ(3,98) < 0.001.
Por tanto, al nivel de significancia de 5%, rechazamos H0 .
Interpretación: Concluimos que la adición del nuevo ingrediente a la tinta
reduce significativamente el tiempo de secado.
1.1.2 Intervalos de confianza (para la diferencia de medias, com varian-

zas conocidas)
Considere que X11 , X12 , · · · , X1n1 es una muestra aleatoria de n1 obser-

vaciones provenientes de la población 1 y X21 , X22 , · · · , X2n2 es una muestra
aleatoria de n2 observaciones provenientes de la población 2. La diferença en
las medias de la muestras X̄1 − X̄2 es un estimador para µ1 − µ2 y
X̄1 − X̄2 − (µ1 − µ2 )

Z= s
σ12 σ2
+ 2
n1 n2
Página 4 de 19
tendrá una distribución normal estándar si las dos poblaciones son normales, o
tendrá uma distribución aproximadamente normal estándar si las condiciones
del Teorema Central del Limite se aplican, respectivamente. Eso implica que
P (−zα/2 ≤ Z ≤ zα/2 ) = 1 − α
o sea,  
 
 X̄1 − X̄2 − (µ1 − µ2 ) 
P −zα/2 ≤
 s =1−α
≤ zα/2 
 σ12 σ22 
+
n1 n2
que es equivalente a
 s s 
σ12 σ22 σ12 σ22 
P X̄1 − X̄2 − zα/2 + ≤ µ1 − µ2 ≤ X̄1 − X̄2 + zα/2 + = 1−α.
n1 n2 n1 n2
Definición. Intervalo de confianza para la diferencia de medias, com va-

rianzas conocidas. Si x̄1 y x̄2 son las medias de dos muestras aleatorias
independentes de tamaños n1 y n2 , provenientes de poblaciones con varian-
zas conocidas σ12 y σ22 , respectivamente, entonces el intervalo de confianza de
100(1-α)% para µ1 − µ2 es
s s
σ12 σ22 σ12 σ2
x̄1 − x̄2 − zα/2 + ≤ µ1 − µ2 ≤ x̄1 − x̄2 + zα/2 + 2
n1 n2 n1 n2
Definición. Límites unilaterales de confianza para µ1 − µ2 son dados por:

Límite unilateral superior del intervalo de confianza de 100(1-α)% para
µ1 − µ2 . s
σ12 σ2
x̄1 − x̄2 + zα + 2.
n1 n2
Límite unilateral inferior del intervalo de confianza de 100(1-α)% para
µ1 − µ2 . s
σ12 σ2
x̄1 − x̄2 − zα + 2.
n1 n2

con varianzas desconocidas
En esta sección, extendemos los resultados para la diferencia de medias
de dos distribuciones, cuando las varianzas σ12 y σ22 son desconocidas. Aquí,
utilizaremos la distribución t para la construcción de Pruebas de Hipótesis e
intervalos de confianza.
Página 5 de 19
1.2.1 Pruebas de Hipótesis (para la diferencia de medias de dos distri-
buciones normales, com varianzas desconocidas)
Dos situaciones diferentes deben ser consideradas. En el primer caso,

suponemos que las varianzas de las dos distribuciones normales sean des-
conocidas, sin embargo iguales; o sea, σ12 = σ22 = σ 2 . En el segundo caso
consideraremos que σ12 y σ22 sean desconocidas y no necesariamente iguales.
Caso I: σ12 = σ22 = σ 2 (varianzas iguales)
Suponga que tenemos dos poblaciones normales independientes, con me-

dias desconocidas µ1 y µ2 y varianzas desconocidas, sin embargo iguales,
σ12 = σ22 = σ 2 .
Considere X̄1 e X̄2 las medias de las muestras y σ12 e σ22 las varianzas
poblacionales. Entonces, tenemos que
E(X̄1 − X̄2 ) = µ1 − µ2
σ2 σ2

1 1
V ar(X̄1 − X̄2 ) = 1 + 2 = σ 2 + .
n1 n2 n1 n2
Definición. Estimador combinado de la varianza. El estimador combinado

de σ 2 , denotado por Sc2 , es definido por:
(n1 − 1)S12 + (n2 − 1)S22

Sc2 =
n1 + n2 − 2
Note que Sc2 es una media ponderada de las dos varianzas muestrales S12 y
S22 , com pesos que dependem de los tamaños muestrales.
Sabemos que
X̄1 − X̄2 − (µ1 − µ2 )
Z= r (2)
1 1
σ +
n1 n2
tiene una distribución N (0, 1). Cambiando σ por Sc tenemos que
X̄1 − X̄2 − (µ1 − µ2 )

T = r (3)
1 1
Sc +
n1 n2
tiene una t, con n1 + n2 − 2 grados de libertad.

Suponga que estamos interesados en probar la diferencia de medias µ1 −
µ2 como igual a um valor especificado ∆0 . Asi, la hipotesis nula será estable-
cida como H0 : µ1 − µ2 = ∆0 .
Definición. Prueba para la diferencia de medias, com varianzas descono-

cidas e iguales
Página 6 de 19
X̄1 − X̄2 − ∆0
T0 = r
1 1
Sc +
n1 n2
Hipótesis p-valor Critério de rechazo para

alternativas pruebas con niveles fijos
H1 : µ1 − µ2 6= ∆0 Probabilidad por encima de |t0 | e t0 > tα/2,n1 +n2 −2 o
Probabilidad por debajo de −|t0 |, t0 < −tα/2,n1 +n2 −2
H1 : µ1 − µ2 > ∆0 Probabilidad por encima de t0 , t0 > tα,n1 +n2 −2
H1 : µ1 − µ2 < ∆0 Probabilidad por abajo de −|t0 |, t0 < −tα,n1 +n2 −2
Ejemplo. Se están analizando dos catalizadores para determinar cómo afec-

tan el rendimiento medio de un proceso químico. En concreto, el catalizador
1 está actualmente en uso, pero el catalizador 2 es aceptable. Una vez que
el catalizador 2 es más barato, debe ser adoptado, siempre y cuando no cam-
bie el rendimiento del proceso. Una prueba se realiza en una planta piloto,
resultando en los datos a continuación. ¿Hay alguna diferencia entre los ren-
dimientos medios? Use alpha = 0, 05 y considere las variaciones iguales.
Figura 2: Datos del rendimiento de los catalizadores.
(1) Parámetros de interés: Queremos probar la diferencia en los rendimien-

tos medios de los catalizadores, µ1 − µ2 , donde ∆0 = 0.
H0 : µ1 − µ2 = 0 o H0 : µ1 = µ2 .
Página 7 de 19
H1 : µ1 6= µ2 .
(4) Estadístico de la prueba: El estadístico de la prueba es
x̄1 − x̄2 − 0
t0 = r
1 1
sc +
n1 n2
(5) Rechaze H0 si: Rechaze H0 : µ1 = µ2 si el p-valor es menor que 0,05.
(6) Cálculo de t0 : Primero, calcularemos el valor de sc :
(n1 − 1)s21 + (n2 − 1)s22 (7)(2, 39)2 + (7)(2, 98)2

s2c = = = 7, 30.
n1 + n2 − 2 8+8−2
√
Luego, sc = 7, 30 = 2,70.
Así,
92, 255 − 92, 733 − 0
t0 = r = −0, 35.
1 1
2, 70 +
8 8
(7) Conclusión: Temos que t0 = -0,35 e t0,025,14 = 2,14. Como t0 < t0,025,14 ,
al nivel de significación de 5%, no debemos rechazar H0 .
Interpretación: A un nivel de significancia de 5%, no tenemos evidencia
para concluir que el catalizador 2 tiene un rendimiento medio diferente del
catalizador 1.
Caso II: σ12 6= σ22 (varianzas no necesariamente iguales)
En algunas situaciones no es razonable considerar que las varianzas des-

conocidas σ12 y σ22 sean iguales. En estos casos, utilizaremos un resultado
aproximado.
Asi, suponga que tenemos dos poblaciones normales independientes, con
medias desconocidas µ1 y µ2 y varianzas desconocidas y no necesariamente
iguales σ12 y σ22 .
Considere X̄1 e X̄2 las medias de las muestras y σ12 y σ22 las varianzas
poblacionales. Entonces, tenemos que
E(X̄1 − X̄2 ) = µ1 − µ2
σ12 σ2
V ar(X̄1 − X̄2 ) = + 2.
n1 n2
Página 8 de 19
Sabemos que
X̄1 − X̄2 − (µ1 − µ2 )
Z= s (4)
σ12 σ2
+ 2
n1 n2
tiene una distribución N (0, 1). Cambiando σ1 por S1 y σ2 por S2 tenemos que
X̄1 − X̄2 − (µ1 − µ2 )

T∗ = s
S12 S2
+ 2
n1 n2
tendrá aproximadamente una distribución t, con ν grados de libertad, donde

2
S12 S22

+
n1 n2
ν= 2 2 (5)
(S1 /n1 ) (S 2 /n2 )2
+ 2
n1 − 1 n2 − 1
Obs: Si ν no es un número entero, redondee para el menor entero mas pró-

ximo.
Suponga que estamos interesados en probar la diferencia de medias µ1 −
µ2 como igual a un valor especificado ∆0 . Asi, la hipótesis nula será estable-
cida como H0 : µ1 − µ2 = ∆0 .
Definición. Prueba para la diferencia de medias, com varianzas descono-
cidas y consideradas no iguales
X̄1 − X̄2 − ∆0
T0∗ = s
S12 S2
+ 2
n1 n2

H1 : µ1 − µ2 6= ∆0 Probabilidad por encima de |t∗0 | e t∗0 > tα/2,ν ou
Probabilidad por abajo de −|t∗0 |, t∗0 < −tα/2,ν
H1 : µ1 − µ2 > ∆0 Probabilidad por encima de t∗0 , t∗0 > tα,ν
H1 : µ1 − µ2 < ∆0 Probabilidad por abajo de −|t∗0 |, t∗0 < −tα,ν
Note que para el caso de varianzas desconocidas, si σ12 y σ22 no son consi-
deradas iguales, las hipótesis sobre las diferencias de médias de dos distribu-
ciones normales son probadas como en el caso de varianzas iguales, excepto
que T ∗ es usado como un estadístico de la prueba y n1 + n2 − 2 es cambiado
por ν en la determinación de los grados de libertad para la prueba.
Página 9 de 19
Ejemplo. La concentración de arsénico en los suministros de agua potable es
un riesgo potencial de salud. Un artículo reportó las concentraciones, en par-
tes por mil millones (ppb), de arsénico en agua potable para 10 comunidades
metropolitanas de Fenix y 10 comunidades rurales de Arizona. Los resultados
fueron:
(a) Fénix: x̄1 = 12, 5 e s1 = 7, 63.
(b) Arizona: x̄2 = 27, 5 e s2 = 15, 3.
¿Hay alguna diferencia entre los promedios de la concentración de arsénico
de Fenix y Arizona? Sigue el gráfico con las observaciones:
Figura 3: Concentración de arsénico en partes por billón.
(1) Parámetros de interés: Queremos probar la diferencia en las concentra-

ciones medias de arsénico en dos regiones geográficas, µ1 − µ2 , donde
∆0 = 0.
H0 : µ1 − µ2 = 0 ou H0 : µ1 = µ2 .

H1 : µ1 6= µ2 .
x̄1 − x̄2 − 0
t∗0 = s
s21 s2
+ 2
n1 n2
Los grados de libertad para t∗0 es dado por

2
s21 s2

+ 2
n1 n2
ν= 2
(s1 /n1 )2 (s2 /n2 )2
+ 2
n1 − 1 n2 − 1
Página 10 de 19
(5) Rechaze H0 si: Rechaze H0 : µ1 = µ2 si el p-valor es menor que 0,05.
(6) Cálculo de t∗0 :

12, 5 − 27, 5 − 0
t∗0 = r = −2, 77.
(7, 63)2 (15, 3)2
+
10 10
Cálculo de ν:
2
(7, 63)2 (15, 3)2

+
10 10
ν= = 13, 2 ≈ 13.
((7, 63)2 /10)2 ((15, 3)2 /10)2
+
9 9
(7) Conclusión: Tenemos que t∗0 = -2,77 y t0,025,13 = 2,16. Como t∗0 < −t0,025,13
= 2,16, al nivel de significancia de 5%, debemos rechazar H0 .
Interpretación: A nivel de significancia del 5%, hay evidencias para con-
cluir que la concentración media de arsénico en el agua potable en la zona
rural de Arizona es diferente de la concentración media de arsénico en el
agua potable en el área metropolitana de Fenix. Además, la concentración
media de arsénico es mayor en las comunidades rurales de Arizona. El
p-valor de la prueba es 0,016.
1.2.2 Intervalos de confianza (para la diferencia de medias de dos dis-

tribuciones muestrales, con varianzas desconocidas)
Caso I: σ12 = σ22 = σ 2 (varianzas iguales)

Sabemos que
X̄1 − X̄2 − (µ1 − µ2 )
T = r
1 1
Sc +
n1 n2
tiene una distribución t con n1 + n2 − 2 grados de libertad. De esta forma,
P (−tα/2,n1 +n2 −2 ≤ T ≤ tα/2,n1 +n2 −2 ) = 1 − α.
Definición. Intervalo de Confianza para la diferencia de medias, varianzas

desconocidas e iguales. Si x̄1 , x̄2 , s21 e s22 son medias y varianzas muestrales
de dos muestras aleatorias de tamaños n1 y n2 , respectivamente, provenientes
de dos poblaciones normales independientes, com varianzas desconocidas,
sin embrago iguales, entonces un intervalo de confianza de 100(1-α)% para
la diferencia de medias µ1 y µ2 será
r r
1 1 1 1
x̄1 −x̄2 −tα/2,n1 +n2 −2 sc + ≤ µ1 −µ2 ≤ x̄1 −x̄2 +tα/2,n1 +n2 −2 sc +
n1 n2 n1 n2
donde s
[(n1 − 1)s21 + (n2 − 1)s22 ]
sc = .
n1 + n2 − 2
Página 11 de 19
Caso II: σ12 6= σ22 (varianzas no necesariamente iguales)
En muchas situaciones, no es razonable suponer que σ12 = σ22 . Podemos
entonces encontrar un intervalo de confianza de 100(1-α)% para µ1 − µ2 , con-
siderando el hecho de que
X̄1 − X̄2 − (µ1 − µ2 )

T∗ = s
S12 S2
+ 2
n1 n2
tiene aproximadamente distribución t, con ν grados de libertad, donde

2
S12 S22

+
n1 n2
ν= .
(S12 /n1 )2 (S22 /n2 )2
+
n1 − 1 n2 − 1
Definición. Intervalo de Confianza para a diferencia de medias, varian-

zas desconocidas y no iguales. Se x̄1 , x̄2 , s21 y s22 son medias y varianzas
muestrales de dos muestras aleatorias de tamaños n1 e n2 , respectivamente,
provenientes de dos poblaciones normales independentes, com varianzas des-
conocidas y desiguales, entonces um intervalo de confianza de 100(1-α)%
para la diferencia de medias µ1 y µ2 será
s s
s21 s22 s21 s2
x̄1 − x̄2 − tα/2,ν + ≤ µ1 − µ2 ≤ x̄1 − x̄2 + tα/2,ν + 2
n1 n2 n1 n2
donde 2
s21 s2

+ 2
n1 n2
ν= 2
(s1 /n1 )2 (s2 /n2 )2
+ 2
n1 − 1 n2 − 1
2 Inferencia para las varianzas de dos distribuci-

ones normales.
Sea X11 , X12 , · · · , X1n1 una muestra aleatoria proveniente de una pobla-
ción normal, con media µ1 y varianza σ12 . Sea X21 , X22 , · · · , X2n2 una muestra
aleatoria proveniente de una población normal, con media µ2 y varianza σ22 .
Considere que ambas poblaciones normales sean independientes. Seam S12
e S22 las varianzas de las muestras. Entonces la razón
S12 /σ12
F =
S22 /σ22
tiene una distribución F, con n1 − 1 grados de libertad en el numerador y n2 − 1

grados de libertad en el denominador.
Página 12 de 19
Definición. Prueba para la razón de Varianzas de dos distribuciones nor-
males
Hipótesis nula: H0 : σ12 = σ22
S12
F0 =
S22
Hipótesis Criterio de rechazo para

H1 : σ12 6= σ22 f0 > fα/2,n1 −1,n2 −1 o
f0 < f1−α/2,n1 −1,n2 −1
H1 : σ12 > σ22 f0 > fα,n1 −1,n2 −1
H1 : σ12 < σ22 f0 < f1−α,n1 −1,n2 −1
Ejemplo. Las capas de óxidos en las pastillas de semiconductores se atacan

con una mezcla de gases para alcanzar el espesor apropiado. La variabilidad
en el grosor de estas capas de óxidos es una característica crítica de la pastilla.
Se desea una baja variabilidad para los pasos posteriores del proceso. Se
están estudiando dos mezclas diferentes de gases para determinar si una de
ellas es superior en la reducción de la variabilidad del grosor de las capas
de óxido. Las dieciséis pastillas son atacadas con cada gas. La desviación
estándar del espesor de óxido es s1 = 1,96 angstroms y s2 = 2,13 angstroms,
respectivamente. ¿Hay alguna evidencia que indique ser un gas preferible en
relación al otro? Utilice una prueba con nivel alpha = 0.05.
(1) Parámetros de interes: Los parámetros de interés son las varianzas, σ12
y σ22 , del grosor de las capas de óxido. Consideraremos que el grosor de
óxido sea una variable aleatoria normal para ambas mezclas de gases.

H0 : σ12 = σ22 .

H1 : σ12 6= σ22 .
s21
f0 =
s22
(5) Rechaze H0 si: Una vez que n1 = n2 = 16 y α = 0, 05, rechazaremmos

H0 si f0 > f0,025;15;15 =2,86 o si f0 < f0,975;15;15 = 1/f0,025;15;15 = 1/2,86 =
0,35.
Página 13 de 19
(6) Cálculo de t0 : Ya que s21 = (1, 96)2 =3,84 y s22 = (2, 13)2 =4,54, el estadís-
tico de la prueba es
s2 3, 84
f0 = 21 = = 0, 85.
s2 4, 54
(7) Conclusión: Como f0,975;15;15 =0,35 < f0 =0,85 < f0,025;15;15 , no debemos
rechazar H0 , o sea, no hay evidencias para indicar un gas que resulte en
una varianza menor del grosor del óxido.
Ejemplo. Al comparar la variabilidad de la resistencia a la tracción de dos cla-

ses de acero estructural, un experimento dio los siguientes resultados: n1 =
13, s21 = 19.2, n2 = 16, s22 = 3.5, donde las unidades de medición son 1000
libras por pulgada cuadrada. Suponga que las mediciones son variables ale-
atorias independientes de dos poblaciones normales. Es posible afirmar que
la variabilidad de la resistencia a la tracción de las dos clases de acero es la
misma?
3 Comparación de proporciones
3.1 Prueba de Hipótesis para la diferencia de proporciones
de dos poblaciones
Suponga que dos muestras aleatorias independientes, de tamaños n1 e
n2 , seam retiradas de dos poblaciones y que Y1 e Y2 seam los números de
observaciones que pertencen a la clase de interés en las muestras 1 e 2,
respectivamente.
Además, considere que la aproximación de la binomial por la normal sea
aplicada a cada población, de modo que los estimadores
p̂1 = Y1 /n1 e p̂2 = Y2 /n2
tengan distribuciones normales aproximadas.

Tenemos que
E(p̂1 − p̂2 ) = p1 − p2
p1 (1 − p1 ) p2 (1 − p2 )
V ar(p̂1 − p̂2 ) = + .
n1 n2
Suponga que estamos interesados en probar la diferença de proporciones

p1 − p2 como igual a un valor especificado ∆0 . Asi, la hipótesis nula será
establecida como H0 : p1 − p2 = ∆0 . Note que si nuestro interés es probar la
igualdad de las proporciones, especificaremos ∆0 = 0.
Sabemos que
p̂1 − p̂2 − (p1 − p2 )
Z=r
p1 (1 − p1 ) p2 (1 − p2 )
+
n1 n2
Página 14 de 19
Considerando n1 y n2 grandes, podemos aproximar p1 e p2 en el cálculo de
la varianza por p̂1 e p̂2 , respectivamente. Luego, tenemos que
p̂1 − p̂2 − (p1 − p2 )

Z=r
p̂1 (1 − p̂1 ) p̂2 (1 − p̂2 )
+
n1 n2
Definición. Prueba de Hipótesis para la diferencia de proporciones de

dos poblaciones
Hipótesis nula: H0 : p1 − p2 = ∆0
p̂1 − p̂2 − ∆0
Z0 = r
p̂1 (1 − p̂1 ) p̂2 (1 − p̂2 )
+
n1 n2
Observação: En el caso específico que ∆0 = 0, tenemos que
p̂1 − p̂2
Z0 = s
1 1
p̂(1 − p̂) +
n1 n2
y el estimador del parámetro comun p puede ser calculado como
Y1 + Y2
p̂ =
n1 + n2

H1 : p1 − p2 6= ∆0 Probabilidad por encima de |z0 | e z0 > zα/2 ou
probabilidad por abajo de −|z0 |, z0 < −zα/2
H1 : p1 − p2 > ∆0 Probabilidad por encima de |z0 |, z0 > zα
H1 : p1 − p2 < ∆0 Probabilidad por abajo de −|z0 |, z0 < −zα
Ejemplo. Los extractos de la hierba de San Juan se utilizan ampliamente para

tratar la depresión. Un artículo comparó la eficacia de un extracto-patrón de
la hierba de San Juan con un placebo en 200 pacientes diagnosticados con
depresión unipolar. Los pacientes fueron designados aleatoriamente en dos
grupos: un grupo recibió la hierba de San Juan y el otro recibió placebo. Des-
pués de ocho semanas, 19 de los pacientes tratados con placebo mostraron
mejoría, mientras que 27 de aquellos tratados con hierba de San Juan, mejo-
raron. ¿Hay alguna razón para creer que la hierba de San Juan es efectiva en
el tratamiento de la depresión unipolar? Use α = 0,05.
Página 15 de 19
Ejemplo. (Ejemplo en Jay Devore, página 355) Algunos acusados en proce-
sos criminales se declaran culpables y son sentenciados sin un juicio en tanto
que otros que se declaran inocentes de manera subsecuente son encontra-
dos culpables y entonces son sentenciados. En años recientes, los eruditos
en leyes han especulado en cuanto si las sentencias de aquellos que se de-
claran culpables difieren en severidad de las sentencias de aquellos que se
declaran inocentes y subsecuentemente son juzgados culpables. Considere
los datos adjuntos sobre acusados de robo en el condado de San Francisco,
todos con antecedentes penales previos ("Does It Pay to Plead Guilty? Diffe-
rential Sentencing and the Functioning of Criminal Courts", Law and Society
Rev., 1981-1982: 45- 69). ¿Sugieren estos datos que la proporción de todos
los acusados en estas circunstancias que se declaran culpables y son envia-
dos a prisión difiere de la proporción que son enviados a prisión después de
declararse inocentes y que son encontrados culpables?
3.2 Intervalos de confianza para la diferencia de proporcio-

nes de dos poblaciones
El intervalo de confianza para p1 − p2 puede ser encontrado directamente,
por el hecho que sabemos que
p̂1 − p̂2
Z=r
p̂1 (1 − p̂1 ) p̂2 (1 − p̂2 )
+
n1 n2
tiene una distribución N (0, 1). Eso implica que
P (−zα/2 ≤ Z ≤ zα/2 ) = 1 − α.
Definición. Intervalo de confianza para la diferencia de proporciones de

dos poblaciones. Si p̂1 y p̂2 son las proporciones muestrales de observaci-
ones en dos muestraas aleatorias independientes, de tamaños n1 y n2 que
pertenezcan a una clase de interés, entonces un intervalo de confianza de
100(1-α)% de las proporciones verdaderas p1 − p2 será
s
p̂1 (1 − p̂1 ) p̂2 (1 − p̂2 )
p̂1 − p̂2 − zα/2 + ≤ p1 − p2 ≤
n1 n2
s
p̂1 (1 − p̂1 ) p̂2 (1 − p̂2 )
p̂1 − p̂2 + zα/2 +
n1 n2
Página 16 de 19
4 Prueba t-pareada para dos distribuciones nor-
males
pareadas
Sea (X11 , X21 ), (X12 , X22 ), · · · , (X1n , X2n ) un conjunto de n observaciones
pareadas, donde consideramos que la media y la varianza de la población
representada por X1 seam µ1 y σ12 es la media y la varianza de la población
representada por X2 seam µ2 y σ22 . Considere las diferencias entre cada par
de observaciones como Dj = X1j − X2j , j = 1, 2, · · · , n.
Considere D̄ la media de las diferencias muestrales y σd2 la varianza pobla-
cional de las diferencias. Luego,
E(D̄) = µ1 − µ2 = µd
σd2
V ar(D̄) = V ar(X̄1 − X̄2 ) = .
n
Sabemos que
D̄ − µd
Z= r (6)
σd2
n
tiene una distribución N (0, 1). Cambiando σd por Sd , la varianza muestral de
las diferencias, tenemos que
D̄ − µd
T = r (7)
Sd2
n
sigue una distribución t, con n − 1 grados de libertad.
Suponga que estamos interesados en probar la diferencia de medias µd
como igual a un valor especificado ∆0 . Así, la hipótesis nula será establecida
como H0 : µd = ∆0 .
Definición. Prueba t-pareada para dos distribuciones normales
Hipótesis nula: H0 : µd = ∆0
Estadístico de la prueba:
D̄ − ∆0
T = p 2
Sd /n
Página 17 de 19
H1 : µD 6= ∆0 Probabilidad por encima de |t0 | e t0 > tα/2,n−1 ou
Probabilidad debajo de −|t0 | t0 < −tα/2,n−1
H1 : µD > ∆0 Probabilidad encima de t0 , t0 > tα,n−1
H1 : µD < ∆0 Probabilidad por debajo de −|t0 |, t0 < −tα,n−1
Obs: D̄ es la media muestral de las n diferencias D1 , D2 , · · · , Dn y Sd es

la desviación estándar muestral de esas diferencias.
Ejemplo. Um artículo compara varios métodos para prever la resistencia a
la Cizalla (Cizalla. Herramienta similar a las tijeras pero de mayor fuerza y
tamaño, destinada a cortar materiales más duros y resistentes) em vigas pla-
nas de acero. Datos para dos de esos métodos, denominados Método 01 e
Método 02, cuando aplicados a nueve vigas específicas, son mostrados en la
siguiente tabla. Deseamos saber se hay qualquier diferencia (en media) entre
los dos métodos. Obs: Note que los procedimentos fueram aplicados en la
misma viga.
Viga Método 01 Método 02 Diferencia dj

1 1,186 1,061 0,125
2 1,151 0,992 0,159
3 1,322 1,063 0,259
4 1,339 1,062 0,277
5 1,200 1,065 0,135
6 1,402 1,178 0,224
7 1,365 1,037 0,328
8 1,537 1,086 0,451
9 1,559 1,052 0,507
(1) Parámetros de interés: Queremos probar la resistencia media a la Cizalla

entre los dos métodos, µ1 − µ2 , donde ∆0 = 0.
H0 : µ1 − µ2 = 0 ou H0 : µd = 0.

H1 : µd 6= 0.
d¯
t0 = √
sd / n
(5) Rechaze H0 si: Rechaze H0 : µd = 0 si el p-valor es menor que 0.05.

(6) Cálculo de t0 : La media y la desviación estándar de las diferencias dj
¯
son d=0,2739 y sd =0,1350, respectivamente. Luego, la estadística de la
Página 18 de 19
prueba es:
d¯ 0, 2739
t0 = √ = √ = 6, 08.
sd / n 0, 1350/ 9
(7) Conclusión: Tenemos que t0 = 6,08 y t0,025;8 = 2,306. Como t0 > t0,025;8 ,
debemos rechazar H0 , o sea, hay diferencia en la resistencia media a la
cizalla entre los dos métodos.
4.2 Intervalo de confianza para µD (muestras pareadas)

Tenemos que
D̄ − µd
T = r (8)
Sd2
n
sigue una distribución t, con n − 1 grados de libertad, o sea,
P (−tα/2,n−1 ≤ T ≤ tα/2,n−1 ) = 1 − α
Definición. Intervalo de confianza de µD para muestras pareadas. Si d¯ y

sd son la media e la desviación estándar muestral de la diferencia de n pa-
res aleatorios de medidas distribuidas normalmente, entonces el intervalo de
confianza de 100(1-α)% para la diferencia de medias µd = µ1 − µ2 será
sd sd
d¯ − tα/2,n−1 √ ≤ µd ≤ d¯ + tα/2,n−1 √ .
n n
Página 19 de 19

INFERENCIA ParaDosMuestras PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

INFERENCIA ParaDosMuestras PDF

Cargado por

Copyright:

Formatos disponibles

Sumário

1 Inferencia Estadística para dos muestras 2

2 Inferencia para las varianzas de dos distribuciones normales. 12

4 Prueba t-pareada para dos distribuciones normales 17

Figura 1: Dos poblaciones independentes.

En esta sección, consideraremos las inferencias estadísticas para la dife-

Definición. Suposiciones para Inferencia con dos muestras

(1) X11 , X12 , · · · , X1n1 es una muestra aleatoria proveniente de la población

(2) X21 , X22 , · · · , X2n2 es una muestra aleatoria proveniente de la población

(3) Las dos poblaciones representadas por X1 e X2 son independentes.

(4) Ambas poblaciones son normales.

Un estimador lógico para µ1 − µ2 es la diferencia de las medias muestrales

1.1.1 Prueba de Hipótesis (para la diferencia de medias de dos distribu-

Suponga que estamos interesados em probar la diferenia de medias µ1 −µ2

Definición. Prueba para la diferencia de medias, con varianzas conocidas

Estadístico de la prueba (bajo H0 ):

Hipótesis p-valor Criterio de rechazo para

Ejemplo. Una persona que desarrolla productos está interesada en reducir el

(1) Parámetros de interés: Queremos probar la diferencia en tiempos medios

(2) Hipótesis nula:

(3) Hipótesis alternativa:

(4) Estadístico de la prueba:

sendo σ12 = σ22 = 82 = 64 e n1 = n2 = 25.

(5) Rechaze H0 si: Rechaza H0 : µ1 = µ2 si el p-valor es menor que 0.05.

1.1.2 Intervalos de confianza (para la diferencia de medias, com varian-

Considere que X11 , X12 , · · · , X1n1 es una muestra aleatoria de n1 obser-

X̄1 − X̄2 − (µ1 − µ2 )

Definición. Intervalo de confianza para la diferencia de medias, com va-

Definición. Límites unilaterales de confianza para µ1 − µ2 son dados por:

1.2 Diferencia de medias de dos distribuciones normales

Dos situaciones diferentes deben ser consideradas. En el primer caso,

Caso I: σ12 = σ22 = σ 2 (varianzas iguales)

Suponga que tenemos dos poblaciones normales independientes, con me-

Definición. Estimador combinado de la varianza. El estimador combinado

(n1 − 1)S12 + (n2 − 1)S22

X̄1 − X̄2 − (µ1 − µ2 )

tiene una t, con n1 + n2 − 2 grados de libertad.

Definición. Prueba para la diferencia de medias, com varianzas descono-

Estadístico de la prueba (bajo H0 ):

Hipótesis p-valor Critério de rechazo para

Ejemplo. Se están analizando dos catalizadores para determinar cómo afec-

Figura 2: Datos del rendimiento de los catalizadores.

(1) Parámetros de interés: Queremos probar la diferencia en los rendimien-

(2) Hipótesis nula:

(4) Estadístico de la prueba: El estadístico de la prueba es

(5) Rechaze H0 si: Rechaze H0 : µ1 = µ2 si el p-valor es menor que 0,05.

(6) Cálculo de t0 : Primero, calcularemos el valor de sc :

(n1 − 1)s21 + (n2 − 1)s22 (7)(2, 39)2 + (7)(2, 98)2

Caso II: σ12 6= σ22 (varianzas no necesariamente iguales)

En algunas situaciones no es razonable considerar que las varianzas des-

X̄1 − X̄2 − (µ1 − µ2 )

tendrá aproximadamente una distribución t, con ν grados de libertad, donde

Obs: Si ν no es un número entero, redondee para el menor entero mas pró-

Estadístico de la prueba (bajo H0 ):

Hipótesis p-valor Criterio de rechazo para

Figura 3: Concentración de arsénico en partes por billón.

(1) Parámetros de interés: Queremos probar la diferencia en las concentra-

(3) Hipótesis alternativa:

(4) Estadístico de la prueba: El estadístico de la prueba es

Los grados de libertad para t∗0 es dado por

(6) Cálculo de t∗0 :

1.2.2 Intervalos de confianza (para la diferencia de medias de dos dis-

Caso I: σ12 = σ22 = σ 2 (varianzas iguales)