Está en la página 1de 26

INTERVALOS DE CONFIANZA

PARA DOS POBLACIONES


A continuación, se mostrarán las estimaciones vía intervalos de confianza para los
parámetros 𝜇, 𝜌 𝑦 𝜎 en dos poblaciones. Este tipo de estimaciones son muy
importantes cuando se quiere comparar un parámetro en dos poblaciones distintas,
por ejemplo, estimar en promedio qué tanto difieren los ingresos de hombres
respecto a los de las mujeres en una empresa particular, o estimar qué tan diferente es
la proporción de desempleados en Bogotá respecto a Medellín.
Intervalo de confianza para la diferencia entre
dos medias poblacionales, 𝜎1 y 𝜎2 conocidas

Si se tienen dos poblaciones distribuidas normal con media 𝜇1 y 𝜇2 y


desviación estándar 𝜎1 y 𝜎2 respectivamente, entonces la estimación
puntual para la diferencia de medias 𝜇1 − 𝜇2 es 𝑥ҧ1 − 𝑥ҧ2 .

Lo que se desea es estimar la diferencia de medias vía intervalo de


confianza. Para ello se toma una muestra aleatoria simple de 𝑛1
unidades para la población correspondiente a 𝜇1 y otra muestra
aleatoria simple de 𝑛2 unidades para la población correspondiente a
𝜇2 .
Cuando se tienen dos muestras aleatorias simples independientes, el error
estándar de 𝑥ҧ1 − 𝑥ҧ2 es el siguiente:

ERROR ESTÁNDAR DE 𝑥ҧ1 − 𝑥ҧ2

𝜎12 𝜎22
𝜎𝑥ҧ1 −𝑥ҧ2 = +
𝑛1 𝑛2

Si ambas poblaciones tienen distribución normal o si los tamaños de las


muestras son suficientemente grandes para que el teorema del límite
central permita concluir que las distribuciones muestrales de 𝑥ҧ1 y 𝑥ҧ2 puedan
ser aproximadas mediante una distribución normal, la distribución muestral
de 𝑥ҧ1 − 𝑥ҧ2 tendrá una distribución normal cuya media es 𝜇1 − 𝜇2 .
En el caso de la estimación de la diferencia entre dos medias
poblacionales, una estimación por intervalo tendrá la forma siguiente:

𝑥ҧ1 − 𝑥ҧ2 ± 𝑀𝑎𝑟𝑔𝑒𝑛 𝑑𝑒 𝑒𝑟𝑟𝑜𝑟

Como la distribución muestral de 𝑥ҧ1 − 𝑥ҧ2 tiene una distribución


normal, el margen de error se expresa de la siguiente manera:

𝜎12 𝜎22
𝑀𝑎𝑟𝑔𝑒𝑛 𝑑𝑒 𝑒𝑟𝑟𝑜𝑟 = 𝑧𝛼Τ2 𝜎𝑥ҧ1 −𝑥ҧ2 = 𝑧𝛼Τ2 +
𝑛1 𝑛2
ESTIMACIÓN POR INTERVALO DE LA DIFERENCIA ENTRE DOS MEDIAS
POBLACIONALES: 𝝈𝟏 y 𝝈𝟐 CONOCIDAS

𝜎12 𝜎22
𝑥ҧ1 − 𝑥ҧ2 ± 𝑧𝛼Τ2 +
𝑛1 𝑛2

donde 1 − 𝛼 es el coeficiente de confianza.


EJEMPLO 1:
Se desea comparar dos tipos de terapias (A y B) las cuales disminuyen por
completo la ansiedad por beber licor. Para hacer la comparación se toman 53
pacientes que tienen problemas con el alcohol y se les aplica la terapia A, a
otros 33 pacientes en las mismas condiciones se les aplica la terapia B. En los
pacientes que se les aplicó la terapia A se observó que el tiempo promedio
en el cual dejan por completo el alcohol fue de 39 días y a los pacientes que
se les aplicó la terapia B demoraron en promedio 44 días. Adicional a esto,
en estudios hechos anteriormente se observó que la desviación estándar del
tiempo en el cual la terapia A hace efecto es de 4.2 días y con la terapia B es
de 3.2 días. Asumiendo que los tiempos en que las terapias A y B hacen
efecto siguen una distribución normal:
A. Calcular un IC del 95% para la diferencia de los promedios en los cuales las
terapias surten efecto.
B. Con el intervalo anterior verifique si hay una diferencia significativa entre
el tiempo promedio que demoran en hacer efecto las dos terapias.
𝑋1 : Tiempo en el cual la terapia A hace efecto 𝑋2 : Tiempo en el cual la terapia B hace efecto.
𝑋1 : 𝑛1 = 53, 𝑥ҧ1 = 39 𝑑í𝑎𝑠, 𝜎1 = 4.2 𝑑í𝑎𝑠 1 − 𝛼 = 0.95
𝜎12 𝜎22
𝑋2 : 𝑛2 = 33, 𝑥ҧ 2 = 44 𝑑í𝑎𝑠, 𝜎2 = 3.2 𝑑í𝑎𝑠 𝑥ҧ1 − 𝑥ҧ2 ± 𝑧𝛼Τ2 +
𝑛1 𝑛2
Como los dos extremos del intervalo son negativos se puede concluir
(con una confianza del 95% y basados en la muestra) que la terapia B
en promedio demora más tiempo en disminuir por completo la
ansiedad de beber licor en comparación con la terapia A. En otras
palabras, la terapia A es más efectiva (en cuanto a tiempo se refiere)
que la terapia B.
La interpretación de un intervalo de confianza para 𝜇1 − 𝜇2 es:

1. Si ambos extremos del intervalo son negativos −𝑎, −𝑏 , entonces


en promedio la población 2 es mayor que la población 1 𝜇1 < 𝜇2 .

2. Si ambos extremos del intervalo son positivos 𝑎, 𝑏 , entonces en


promedio la población 1 es mayor que la población 2 𝜇1 > 𝜇2 .

3. Si un extremo del intervalo es positivo y el otro negativo


−𝑎, 𝑏 , entonces se dice que ambas poblaciones en promedio son
iguales 𝜇1 = 𝜇2 .
EJEMPLO 2:
Un administrador está indeciso en si trabajar en el hotel Estelar o en el
hotel Rancho viejo, ambos hoteles en la ciudad de Bogotá. El
administrador piensa que en el hotel Rancho viejo ganará más
comisiones que en el otro hotel. Para verificar esto, tomó el historial de
las comisiones que los dos hoteles han pagado a sus distintos
administradores en lo corrido de los 24 meses, dando unas comisiones
promedios para el hotel Estelar de $980000 y para el hotel Rancho
viejo de $1200000. Por información externa sabe que el hotel Estelar
tiene una desviación estándar de $23000 y el hotel Rancho viejo una de
$18500. Asumiendo que las comisiones en cada hotel siguen una
distribución normal, ¿Será correcto lo que piensa el administrador, con
una confianza del 99%?
EJEMPLO 3:
En un estudio realizado en una universidad de la ciudad de Bogotá
acerca de las diferencias salariales entre hombres y mujeres, se
presume que los hombres ganan más dinero que las mujeres dado que
los hombres acumulan más años de experiencia que las mujeres. Para
probar esto, se tomó una muestra de 60 hombres arrojando un
promedio salarial mensual de $1800000 y 80 mujeres arrojando un
salario promedio de $1780000. Por otras fuentes, se sabe que la
desviación estándar de los salarios de los hombres es de $100000 y de
las mujeres es de $8000. Con esta información y asumiendo que los
salarios se distribuyen normal, con una confianza 90% ¿Se puede
determinar si el estudio está en lo cierto?
𝑋1 : Salario Hombres: 𝑛1 = 60, 𝑥ҧ1 = $1800.000, 𝜎1 = $100.000 1 − 𝛼 = 0.90
𝜎12 𝜎22
𝑋2 : Salario Mujeres: 𝑛2 = 80, 𝑥ҧ2 = $1780.000, 𝜎2 = $8.000 𝑥ҧ1 − 𝑥ҧ2 ± 𝑧𝛼Τ2 𝑛1
+ 𝑛2
Intervalo de confianza para la diferencia entre
dos medias poblacionales:
• 𝜎1 y 𝜎2 desconocidas, pero iguales 𝜎1 = 𝜎2

• 𝜎1 y 𝜎2 desconocidas, pero distintas 𝜎1 ≠ 𝜎2


Intervalo de confianza para la diferencia entre dos medias
poblacionales, con 𝝈𝟏 y 𝝈𝟐 desconocidas, pero iguales 𝝈𝟏 =
𝝈𝟐
Si 𝑥ҧ1 𝑦 𝑥ҧ2 son las medias de muestras aleatorias independientes de
tamaño 𝑛1 y 𝑛2 respectivamente, provenientes de poblaciones que
siguen una distribución normal con varianzas desconocidas pero
iguales, entonces un intervalo de confianza al 1 − α 100% para 𝜇1 −
𝜇2 es:
1 1
𝑥ҧ1 −𝑥ҧ2 ± 𝑡𝛼Τ2,𝑣 𝑆𝑝 +
𝑛1 𝑛2
Donde,
𝑛1 −1 𝑠12 + 𝑛2 −1 𝑠22
𝑣 = 𝑛1 + 𝑛2 − 2 y 𝑆𝑝 =
𝑛1 +𝑛2 −2
Intervalo de confianza para la diferencia entre dos medias
poblacionales, con 𝝈𝟏 y 𝝈𝟐 desconocidas, pero pero distintas
𝝈𝟏 ≠ 𝝈𝟐
Si 𝑥ҧ1 𝑦 𝑥ҧ2 son las medias de muestras aleatorias independientes de tamaño 𝑛1 y
𝑛2 respectivamente, provenientes de poblaciones que siguen una distribución normal con varianzas
desconocidas y diferentes, entonces un intervalo de confianza al 1 − α 100% para 𝜇1 − 𝜇2 es:

𝑠12 𝑠22
𝑥ҧ1 −𝑥ҧ2 ± 𝑡𝛼Τ2,𝑣 +
𝑛1 𝑛2
Donde, 2
𝑠12 𝑠22
+
𝑛1 𝑛2
𝑣=
2 2 2 2
𝑠2
𝑠1
𝑛1 𝑛2
+
𝑛1−1 𝑛2−1
EJEMPLO 4:
Se desea comparar la velocidad con la que cierto fármaco se elimina
del organismo de hombres y mujeres. Para probar ésto, se toma una
muestra aleatoria de 22 hombres con lo que se estimó que en
promedio el fármaco se elimina en 5.4 horas con una desviación
estándar de 3.1 horas. Por otra parte, se toma una muestra aleatoria de
18 mujeres, con las que se estima que el promedio de eliminación del
fármaco es de 6.2 horas con una desviación estándar de 2.3 horas.
Asumiendo que el tiempo en el que el fármaco se elimina en hombres y
mujeres sigue una distribución normal y además las varianzas
poblacionales son iguales, pruebe mediante un intervalo de confianza
si el tiempo en que el fármaco se elimina en hombres y mujeres es
igual con una confianza del 90%.
1 1
𝑋1 : Tiempo de eliminación del fármaco en los hombres 𝑥ҧ1 −𝑥ҧ 2 ± 𝑡𝛼Τ2,𝑣 𝑆𝑝 +
𝑛1 𝑛2

𝑛1 −1 𝑠12 + 𝑛2 −1 𝑠22
𝑋2 : Tiempo de eliminación del fármaco en las mujeres 𝑣 = 𝑛1 + 𝑛2 − 2 y 𝑆𝑝 =
𝑛1 +𝑛2 −2

𝑛1 = 22, 𝑥ҧ1 = 5.4 ℎ𝑜𝑟𝑎𝑠, 𝑠1 = 3.1 ℎ𝑜𝑟𝑎𝑠 ; 𝑛2 = 18, 𝑥ҧ 2 = 6.2 ℎ𝑜𝑟𝑎𝑠, 𝑠2 = 2.3 horas 1 − 𝛼 = 0.90
EJEMPLO 5:
Se cuenta con dos métodos de enseñanza de lectura (A y B) los cuales
son dirigidos a niños de primaria. Se tiene la idea de que ambos
métodos producen resultados diferentes en los niños a los cuales se les
aplica. Para verificar esto, se aplica el método A en una muestra de 50
niños y el método B a otra muestra de 60 niños. Al finalizar el periodo
de instrucción se realiza una prueba de lectura y los resultados
obtenidos para cada método son:
Asumiendo que los puntos obtenidos en los métodos siguen una
distribución normal, calcular un intervalo de confianza al 95% y mostrar
cuál de los dos métodos de lectura es mejor.

QUEDA DE CONSULTA
Intervalo de confianza para 𝒑𝟏 − 𝒑𝟐
Por ejemplo, suponga el caso en donde se desea estimar qué tanta
diferencia hay entre la proporción de fumadores con cáncer de pulmón
𝑝1 y la proporción de personas con cáncer de pulmón que no
fuman 𝑝2 . Otro caso puede ser estimar la diferencia que hay entre la
proporción de mujeres y hombre que hacen ejercicio.

Se mostrará la expresión que permite calcular el intervalo de confianza


para 𝑝1 − 𝑝2 en muestras grandes 𝑛1 , 𝑛2 ≥ 30. El caso de muestras
pequeñas no será abordado dado que las expresiones que de allí se
derivan están fuera de nuestro alcances, pero se puede hacer su
revisión en el libro Casella & Berger (2002).
Intervalo de confianza para la diferencia entre
dos proporciones poblacionales 𝒑𝟏 − 𝒑𝟐
Si 𝑝1ҧ y 𝑝2ҧ son las proporciones de éxito en muestras aleatorias de
tamaño 𝑛1 𝑦 𝑛2 respectivamente, un intervalo de confianza al
1 − 𝛼 100% para 𝑝1 − 𝑝2 es:

𝑝1ҧ 1 − 𝑝1ҧ 𝑝2ҧ 1 − 𝑝2ҧ


𝑝1ҧ − 𝑝2ҧ ± 𝑧𝛼Τ2 +
𝑛1 𝑛2
La interpretación de un intervalo de confianza para 𝑝1 − 𝑝2 es:

1. Si ambos extremos del intervalo son negativos −𝑎, −𝑏 , entonces


la proporción de la población 2 es mayor que la proporción de la
población 1 𝑝1 < 𝑝2 .

2. Si ambos extremos del intervalo son positivos 𝑎, 𝑏 , entonces la


proporción de la población 1 es mayor que la proporción de la
población 2 𝑝1 > 𝑝2 .

3. Si un extremo del intervalo es positivo y el otro negativo


−𝑎, 𝑏 , entonces se dice que las proporciones de ambas
poblaciones ambas poblaciones en promedio son iguales
𝜇1 = 𝜇2 .
EJEMPLO 6:

Un médico ortopedista quiere probar si la osteoporosis está


relacionada con el género. Para ello, toma una muestra de 300
hombres con más de 50 años y 330 mujeres en las mismas condiciones.
De esta muestra se obtiene que 92 hombres y 102 mujeres tienen
cierto grado de osteoporosis. Con esta información ¿qué se puede
concluir con una confianza del 95%?
EJEMPLO 7:

Suponga que en la ciudad de Cartagena hay dos grandes hoteles 5


estrellas. La idea es estimar la proporción de huéspedes que se quedan
más de 7 días en cada hotel, esto con el fin de hacer un plan turístico.
Para verificarlo, se toma una muestra en el hotel A de 150 huéspedes
de los cuales 28 se quedarán más de 7 días y en el hotel B una de 175
huéspedes de los cuales 52 se quedan más de 7 días. Con esta
información verificar si existe o no diferencia en el porcentaje de
huéspedes que se quedan más de 7 días en cada hotel con una
confianza del 90%.
𝑋1 : Huéspedes que se quedan más de 7 días en el hotel A 𝑋2 : Huéspedes que se quedan más de 7 días en el hotel B
28 52 𝑝ҧ1 1−𝑝1ҧ 𝑝ҧ2 1−𝑝ҧ2
𝑝1ҧ = = 0.187 𝑝ҧ2 = = 0.297 1 − 𝛼 = 0.90 𝑝1ҧ − 𝑝ҧ2 ± 𝑧𝛼Τ2 +
150 175 𝑛1 𝑛2
EJEMPLO 8:

Se sospecha que los niños entre 4 y 5 años tienen un nivel aceptable de


habla, mientras que las niñas demoran un poco más en tener este
mismo nivel. Para verificar esta sospecha, se tomó una muestra de
1400 niños y 1280 niñas en la ciudad de Bogotá, de los cuales 980
niños y 1020 niñas que tienen entre 4 y 5 años y a su vez poseen un
nivel de habla aceptable. Con esta información y con una confianza del
95% ¿qué tan cierto es lo que se sospecha?

También podría gustarte