Está en la página 1de 14

UNIVERSIDAD NACIONAL AUTÓNOMA DE HONDURAS

Escuela de Matemática
Mario Antúnez Murillo
Cubículo 9

MARIO ANTUNEZ MM401 IC302 UNAH PAGINA 1


INTERVALOS DE CONFIANZA
Para diferencia de medias y proporciones
Teoría y ejemplos

MARIO ANTUNEZ MM401 IC302 UNAH PAGINA 2


Distribución muestral de las diferencias entre medias

Suponga que se tienen dos poblaciones distintas, la primera con media m1 y


desviación estándar s1, y la segunda con media m2 y desviación estándar s2, se elige
una muestra aleatoria de tamaño n1 de la primera población y una muestra
independiente aleatoria de tamaño n2 de la segunda población; se calcula la media
muestral para cada muestra y la diferencia entre dichas medias. La colección de
todas esas diferencias se llama distribución muestral de las diferencias entre medias
o la distribución muestral del estadístico X1  X2

X11 X11  X21 X21


Muestra 1 Muestra 1

Muestra 2 X12 X12  X22 X22 Muestra 2

Muestra 3
X13
X13  X23 X23 Muestra 3

Muestra k
Muestra k
X1k X1k  X2k X2k

DISTRIBUCIÓN MUESTRAL DE POBLACION 2


POBLACION 1
DIFERENCIA DE MEDIAS

MARIO ANTUNEZ MM401 IC302 UNAH PAGINA 3


Distribución muestral de las diferencias entre medias
La distribución es aproximadamente normal para n₁ ≥ 30 y n₂ ≥ 30. Si las poblaciones
son normales, entonces la distribución muestral de medias es normal sin importar
los tamaños de las muestras con
s21 s22
m x  x  m x  m x  m1  m2 s x  x  
1 2 1 2 1 2 n1 n2

Estimación de la Diferencia entre dos Medias


Se tienen dos poblaciones distintas con media m1 y m2 (desconocidas) con
desviaciones estándar s1 y s2 conocidas, se seleccionan dos muestras aleatorias
independientes, una de cada población de tamaño n₁ y n₂ con medias X1 , X2 :
El estimador puntual para la diferencia de medias entre m1 y m2 es m1  m2  X1  X2
En tanto la estimación por intervalo de confianza para la diferencia de medias
entre m1 y m2 es
s21 s22
Población 1 Población 2 m1  m2 : (X1  X2 )  Zc 
n1 n2
n₁ n₂
En el caso en que se desconozcan las desviaciones
X1 X2 poblacionales y las muestras sean mayores a 30 se
s₁ s₂ podrá utilizar las desviaciones muestrales

MARIO ANTUNEZ MM401 IC302 UNAH PAGINA 4


Población 1
Media µ desconocida n1 Media X1
Desviación s1

Población 2
Media µ desconocida n2 Media X2
Desviación s2

Criterios para la toma de conclusión en un intervalo con diferencia de medias

a < m1 m2 < b

Si a y b son negativos entonces m1  m2 < 0 o bien m1 < m2

Si a y b son positivos entonces m1  m2 > 0 o bien m1 > m2

Si a y b tiene signos distintos entonces no se puede concluir que hay diferencia

MARIO ANTUNEZ MM401 IC302 UNAH PAGINA 5


Ejemplo
A un equipo de investigación Ie interesa conocer la diferencia entre las
concentraciones de acido úrico en pacientes con y sin el síndrome de Down. En un
gran hospital para el tratamiento de pacientes con retardo mental, una muestra de
12 individuos con el síndrome presenta una media de x̅₁ = 4.5 mgl l00 mL. En un
hospital general se encontró que una muestra de 15 individuos normales de la
misma edad y sexo presenta un nivel medio de x̅₂ = 3.4. Si es razonable suponer
que las dos poblaciones de valores muestran una distribución normal y sus
varianzas son iguales a 1 y 1.5, calcule el intervalo de confianza de 95 por ciento
para m1  m2
s21 s22
m1  m2  (X1  X2 )  Zc 
Población 1 Población 2 n1 n2
Con síndrome Sin síndrome 1 1.5
 (4.5  3.4)  1.96 
muestra 12 15 12 15
media 4.5 3.4  1.1  0.8392
varianza 1 1.5 0.2608  m1  m2  1.9392

Note que m1  m2 > 0 o bien m1 > m2 , se concluye


OBS: varianza s² que los pacientes con síndrome de Down tienen
mayor concentración de ácido úrico.

MARIO ANTUNEZ MM401 IC302 UNAH PAGINA 6


Ejemplo
Un científico desea determinar si hay diferencia en el promedio de ingesta
diaria de productos lácteos entre hombres y mujeres. Tomó una muestra de
50 mujeres adultas y registró sus ingestas diarias de productos lácteos en
gramos por día. Hizo lo mismo con 50 hombres adultos. En la siguiente tabla
se presenta un resumen de sus resultados muestrales.
Construir un intervalo de confianza de 90% para la diferencia en el promedio
de ingestas diarias de productos lácteos para hombres y mujeres.
¿Se puede concluir que hay una diferencia en el promedio de ingestas diarias
para hombres y mujeres?
s21 s22
Hombres Mujeres m1  m2  (X1  X2 )  Zc 
n1 n2
muestra 50 50
352 302
media 756 762  (756  762)  1.64485 
50 50
desviación 35 30
 6  10.7231
16.7231  m1  m2  4.7231
Se desconocen las desviaciones
poblacionales las muestras sean Con base en esta información, no podemos
mayores a 30 usamos las concluir que hay una diferencia en el
desviaciones muestrales y la promedio de ingestas diarias de productos
normal lácteos para hombres y mujeres
MARIO ANTUNEZ MM401 IC302 UNAH PAGINA 7
Desafortunadamente, cuando los tamaños muestrales son pequeños, este
estadístico no tiene una distribución aproximadamente normal ni tiene una
distribución t de Student .Para formar una estadística con una distribución de
muestreo que pueda deducirse en forma teórica, es necesario hacer una
suposición más.
Un procedimiento es combinar la información de ambas varianzas muestrales
usando un promedio de varianza ponderado, en el que los pesos están
determinados por la cantidad relativa de información (grados de libertad) en cada
muestra (n  1)s2  (n  1)s2  (n  n  2)s2
1 1 2 2 1 2 p

Muestras pequeñas
Si no se conocen σ1 y σ2 y las muestras son pequeñas se puede usar la
distribución t-Student. Para ello se asume que las varianzas son desconocidas,
se suponen iguales
2 (n1  1)s21  (n2  1)s22
sp 
n1  n2  2
y el intervalo está dado por
s2p s2p
m1  m2 : (X1  X2 )  tc  con t (n1 + n22) grados de libertad
n1 n2

MARIO ANTUNEZ MM401 IC302 UNAH PAGINA 8


Puede tomarse un curso con crédito ya sea asistiendo a sesiones de clases en horas y
días fijos, o haciendo sesiones en línea que el estudiante puede hacer a su propio
paso y en los tiempos que el estudiante escoja. El coordinador del curso desea
determinar si estos dos días de tomar el curso resultaron en una diferencia
significativa en rendimiento medido por el examen final para el curso. La siguiente
información da las calificaciones en un examen con 45 puntos posibles para un grupo
de n₁  9 estudiantes que tomaron el curso en línea y un segundo grupo de n₂  9
estudiantes que tomaron el curso de clases convencionales. Los resultados se
muestran a continuación. Encuentre un intervalo de confianza de 95% para estimar la
diferencia (m₁  m₂)
En línea Salón clase 2 (n1  1)s21  (n2  1)s22
sp 
muestra 9 9 n1  n2  2
8  (4.9441)2  8  (4.4752)2
media 35.22 31.56 sp 
2
 22.2358
16
desviación 4.9441 4.4752

En este caso tc lo encontramos con 16 grados de libertad: tc = 2.1199

22.2358 22.2358
m1  m2 : (35.22  31.56)  2.120 
9 9
m1  m2 : 3.66  4.7126
1.0526 < m1  m2 < 8.3726
MARIO ANTUNEZ MM401 IC302 UNAH PAGINA 9
Distribución Muestral de Diferencia de Proporciones
Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse
utilizando proporciones o porcentajes.
¿Es mayor la proporción de los estudiantes que aprueban matemáticas que las de los que
aprueban inglés?
¿Es menor el porcentaje de los usuarios del medicamento A que presentan una reacción
adversa que el de los usuarios del fármaco B que también presentan una reacción de ese
tipo?
¿Hay diferencia entre los porcentajes de hombres y mujeres en preferencia a una comida?

p11 p11  p21 p21


Muestra 1 Muestra 1
p12 p12  p22 p22 Muestra 2
Muestra 2

Muestra 3 p13
p13  p23 p23 Muestra 3

Muestra k p1k p1k  p2k p2k


Muestra k

DISTRIBUCIÓN MUESTRAL DE POBLACION 2


POBLACION 1
DIFERENCIA DE PROPORCIONES

MARIO ANTUNEZ MM401 IC302 UNAH PAGINA 10


Distribución muestral de la diferencia entre proporciones
Sean las poblaciones con parámetros p₁ y p₂, se toman las muestras aleatorias
independientes de tamaño n₁ y n₂ de cada población, si X₁ representa el número
de éxitos de la población 1 y X₂ representa el número de éxitos de la población
La distribución muestral de la diferencia entre proporciones muestrales
 X1 X 2 
p1  p2    
Con propiedades:  n1 n2 
La media de es p1  p2  p1  p2
p1q1 p2q2 p1q1 p2q2
El error estándar es  
n1 n2 que se estima como n1 n2
la diferencia entre dos proporciones va de 1 a 1

Las fórmulas apropiadas para estimación puntual y de intervalo de confianza son

p1  p2  p1  p2 p1q1 p2q2
(p1  p2 )  Zc 
n1 n2
puntual
intervalo de confianza

MARIO ANTUNEZ MM401 IC302 UNAH PAGINA 11


Ejemplo
En un estudio para comparar los efectos de dos analgésicos se encontró que, de
200 personas seleccionadas al azar que tomaron el analgésico A el 93% indicaron
que alivió su dolor. De 450 personas seleccionadas al azar que tomaron el
analgésico B, 96% indicaron que les alivió el dolor.
Encuentre un intervalo de confianza de 99% para la diferencia en las proporciones
que experimentan alivio por estos dos analgésicos.
Con base en el intervalo de confianza del inciso anterior, ¿hay suficiente evidencia
para indicar una diferencia en las proporciones que experimentan alivio para los
dos analgésicos? Explique.

Analgésico A(1) Analgésico B(2) El estimador puntual es


p1  p2  p1  p2  0.93  0.96  0.03
muestra 200 450
p 0.93 0.96
q 0.07 0.04

p1q1 p2q2 (0.93)(0.07) (0.96)(0.04)


(p1  p2 )  Zc   (0.93  0.96)  2.57583 
n1 n2 200 450
No podemos concluir que hay diferencia
0.0822  p1  p2  0.0222
en las proporciones sobre el alivio entre
los analgésicos
MARIO ANTUNEZ MM401 IC302 UNAH PAGINA 12
Cálculo del Tamaño de la Muestra para Estimar la Diferencia de Medias
En la distribución muestral de diferencia de medias se tiene que error esta dado por:
s21 s22
E  Zc 
n1 n2
En esta ecuación considerando que los tamaños de muestra son iguales
n = n₁ = n₂ despejando para n obtenemos
Z2c (s21  s22 )
n
E2
Un director de personal quiere comparar la efectividad de dos métodos de
entrenamiento para trabajadores industriales a fin de efectuar cierta operación de
montaje. Se divide un número de operarios en dos grupos iguales: el primero recibe el
método de entrenamiento 1, y el segundo, el método 2. Cada uno realizará la
operación de montaje y se registrará el tiempo de trabajo. Se espera que las
mediciones para ambos grupos tengan una desviación estándar aproximadamente de
2 minutos. Si se desea que la estimación de la diferencia en tiempo medio de montaje
sea correcta hasta por un minuto, con una probabilidad igual a 0.95, ¿cuántos
trabajadores se tienen que incluir en cada grupo de entrenamiento?

Z2c (s21  s22 ) 1.962 (22  22 ) Cada grupo debe estar


n 2
 2
 30.7328
E 1 formado por 31 empleados.

MARIO ANTUNEZ MM401 IC302 UNAH PAGINA 13


Cálculo del Tamaño de la Muestra para Estimar la Diferencia de Proporciones
En la distribución muestral de diferencia de medias se tiene que error esta
dado por:
pq pq
E  Zc 1 1  2 2
n1 n2

En esta ecuación considerando que los tamaños de muestra son iguales


n = n₁ = n₂ despejando para n obtenemos Z2c (p1q1  p2q2 )
n
E2
Para obtener el mayor tamaño posible de muestra se toman valores de p = 0.5
Una compañía de productos alimenticios contrató a una empresa de investigación de
mercadotecnia , para muestrear dos mercados, I y II, a fin de comparar las
proporciones de consumidores que prefieren la comida congelada de la compañía
con los productos de sus competidores. No hay información previa acerca de la
magnitud de las proporciones P1 y P2. Si la empresa de productos alimenticios
quiere estimar la diferencia dentro de 0.04, con una probabilidad de 0.95, ¿ cuántos
consumidores habrá que muestrear en cada mercado?
Se tendrá que realizar encuestas a 1201
1.96 (0.5*0.5  0.5*0.5)
2
n 2
 1200.5 consumidores de cada mercado para
0.04 tener una estimación con una confianza
del 95% y un error máximo de 0.04

MARIO ANTUNEZ MM401 IC302 UNAH PAGINA 14

También podría gustarte