Está en la página 1de 16

Intervalos de Confianza

para la diferencia de medias

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS


Sean x11 , x12 , ... x1n1 , una muestra aleatoria de n1
observaciones tomadas de una primera poblacin con valor esperado

1 , y varianza 21

de

n2

;y

x 21 , x 22 , ... x 2n 2 , una muestra aleatoria

observaciones tomada de la segunda poblacin con valor

esperado

y varianza

muestrales, la estadstica

2 2 . Si

x1

x1 x 2

x2

son las medias

es un estimador puntual de

1 2 , y tiene una distribucin normal si las dos poblaciones son

normales, o aproximadamente normal si cumple con las condiciones del


teorema del limite central (tamaos de muestras relativamente grandes).
Por lo tanto,

z=

x 1 x 2 ( 1 2 )

12
n1

22
n2

Para calcular el intervalo de confianza para la diferencia de dos medias


se debe saber si las varianzas poblacionales son conocidas o
desconocidas, y en caso de que sean desconocidas, se debe probar si
son iguales o diferentes. Cada uno de estos tres casos se analizarn por
separado
Varianzas conocidas pero diferentes,

1 2

Si las varianzas poblacionales son conocidas y diferentes, los pasos a


seguir para encontrar el intervalo de confianza son los siguientes:
a) El estadstico usado como estimador puntual de la diferencia de
medias

1 2 , ser T = x 1 x 2 , que es un estimador suficiente

b) La variable aleatoria asociada con el estimador ser la variable


normal estndar dada por:

z=

x 1 x 2 ( 1 2 )

12
n1

22
n2

c) Para calcular el intervalo de confianza se debe tener en cuenta el


nivel de confianza que se quiere considerar.

Teorema. Si

x1 x 2

son las medias de dos muestras aleatorias

independientes de tamao

n1 y n2

tomadas de poblaciones que

2
2
tienen varianzas conocidas 1 y 2 , respectivamente, entonces el

intervalo de confianza para

x1 x 2 Z

12
n1

22
n2

1 2 es:

1 2 x 1 x 2 + Z

12
n1

22
n2

Ejemplo. Construya un intervalo de confianza del 94% para la diferencia


real entre las duraciones de dos marcas de focos, si una muestra de 40
focos tomada al azar de la primera marca dio una duracin media de
418 horas, y una muestra de 50 focos de otra marca dieron una duracin
media de 402 horas. Las desviaciones estndares de las dos
poblaciones son 26 horas y 22 horas, respectivamente.
Tenemos que: x 1 = 418 , x 1 = 402 ,

Solucin.

1 = 26, 2 = 22, n1 = 40, n 2 = 50, Z = 1.88


El intervalo de confianza es, entonces:

x1 x 2 Z

12

( 418 402 ) 1 . 88

n1

26 2
40

22
n2
+

1 2 x 1 x 2 + Z

22 2
50

1 2 ( 418 402 ) + 1 . 88

6 .3 1 2 25 .7

12
n1
26 2
40

22
n2
22 2
50

2
2
2
(

)
Varianzas desconocidas e iguales
1
2

Cuando las varianzas son desconocidas, se debe realizar previamente


una prueba estadstica para verificar si stas son iguales o diferentes.
Para hacerlo debemos hacer uso de la distribucin F, bien sea mediante
el clculo de la probabilidad de que la muestra tomada provenga de dos
poblaciones con varianzas iguales, o mediante el uso de un intervalo de
confianza para la relacin de dos varianzas, segn se estudiar ms
adelante. Como se desconocen las varianzas de la poblacin, se usan
las varianzas de las muestras como estimadores.
El procedimiento a seguir para el clculo del intervalo de confianza para
la diferencia de dos medias ser el siguiente:
a) El estadstico usado como estimador puntual de la diferencia de
medias

1 2 ser x 1 x 2 , que es un estimador suficiente.

b) La variable aleatoria asociada con el estimador ser la variable


definida como (se usa t en caso de muestras pequeas):

t=

x 1 x 2 ( 1 2 )
sp

donde

1
1
+
n1 n2

s p es un estimador combinado de las s 2 , mejor que s12 , s22

por separado, donde

2
2
(
n
1)
s
(
n
1)
s

1
2
2
s 2p = 1
n1 + n2 2

c) Para calcular el intervalo de confianza se debe tener en cuenta el


nivel de confianza que se quiere considerar y los grados de libertad que
se calculan

g.l.= n1 + n2 2

De nuevo, manipulando la expresin anterior en forma similar al caso


previo se llega al siguiente teorema que nos define el intervalo de
confianza para la diferencia entre dos medias
desconocidas pero iguales:
Teorema. Si

x1 , x 2 , s12 , s22

1 2 con varianzas

son las medias y las varianzas de dos

muestras aleatorias de tamaos n1 , n2 , respectivamente, tomadas de


dos poblaciones normales e independientes con varianzas desconocidas
pero iguales, entonces un intervalo de confianza para la diferencia entre
medias

1 2 es:

x1 x 2 t s p

1
1
1
1
+
1 2 x 1 x 2 + t s p
+
n1 n2
n1 n2

Ejemplo. La siguiente tabla presenta los resultados de dos muestras


aleatorias para comparar el contenido de nicotina de dos marcas de
cigarrillos.

Suponiendo que los conjuntos de datos provienen de muestras tomadas


al azar de poblaciones normales con varianzas desconocidas e iguales,
construya un intervalo de confianza del 95% para la diferencia real de
nicotina de las dos marcas.
2
Solucin. Como las varianzas son iguales, calculamos s p que est dado
por:

s 2p

( 9 )0 . 5 2 + ( 7 )0 . 7 2
=
= 0.355
16

s p = 0.596

El intervalo de confianza del 95% est dado por (t(0.025,g.l.16) = 2.21):

x1 x 2 t s p

1
1
1
1
+
1 2 x 1 x 2 + t s p
+
n1 n2
n1 n2

3.1 2.7 2.21 ( 0.596 )

1 1
1 1
+ 1 2 3.1 2.7 + 2.21 ( 0.596 )
+
10 8
10 8
0.2 1 2 1.0

2
2

Varianzas desconocidas y diferentes 1


2

a) El estadstico usado como estimador puntual de la diferencia de


medias 1 2 , ser x 1 x 2 , que es un estimador suficiente
b) La variable aleatoria asociada con el estimador ser la variable t
definida como:

t=

x 1 x 2 ( 1 2 )
s12 s22
+
n1 n2

c) El intervalo de confianza esta dado por el siguiente teorema, basado


en la distribucin t con n grados de libertad.

Teorema. . Si

x1 , x 2 , s12 , s22

son las medias y las varianzas de dos

muestras aleatorias de tamaos n1 , n2 , respectivamente, tomadas de


dos poblaciones normales e independientes con varianzas desconocidas
y diferentes, entonces un intervalo de confianza para la diferencia entre
medias

1 2 es (nuevamente para el caso de muestras pequeas):

x1 x 2 t

s12 s22
+
1 2 x 1 x 2 + t
n1 n2

s12 s22
+
n1 n2

Los grados de libertad estn dados por:

(s

2
1

/ n1 + s / n2 )
2
2

( s 2 / n ) 2 / ( n 1) + ( s 2 / n ) 2 / ( n 1)
1
2
1 1
2 2

Nota: el valor obtenido se redondea al entero ms prximo.

Nota.
Si llevamos a cabo un clculo de intervalo de confianza para
diferencia de medias, suponiendo que las varianzas no son
iguales, en el dado caso que s lo fueran, perderamos muy
poco, y el intervalo obtenido sera un poco conservador.
El caso de que supongamos que las varianzas son iguales,
siendo que no lo son, nos produce un error mayor que puede
ser considerable por lo que una sugerencia es usar varianzas
diferentes como regla general.

Problema. Cierto metal se produce, por lo comn, mediante un proceso


estndar. Se desarrolla un nuevo proceso en el que se aade una
aleacin a la produccin del metal. Los fabricantes se encuentran
interesados en estimar la verdadera diferencia entre las tensiones de
ruptura de los metales producidos por los dos procesos. Para cada
metal se seleccionan 12 ejemplares y cada uno de stos se somete a
una tensin hasta que se rompe.
La siguiente tabla muestra las tensiones de ruptura de los ejemplares,
en kilogramos por centmetro cuadrado:

Si se supone que el muestreo se llev a cabo sobre dos distribuciones


normales e independientes, obtener los intervalos de confianza
estimados del 95 y 99% para la diferencia entre los dos procesos.
Interprete los resultados.

Solucin:
Calculamos los valores que necesitamos.

Media

12 443.3
12 451.4

S
24.8
14.9

(s

2
1

/ n1 + s22 / n2 )

( s / n ) / ( n 1) + ( s / n ) / ( n 1)
1
1
2
2

2
1

2
2

Distribution Plot
T, df=18
0.4

95% de confianza

Density

0.3

0.2

0.1

t1 = 2.10, t2 = -2.10
x1 x 2 t

0.025
0.0

0.025
-2.10

s12 s22
+
1 2 x 1 x 2 + t
n1 n2

0
X

s12 s22
+
n1 n2

2.10

= 18

Por lo tanto:
14.9 2 24.8 2
14.9 2 24.8 2
(451.4 443.3) 2.10
+
1 2 (451.4 443.3) + 2.10
+
12
12
12
12

-25.65 1 2 9.49
Y para 99% de confianza

Distribution Plot
T, df=18
0.4

t1 = 2.88, t2 = -2.88
Density

0.3

0.2

0.1

0.0

0.005

0.005
-2.88

0
X

2.88

14.9 2 24.8 2
14.9 2 24.8 2
(451.4 443.3) 2.88
+
1 2 (451.4 443.3) + 2.88
+
12
12
12
12

-32.16 1 2 15.99

También podría gustarte