Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Clase 12
Clase 12
1 , y varianza 21
n2
;y
de
esperado
y varianza
x1
x2
muestrales, la estadstica
x1 x 2
es un estimador puntual de
normales, o aproximadamente normal si cumple con las condiciones del teorema del limite central (tamaos de muestras relativamente grandes). Por lo tanto,
z=
x 1 x 2 ( 1 2 )
12
n1
2 2
n2
Para calcular el intervalo de confianza para la diferencia de dos medias se debe saber si las varianzas poblacionales son conocidas o desconocidas, y en caso de que sean desconocidas, se debe probar si son iguales o diferentes. Cada uno de estos tres casos se analizarn por separado
Varianzas conocidas pero diferentes,
1 2
Si las varianzas poblacionales son conocidas y diferentes, los pasos a seguir para encontrar el intervalo de confianza son los siguientes: a) El estadstico usado como estimador puntual de la diferencia de medias
b) La variable aleatoria asociada con el estimador ser la variable normal estndar dada por:
z=
12
n1
2 2
n2
c) Para calcular el intervalo de confianza se debe tener en cuenta el nivel de confianza que se quiere considerar.
Teorema. Si
x1 x 2
independientes de tamao
n1 y n2
1 2 es:
x1 x 2 Z
12
n1
2 2
n2
1 2 x 1 x 2 + Z
12
n1
2 2
n2
Ejemplo. Construya un intervalo de confianza del 94% para la diferencia real entre las duraciones de dos marcas de focos, si una muestra de 40 focos tomada al azar de la primera marca dio una duracin media de 418 horas, y una muestra de 50 focos de otra marca dieron una duracin media de 402 horas. Las desviaciones estndares de las dos poblaciones son 26 horas y 22 horas, respectivamente. Solucin. Tenemos que: x 1 = 418 , x 1 = 402 ,
x1 x 2 Z
12
n1
2 2
n2
+ 50
1 2 x 1 x 2 + Z
1 2 ( 418 402 ) + 1 . 88
12
n1
26 2 40
2 2
n2
22 2 50
( 418 402 ) 1 . 88
26 2 40
22 2
6 .3 1 2 25 .7
Cuando las varianzas son desconocidas, se debe realizar previamente una prueba estadstica para verificar si stas son iguales o diferentes. Para hacerlo debemos hacer uso de la distribucin F, bien sea mediante el clculo de la probabilidad de que la muestra tomada provenga de dos poblaciones con varianzas iguales, o mediante el uso de un intervalo de confianza para la relacin de dos varianzas, segn se estudiar ms adelante. Como se desconocen las varianzas de la poblacin, se usan las varianzas de las muestras como estimadores. El procedimiento a seguir para el clculo del intervalo de confianza para la diferencia de dos medias ser el siguiente: a) El estadstico usado como estimador puntual de la diferencia de medias
b) La variable aleatoria asociada con el estimador ser la variable definida como (se usa t en caso de muestras pequeas):
t=
x 1 x 2 ( 1 2 ) sp 1 1 + n1 n2
donde
c) Para calcular el intervalo de confianza se debe tener en cuenta el nivel de confianza que se quiere considerar y los grados de libertad que se calculan
g.l.= n1 + n2 2
De nuevo, manipulando la expresin anterior en forma similar al caso previo se llega al siguiente teorema que nos define el intervalo de confianza para la diferencia entre dos medias desconocidas pero iguales: Teorema. Si
2 2 x1 , x 2 , s1 , s2
1 2 con varianzas
muestras aleatorias de tamaos n1 , n2 , respectivamente, tomadas de dos poblaciones normales e independientes con varianzas desconocidas pero iguales, entonces un intervalo de confianza para la diferencia entre medias
1 2 es:
x1 x 2 t s p
1 1 1 1 + 1 2 x 1 x 2 + t s p + n1 n2 n1 n2
Ejemplo. La siguiente tabla presenta los resultados de dos muestras aleatorias para comparar el contenido de nicotina de dos marcas de cigarrillos.
Suponiendo que los conjuntos de datos provienen de muestras tomadas al azar de poblaciones normales con varianzas desconocidas e iguales, construya un intervalo de confianza del 95% para la diferencia real de nicotina de las dos marcas.
2 Solucin. Como las varianzas son iguales, calculamos s p que est dado por:
s2 p
( 9 )0 . 5 2 + ( 7 )0 . 7 2 = = 0.355 16
s p = 0.596
x1 x 2 t s p
1 1 1 1 + 1 2 x 1 x 2 + t s p + n1 n2 n1 n2
1 1 1 1 + 1 2 3.1 2.7 + 2.21 ( 0.596 ) + 10 8 10 8
0.2 1 2 1.0
a) El estadstico usado como estimador puntual de la diferencia de medias 1 2 , ser x 1 x 2 , que es un estimador suficiente b) La variable aleatoria asociada con el estimador ser la variable t definida como:
t=
x 1 x 2 ( 1 2 )
2 s12 s2 + n1 n2
c) El intervalo de confianza esta dado por el siguiente teorema, basado en la distribucin t con n grados de libertad.
Teorema. . Si
2 2 x1 , x 2 , s1 , s2
muestras aleatorias de tamaos n1 , n2 , respectivamente, tomadas de dos poblaciones normales e independientes con varianzas desconocidas y diferentes, entonces un intervalo de confianza para la diferencia entre medias
x1 x 2 t
(s
2 1
/ n1 + s / n2 )
2 2
( s 2 / n ) 2 / ( n 1) + ( s 2 / n ) 2 / ( n 1) 1 2 1 1 2 2
Nota. Si llevamos a cabo un clculo de intervalo de confianza para diferencia de medias, suponiendo que las varianzas no son iguales, en el dado caso que s lo fueran, perderamos muy poco, y el intervalo obtenido sera un poco conservador. El caso de que supongamos que las varianzas son iguales, siendo que no lo son, nos produce un error mayor que puede ser considerable por lo que una sugerencia es usar varianzas diferentes como regla general.
Problema. Cierto metal se produce, por lo comn, mediante un proceso estndar. Se desarrolla un nuevo proceso en el que se aade una aleacin a la produccin del metal. Los fabricantes se encuentran interesados en estimar la verdadera diferencia entre las tensiones de ruptura de los metales producidos por los dos procesos. Para cada metal se seleccionan 12 ejemplares y cada uno de stos se somete a una tensin hasta que se rompe. La siguiente tabla muestra las tensiones de ruptura de los ejemplares, en kilogramos por centmetro cuadrado:
Si se supone que el muestreo se llev a cabo sobre dos distribuciones normales e independientes, obtener los intervalos de confianza estimados del 95 y 99% para la diferencia entre los dos procesos. Interprete los resultados.
Media
S 24.8 14.9
=
12 443.3 12 451.4
(s
2 1
/ n1 + s / n2 )
2 2
( s 2 / n ) 2 / ( n 1) + ( s 2 / n ) 2 / ( n 1) 1 2 1 1 2 2
Distribution Plot
T, df=18 0.4
= 18
0.3 Density
95% de confianza
0.2
0.1
t1 = 2.10, t2 = -2.10
x1 x 2 t
0.025
2 2 s1 s2 + 1 2 x 1 x 2 + t n1 n2
2 2 s1 s2 + n1 n2
Por lo tanto:
14.9 2 24.8 2 14.9 2 24.8 2 (451.4 443.3) 2.10 + 1 2 (451.4 443.3) + 2.10 + 12 12 12 12
-25.65 1 2 9.49
Y para 99% de confianza
0.4
Distribution Plot
T, df=18
t1 = 2.88, t2 = -2.88
Density
0.3
0.2
0.1
0.0
0.005
14.9 2 24.8 2 14.9 2 24.8 2 (451.4 443.3) 2.88 + 1 2 (451.4 443.3) + 2.88 + 12 12 12 12
-32.16 1 2 15.99