Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Mód. Estadística Aplicada PDF
Mód. Estadística Aplicada PDF
AUTNOMO
Asignatura
ESTADSTICA II
Autor: RODRIGO AL VALLEJOS
AUTOR
RODRIGO AL:
INVITACIN AL MDULO
Estimado alumno
Los conocimientos de teora estadstica son la base del soporte tecnolgico y la base sobre
la cul se puede hacer un uso racional, sistemtico y tico de la sorprendente tecnologa que se
incorpora cotidianamente a nuestro quehacer laboral. Por tanto, no es solo la necesidad de
calcular, medir o de disponer de herramientas mecnicas directas por lo cul hay que estudiar
disciplina, sino que nos debe mover el manifiesto inters por desarrollar nuestra capacidad de
desicin, aumentar nuestra capacidad de analizar, discriminar, abstraer y sintetizar informacin,
optimizando as nuestra rapidez y eficacia para enfrentar el conjunto de situaciones problemticas
que afectan diariamente al conjunto de nuestra actividad.
Esperando para ti todo el xito posible, te invito a iniciar la tarea del aprendizaje
sistemtico, que te conducir a la obtencin de tus objetivos personales y profesionales.
ASIGNATURA
ESTADSTICA
OBJETIVO GENERAL
Al trmino del curso, el alumno ser capaz de:
OBJETIVOS ESPECFICOS
ASIGNATURA
ESTADSTICA
PRIMERA UNIDAD
DISTRIBUCIONES CONTINUAS
1.1
1.2
DISTRIBUCIN NORMAL
Esta curva permite describir muchos fenmenos que ocurren en la naturaleza, la industria y la
investigacin.
Una variable aleatoria (v.a) continua que tiene distribucin en forma de campana se llama
variable aleatoria normal.
Concepto: La funcin de la variable aleatoria , con media y varianza 2, est dada por:
f (X ) =
1
2
1 X
< x <
X ~ N ( , 2 )
Sin embargo, resolver esta integral con la funcin de densidad de la variable aleatoria normal no
es tan simple. Por tal motivo, se recurre a un proceso denominado estandarizacin basndose en
una variable aleatoria z que tiene =0 y 2=1 y que se denomina distribucin normal estndar.
1
2
1
Z2
2
- < x <
Z ~ N (0,1)
Si X ~ N ( , 2 ), entonces Z =
~ N (0,1)
Ejemplos
1) P(z>1,84)
P(z>1,84)=1-P(z 1,84)
= 1-0,9671
= 0,0329
2) P(-1,97<z<0,86)
P(-1,97<z<0,86) =
P(z<0,86)- P(z<-197)
0,8051-0,0244
0,7807
3) P(z>z0)=0,7486
P(z>z0)=0,7486
1-P(z z0)=0,7486
1-0,7486 = P(z z0) P(z z0) = 0,2514 z0=-067
z 40
P z
= 0.45
6
x 40
= 0.13 x = 39,22
6
b) P( X>x )= 0,14
x 40
1 P z
= 0,14
6
x 40
x 40
P z
= 1,08 x = 46,48
= 0,86
6
6
10
EJERCICIOS
a) P(z<0,83)
Resp: 0,7967
b) P(z<-1,27)
Resp: 0,1020
c) P(z>0,83)
Resp: 0,2033
d) P(z>-1,27)
Resp: 0,898
e) P(0,47<z<1,08)
Resp: 0,1791
f) P( -1,39<z<1,39)
Resp: 0,8354
g) P(z>z1)=0,06
Resp: z1=1,55
h) P(-0,93<z<z1)=0,7235
Resp: z1=1,28
II) Dada la v.a. X distribuida normalmente con media 18 y desviacin estndar 2,5 , encuentre:
a) P(x<15)
Resp: 0,1151
b) P(x<x1)
Resp: x1=16,1
c) P(x<x1)
Resp: x1=20,28
d) P(17<x<21)
Resp: 0,4009
11
Problemas de aplicacin
1) Cierto tipo de batera dura un promedio de tres aos, con una desviacin estndar de 0,5
aos. Suponiendo que las duraciones de las bateras son normalmente distribuidas,
encuentre la probabilidad de que una determinada batera dure menos de 2,3 aos.
Solucin:
X ~ N (3, (0,5) 2 )
X = Duracin de la batera
X ~ N (3, (0,5) 2 )
X = Duracin de la batera
P( x < 2,3)
2,3 3
= P z <
0,5
= P ( z < 1,4)
= 0,0808
La probabilidad de que una determinada batera dure menos de 2,3 aos es de un 8,08%.
12
2) Una compaa fabrica focos cuya duracin es normalmente distribuida con una media de
800 horas y una desviacin estndar de 40 horas. Encuentre la probabilidad de que un
foco dura entre 778 y 834 horas de uso.
Solucin
X ~ N (800, (40) 2 )
P (778 < x < 834)
40
40
La probabilidad de que un foco dure entre 778 y 834 horas de uso es de un 51,11%.
13
3) Una cierta mquina produce resistencias alctricas que tienen un valor medio de 40 ohms
y una desviacin estndar de 2 ohms. Suponiendo que los valores de las resistencias
siguen una distribucin normal y que pueden medirse con cualquier grado de precisin.
Que porcentaje de las resistencias tendr un valor que exceda los 43 ohms ?
Solucin:
X ~ N (40, (2) 2 )
P( x > 43)
= 1 P z
= 1 P( z 1,5)
= 1 0,9332
= 0,0668
14
4) En una empresa las edades de los trabajadores se distribuye normalmente con media 50
aos y desviacin estndar 5 aos.
a) Qu porcentaje de los trabajadores tiene entre 50 y 52,5 aos ?
b) Cul es la probabilidad de qque un trabajador cualquiera no sea mayor de 45 aos?
c) Cul es la probabilidad que un trabajador tenga entre 41 y 58 aos?
d) El 20% de los trabajadores estn bajo cierta edad Cul es esa edad?
Solucin:
X ~ N (50, (5) 2 )
5
5
b) P ( x 45)
45 50
= P z
= P ( z 1)
= 0,1587
15
58 50
41 50
= P
<z<
5
5
= P (1,8 < z < 1,6)
= P ( z < 1,6) P ( z < 1,8)
= 0,9093
d) P( X < x) = 0,20
x 50
x 50
P z
= -0,85 x = 45,75
= 0,20
5
5
El 20% de los trabajadores tiene una edad menor o igual a 45,75 aos.
16
1) Las piezas de pan de centeno distribuidas a las tiendas locales por una cierta pastelera
tienen una longitud promedio de 30 cm y una desviacin estndar de 2 cm. Suponiendo
que las longitudes estn normalmente distribuidas. Qu porcentaje de las piezas son :
a) De ms de 31,7 cm de longitud ?
b) Entre 29,3 y 33,5 cm de longitud ?
c) De una longitud menor que 25,5 cm ?
2) Una mquina despachadora de refrescos est ajustada para servir un promedio de 200
mililtros por vaso. Si la cantidad de refresco est normalmente distribuida con una
desviacin estndar de 15 mililtros.
17
5) La vida promedio de cierto tipo de motor pequeo es de 10 aos con una desviacin
estndar de 2 aos. El fabricante repone sin cargo todos los motores que fallen dentro del
perodo de garanta. Si est a reponer slo el 3% de los motores que fallan, qu tan larga
deber ser la garanta que otorgue? Suponga que la vida de los motores tienen distribucin
normal.
6) Suponga que un consultor est investigando cunto tiempo necesitarn los obreros de la
fbrica para montar cierta pieza en una planta de automviles Volvo, y determin que la
informacin ( tiempo en segundos ) estaba normalmente distribuida con una media de 75
segundos y una desviacin estndar de 6 segundos.
18
9) Un procesador de alimentos envasa caf en pequeos tarros, los pesos de los tarros estn
normalmente distribuidos con una desviacin estndar de 0,3 onzas. Si el 5% de los tarros
pesa ms de de 12,492 onzas. Cul es el promedio de los tarros?
19
1)
a) El 19,77% de las piezas tiene una longitud de ms de 31,7 cm.
b) El 59,67% de las piezas tiene una longitud menos que 25,5 cm.
2)
a) El 5,48% de los vasos contendr ms de 224 mililtros
b) El 5,18% de los vasos tendr entre 191 y 209 mililtros
3)
a) El 0,62% de los anillos tendr un dimetro superior a 10,075 cm.
b) El 68,26% de los anillos tendr un dimetro entre 9,97 y 10,03 cm.
c) El 15% de los anillos tendr un dimetro de 9,9688 cm.
4)
a) El 6,68% de los componentes exceden de 10.150 Kg/cm2 de resistencia a la tensin.
b) El 4,56% de las piezas se despacharn
6)
a) Existe un 65,87% de probabilidad de que un obrero pueda montar una pieza en menos de
75
62
seg.
d) Existe un 14,37% de probabilidad de que un obrero pueda montar una pieza entre 62y 69 seg.
e) Deben pasar 75 segundos antes de que el 50% de los obreros monten la pieza.
20
7)
Se cumple que el 99,04% de las arandelas tiene un espesor entre 0,0180 y 0,202 pulgadas.
8)
a) El 92,7% de las personas tiene un tiempo de reaccin entre 14 y 30 segundos.
b) El 9,94% de las personas tiene un tiempo de reaccin entre 25 y 30 segundos.
c) El 93,32% de las personas tiene un tiempo de reaccin de ms de 14 segundos.
d) El tiempo de reaccin es de 10,38 segundos.
21
DISTRIBUCIN T-STUDENT
Definicin
Sean X1,X2,Xn variables aleatorias identicamente distribuidas con distribucin normal con
media y varianza 2. Entonces la variable:
T=
(x ) n
s
tiene distribucin t-student con v=n-1 grados de libertad donde n es el tamao de la muestra, x es
la media de la muestra y s es la varianza muestral. La grfica de esta distribucin es similar a la
distribucin normal y est dada por:
Al igual que la distribucin normal los valores de rea de esta distribucin se encuentran
tabulados.
La distribucin de probabilidad T se public por primera vez en 1908 en un artculo de W.S.
Gosset. En esa poca , Gosset era empleado de una cervecera irlandesa que desaprobaba la
publicacin de investigaciones de sus empleados. Para evadir esta prohibicin, public su trabajo
en secreto bajo el nombre de Student. En consecuencia, la distribucin T normalmente se llama
distribucin t de Student, o simplemente distribucin t.
La distribucin T es similar a la distribucin de Z, pues ambas son simtricas alrededor de la
media igual a cero. Ambas distribuciones tienen forma de campana, pero la distribucin t es ms
variable, debido al hecho que la distribucin t depende de las cantidades de x y s2.
22
Ejemplos
1) El valor de t con v=14 grados de libertad que deja un rea de 0.0975 a la derecha es:
2) Encuentre P(-t0.025<T<t0.05).
Solucin:
Como t0.05 deja un rea de 0.05 a la derecha, y t0.025 deja un rea de 0.025 a la izquierda,
encontrmos un rea total de:
1-0.05-0.025=0.925
Solucin:
Notemos que 1.761 corresponde a t0.05 cuando v=14. Por tanto, -t0.05=-1761. Como k en el
enunciado de de la probabilidad original est a la izquieda de t0.05 = -1761,
luego k=-2.977.
23
gramos por milmetro y una desviacin estndar s=40 gramos?. Suponga que la
distribucin de rendimientos es aproximadamente normal.
Solucin:
De la tabla t-student encontramos que t0.05=1.711 para 24 grados de libertad. Por tanto, el
fabricante que satisfecho con esta afirmacin si para la muestra de tamao 25 el valor de t queda
entre -1.711 y 1.711. Si =500 entonces:
t=
( x ) n (518 500) 25
=
= 2.25
s
40
Como t=2.25 no est entre -1711 y 1.711 el fabricante debe revisar su proceso productivo.
24
25
1)
a) P= 0.975
b) P= 0.10
c) P= 0.875
2)
a) k=2.5
b) k=1.319
c) k=1.714
x
=
2
i
n( x 2 )
n 1
( x ) n ( x 0.5) n
>
P ( < 0.5) = P
s
s
(0.475 0.5) 8
= P T7 <
0
.
183
= P (T7 < 0.38) = P (T7 < 0.38) = P (T7 > 0.38) = 0.3
26
4) Calculemos: P(>0.6)
( x ) n ( x 0.6) n
>
P ( > 0.6) = P
s
s
(0.75 0.6) 16
= P T15 >
0.175
Luego la probabilidad que el contenido promedio de nicotina se mayor que 0.6 milgramos es
muy baja por tanto el fabricante podra tener razn sobre los contenidos promedio de nicotina de
sus cigarros.
27
Distribucin ji-cuadrado
Definicin
2 =
(n 1) S 2
x
=
2
i
n( x 2 )
n 1
Al igual que las otras distribuciones sus valores de probabilidad se encuentran tabulados.
28
Ejemplo:
Un fabricante de bateras para auto garantiza que sus bateras durarn, en promedio tres aos
con una desviacin estndar de un ao. Si cinco de estas bateras tienen duraciones de 1.9,
2.4, 3.0 , 3.5 y 4.2 aos, el fabricante an est convencido de que sus bateras tienen una
desviacin estndar de un ao? Suponga que la duracin de la batera tiene distribucin
normal.
Solucin:
x
=
n( x 2 )
n 1
= 0.815
2 =
(n 1) S 2
(4)(0.815)
= 3.26
1
(n 1) s 2 (4)(0.815)
= P 42 < 3.26 = 0.5
P ( s < 1) = P
<
1
29
1) Para 2 encuentre :
2
a) 0.005
cuando v = 15
2
b) 0.05
cuando v = 7
2
c) 0.01
cuando v = 24
2) Encuentre 02 si :
a) P( 2 > 02 ) = 0.99 con v = 5
b) P( 12- > 02 ) = 0.025 con v = 19
c) P(37.652 < 2 < 02 ) = 0.045 con v = 25
3) Un fabricante de bateras para auto garantiza que sus bateras duraran en promedio, tres aos
con una desviacin estandar de 1 ao .Si 5 de estas bateras tienen duraciones de 1.9, 2.4, 3.0, 3.5
y 4.2 aos. Cual es la probabilidad de que la variabilidad de las bateras sea de ms de 3 aos ?
4) Considere una medicin fsica proporcionada por un instrumento de precisin, en donde el
inters recae en la variabilidad de la lectura .suponga que, con base en la experiencia, la medicin
es una variable aleatoria normalmente distribuida con media 10 y desviacin estndar 0.1
unidades. Si se toma una muestra aleatoria procedente de un proceso de manofactura de los
instrumentos de tamao 25, cul es la probabilidad de que el valor de la varianza muestral sea
mayor de 0.014 unidades cuadradas ?
30
1)
a) 27.488
b) 18.475
c) 36.415
2)
a) 13.277
b) 32.852
c) 46.928
3) y 4) tarea
31
ASIGNATURA
ESTADSTICA
SEGUNDA UNIDAD
TCNICAS DE MUESTREO Y ESTIMACIN
PUNTUAL
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
Tamao de muestra.
32
Si los datos que buscamos los podemos obtener a partir de una pequea parte del total de
la poblacin, los gastos de recogida y tratamiento de los datos sern menores. Por
ejemplo, cuando se realizan encuestas previas a un referndum, es ms barato preguntar a
4.000 personas su intencin de voto, que a 30.000.000;
Mayor rapidez:
Estamos acostumbrados a ver cmo con los resultados del escrutinio de las primeras
mesas electorales, se obtiene una aproximacin bastante buena del resultado final de unas
elecciones, muchas horas antes de que el recuento final de votos haya finalizado;
Ms posibilidades:
Para hacer cierto tipo de estudios, por ejemplo el de duracin de cierto tipo de bombillas,
no es posible en la prctica destruirlas todas para conocer su vida media, ya que no
quedara nada que vender. Es mejor destruir slo una pequea parte de ellas y sacar
conclusiones sobre las dems.
De este modo se ve que al hacer estadstica inferencial debemos enfrentarnos con dos problemas:
33
Muestreo aleatorio
Consideremos una poblacin finita, de la que deseamos extraer una muestra. Cuando el proceso
de extraccin es tal que garantiza a cada uno de los elementos de la poblacin la misma
oportunidad de ser incluidos en dicha muestra, denominamos al proceso de seleccin muestreo
aleatorio.
Con reposicin.
1
La probabilidad de que e sea elegido en primer lugar es N ;
N
Si no ha sido elegido en primer lugar (lo que ocurre con una probabilidad de N 1 , la
1
probabilidad de que sea elegido en el segundo intento es de N 1 .
34
N N 1 N (n 1)
( N n)!
=
N!
=
n! ( N n)!
N!
35
El muestreo aleatorio con reposicin es tambin denominado muestreo aleatorio simple, que
como hemos mencionado se caracteriza por que:
36
t
10 k
pueden ser consideradas como observaciones de una v.a. U, que sigue una distribucin uniforme
en el intervalo [0,1]
37
Mtodo de Montecarlo
El mtodo de Montecarlo es una tcnica para obtener muestras aleatorias simples de una v.a. X,
de la que conocemos su ley de probabilidad (a partir de su funcin de distribucin F). Con este
mtodo, el modo de elegir aleatoriamente un valor de X siguiendo usando su ley de probabilidad
es:
1. Usando una tabla de nmeros aleatorios se toma un valor u de una v.a. U~U(0,1).
2. Si X es continua tomar como observacin de X, la cantidad x=F-1(u). En el caso en que X sea
discreta se toma x como el percentil 100* de X, es decir el valor ms pequeo que verifica que
F(x).
Este proceso se debe repetir n veces para obtener una muestra de tamao n.
Ejemplo
Si queremos extraer n=10 muestras de una distribucin N(0,1) podemos recurrir a una tabla de
nmeros aleatorios de k=5 cifras, en las que observamos las cantidades (por ejemplo)
ti
ui
76.293
0'76
0'71
31.776
0'32(=1-0'68)
-0'47
50.803
0'51
0'03
71.153
0'71
0'55
20.271
0'20(=1-0'80)
-0'84
33.717
0'34(=1-0'66)
-0'41
38
xi = F-1(ui)
17.979
0'18(=1-0'82)
-0'92
52.125
0'52
0'05
41.330
0'41(=1-0'59)
-0'23
95.141
0'95
1'65
Obsrvese que como era de esperar, las observaciones xi tienden a agruparse alrededor de la
esperanza matemtica deXi~N(=0, 2=1). Por otra parte, esto no implica que el valor medio de
la muestra sea necesariamente x = 0 . Sin embargo como sabemos por el teorema de Fischer que
10
1
X = X i ~ N x = 0, x2 =
10
i =1
su dispersin con respecto al valor central es pequea, lo que implica que probablemente el valor
medio
1
(0,71 + ...... + 1,65) = 0,012
10
39
MUESTREO ESTRATIFICADO
40
1 varn.
9 hembras.
Asignacin proporcional
Sea n el nmero de individuos de la poblacin total que forman parte de alguna muestra:
n=n1,n2,,nk
Cuando la asignacin es proporcional el tamao de la muestra de cada estrato es proporcional al
tamao del estrato correspondiente con respecto a la poblacin total:
ni = n
41
Ni
N
Asignacin ptima
Cuando se realiza un muestreo estratificado, los tamaos muestrales en cada uno de los estratos,
ni, los elige quien hace el muestreo, y para ello puede basarse en alguno de los siguientes
criterios:
Elegir los ni de tal modo que se minimice la varianza del estimador, para un coste
especificado, o bien,
habiendo fijado la varianza que podemos admitir para el estimador, minimizar el coste en
la obtencin de las muestras.
El estrato es ms grande;
Para ajustar el tamao de los estratos cuando conocemos la dispersin interna de cada uno de los
mismos, tenemos el siguiente resultado:
Muestreo sistemtico
Cuando los elementos de la poblacin estn ordenados en fichas o en una lista, una manera de
muestrear consiste en
Sea k=N/n ;
{e
m, m+ k
, em + 2 k ,..., em + ( n 1) k }
42
Observacin
El mtodo tal como se ha definido anteriormente es sesgado si N/n no es entero, ya que los
ltimos elementos de la lista nunca pueden ser escogidos. Un modo de evitar este problema
consiste en considerar la lista como si fuese circular (el elemento N+1 coincide con el primero)
y:
Se puede comprobar que con este mtodo todos los elementos de la lista tienen la misma
probabilidad de seleccin.
despus elegir calles y edificios. Una vez elegido el edificio, se entrevista a todos los vecinos.
43
Z=
(X )
Ejemplo
Una empresa elctrica fabrica focos que tienen una duracin que se distribuye aproximadamente
en forma normal, con media 800 horas y desviacin estndar 40 horas. Encuentre la probabilidad
de que una muestra aleatoria de 16 focos tenga una vida promedio de 775 horas.
Solucin
Como la distribucin de los focos es aproximadamente normal, que n=16 sea menor que treinta
no es relevante para el problema. Luego
Z=
(X )
(775 800) 16
= 2.5
40
por lo tanto
P( X < 775) = P( Z < 2.5) = 0.0062
44
Sea x1,x2,..x2 una muestra aleatoria de una variable aleatoria X que se distribuye normal con
media y varianza 2 entonces:
2
X ~ N ,
n
( X ) n
Z =
~ N (0,1)
n
Ejemplo
Si una muestra aleatoria de tamao 20 de una poblacin normal con media 64,3 y varianza 225.
Encuentre la probabilidad de que la media muestral sea mayor que 68.
Solucin
P ( x > 68) = 1 P( x < 68)
(68 64,3) 20
= 1 P z <
15
45
1) La vida media de una mquina para hacer pasta es de siete aos, con una desviacin
estndar de un ao. Suponga que las vidas de estas mquinas siguen aproximadamente
una distribucin normal, encuentre:
a) a lo ms 2.7 minutos
b) ms de 3.5 minutos
c) entre 3.2 y 3.4 minutos.
46
1)
a) 0.6898
b) 7.35
2)
a) 0.0062
b) 0.0668
c) 0.3413
47
Inferencia estadstica
La teora de inferencia estadstica consiste en aquellos mtodos con los cuales se pueden
realizar inferencias o generalizaciones acerca de una poblacin.
ESTIMACION DE PARAMETROS
Los parmetros a estudiar son parmetros poblacionales como la media y la varianza.
insesgamiento.
Definicin
a) E ( x ) =
b) E( s 2 ) = 2
2
Nota : La letra E simboliza Esperanza o Valor Esperado para x y s .
48
1 < < 2 , donde 1 y 2 dependen del valor de para una muestra particular y tambin de la
distribucin muestral de .
Por ejemplo:
a) Si = 0.05, entonces se tiene un intervalo de confianza del 95 %.
b) Si = 0.01, entonces el intervalo de confianza es del 99 %.
49
luego la variable : Z =
(x ) n
~ N(0,1)
P ( Z1 < Z < Z 2 ) = 1
P( Z < Z 2 ) =
P ( Z < Z1 ) =
+1 = 1
2
Luego : Z 2 = Z
por construccin
Z1 = Z
pero Z1 = Z 2
Luego : Z1 = Z
50
(x ) n
P Z <
< Z = 1
1
2
1 2
(x )
P Z <
< Z = 1
1 2
1
P Z
= 1
< x <Z
1
n
2
1 2 n
P x Z
= 1
< < x + Z
1
1
n
n
2
2
P x Z
= 1
< < x+Z
1
1
n
n
2
2
Definicin
Si x es la media de una muestra aleatoria de tamao n de una poblacin normal con varianza
2
pobalcional conocida, entonces un intervalo de confianza del (1- )100% para la media
x Z
,x + Z
1
1
n
n
2
2
Ejemplo :
Si una muestra aleatoria de tamao 20 de una poblacin normal con varianza 225 tiene una media
muestral de 64.3. Construya un intervalo de confianza del 95% para .
51
Solucin
2 = 225 = 15
x = 64.3
15
15
64.3 Z 0.05
Z
,
64
.
3
+
0
.
05
1
1
20
20
2
2
15
15
64.3 (1.96)
,64.3 + (1.96)
= (57.7,70.9)
20
20
as con una confianza del 95% el verdadero valor de la media poblacional se encuentra en el
intervalo : (57.7,70.9).
Teorema
Si se usa x como estimacin de , se puede tener una confianza del (1-)100% de que el error
no exceder de :
e=Z
En el ejemplo anterior:
Z
15
20
= 6.57
52
as con una confianza de 95% , el error de estimar a travs de x no ser mayor que 6.57
unidades, es decir :
x 6.57
Teorema
Con una confianza del (1-)100% , el tamao muestral adecuado (n) para que la diferencia entre
Z
1 2
n=
e
Ejemplo:
Que tan grande se require que sea la muestra del ejemplo (1) para que el error de estimar a
travs de x no sea mayor que 0.05 ? utilice una confianza del 95%.
Sol
e = 0.05 ; (1 - ) = 0.95 = 0.05 as Z
1-
= Z 0.975 = 1.96
1.96(15)
= 15 por lo tanto n =
= 345.744
0.05
Luego con una confianza del 95% el tamao muestral adecuado para que error de estimar de
x no sea mayor que 0.05 es de n=346 unidades aproximadamente.
Observacin
Todo lo anterior tambin es aplicable a poblaciones no normales con varianza conocida cuando
n>30.
53
1) Las medidas de los dimetros de los rodamientos tiene una desviacin estndar de de
0.042 cm. Se selecciona una muestra aleatoria de 200 rodamientos producidas por una
mquina en una semana, los dimetros dieron una media de 0.824 cm. Hallar un intervalo
de confianza del 95% y 99% para el verdadero dimetro promedio de los rodamientos.
2) Suponga que la duracin de un componente tiene distribucin normal con media y
varianza 9. Se prueban 20 componentes y se anotan sus tipos de fallas x1,x2,x3..x20.
Suponga adems que la media de la muestra es de 100.9 horas. Obtener un intervalo de
confianza del 99% para la verdadera duracin promedio de todos los componentes.
54
2) (99.17 , 102.63)
3) a) (63.35 , 86.65)
b) (84.8)
c) 66.775
4) 95% n=96.04 97
55
Sabemos que si x1,x2,..xn una muestra aleatoria de una variable aleatoria X~N(,2) con 2
desconocida entonces el estadstico:
T=
(x ) n
tiene distribucin t - student con v = n 1 grados de libertad .
s
56
x
P t <
< t
2
s
2
= 1
s
s
= 1
P x t
< < x + t
n
n
2
2
Definicin
Si x es la media de una muestra aleatoria de tamao n de una poblacin normal con varianza
conocida, entonces un intervalo de confianza del (1-)100% para est dado por:
s
s
x t
x
+
t
,
n
n
2
2
Ejemplo
Un fabricante de pintura quiere determinar el tiempo de secado promedio para una nueva pintura
para pared interior. Si para una prueba de 12 reas de igual tamao se obtiene un tiempo medio
de secado de 66.3 minutos y una desviacin estndar de 8.4 minutos. Construya un intervalo de
confianza del 95% para el verdadero tiempo de secado promedio de las paredes si el tiempo
de secado tiene distribucin normal.
Solucin
n = 12 n - 1 = 11
x = 66.3 por otro lado :1 = 0.95 = 0.05
s = 8.4
8.4
8.4
, 66.3 + (2.201)
66.3 - (2.201)
= (61;71.6 )
12
12
57
= 0.025 t
2
, n 1
= t 0.025,11 = 2.201
As un intervalo de confianza del 95% para el verdadero tiempo de secado promedio de las
paredes se encuentra en el intervalo (61; 71.6) minutos.
Teorema
Si se usa x como estimacin de , se puede tener una confianza del (1-)100% de que el error
no exceder de :
e = t
s
n
Ejemplo:
En el ejemplo anterior:
t = 2.201 , s = 8.4 ,
8.4
12
= 5.34
Teorema
Con una confianza del (1-)100% , el tamao muestral adecuado (n) para que la diferencia entre
x y no sea mayor que una cantidad especfica e est dado por :
t s
n= 2
e
58
Ejemplo:
En el ejemplo del fabricante de pintura, determine el tamao de muestra adecuado para que el
error de estimar a travs de x no sea mayor que 0.25 minutos.
2
2.201(8.4)
n=
= 5469
0.25
Es decir para que el error no sea mayor que 0.25 se debe tomar una muestra de 5469 reas.
59
3) Una muestra aleatoria de 100 propietarios de automviles indica que, en el estado XX, un
automvil recorre un promedio de 23.500 Km por ao con una desviacin estndar de
3.900 Km. Determine un intervalo de confianza del 98% para la cantidad promedio de
Km que un automvil recorre anualmente en el estado XX. Suponga distribucin normal.
60
1) (11867,385 ; 12132,615)
2) (9.61 ; 11.35)
3) (22578,04 ; 24421,96)
4) a) (1,847 ; 3.353)
b) n= 40 cigarros aproximadamente.
61
(n 1) s 2
62
P X 2 < X 2 < X 2 = 1
1 2
2
(n 1) s 2
< X 2 = 1
P X 2 <
2
2
1 2
1
1
2
< 2 = 1
P 2 <
2
X
X (n 1) s
1
2
2
(n 1) s 2
(n 1) s 2
2
< <
P
= 1
2
X 2
X
1
2
2
Definicin
(n 1) s 2 (n 1) s 2
;
2
X 2
X
1
2
2
donde X2/2 y X21-/2 son los valores de X2 con (n-1) grados de libertad, con reas de /2 y
1-/2 respectivamente, a la derecha.
Ejemplo:
1) Determine un intervalo de confianza del 95% para la varianza de una muestra de 10
paquetes de semilla, si la varianza de la muestra es 0.286.
63
Solucin:
= 0.025 1
= 0.975
n = 10 (n 1) = 9
s 2 = 0.286
X 2 = 19.023 ; X 2 = 2.700
2
1-
= (0.135,0.953)
19.023 2.700
as, con una confianza del 95% el verdadero valor de la varianza poblacional 2 se encuentra
en el intervalo (0.135,0.953).
2) Se obtiene una muestra aleatoria de 20 estudiantes con una media x = 72 puntos y una
2
varianza s = 16 en un exmen de Estadstica. Suponga que las calificaciones tienen
Solucin
(1 )100% = 98% = 0.02
= 0.01 1
= 0.99
n = 20 (n 1) = 19
X 2 = 36.191 ; X 2 = 7.633
2
1-
de esta manera el intervalo de confianza del 95% para la varianza 2 est dado por:
19(16) 19(16)
;
= (8.39;39.82)
36.191 7.633
luego con una confianza del 95% el verdadero valor de la varianza 2 de las notas de los
estudiantes se encuentra en el intervalo (8.39;39.82).
64
1) Un fabricante de bateras para automvil asegura que sus bateras duran en promedio, 3
aos con una desviacon estndar de un ao. Si 5 de estas bateras tienen una desviacin
estndar de 0.9028 aos. Determine un intervalo de confianza del 95% para la varianza
real. Es vlida la afirmacin del fabricante ? Suponga que la poblacin de las duraciones
de las bateras se distribuye aproximadamente normal.
3) Una muestra aleatoria de 25 cigarros de una cierta marca tiene un contenido promedio de
nicotina de 1.3 milgramos y una desviacin estndar de 0.17 milgramos. Encuentre un
intervalo de confianza del 90% y 98% para la varianza real de esta derteminada marca de
cigarros si se supone que las mediciones se distribuyen normalmente.
4) Una muestra aleatoria de 100 propietarios de automviles indica que, en el estado XX, un
automvil recorre un promedio de 23.500 Km al ao con una desviacin estndar de
3.900 Km. Determine un intervalo de confianza del 99% para la varianza real de Km
recorridos al ao por los automviles del estado XX.
65
1) (0.29; 6.79) La afirmacin del fabricante es vlida porque la varianza poblacional est
dentro del intervalo que se determin con una confianza del 95%.
2) (1.069; 3.949)
3) 90% (0.019; 0.05)
4) ( 10741065.69 ; 22374294,2)
66
z=
( x1 x 2 ) (u1 u 2 )
12
n1
22
+
n2
Definicin
( x1 x 2 ) z
1
12
n1
22
+
n2
; ( x1 x 2 ) + z
1
67
12
n1
22
+
n2
Ejemplo:
Se lleva a cabo un experimento en que se comparan dos tipos de motores A y B. Se mide el
rendimiento en millas por galn de gasolina. Se realizan 50 experimentos con el motor tipo A y
75 con el motor tipo B. La gasolina que se utiliza y las dems condiciones se mantienen
constantes. El rendimiento promedio de gasolina para el motor A es de 36 millas por galn y el
promedio para el motor B es 42 millas por galn. Encuentre un intervalo de confianza del 96 %
para ( B-A), donde B y A son el rendimiento de gasolina medio poblacional para los motores
B y A. Suponga que las deviaciones estndar poblacionales son seis y ocho para los motores A y
B.
Solucin
(1-)100%=96% (1-)=0.96 = 0.04 /2 = 0.02 ( 1- /2) = 0.98 . Por lo tanto:
z1-/2 = z0.98 = 2.05.
De esta forma un intervalo de confianza de 96% para (B-A) est dado por:
64 36
64 36
; 6 + 2.05
+
+ = [3.43 ; 8.57]
6 - 2.05
75
50
75
50
Podemos concluir que el rendimiento del motor B es mayor que el rendimiento del motor A.
68
T=
( x1 x 2 ) ( 1 2 )
sp
1
1
+
n1 n2
donde:
s 2p =
Definicin
1
1
1
1
; ( x1 x 2 ) + t s p
+
+
( x1 x 2 ) t s p
n1 n2
n1 n2
2
2
donde t/2 es el valor de t que deja un rea de /2 a derecha con v=n1+n2-2 grados de libertad.
69
Ejemplo:
Se eligieron dos estaciones de muestreo independientes para un estudio sobre la descarga de
cido de una mna de uranio. Los registros de ambas estaciones se encuentran dados en la
siguiente tabla:
Estacin 1
Estacin 2
n1= 12
n2= 10
x1 =3.11
x 2 =2.04
s1=0.771
s2=0.448
Encuentre un intervalode confianza del 90% para la diferencia entre las medias poblacionales de
ambas estaciones. Suponga que las varianzas poblacionales son iguales pero desconocidas.
Solucin
(1-)100%=90% (1-)=0.90 = 0.1 /2 = 0.05. Por lo tanto: t/2=t0.05=1.725
De esta forma:
s 2p =
70
De esta forma un intervalo de confianza de 90% para (1-2) est dado por:
1
1
1
1
; 1.07 + (1.725)(0.646)
+
+
1.07 - (1.725)(0.646)
= [0.593 ; 1.547]
12 10
12 10
De esta forma podemos concluir que las decarga de uranio en la en la estacin 1 es mayor que
en la estacin 2.
71
1) Una muestra aleatoria de tamao n1=25 que se toma de una poblacin normal con una
desviacin estndar 1=5 tiene una media x1 = 80 . Una segunda muestra aleatoria de
tamao n2=36, que se toma de una poblacin normal diferente con una desviacin
estndar 2=3, tiene una media x2 = 75 .Encuentre un intervalo de confianza del 95% para
1-2.
2) Los estudiantes pueden elegir entre un curso de fsica sin laboratorio de tres semestreshora y un curso con laboratorio de 4 semestres-hora. El examen escrito final es el mismo
para cada seccin. Si 12 estudiantes de la seccin con laboratorio tienen una calificacin
promedio en el exmen de 84 con una deviacin estndar de 4, y 18 estudiantes de la
seccin sin laboratorio tienen una calificacin promedio de 77 con una deviacin estndar
de 6, encuentre un intervalo de confianza del 99% para la diferencia entre las
calificaciones promedio de los dos cursos. Suponga que las poblaciones se distribuyen de
forma aproximadamente normal con varianzas iguales.
Medicamento 1
Medicamento 2
n1= 14
n2= 16
x1 =17
x 2 =19
s12 =0.771
s 22 =0.448
72
Encuentre un intervalo de confianza del 99% para la diferencia 1-2 del tiempo promedio de
recuperacin de los medicamentos. Son iguales los tiempos de recuperacin? Suponga
poblaciones normales con varianzas poblacionales desconocidas pero iguales.
4) Una compaa de taxis trata de decidir si comprar neumticos marca A o de la marca B para su
flotilla de taxis. Para estimar la diferencia de las dos marcas, se lleva a cabo un experimento
utilizando 12 de cada marca. Los neumticos se utilizan hasta que se gastan. Los resultados son:
Marca A
Marca B
n1= 12
n2= 12
x1 =36,300 kilmetros
x 2 =38,100 kilmetros
s1 =5000 kilmetro
s2 =6100 kilmetros
Calcule un intervalo de confianza del 95% para 1-2 , suponga que las poblaciones se
distribuyen de forma aproximadamente normal. Suponga varianzas iguales pero desconocidas.
Existe diferencia entre las dos marcas de neumticos ?
73
3) 2-1 [0.7 , 3.3] . El tiempo de recuperacin del medicamento 2 es mayor que el tiempo
de recuperacin del medicamento 1
4) 1-2 [-6522 , 2922] . El cero pertenece este intervalo luego 1-2 puede ser igual a
cero, es decir: 1-2 =0 1 = 2 , luego no existen diferencias entre los dos marcas
neumticos.
74
ASIGNATURA
ESTADSTICA
TERCERA UNIDAD
PRUEBAS DE HIPTESIS
3.1
3.2
3.3
75
PRUEBAS DE HIPOTESIS
Son procedimientos de decisin basados en datos que puedan producir una conclusin acerca de
algn sistema cientfico.
Una hiptesis estadstica es una afirmacin o conjetura acerca de una o ms poblaciones.
No es posible saber con absoluta certeza la verdad o falsedad de una hiptesis estadstica, pues
para ello habra que trabajar con toda la poblacin. En la prctica se toma una muestra aleatoria
de la poblacin de inters y se utilizan los datos que contiene tal muestra para proporcionar
evidencias que confirmen o no la hiptesis. Si la evidencia de la muestra es inconsistente con la
hiptesis planteada, entonces sta se rechaza y si la evidencia apoya a la hiptesis planteada,
entonces se acepta sta.
La aceptacin de una hiptesis implica tan slo que los datos no proporcionan evidencia
suficiente para refutarla. Por otro lado, el rechazo implica que la evidencia de la muestra la refuta.
La estructura de una prueba de hiptesis consiste en la formulacin de una hiptesis nula , es
decir, cualquier hiptesis que se desee probar se denota por H 0 . El rechazo de H 0 , genera la
aceptacin de una hiptesis alternativa , que se denota por H1 .
Una hiptesis nula referente a un parmetro poblacional siempre debe establecerse de manera que
especifique un valor exacto del parmetro, mientras que la hiptesis alternativa admite la
posibilidad de varios valores.
Por ejemplo:
H : = 20
H 0 : = 20
H : = 20
2)
3) 0
1) 0
H1 : > 20
H1 : < 20
H1 : 20
En la hiptesis alternativa se plantea usualmente la que se cree verdadero y en la hiptesis nula lo
que se desea rechazar.
Para tomar una desicin acerca de un parmetro es necesario una prueba estadstica para
cuantificar esta decisin. Esto se logra al establecer primero la distribucin muestral que sigue la
muestra estadstica ( es decir, la media ) y despus calcular la prueba estadstica apropiada. Esta
prueba estadstica mide que tan cerca de la hiptesis nula se encuentra el valor de la muestra. La
prueba estadstica suela seguir una distribucin estadstica conocida ( normal, t-student, ji
cuadrado).
La distribucin apropiada de la prueba estadstica se divide en dos regiones:
a) regin de rechazo ( regin crtica)
76
b) regin de no rechazo
Si la prueba estadstica cae en la regin de no rechazo no se puede rechazar la hiptesis nula y si
cae en la regin de rechazo, se rechaza la hiptesis nula.
Pare decidir con relacin a la hiptesis nula, primero se tiene que determinar el valor crtico para
la distribucin estadstica de inters. El valor crtico separa la regin de rechazo de la regin de
no rechazo.
regin de no rechazo
regin de rechazo
valor crtico
Al probar cualquier hiptesis estadstica, existen cuatro posibles situaciones que determinan si la
desicin es correcta o equivocada.
Se acepta H0
Se rechaza H0
H0 es verdadera
Desicin correcta
Error tipo I
H0 es falsa
Error tipo II
Desicin correcta
77
El ideal al rechazar una prueba de hiptesis es determinar los procedimientos o reglas que
conduzcan a maximizar la potencia de una prueba, para fijo. se suele especificar antes de
tomar una muestra, es frecuente que = 0.05 o = 0.01
Esquema para realizar una prueba de hiptesis acerca de un parmetro
1) Plantear la hiptesis nula y la hiptesis alternativa.
a)
H 0 : 1
H1 : > 1
b)
H 0 : 1
c)
H1 : < 1
H 0 : = 1
H1 : 1
b)
c)
d)
H 0 : = 1
H1 : > 1
H 0 : = 1
H1 : < 1
H 0 : 1
H1 : > 1
H 0 : 1
H1 : < 1
78
Pruebas de hiptesis
z=
(x ) n
~ N(0,1)
Grficamente:
79
ii ) H 0 : u = u1 (u u1 )
H1 : u < u1
Grficamente:
RC = z / z < z z > z
1
1
2
2
Grficamente:
80
Ejemplos
1) Considere la hiptesis nula de que el peso promedio de los estudiantes de un cierto
instituto es de 68 kilos contra la hiptesis alternativa de que es diferente de 68 kilos.
Suponga que los pesos se distribuyen normalmente con una desviacin estndar de 3.6
kilos. Se elige una muestra aleatoria de 36 estudiantes y se obtiene un peso promedio de
67.5 kilos. Utilice un nivel de significancia =0.05.
Solucin:
H 0 : u = 68
H1 : u 68
= 0.05 z
n = 36
= z0.975 = 1.96
x = 67.5
= 3.6 z =
(67.5 68) 36
= 0.83
3.6
Por lo tanto z RC . Luego con base en la muestra no es posible decidir si el peso promedio de
los estudiantes del instituto es distinto de 68 kilos.
2) Una muestra aleatoria de 100 muertos registrados en Chile durante el ao pasado mostr
una vida promedio de 71.8 aos. Suponiendo una desviacin estndar poblacional de 8.9
aos. Parecera esto indicar que la vida promedio hoy en da es mayor que 70 aos ?
Utilice un nivel de significancia =0.05.
81
Solucin:
H 0 : u < 70
H1 : u > 70
x = 71.8
= 8.9 z =
Por lo tanto z RC . Luego con base en la muestra podemos decir que la vida promedio hoy en
da supera los 70 aos.
= 0.01 z
n = 50
= z0.995 = 2.57
x = 7.8
= 0.5 z =
(7.8 8) 50
= 2.83
0.5
82
83
1) Una empresa elctrica fabrica focos que tienen una duracin que est distribuda en forma
aproximadamente normal con media 800 horas y una desviacin estndar de 40 horas.
Pruebe la hiptesis de que = 800 horas en contraposicin de la alternativa de que
800 horas. Si una muestra aleatoria de 30 focos tiene una duracin promedio de 788
horas. Utilice un nivel de significancia de 0,04.
2) Un fabricante de cigarros afirma que el contenido promedio de nicotina no excede de de
3,5 milgramos , con una desviacin estndar de 1,4 milgramos. Para una muestra
aleatoria de 8 cigarros se tiene un contenido promedio de nicotina de 4,2 milgramos
Est de acuerdo con la afirmacin del fabricante? Use un nivel de significancia =0,05.
84
1) Se acepta H0 , es decir, los focos tienen una duracin promedio de 800 horas.
85
t=
(x ) n
se distribuye t-student con v=n-1 grados de libertad, donde s es la
s
i)
H 0 : = 1
H 1 : > 1
( 1 )
RC = {t / t > t ( ,n 1) }
Grficamente:
86
ii)
H 0 : = 1
( 1 )
H1 : < 1
Grficamente:
RC = t / t < t t > t
2
2
87
Grficamente:
Ejemplos:
de la cantidad anual de
kilowatts-hora consumida por varios aparatos para el hogar. Se afirma que la aspiradora
consume un promedio de 46 kilowatts-hora al ao. Si una muestra aleatoria de 12 hogares
incluidos en un estudio planeado indica que las aspiradoras consumen un promedio de 42
kilowatts-hora al ao con una desviacin estndar de 11.9 kilowatts-hora. Sugiere esto,
con un nivel de significacin =0.05 , que las aspiradoras consumen, en promedio, menos
de 46 kilowatts-hora al ao ? Suponga que la poblacin de kilowatts-hora es normal.
Solucin:
H 0 : u = 46
H1 : u < 46
n = 12
x = 42
s = 11.9 t =
(42 46) 12
= 1.16
11.9
88
Por lo tanto t RC . Luego con base en la muestra no podemos decir que el consumo de
kilowatts-hora al ao de las aspiradoras sea menor que 46.
2) El gerente de produccin de una empresa cuyo proceso consiste en llenar cajas de cereal
desea saber si efectivamente en cada caja se est depositando, en promedio, los 368
gramos que se supone es lo que la empresa asegura a sus vendedores. Para ello, se
selecciona una muestra aleatoria de 25 de estas cajas obteniendose una media de 364.1
gramos y una desviacin estndar de 17.3 gramos. Considere que la distribucin de los
pesos de las cajas de cereales es normal y trabaje con un nivel de significancia =0.05.
Qu decide el gerente ?
Solucin:
H 0 : u = 368
H1 : u 368
= 0.05 t
2
n = 25
, n 1
= t0.025, 24 = 2.064
x = 364.1
s = 17.3 t =
(364.1 368) 25
= 1.13
17.3
Por lo tanto t RC . Luego con base en la muestra el gerente de produccin puede estar seguro
que, en promedio, cada caja contiene 368gramos de cereal.
89
3) Suponga que en el mismo ejemplo anterior, del proceso de llenado de las cajas de cereal,
que la empresa es visitada por un representante de la oficina de proteccin al consumidor
y que le interesa averiguar si las cajas, en promedio, estn faltas de peso, es decir, si el
peso promedio es inferior a 368 gramos. Considere un nivel de significacin =0.01.
Solucin:
H 0 : u 368
H1 : u < 368
x = 364.1
s = 17.3 t =
(364.1 368) 25
= 1.13
17.3
90
Estara usted de
=0.01.
3) En un informe de una investigacin de J.M.N. se afirma que los ratones con una vida
promedio de 32 meses llegarn hasta casi 40 cuando 40% de las caloras en su
alimentacin se reemplacen con vitaminas y protenas. Hay alguna razn para creer que
la vida promedio ser inferior a 40 meses si 64 ratones que se han sujetado a esta dieta
tienen una vida promedio de 38 meses con una desviacin estndar de 5.8 meses ? Utilice
un nivel de significancia =0.025
4) Una empresa elctrica afirma que un compactador de basura se usa un promedio de 125
horas al ao. Si una muestra aleatoria de 49 hogares equipados con compactadores de
basura indica un uso promedio anual de 126.9 horas con una desviacin estndar de 8.4
horas Sugiere esto con un nivel de significancia de 0.05, que estos aparatos se usan en
promedio ms de 125 horas ?
91
92
2 =
H 0 : 2 = 12
( 2 12 )
H1 : 2 > 12
RC = 2 / 2 > 2 , n 1
Grficamente:
93
ii)
i)
H 0 : 2 = 12
( 2 12 )
H1 : 2 < 12
RC = 2 / 2 < 12 , n 1
Grficamente:
RC = 2 / 2 < 2
2 > 2
(1 , n 1)
( , n 1)
2
2
94
Grficamente:
Ejemplos
1) Un fabricante de bateras para automvil asegura que la duracin de sus bateras tiene
distribucin aproximadamente normal con desviacin estndar de 0.9 aos. Si una
muestra aleatoria de 10 bateras tiene una desviacin estndar de 1.2 aos Piensa usted
que >0.9 aos ? Utilice un nivel de significancia =0.05
Solucin:
H 0 : 2 = 0,81
H1 : 2 > 0,81
s 2 = 1.44 2 =
9 1,44
= 16
0.81
95
RC = { 2 / 2 > 19,919
Por lo tanto 2RC. Luego con base en la muestra no hay evidencia suficiente para afirmar que
la varianza de la duracin de las bateras sea mayor que 0.81 aos.
=0.05.
Solucin:
H 0 : 2 = 1,3
H1 : 2 1,3
= 0.05 2
1 , n 1
2
2
2
n=8
, n 1
= 02.975,7 = 1,690
= 02.025,7 = 16,013
s 2 = 3.24 2 =
7 3,24
= 17.45
0.13
Por lo tanto 2RC. Luego con base en la muestra no hay evidencia suficiente para afirmar que
la varianza del contenido de nicotina en los cigarros se igual a 1,3 milgramos.
96
3) Experiencias pasadas indican que el tiempo para que los alumnos del ltimo ao realicen
un examen estandarizado es una v.a normal con desviacin estndar de 6 minutos. Pruebe
la hiptesis de que <6 , si una muestra aleatoria de 20 estudiantes tiene una desviacin
estndar de 4.51 minutos al realizar este examen. Utilice un nivel de significancia =0.01.
Solucin:
H 0 : 2 = 36
H1 : 2 < 36
n = 20
s 2 = 20,3401 2 =
19 20,3401
= 10,74
36
RC = { 2 / 2 < 7,633
Por lo tanto 2RC. Luego con base en la muestra es posible afirmar que la varianza del tiempo
en que los estudiantes contestan el examen es igual a 36 minutos.
97
2) Se sabe que el contenido de nicotina de una marca de cigarros tiene una distribucin
aproximadamente normal con una varianza de 1,3 milgramos. Pruebe la hiptesis de que
98
99
ASIGNATURA
ESTADSTICA
CUARTA UNIDAD
ANLISIS DE VARIANZA
100
z=
( x1 x2 )
12 22
+
n1 n2
i)
H 0 : 1 = 2
H1 : 1 < 2
RC = {z / z < z
ii)
H 0 : 1 = 2
H1 : 1 > 2
RC = {z / z > z
101
H 0 : 1 = 2
H1 : 1 2
RC = z / z < z z > z
2
2
T =
( x1 x2 )
tiene distribucin t student con v = n1 + n2 - 2 grados de libertad
1 1
sp
+
n1 n2
donde:
102
i)
H 0 : 1 = 2
H1 : 1 < 2
RC = {t / t < t
ii)
H 0 : 1 = 2
H1 : 1 > 2
RC = {t / t > t
H 0 : 1 = 2
H1 : 1 2
RC = t / t < t t > t
2
2
103
Ejemplo:
Se eligieron dos estaciones de muestreo independientes para un estudio sobre la descarga de
cido de una mina de uranio. Los registros de ambas estaciones se encuentran dados en la
siguiente tabla:
Estacin 1
Estacin 2
n1= 12
n2= 10
x1 =3.11
x 2 =2.04
s1=0.771
s2=0.448
Son iguales las medias de ambas estaciones ? Utilice un nivel de significancia de 0,1.Suponga
que las varianzas poblacionales son iguales pero desconocidas.
Solucin
H 0 : 1 = 2
H1 : 1 2
= 0.1 /2 = 0.05. Por lo tanto: t/2=t0.05=1.725
RC = {t / t < 1.725 t > 1.725}
104
De esta forma:
s 2p =
( n1 1) s12 + ( n2 1) s22
(11)(0.7712 ) + (9)(0.4482 )
=
= 0.417
12 + 10 2
n1 + n2 2
as:
t=
( x1 x2 )
1,07
=
= 6,011
0,417 0.428
1 1
sp
+
n1 n2
Por lo tanto t RC . Luego se rechaza H0 , de esta forma las medias de ambas estaciones no
son iguales.
105
Problema 1
Cinco muestras de una sustancia ferrosa se usan para determinar si hay una diferencia entre un
anlisis qumico de laboratorio y un anlisis de fluorescencia de rayos X del contenido de hierro.
Cada muestra se divide en 2 submuestras y se aplican los dos tipos de anlisis. A continuacin se
presentan los datos codificados que muestran los anlisis de contenido de hierro.
1
Anlisis
Rayos X
Qumico
2.0
2.2
2.0
1.9
2.3
2.5
2.1
2.3
2.4
2.4
Suponga que las poblaciones son normales, Pruebe con un nivel de significancia de 0.05 si los
dos mtodos de anlisis dan en promedio el mismo resultado.
Problema 2
Los siguientes datos representan los tiempos de duracin de las pelculas que producen dos
compaas cinematogrficas.
Tiempo (minutos)
Compaa
I
II
103
97
94
82
110
123
87
92
98
175
88
118
Son iguales los tiempos de duracin de las pelculas que producen las 2 compaas? Utilice un
nivel de significancia de 0,05.
106
1) Los dos tratamientos no dan en promedio el mismo resultado es decir se rechaza H0.
2) Los tiempos promedio de duracin de ambas pelculas no son iguales es decir se rechaza H0.
107
ANEXOS
Tablas de distribucin de probabilidades: (normal, t student, y ji-cuadrado)
Tabla reas bajo la curva normal
z
-3.4
-3.3
-3.2
-3.1
-3.0
.00
0.0003
0.0005
0.0007
0.0010
0.0013
.01
0.0003
0.0005
0.0007
0.0009
0.0013
.02
0.0003
0.0005
0.0006
0.0009
0.0013
.03
0.0003
0.0004
0.0006
0.0009
0.0012
.04
0.0003
0.0004
0.0006
0.0008
0.0012
.05
0.0003
0.0004
0.0006
0.0008
0.0011
.06
0.0003
0.0004
0.0006
0.0008
0.0011
.07
0.0003
0.0004
0.0005
0.0008
0.0011
.08
0.0003
0.0004
0.0005
0.0007
0.0010
.09
0.0002
0.0003
0.0005
0.0007
0.0010
-2.9
-2.8
-2.7
-2.6
-2.5
0.0019
0.0026
0.0035
0.0047
0.0062
0.0018
0.0025
0.0034
0.0045
0.0060
0.0017
0.0024
0.0033
0.0044
0.0059
0.0017
0.0023
0.0032
0.0043
0.0057
0.0016
0.0023
0.0031
0.0041
0.0055
0.0016
0.0022
0.0030
0.0040
0.0054
0.0015
0.0021
0.0029
0.0039
0.0052
0.0015
0.0021
0.0028
0.0038
0.0051
0.0014
0.0020
0.0027
0.0037
0.0049
0.0014
0.0019
0.0026
0.0036
0.0048
-2.4
-2.3
-2.2
-2.1
-2.0
0.0082
0.0107
0.0139
0.0179
0.0228
0.0080
0.0104
0.0136
0.0174
0.0222
0.0078
0.0102
0.0132
0.0170
0.0217
0.0075
0.0099
0.0129
0.0166
0.0212
0.0073
0.0096
0.0125
0.0162
0.0207
0.0071
0.0094
0.0122
0.0158
0.0202
0.0069
0.0091
0.0119
0.0154
0.0197
0.0068
0.0089
0.0116
0.0150
0.0192
0.0066
0.0087
0.0113
0.0146
0.0188
0.0064
0.0084
0.0110
0.0143
0.0183
-1.9
-1.8
-1.7
-1.6
-1.5
0.0287
0.0359
0.0446
0.0548
0.0668
0.0281
0.0352
0.0436
0.0537
0.0655
0.0274
0.0344
0.0427
0.0526
0.0643
0.0268
0.0336
0.0418
0.0516
0.0630
0.0262
0.0329
0.0409
0.0505
0.0518
0.0256
0.0322
0.0401
0.0495
0.0606
0.0250
0.0314
0.0392
0.0485
0.0594
0.0244
0.0307
0.0384
0.0475
0.0582
0.0239
0.0301
0.0375
0.0465
0.0571
0.0233
0.0294
0.0367
0.0455
0.0559
-1.4
-1.3
-1.2
-1.1
-1.0
0.0808
0.0968
0.1151
0.1357
0.1587
0.0793
0.0951
0.1131
0.1335
0.1562
0.0778
0.0934
0.1112
0.1314
0.1539
0.0764
0.0918
0.1093
0.1292
0.1515
0.0749
0.0901
0.1075
0.1271
0.1492
0.0735
0.0885
0.1056
0.1251
0.1469
0.0722
0.0869
0.1038
0.1230
0.1446
0.0708
0.0853
0.1020
0.1210
0.1423
0.0694
0.0838
0.1003
0.1190
0.1401
0.0681
0.0823
0.0985
0.1170
0.1379
-0.9
-0.8
-0.7
-0.6
-0.5
0.1841
0.2119
0.2420
0.2743
0.3085
0.1814
0.2090
0.2389
0.2709
0.3050
0.1788
0.2061
0.2358
0.2676
0.3015
0.1762
0.2033
0.2327
0.2643
0.2981
0.1736
0.2005
0.2296
0.2611
0.2946
0.1711
0.1977
0.2266
0.2578
0.2912
0.1685
0.1949
0.2236
0.2546
0.2877
0.1660
0.1922
0.2206
0.2514
0.2843
0.1635
0.1894
0.2177
0.2483
0.2810
0.1611
0.1867
0.2148
0.2451
0.2776
-0.4
-0.3
-0.2
-0.1
-0.0
0.3446
0.3821
0.4207
0.4602
0.5000
0.3409
0.3783
0.4168
0.4562
0.4960
0.3372
0.3745
0.4129
0.4522
0.4920
0.3336
0.3707
0.4090
0.4483
0.4880
0.3300
0.3669
0.4052
0.4443
0.4840
0.3264
0.3632
0.4013
0.4404
0.4801
0.3228
0.3594
0.3974
0.4364
0.4761
0.3192
0.3557
0.3936
0.4325
0.4721
0.3156
0.3520
0.3897
0.4286
0.4681
0.3121
0.3483
0.3859
0.4247
0.4641
108
109
Tabla t- student
110
Tabla t- student
111
Tablas ji-cuadrado
112
Tablas ji-cuadrado
113
BIBLIOGRAFA
114