Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadistica II
Estadistica II
AUTÓNOMO
Asignatura
ESTADÍSTICA II
Autor: RODRIGO ALÍ VALLEJOS
1
Instituto Profesional Diego Portales
AUTÓNOMO
AUTOR
RODRIGO ALÍ:
2
Instituto Profesional Diego Portales
AUTÓNOMO
INVITACIÓN AL MÓDULO
Estimado alumno
Los conocimientos de teoría estadística son la base del soporte tecnológico y la base sobre
la cuál se puede hacer un uso racional, sistemático y ético de la sorprendente tecnología que se
incorpora cotidianamente a nuestro quehacer laboral. Por tanto, no es solo la necesidad de
calcular, medir o de disponer de herramientas mecánicas directas por lo cuál hay que estudiar
disciplina, sino que nos debe mover el manifiesto interés por desarrollar nuestra capacidad de
desición, aumentar nuestra capacidad de analizar, discriminar, abstraer y sintetizar información,
optimizando así nuestra rapidez y eficacia para enfrentar el conjunto de situaciones problemáticas
que afectan diariamente al conjunto de nuestra actividad.
Esperando para ti todo el éxito posible, te invito a iniciar la tarea del aprendizaje
sistemático, que te conducirá a la obtención de tus objetivos personales y profesionales.
3
Instituto Profesional Diego Portales
AUTÓNOMO
ASIGNATURA
ESTADÍSTICA
OBJETIVO GENERAL
OBJETIVOS ESPECÍFICOS
4
Instituto Profesional Diego Portales
AUTÓNOMO
ASIGNATURA
ESTADÍSTICA
PRIMERA UNIDAD
DISTRIBUCIONES CONTINUAS
5
Instituto Profesional Diego Portales
AUTÓNOMO
DISTRIBUCIÓN NORMAL
Esta curva permite describir muchos fenómenos que ocurren en la naturaleza, la industria y la
investigación.
Una variable aleatoria (v.a) continua Χ que tiene distribución en forma de campana se llama
variable aleatoria normal.
Concepto: La función de la variable aleatoria Χ , con media μ y varianza σ2, está dada por:
1 ⎛ X −μ ⎞
2
1 − ⎜ ⎟
2⎝ σ ⎠
f (X ) = ⋅e −∞ < x < ∞
2π ⋅ σ
X ~ N (μ ,σ 2 )
6
Instituto Profesional Diego Portales
AUTÓNOMO
b
P (a < X < b) = ∫ f ( X )dx
a
Sin embargo, resolver esta integral con la función de densidad de la variable aleatoria normal no
es tan simple. Por tal motivo, se recurre a un proceso denominado estandarización basándose en
una variable aleatoria z que tiene μ=0 y σ2=1 y que se denomina distribución normal estándar.
7
Instituto Profesional Diego Portales
AUTÓNOMO
Concepto: Si z es una v.a. normal con μ=0 y σ2=1, tiene función de densidad:
1
1 − Z2
f (Z ) = e 2
-∞ < x < ∞
2π
Z ~ N (0,1)
1) P(z>1,84)
P(z>1,84)=1-P(z ≤ 1,84)
= 1-0,9671
= 0,0329
8
Instituto Profesional Diego Portales
AUTÓNOMO
2) P(-1,97<z<0,86)
= 0,8051-0,0244
= 0,7807
3) P(z>z0)=0,7486
P(z>z0)=0,7486
1-P(z ≤ z0)=0,7486
1-0,7486 = P(z ≤ z0) ⇒ P(z ≤ z0) = 0,2514 ⇒ z0=-067
9
Instituto Profesional Diego Portales
AUTÓNOMO
a) P(X≤x) = 0,45
⎛ z − 40 ⎞
P⎜ z ≤ ⎟ = 0.45
⎝ 6 ⎠
x − 40
= −0.13 ⇒ x = 39,22
6
b) P( X>x )= 0,14
⎛ x − 40 ⎞
1 − P⎜ z ≤ ⎟ = 0,14
⎝ 6 ⎠
⎛ x − 40 ⎞ x − 40
P⎜ z ≤ ⎟ = 0,86 ⇒ = 1,08 ⇒ x = 46,48
⎝ 6 ⎠ 6
10
Instituto Profesional Diego Portales
AUTÓNOMO
EJERCICIOS
II) Dada la v.a. X distribuida normalmente con media 18 y desviación estándar 2,5 , encuentre:
a) P(x<15) Resp: 0,1151
11
Instituto Profesional Diego Portales
AUTÓNOMO
Problemas de aplicación
1) Cierto tipo de batería dura un promedio de tres años, con una desviación estándar de 0,5
años. Suponiendo que las duraciones de las baterías son normalmente distribuidas,
encuentre la probabilidad de que una determinada batería dure menos de 2,3 años.
Solución:
⎛ 2,3 − 3 ⎞
P( x < 2,3) = P⎜ z < ⎟
⎝ 0,5 ⎠
= P ( z < 1,4)
= 0,0808
La probabilidad de que una determinada batería dure menos de 2,3 años es de un 8,08%.
12
Instituto Profesional Diego Portales
AUTÓNOMO
2) Una compañía fabrica focos cuya duración es normalmente distribuida con una media de
800 horas y una desviación estándar de 40 horas. Encuentre la probabilidad de que un
foco dura entre 778 y 834 horas de uso.
Solución
La probabilidad de que un foco dure entre 778 y 834 horas de uso es de un 51,11%.
13
Instituto Profesional Diego Portales
AUTÓNOMO
3) Una cierta máquina produce resistencias aléctricas que tienen un valor medio de 40 ohms
y una desviación estándar de 2 ohms. Suponiendo que los valores de las resistencias
siguen una distribución normal y que pueden medirse con cualquier grado de precisión.
¿Que porcentaje de las resistencias tendrá un valor que exceda los 43 ohms ?
Solución:
⎛ 43 − 40 ⎞
P( x > 43) = 1 − P⎜ z ≤ ⎟
⎝ 2 ⎠
= 1 − P( z ≤ 1,5)
= 1 − 0,9332
= 0,0668
14
Instituto Profesional Diego Portales
AUTÓNOMO
4) En una empresa las edades de los trabajadores se distribuye normalmente con media 50
años y desviación estándar 5 años.
a) ¿Qué porcentaje de los trabajadores tiene entre 50 y 52,5 años ?
b) ¿Cuál es la probabilidad de qque un trabajador cualquiera no sea mayor de 45 años?
c) ¿Cuál es la probabilidad que un trabajador tenga entre 41 y 58 años?
d) El 20% de los trabajadores están bajo cierta edad ¿Cuál es esa edad?
Solución:
⎛ 50 − 50 52,5 − 50 ⎞
a) P (50 < x < 52,5) = P⎜ <z< ⎟
⎝ 5 5 ⎠
= 0,6915 − 0,5
= 0,1915
⎛ 45 − 50 ⎞
b) P ( x ≤ 45) = P⎜ z ≤ ⎟
⎝ 5 ⎠
= P ( z ≤ −1)
= 0,1587
La probabilidad de que un trabajador cualquiera no sea mayor de 45 años es de un 15,87 %
15
Instituto Profesional Diego Portales
AUTÓNOMO
⎛ 41 − 50 58 − 50 ⎞
c) P(41 < x < 58) = P⎜ <z< ⎟
⎝ 5 5 ⎠
= 0,9093
La probabilidad que un trabajador tenga entre 41 y 58 años es de un 90,93 %
d) P( X < x) = 0,20
⎛ x − 50 ⎞ x − 50
P⎜ z ≤ ⎟ = 0,20 ⇒ = -0,85 ⇒ x = 45,75
⎝ 5 ⎠ 5
El 20% de los trabajadores tiene una edad menor o igual a 45,75 años.
16
Instituto Profesional Diego Portales
AUTÓNOMO
1) Las piezas de pan de centeno distribuidas a las tiendas locales por una cierta pastelería
tienen una longitud promedio de 30 cm y una desviación estándar de 2 cm. Suponiendo
que las longitudes están normalmente distribuidas. ¿Qué porcentaje de las piezas son :
2) Una máquina despachadora de refrescos está ajustada para servir un promedio de 200
mililítros por vaso. Si la cantidad de refresco está normalmente distribuida con una
desviación estándar de 15 mililítros.
a) ¿Qué proporción de los anillos tendrá un diámetro interno que exceda de 10,075
cm ?
b) ¿Cuál es la probabilidad de que un anillo de pistón tenga un diámetro interno entre
9,97 y 10,03 cm ?
c) ¿Para que valor el diámetro interno de un anillo de pistón representará el 15% ?
17
Instituto Profesional Diego Portales
AUTÓNOMO
5) La vida promedio de cierto tipo de motor pequeño es de 10 años con una desviación
estándar de 2 años. El fabricante repone sin cargo todos los motores que fallen dentro del
período de garantía. Si está a reponer sólo el 3% de los motores que fallan, ¿qué tan larga
deberá ser la garantía que otorgue? Suponga que la vida de los motores tienen distribución
normal.
6) Suponga que un consultor está investigando cuánto tiempo necesitarán los obreros de la
fábrica para montar cierta pieza en una planta de automóviles Volvo, y determinó que la
información ( tiempo en segundos ) estaba normalmente distribuida con una media de 75
segundos y una desviación estándar de 6 segundos.
18
Instituto Profesional Diego Portales
AUTÓNOMO
9) Un procesador de alimentos envasa café en pequeños tarros, los pesos de los tarros están
normalmente distribuidos con una desviación estándar de 0,3 onzas. Si el 5% de los tarros
pesa más de de 12,492 onzas. ¿Cuál es el promedio de los tarros?
19
Instituto Profesional Diego Portales
AUTÓNOMO
1)
a) El 19,77% de las piezas tiene una longitud de más de 31,7 cm.
b) El 59,67% de las piezas tiene una longitud menos que 25,5 cm.
2)
a) El 5,48% de los vasos contendrá más de 224 mililítros
b) El 5,18% de los vasos tendrá entre 191 y 209 mililítros
3)
a) El 0,62% de los anillos tendrá un diámetro superior a 10,075 cm.
b) El 68,26% de los anillos tendrá un diámetro entre 9,97 y 10,03 cm.
c) El 15% de los anillos tendrá un diámetro de 9,9688 cm.
4)
a) El 6,68% de los componentes exceden de 10.150 Kg/cm2 de resistencia a la tensión.
b) El 4,56% de las piezas se despacharán
6)
a) Existe un 65,87% de probabilidad de que un obrero pueda montar una pieza en menos de 75
seg o en ,más de 81 seg.
b) Existe un 68,26% de probabilidad de que un obrero pueda montar una pieza entre 69 y 81 seg.
c) Existe un 1,5% de probabilidad de que un obrero pueda montar una pieza en menos de 62
seg.
d) Existe un 14,37% de probabilidad de que un obrero pueda montar una pieza entre 62y 69 seg.
e) Deben pasar 75 segundos antes de que el 50% de los obreros monten la pieza.
20
Instituto Profesional Diego Portales
AUTÓNOMO
7)
Se cumple que el 99,04% de las arandelas tiene un espesor entre 0,0180 y 0,202 pulgadas.
8)
a) El 92,7% de las personas tiene un tiempo de reacción entre 14 y 30 segundos.
b) El 9,94% de las personas tiene un tiempo de reacción entre 25 y 30 segundos.
c) El 93,32% de las personas tiene un tiempo de reacción de más de 14 segundos.
d) El tiempo de reacción es de 10,38 segundos.
21
Instituto Profesional Diego Portales
AUTÓNOMO
DISTRIBUCIÓN T-STUDENT
Definición
Sean X1,X2,……Xn variables aleatorias identicamente distribuidas con distribución normal con
media μ y varianza σ2. Entonces la variable:
(x − μ) n
T=
s
tiene distribución t-student con v=n-1 grados de libertad donde n es el tamaño de la muestra, x es
la media de la muestra y s es la varianza muestral. La gráfica de esta distribución es similar a la
distribución normal y está dada por:
Al igual que la distribución normal los valores de área de esta distribución se encuentran
tabulados.
La distribución de probabilidad T se publicó por primera vez en 1908 en un artículo de W.S.
Gosset. En esa época , Gosset era empleado de una cervecería irlandesa que desaprobaba la
publicación de investigaciones de sus empleados. Para evadir esta prohibición, publicó su trabajo
en secreto bajo el nombre de Student. En consecuencia, la distribución T normalmente se llama
distribución t de Student, o simplemente distribución t.
La distribución T es similar a la distribución de Z, pues ambas son simétricas alrededor de la
media igual a cero. Ambas distribuciones tienen forma de campana, pero la distribución t es más
variable, debido al hecho que la distribución t depende de las cantidades de x y s2.
22
Instituto Profesional Diego Portales
AUTÓNOMO
Ejemplos
1) El valor de t con v=14 grados de libertad que deja un área de 0.0975 a la derecha es:
2) Encuentre P(-t0.025<T<t0.05).
Solución:
Como t0.05 deja un área de 0.05 a la derecha, y –t0.025 deja un área de 0.025 a la izquierda,
encontrmos un área total de:
1-0.05-0.025=0.925
Solución:
Notemos que 1.761 corresponde a t0.05 cuando v=14. Por tanto, -t0.05=-1761. Como k en el
enunciado de de la probabilidad original está a la izquieda de –t0.05 = -1761,
luego k=-2.977.
23
Instituto Profesional Diego Portales
AUTÓNOMO
gramos por milímetro y una desviación estándar s=40 gramos?. Suponga que la
distribución de rendimientos es aproximadamente normal.
Solución:
De la tabla t-student encontramos que t0.05=1.711 para 24 grados de libertad. Por tanto, el
fabricante que satisfecho con esta afirmación si para la muestra de tamaño 25 el valor de t queda
entre -1.711 y 1.711. Si μ=500 entonces:
( x − μ ) n (518 − 500) 25
t= = = 2.25
s 40
Como t=2.25 no está entre -1711 y 1.711 el fabricante debe revisar su proceso productivo.
24
Instituto Profesional Diego Portales
AUTÓNOMO
2) Dada una muestra aleatoria de tamaño 24 de una distribución normal, encuentre k tal que:
3) Un fabricante de instrumentos de precisión para medidas terrestre afirma que sus mediciones
fallan en promedio a lo más 0.5 mm. En una muestra aleatoria de 8 de estos instrumentos las
fallas de medición fueron de : 0.6 , 0.7 , 0.7, 0.3, 0.4, 0.5, 0.4 y 0.2 mm. Estaría de acuerdo
con la afirmación del fabricante?
25
Instituto Profesional Diego Portales
AUTÓNOMO
1)
a) P= 0.975
b) P= 0.10
c) P= 0.875
2)
a) k=2.5
b) k=1.319
c) k=1.714
∑x − n( x 2 )
2
i
s 2
=
n −1
⎛ ( x − μ ) n ( x − 0.5) n ⎞
P ( μ < 0.5) = P⎜⎜ > ⎟
s s ⎟
⎝ ⎠
⎛ (0.475 − 0.5) 8 ⎞
= P⎜⎜ T7 < ⎟
⎟
⎝ 0 . 183 ⎠
= P (T7 < −0.38) = P (T7 < −0.38) = P (T7 > 0.38) = 0.3
26
Instituto Profesional Diego Portales
AUTÓNOMO
4) Calculemos: P(μ>0.6)
⎛ ( x − μ ) n ( x − 0.6) n ⎞
P ( μ > 0.6) = P⎜⎜ > ⎟
s s ⎟
⎝ ⎠
⎛ (0.75 − 0.6) 16 ⎞
= P⎜⎜ T15 > ⎟
⎟
⎝ 0.175 ⎠
= P (T15 > 3.428) = 0.0025
Luego la probabilidad que el contenido promedio de nicotina se mayor que 0.6 milígramos es
muy baja por tanto el fabricante podría tener razón sobre los contenidos promedio de nicotina de
sus cigarros.
27
Instituto Profesional Diego Portales
AUTÓNOMO
Distribución ji-cuadrado
Definición
Si S2 es la varianza de una muestra aleatoria de tamaño n que se toma de una población
normal que tiene varianza σ2 , entonces la variable:
(n − 1) S 2
χ2 =
σ2
tiene distribución ji-cuadrado con v=n-1 grados de libertad. En que n es el tamaño de la
muestra S2 es la varianza muestral y σ2 es la varianza de la población.
∑x − n( x 2 )
2
i
s 2
=
n −1
Al igual que las otras distribuciones sus valores de probabilidad se encuentran tabulados.
28
Instituto Profesional Diego Portales
AUTÓNOMO
Ejemplo:
Un fabricante de baterías para auto garantiza que sus baterías durarán, en promedio tres años
con una desviación estándar de un año. Si cinco de estas baterías tienen duraciones de 1.9,
2.4, 3.0 , 3.5 y 4.2 años, ¿el fabricante aún está convencido de que sus baterías tienen una
desviación estándar de un año? Suponga que la duración de la batería tiene distribución
normal.
Solución:
∑x − n( x 2 )
2
i
s 2
= = 0.815
n −1
por otro lado
(n − 1) S 2 (4)(0.815)
χ2 = = = 3.26
σ 2
1
⎛ (n − 1) s 2 (4)(0.815) ⎞
P ( s < 1) = P⎜⎜
2
< (
⎟⎟ = P χ 42 < 3.26 = 0.5 )
⎝ σ 1 ⎠
29
Instituto Profesional Diego Portales
AUTÓNOMO
2) Encuentre χ 02 si :
a) P( χα2 > χ 02 ) = 0.99 con v = 5
b) P( χ12-α > χ 02 ) = 0.025 con v = 19
c) P(37.652 < χ 2 < χ 02 ) = 0.045 con v = 25
3) Un fabricante de baterías para auto garantiza que sus baterías duraran en promedio, tres años
con una desviación estandar de 1 año .Si 5 de estas baterías tienen duraciones de 1.9, 2.4, 3.0, 3.5
y 4.2 años. Cual es la probabilidad de que la variabilidad de las baterías sea de más de 3 años ?
30
Instituto Profesional Diego Portales
AUTÓNOMO
1)
a) 27.488
b) 18.475
c) 36.415
2)
a) 13.277
b) 32.852
c) 46.928
3) y 4) tarea
31
Instituto Profesional Diego Portales
AUTÓNOMO
ASIGNATURA
ESTADÍSTICA
SEGUNDA UNIDAD
TÉCNICAS DE MUESTREO Y ESTIMACIÓN
PUNTUAL
32
Instituto Profesional Diego Portales
AUTÓNOMO
La teoría del muestreo tiene por objetivo, el estudio de las relaciones existentes entre la
distribución de un carácter en dicha población y las distribuciones de dicho carácter en todas sus
muestras.
Las ventajas de estudiar una población a partir de sus muestras son principalmente:
Coste reducido:
Si los datos que buscamos los podemos obtener a partir de una pequeña parte del total de
la población, los gastos de recogida y tratamiento de los datos serán menores. Por
ejemplo, cuando se realizan encuestas previas a un referéndum, es más barato preguntar a
4.000 personas su intención de voto, que a 30.000.000;
Mayor rapidez:
Estamos acostumbrados a ver cómo con los resultados del escrutinio de las primeras
mesas electorales, se obtiene una aproximación bastante buena del resultado final de unas
elecciones, muchas horas antes de que el recuento final de votos haya finalizado;
Más posibilidades:
Para hacer cierto tipo de estudios, por ejemplo el de duración de cierto tipo de bombillas,
no es posible en la práctica destruirlas todas para conocer su vida media, ya que no
quedaría nada que vender. Es mejor destruir sólo una pequeña parte de ellas y sacar
conclusiones sobre las demás.
De este modo se ve que al hacer estadística inferencial debemos enfrentarnos con dos problemas:
33
Instituto Profesional Diego Portales
AUTÓNOMO
Muestreo aleatorio
Consideremos una población finita, de la que deseamos extraer una muestra. Cuando el proceso
de extracción es tal que garantiza a cada uno de los elementos de la población la misma
oportunidad de ser incluidos en dicha muestra, denominamos al proceso de selección muestreo
aleatorio.
1
• La probabilidad de que e sea elegido en primer lugar es N ;
N
• Si no ha sido elegido en primer lugar (lo que ocurre con una probabilidad de N − 1 , la
1
probabilidad de que sea elegido en el segundo intento es de N − 1 .
• en el (i+1)-ésimo intento, la población consta de N-i elementos, con lo cual si e no ha sido
1
seleccionado previamente, la probabilidad de que lo sea en este momento es de N − i .
34
Instituto Profesional Diego Portales
AUTÓNOMO
P[ M ] = P[(e1 , e2 ,....., en )]
= P[e1 ] ⋅ P[e2 ] ⋅ ⋅ ⋅ P[en / e1 ,e2 ,......,en −1 ]
1 1 1
= ⋅ ⋅⋅⋅
N N − 1 N − (n − 1)
( N − n)!
=
N!
sea elegida es la suma de las probabilidades de elegir una cualquiera de sus n-uplas, tantas veces
como permutaciones en el orden de sus elementos sea posible, es decir
P[ M ] = P[(e1 , e2 ,....., en )]
= n! ⋅ P[(e1 , e2 ,....., en )]
n! ⋅ ( N − n)!
=
N!
Sobre una población E de tamaño N podemos realizar extracciones de n elementos, pero de modo
que cada vez el elemento extraído es repuesto al total de la población. De esta forma un elemento
puede ser extraído varias veces. Si el orden en la extracción de la muestra interviene, la
probabilidad de una cualquiera de ellas, formada por n elementos es:
1 1 1 1
⋅ ⋅⋅⋅ = n
N N N N
35
Instituto Profesional Diego Portales
AUTÓNOMO
El muestreo aleatorio con reposición es también denominado muestreo aleatorio simple, que
como hemos mencionado se caracteriza por que:
36
Instituto Profesional Diego Portales
AUTÓNOMO
Un ejemplo de una tabla de números aleatorios consiste en la lista de los números de Lotería
Nacional premiados a lo largo de su historia, pues se caracterizan por que cada dígito tiene la
misma probabilidad de ser elegido, y su elección es independiente de las demás extracciones.
Un modo de hacerlo es el siguiente. Supongamos que tenemos una lista de números aleatorios de
k=5 cifras (00000-99.999), una población de N=600individuos, y deseamos extraer una muestra
de n=6 de ellos. En este caso ordenamos a toda la población (usando cualquier criterio) de modo
que a cada uno de sus elementos le corresponda un número del 1 al 600. En segundo lugar nos
dirigimos a la tabla de números aleatorios, y comenzando en cualquier punto extraemos un
número t, y tomamos como primer elemento de la muestra al elemento de la población:
⎡t ⋅ N ⎤ ⎡ t ⋅ 600 ⎤
1+ ⎢ k ⎥ = 1+ ⎢
⎣ 10 ⎦ ⎣100.000 ⎥⎦
El proceso se repite tomando los siguientes números de la tabla de números aleatorios, hasta
obtener la muestra de 10 individuos.
Las cantidades
t
u=
10 k
pueden ser consideradas como observaciones de una v.a. U, que sigue una distribución uniforme
en el intervalo [0,1]
37
Instituto Profesional Diego Portales
AUTÓNOMO
Método de Montecarlo
El método de Montecarlo es una técnica para obtener muestras aleatorias simples de una v.a. X,
de la que conocemos su ley de probabilidad (a partir de su función de distribución F). Con este
método, el modo de elegir aleatoriamente un valor de X siguiendo usando su ley de probabilidad
es:
1. Usando una tabla de números aleatorios se toma un valor u de una v.a. U~U(0,1).
2. Si X es continua tomar como observación de X, la cantidad x=F-1(u). En el caso en que X sea
discreta se toma x como el percentil 100*μ de X, es decir el valor más pequeño que verifica que
F(x)≥μ.
Este proceso se debe repetir n veces para obtener una muestra de tamaño n.
Ejemplo
Si queremos extraer n=10 muestras de una distribución N(0,1) podemos recurrir a una tabla de
números aleatorios de k=5 cifras, en las que observamos las cantidades (por ejemplo)
A partir de ellas podemos obtener una muestra de X~N(0,1) usando una tabla de la distribución
normal:
38
Instituto Profesional Diego Portales
AUTÓNOMO
Obsérvese que como era de esperar, las observaciones xi tienden a agruparse alrededor de la
esperanza matemática deXi~N(μ=0, σ2=1). Por otra parte, esto no implica que el valor medio de
la muestra sea necesariamente x = 0 . Sin embargo como sabemos por el teorema de Fischer que
10
⎛ 1⎞
X = ∑ X i ~ N ⎜ μ x = 0, σ x2 = ⎟
i =1 ⎝ 10 ⎠
su dispersión con respecto al valor central es pequeña, lo que implica que probablemente el valor
medio estará muy próximo a 0, como se puede calcular:
1
x= (0,71 + ...... + 1,65) = 0,012
10
39
Instituto Profesional Diego Portales
AUTÓNOMO
MUESTREO ESTRATIFICADO
Ejemplo
Supongamos que realizamos un estudio sobre la población de estudiantes de una Universidad, en
el que a través de una muestra de 10 de ellos queremos obtener información sobre el uso de
barras de labios.
En primera aproximación lo que procede es hacer un muestreo aleatorio simple, pero en su lugar
podemos reflexionar sobre el hecho de que el comportamiento de la población con respecto a este
carácter no es homogéneo, y atendiendo a él, podemos dividir a la población en dos estratos:
40
Instituto Profesional Diego Portales
AUTÓNOMO
Si observamos con más atención, nos encontramos (salvo sorpresas de probabilidad reducida)
que el comportamiento de los varones con respecto al carácter que se estudia es muy homogéneo
y diferenciado del grupo de las mujeres.
Por otra parte, con toda seguridad la precisión sobre el carácter que estudiamos, será muy alta en
el grupo de los varones aunque en la muestra haya muy pocos (pequeña varianza), mientras que
en el grupo de las mujeres habrá mayor dispersión. Cuando las varianzas poblacionales son
pequenãs, con pocos elementos de una muestra se obtiene una información más precisa del total
de la población que cuando la varianza es grande. Por tanto, si nuestros medios sólo nos permiten
tomar una muestra de 10 alumnos, será más conveniente dividir la muestra en dos estratos, y
tomar mediante muestreo aleatorio simple cierto número de individuos de cada estrato, de modo
que se elegirán más individuos en los grupos de mayor variabilidad. Así probablemente
obtendríamos mejores resultados estudiando una muestra de:
• 1 varón.
• 9 hembras.
Asignación proporcional
Sea n el número de individuos de la población total que forman parte de alguna muestra:
n=n1,n2,…,nk
Ni
ni = n ⋅
N
41
Instituto Profesional Diego Portales
AUTÓNOMO
Asignación óptima
Cuando se realiza un muestreo estratificado, los tamaños muestrales en cada uno de los estratos,
ni, los elige quien hace el muestreo, y para ello puede basarse en alguno de los siguientes
criterios:
• Elegir los ni de tal modo que se minimice la varianza del estimador, para un coste
especificado, o bien,
• habiendo fijado la varianza que podemos admitir para el estimador, minimizar el coste en
la obtención de las muestras.
Así en un estrato dado, se tiende a tomar una muestra más grande cuando:
Para ajustar el tamaño de los estratos cuando conocemos la dispersión interna de cada uno de los
mismos, tenemos el siguiente resultado:
Muestreo sistemático
Cuando los elementos de la población están ordenados en fichas o en una lista, una manera de
muestrear consiste en
• Sea k=N/n ;
• Elegir aleatoriamente un número m, entre 1 y k;
• Tomar como muestra los elementos de la lista:
{e e
m, m+ k , em + 2 k ,..., em + ( n −1) k }
42
Instituto Profesional Diego Portales
AUTÓNOMO
Observación
El método tal como se ha definido anteriormente es sesgado si N/n no es entero, ya que los
últimos elementos de la lista nunca pueden ser escogidos. Un modo de evitar este problema
consiste en considerar la lista como si fuese circular (el elemento N+1 coincide con el primero)
y:
Se puede comprobar que con este método todos los elementos de la lista tienen la misma
probabilidad de selección.
Si intentamos hacer un estudio sobre los habitantes de una ciudad, el muestreo aleatorio simple
puede resultar muy costoso, ya que estudiar una muestra de tamaño n implica enviar a los
encuestadores a npuntos distintos de la misma, de modo que en cada uno de ellos sólo se realiza
una entrevista. En esta situación es más económico realizar el denominado muestreo por
conglomerados, que consiste en elegir aleatoriamente ciertos barrios dentro de la ciudad, para
después elegir calles y edificios. Una vez elegido el edificio, se entrevista a todos los vecinos.
43
Instituto Profesional Diego Portales
AUTÓNOMO
Si X es la media de una muestra aleatoria de tamaño n tomada de una población con media μ y
varianza σ2 , entonces la variable:
Z=
(X − μ ) n
tiene distribución normal estándar ( N(0,1)) siempre que n → ∞, (n ≥ 30)
σ
Ejemplo
Una empresa eléctrica fabrica focos que tienen una duración que se distribuye aproximadamente
en forma normal, con media 800 horas y desviación estándar 40 horas. Encuentre la probabilidad
de que una muestra aleatoria de 16 focos tenga una vida promedio de 775 horas.
Solución
Como la distribución de los focos es aproximadamente normal, que n=16 sea menor que treinta
no es relevante para el problema. Luego
Z=
(X − μ ) n
=
(775 − 800) 16
= −2.5
σ 40
por lo tanto
P( X < 775) = P( Z < −2.5) = 0.0062
44
Instituto Profesional Diego Portales
AUTÓNOMO
Sea x1,x2,…..x2 una muestra aleatoria de una variable aleatoria X que se distribuye normal con
media μ y varianza σ2 entonces:
⎛ σ2 ⎞ ( X − μ) n
X ~ N ⎜⎜ μ , ⎟⎟ ⇒ Z = ~ N (0,1)
⎝ n ⎠ n
Ejemplo
Si una muestra aleatoria de tamaño 20 de una población normal con media 64,3 y varianza 225.
Encuentre la probabilidad de que la media muestral sea mayor que 68.
Solución
45
Instituto Profesional Diego Portales
AUTÓNOMO
1) La vida media de una máquina para hacer pasta es de siete años, con una desviación
estándar de un año. Suponga que las vidas de estas máquinas siguen aproximadamente
una distribución normal, encuentre:
46
Instituto Profesional Diego Portales
AUTÓNOMO
1)
a) 0.6898
b) 7.35
2)
a) 0.0062
b) 0.0668
c) 0.3413
47
Instituto Profesional Diego Portales
AUTÓNOMO
Inferencia estadística
La teoría de inferencia estadística consiste en aquellos métodos con los cuales se pueden
realizar inferencias o generalizaciones acerca de una población.
ESTIMACION DE PARAMETROS
insesgamiento.
Definición
De esta forma : a) E ( x ) = μ
b) E( s 2 ) = σ 2
48
Instituto Profesional Diego Portales
AUTÓNOMO
θˆ1 < θ < θˆ2 , donde θˆ1 y θˆ2 dependen del valor de θˆ para una muestra particular y también de la
distribución muestral de θ .
ˆ
Por ejemplo:
49
Instituto Profesional Diego Portales
AUTÓNOMO
⎛ σ2 ⎞
X ~ N ⎜⎜ μ , ⎟⎟
Sabemos que si X es una variable aleatoria de una poblacion normal, entonces : ⎝ n ⎠
(x − μ) n
luego la variable : Z = ~ N(0,1)
σ
P ( Z1 < Z < Z 2 ) = 1 − α
α α
P( Z < Z 2 ) = +1−α = 1−
2 2
α
P ( Z < Z1 ) =
2
Luego : Z 2 = Z α por construcción
1−
2
Z1 = Zα pero Z1 = − Z 2
2
Luego : Z1 = − Z α
1−
2
50
Instituto Profesional Diego Portales
AUTÓNOMO
⎛ (x − μ) n ⎞
P⎜⎜ − Z α < < Z α ⎟⎟ = 1 − α
⎝ 1− 2 σ 1−
2 ⎠
⎛ ⎞
⎜ ⎟
⎜ (x − μ)
P −Z α < < Z α ⎟ = 1−α
⎜ 1− 2 σ 1− ⎟
⎜ 2
⎟
⎝ n ⎠
⎛ σ σ ⎞⎟
P⎜⎜ − Z α < x−μ <Z α = 1−α
⎝ 1− 2 n 1−
2 n ⎟⎠
⎛ σ σ ⎞⎟
P⎜⎜ − x − Z α < −μ < − x + Z α = 1−α
⎝ 1−
2 n 1−
2 n ⎟⎠
⎛ σ σ ⎞⎟
P⎜⎜ x − Z α <μ < x+Z α = 1−α
⎝ 1−
2 n 1−
2 n ⎟⎠
Definición
Si x es la media de una muestra aleatoria de tamaño n de una población normal con varianza
pobalcional σ conocida, entonces un intervalo de confianza del (1- α )100% para la media
2
⎛ σ σ ⎞⎟
⎜x − Z α ,x + Z α
⎜ 1− n 1− n ⎟⎠
⎝ 2 2
Ejemplo :
Si una muestra aleatoria de tamaño 20 de una población normal con varianza 225 tiene una media
muestral de 64.3. Construya un intervalo de confianza del 95% para μ .
51
Instituto Profesional Diego Portales
AUTÓNOMO
Solución
(1 − α )100% = 95% ⇒ α = 0.05
n = 20
σ 2 = 225 ⇒ σ = 15
x = 64.3
⎛ 15 15 ⎞
⎜ 64.3 − Z 0.05 , 64. 3 + Z ⎟
⎜ 1− 1−
0.05 ⎟
⎝ 2 20 2 20 ⎠
⎛ 15 ⎞
⎟⎟ = (57.7,70.9)
15
⎜⎜ 64.3 − (1.96) ,64.3 + (1.96)
⎝ 20 20 ⎠
así con una confianza del 95% el verdadero valor de la media poblacional μ se encuentra en el
intervalo : (57.7,70.9).
Teorema
Si se usa x como estimación de μ , se puede tener una confianza del (1-α)100% de que el error
no excederá de :
σ
e=Z α
1−
2 n
En el ejemplo anterior:
15
Z α = Z 0.975 = 1.96 ⇒ e = (1.96) = 6.57
1− 20
2
52
Instituto Profesional Diego Portales
AUTÓNOMO
así con una confianza de 95% , el error de estimar μ a través de x no será mayor que 6.57
x − μ ≤ 6.57
unidades, es decir : .
Teorema
Con una confianza del (1-α)100% , el tamaño muestral adecuado (n) para que la diferencia entre
x y μ no sea mayor que una cantidad específica e está dado por :
2
⎛⎛ ⎞ ⎞
⎜⎜Z α ⎟σ ⎟
⎜ ⎜⎝ 1− 2 ⎟ ⎟
⎠
n=⎜ ⎟
⎜ e ⎟
⎜ ⎟
⎝ ⎠
Ejemplo:
¿ Que tan grande se require que sea la muestra del ejemplo (1) para que el error de estimar μ a
través de x no sea mayor que 0.05 ? utilice una confianza del 95%.
Sol
e = 0.05 ; (1 - α ) = 0.95 ⇒ α = 0.05 así Z α = Z 0.975 = 1.96
1-
2
2
⎛ 1.96(15) ⎞
σ = 15 por lo tanto n = ⎜ ⎟ = 345.744
⎝ 0.05 ⎠
Luego con una confianza del 95% el tamaño muestral adecuado para que error de estimar μ de
x no sea mayor que 0.05 es de n=346 unidades aproximadamente.
Observación
Todo lo anterior también es aplicable a poblaciones no normales con varianza conocida cuando
n>30.
53
Instituto Profesional Diego Portales
AUTÓNOMO
1) Las medidas de los diámetros de los rodamientos tiene una desviación estándar de de
0.042 cm. Se selecciona una muestra aleatoria de 200 rodamientos producidas por una
máquina en una semana, los diámetros dieron una media de 0.824 cm. Hallar un intervalo
de confianza del 95% y 99% para el verdadero diámetro promedio de los rodamientos.
54
Instituto Profesional Diego Portales
AUTÓNOMO
2) (99.17 , 102.63)
3) a) (63.35 , 86.65)
b) (84.8)
c) 66.775
55
Instituto Profesional Diego Portales
AUTÓNOMO
Sabemos que si x1,x2,……..xn una muestra aleatoria de una variable aleatoria X~N(μ,σ2) con σ2
desconocida entonces el estadístico:
(x − μ) n
T= tiene distribución t - student con v = n − 1 grados de libertad .
s
donde n es el tamaño de la muestra y s es la desviación estándar de la muestra .
56
Instituto Profesional Diego Portales
AUTÓNOMO
Definición
Si x es la media de una muestra aleatoria de tamaño n de una población normal con varianza
conocida, entonces un intervalo de confianza del (1-α)100% para μ está dado por:
⎛ s s ⎞
⎜ x − tα , x + t ⎟
⎜ n
α
n ⎟⎠
⎝ 2 2
Ejemplo
Un fabricante de pintura quiere determinar el tiempo de secado promedio para una nueva pintura
para pared interior. Si para una prueba de 12 áreas de igual tamaño se obtiene un tiempo medio
de secado de 66.3 minutos y una desviación estándar de 8.4 minutos. Construya un intervalo de
confianza del 95% para μ el verdadero tiempo de secado promedio de las paredes si el tiempo
de secado tiene distribución normal.
Solución
n = 12 ⇒ n - 1 = 11
α
x = 66.3 por otro lado :1 − α = 0.95 ⇒ α = 0.05 ⇒ = 0.025 ⇒ t α = t 0.025,11 = 2.201
2 , n −1
2
⎛ 8.4 ⎞
⎟ = (61;71.6 )
8.4
⎜ 66.3 - (2.201) , 66.3 + (2.201)
⎝ 12 12 ⎠
57
Instituto Profesional Diego Portales
AUTÓNOMO
Así un intervalo de confianza del 95% para el verdadero tiempo de secado promedio de las
paredes se encuentra en el intervalo (61; 71.6) minutos.
Teorema
Si se usa x como estimación de μ , se puede tener una confianza del (1-α)100% de que el error
no excederá de :
s
e = tα
2 n
Ejemplo:
En el ejemplo anterior:
8.4
t α = 2.201 , s = 8.4 , n = 12 por lo tanto : e = (2.201) = 5.34
2 12
Teorema
Con una confianza del (1-α)100% , el tamaño muestral adecuado (n) para que la diferencia entre
x y μ no sea mayor que una cantidad específica e está dado por :
2
⎛ tα s ⎞
⎜ ⎟
n=⎜ 2 ⎟
⎜ e ⎟
⎝ ⎠
58
Instituto Profesional Diego Portales
AUTÓNOMO
Ejemplo:
En el ejemplo del fabricante de pintura, determine el tamaño de muestra adecuado para que el
error de estimar μ a través de x no sea mayor que 0.25 minutos.
2
⎛ 2.201(8.4) ⎞
n=⎜ ⎟ = 5469
⎝ 0.25 ⎠
Es decir para que el error no sea mayor que 0.25 se debe tomar una muestra de 5469 áreas.
59
Instituto Profesional Diego Portales
AUTÓNOMO
3) Una muestra aleatoria de 100 propietarios de automóviles indica que, en el estado XX, un
automóvil recorre un promedio de 23.500 Km por año con una desviación estándar de
3.900 Km. Determine un intervalo de confianza del 98% para la cantidad promedio de
Km que un automóvil recorre anualmente en el estado XX. Suponga distribución normal.
60
Instituto Profesional Diego Portales
AUTÓNOMO
1) (11867,385 ; 12132,615)
2) (9.61 ; 11.35)
3) (22578,04 ; 24421,96)
4) a) (1,847 ; 3.353)
b) n= 40 cigarros aproximadamente.
61
Instituto Profesional Diego Portales
AUTÓNOMO
62
Instituto Profesional Diego Portales
AUTÓNOMO
⎛ ⎞
P⎜⎜ X 2 α < X 2 < X α2 ⎟⎟ = 1 − α
⎝ 1− 2 2 ⎠
⎛ (n − 1) s 2 ⎞
P⎜⎜ X 2 α < < X α2 ⎟⎟ = 1 − α
⎝ 1− 2 σ 2
2 ⎠
⎛ ⎞
⎜ 1 σ2 1 ⎟
P⎜ 2 < < 2 ⎟ = 1−α
⎜ X α (n − 1) s X α ⎟
2
1−
⎝ 2 2 ⎠
⎛ ⎞
⎜ (n − 1) s 2 (n − 1) s 2 ⎟
P⎜ <σ < 2
⎟ = 1−α
⎜ Xα X 2α ⎟
2
1−
⎝ 2 2 ⎠
Definición
Si s2 es la varianza de una muestra aleatoria de tamaño n de una población normal, un intervalo
de confianza del (1-α)100% para σ2 está dado por:
⎛ ⎞
⎜ (n − 1) s 2 (n − 1) s 2 ⎟
⎜ ; ⎟
⎜ Xα X 2α
2
1−
⎟
⎝ 2 2 ⎠
donde X2α/2 y X21-α/2 son los valores de X2 con (n-1) grados de libertad, con áreas de α/2 y
1-α/2 respectivamente, a la derecha.
Ejemplo:
1) Determine un intervalo de confianza del 95% para la varianza de una muestra de 10
paquetes de semilla, si la varianza de la muestra es 0.286.
63
Instituto Profesional Diego Portales
AUTÓNOMO
Solución:
2) Se obtiene una muestra aleatoria de 20 estudiantes con una media x = 72 puntos y una
Solución
α α
(1 − α )100% = 98% ⇒ α = 0.02 ⇒ = 0.01 ⇒ 1 − = 0.99
2 2
n = 20 ⇒ (n − 1) = 19
X α2 = 36.191 ; X 2 α = 7.633
1-
2 2
de esta manera el intervalo de confianza del 95% para la varianza σ2 está dado por:
⎛ 19(16) 19(16) ⎞
⎜ ; ⎟ = (8.39;39.82)
⎝ 36.191 7.633 ⎠
luego con una confianza del 95% el verdadero valor de la varianza σ2 de las notas de los
estudiantes se encuentra en el intervalo (8.39;39.82).
64
Instituto Profesional Diego Portales
AUTÓNOMO
1) Un fabricante de baterías para automóvil asegura que sus baterías duran en promedio, 3
años con una desviacíon estándar de un año. Si 5 de estas baterías tienen una desviación
estándar de 0.9028 años. Determine un intervalo de confianza del 95% para la varianza
real. ¿ Es válida la afirmación del fabricante ? Suponga que la población de las duraciones
de las baterías se distribuye aproximadamente normal.
3) Una muestra aleatoria de 25 cigarros de una cierta marca tiene un contenido promedio de
nicotina de 1.3 milígramos y una desviación estándar de 0.17 milígramos. Encuentre un
intervalo de confianza del 90% y 98% para la varianza real de esta derteminada marca de
cigarros si se supone que las mediciones se distribuyen normalmente.
4) Una muestra aleatoria de 100 propietarios de automóviles indica que, en el estado XX, un
automóvil recorre un promedio de 23.500 Km al año con una desviación estándar de
3.900 Km. Determine un intervalo de confianza del 99% para la varianza real de Km
recorridos al año por los automóviles del estado XX.
65
Instituto Profesional Diego Portales
AUTÓNOMO
1) (0.29; 6.79) La afirmación del fabricante es válida porque la varianza poblacional está
dentro del intervalo que se determinó con una confianza del 95%.
2) (1.069; 3.949)
4) ( 10741065.69 ; 22374294,2)
66
Instituto Profesional Diego Portales
AUTÓNOMO
Si tenemos dos poblaciones normales con medias μ1 y μ2 y varianzas σ12 y σ22, respectivamente,
el estadístico usado para la construcción de este intervalo está dado por:
( x1 − x 2 ) − (u1 − u 2 )
z= ~ N (0,1) ( z tiene distribución normal estándar)
⎛ σ 12 ⎞ ⎛ σ 22 ⎞
⎜⎜ ⎟⎟ + ⎜⎜ ⎟⎟
⎝ n1 ⎠ ⎝ n2 ⎠
Definición
⎡ ⎛ σ 12 ⎞ ⎛ σ 22 ⎞ ⎛ σ 12 ⎞ ⎛ σ 22 ⎞ ⎤
⎢( x1 − x 2 ) − z α ⎜⎜ ⎟⎟ + ⎜⎜ ⎟⎟ ; ( x1 − x 2 ) + z α ⎜⎜ ⎟⎟ + ⎜⎜ ⎟⎟ ⎥
⎢⎣ 1−
2 ⎝ n1 ⎠ ⎝ n2 ⎠ 1−
2 ⎝ n1 ⎠ ⎝ n2 ⎠ ⎥⎦
67
Instituto Profesional Diego Portales
AUTÓNOMO
Ejemplo:
Se lleva a cabo un experimento en que se comparan dos tipos de motores A y B. Se mide el
rendimiento en millas por galón de gasolina. Se realizan 50 experimentos con el motor tipo A y
75 con el motor tipo B. La gasolina que se utiliza y las demás condiciones se mantienen
constantes. El rendimiento promedio de gasolina para el motor A es de 36 millas por galón y el
promedio para el motor B es 42 millas por galón. Encuentre un intervalo de confianza del 96 %
para ( μB-μA), donde μB y μA son el rendimiento de gasolina medio poblacional para los motores
B y A. Suponga que las deviaciones estándar poblacionales son seis y ocho para los motores A y
B.
Solución
x B − x A = 42 - 36 = 6 , σ B2 = 8 , σ A2 = 6 , además n A = 50, n B = 75
De esta forma un intervalo de confianza de 96% para (μB-μA) está dado por:
⎡ 64 36 ⎤
+ ⎥ = [3.43 ; 8.57]
64 36
⎢6 - 2.05 + ; 6 + 2.05
⎣ 75 50 75 50 ⎦
Podemos concluir que el rendimiento del motor B es mayor que el rendimiento del motor A.
68
Instituto Profesional Diego Portales
AUTÓNOMO
Si tenemos dos poblaciones normales con medias μ1 y μ2 y varianzas poblacionales σ12 y σ22,
desconocidas pero iguales, el estadístico usado para la construcción de este intervalo está dado
por:
( x1 − x 2 ) − ( μ1 − μ 2 )
T= tiene distribución t − student con v = n1 + n2 - 2 grados de libertad
1 1
sp +
n1 n2
donde:
Definición
⎡ 1 1 1 1 ⎤
⎢( x1 − x 2 ) − t α s p + ; ( x1 − x 2 ) + t α s p + ⎥
⎣ 2
n1 n2 2
n1 n2 ⎦
donde tα/2 es el valor de t que deja un área de α/2 a derecha con v=n1+n2-2 grados de libertad.
69
Instituto Profesional Diego Portales
AUTÓNOMO
Ejemplo:
Se eligieron dos estaciones de muestreo independientes para un estudio sobre la descarga de
ácido de una mína de uranio. Los registros de ambas estaciones se encuentran dados en la
siguiente tabla:
Estación 1 Estación 2
n1= 12 n2= 10
x1 =3.11 x 2 =2.04
s1=0.771 s2=0.448
Encuentre un intervalode confianza del 90% para la diferencia entre las medias poblacionales de
ambas estaciones. Suponga que las varianzas poblacionales son iguales pero desconocidas.
Solución
De esta forma:
70
Instituto Profesional Diego Portales
AUTÓNOMO
De esta forma un intervalo de confianza de 90% para (μ1-μ2) está dado por:
⎡ 1 ⎤
⎥ = [0.593 ; 1.547]
1 1 1
⎢1.07 - (1.725)(0.646) + ; 1.07 + (1.725)(0.646) +
⎣ 12 10 12 10 ⎦
De esta forma podemos concluir que las decarga de uranio en la en la estación 1 es mayor que
en la estación 2.
71
Instituto Profesional Diego Portales
AUTÓNOMO
1) Una muestra aleatoria de tamaño n1=25 que se toma de una población normal con una
desviación estándar σ1=5 tiene una media x1 = 80 . Una segunda muestra aleatoria de
tamaño n2=36, que se toma de una población normal diferente con una desviación
estándar σ2=3, tiene una media x2 = 75 .Encuentre un intervalo de confianza del 95% para
μ1-μ2.
2) Los estudiantes pueden elegir entre un curso de física sin laboratorio de tres semestres-
hora y un curso con laboratorio de 4 semestres-hora. El examen escrito final es el mismo
para cada sección. Si 12 estudiantes de la sección con laboratorio tienen una calificación
promedio en el exámen de 84 con una deviación estándar de 4, y 18 estudiantes de la
sección sin laboratorio tienen una calificación promedio de 77 con una deviación estándar
de 6, encuentre un intervalo de confianza del 99% para la diferencia entre las
calificaciones promedio de los dos cursos. Suponga que las poblaciones se distribuyen de
forma aproximadamente normal con varianzas iguales.
Medicamento 1 Medicamento 2
n1= 14 n2= 16
x1 =17 x 2 =19
72
Instituto Profesional Diego Portales
AUTÓNOMO
Encuentre un intervalo de confianza del 99% para la diferencia μ1-μ2 del tiempo promedio de
recuperación de los medicamentos. ¿Son iguales los tiempos de recuperación? Suponga
poblaciones normales con varianzas poblacionales desconocidas pero iguales.
4) Una compañía de taxis trata de decidir si comprar neumáticos marca A o de la marca B para su
flotilla de taxis. Para estimar la diferencia de las dos marcas, se lleva a cabo un experimento
utilizando 12 de cada marca. Los neumáticos se utilizan hasta que se gastan. Los resultados son:
Marca A Marca B
n1= 12 n2= 12
x1 =36,300 kilómetros x 2 =38,100 kilómetros
Calcule un intervalo de confianza del 95% para μ1-μ2 , suponga que las poblaciones se
distribuyen de forma aproximadamente normal. Suponga varianzas iguales pero desconocidas. ¿
Existe diferencia entre las dos marcas de neumáticos ?
73
Instituto Profesional Diego Portales
AUTÓNOMO
3) μ2-μ1 ∈ [0.7 , 3.3] . El tiempo de recuperación del medicamento 2 es mayor que el tiempo
de recuperación del medicamento 1
4) μ1-μ2 ∈ [-6522 , 2922] . El cero pertenece este intervalo luego μ1-μ2 puede ser igual a
cero, es decir: μ1-μ2 =0 ⇒ μ1 = μ2 , luego no existen diferencias entre los dos marcas
neumáticos.
74
Instituto Profesional Diego Portales
AUTÓNOMO
ASIGNATURA
ESTADÍSTICA
TERCERA UNIDAD
PRUEBAS DE HIPÓTESIS
75
Instituto Profesional Diego Portales
AUTÓNOMO
PRUEBAS DE HIPOTESIS
Son procedimientos de decisión basados en datos que puedan producir una conclusión acerca de
algún sistema científico.
Una hipótesis estadística es una afirmación o conjetura acerca de una o más poblaciones.
No es posible saber con absoluta certeza la verdad o falsedad de una hipótesis estadística, pues
para ello habría que trabajar con toda la población. En la práctica se toma una muestra aleatoria
de la población de interés y se utilizan los datos que contiene tal muestra para proporcionar
evidencias que confirmen o no la hipótesis. Si la evidencia de la muestra es inconsistente con la
hipótesis planteada, entonces ésta se rechaza y si la evidencia apoya a la hipótesis planteada,
entonces se acepta ésta.
La aceptación de una hipótesis implica tan sólo que los datos no proporcionan evidencia
suficiente para refutarla. Por otro lado, el rechazo implica que la evidencia de la muestra la refuta.
Una hipótesis nula referente a un parámetro poblacional siempre debe establecerse de manera que
especifique un valor exacto del parámetro, mientras que la hipótesis alternativa admite la
posibilidad de varios valores.
Por ejemplo:
H : μ = 20 H 0 : μ = 20 H : μ = 20
1) 0 2) 3) 0
H1 : μ > 20 H1 : μ < 20 H1 : μ ≠ 20
En la hipótesis alternativa se plantea usualmente la que se cree verdadero y en la hipótesis nula lo
que se desea rechazar.
Para tomar una desición acerca de un parámetro es necesario una prueba estadística para
cuantificar esta decisión. Esto se logra al establecer primero la distribución muestral que sigue la
muestra estadística ( es decir, la media ) y después calcular la prueba estadística apropiada. Esta
prueba estadística mide que tan cerca de la hipótesis nula se encuentra el valor de la muestra. La
prueba estadística suela seguir una distribución estadística conocida ( normal, t-student, ji
cuadrado).
76
Instituto Profesional Diego Portales
AUTÓNOMO
b) región de no rechazo
Pare decidir con relación a la hipótesis nula, primero se tiene que determinar el valor crítico para
la distribución estadística de interés. El valor crítico separa la región de rechazo de la región de
no rechazo.
valor crítico
Al utilizar una muestra para obtener conclusiones sobre una población existe el riesgo de llegar a
una conclusión incorrrecta. Pueden ocurrir dos errores diferentes:
Al probar cualquier hipótesis estadística, existen cuatro posibles situaciones que determinan si la
desición es correcta o equivocada.
H0 es verdadera H0 es falsa
Se acepta H0 Desición correcta Error tipo II
Se rechaza H0 Error tipo I Desición correcta
La probabilidad de cometer error tipo II, es decir, aceptar H0 cuando es falsa, se representa por
β . P(error tipo II)= β
La probabilidad de cometer error tipo II, es decir, rechazar H0 cuando es falsa, se denomina
potencia de la prueba y se denota por 1 − β . P(error tipo I)c= 1 − β
77
Instituto Profesional Diego Portales
AUTÓNOMO
El ideal al rechazar una prueba de hipótesis es determinar los procedimientos o reglas que
conduzcan a maximizar la potencia de una prueba, para α fijo. α se suele especificar antes de
tomar una muestra, es frecuente que α = 0.05 o α = 0.01
H 0 : θ ≤ θ1 H 0 : θ ≥ θ1 H 0 : θ = θ1
a) b) c)
H1 : θ > θ1 H1 : θ < θ1 H1 : θ ≠ θ1
H 0 : θ = θ1
a)
H1 : θ > θ1
H 0 : θ = θ1
b)
H1 : θ < θ1
H 0 :θ ≤ θ1
c)
H1 :θ > θ1
H 0 : θ ≥ θ1
d)
H1 : θ < θ1
78
Instituto Profesional Diego Portales
AUTÓNOMO
H 0 : θ = θ1
H1 : θ ≠ θ1 (θ < θ1 ∨ θ > θ1 )
Pruebas de hipótesis
⎛ σ2 ⎞
( )
Recuerde que si X ~ N μ ,σ , entonces X ~ N ⎜⎜ μ , ⎟⎟ . Luego el estadístico usado para
2
n ⎠
⎝
contrastar estas hipótesis está dado por:
(x − μ) n
z= ~ N(0,1)
σ
i) H 0 : u = u1 (u ≤ u1 )
H 1 : u > u1
RC = {z / z > z1−α }
Gráficamente:
79
Instituto Profesional Diego Portales
AUTÓNOMO
ii ) H 0 : u = u1 (u ≥ u1 )
H1 : u < u1
RC = {z / z < zα }
Gráficamente:
H 0 : u = u1
H1 : u ≠ u1
⎧ ⎫
RC = ⎨ z / z < − z α ó z > z α ⎬
1− 1−
⎩ 2 2⎭
Gráficamente:
80
Instituto Profesional Diego Portales
AUTÓNOMO
Ejemplos
Solución:
H 0 : u = 68
H1 : u ≠ 68
(67.5 − 68) 36
n = 36 x = 67.5 σ = 3.6 ⇒ z = = −0.83
3.6
Por lo tanto z ∉ RC . Luego con base en la muestra no es posible decidir si el peso promedio de
los estudiantes del instituto es distinto de 68 kilos.
2) Una muestra aleatoria de 100 muertos registrados en Chile durante el año pasado mostró
una vida promedio de 71.8 años. Suponiendo una desviación estándar poblacional de 8.9
años. ¿ Parecería esto indicar que la vida promedio hoy en día es mayor que 70 años ?
Utilice un nivel de significancia α=0.05.
81
Instituto Profesional Diego Portales
AUTÓNOMO
Solución:
H 0 : u < 70
H1 : u > 70
RC = {z / z > 1.64}
Por lo tanto z ∈ RC . Luego con base en la muestra podemos decir que la vida promedio hoy en
día supera los 70 años.
Solución:
H0 : u = 8
H1 : u ≠ 8
(7.8 − 8) 50
n = 50 x = 7.8 σ = 0.5 ⇒ z = = −2.83
0.5
82
Instituto Profesional Diego Portales
AUTÓNOMO
83
Instituto Profesional Diego Portales
AUTÓNOMO
1) Una empresa eléctrica fabrica focos que tienen una duración que está distribuída en forma
aproximadamente normal con media 800 horas y una desviación estándar de 40 horas.
Pruebe la hipótesis de que μ = 800 horas en contraposición de la alternativa de que μ ≠
800 horas. Si una muestra aleatoria de 30 focos tiene una duración promedio de 788
horas. Utilice un nivel de significancia de 0,04.
84
Instituto Profesional Diego Portales
AUTÓNOMO
1) Se acepta H0 , es decir, los focos tienen una duración promedio de 800 horas.
85
Instituto Profesional Diego Portales
AUTÓNOMO
(x − μ ) n
t= se distribuye t-student con v=n-1 grados de libertad, donde s es la
s
desviación estándar de la muestra.
H 0 : μ = μ1 (μ ≤ μ 1 )
i)
H 1 : μ > μ1
RC = {t / t > t (α ,n −1) }
Gráficamente:
86
Instituto Profesional Diego Portales
AUTÓNOMO
H 0 : μ = μ1 ( μ ≥ μ1 )
ii)
H1 : μ < μ1
RC = {t / t < −t (α ,n −1) }
Gráficamente:
H 0 : u = u1
H1 : u ≠ u1
⎧ ⎫
RC = ⎨t / t < −tα ó t > tα ⎬
⎩ 2 2⎭
87
Instituto Profesional Diego Portales
AUTÓNOMO
Gráficamente:
Ejemplos:
Solución:
H 0 : u = 46
H1 : u < 46
(42 − 46) 12
n = 12 x = 42 s = 11.9 ⇒ t = = −1.16
11.9
88
Instituto Profesional Diego Portales
AUTÓNOMO
RC = {t / t < −1.796}
Por lo tanto t ∉ RC . Luego con base en la muestra no podemos decir que el consumo de
kilowatts-hora al año de las aspiradoras sea menor que 46.
2) El gerente de producción de una empresa cuyo proceso consiste en llenar cajas de cereal
desea saber si efectivamente en cada caja se está depositando, en promedio, los 368
gramos que se supone es lo que la empresa asegura a sus vendedores. Para ello, se
selecciona una muestra aleatoria de 25 de estas cajas obteniendose una media de 364.1
gramos y una desviación estándar de 17.3 gramos. Considere que la distribución de los
pesos de las cajas de cereales es normal y trabaje con un nivel de significancia α=0.05. ¿
Qué decide el gerente ?
Solución:
H 0 : u = 368
H1 : u ≠ 368
(364.1 − 368) 25
n = 25 x = 364.1 s = 17.3 ⇒ t = = −1.13
17.3
Por lo tanto t ∉ RC . Luego con base en la muestra el gerente de producción puede estar seguro
que, en promedio, cada caja contiene 368gramos de cereal.
89
Instituto Profesional Diego Portales
AUTÓNOMO
3) Suponga que en el mismo ejemplo anterior, del proceso de llenado de las cajas de cereal,
que la empresa es visitada por un representante de la oficina de protección al consumidor
y que le interesa averiguar si las cajas, en promedio, están faltas de peso, es decir, si el
peso promedio es inferior a 368 gramos. Considere un nivel de significación α=0.01.
Solución:
H 0 : u ≥ 368
H1 : u < 368
(364.1 − 368) 25
n = 25 x = 364.1 s = 17.3 ⇒ t = = −1.13
17.3
RC = {t / t < −2.492 }
90
Instituto Profesional Diego Portales
AUTÓNOMO
2) Se afirma que automóvil recorre un promedio anual de más de 20.000 kilómetros. Para
probar esta afirmación, se le solicita a una muestra aleatoria de 100 propietarios de
automóvil que lleven un registro de los kilómetros que recorren. ¿Estaría usted de
acuerdo con esta afirmación si en la muestra aleatoria resulta un promedio de 23.500
kilómetros y una desviación estándar de 3.900 kilómetros ? Use un nivel se significancia
α=0.01.
3) En un informe de una investigación de J.M.N. se afirma que los ratones con una vida
promedio de 32 meses llegarán hasta casi 40 cuando 40% de las calorías en su
alimentación se reemplacen con vitaminas y proteínas. ¿ Hay alguna razón para creer que
la vida promedio será inferior a 40 meses si 64 ratones que se han sujetado a esta dieta
tienen una vida promedio de 38 meses con una desviación estándar de 5.8 meses ? Utilice
un nivel de significancia α=0.025
4) Una empresa eléctrica afirma que un compactador de basura se usa un promedio de 125
horas al año. Si una muestra aleatoria de 49 hogares equipados con compactadores de
basura indica un uso promedio anual de 126.9 horas con una desviación estándar de 8.4
horas ¿ Sugiere esto con un nivel de significancia de 0.05, que estos aparatos se usan en
promedio más de 125 horas ?
91
Instituto Profesional Diego Portales
AUTÓNOMO
92
Instituto Profesional Diego Portales
AUTÓNOMO
(n − 1) s 2
χ2 =
σ2
H 0 : σ 2 = σ 12 (σ 2 ≤ σ 12 )
i)
H1 : σ 2 > σ 12
{
RC = χ 2 / χ 2 > χα2 , n −1 }
Gráficamente:
93
Instituto Profesional Diego Portales
AUTÓNOMO
H 0 : σ 2 = σ 12 (σ 2 ≥ σ 12 )
ii) i)
H1 : σ 2 < σ 12
{
RC = χ 2 / χ 2 < χ12−α , n −1 }
Gráficamente:
H 0 : σ 2 = σ 12
H1 : σ 2 ≠ σ 12
⎧ ⎫
RC = ⎨ χ 2 / χ 2 < χ 2 α ó χ 2 > χ 2α ⎬
(1− , n −1) ( , n −1)
⎩ 2 2 ⎭
94
Instituto Profesional Diego Portales
AUTÓNOMO
Gráficamente:
Ejemplos
1) Un fabricante de baterías para automóvil asegura que la duración de sus baterías tiene
distribución aproximadamente normal con desviación estándar de 0.9 años. Si una
muestra aleatoria de 10 baterías tiene una desviación estándar de 1.2 años ¿ Piensa usted
que σ >0.9 años ? Utilice un nivel de significancia α=0.05
Solución:
H 0 : σ 2 = 0,81
H1 : σ 2 > 0,81
9 ⋅ 1,44
n = 10 s 2 = 1.44 ⇒ χ 2 = = 16
0.81
95
Instituto Profesional Diego Portales
AUTÓNOMO
RC = {χ 2 / χ 2 > 19,919 }
Por lo tanto χ2∉RC. Luego con base en la muestra no hay evidencia suficiente para afirmar que
la varianza de la duración de las baterías sea mayor que 0.81 años.
Solución:
H 0 : σ 2 = 1,3
H1 : σ 2 ≠ 1,3
χ α2 = χ 02.025,7 = 16,013
, n −1
2
7 ⋅ 3,24
n=8 s 2 = 3.24 ⇒ χ 2 = = 17.45
0.13
96
Instituto Profesional Diego Portales
AUTÓNOMO
3) Experiencias pasadas indican que el tiempo para que los alumnos del último año realicen
un examen estandarizado es una v.a normal con desviación estándar de 6 minutos. Pruebe
la hipótesis de que σ<6 , si una muestra aleatoria de 20 estudiantes tiene una desviación
estándar de 4.51 minutos al realizar este examen. Utilice un nivel de significancia α=0.01.
Solución:
H 0 : σ 2 = 36
H1 : σ 2 < 36
19 ⋅ 20,3401
n = 20 s 2 = 20,3401 ⇒ χ 2 = = 10,74
36
RC = {χ 2 / χ 2 < 7,633 }
Por lo tanto χ2∉RC. Luego con base en la muestra es posible afirmar que la varianza del tiempo
en que los estudiantes contestan el examen es igual a 36 minutos.
97
Instituto Profesional Diego Portales
AUTÓNOMO
2) Se sabe que el contenido de nicotina de una marca de cigarros tiene una distribución
aproximadamente normal con una varianza de 1,3 milígramos. Pruebe la hipótesis de que
σ2=1.3 en contraposición a la alternativa de que σ2>1,3 , si una muestra aleatoria de 8 de
estos tiene una desviación estándar de 1,8. Use un nivel de significancia α=0,05.
98
Instituto Profesional Diego Portales
AUTÓNOMO
99
Instituto Profesional Diego Portales
AUTÓNOMO
ASIGNATURA
ESTADÍSTICA
CUARTA UNIDAD
ANÁLISIS DE VARIANZA
100
Instituto Profesional Diego Portales
AUTÓNOMO
( x1 − x2 )
z= ~ N (0,1) ( z tiene distribución normal estándar)
⎛ σ 12 ⎞ ⎛ σ 22 ⎞
⎜⎜ ⎟⎟ + ⎜⎜ ⎟⎟
⎝ n1 ⎠ ⎝ n2 ⎠
H 0 : μ1 = μ 2
i)
H1 : μ1 < μ 2
RC = {z / z < − zα }
H 0 : μ1 = μ 2
ii)
H1 : μ1 > μ 2
RC = {z / z > zα }
101
Instituto Profesional Diego Portales
AUTÓNOMO
H 0 : μ1 = μ 2
H1 : μ1 ≠ μ 2
⎧ ⎫
RC = ⎨ z / z < − zα ó z > zα ⎬
⎩ 2 2⎭
( x1 − x2 )
T = tiene distribución t − student con v = n1 + n2 - 2 grados de libertad
1 1
sp +
n1 n2
donde:
102
Instituto Profesional Diego Portales
AUTÓNOMO
H 0 : μ1 = μ 2
i)
H1 : μ1 < μ 2
RC = {t / t < −tα }
H 0 : μ1 = μ 2
ii)
H1 : μ1 > μ 2
RC = {t / t > tα }
b) Prueba de hipótesis de dos colas
H 0 : μ1 = μ 2
H1 : μ1 ≠ μ 2
⎧ ⎫
RC = ⎨t / t < −tα ó t > tα ⎬
⎩ 2 2⎭
103
Instituto Profesional Diego Portales
AUTÓNOMO
Ejemplo:
Se eligieron dos estaciones de muestreo independientes para un estudio sobre la descarga de
ácido de una mina de uranio. Los registros de ambas estaciones se encuentran dados en la
siguiente tabla:
Estación 1 Estación 2
n1= 12 n2= 10
x1 =3.11 x 2 =2.04
s1=0.771 s2=0.448
¿ Son iguales las medias de ambas estaciones ? Utilice un nivel de significancia de 0,1.Suponga
que las varianzas poblacionales son iguales pero desconocidas.
Solución
H 0 : μ1 = μ 2
H1 : μ1 ≠ μ 2
104
Instituto Profesional Diego Portales
AUTÓNOMO
De esta forma:
así:
( x1 − x2 ) 1,07
t= = = 6,011
1 1 0,417 ⋅ 0.428
sp +
n1 n2
Por lo tanto t ∈ RC . Luego se rechaza H0 , de esta forma las medias de ambas estaciones no
son iguales.
105
Instituto Profesional Diego Portales
AUTÓNOMO
Problema 1
Cinco muestras de una sustancia ferrosa se usan para determinar si hay una diferencia entre un
análisis químico de laboratorio y un análisis de fluorescencia de rayos X del contenido de hierro.
Cada muestra se divide en 2 submuestras y se aplican los dos tipos de análisis. A continuación se
presentan los datos codificados que muestran los análisis de contenido de hierro.
1 2 3 4 5
Análisis
Rayos X 2.0 2.0 2.3 2.1 2.4
Químico 2.2 1.9 2.5 2.3 2.4
Suponga que las poblaciones son normales, Pruebe con un nivel de significancia de 0.05 si los
dos métodos de análisis dan en promedio el mismo resultado.
Problema 2
Los siguientes datos representan los tiempos de duración de las películas que producen dos
compañías cinematográficas.
Tiempo (minutos)
Compañía
I 103 94 110 87 98
II 97 82 123 92 175 88 118
¿Son iguales los tiempos de duración de las películas que producen las 2 compañías? Utilice un
nivel de significancia de 0,05.
106
Instituto Profesional Diego Portales
AUTÓNOMO
1) Los dos tratamientos no dan en promedio el mismo resultado es decir se rechaza H0.
2) Los tiempos promedio de duración de ambas películas no son iguales es decir se rechaza H0.
107
Instituto Profesional Diego Portales
AUTÓNOMO
ANEXOS
Tablas de distribución de probabilidades: (normal, t –student, y ji-cuadrado)
-2.9 0.0019 0.0018 0.0017 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 0.0014
-2.8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019
-2.7 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026
-2.6 0.0047 0.0045 0.0044 0.0043 0.0041 0.0040 0.0039 0.0038 0.0037 0.0036
-2.5 0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.0049 0.0048
-2.4 0.0082 0.0080 0.0078 0.0075 0.0073 0.0071 0.0069 0.0068 0.0066 0.0064
-2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084
-2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.0110
-2.1 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150 0.0146 0.0143
-2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183
-1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233
-1.8 0.0359 0.0352 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294
-1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367
-1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455
-1.5 0.0668 0.0655 0.0643 0.0630 0.0518 0.0606 0.0594 0.0582 0.0571 0.0559
-1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0722 0.0708 0.0694 0.0681
-1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823
-1.2 0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020 0.1003 0.0985
-1.1 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170
-1.0 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379
-0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660 0.1635 0.1611
-0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867
-0.7 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148
-0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451
-0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776
-0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121
-0.3 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483
-0.2 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859
-0.1 0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247
-0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641
108
Instituto Profesional Diego Portales
AUTÓNOMO
109
Instituto Profesional Diego Portales
AUTÓNOMO
Tabla t- student
110
Instituto Profesional Diego Portales
AUTÓNOMO
Tabla t- student
111
Instituto Profesional Diego Portales
AUTÓNOMO
Tablas ji-cuadrado
112
Instituto Profesional Diego Portales
AUTÓNOMO
Tablas ji-cuadrado
113
Instituto Profesional Diego Portales
AUTÓNOMO
BIBLIOGRAFÍA
114