Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTIMACIONES
3. INTRODUCION
a) Estimación de parámetros.
b) Prueba de hipótesis sobre parámetros.
c) Prueba de independencia chi-cuadrado.
3.1.2. Estimación por Intervalos: Especificas el rango dentro del cual está el
parámetro desconocido y el nivel de confianza que el intervalo contiene del parámetro.
Por lo tanto se llama Intervalo de Confianza.
Por ejemplo: Si 1-α = 0.95, se dice que se tiene una confianza del 95% que el intervalo
contenga el valor desconocido θ; o bien de 100 intervalos aleatorios que se tomen 95 de
las veces contendrá el parámetro y solo 5 veces no lo contendrá.
P [L1≤ μ ≤ L2] = 1- α
L1 L2
σ
L1 = x – Z0 x σ x = x – Z0 x
√n
σ
L2 = x + Z0 x σ x = x + Z0 x
√n
ii) Muestra grande (n ≥ 30), varianza poblacional desconocida ( σ 2 ~¿ s2 ) y
población normal o no.
s
L1 = x – Z0 x s x = x – Z0 x
√n
s
L2 = x + Z0 x s x = x + Z0 x
√n
iii) Muestra pequeña (n < 30), varianza poblacional conocida σ 2 y poblacional
normal.
σ
L1 = x – Z0 x σ x = x – Z0 x
√n
σ
L2 = x + Z0 x σ x = x + Z0 x
√n
CASO II: Uso de la Estadistica t.
s
L1 = x – t0 x s x = x – t0 x
√n
s
L2 = x + t0 x s x = x + t0 x
√n
Donde: t0 = t1- α/2,n-1
OBSERVACIONES:
i)
√
σ x = σ N −n → ( σ 2 conocida)
√ n N −1
ii)
√
s x = s N −n → ( σ 2 conocida)
√ n N −1
Donde
√ N −n
N −1
es el factor de corrección para población finita.
B) Error de Estimación:
|x−μ|. Ver fig.26:
error
L1 x μ L2
El valor mínimo del error de estimación es igual a cero, esto ocurre cuando x estima
exactamente a μ. El valor numérico máximo del error de estimación es igual a Z 0 x σ x ,
ya que el intervalo de estimación resulta: |x−μ| ≤ Z0 x σ x .
Ejemplo 3. 1:
Una compañía desea estimar la duración media de tiempo que necesita una secretaria
para llegar del trabajo a su casa. En una muestra al azar de 40 secretarias se encuentra
que la media es de x= 60 minutos. Suponiendo que
σ =15 minutos y el coeficiente de confianza del 95 % , construir un intervalo de confianza
para la media poblacional.
Solución:
- Sea X: el tiempo en minutos que emplea una secretaria para llegar del trabajo a
su casa, cuya media se quiere estimar a partir de una muestra de tamaño n=40.
- Se conoce que x =60 minutos y σ = 15 minutos.
- Usamos la estadística Z- Caso 1- i
- Para el nivel de confianza 1- α 0.95, el valor Z0 = 1.96
- El error estándar de la media muestral x es:
σ 15
σx = = = 2.37
√ n √ 40
- Los límites de confianza para μ son:
σ
L1 = x – Z0 x = 60 – 1.96 x 2.37 = 55.35 minutos.
√n
σ
L2 = x + Z0 x = 60 + 1.96 x 2.37 = 64.65 minutos.
√n
- Se tiene una confianza del 95% que el tiempo medio que emplea una secretaria
para llegar del trabajo a su casa varia de entre 55.35 y 64.65 minutos.
Ejemplo 3.2:
Los ingresos semanales promedio de las personas que trabajan en varias industrias
aparecieron en el The New Cork Times 1998. Esos ingresos para quienes trabajan en los
servicios legales fueron 5639 dólares. Suponga que este resultado se basó en una
muestra de 250 personas dedicadas a los servicios legales, y que la desviación estándar
de la muestra de $50. Calcule el intervalo de confianza de 95% para la población de
ingresos medios semanales de personas que trabajan en los servicios legales.
Solución:
Ejemplo 3.3:
Solución:
Ejemplo 3.4:
Solución:
√
s x = s N −n
√ n N −1
√ √
s x = 0.9 2200−81 = 0.1
81 2200−1
- Los límites de confianza para μ son :
s
L1 = x – Z0 x = 3.1 – 1.96 x 0.1 = 3.0 años
√n
s
L2 = x + Z0 x = 3.2 + 1.96 x 0.1 = 3.4 años
√n
- Se tiene una confianza del 95% de que el tiempo de vida media de las
calculadoras científicas varía entre de 3.0 y 3.4 años.
P [L1≤ P ≤ L2] = 1- α
1-α
α/2 α/2
L1 L2
P
L1 = p – Z0 x s p = p – Z0 x
√ pxq
n
L2 = p + Z0 x s p = p + Z0 x
√ pxq
n
OBSERVACIONES:
√
σ P = P(1−P) que se estima por:
N
√
s P = P(1−P)
N
√
σ P = P(1−P)
N √ N −n
N −1
que se estima por
√
s P = P(1−P)
N √ N −n
N −1
Donde:
√ N −n es el factor de corrección para la población finita.
N −1
Ejemplo 3.5:
Una muestra de 400 menores de 16 años revela que 220 consumen drogas. Estimar la
proporción de menores de 16 años que consumen drogas en toda la población mediante
un intervalo de confianza del 99%.
Solución:
- sP =
√ pxq
n
=¿ ¿
√
0.55 x 0.45
400
= 0.02
L1 = p – Z0 x
√ pxq
n
= 0.55 – 2.576 x 0.02 = 0.5
L2 = p + Z0 x
√ pxq
n
= 0.55 + 2.576 x 0.02 = 0.6
- Se tiene una confianza del 99% de que entre el 50% y 60% de los jóvenes
menores de 16 años consumen drogas.
Ejemplo 3.6:
Solución:
- Observamos que N = 500 y n= 49
- Observamos también que la proporción muestral de compradores del nuevo libro
es p= 0.80 → q = 0.02
- Para un nivel de confianza del 96%, el valor Z0 = 2.054
- El error estándar de la proporción muestral es:
sP =
√ √
pxq
n
N −n
N −1
√ √
s P = 0.08 x 0.20 =¿ ¿ 500 x 49
49 500−1
Sp = 0.06
- Los límites de confianza para P son:
L1 = p – Z0 x
√ pxq
n
X
√ N −n
N −1
= 0.80 – 2.054 x 0.06 = 0.68
L2 = p + Z0 x
√ pxq
n
=¿ ¿
√
N −n .
N −1
= 0.80 + 2.054 x 0.06 = 0.92
- Se tiene una confianza del 96% de que entre el 68% y 92% de los compradores
se interesó por el nuevo libro.
L1 = ( x 1 - x 2 ) – Z0 x σ x −x 1 2
L2 = ( x 1 - x 2 ) + Z0 x σ x −x 1 2
Donde:
√
2 2
σ x −x = σ ¿ + σ 2
n1 n2
1 2
L1 = ( x 1 - x 2 ) - Z0 x s x − x 1 2
L2 = ( x 1 - x 2 ) + Z0 x s x − x 1 2
Donde:
√
2 2
sx − x = s¿ s2
+
n 1 n2
1 2
iii) Muestra pequeñas (n1 < 30 y n2 < 30), varianzas poblacionales conocidas y
poblaciones normales.
L1 = ( x 1 - x 2 ) - Z0 x σ x −x 1 2
L2 = ( x 1 - x 2 ) + Z0 x σ x −x 1 2
Donde:
√
2
σ x −x = σ ¿ + σ 2
2
n1 n2
1 2
NOTA: En caso de que las poblaciones N1, N2 fueran finitas, se debe corregir:
σ x −x =
1 2
√ ( +
n1 N 1−1 n2 N 2−1 ) (
σ 21 N 1−n1 σ 22 N 2−n2
)
s21 N 1−n 1 s 22 N 2−n 2
CASO II: Usando la estadística t
i) Muestra pequeñas (n1 < 30 y n2 < 30), varianzas poblacionales desconocidas
~ ~
pero iguales σ 12 = σ 22 ( σ 21 ¿ s21 y σ 22 ¿ s22 ) y poblaciones normales.
Donde:
L1 = ( x 1−x 2 ¿−t 0 x S C
√ 1 1
+
n1 n2
L2 = ( x 1−x 2 ¿+ t 0 x SC
√ 1 1
+
n 1 n2
Donde:
s x − x =S C
1 2
√ 1 1
+
n1 n 2
SC =
√ ( n1 −1 ) x s 21+ ( n2−1 ) x s 22
n1 +n2−2
t o=t α
1− ,n1+n2−2
2
ii) Muestras pequeñas (n1 < 30 y n2 < 30), varianza poblacionales desconocidas
~ ~
pero diferentes σ 21 ≠ σ 22 ( σ 21 ¿ s21 y σ 22 ¿ s22 ) y poblaciones normales.
√ √
2 2 2 2
s1 s 2 s 1 s2
L1 = ( x 1−x 2 ¿−t 0 + L2 = ( x 1−x 2 ¿+ t 0 +
n1 n2 n1 n2
Donde:
t o=t 1−α/ 2 ,r
[ ]
2
s 21 s22
+
n 1 n2
[] []
r= 2 2 2 2
s1 s2
n1 n2
+
n 1−1 n2−1
- s x − x =S C
1 2
√ 1 1
+ = 1.80
n1 n 2
Donde:
SC =
√ ( n1 −1 ) x s 21+ ( n2−1 ) x s 22
n1 +n2−2
sc =5.10
Ejemplo 3.8:
n x S
Universidad 50 85 12
Privada 60 71 14
Universidad Estatal
Solución:
- Sean X1 , X2 las variables aleatorias que representan los puntajes para ambos
grupos.
- De las muestras dadas obtenemos:
n1 = 50, x = 85 puntos, s1 =12 puntos
n2 = 60, x = 71 puntos, s1 =14 puntos
Haremos uso de la estadística Z.
- Las diferencias de medias muestrales es:
x 1−x 2=85−71=14
- Error entandar de la media muestral es:
√
2 2
s s
sx − x = 1 + 2
1
n 1 n2
2
s x − x =S C √ ¿ ¿ ¿
1 2
s x − x = 2.48
1 2
Ejemplo 3.9:
Para comparar los gastos promedios mensuales de los alumnos de dos universidades
particulares se escogen dos muestras aleatorias de 10 y 9 alumnos, respectivamente,
resultados los siguientes gastos en dólares:
Muestra 1: 400, 410, 420, 380, 390, 410, 400, 405, 405, 400.
Muestras 2: 390, 395, 380, 390, 400, 380, 370, 390, 380.
i n1 x1 s1
Muestra 1 10 402 11.11
Muestra 2 9 386.11 9.28
2 2
- Haremos uso de la estadística t, cuando σ 1 = σ 2
- La diferencia de medias muéstrales es:
x 1−x 2=402−386.11=15.89
- Para un nivel de confianza del 95% →
t 0=t 1−α / 2.n +n −2 = t 0.975.17 =2.11
1 2
- s x − x =S C
1 2
√ 1 1
+ = 4.73
n1 n 2
Donde:
SC =
√ ( n1 −1 ) x s 21+ ( n2−1 ) x s 22 = 10.29
n1 +n2−2
L1 = ( x 1−x 2 ¿−t 0 x S C
√ 1 1
+
n1 n2
L1 = 15.89 - 2.11 x 4.73 = $5.91
L2 = ( x 1−x 2 ¿+ t 0 x SC
√ 1 1
+
n 1 n2
L2 = 15.89+2.11 x 4.73 = $25.87
- Luego el intervalo de confianza del 95% para μ1-μ2, es:
5.91 ≤ μ1 –μ2 ≤ 25.87. Dado que μ1 – μ2 = 0 ∄ al intervalo de confianza, quiere decir
que los gastos promedios mensuales no son iguales. Por lo tanto μ1 – μ2 > 0. Los
gastos semanales del grupo 1 son mayores que los gastos semanales del grupo 2.
Ejemplo 3.10:
Se lleva a cabo un estudio para comparar el tiempo que tardan hombres y mujeres
para realizar determinada tarea. Las experiencias anteriores indican que la
distribución de tiempos tanto hombres como para mujeres es normal con varianza
diferente. Una muestra aleatoria de 9 hombres y 8 mujeres ha dado los siguientes
tiempos en minutos:
Hombres 13, 27,10, 25, 24, 19, 21, 32, 16
Mujeres: 16, 21, 16, 21, 16, 17, 16, 20
Mediante un intervalo de confianza del 95% para la verdadera diferencia de los
promedios de tiempos de hombres y mujeres ¿Se pude concluir que los hombres
emplean mayor tiempo que las mujeres para hacer la tarea?
Solución:
- Sean X1 y X2 las variables aleatorias que representan los tiempos empleados por los
hombres y mujeres, respectivamente:
- Cálculos realizados con las muestras dadas:
i n1 x1 s1
Muestra 1 9 20.78 7.03
Muestra 2 8 17.88 2.36
√
2 2
s 1 s2
sx − x = + = 2.49
1 2
n 1 n2
- Hallando los grados de libertad r
[ ] [
2 2
]
2 2 2
s 1 s2 2
( 7.03 ) ( 2.36 )
+ +
n 1 n2 9 8
[] [] [ ][ ]
2 2
r= s21 = ( 7.03 )2 2 ( 2.36 )2
s 22
2
n1 9 n2 8
+ +
n 1−1 n2−1 8 7
r = 9.97 ~¿ 10
- Para un nivel de confianza del 95% → t 0 =t 0.975,10 =2.228
- Los límites de confianza para la verdadera diferencia de los promedios de
tiempo de hombres y mujeres para hacer la tarea es:
√
2 2
s1 s 2
- L1 = ( x 1−x 2 ¿−t 0 +
n1 n2
- L1 = 2.9 - 2.228 x 2.49 = -2.65
- L2 = ( x 1−x 2 ¿+ t 0
√ s 21 s22
+
n1 n2
- L2 = 2.9+2.228 x 2.49 = 8.45
- Luego el intervalo de confianza para μ1-μ2, es:
-2.65 ≤ μ1 –μ2 ≤ 8.45. Dado que μ1 – μ2 = 0 ∈ al intervalo de confianza, quiere
decir que los promedios de tiempo de hombres y mujeres para hacer la tarea son
iguales.
También cuando comparamos la media de dos poblaciones puede ocurrir una diferencia
significativa por causa de factores externos no controlados. Por ejemplo, cuando
comparamos dos técnicas de venta A y B puede ocurrir que uno de los grupos tenga
vendedores más experimentados y hábiles que el otro grupo. Así, la diferencia seria
debido a esos factores y no al mérito real de la técnica de venta. Un modo de controlar
este problema es a través del artificio de recolectar observaciones en pares de modo que
los elementos de cada par sea homogéneo en todos los sentidos, excepto con respecto al
factor que queremos comparar.
Los dos grupos de observaciones que resultan de esta clase de procedimientos están
indudablemente relacionados.
CASO I: Uso de Z
~
Cuando n ≥ 30 σ 2D ¿ s 2D (varianzas poblacional de las diferencias es desconocida) y la
población es normal, entonces:
P [ L1 ≤ μ D ≤ L2 ]=1−α
Donde:
2
SD
L1=D−Z 0 x
√n
S 2D
L2=D+ Z 0 x
√n
Además:
n n
∑ D1 y
∑ ( D1−D )2
D= i=1 s2D= i=1
n n
2 ~ 2
- Cuando n < 30 σ D ¿ s D (varianzas poblacional de las diferencias es desconocida)
y la población es normal, entonces:
P [ L1 ≤ μ D ≤ L2 ]=1−α
Donde:
2 2
SD SD
L1=D−t 0 x L2=D+t 0 x
√n √n
Además:
n n
∑ D1 y
∑ ( D1−D )2
D= i=1 s2D= i=1
n n
t 0=t α
1− , n−1
2
Ejemplo 3.11:
10 10
∑ D1 y ∑ ( D1−D )2 =1.51
i=1 2 i=1
D= =−0.5 s D=
10 s9
Entonces:
S 2D 1.51
L1=D−t 0 x = - 0.5 – 2.821 x = - 1.85
√n √ 10
S2D 1.51
L2=D+t 0 x = - 0.5 + 2.821 x = 0.85
√n √10
Por lo tanto μD є [-1.85,0.85] con confianza del 98%. Como 0 є [[-1.85,0.85], entonces
μx = μy. Los procedimientos de enseñanza son iguales.
L1 = ( p1− p2 ¿−Z 0 x s p − p1 2
L2 = ( p1− p2 + Z 0 x s p − p
1 2
Donde:
sp − p =
1 2
√ p1q1 p2q2
n1
+
n2
Ejemplo 3.12:
Solución:
- Las muestras de internos tomadas para cada tipo revelan las siguientes
información:
Tipo I Tipo II
n n1 = 300 n2 = 240
p p1= 0.50 p2 = 0.35
sp − p =
1 2
√ 0.50 x 0.50 0.35 x 0.65
300
+
240
=0.04
sp − p =
1 2
√ n1 (
N 1−1 )
+
n2 (
p 1 x q1 N 1 −n1 p 2 x q2 N 2 −n2
N 2−1 )
PROBLEMAS PROPUESTOS N° 3
1. Se decide estimar la medida del nivel de ansiedad de todos los estudiantes pre
universitario. Se supone que la población de los puntajes de la prueba se
distribuyen normalmente con desviación estándar igual a 10 puntos.
a) Determinar el intervalo para una confianza del 95%, si una muestra
aleatoria de tamaño 100 ha dado una medida de 70 puntos.
b) Si μ se estima en 70 puntos con el nivel de confianza del 99%, ¿Es el error
de estimación puntual superior a 5 puntos?
2. El tiempo en minutos que te dicen los clientes en sus distintas operaciones en
un banco local es una variable aleatoria estándar de 3 minutos. Se han
registrado en los tiempos de las operaciones de 9 clientes del banco resultando
una media igual a nueve minutos.
a) Hallar el nivel de confianza si la estimación de μ es el intervalo de 7a 13
minutos.
b) Si μ se estima por x , calcular la probabilidad de que la media de los
tiempos de todas las muestras de tamaño 9 este 6.5 y 11.5 minutos.
3. Suponga que las alturas de los alumnos de la Facultad de Economía tienen
distribución normal con σ =15 cm. Fue retirada una muestra de 100 alumnos
obteniéndose x=175 cm . Construir el intervalo de confianza para la verdadera
altura media de los alumnos con 95% de confianza.
4. La Cámara de Comercio de una ciudad está interesada en estimar la medida de
la cantidad de dinero que gasta la gente que asiste a convenciones,
considerando comida, alojamiento y entretenimiento por día. De las distintas
convenciones que se llevan a cabo en la ciudad se seleccionaron a 16 personas
aleatoriamente y se les pregunto la cantidad que gastaba por día. Se obtuvo en
la siguiente información en soles:
450,575, 363, 448, 542, 389, 435, 674, 468, 352, 458, 384, 434, 546, 655, 560.
5. Una muestra aleatoria extraída de una población normal presenta una media
muestral igual a 150, el número de observaciones es 21 y la varianza muestral
es 100. Se pide:
a) Construir un intervalo de confianza del 95% para la media poblacional.
b) Si se utiliza la información de que la varianza poblacional es 100, calcular el
intervalo de confianza del 95% para la media poblacional.
c) ¿Por qué el intervalo calculado (b) es más estrecho que en a? ¿Qué ocurrirá
con ambos intervalos si se amplía el tamaño de muestra?
Distrito n x s
Chiclayo 30 115 9
José L. Ortiz 40 90 16
12. Se quieres estimar la diferencia entre los promedios de tiempo (en minutos)
que utilizan los hombres y las mujeres para realizar un test de aptitud. Se aplica
el test a 20 hombres Y 25 mujeres dando las medidas respectivas de 110 y 100
puntos. Suponga que las dos poblaciones son varianzas iguales a 100 y 64,
respectivamente.
a) Determine el intervalo de confianza del 99% para la diferencia de medias.
b) ¿Es válida la afirmación μ1−μ 2=13 ?
13. Un inversionista hacer un estudio sobre los gastos semanales para elegir una de
las dos ciudades, Trujillo o Piura, para un centro comercial. En una muestra de
21 hogares de la ciudad de Trujillo halló : x=$ 400 , s x =$ 210. En otra muestra
de 16 hogares de la ciudad de Piura hallo: y=$ 380 , s y =$ 60 . Suponga
poblaciones normales con varianza desconocidas pero diferentes. Usando un
intervalo de confianza de 95%, ¿En cuál de las dos ciudades debería abrir la
sucursal?
14. El departamento de admisión de una universidad desea estimar la diferencia
entre las medias de las calificaciones de alumnos provenientes de dos
preparatorias. Los resultados de las muestra aleatoria simples e independientes
de las dos escuelas se ven en la siguiente tabla: