Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INFERENCIA ESTADÍSTICA:
ESTIMACIÓN.
Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación
II UNIDAD
Para estimar un parámetro (tal como la media, µ, la varianza, σ², la proporción, π, etc.),
se hace un muestreo de tamaño n suficiente, que disminuya el error de muestreo y que
garantice que se obtendrá un estadístico confiable (𝑥̅ , s2, 𝑝̅ , etc), tal que pueda ser considerado
como un buen estimador del correspondiente parámetro poblacional. Mientras menor sea el
error de muestreo (“e”) que usemos en el muestreo del estadístico, más cercano estará dicho
estadístico del verdadero valor del parámetro.
a) Imparcialidad o insesgadez
Ejemplo 2.1:
Sea (X1, X2, …, Xn) un muestreo aleatorio simple, tal que E(Xi) = µ y Var(Xi) = σ²
b) Consistencia o Coherencia.
1) 𝜃̂ es insesgado;
1) lim𝑛 →∞ 𝐸( 𝜃̂ ) = θ
2) Var(𝜃̂) → 0 cuando n →∞
2) lim𝑛 →∞ 𝑉𝑎𝑟( 𝜃̂ ) = 0
Lo cual significa que si tomáramos una muestra del tamaño de la población (censo), el
estimador coincidiría exactamente con el valor del parámetro.
Ejemplo 2.2:
𝜎2
a) Supongamos que 𝜃̂ = 𝑥̅ . Se cumple que E(𝑥̅ n).= µ, y Var (𝑥̅ .) = 𝑛
entonces,
tomando límites:
𝜎2
lim𝑛→∞ µ = µ y lim n = 0.
𝑛 →∞
Por tanto, la media muestral es estimador consistente de la media poblacional µ.
𝑛−1 2 (𝑛−1)
b) Consideremos 𝜃̂ = S2. Puede demostrarse que E(𝑆 2 ) = σ², y Var(𝑆 2 ) = σ4,
𝑛 𝑛2
por lo que tomando límites
𝑛−1 2(𝑛−1)
lim𝑛→∞ 𝜎² = 𝜎² y lim𝑛→∞ 𝜎4 = 0
𝑛 𝑛2
c) Suficiencia
Ejemplo 2.3:
Ejemplo 2.4:
Por ejemplo, si una población tiene solo N= 500 elementos y se va a tomar una muestra
de n = 35 elementos, entonces hay un total de 500C35 = 8.328995679 E53 muestras posibles,
que es un número muy grande, (∞), y de las cuales el muestreador obtendrá sólo una de esas
8.328995679 E53 posibles muestras; y, por supuesto que el estadístico de interés (𝑥̅ , s2, 𝑝̅ ,
etc.) podrá tener distinto valor en cada una de las posibles muestras (es decir que 𝑥̅ , s2, 𝑝̅, etc.
son variables aleatorias), por lo que, ante la situación de que el muestreador tomará una de
entre un número grande (∞), de muestras posibles, estamos ante una distribución de probabi-
lidad de muestreo de un estadístico, también llamada distribución de muestreo o distribución
muestral, que tiene una distribución de probabilidad Normal, con una probabilidad del 95% de
obtener el estadístico buscado en ±1.96 𝜎𝑥̅ respecto del centro de la distribución.
Así, por ejemplo, para el estadístico media, (𝑥̅ ), la distribución muestral de la media es
la distribución de probabilidad de todas las medias de muestra posibles, también llamada en
plural, distribución de medias, o en singular, distribución de la media, pero que se refieren
exactamente a lo mismo. Idénticamente, para cada estadístico muestreado se tiene una distri-
bución propia de muestreo. La siguiente tabla 2.1 muestra algunas de las distribuciones mues-
trales:
Error de muestreo o error muestral, e, Es el error máximo que se puede cometer por el
hecho de inferir sobre cierta realidad a partir de la observación de sólo una parte de ella. La
magnitud de este error lo determina el investigador en función de los recursos.
Hay dos tipos de estimación de parámetros, que se tratan en las dos secciones siguientes.
Una estimación puntual es un único valor de un estadístico que es usado para estimar
un parámetro. Este estadístico usado se denomina estimador y se denota con el símbolo ̂
encima del estadístico correspondiente. Por ejemplo, el estimador de la media es µ̂ = 𝑥̅ . Aquí
conviene aclarar que µ̂ no es el verdadero parámetro (µ) de la población, sino que solo es un
estimador de µ por medio de un muestreo estadístico.
La media: µ̂ = 𝑥̅ (2.1)
La proporción 𝑝̂ = 𝑝̅ (2.2)
La varianza 𝜎̂ 2 = s2 (2.3)
etc., de modo que, si 𝑥̅ = 170 cm, entonces µ̂ = 170 cm significa que se está estimando
que la media de toda la población es 170 cm, con base en el resultado de una muestra, pero
puede no ser exactamente µ, sino que solo es una aproximación de µ̂ al parámetro µ.
Ejemplo 2.5:
Puesto que los estimadores puntuales pocas veces serán iguales a los parámetros que
tratan de estimar, podemos darnos una mayor libertad en su estimación mediante el uso de la
"estimación por intervalos" o "intervalos de confianza".
Una estimación por intervalo o intervalo de confianza es un intervalo, dentro del cual
se espera que el parámetro θ esté contenido. Un intervalo de confianza tiene la forma:
Definición: Sea 1- α una probabilidad alta especificada y sean T1 y T2, dos estadísticos
tales que:
El intervalo [T1, T2] recibe el nombre de Intervalo de Confianza del 100(1-α) % para el
parámetro desconocido θ. Las cantidades T1, T2 reciben el nombre de Límites de confianza
inferior y superior, respectivamente, y (1-α) es el Nivel de Confianza asociado con el
intervalo.
𝜎 𝜎
p⟦(𝑥̅ − 𝑍1−𝛼 ∗ ) ≤ µ ≤ (𝑥̅ + 𝑍1−𝛼 ∗ )⟧ = 1 - α
2 √𝑛 2 √𝑛
Figura 2.5: Confianza (1-α) de que la media µ esté en (T1, T2), con base en 𝑥̅ .
𝜎 𝜎
[(𝑥̅ − 𝑍 1−𝛼
2
∗
√𝑛
) ≤ µ ≤ (𝑥̅ + 𝑍1−𝛼 ∗
2 √𝑛
) ] (2.5)
Para muestras tomadas de una población normal, o para muestras de tamaño n ≥ 30, sin
importar la forma que tenga la población, el intervalo de confianza proporciona buenos
resultados. Sin embargo, para muestras pequeñas tomadas de poblaciones que no son
normales, no es posible esperar que el nivel de confianza 1-α sea exacto. El error de
estimación está dado por el siguiente teorema.
Teorema. Si se utiliza 𝑥̅ como una estimación de µ, se puede tener una confianza del
(1-α) % de que el error de estimación, e, no excederá de:
𝜎
e ≤ 𝑍(1−𝛼)/2 ∗ (2.6)
√𝑛
Ejemplo 2.6:
Una empresa eléctrica fabrica focos que tienen una distribución aproximadamente
normal. Si una muestra de 40 focos tiene una duración promedio de 1000 horas,
encuentre un intervalo de confianza del 94% para la media de la población de todos los
focos que produce esta empresa, si se supone una desviación estándar de 100 horas.
Solución:
𝑆 𝑆
p(⟦(𝑥̅ − 𝑡𝛼,𝑣 ∗ ) ≤ µ ≤ (𝑥̅ + 𝑡𝛼,𝑣 ∗ )⟧ = 1 - α
2 √𝑛 2 √𝑛
La figura 2.6 ayuda a aclarar la expresión de probabilidad anterior, la cual se llega al:
𝑆 𝑆
⟦(𝑥̅ − 𝑡𝛼,𝑣 ∗ ) ≤ µ ≤ (𝑥̅ + 𝑡𝛼,𝑣 ∗ )⟧ (2.7)
2 √𝑛 2 √𝑛
𝑆
e ≤ 𝑡𝛼,𝑣 ∗ (2.8)
2 √𝑛
Ejemplo 2.7:
Construya un intervalo de confianza del 95% para estimar µ del proceso. ¿Puede
considerarse que este proceso tiene una producción con parámetro de 5.0 cm?
Solución:
𝑆 𝑆
⟦(𝑥̅ − 𝑡𝛼,𝑣 ∗ ) ≤ µ ≤ (𝑥̅ + 𝑡𝛼,𝑣 ∗ )⟧
2 √𝑛 2 √𝑛
0.0832 0.0832
4.925 – 2.131* ≤ µ ≤ 4.925 + 2.131 ∗
√16 √16
Y, de acuerdo con este muestreo e intervalo, puede decirse con un 95% de confianza que
el nivel medio del proceso no es 5.0 cm de longitud (o, que se está produciendo fuera del
parámetro especificado para el proceso de µ= 5 cm.) ▪
2.1 Se sabe que una población tiene una desviación estándar de 20, se toma de ella una
muestra de 64 elementos y se encuentra una media de 90.
a) Encuentre el error estándar de la media.
b) Construya una estimación de intervalo para µ, del 95% de confianza.
2.2 En una población con una varianza de 225, una muestra de 100 observaciones arroja una
media de 450.
a) Encuentre el error estándar de la media.
b) Construya una estimación de intervalo del 85.02%.
2.3 Una muestra de 12 elementos tiene una media de 62 y una desviación estándar de 10.
Construya un intervalo de confianza de 95% para la media de la población.
2.4 De una población de 220 individuos, se toma una muestra de 64. A partir de esta muestra,
se encuentra que la media es de 12.5 y la desviación estándar de 2.4
a) Encuentre el error estándar estimado de la media.
b) Construya un intervalo de confianza de 98 % para la media.
2.5 De una población con desviación estándar de 50 se toma una muestra, resultando que la
media de la muestra es 220. Construya una estimación de intervalo para la media de la
población que tenga un 95% de certeza de incluir a la verdadera media de la población.
a) Si el tamaño de la muestra es de 100 elementos
b) Si el tamaño de la muestra es de 4,000 elementos.
2.6 El gerente de calidad de los focos ahorradores marca Sylvano debe estimar la vida
promedio de horas que durarán los focos fabricados en su planta. Fue elegida una
muestra aleatoria de 100 focos y el tiempo promedio de duración fue de 2,720 horas. Si
se sabe que la desviación estándar del tiempo de vida es 100 horas, construya un
intervalo de confianza del 97.5% para la vida de estos focos.
2.7 La tienda de alimentos “Soriano” adquirió 2,000 cajas de cereal para el desayuno de 680
gramos cada una. Una muestra aleatoria de 48 de estas cajas tuvo un peso neto
promedio de 657 gramos y una desviación estándar de 8.5 gramos.
a) Estime la desviación estándar de la población.
b) Estime el error estándar de la media para esta población finita.
c) Determine un intervalo de confianza del 95% para el peso neto medio, basado en la
muestra.
2.8 Para los siguientes límites de un intervalos de confianza, determine el nivel de confianza
asociado con el intervalo:
(a) x̅ - 1.45σx̅ a x̅ + 1.45 σx̅
(b) x̅ – 1.96σx̅ a x̅ + 1.96σx̅
(c) x̅ - 2.54σx̅ a x̅ + 2.54σx̅
2.9 Jorge Ramírez, el ingeniero de una planta purificadora de agua, mide diariamente el
contenido de cloro en 200 muestras diferentes. En un periodo de varios años, ha
establecido que la población tiene una media de 5.5 y una desviación estándar de 1.5
miligramos de cloro por litro. Las muestras arrojaron hoy un promedio de 4.6
miligramos de cloro por litro.
a) Encuentre el error estándar de la media.
b) Establezca el intervalo de confianza del 86.4% para estimar µ.
2.10 Paty Gómez, una ingeniera industrial, está realizando un estudio de tiempos normales
para un proceso de ensamblado. Este proceso se realiza en 80 diferentes estaciones de
trabajo, cada una efectuando las mismas actividades de ensamblado. Muestreó 10
estaciones y obtuvo los siguientes tiempos de ensamblado, en minutos: 2.3, 2.0, 1.9, 2.9,
2.6, 1.3, 2.4, 2.6, 2.8 y 3.0.
a) Estime la desviación estándar de la población.
b) Construya un intervalo de confianza de 98% para el tiempo medio de ensamblado.
2.11 El Grupo de Transportistas de la ciudad de Guadalajara desea estimar el número
promedio de pasajeros por kilómetro que usan sus vehículos. Si su flotilla es de 5,200
autobuses, y si se ha determinado en estudios previos que la desviación estándar es de
5.3 pasajeros por kilómetro, construya un intervalo de confianza de 96% para el número
medio de pasajeros por kilómetro, cuando toma una muestra aleatoria de 100 autobuses,
que arroja un promedio de 15.5 usuarios por kilómetro.
2.12 La presión sanguínea de 25 mujeres de edad avanzada tienen una media x̅= 140 mm de
mercurio. Considerando que estos datos provienen de una muestra tomada al azar de
una población normal con σ = 10 mm de mercurio, construya un intervalo de confianza
del 95% para la media de la población µ.
2.13 Una universidad aplica una prueba del nivel de matemáticas a todos los alumnos de
primer ingreso. Si 64 estudiantes, seleccionados al azar en este periodo, tardaron en
promedio 40 minutos en resolver la prueba, con una varianza de 10 minutos², construya
un intervalo de confianza del 99% del verdadero tiempo promedio que tardan los
alumnos de primer ingreso en resolver el examen.
2.14 Durante la cosecha de naranjas, se revisaron al azar 50 hectáreas en busca de naranjas en
mal estado (debido a que una naranja mala puede echar a perder a todo el canasto) y se
encontró que había un promedio de 12.6 naranjas malas por hectárea. Se sabe que la
desviación estándar de naranjas malas por hectárea es de 2.5 para este tipo de naranja.
a) Calcule el error estándar de la media.
b) Establezca una estimación de intervalo alrededor de la media, utilizando 𝜎̂= s.
2.15 La longitud de los cráneos de 10 esqueletos fósiles de una especie de aves extinta tiene
una media de 5.68 cm y una desviación estándar de 0.29 cm. Suponiendo que estas
mediciones están normalmente distribuidas, obtenga un intervalo de confianza del 95%
de la longitud media de los cráneos de esta especie de aves.
23.16 Un inspector de alimentos examinó 12 frascos de cierta marca de mantequilla de
cacahuate, y obtuvo los siguientes porcentajes de impurezas: 2.3, 1.9, 2.1, 2.8, 2.3, 3.6,
1.4, 1.8, 2.1, 3.2, 2.0 y 1.9. Si estas mediciones están normalmente distribuidas,
construya un intervalo de confianza del 98% para el porcentaje promedio de impurezas
que hay en esta marca de mantequilla de cacahuate.
2.17 Para los siguientes tamaños de muestra y niveles de confianza, encuentre los valores t
apropiados para la construcción de intervalos de confianza:
a) n = 06, 98%.
b) n = 09; 99%.
c) n = 10; 90%.
d) n = 15; 99.8%.
e) n = 22; 99.5%.
f) n = 27; 95%.
2.18 Dados los siguientes tamaños de muestra y los valores t utilizados para construir
intervalos de confianza, encuentre los correspondientes niveles de confianza:
a) n= 6, t= ±2.447.
b) n= 15, t= ±2.624.
c) n = 29, t = ±2.048.
2.19 La siguiente muestra de nueve observaciones fue tomada de una población infinita con
distribución normal:
75.5, 75.3, 76.4, 83.2, 91.0, 80.1, 77.5, 84.8, 81.0
Construya un intervalo de confianza de 95% para la media.
2.20 Tomamos una muestra aleatoria simple de 29 estudiantes universitarios, para que
respondan una prueba de inteligencia espacial. Los resultados fueron una media de 78 y
una desviación estándar de 9. ¿En qué intervalo se hallará la inteligencia espacial media
de todos los estudiantes, a un nivel de confianza del 98%?
Sean X11, X12, ... X1n, una muestra aleatoria de n1 observaciones tomadas de una primera
población con valor esperado µ1 y varianza 𝜎12 , y X21, X22, ... X2n otra muestra aleatoria de n2
observaciones tomada de la segunda población con valor esperado µ2 y varianza 𝜎22 . Si 𝑥̅1 y 𝑥̅2
son las medias muestrales, la estadística 𝑥̅1-𝑥̅2 es un estimador puntual de µ1 - µ2, y tiene una
𝜎12 𝜎22
𝑥̅1 -𝑥̅2 → N(µ1 - µ2, + )
𝑛1 𝑛2
Por lo tanto, la diferencia 𝑥̅1 -𝑥̅2 sigue una distribución normal, con
Para calcular el intervalo de confianza para la diferencia de dos medias debemos saber si
las varianzas poblacionales son conocidas o desconocidas, y en caso de que sean
desconocidas, se debe probar si son iguales o diferentes. Cada caso se analiza enseguida:
Figura 2.7: Confianza (1-α) de que µ1 - µ2 esté en (T1, T2), con base en 𝑥̅1 − 𝑥̅ 2
Teorema. Si 𝑥̅1 y 𝑥̅2 son las medias de dos muestras aleatorias independientes de
tamaño n1 y n2 tomadas de poblaciones que tienen varianzas conocidas 𝜎12 . y 𝜎22 ,
respectivamente, entonces un intervalo de confianza del 100(1-α) % para estimar la diferencia
µ1 - µ2 entre dos poblaciones, es:
𝜎2 𝜎22 𝜎2 𝜎22
(𝑥̅1 − 𝑥̅2 ) − 𝑍(1−𝛼) √𝑛1 + ≤ (µ1 − µ2 ) ≤ (𝑥̅1 − 𝑥̅2 ) + 𝑍(1−𝛼) √𝑛1 + (2.9)
1 𝑛2 1 𝑛2
2 2
𝜎12 𝜎22
e ≤ 𝑍(1−𝛼) √ + ( 2.10)
2
𝑛1 𝑛2
Ejemplo.2.8
Una muestra de 50 focos tomada al azar de una primera marca dio una duración media
de 515 horas, en tanto que una muestra de 64 focos de una segunda marca dio una duración
media de 502 horas. Si las desviaciones estándar de las dos poblaciones son 30 horas y 25
horas, respectivamente, construya un intervalo de confianza del 97.5% para estimar la
diferencia real de la duración entre las dos marcas de focos.
Solución.
Datos:
n1 = 50 𝑥̅1 = 515 h σ1 = 30 h,
n2 = 64 𝑥̅2 = 502 h, σ2 = 25 h,
(1-α) = 0.975 (1-α)/2 = 0.4875 α = 0.025
Como las varianzas son conocidas, tenemos que: 𝑍(1−𝛼) = 𝑍0.4875 = 2.24
2
El hecho de que ambos límites sean positivos sugiere que la primera marca de focos
tiene una duración media superior a la segunda marca▪
Si las varianzas poblacionales son desconocidas, pero iguales, los pasos a seguir para
encontrar el intervalo de confianza son los siguientes:
c) De modo que para calcular el intervalo de confianza, debe tenerse en cuenta que:
Teorema. Si 𝑥̅1 y 𝑥̅2 son las medias y 𝑆12 y 𝑆22 son las varianzas de dos muestras
aleatorias independientes de tamaño n1 y n2 tomadas de dos poblaciones que tienen varianzas
desconocidas, pero iguales, entonces un intervalo de confianza del 100(1-α) % para µ1 - µ2 es:
1 1 1 1
(𝑥̅1 − 𝑥̅2 ) − 𝑡𝛼,𝑛 𝑆𝑝 √𝑛 + 𝑛2
≤ (µ1 − µ2 ) ≤ (𝑥̅1 − 𝑥̅2 ) + 𝑡𝛼,𝑛 𝑆𝑝 √𝑛 + 𝑛2
__ (2.12)
2 1+𝑛2 −2 1 2 1+𝑛2 −2 1
1 1
e ≤ 𝑡𝛼,𝑛1+𝑛 𝑆𝑝 √𝑛 + 𝑛 (2.13)
2 2 −2 1 2
Ejemplo 2.9
Marca A Marca B
ni 12 11
𝑥̅𝑖 3.3 2.9
𝑆𝑖 0.6 0.8
Solución. Como las varianzas son desconocidas, pero iguales, calculamos 𝑆𝑝2 por (2.11):
1 1 1 1
(𝑥̅1 − 𝑥̅2 ) − 𝑡𝛼,𝑛 𝑆𝑝 √𝑛 + 𝑛2
≤ (µ1 − µ2 ) ≤ (𝑥̅1 − 𝑥̅2 ) + 𝑡𝛼,𝑛 𝑆𝑝 √𝑛 + 𝑛2
2 1+𝑛2 −2 1 2 1+𝑛2 −2 1
1 1 1 1
(3.3 − 2.9) − 2.08 ∗ 0.4933√ + ≤ (µ1 − µ2 ) ≤ (3.3 − 2.9) + 2.08 ∗ 0.4933√ +
12 11 12 11
-0.028 ≤ µ1 - µ2 ≤ 0.828▪
Debido a que la diferencia real puede ser negativa o cero, no se puede concluir que
existe una diferencia en el contenido de nicotina de las dos marcas de cigarrillos▪
c) De modo que para calcular el intervalo de confianza, debe tenerse en cuenta que:
𝑝 ( −𝑡𝛼,𝑣 ≤ 𝑡 ≤ 𝑡𝛼,𝑣 ) = 1 − 𝛼
2 2
(𝑥̅1 − 𝑥̅ 2 ) − (µ1 − µ2 )
𝑝 −𝑡𝛼,𝑣 ≤ ≤ 𝑡𝛼,𝑣 = 1− 𝛼
2 2
𝑆12 𝑆22
√ +
𝑛1 𝑛2
( )
Teorema. Si 𝑥̅1 , 𝑥̅2 , 𝑆12 y 𝑆22 son las medias y las varianzas de dos muestras aleatorias de
tamaños n1 y n2, respectivamente, tomadas de dos poblaciones normales e independientes con
varianzas desconocidas y desiguales, entonces un intervalo de confianza aproximado del
100(1-α) % para la diferencia entre medias (µ1 - µ2) está dado por:
𝑆2 𝑆22 𝑆2 𝑆22
(𝑥̅1 − 𝑥̅2 ) − 𝑡𝛼,𝑣 √𝑛1 + ≤ (µ𝟏 − µ𝟐 ) ≤ (𝑥̅1 − 𝑥̅2 ) + 𝑡𝛼,𝑣 √𝑛1 + _____ (2.15)
2 1 𝑛2 2 1 𝑛2
𝑆2 𝑆22
e ≤ 𝑡𝛼,𝑣 √𝑛1 + (2.16)
2 1 𝑛2
Sea 𝑑̅ la diferencia promedio entre los “n” pares de datos, calculada por:
∑ 𝑑𝑖
𝑑̅ = (2.17)
𝑛
∑ 𝑑𝑖2 − 𝑛𝑑̅ 2
𝑆𝑑 = √ (2.18)
𝑛−1
Y, dado que es muy usual que la varianza es desconocida y/o se usa un tamaño de
muestra (n) pequeño, entonces la diferencia promedio con estadístico 𝑑̅ es una variable
aleatoria que sigue una una distribución T, con 𝑡∝,𝑣 unidades de desviación, calculadas por:
𝑑̅ −µ𝑑
𝑡∝,𝑣 = (2.19)
𝑆𝑑 / √ 𝑛
Por lo que el intervalo de confianza para muestras dependientes está dado por el
siguiente:
𝑆 𝑆
𝑑̅ − 𝑡𝛼,𝑣 𝑑 ≤ µd ≤ 𝑑̅ + 𝑡𝛼,𝑣 𝑑 ____________ (2.20)
2 √𝑛 2 √𝑛
Ejemplo 2.10
Solución:
2.21 Un fabricante de telas que compra hilo a dos proveedores está interesado en investigar la
resistencia a la ruptura de los hilos que compra. El proveedor 1 especifica que su hilo
tiene una resistencia a la ruptura con σ1 = 6 psi, en tanto que el 2 tiene especificada una
σ2 = 4 psi. De una muestra aleatoria de 30 probetas de cada proveedor resultan x̅1 = 80
psi y x̅2 =83 psi. Estime un intervalo de confianza del 95 % para la diferencia en la
tensión a la ruptura de los dos hilos.Una muestra tomada al azar de una población
normal de tamaño n1 = 25 con σ1 = 5 tiene la media x̅1 = 20 y una muestra aleatoria de
tamaño n2 = 36 tomada de otra población normal con σ2 = 3.6 tiene la media x̅2 = 25.
Determine un intervalo de confianza del 97.5 % para µ1 - µ2.
2.22 Una muestra tomada al azar de una población normal de tamaño n1 = 25 con σ1 = 5 tiene
la media x̅1 = 20 y una muestra aleatoria de tamaño n2 = 36 tomada de otra población
normal con σ2 = 3.6 tiene la media x̅2 = 25. Determine un intervalo de confianza del 90
% para µ1 - µ2.
2.23 Un estudio de dos tipos de equipo de fotocopiado demuestra que 60 fallas del primer tipo
de equipo tardaron un promedio de 91.2 minutos en ser reparadas, con una desviación
estándar de 20 minutos; mientras tanto, 60 fallas del segundo tipo de equipo tardaron en
Instituto Tecnológico de Colima Página 44
Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación
promedio 98.6 minutos en repararse con una desviación estándar de 19.5 minutos.
Obtenga un intervalo de confianza del 95% de la diferencia entre los tiempos promedio
reales que se requirieron para reparar fallas de los dos tipos de equipo de fotocopiado.
2.24 Se compara el rendimiento de dos vehículos, A y B, en kilómetros por litro. Se realizan
40 experimentos con el vehículo A y 55 con el B. La gasolina que se utiliza y las demás
condiciones son las mismas para ambos autos. El rendimiento promedio de gasolina para
A fue de 15.32 km/lt y el promedio para B fue 12.22 km/lt. Encuentre un intervalo de
confianza de 95% para la diferencia promedio real para los autos A y B. Suponga que
las desviaciones estándar poblacionales son 2.54 y 3.38 para los autos A y B,
respectivamente.
2.25 Se llevan a cabo pruebas de resistencia a la compresión sobre dos diferentes tabicones
utilizados en la construcción. De la experiencia pasada con el proceso de fabricación se
supone que las desviaciones estándar de las resistencias a la compresión son conocidas.
2
La desviación estándar del tabicón 1 es de 2.0 Kg/cm y la del tabicón 2 es de 2.5
2
Kg/cm . Se sabe que el comportamiento de las resistencias a la compresión de los dos
tipos de tabicones es aproximadamente normal. Se toma una muestra de 14 tabicones del
2
tipo 1 obteniéndose una media de 82.4 Kg/cm , y otra de tamaño 15 para el tabicón 2
2
obteniéndose una media de 74.5 Kg/cm . Construya un intervalo de confianza del 95%
para la diferencia en la resistencia media a la compresión de los dos tabicones.
2.26 Cierto metal se produce actualmente mediante un proceso estándar. Se desarrolla un
nuevo proceso en el que se añade una aleación a la producción del metal. Los fabricantes
se encuentran interesados en estimar la verdadera diferencia entre las tensiones de
ruptura de los metales producidos por los dos procesos. Para cada metal se seleccionan
12 ejemplares y cada uno de éstos se somete a una tensión hasta que se rompe. La
2
siguiente tabla muestra las tensiones de ruptura de los ejemplares, en Kg/cm :
Proceso actual 446 401 476 421 459 438 481 411 456 427 459 445
Proceso nuevo 462 448 435 465 429 472 453 459 427 468 452 447
Si se supone que el muestreo se llevó a cabo sobre dos distribuciones normales e
independientes, obtenga un intervalo de confianza del 95% para la diferencia entre los
dos procesos.
2.27 El gerente de una refinería piensa modificar el proceso para producir gasolina a partir de
petróleo crudo. El gerente hará la modificación sólo si la gasolina promedio que se
obtiene por este nuevo proceso (expresada como un porcentaje del crudo) aumenta su
valor con respecto al proceso actual. Con base en experimentos de laboratorio y
mediante el empleo de dos muestras aleatorias de tamaño 15, una para cada proceso, la
cantidad de gasolina promedio del proceso actual es de 25.4 con una desviación estándar
de 2.1, y para el proceso propuesto fue de 29.0 con una desviación estándar de 2.6. Si los
resultados proporcionados por los dos procesos son variables aleatorias independientes
normalmente distribuidas con varianzas iguales, determine un intervalo de confianza del
95 % para la diferencia real entre los dos procesos.
2.28 Un producto dietético afirma en su publicidad que el empleo del mismo durante un mes
produce una pérdida promedio de peso de 1.5 Kg en el primer mes. Nueve sujetos
utilizan este producto por un mes, con los siguientes resultados:
2.33 La Conagua reportó los resultados de un experimento en el que se usaron dos métodos
diferentes para determinar el contenido de cloro en muestras de agua clorada para varias
dosis y tiempos de contacto. Las siguientes observaciones están dadas en mg/litro.
Muestra
Método 1 2 3 4 5 6 7 8
1 0.86 10.55 1.78 0.42 10.90 7.50 4.67 3.37
2 1.36 10.73 2.58 0.39 10.89 8.13 5.33 4.00
Construya un intervalo de confianza del 99% para la diferencia en lecturas del verdadero
promedio de cloro residual entre los dos métodos.
2.34 Un investigador médico desea determinar si un remedio experimental tiene el efecto
colateral de aumentar la presión sistólica sanguínea. Se seleccionan al azar 12 personas
de diferentes edades y condiciones de salud, y se les mide la presión sanguínea antes de
aplicar la droga y un tiempo prudencial después de aplicarla. Determine un intervalo de
confianza del 98%, para el efecto del medicamento experimental en la presión
sanguínea.
Presión sanguínea
Persona Antes Después
1 130 136
2 174 176
3 112 120
4 145 148
5 182 186
6 138 138
7 120 128
8 160 170
9 152 154
10 128 126
11 126 130
12 161 168
2.35 Una compañía de taxis está tratando de decidir si comprar la marca A o la marca B de
neumáticos para su flotilla de automóviles. Para estimar la diferencia entre dos marcas, se
lleva a cabo un experimento con 8 neumáticos de cada marca que se instalan
aleatoriamente, una de cada compañía, en las ruedas traseras de ocho taxis. Los
neumáticos se utilizan hasta que se gastan. Los kilómetros recorridos fueron:
Taxi Marca A Marca B
1 44 400 46 700
2 55 500 56 800
3 46 700 47 700
4 42 000 41 100
5 58 400 57 800
6 42 800 46 400
7 48 100 48 900
8 40 100 41 500
Suponiendo que las distancias recorridas son normales, determine un intervalo de
confianza de 95 % para la diferencia media entre las dos marcas de llantas.
𝑝̅ − 𝑝
𝑍=
𝜎𝑝
̅
p̅ – 𝑝
𝑝 −𝑍(1−𝛼) < < 𝑍(1−𝛼) = 1− 𝛼
2 𝑝𝑞 2
√
( 𝑛 )
Donde la siguiente figura 2.9 nos ayuda a aclarar las expresiones anteriores:
̂q
p ̂ ̂q
p ̂
p̅ − 𝑍(1−𝛼) √ < 𝑝 < p̅ + 𝑍(1−𝛼) √ (2.22)
2
𝑛 2
𝑛
̂q
p ̂
e ≤ 𝑍(1−𝛼) √ (2.23)
2
𝑛
Ejemplo 2.11:
Solución:
𝑛(𝑥) 380
n= 500, n(x)=380, p̅ = = 500 = 0.76, por lo tanto: q̅ = 0.24
𝑛
como n es grande y np̅ = 500*0.76 = 380, y nq̅ = 500*0.24 = 120, siendo ambos >5,
tenemos que la distribución de la variable binomial X puede aproximarse por la
normal. Entonces, por (2.22):
p̂q̂ p̂q̂
p̅ − 𝑍(1−𝛼) √ < 𝑝 < p̅ + 𝑍(1−𝛼) √
2 𝑛 2 𝑛
0.76∗0.24 0.76∗0.24
Sustituyendo en (2.22): 0.76 − 1.96√ 500
< 𝑝 < 0.76 + 1.96 √ 500
0.723 ≤ p ≤ 0.797
De acuerdo con el teorema del límite central, se desprende que si los tamaños de dos
muestras, n1 y n2, son suficientemente grandes, el estadístico binomial (𝑝̅1 − 𝑝̅2 ) es una
variable aleatoria que tiene una distribución aproximadamente normal, con:
Teorema. Si 𝑝̅1 𝑦 𝑝̅2 son las proporciones de dos muestras aleatorias independientes de
tamaño n1 y n2, entonces un intervalo de confianza del 100(1-α) % para la diferencia de las
proporciones verdaderas 𝑝1 − 𝑝2, está dado por:
̂1q
p ̂1 ̂2q
p ̂2 ̂1q
p ̂1 ̂2q
p ̂2
(𝑝̅1 − 𝑝̅2 ) − 𝑍(1−𝛼) √ + < (𝒑𝟏 − 𝒑𝟐 ) < (𝑝̅1 − 𝑝̅2 ) + 𝑍(1−𝛼) √ +
2 𝑛1 𝑛2 2 𝑛1 𝑛2
(2.25)
̂1 q
p ̂1 ̂2q
p ̂2
e = 𝑍(1−𝛼) √ + (2.26)
2
𝑛1 𝑛2
Ejemplo 2.12:
Considere un proceso de producción que tiene una fracción defectuosa p1, desconocida.
Se toma una muestra aleatoria de 250 artículos del proceso original, encontrando 15
defectuosos. A este proceso se le realizan unas mejoras para reducir el porcentaje de
artículos defectuosos que está produciendo, y queremos saber la diferencia en la
proporción de artículos defectuosos entre el viejo y el nuevo proceso. Para ello, se
examinan al azar 200 artículos del nuevo proceso y se observan 8 defectuosos.
Determinar la diferencia real de mejora del proceso, usando un nivel de confianza del
95%.
Solución:
El intervalo de confianza del 95 %, (1-α = 0.95), para la diferencia entre las fracciones
defectuosas antes y después de las mejoras realizadas al proceso está dado por la
expresión (2.25):
𝑝1 𝑞1 𝑝2 𝑞2 𝑝1 𝑞1 𝑝2 𝑞2
(𝑝̅1 − 𝑝̅2 ) − 𝑍(1−𝛼) √ + < (𝑝1 − 𝑝2 ) < (𝑝̅1 − 𝑝̅2 ) + 𝑍(1−𝛼) √ +
2 𝑛1 𝑛2 2 𝑛1 𝑛2
Como la diferencia puede ser cero (procesos iguales), negativa (la diferencia puede estar
a favor del proceso viejo), o positiva (diferencia a favor del proceso nuevo), concluimos
con un 95% de confianza que no hay evidencia estadística para afirmar que los cambios
efectuados al proceso contribuyen a reducir el porcentaje de artículos defectuosos▪
2.48 De las líneas A y B de producción de chips para teléfonos celulares, se tomaron dos
muestras aleatorias de 400 chips cada una. De la línea A resultaron 20 chips defectuosos,
y de la B, 32. Estime la diferencia real en las fracciones de defectuosos para las dos
líneas, con un nivel de confianza de 0.95.
2.51 Se analiza la fracción de artículos defectuosos producidos por dos líneas de producción,
por lo que se toman muestras al azar. De la línea 1 se analizaron 200 piezas, encontrando
10 defectuosas; de la línea 2 se revisaron 180, encontrando 18 defectuosas. Determine un
intervalo de confianza del 96 % para la diferencia de la proporción de artículos
defectuosos producidos por las dos líneas.
2.52 Se lleva a cabo un estudio para determinar la efectividad de una nueva vacuna contra el
dengue. Se aplica la nueva vacuna a una muestra aleatoria de 1000 personas y de ellos 4
contraen dengue. A otro grupo control de 800 personas se les aplica una vacuna placebo,
60 de estos contraen dengue. Construya un intervalo de confianza del 98 % para la
verdadera diferencia de proporciones entre las dos vacunas.
2.53 En una muestra aleatoria de personas que visitan un famoso centro turístico, 85 de 250
hombres y 155 de 250 mujeres compraron “suvenires”. Construya un intervalo de
confianza del 96% para la diferencia entre las proporciones verdaderas de hombres y
mujeres que compran suvenires en este sitio turístico e interprete los resultados.
3.54 Entre 500 solicitudes de matrimonio, elegidas al azar en 2006 en cierta ciudad, hubo 50
en las cuales las mujeres eran cuando menos un año mayores que los hombres y entre
400 solicitudes de matrimonio, elegidas al azar en 2012, hubo 70 en las cuales las
mujeres eran cuando menos un año mayores que los hombres. Construya un intervalo de
confianza del 98% para la diferencia entre las proporciones verdaderas correspondientes
de solicitudes de matrimonio en las cuales las mujeres fueron cuando menos un año
mayores que los hombres.
2.55 Un cardiólogo investigador pensaba que se puede reducir el riesgo de sufrir ataques al
corazón ingiriendo aspirina. Para probar esta idea experimentó con personas propensas a
ataques al corazón, a los que dividió en dos grupos. A un grupo “A” de 566 personas se
le suministró una dosis diaria de una pastilla que no contenía ninguna droga (un
placebo), y de estos 10 sufrieron posteriormente ataques al corazón, mientras que a un
grupo “B” de 849 se les suministró una aspirina, y sólo 8 lo sufrieron. Usando un
intervalo de confianza de 95%, ¿Considera Usted que el cardiólogo estaba en lo
correcto?
2.56 Se lleva a cabo un estudio sobre la proporción de mujeres empleadas con licenciatura. De
entre las empresas grandes se han escogido dos al azar. De cada empresa se toma una
muestra aleatoria simple de 40 empleadas, obteniéndose que en la empresa A hay 16 y
en la empresa B, 22 mujeres con licenciatura. Obtenga un intervalo de confianza del 95
% para la diferencia de proporciones poblacionales de mujeres empleadas con
licenciatura.
Para obtener un intervalo de confianza del 100(1-α) % para la varianza, σ2, nos basamos
en el estadístico S², la cual tiene una distribución chi cuadrado. Así, análogamente,
consideramos ahora la siguiente probabilidad:
2 (𝑛 − 1) 𝑆 2
p ( 𝜒(1− 𝛼 < < 𝜒 2𝛼, )= 1−𝛼
2
),( 𝑛−1) 𝜎2 2
𝑛−1
(𝑛−1) 𝑆 2
Figura 2.11: Probabilidad (1-α) de que 𝜒 2 𝛼 < 𝜎2
< 𝜒 2𝛼, 𝑛−1
(1− ),( 𝑛−1) 2
2
(𝑛 − 1) 𝑆 2 (𝑛 − 1) 𝑆 2
p( 2 < 𝜎2 < 2 )= 1−𝛼
𝜒𝛼 𝜒 𝛼
2 ,( 𝑛−1) 1− 2 ,( 𝑛−1)
(𝑛−1) 𝑆 2 2 (𝑛−1) 𝑆 2
< 𝜎 < (2.27)
𝜒2𝛼 𝜒2 𝛼
,( 𝑛−1) 1− ,( 𝑛−1)
2 2
Se presenta la figura 2.12 para ayudar a interpretar el intervalo dado por (2.27):
Figura 2.12 Intervalo de confianza de (1-α) para estimar σ² por medio de S2.
Y, para obtener un intervalo de confianza de (1-α) para la desviación estándar basta con
sacar raíces cuadradas a la expresión (2.27).
Ejemplo 2.13:
Un nuevo proceso fabrica cojinetes de bola con diámetro interior igual a 3 cm. Si se
considera que tiene distribución normal, determine un intervalo de confianza del 99% para la
varianza poblacional σ², si se toma una muestra aleatoria de 12 de estos cojinetes y midieron
sus diámetros interiores, que fueron: 3.00, 3.03, 2.99, 2.99, 3.02, 3.00, 2.99, 2.99, 2.97, 2.98,
3.02 y 3.01.
(𝑛−1) 𝑆 2 (𝑛−1) 𝑆 2
< 𝜎2 <
𝜒2𝛼 𝜒2 𝛼
,( 𝑛−1) 1− ,( 𝑛−1)
2 2
Tenemos:
11 ∗ 0.0003606 11 ∗ 0.0003606
≤ 𝜎2 ≤
26.757 2.603
Instituto Tecnológico de Colima Página 56
Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación
𝟎. 𝟎𝟎𝟏𝟒𝟖𝟐 ≤ 𝝈𝟐 ≤ 𝟎. 𝟎𝟎𝟏𝟓𝟐𝟒
0.0385 cm ≤ σ ≤ 0.0390 cm
2.57 En una muestra aleatoria de 30 focos, la desviación estándar de la duración de los focos
fue de 100 horas. Determine un intervalo de confianza del 98 % para la desviación
estándar, σ, de la duración de los focos.
2.59 Concretos Kolima hace pruebas de la resistencia a la compresión del concreto. Hoy
prueban aleatoriamente 10 especímenes y obtienen las siguientes resistencias:
2.60 Una universidad aplica una prueba del nivel de matemáticas a todos los alumnos de
primer ingreso. Si 64 estudiantes, seleccionados al azar en este periodo, tardaron en
promedio 40 minutos en resolver la prueba, con una varianza de 10 minutos², construya
el intervalo de confianza del 90% para la desviación estándar verdadera del tiempo que
tardan los estudiantes en resolver el examen.
2.62 La longitud de los cráneos de 10 esqueletos fósiles de una especie de aves extinta tiene
una media de 5.68 cm y una desviación estándar de 0.29 cm Suponiendo que estas
mediciones están normalmente distribuidas, construya un intervalo de confianza del
95% para estimar la varianza verdadera de la longitud de los cráneos de la especie de
aves dada.
2.63 Una máquina produce láminas de plástico y se espera tener una cierta variación aleatoria
nominal en el espesor de las láminas. Para determinar que la variación del espesor se
encuentre dentro de ciertos límites, cada día se seleccionan en forma aleatoria 12
láminas de plástico y se mide su espesor en milímetros. Los datos que se obtuvieron hoy
son los siguientes:
Si se supone que el espesor es una variable aleatoria con distribución normal, obtenga un
intervalo de confianza del 99% para estimar la varianza desconocida del espesor. Si no
es aceptable una varianza mayor de 0.9 mm, ¿existe alguna razón para preocuparse con
base en esta evidencia?
2.64 La tienda de alimentos “Soriano” adquirió 2,000 cajas de cereal para el desayuno de 680
gramos cada una. Una muestra aleatoria de 51 de estas cajas tuvo un peso neto
promedio de 670 gramos y una desviación estándar de 8 gramos.
a) Estime la desviación estándar de la población.
b) Determine un intervalo de confianza del 95% para la desviación estándar del peso
neto medio, si el fabricante del cereal asegura que la desviación estándar de su
producto es de 5 gramos.
2.65 El administrador de un hotel de playa en Manzanillo desea conocer la ocupación de
habitaciones diaria promedio de la temporada baja en primavera. La siguiente tabla
presenta el número de habitaciones ocupadas en 21 días elegidos aleatoriamente en
dicha temporada. Estime la desviación estándar, σ, para esta temporada.
44 47 52 50 54 57 64 63 50 61 44
51 50 50 50 52 58 62 60 57 63
Si S1² y S2² son las varianzas de dos muestras aleatorias independientes de tamaño n1 y
n2 tomadas de dos poblaciones normales, entonces, el cociente (o razón) de dos varianzas
tiene una distribución muestral F con v1 = n1-1 y v2 = n2-1 grados de libertad:
𝑆12 𝜎22
𝐹 = (2.28)
𝑆22 𝜎12
𝑝 (𝐹1−𝛼, 𝑛1 −1,𝑛2 −1
≤ F ≤ 𝐹𝛼 , 𝑛1 −1,𝑛2 −1
)= 1− 𝛼
2 2
𝑆12 𝜎22
𝑝 (𝐹1−𝛼, 𝑛1 −1,𝑛2 −1
≤ 2 2 ≤ 𝐹𝛼, 𝑛1 −1,𝑛2 −1
)=1− 𝛼
2 𝑆2 𝜎1 2
se llega al siguiente:
Figura 2.13: Intervalo de confianza para 𝜎12 / 𝜎22 , con base en 𝑆12 /𝑆22 .
Ejemplo 2.14:
Considere dos marcas de cigarrillos con el siguiente contenido de nicotina (en mg.):
Marca A Marca B
ni 13 11
𝑆𝑖 0.6 0.8
Solución:
Así F𝛼,𝑣1 ,𝑣2 = F0.01, 10,12 = 4.30 y F𝛼,𝑣2,𝑣1 = F0.01, 12,10 = 4.71
2 2
𝝈𝟐𝑩
0.413 ≤ 𝟐 ≤ 8.373
𝝈𝑨
𝝈𝑩
0.643 ≤ ≤ 2.894 mg.▪
𝝈𝑨
𝝈𝟐
Si se hubiera construido la relación de la varianza de la marca A a la marca B, 𝝈𝟐𝑨 , el
𝑩
intervalo de confianza se tendría que ahora el numerador es A, por lo que v1 = 12 y v2 = 10.
Así F𝛼,𝑣1 ,𝑣2 = F0.01, 12,10 = 4.71 y F𝛼,𝑣2,𝑣1 = F0.01, 10,12 = 4.30
2 2
𝜎𝐴2
0.12 ≤ ≤ 2.42
𝜎𝐵2
𝝈𝑨
Y la razón de desviaciones estándar es: 0.346 ≤ ≤ 1.556 mg.▪
𝝈𝑩
2.67 La pintura para carreteras se surte en dos colores: blanco y amarillo. Interesa medir la
diferencia en tiempos de secado. Se toman mediciones de ambos tipos de pintura,
resultando los siguientes tiempos de secado, en minutos:
2.68 De una muestra tomada al azar de una población normal de tamaño n1 = 25 se obtuvo
que s1 = 5 y de otra muestra aleatoria de tamaño n2 = 36 tomada de una población
normal diferente se tuvo una s2 = 3.6. Determine un intervalo de confianza del 90% para
𝝈𝟐𝟏 /𝝈𝟐𝟐 .
2.70 Un estudio de dos tipos de equipo de fotocopiado demuestra que 16 fallas del primer tipo
de equipo tardaron un promedio de 91.2 minutos en ser reparadas, con una desviación
estándar de 21 minutos; mientras que 21 fallas del segundo tipo de equipo tardaron un
promedio de 98.6 minutos en repararse con una desviación estándar de 18 minutos.
Obtenga un intervalo de confianza del 98% de la razón de desviaciones estándar 𝝈𝟏 /𝝈𝟐
de los dos tipos de equipo de fotocopiado.
2.72 Las siguientes son las capacidades de producción de calor del carbón extraído de dos
minas (en millones de calorías por tonelada):
2.73 Doce árboles de frutos cítricos maduros, seleccionados al azar de una variedad A de
ejemplares, tienen una altura media de 13.8 pies con una desviación estándar de 2.0 pies
y 16 árboles de frutos cítricos maduros seleccionados también al azar de otra variedad B,
tienen una altura media 12.9 pies con una desviación estándar de 3.5 pies. Suponiendo
que las dos muestras aleatorias se seleccionaron de poblaciones normales con varianzas
iguales, construya un intervalo de confianza del 98% para la razón σB /σA de las dos
varianzas de la población.