Está en la página 1de 46

II UNIDAD

INFERENCIA ESTADÍSTICA:
ESTIMACIÓN.
Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

Instituto Tecnológico de Colima Página 20


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

II UNIDAD

INFERENCIA ESTADÍSTICA: ESTIMACIÓN.

Competencia específica a desarrollar: Explicar los diferentes métodos de estima-


ción que permitirían definir un buen estimador para los diferentes parámetros de una
población y nos permitan aplicarlos a situaciones reales. Así como su aplicación a los
métodos estadísticos para inferir.

2.1 CONCEPTOS BÁSICOS.

Uno de los objetivos principales de la estadística inferencial es la estimación de


parámetros. Así que mediante el estudio de una población por medio de una muestra aleatoria
recolectada, puedan estimarse los parámetros de la misma.

Para estimar un parámetro (tal como la media, µ, la varianza, σ², la proporción, π, etc.),
se hace un muestreo de tamaño n suficiente, que disminuya el error de muestreo y que
garantice que se obtendrá un estadístico confiable (𝑥̅ , s2, 𝑝̅ , etc), tal que pueda ser considerado
como un buen estimador del correspondiente parámetro poblacional. Mientras menor sea el
error de muestreo (“e”) que usemos en el muestreo del estadístico, más cercano estará dicho
estadístico del verdadero valor del parámetro.

Además, un buen estimador deberá cubrir las siguientes propiedades:

Características de un buen estimador.

Un estadístico 𝜃̂ se considera un buen estimador de un parámetro θ si cumple cuatro


características: a) Imparcialidad, b) Consistencia, c) Suficiencia, y d) Eficiencia.

a) Imparcialidad o insesgadez

Instituto Tecnológico de Colima Página 21


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

Un estadístico 𝜃̂ es un estimador insesgado o imparcial del parámetro θ si y solo si E(𝜃̂)


= θ. Es decir, si su distribución está centrada en el parámetro a estimar. La figura 2.1 ilustra
que la imparcialidad o insesgadez tiene que ver con un error de muestreo pequeño (“e”).

Figura 2.1 Estimadores insesgado y sesgado, e= 𝜃̂- θ.

Ejemplo 2.1:

Sea (X1, X2, …, Xn) un muestreo aleatorio simple, tal que E(Xi) = µ y Var(Xi) = σ²

a) Consideremos como estimador de la media poblacional a la media muestral, es decir


𝜃̂ = 𝑥̅ . Como sabemos E(𝑥̅ n).= µ, entonces, la media muestral es estimador insesgado
de la media poblacional µ.

b) Supongamos como estimador de la varianza poblacional a la varianza muestral, 𝜃̂2 =


S2. Puede demostrarse que E(S2) = σ². Por tanto, la varianza muestral es un estimador
insesgado de la varianza poblacional▪

No obstante que S2 es un estimador insesgado de σ², la desviación estándar de la muestra


S es un estimador sesgado de σ, con tendencia a que ese sesgo sea insignificante en
muestras grandes.

b) Consistencia o Coherencia.

Un estadístico 𝜃̂ es un estimador consistente o coherente del parámetro θ

Instituto Tecnológico de Colima Página 22


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

Si y solo si cumple que: O, en forma equivalente:

1) 𝜃̂ es insesgado;
1) lim𝑛 →∞ 𝐸( 𝜃̂ ) = θ
2) Var(𝜃̂) → 0 cuando n →∞
2) lim𝑛 →∞ 𝑉𝑎𝑟( 𝜃̂ ) = 0

3) O, también puede decirse que: lim𝑛 →∞ 𝑝( 𝑒 = 𝜃̂ − θ = 0) = 1

Lo cual significa que si tomáramos una muestra del tamaño de la población (censo), el
estimador coincidiría exactamente con el valor del parámetro.

Ejemplo 2.2:

Veamos que los estimadores tratados en el apartado anterior son consistentes.

𝜎2
a) Supongamos que 𝜃̂ = 𝑥̅ . Se cumple que E(𝑥̅ n).= µ, y Var (𝑥̅ .) = 𝑛
entonces,
tomando límites:
𝜎2
lim𝑛→∞ µ = µ y lim n = 0.
𝑛 →∞
Por tanto, la media muestral es estimador consistente de la media poblacional µ.

𝑛−1 2 (𝑛−1)
b) Consideremos 𝜃̂ = S2. Puede demostrarse que E(𝑆 2 ) = σ², y Var(𝑆 2 ) = σ4,
𝑛 𝑛2
por lo que tomando límites

𝑛−1 2(𝑛−1)
lim𝑛→∞ 𝜎² = 𝜎² y lim𝑛→∞ 𝜎4 = 0
𝑛 𝑛2

Por lo tanto S2 es un estimador consistente de la varianza poblacional σ²▪

c) Suficiencia

Se dice que un estimador 𝜃̂ es suficiente si utiliza una cantidad de información contenida


en la muestra que ningún otro estimador podría extraer información adicional de la muestra
sobre el parámetro θ de la población que se está estimando. Es decir se pretende que al extraer
la muestra el estadístico calculado contenga toda la información de esa muestra.

Ejemplo 2.3:

Instituto Tecnológico de Colima Página 23


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

Cuando se calcula la media de la muestra, se necesitan todos los datos y cuando se


calcula la mediana de una muestra sólo se utiliza un dato o dos. Esto es solo el dato o los
datos del centro son los que van a representar la muestra. Con esto se deduce que si
utilizamos todos los datos de la muestra como es en el caso de la media, se tendrá un
estimador suficiente, en tanto que la mediana no lo es.▪

d) Eficiencia o Estimador de Varianza Mínima

Dados dos estimadores de θ, 𝜃̂1


y 𝜃̂2, decimos que 𝜃̂1 es más
eficiente que 𝜃̂2, si Var(𝜃̂1) <
Var(𝜃̂2). Nos interesa el que tenga
menos dispersión, es decir un
estimador de varianza mínima. La
figura 2.2 ilustra esta situación. Para
comparar la eficiencia se construye
̂1 )
𝑉𝑎𝑟(𝜃
el cociente ̂2 ). Si es mayor que
𝑉𝑎𝑟(𝜃 Figura 2.2 Estimador eficiente o de varianza
1, entonces 𝜃̂2 es más eficiente; si mínima
es igual a 1, entonces ambos
estimadores son igual de eficientes;
si es menor que 1, entonces 𝜃̂1 es
más eficiente.

Ejemplo 2.4:

Consideremos como estimadores de la varianza poblacional σ² a S2 y 𝑆𝑛∗2 , donde 𝑆𝑛∗2 es


2
la cuasivarianza, la cual tiene E(𝑆𝑛∗2 ) = σ² y Var(𝑆𝑛∗2 ) = σ4. Calculamos el cociente
𝑛−1
de las varianzas:
2(𝑛−1) 4
𝑉𝑎𝑟 (𝑆 2 ) 𝑛2
𝜎 (𝑛−1)2
= 2 = < 1,
𝑉𝑎𝑟 (𝑆𝑛∗2 ) 𝜎4 𝑛2
(𝑛−1)

Por tanto, S2 es un estimador más eficiente▪

Instituto Tecnológico de Colima Página 24


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

2.2 DISTRIBUCIONES DE MUESTREO.

Cuando se muestrea un estadístico cualquiera, existe un número muy grande (o


indeterminado) de valores posibles que ese estadístico puede tener, por ello tal estadístico es
una variable aleatoria que tiene su propia distribución muestral de probabilidad, y el
muestreo se rige por ella. A continuación lo anterior se presenta con mayor detalle.

Cuando se hace el muestreo de una población donde hay N elementos, y se tomarán


aleatoriamente n elementos de ella, ocurre que hay un gran número de posibles muestras que
pueden ser tomadas. Más exactamente, hay NCn posibles muestras sin repetición, de las cuales
se tomará solo una al hacer el muestreo.

Por ejemplo, si una población tiene solo N= 500 elementos y se va a tomar una muestra
de n = 35 elementos, entonces hay un total de 500C35 = 8.328995679 E53 muestras posibles,
que es un número muy grande, (∞), y de las cuales el muestreador obtendrá sólo una de esas
8.328995679 E53 posibles muestras; y, por supuesto que el estadístico de interés (𝑥̅ , s2, 𝑝̅ ,
etc.) podrá tener distinto valor en cada una de las posibles muestras (es decir que 𝑥̅ , s2, 𝑝̅, etc.
son variables aleatorias), por lo que, ante la situación de que el muestreador tomará una de
entre un número grande (∞), de muestras posibles, estamos ante una distribución de probabi-
lidad de muestreo de un estadístico, también llamada distribución de muestreo o distribución
muestral, que tiene una distribución de probabilidad Normal, con una probabilidad del 95% de
obtener el estadístico buscado en ±1.96 𝜎𝑥̅ respecto del centro de la distribución.

Así, por ejemplo, para el estadístico media, (𝑥̅ ), la distribución muestral de la media es
la distribución de probabilidad de todas las medias de muestra posibles, también llamada en
plural, distribución de medias, o en singular, distribución de la media, pero que se refieren
exactamente a lo mismo. Idénticamente, para cada estadístico muestreado se tiene una distri-
bución propia de muestreo. La siguiente tabla 2.1 muestra algunas de las distribuciones mues-
trales:

Instituto Tecnológico de Colima Página 25


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

Estadístico Nombre de la Distribución Nombre corto

Media, 𝑥̅ Distribución muestral de la media Distribución de la media

Porción, 𝑝̅ Distribución muestral de la proporción Distribución de la proporción


Mediana, m Distribución muestral de la mediana Distribución de la mediana
Diferencia de me- Distribución muestral de la diferencia de Distribución de la diferencia de
dias, dos medias medias
Diferencia de pro- Distribución muestral de la diferencia de Distribución de la diferencia de
porciones dos proporciones proporciones

Tabla 2.1: Distribuciones muestrales de estadísticos.

Un concepto muy importante en las distribuciones de muestreo es el “Error


dar”, 𝜎𝑥̅ , el cual refiere a la “variación promedio” o “diferencia promedio” que puede haber
entre los estadísticos de todas las distintas muestras posibles del mismo tamaño n que pueden
tomarse; es decir: el error estándar es a una distribución muestral lo que la desviación estándar
es a una distribución de probabilidad (Nota: Aquí se usó el símbolo 𝜎𝑥̅ , para denotar el error
estándar, mismo que se usará de manera genérica a lo largo de este documento. Sin embargo,
cabe aclarar que este es el error estándar del muestreo de la media, 𝑥̅ , y que para algún otro
parámetro deberá cambiarse el subíndice en 𝜎𝑥̅ , por el estadístico correspondiente que se esté
estudiando).

Error de muestreo o error muestral, e, Es el error máximo que se puede cometer por el
hecho de inferir sobre cierta realidad a partir de la observación de sólo una parte de ella. La
magnitud de este error lo determina el investigador en función de los recursos.

Teniendo en cuenta la distribución muestral se puede entonces estimar el parámetro que


se busca.

Hay dos tipos de estimación de parámetros, que se tratan en las dos secciones siguientes.

Instituto Tecnológico de Colima Página 26


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

2.3 ESTIMACIÓN PUNTUAL.

Una estimación puntual es un único valor de un estadístico que es usado para estimar
un parámetro. Este estadístico usado se denomina estimador y se denota con el símbolo ̂
encima del estadístico correspondiente. Por ejemplo, el estimador de la media es µ̂ = 𝑥̅ . Aquí
conviene aclarar que µ̂ no es el verdadero parámetro (µ) de la población, sino que solo es un
estimador de µ por medio de un muestreo estadístico.

El objetivo de la estimación puntual es seleccionar sólo un número, basado en datos de


la muestra, que represente el valor más razonable del parámetro de interés θ. En general,
utilizaremos el símbolo 𝜃̂ para denotar el estimador del parámetro θ, y, para representar los
estimadores específicos se usa el símbolo ̂ encima del estadístico correspondiente. Por
ejemplo, denotamos los estimadores de:

La media: µ̂ = 𝑥̅ (2.1)

La proporción 𝑝̂ = 𝑝̅ (2.2)

La varianza 𝜎̂ 2 = s2 (2.3)

etc., de modo que, si 𝑥̅ = 170 cm, entonces µ̂ = 170 cm significa que se está estimando
que la media de toda la población es 170 cm, con base en el resultado de una muestra, pero
puede no ser exactamente µ, sino que solo es una aproximación de µ̂ al parámetro µ.

Ejemplo 2.5:

Sea µ el verdadero promedio de la duración (parámetro), en años, de una batería de


automóvil. Se toma una muestra aleatoria de 4 de esas baterías, resultando x1=2.0,
x2=3.4, x3=2.9 y x4= 3.1. Calculando se tiene una 𝑥̅ = 2.85 años y s2=0.6028, por lo que
es razonable considerar que:

µ̂ = 𝑥̅ = 2.85 años y que 𝜎̂2 = s2 = 0.6028 años2.

Por lo que µ̂ = 2.85 años es un estimador puntual de µ, y

Instituto Tecnológico de Colima Página 27


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

𝜎̂2 = 0.6028 años2 es un estimador puntual de la varianza σ²▪

Así entonces, tenemos que:

Un estimador puntual 𝜃̂ de un parámetro θ es un valor único que se puede considerar


como el más representativo de θ; que se obtiene calculándolo de una muestra estadística
apropiada.

En estadística matemática se utilizan diferentes métodos para calcular los estimadores.


Cuatro de los principales son: El Método de Máxima Verosimilitud, (propuesto en 1920 por R.
A. Fisher) que es uno de los mejores métodos para obtener un estimador puntual, El Método
de Momentos, que es uno de los métodos de estimación más antiguos, el método de mínimos
cuadrados y el método de estimación bayesiana.

2.4. ESTIMACIÓN DE INTERVALO.

Puesto que los estimadores puntuales pocas veces serán iguales a los parámetros que
tratan de estimar, podemos darnos una mayor libertad en su estimación mediante el uso de la
"estimación por intervalos" o "intervalos de confianza".

Una estimación por intervalo o intervalo de confianza es un intervalo, dentro del cual
se espera que el parámetro θ esté contenido. Un intervalo de confianza tiene la forma:

𝜃̂𝐼𝑧𝑞 ≤ θ ≤ 𝜃̂𝐷𝑒𝑟 (2.4)

Definición: Sea 1- α una probabilidad alta especificada y sean T1 y T2, dos estadísticos
tales que:

p[T1 ≤ θ ≤ T2] = 1-α

Instituto Tecnológico de Colima Página 28


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

El intervalo [T1, T2] recibe el nombre de Intervalo de Confianza del 100(1-α) % para el
parámetro desconocido θ. Las cantidades T1, T2 reciben el nombre de Límites de confianza
inferior y superior, respectivamente, y (1-α) es el Nivel de Confianza asociado con el
intervalo.

Figura 2.3 Intervalo de confianza para 𝜃̂ Figura 2.4 Estimaciones de 𝜃̂

La interpretación de un intervalo de confianza es que si se recopila un número grande de


muestras aleatorias y se calculan los intervalos de confianza del 100(1-α) % para el parámetro
θ, para cada una de las muestras, entonces el 100(1- α) % de esos intervalos contienen el valor
verdadero de θ. Puede decirse también que 1-α es la probabilidad de que el intervalo aleatorio
contenga el verdadero valor del parámetro desconocido θ.

Instituto Tecnológico de Colima Página 29


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

2.5 INTERVALOS DE CONFIANZA PARA MEDIAS.

Al calcular un intervalo de confianza para estimar la media poblacional (“µ”) debe


saberse si la varianza poblacional σ² es conocida o desconocida. A continuación se presentan
ambos casos.

2.5.1 INTERVALO DE CONFIANZA PARA LA MEDIA µ, CONOCIDA LA VARIANZA.

Si 𝑥̅ es la media de una muestra aleatoria de tamaño n, tomada de una población con


varianza conocida σ², entonces un intervalo de confianza del 100(1-α) para estimar µ será
aquél que cumpla que

𝜎 𝜎
p⟦(𝑥̅ − 𝑍1−𝛼 ∗ ) ≤ µ ≤ (𝑥̅ + 𝑍1−𝛼 ∗ )⟧ = 1 - α
2 √𝑛 2 √𝑛

para ayudar a aclarar la expresión anterior se presenta la figura 2.5

Figura 2.5: Confianza (1-α) de que la media µ esté en (T1, T2), con base en 𝑥̅ .

De la expresión de probabilidad anterior, se obtiene el siguiente

Teorema. Si 𝑥̅ es la media de una muestra aleatoria de tamaño n de una población con


varianza conocida σ², un intervalo de confianza para µ, del 100(1-α) % está dado por:

𝜎 𝜎
[(𝑥̅ − 𝑍 1−𝛼
2

√𝑛
) ≤ µ ≤ (𝑥̅ + 𝑍1−𝛼 ∗
2 √𝑛
) ] (2.5)

Instituto Tecnológico de Colima Página 30


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

Para muestras tomadas de una población normal, o para muestras de tamaño n ≥ 30, sin
importar la forma que tenga la población, el intervalo de confianza proporciona buenos
resultados. Sin embargo, para muestras pequeñas tomadas de poblaciones que no son
normales, no es posible esperar que el nivel de confianza 1-α sea exacto. El error de
estimación está dado por el siguiente teorema.

Teorema. Si se utiliza 𝑥̅ como una estimación de µ, se puede tener una confianza del
(1-α) % de que el error de estimación, e, no excederá de:

𝜎
e ≤ 𝑍(1−𝛼)/2 ∗ (2.6)
√𝑛

Ejemplo 2.6:

Una empresa eléctrica fabrica focos que tienen una distribución aproximadamente
normal. Si una muestra de 40 focos tiene una duración promedio de 1000 horas,
encuentre un intervalo de confianza del 94% para la media de la población de todos los
focos que produce esta empresa, si se supone una desviación estándar de 100 horas.

Solución:

Datos: n = 40, 𝑥̅ = 1000 horas, σ = 100 horas, la distribución es normal


(1-α) = 0.94, (1-α)/2 = 0.47, por lo que de la tabla A1: ZA=0.47 = 1.88
El intervalo se calcula por (2.5):
𝜎 𝜎
𝑥̅ − 𝑍1−𝛼 ∗ ≤ µ ≤ 𝑥̅ + 𝑍1−𝛼 ∗
2 √𝑛 2 √𝑛
Sustituyendo:
100 100
1000 – 1.88* ≤ µ ≤ 1000 + 1.88*
√40 √40
Obteniendo el intervalo del 94% de confianza de que allí esté µ, es:
970.27 horas ≤ µ ≤ 1029.73 horas▪

2.5.2 INTERVALO DE CONFIANZA PARA µ, VARIANZA DESCONOCIDA.

Si 𝑥̅ y S son la media y la desviación estándar de una muestra aleatoria tomada de una


distribución normal con varianza σ² desconocida, entonces un intervalo de confianza del
100(1-α) % para µ será aquel que cumpla que:
Instituto Tecnológico de Colima Página 31
Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

𝑆 𝑆
p(⟦(𝑥̅ − 𝑡𝛼,𝑣 ∗ ) ≤ µ ≤ (𝑥̅ + 𝑡𝛼,𝑣 ∗ )⟧ = 1 - α
2 √𝑛 2 √𝑛

Figura 2.6: Confianza (1-α) de que µ está en (T1,T2), con base en 𝑥̅ .

La figura 2.6 ayuda a aclarar la expresión de probabilidad anterior, la cual se llega al:

Teorema. Si 𝑥̅ y S² son la media y la varianza de una muestra aleatoria de tamaño n de


una población con varianza desconocida σ², el intervalo de confianza para la media
poblacional µ está dado por:

𝑆 𝑆
⟦(𝑥̅ − 𝑡𝛼,𝑣 ∗ ) ≤ µ ≤ (𝑥̅ + 𝑡𝛼,𝑣 ∗ )⟧ (2.7)
2 √𝑛 2 √𝑛

y que el error de estimación está dado por el siguiente:

Teorema. Si se utiliza 𝑥̅ como una estimación de µ, en una población con varianza


desconocida, σ², se puede tener una confianza del (1-α) % de que el error de estimación, e, no
excederá de:

𝑆
e ≤ 𝑡𝛼,𝑣 ∗ (2.8)
2 √𝑛

Ejemplo 2.7:

Se producen cilindros de longitud media µ = 5 cm y varianza desconocida. Si


suponemos que el proceso es normal y se toma una muestra de 16 piezas, con las
siguientes medidas:

4.94 4.91 4.86 5.02 5.08 4.84 4.95 5.01


4.95 4.90 4.85 5.00 4.96 4.95 4.78 4.80

Instituto Tecnológico de Colima Página 32


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

Construya un intervalo de confianza del 95% para estimar µ del proceso. ¿Puede
considerarse que este proceso tiene una producción con parámetro de 5.0 cm?

Solución:

Calculando se tiene que la media de la muestra es igual a 4.925 cm y la desviación


estándar de 0.0832.

Datos: n = 16, v = 15, 𝑥̅ =4.925, s=0.0832,

Se usa la distribución t porque σ es desconocida y n es pequeña

α =0.05, t α/2, v = t0.025,15 = 2.131

El intervalo de confianza del 95% está dado por (2.7):

𝑆 𝑆
⟦(𝑥̅ − 𝑡𝛼,𝑣 ∗ ) ≤ µ ≤ (𝑥̅ + 𝑡𝛼,𝑣 ∗ )⟧
2 √𝑛 2 √𝑛

0.0832 0.0832
4.925 – 2.131* ≤ µ ≤ 4.925 + 2.131 ∗
√16 √16

Resultando 4.881 ≤ µ ≤ 4.969, o bien: (4.881, 4.969).

Y, de acuerdo con este muestreo e intervalo, puede decirse con un 95% de confianza que
el nivel medio del proceso no es 5.0 cm de longitud (o, que se está produciendo fuera del
parámetro especificado para el proceso de µ= 5 cm.) ▪

EJERCICIOS SECCIÓN 2.5: INTERVALOS DE CONFIANZA PARA LA MEDIA µ

2.1 Se sabe que una población tiene una desviación estándar de 20, se toma de ella una
muestra de 64 elementos y se encuentra una media de 90.
a) Encuentre el error estándar de la media.
b) Construya una estimación de intervalo para µ, del 95% de confianza.
2.2 En una población con una varianza de 225, una muestra de 100 observaciones arroja una
media de 450.
a) Encuentre el error estándar de la media.
b) Construya una estimación de intervalo del 85.02%.
2.3 Una muestra de 12 elementos tiene una media de 62 y una desviación estándar de 10.
Construya un intervalo de confianza de 95% para la media de la población.
2.4 De una población de 220 individuos, se toma una muestra de 64. A partir de esta muestra,
se encuentra que la media es de 12.5 y la desviación estándar de 2.4
a) Encuentre el error estándar estimado de la media.
b) Construya un intervalo de confianza de 98 % para la media.

Instituto Tecnológico de Colima Página 33


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

2.5 De una población con desviación estándar de 50 se toma una muestra, resultando que la
media de la muestra es 220. Construya una estimación de intervalo para la media de la
población que tenga un 95% de certeza de incluir a la verdadera media de la población.
a) Si el tamaño de la muestra es de 100 elementos
b) Si el tamaño de la muestra es de 4,000 elementos.
2.6 El gerente de calidad de los focos ahorradores marca Sylvano debe estimar la vida
promedio de horas que durarán los focos fabricados en su planta. Fue elegida una
muestra aleatoria de 100 focos y el tiempo promedio de duración fue de 2,720 horas. Si
se sabe que la desviación estándar del tiempo de vida es 100 horas, construya un
intervalo de confianza del 97.5% para la vida de estos focos.
2.7 La tienda de alimentos “Soriano” adquirió 2,000 cajas de cereal para el desayuno de 680
gramos cada una. Una muestra aleatoria de 48 de estas cajas tuvo un peso neto
promedio de 657 gramos y una desviación estándar de 8.5 gramos.
a) Estime la desviación estándar de la población.
b) Estime el error estándar de la media para esta población finita.
c) Determine un intervalo de confianza del 95% para el peso neto medio, basado en la
muestra.
2.8 Para los siguientes límites de un intervalos de confianza, determine el nivel de confianza
asociado con el intervalo:
(a) x̅ - 1.45σx̅ a x̅ + 1.45 σx̅
(b) x̅ – 1.96σx̅ a x̅ + 1.96σx̅
(c) x̅ - 2.54σx̅ a x̅ + 2.54σx̅
2.9 Jorge Ramírez, el ingeniero de una planta purificadora de agua, mide diariamente el
contenido de cloro en 200 muestras diferentes. En un periodo de varios años, ha
establecido que la población tiene una media de 5.5 y una desviación estándar de 1.5
miligramos de cloro por litro. Las muestras arrojaron hoy un promedio de 4.6
miligramos de cloro por litro.
a) Encuentre el error estándar de la media.
b) Establezca el intervalo de confianza del 86.4% para estimar µ.
2.10 Paty Gómez, una ingeniera industrial, está realizando un estudio de tiempos normales
para un proceso de ensamblado. Este proceso se realiza en 80 diferentes estaciones de
trabajo, cada una efectuando las mismas actividades de ensamblado. Muestreó 10
estaciones y obtuvo los siguientes tiempos de ensamblado, en minutos: 2.3, 2.0, 1.9, 2.9,
2.6, 1.3, 2.4, 2.6, 2.8 y 3.0.
a) Estime la desviación estándar de la población.
b) Construya un intervalo de confianza de 98% para el tiempo medio de ensamblado.
2.11 El Grupo de Transportistas de la ciudad de Guadalajara desea estimar el número
promedio de pasajeros por kilómetro que usan sus vehículos. Si su flotilla es de 5,200
autobuses, y si se ha determinado en estudios previos que la desviación estándar es de
5.3 pasajeros por kilómetro, construya un intervalo de confianza de 96% para el número
medio de pasajeros por kilómetro, cuando toma una muestra aleatoria de 100 autobuses,
que arroja un promedio de 15.5 usuarios por kilómetro.
2.12 La presión sanguínea de 25 mujeres de edad avanzada tienen una media x̅= 140 mm de
mercurio. Considerando que estos datos provienen de una muestra tomada al azar de
una población normal con σ = 10 mm de mercurio, construya un intervalo de confianza
del 95% para la media de la población µ.
2.13 Una universidad aplica una prueba del nivel de matemáticas a todos los alumnos de
primer ingreso. Si 64 estudiantes, seleccionados al azar en este periodo, tardaron en
promedio 40 minutos en resolver la prueba, con una varianza de 10 minutos², construya
un intervalo de confianza del 99% del verdadero tiempo promedio que tardan los
alumnos de primer ingreso en resolver el examen.
2.14 Durante la cosecha de naranjas, se revisaron al azar 50 hectáreas en busca de naranjas en
mal estado (debido a que una naranja mala puede echar a perder a todo el canasto) y se

Instituto Tecnológico de Colima Página 34


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

encontró que había un promedio de 12.6 naranjas malas por hectárea. Se sabe que la
desviación estándar de naranjas malas por hectárea es de 2.5 para este tipo de naranja.
a) Calcule el error estándar de la media.
b) Establezca una estimación de intervalo alrededor de la media, utilizando 𝜎̂= s.
2.15 La longitud de los cráneos de 10 esqueletos fósiles de una especie de aves extinta tiene
una media de 5.68 cm y una desviación estándar de 0.29 cm. Suponiendo que estas
mediciones están normalmente distribuidas, obtenga un intervalo de confianza del 95%
de la longitud media de los cráneos de esta especie de aves.
23.16 Un inspector de alimentos examinó 12 frascos de cierta marca de mantequilla de
cacahuate, y obtuvo los siguientes porcentajes de impurezas: 2.3, 1.9, 2.1, 2.8, 2.3, 3.6,
1.4, 1.8, 2.1, 3.2, 2.0 y 1.9. Si estas mediciones están normalmente distribuidas,
construya un intervalo de confianza del 98% para el porcentaje promedio de impurezas
que hay en esta marca de mantequilla de cacahuate.
2.17 Para los siguientes tamaños de muestra y niveles de confianza, encuentre los valores t
apropiados para la construcción de intervalos de confianza:
a) n = 06, 98%.
b) n = 09; 99%.
c) n = 10; 90%.
d) n = 15; 99.8%.
e) n = 22; 99.5%.
f) n = 27; 95%.
2.18 Dados los siguientes tamaños de muestra y los valores t utilizados para construir
intervalos de confianza, encuentre los correspondientes niveles de confianza:
a) n= 6, t= ±2.447.
b) n= 15, t= ±2.624.
c) n = 29, t = ±2.048.
2.19 La siguiente muestra de nueve observaciones fue tomada de una población infinita con
distribución normal:
75.5, 75.3, 76.4, 83.2, 91.0, 80.1, 77.5, 84.8, 81.0
Construya un intervalo de confianza de 95% para la media.
2.20 Tomamos una muestra aleatoria simple de 29 estudiantes universitarios, para que
respondan una prueba de inteligencia espacial. Los resultados fueron una media de 78 y
una desviación estándar de 9. ¿En qué intervalo se hallará la inteligencia espacial media
de todos los estudiantes, a un nivel de confianza del 98%?

2.6 INTERVALOS DE CONFIANZA PARA DIFERENCIA DE MEDIAS.

Sean X11, X12, ... X1n, una muestra aleatoria de n1 observaciones tomadas de una primera
población con valor esperado µ1 y varianza 𝜎12 , y X21, X22, ... X2n otra muestra aleatoria de n2
observaciones tomada de la segunda población con valor esperado µ2 y varianza 𝜎22 . Si 𝑥̅1 y 𝑥̅2
son las medias muestrales, la estadística 𝑥̅1-𝑥̅2 es un estimador puntual de µ1 - µ2, y tiene una

Instituto Tecnológico de Colima Página 35


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

distribución normal si las dos poblaciones son normales, o aproximadamente normales si


tienen tamaños de muestras relativamente grandes. Es decir:

𝜎12 𝜎22
𝑥̅1 -𝑥̅2 → N(µ1 - µ2, + )
𝑛1 𝑛2

Por lo tanto, la diferencia 𝑥̅1 -𝑥̅2 sigue una distribución normal, con

(𝑥̅1 − 𝑥̅2 ) − (µ1 − µ2 )


𝑍=
𝜎2 𝜎2
√ 1 + 2
𝑛1 𝑛2

Para calcular el intervalo de confianza para la diferencia de dos medias debemos saber si
las varianzas poblacionales son conocidas o desconocidas, y en caso de que sean
desconocidas, se debe probar si son iguales o diferentes. Cada caso se analiza enseguida:

2.6.1 ESTIMACIÓN DE µ1 − µ2 , CASO DE VARIANZAS 𝜎12 Y 𝜎22 CONOCIDAS.

Si las varianzas poblacionales son conocidas, el procedimiento para estimar la diferencia


µ1 − µ2 mediante un intervalo de confianza es el siguiente:
a) El estadístico usado como estimador puntual de la diferencia de medias µ1 − µ2 es
𝑥̅1 − 𝑥̅ 2 .
b) La variable aleatoria asociada con el estimador será la variable normal estándar dada
por:

(𝑥̅1 −𝑥̅ 2 ) − (µ1 − µ2 )


𝑍=
𝜎 𝜎 2 2
√ 1+ 2
𝑛1 𝑛2

c) Para calcular un intervalo de confianza del 100(1-α) % se debe tener en cuenta la


siguiente probabilidad:

𝑝 ( −𝑍(1−𝛼) < 𝑍 < 𝑍(1−𝛼) ) = 1 − 𝛼


2 2

Instituto Tecnológico de Colima Página 36


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

o, sustituyendo Z de la expresión anterior:

(𝑥̅1 − 𝑥̅2 ) – (µ1 − µ2 )


𝑝 −𝑍(1−𝛼) < < 𝑍(1−𝛼) =1− 𝛼
2 𝜎2 𝜎22 2
√ 1
𝑛1 + 𝑛2
( )

probalilidad que puede aclararse con la siguiente figura 2.7:

Figura 2.7: Confianza (1-α) de que µ1 - µ2 esté en (T1, T2), con base en 𝑥̅1 − 𝑥̅ 2

Manipulando la expresión de probabilidad anterior se obtiene el siguiente teorema, que


define el intervalo de confianza para la diferencia entre dos medias µ1 - µ2 con varianzas
conocidas 𝜎12 . y 𝜎22 .

Teorema. Si 𝑥̅1 y 𝑥̅2 son las medias de dos muestras aleatorias independientes de
tamaño n1 y n2 tomadas de poblaciones que tienen varianzas conocidas 𝜎12 . y 𝜎22 ,
respectivamente, entonces un intervalo de confianza del 100(1-α) % para estimar la diferencia
µ1 - µ2 entre dos poblaciones, es:

𝜎2 𝜎22 𝜎2 𝜎22
(𝑥̅1 − 𝑥̅2 ) − 𝑍(1−𝛼) √𝑛1 + ≤ (µ1 − µ2 ) ≤ (𝑥̅1 − 𝑥̅2 ) + 𝑍(1−𝛼) √𝑛1 + (2.9)
1 𝑛2 1 𝑛2
2 2

Con error de estimación, e, dado por:

Instituto Tecnológico de Colima Página 37


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

𝜎12 𝜎22
e ≤ 𝑍(1−𝛼) √ + ( 2.10)
2
𝑛1 𝑛2

Ejemplo.2.8

Una muestra de 50 focos tomada al azar de una primera marca dio una duración media
de 515 horas, en tanto que una muestra de 64 focos de una segunda marca dio una duración
media de 502 horas. Si las desviaciones estándar de las dos poblaciones son 30 horas y 25
horas, respectivamente, construya un intervalo de confianza del 97.5% para estimar la
diferencia real de la duración entre las dos marcas de focos.

Solución.

Datos:

n1 = 50 𝑥̅1 = 515 h σ1 = 30 h,
n2 = 64 𝑥̅2 = 502 h, σ2 = 25 h,
(1-α) = 0.975 (1-α)/2 = 0.4875 α = 0.025

Como las varianzas son conocidas, tenemos que: 𝑍(1−𝛼) = 𝑍0.4875 = 2.24
2

Entonces, el intervalo de confianza está dado por (2.9):

𝜎12 𝜎22 𝜎12 𝜎22


(𝑥̅1 − 𝑥̅2 ) − 𝑍(1−𝛼) √ + ≤ (µ1 − µ2 ) ≤ (𝑥̅1 − 𝑥̅2 ) + 𝑍(1−𝛼) √ +
2 𝑛1 𝑛2 2 𝑛1 𝑛2

302 252 302 252


(515 − 502) − 2.24√ + ≤ (µ1 − µ2 ) ≤ (515 − 502) + 2.24√ 50 +
50 64 64

1.2 horas ≤ (µ𝟏 − µ𝟐 ) ≤ 24.8 horas

El hecho de que ambos límites sean positivos sugiere que la primera marca de focos
tiene una duración media superior a la segunda marca▪

2.6.2 CASO 2: VARIANZAS DESCONOCIDAS PERO IGUALES (𝜎12 = 𝜎22 = 𝜎 2 )

Si las varianzas poblacionales son desconocidas, pero iguales, los pasos a seguir para
encontrar el intervalo de confianza son los siguientes:

Instituto Tecnológico de Colima Página 38


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

a) El estadístico usado como estimador puntual de la diferencia de medias µ1 − µ2 será


𝑥̅1 − 𝑥̅ 2 .
b) La variable aleatoria asociada con el estimador será la variable T dada por:
(𝑥̅ 1 −𝑥̅ 2 ) − (µ1 − µ2 )
T= 1 1
𝑆𝑝 √ +
𝑛1 𝑛2

Donde Sp puede obtenerse de la varianza combinada 𝑆𝑝2 , que es un estimador insesgado


de la varianza σ2, y que se calcula por:
(𝑛1 −1)𝑆12 + (𝑛2 −1)𝑆22
𝑆𝑝2 = (2.11)
𝑛1 + 𝑛2 −2

c) De modo que para calcular el intervalo de confianza, debe tenerse en cuenta que:

𝑝 ( −𝑡𝛼,𝑛 < 𝑡 < 𝑡𝛼,𝑛 )= 1− 𝛼


2 1+𝑛2 −2 2 1+𝑛2 −2

(𝑥̅1 − 𝑥̅2 ) – (µ1 − µ2 )


𝑝 −𝑡𝛼,𝑛 < < 𝑡𝛼,𝑛 =1− 𝛼
2 1+𝑛2 −2 1 1 2 1+𝑛2 −2
𝑆𝑝 √𝑛 + 𝑛
( 1 2 )

De nuevo, manipulando la expresión anterior, se obtiene el siguiente teorema, que define


el intervalo de confianza para estimar la diferencia entre dos medias µ1 - µ2 cuando las
varianzas son desconocidas, pero iguales: 𝜎12 = 𝜎22 = 𝜎 2 :

Teorema. Si 𝑥̅1 y 𝑥̅2 son las medias y 𝑆12 y 𝑆22 son las varianzas de dos muestras
aleatorias independientes de tamaño n1 y n2 tomadas de dos poblaciones que tienen varianzas
desconocidas, pero iguales, entonces un intervalo de confianza del 100(1-α) % para µ1 - µ2 es:

1 1 1 1
(𝑥̅1 − 𝑥̅2 ) − 𝑡𝛼,𝑛 𝑆𝑝 √𝑛 + 𝑛2
≤ (µ1 − µ2 ) ≤ (𝑥̅1 − 𝑥̅2 ) + 𝑡𝛼,𝑛 𝑆𝑝 √𝑛 + 𝑛2
__ (2.12)
2 1+𝑛2 −2 1 2 1+𝑛2 −2 1

Y, el error máximo de estimación, e, está dado por:

1 1
e ≤ 𝑡𝛼,𝑛1+𝑛 𝑆𝑝 √𝑛 + 𝑛 (2.13)
2 2 −2 1 2

Instituto Tecnológico de Colima Página 39


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

Ejemplo 2.9

Se realizó un estudio para comparar el contenido de nicotina de dos marcas de


cigarrillos. La siguiente tabla presenta los resultados de las dos muestras aleatorias:

Marca A Marca B
ni 12 11
𝑥̅𝑖 3.3 2.9
𝑆𝑖 0.6 0.8

Si los datos provienen de muestras de poblaciones normales con varianzas desconocidas,


pero iguales, construya un intervalo de confianza del 95% para estimar la diferencia real
del contenido de nicotina entre las dos marcas.

Solución. Como las varianzas son desconocidas, pero iguales, calculamos 𝑆𝑝2 por (2.11):

(𝑛1 −1)𝑆12 + (𝑛2 −1)𝑆22 (12−1)0.62 + (11−1)0.82


𝑆𝑝2 = == = 0.4933
𝑛1 + 𝑛2 −2 12+11 −2

De donde 𝑆𝑝 = 0.7024. Además, de la tabla A2 obtenemos t0.025,21 = 2.08, con lo cual


calculamos, el intervalo de confianza del 95 % , dado por (2.12):

1 1 1 1
(𝑥̅1 − 𝑥̅2 ) − 𝑡𝛼,𝑛 𝑆𝑝 √𝑛 + 𝑛2
≤ (µ1 − µ2 ) ≤ (𝑥̅1 − 𝑥̅2 ) + 𝑡𝛼,𝑛 𝑆𝑝 √𝑛 + 𝑛2
2 1+𝑛2 −2 1 2 1+𝑛2 −2 1
1 1 1 1
(3.3 − 2.9) − 2.08 ∗ 0.4933√ + ≤ (µ1 − µ2 ) ≤ (3.3 − 2.9) + 2.08 ∗ 0.4933√ +
12 11 12 11

-0.028 ≤ µ1 - µ2 ≤ 0.828▪

Debido a que la diferencia real puede ser negativa o cero, no se puede concluir que
existe una diferencia en el contenido de nicotina de las dos marcas de cigarrillos▪

2.6.3 CASO 3: VARIANZAS DESCONOCIDAS Y DESIGUALES (𝜎12 ≠ 𝜎22 )

Si las varianzas son diferentes y desconocidas, el procedimiento a seguir para el cálculo


del intervalo de confianza para la diferencia de dos medias es el siguiente:

a) El estadístico usado como estimador puntual de la diferencia de medias µ1 − µ2 será


𝑥̅1 − 𝑥̅2 .
b) La variable aleatoria asociada con el estimador será la variable T dada por:
(𝑥̅1 −𝑥̅2 ) − (µ1 − µ2 )
𝑡 𝛼,𝑣 =
2 2 2
𝑆1 𝑆2
√ +
𝑛1 𝑛2

Instituto Tecnológico de Colima Página 40


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

Donde v son los grados de libertad, que están dados por:


𝑆 𝑆 2 2
( 1 + 2 )2
𝑛1 𝑛2
𝑣= 𝑆2 𝑆2
(2.14)
( 1 )2 (𝑛2 )2
𝑛1
+ 2
𝑛1 +1 𝑛2 +1

c) De modo que para calcular el intervalo de confianza, debe tenerse en cuenta que:

𝑝 ( −𝑡𝛼,𝑣 ≤ 𝑡 ≤ 𝑡𝛼,𝑣 ) = 1 − 𝛼
2 2

Ahora sustituimos t en la expresión del inciso (b):

(𝑥̅1 − 𝑥̅ 2 ) − (µ1 − µ2 )
𝑝 −𝑡𝛼,𝑣 ≤ ≤ 𝑡𝛼,𝑣 = 1− 𝛼
2 2
𝑆12 𝑆22
√ +
𝑛1 𝑛2
( )

Y, basado en la distribución t, con v grados de libertad, se llega al siguiente teorema, que


estima el intervalo de confianza buscado:

Teorema. Si 𝑥̅1 , 𝑥̅2 , 𝑆12 y 𝑆22 son las medias y las varianzas de dos muestras aleatorias de
tamaños n1 y n2, respectivamente, tomadas de dos poblaciones normales e independientes con
varianzas desconocidas y desiguales, entonces un intervalo de confianza aproximado del
100(1-α) % para la diferencia entre medias (µ1 - µ2) está dado por:

𝑆2 𝑆22 𝑆2 𝑆22
(𝑥̅1 − 𝑥̅2 ) − 𝑡𝛼,𝑣 √𝑛1 + ≤ (µ𝟏 − µ𝟐 ) ≤ (𝑥̅1 − 𝑥̅2 ) + 𝑡𝛼,𝑣 √𝑛1 + _____ (2.15)
2 1 𝑛2 2 1 𝑛2

Donde el máximo error de estimación es

𝑆2 𝑆22
e ≤ 𝑡𝛼,𝑣 √𝑛1 + (2.16)
2 1 𝑛2

2.6.4 CASO 4: MUESTRAS DEPENDIENTES (OBSERVACIONES PAREADAS)

Dos muestras son dependientes cuando:

Instituto Tecnológico de Colima Página 41


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

a) Se observa la “unidad de muestreo” en dos tiempos distintos, llamados muchas veces


“antes y después”. Se tiene una pareja de datos por cada elemento de la muestra.
b) Cuando son dos “unidades de muestreo” diferentes, pero tan similares en
características que estas parecen “gemelos”. También se tendrá una pareja de datos.

Sea 𝑑̅ la diferencia promedio entre los “n” pares de datos, calculada por:

∑ 𝑑𝑖
𝑑̅ = (2.17)
𝑛

Y sea 𝑆𝑑 el error estándar de las muestras pareadas, calculado por:

∑ 𝑑𝑖2 − 𝑛𝑑̅ 2
𝑆𝑑 = √ (2.18)
𝑛−1

Dónde: n es el número de pares de observaciones,


di es la diferencia en la i-ésima pareja de observaciones,
𝑑̅ es la diferencia promedio de los datos pareados de la muestra,
𝑆𝑑 es la desviación estándar de las diferencias de las observaciones.

Y, dado que es muy usual que la varianza es desconocida y/o se usa un tamaño de
muestra (n) pequeño, entonces la diferencia promedio con estadístico 𝑑̅ es una variable
aleatoria que sigue una una distribución T, con 𝑡∝,𝑣 unidades de desviación, calculadas por:

𝑑̅ −µ𝑑
𝑡∝,𝑣 = (2.19)
𝑆𝑑 / √ 𝑛

Dónde: α es el nivel de significancia


v = n - 1 son los grados de libertad, y
µ𝑑 es la diferencia parámetro entre los dos grupos.

Por lo que el intervalo de confianza para muestras dependientes está dado por el
siguiente:

Teorema. Si 𝑑̅ y 𝑆𝑑 son la media y la desviación estándar muestrales de la diferencia de


n pares parejas de datos dependientes normalmente distribuidos, entonces un intervalo de
confianza del 100(1- α) % para la diferencia de medias dependientes µd = µ1 -µ2 es:

Instituto Tecnológico de Colima Página 42


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

𝑆 𝑆
𝑑̅ − 𝑡𝛼,𝑣 𝑑 ≤ µd ≤ 𝑑̅ + 𝑡𝛼,𝑣 𝑑 ____________ (2.20)
2 √𝑛 2 √𝑛

Figura 2.8: Intervalo de confianza para µd , con base en 𝑑̅

Con un máximo error de estimación:


𝑆𝑑
̅
e ≤ 𝑡𝛼,𝑣 (2.21)
2 √𝑛

Ejemplo 2.10

En una prueba de laboratorio para determinar los contenidos esenciales de jitomates


frescos, en miligramos, en comparación con los mismos jitomates ya enlatados, se
encontraron los siguientes resultados:

Grupo de Frescos Enlatados di 𝑑𝑖2


Jitomates
1 87 96 9 81
2 79 91 12 144
3 67 85 18 324
4 76 88 12 144
5 71 93 22 484
6 66 79 13 169
7 71 68 -3 9
8 73 65 -8 64
9 62 70 8 64
10 69 95 26 676
109 2159

Determine un intervalo de confianza del 99 % para la diferencia en los contenidos


esenciales de los jitomates antes y después de enlatarlos.

Solución:

Instituto Tecnológico de Colima Página 43


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

Calculamos la diferencia promedio y su desviación estándar usando (2.17) y (2.18):


∑ 𝑑𝑖 109
𝑑̅ = = = 10.9
𝑛 10

∑ 𝑑𝑖2 − 𝑛𝑑̅ 2 2159−10∗(10.9)²


𝑆𝑑 = √ √ = 10.386 mg
𝑛−1 9

Y, el intervalo para muestras dependientes lo calculamos por (2.20):


𝑆𝑑 𝑆𝑑
𝑑̅ − 𝑡𝛼,𝑣 ≤ µd ≤ 𝑑̅ + 𝑡𝛼,𝑣
2 √𝑛 2 √𝑛
Que para aplicarla necesitamos el valor 𝑡𝛼,𝑣 , como α = 0.01, entonces α/2 = 0.005 y v =
2
n-1 = 9, por lo que de la tabla A2 se tiene: t0.005, 9 = 3.25. Entonces, el intervalo de
confianza para estimar los contenidos esenciales de los jitomates frescos y enlatados es:
10.386 10.386
10.9 – 3.25* ≤ µd ≤ 10.9 + 3.25*
√10 √10
0.226 ≤ µ𝐝 ≤ 21.574
De donde se concluye con un 99 % de confianza que la diferencia en el contenido de
componentes esenciales en los jitomates frescos contra enlatados es de 0.226 a 21.574
miligramos a favor de los jitomates ya enlatados▪

EJERCICIOS SECCIÓN 2.6: INTERVALOS DE CONFIANZA PARA DIFERENCIA DE


MEDIAS, µ1 - µ2.

2.21 Un fabricante de telas que compra hilo a dos proveedores está interesado en investigar la
resistencia a la ruptura de los hilos que compra. El proveedor 1 especifica que su hilo
tiene una resistencia a la ruptura con σ1 = 6 psi, en tanto que el 2 tiene especificada una
σ2 = 4 psi. De una muestra aleatoria de 30 probetas de cada proveedor resultan x̅1 = 80
psi y x̅2 =83 psi. Estime un intervalo de confianza del 95 % para la diferencia en la
tensión a la ruptura de los dos hilos.Una muestra tomada al azar de una población
normal de tamaño n1 = 25 con σ1 = 5 tiene la media x̅1 = 20 y una muestra aleatoria de
tamaño n2 = 36 tomada de otra población normal con σ2 = 3.6 tiene la media x̅2 = 25.
Determine un intervalo de confianza del 97.5 % para µ1 - µ2.
2.22 Una muestra tomada al azar de una población normal de tamaño n1 = 25 con σ1 = 5 tiene
la media x̅1 = 20 y una muestra aleatoria de tamaño n2 = 36 tomada de otra población
normal con σ2 = 3.6 tiene la media x̅2 = 25. Determine un intervalo de confianza del 90
% para µ1 - µ2.
2.23 Un estudio de dos tipos de equipo de fotocopiado demuestra que 60 fallas del primer tipo
de equipo tardaron un promedio de 91.2 minutos en ser reparadas, con una desviación
estándar de 20 minutos; mientras tanto, 60 fallas del segundo tipo de equipo tardaron en
Instituto Tecnológico de Colima Página 44
Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

promedio 98.6 minutos en repararse con una desviación estándar de 19.5 minutos.
Obtenga un intervalo de confianza del 95% de la diferencia entre los tiempos promedio
reales que se requirieron para reparar fallas de los dos tipos de equipo de fotocopiado.
2.24 Se compara el rendimiento de dos vehículos, A y B, en kilómetros por litro. Se realizan
40 experimentos con el vehículo A y 55 con el B. La gasolina que se utiliza y las demás
condiciones son las mismas para ambos autos. El rendimiento promedio de gasolina para
A fue de 15.32 km/lt y el promedio para B fue 12.22 km/lt. Encuentre un intervalo de
confianza de 95% para la diferencia promedio real para los autos A y B. Suponga que
las desviaciones estándar poblacionales son 2.54 y 3.38 para los autos A y B,
respectivamente.
2.25 Se llevan a cabo pruebas de resistencia a la compresión sobre dos diferentes tabicones
utilizados en la construcción. De la experiencia pasada con el proceso de fabricación se
supone que las desviaciones estándar de las resistencias a la compresión son conocidas.
2
La desviación estándar del tabicón 1 es de 2.0 Kg/cm y la del tabicón 2 es de 2.5
2
Kg/cm . Se sabe que el comportamiento de las resistencias a la compresión de los dos
tipos de tabicones es aproximadamente normal. Se toma una muestra de 14 tabicones del
2
tipo 1 obteniéndose una media de 82.4 Kg/cm , y otra de tamaño 15 para el tabicón 2
2
obteniéndose una media de 74.5 Kg/cm . Construya un intervalo de confianza del 95%
para la diferencia en la resistencia media a la compresión de los dos tabicones.
2.26 Cierto metal se produce actualmente mediante un proceso estándar. Se desarrolla un
nuevo proceso en el que se añade una aleación a la producción del metal. Los fabricantes
se encuentran interesados en estimar la verdadera diferencia entre las tensiones de
ruptura de los metales producidos por los dos procesos. Para cada metal se seleccionan
12 ejemplares y cada uno de éstos se somete a una tensión hasta que se rompe. La
2
siguiente tabla muestra las tensiones de ruptura de los ejemplares, en Kg/cm :
Proceso actual 446 401 476 421 459 438 481 411 456 427 459 445
Proceso nuevo 462 448 435 465 429 472 453 459 427 468 452 447
Si se supone que el muestreo se llevó a cabo sobre dos distribuciones normales e
independientes, obtenga un intervalo de confianza del 95% para la diferencia entre los
dos procesos.
2.27 El gerente de una refinería piensa modificar el proceso para producir gasolina a partir de
petróleo crudo. El gerente hará la modificación sólo si la gasolina promedio que se
obtiene por este nuevo proceso (expresada como un porcentaje del crudo) aumenta su
valor con respecto al proceso actual. Con base en experimentos de laboratorio y
mediante el empleo de dos muestras aleatorias de tamaño 15, una para cada proceso, la
cantidad de gasolina promedio del proceso actual es de 25.4 con una desviación estándar
de 2.1, y para el proceso propuesto fue de 29.0 con una desviación estándar de 2.6. Si los
resultados proporcionados por los dos procesos son variables aleatorias independientes
normalmente distribuidas con varianzas iguales, determine un intervalo de confianza del
95 % para la diferencia real entre los dos procesos.
2.28 Un producto dietético afirma en su publicidad que el empleo del mismo durante un mes
produce una pérdida promedio de peso de 1.5 Kg en el primer mes. Nueve sujetos
utilizan este producto por un mes, con los siguientes resultados:

Instituto Tecnológico de Colima Página 45


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

Peso (en Kg) Sujeto


1 2 3 4 5 6 7 8 9
Inicial 82 99 97 99 77 72 75 82 93
Final 80 97 95 98 75 70 73 81 91
Determine un intervalo de confianza del 98 % para la pérdida de peso promedio.
2.29 Doce árboles de frutos cítricos de cinco años, seleccionados al azar en un cultivo, tienen
una altura media de 4.25 metros con una desviación estándar de 37 centímetros y en otra
huerta también de frutos cítricos de 5 años se muestreó a 15 árboles al azar, teniendo una
altura media de 4 m con una desviación estándar de 46 cm. Suponiendo que las dos
muestras aleatorias se seleccionaron de poblaciones normales con varianzas iguales,
construya un intervalo de confianza del 95% de la diferencia en las alturas promedio
reales de los dos tipos de árboles de cítricos.
2.30 Las siguientes son las capacidades de producción de calor del carbón extraído de dos
minas, en millones de calorías por tonelada:
Mina Calor, (en millones de calorías por tonelada)
A 8600 8420 8590 8060 8130
B 7810 7990 8020 8370 7960
Suponiendo que los datos constituyen dos muestras aleatorias independientes tomadas
de poblaciones normales con varianzas iguales, construya un intervalo de confianza del
99% de la diferencia entre el promedio real de las capacidades de producción de calor
del carbón extraído de ambas minas.
2.31 Un cierto metal se produce mediante un proceso estándar. Se desarrolla un nuevo
proceso para la producción de ese metal. Los fabricantes se encuentran interesados en
estimar la verdadera diferencia entre las tensiones de ruptura de los metales producidos
por los dos procesos. Seleccionan 12 ejemplares de cada proceso y se someten a una
prueba de tensión a la ruptura. Los resultados fueron:
Proceso Tensión a la ruptura (en Kg/cm2)
Estándar 460 444 402 445 475 422 440 458 478 412 427 430
Nuevo 460 425 470 450 448 460 450 435 465 430 472 452
Si se supone que el muestreo se llevó a cabo sobre dos distribuciones normales e
independientes, obtenga un intervalo de confianza del 95% para la diferencia entre los
dos procesos.
2.32 En un artículo de la revista Human Factors se reportan los resultados de un experimento
para comparar características de maniobra para dos automóviles de diferentes
longitudes, distancias entre ejes y radios de giro. Las observaciones se refieren a los
tiempos en segundos necesarios por una persona para estacionar cada automóvil en
paralelo (con dos vehículos a los lados).
Persona
Automóvil 1 2 3 4 5 6 7 8 9 10 11 12
A 26 37 16 24 22 24 34 58 34 24 24 21
B 20 18 17 41 21 17 39 32 28 23 30 21
¿Cree Usted que un automóvil será estacionado en menor tiempo que el otro? Use un
intervalo de confianza del 90%. Haga explícitas las suposiciones necesarias.

Instituto Tecnológico de Colima Página 46


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

2.33 La Conagua reportó los resultados de un experimento en el que se usaron dos métodos
diferentes para determinar el contenido de cloro en muestras de agua clorada para varias
dosis y tiempos de contacto. Las siguientes observaciones están dadas en mg/litro.
Muestra
Método 1 2 3 4 5 6 7 8
1 0.86 10.55 1.78 0.42 10.90 7.50 4.67 3.37
2 1.36 10.73 2.58 0.39 10.89 8.13 5.33 4.00
Construya un intervalo de confianza del 99% para la diferencia en lecturas del verdadero
promedio de cloro residual entre los dos métodos.
2.34 Un investigador médico desea determinar si un remedio experimental tiene el efecto
colateral de aumentar la presión sistólica sanguínea. Se seleccionan al azar 12 personas
de diferentes edades y condiciones de salud, y se les mide la presión sanguínea antes de
aplicar la droga y un tiempo prudencial después de aplicarla. Determine un intervalo de
confianza del 98%, para el efecto del medicamento experimental en la presión
sanguínea.
Presión sanguínea
Persona Antes Después
1 130 136
2 174 176
3 112 120
4 145 148
5 182 186
6 138 138
7 120 128
8 160 170
9 152 154
10 128 126
11 126 130
12 161 168
2.35 Una compañía de taxis está tratando de decidir si comprar la marca A o la marca B de
neumáticos para su flotilla de automóviles. Para estimar la diferencia entre dos marcas, se
lleva a cabo un experimento con 8 neumáticos de cada marca que se instalan
aleatoriamente, una de cada compañía, en las ruedas traseras de ocho taxis. Los
neumáticos se utilizan hasta que se gastan. Los kilómetros recorridos fueron:
Taxi Marca A Marca B
1 44 400 46 700
2 55 500 56 800
3 46 700 47 700
4 42 000 41 100
5 58 400 57 800
6 42 800 46 400
7 48 100 48 900
8 40 100 41 500
Suponiendo que las distancias recorridas son normales, determine un intervalo de
confianza de 95 % para la diferencia media entre las dos marcas de llantas.

Instituto Tecnológico de Colima Página 47


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

2.7 INTERVALOS DE CONFIANZA PARA PROPORCIONES, p.

Para encontrar un intervalo de confianza para el parámetro p (o π) de la distribución


binomial, que representa la verdadera proporción de “éxitos” en los eventos binomiales, es
conveniente utilizar el estimador máximo verosímil de p o π, que está dado por la proporción
muestral 𝑝̅, es decir 𝑝̂ = 𝑝̅ , y que cuando ambos: np≥5 y nq≥5, y ni p ni q están próximos a 0 o
a 1, la proporción p tiene aproximadamente una distribución normal estándar, con variable:

𝑝̅ − 𝑝
𝑍=
𝜎𝑝
̅

Por lo que, para encontrar un intervalo de confianza del (1 – α) debemos considerar la


siguiente probabilidad:

𝑝 ( −𝑍(1−𝛼) < 𝑍 < 𝑍(1−𝛼) ) = 1 − 𝛼


2 2

p̅ – 𝑝
𝑝 −𝑍(1−𝛼) < < 𝑍(1−𝛼) = 1− 𝛼
2 𝑝𝑞 2

( 𝑛 )

Donde la siguiente figura 2.9 nos ayuda a aclarar las expresiones anteriores:

Figura 2.9: Intervalo de confianza de (1-α) para p, con base en p


̅.

Manipulado la expresión anterior obtenemos el:


Instituto Tecnológico de Colima Página 48
Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

Teorema. Si p̅ es la proporción de éxitos en una muestra aleatoria de tamaño n, y q̅ = 1-


p̅, entonces un intervalo de confianza del 100(1-α) %, para la proporción p es:

̂q
p ̂ ̂q
p ̂
p̅ − 𝑍(1−𝛼) √ < 𝑝 < p̅ + 𝑍(1−𝛼) √ (2.22)
2
𝑛 2
𝑛

Donde el máximo error de estimación es:

̂q
p ̂
e ≤ 𝑍(1−𝛼) √ (2.23)
2
𝑛

Ejemplo 2.11:

En una muestra aleatoria de n = 500 familias que tienen televisores en la ciudad de


Colima, Se encontró que 380 tienen servicio de televisión por cable. Determine un intervalo
de confianza del 95 % para la proporción verdadera de familias en esta ciudad que tienen
dicho servicio.

Solución:

𝑛(𝑥) 380
n= 500, n(x)=380, p̅ = = 500 = 0.76, por lo tanto: q̅ = 0.24
𝑛

como n es grande y np̅ = 500*0.76 = 380, y nq̅ = 500*0.24 = 120, siendo ambos >5,
tenemos que la distribución de la variable binomial X puede aproximarse por la
normal. Entonces, por (2.22):

p̂q̂ p̂q̂
p̅ − 𝑍(1−𝛼) √ < 𝑝 < p̅ + 𝑍(1−𝛼) √
2 𝑛 2 𝑛

Donde, para una confianza (1- α) = 0.95, se tiene de la tabla A1 que:

𝑍(1−𝛼) = 𝑍(.95) = Z 0.475 = 1.96


2 2

0.76∗0.24 0.76∗0.24
Sustituyendo en (2.22): 0.76 − 1.96√ 500
< 𝑝 < 0.76 + 1.96 √ 500

0.723 ≤ p ≤ 0.797

Por lo que se concluye, con un 95 % de confianza, que la proporción de usuarios de tv


por cable en dicha ciudad está entre 0.723 ≤ p ≤ 0.797▪

Instituto Tecnológico de Colima Página 49


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

EJERCICIOS SECCION 2.7: INTERVALOS DE CONFIANZA DE UNA PROPORCIÓN, p.


2.36 Una muestra realizada en un supermercado demostró que 304 de 400 compradores
donan los centavos en el programa “Redondeo”. Obtenga un intervalo de confianza del
96% para la proporción verdadera correspondiente.
2.37 En una muestra aleatoria de 300 televidentes de Colima, 210 habían presenciado cierto
programa de TV. Construya un intervalo de confianza del 95% para la proporción
verdadera correspondiente.
2.38 Un proveedor asegura que el porcentaje de artículos defectuosos en su proceso de
producción es cuando mucho del 1%. Se recibe un lote grande de artículos provenientes
de este proveedor y se selecciona e inspecciona una muestra aleatoria de 400 artículos,
encontrando 16 defectuosos. Obtenga un intervalo de confianza de 95% para estimar la
proporción de artículos defectuosos del proceso de manufactura del fabricante.
2.39 La lista electoral final en una elección reciente para senador, reveló que 11,872 personas
de un total de 22,400 seleccionadas aleatoriamente, tienen preferencia por el candidato
A con respecto al candidato B. Obtenga un intervalo de confianza unilateral inferior del
99% para la verdadera proporción de votantes a favor del candidato A. Con base en este
resultado, ¿podría usted afirmar que es probable que A gane la elección?
2.40 Un fabricante de calculadoras está interesado en calcular la fracción de unidades
defectuosas producidas. Toma una muestra aleatoria de 1000 calculadoras, de las que
resultan 15 defectuosas. Estime un intervalo de confianza del 95 % para la fracción de
calculadoras defectuosas.
2.41 El doctor Pedro Picudo, un reconocido psicólogo social, investigó a 200 altos ejecutivos;
encontró que 44% de ellos eran incapaces de sumar fracciones correctamente.
a) Estime el error estándar de la porción.
b) Construya un intervalo de confianza de 94% para la porción real de altos ejecutivos
que no pueden sumar correctamente fracciones.
2.42 Uno de los líderes de un sindicato de 500 trabajadores desea plantear una cuestión a
todos los miembros del grupo en la próxima asamblea. Si más de la mitad respondieran
“NO” entonces preferiría no plantearla para no minar su prestigio. Para salir de dudas,
elige aleatoriamente a 100 trabajadores a los que les hace la pregunta y 40 responden
“NO”. ¿Entre qué límites se hallará la verdadera proporción de NO, al nivel del 95%?
2.43 Un fabricante de reproductores de DVD utiliza un conjunto de pruebas amplias para
evaluar las funciones eléctricas de su producto. Todos los reproductores de DVD deben
pasar todas las pruebas antes de venderse. Una muestra aleatoria de 100 reproductores
tiene como resultado 2 que fallan en una o más pruebas. Encuentre un intervalo de
confianza de 95% para la proporción de los reproductores de DVD de la población que
no pasan todas las pruebas.
2.44 En una muestra de 100 pilas tipo B fabricadas por la compañía Águila Azul, se
encontraron 5 defectuosas. Encuentre el máximo error de estimación e tal que se pueda
tener un 95% de confianza en que 𝑝̅ de la muestra diste cuando mucho de p en “e”.
2.45 Durante 24 meses las ventas han estado disminuyendo de manera coherente en las 550
sucursales de una cadena de Pizzas. Una empresa de asesores ha determinado que 36%
de una muestra de 100 sucursales tiene claros signos de una mala administración.
Construya un intervalo de confianza de 98% para la porción de sucursales con mala
administración.
2.46 En un estudio aleatorio de 200 accidentes de automóvil en la ciudad, 50 tuvieron
consecuencias fatales. Construya un intervalo del 95% de confianza para estimar la
proporción de todos los accidentes automovilísticos que en esta ciudad tienen
consecuencias fatales.
2.47 Al evaluar la efectividad de un programa federal de rehabilitación, con una investigación
de 60 de los 1200 internos de una prisión se encontró que 21 de éstos eran reincidentes.
a) Estime el error estándar de la porción de reincidentes. b) Construya un intervalo
de confianza de 95% para la porción de reincidentes de esta prisión.

Instituto Tecnológico de Colima Página 50


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

2.8 INTERVALOS DE CONFIANZA PARA DIFERENCIA ENTRE


PROPORCIONES.

De acuerdo con el teorema del límite central, se desprende que si los tamaños de dos
muestras, n1 y n2, son suficientemente grandes, el estadístico binomial (𝑝̅1 − 𝑝̅2 ) es una
variable aleatoria que tiene una distribución aproximadamente normal, con:

(𝑝̅1 −𝑝̅2 ) − (𝑝1 − 𝑝2 )


𝑍= 𝑝 𝑞 𝑝 𝑞
(2.24)
1 1 2 2
√ 𝑛 + 𝑛
1 2

Para encontrar un intervalo de confianza para la diferencia de proporciones (𝑝1 − 𝑝2 ),


el estimador puntual estará dado por (𝑝̅1 − 𝑝̅2 ), y nuevamente debe considerarse la siguiente
probabilidad:

𝑝 ( −𝑍(1−𝛼) < 𝑍 < 𝑍(1−𝛼) ) = 1 − 𝛼


2 2

Sustituyendo Z por su equivalente dado en (2.24) se obtiene:

(𝑝̅1 − 𝑝̅2 ) − (𝑝1 − 𝑝2 )


𝑝 −𝑍(1−𝛼) < < 𝑍(1−𝛼) = 1 − 𝛼
2 𝑝1 𝑞1 𝑝2 𝑞2 2
√ 𝑛 + 𝑛
( 1 2 )

Donde la siguiente figura 2.10 ayuda a aclarar las anteriores expresiones:

Figura 2.10: Confianza de (1-α) para p( −𝑍(1−𝛼) < 𝑍 < 𝑍(1−𝛼) )


2 2

Instituto Tecnológico de Colima Página 51


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

Y, de las expresiones anteriores, se deriva el siguiente teorema:

Teorema. Si 𝑝̅1 𝑦 𝑝̅2 son las proporciones de dos muestras aleatorias independientes de
tamaño n1 y n2, entonces un intervalo de confianza del 100(1-α) % para la diferencia de las
proporciones verdaderas 𝑝1 − 𝑝2, está dado por:

̂1q
p ̂1 ̂2q
p ̂2 ̂1q
p ̂1 ̂2q
p ̂2
(𝑝̅1 − 𝑝̅2 ) − 𝑍(1−𝛼) √ + < (𝒑𝟏 − 𝒑𝟐 ) < (𝑝̅1 − 𝑝̅2 ) + 𝑍(1−𝛼) √ +
2 𝑛1 𝑛2 2 𝑛1 𝑛2
(2.25)

Donde el error máximo está dado por:

̂1 q
p ̂1 ̂2q
p ̂2
e = 𝑍(1−𝛼) √ + (2.26)
2
𝑛1 𝑛2

Ejemplo 2.12:

Considere un proceso de producción que tiene una fracción defectuosa p1, desconocida.
Se toma una muestra aleatoria de 250 artículos del proceso original, encontrando 15
defectuosos. A este proceso se le realizan unas mejoras para reducir el porcentaje de
artículos defectuosos que está produciendo, y queremos saber la diferencia en la
proporción de artículos defectuosos entre el viejo y el nuevo proceso. Para ello, se
examinan al azar 200 artículos del nuevo proceso y se observan 8 defectuosos.
Determinar la diferencia real de mejora del proceso, usando un nivel de confianza del
95%.

Solución:

Tenemos: n1 = 250, x1 = 15 → p1 = 15/250 = 0.06

n2 = 200, x2 = 8 → p2 = 8/200 = 0.04

El intervalo de confianza del 95 %, (1-α = 0.95), para la diferencia entre las fracciones
defectuosas antes y después de las mejoras realizadas al proceso está dado por la
expresión (2.25):

𝑝1 𝑞1 𝑝2 𝑞2 𝑝1 𝑞1 𝑝2 𝑞2
(𝑝̅1 − 𝑝̅2 ) − 𝑍(1−𝛼) √ + < (𝑝1 − 𝑝2 ) < (𝑝̅1 − 𝑝̅2 ) + 𝑍(1−𝛼) √ +
2 𝑛1 𝑛2 2 𝑛1 𝑛2

0.06 ∗ 0.94 0.04 ∗ 0.96 0.06 ∗ 0.94 0.04 ∗ 0.96


(0.06 − 0.04) − 1.96√ + < (𝑝1 − 𝑝2 ) < (0.06 − 0.04) − 1.96√ +
250 200 250 200

Instituto Tecnológico de Colima Página 52


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

-0.02 < (𝒑𝟏 − 𝒑𝟐 ) < 0.06

Como la diferencia puede ser cero (procesos iguales), negativa (la diferencia puede estar
a favor del proceso viejo), o positiva (diferencia a favor del proceso nuevo), concluimos
con un 95% de confianza que no hay evidencia estadística para afirmar que los cambios
efectuados al proceso contribuyen a reducir el porcentaje de artículos defectuosos▪

EJERCICIOS SECCIÓN 2.8: INTERVALOS DE CONFIANZA PARA DIFERENCIA


ENTRE PROPORCIONES, p1 – p2.

2.48 De las líneas A y B de producción de chips para teléfonos celulares, se tomaron dos
muestras aleatorias de 400 chips cada una. De la línea A resultaron 20 chips defectuosos,
y de la B, 32. Estime la diferencia real en las fracciones de defectuosos para las dos
líneas, con un nivel de confianza de 0.95.

2.49 En un proceso de fabricación de partes automotrices se está considerando cierto cambio


a un proceso específico. Se toman muestras del proceso actual y del nuevo para
determinar si éste tiene como resultado una mejoría. Se encuentra que son defectuosos
30 de 600 artículos del procedimiento actual y 32 de 800 artículos del procedimiento
nuevo. Encuentre un intervalo de confianza de 95% para la diferencia real en la porción
de partes defectuosas entre el proceso actual y el nuevo ¿recomendaría que el proceso
nuevo sea implementado?

2.50 El Jefe del departamento de Ciencias Básicas registró el porcentaje de calificaciones NA


obtenidas por dos muestras de estudiantes de dos profesores de matemáticas. El profesor
1 reportó 150 estudiantes, de los que 48 obtuvieron NA, y el profesor 2 reportó las
calificaciones de 125 estudiantes y un 22% con NA. Estime la diferencia entre los
porcentajes de calificaciones NA otorgadas por los dos profesores, usando un nivel de
confianza del 95%.

2.51 Se analiza la fracción de artículos defectuosos producidos por dos líneas de producción,
por lo que se toman muestras al azar. De la línea 1 se analizaron 200 piezas, encontrando
10 defectuosas; de la línea 2 se revisaron 180, encontrando 18 defectuosas. Determine un
intervalo de confianza del 96 % para la diferencia de la proporción de artículos
defectuosos producidos por las dos líneas.

2.52 Se lleva a cabo un estudio para determinar la efectividad de una nueva vacuna contra el
dengue. Se aplica la nueva vacuna a una muestra aleatoria de 1000 personas y de ellos 4
contraen dengue. A otro grupo control de 800 personas se les aplica una vacuna placebo,
60 de estos contraen dengue. Construya un intervalo de confianza del 98 % para la
verdadera diferencia de proporciones entre las dos vacunas.

Instituto Tecnológico de Colima Página 53


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

2.53 En una muestra aleatoria de personas que visitan un famoso centro turístico, 85 de 250
hombres y 155 de 250 mujeres compraron “suvenires”. Construya un intervalo de
confianza del 96% para la diferencia entre las proporciones verdaderas de hombres y
mujeres que compran suvenires en este sitio turístico e interprete los resultados.

3.54 Entre 500 solicitudes de matrimonio, elegidas al azar en 2006 en cierta ciudad, hubo 50
en las cuales las mujeres eran cuando menos un año mayores que los hombres y entre
400 solicitudes de matrimonio, elegidas al azar en 2012, hubo 70 en las cuales las
mujeres eran cuando menos un año mayores que los hombres. Construya un intervalo de
confianza del 98% para la diferencia entre las proporciones verdaderas correspondientes
de solicitudes de matrimonio en las cuales las mujeres fueron cuando menos un año
mayores que los hombres.

2.55 Un cardiólogo investigador pensaba que se puede reducir el riesgo de sufrir ataques al
corazón ingiriendo aspirina. Para probar esta idea experimentó con personas propensas a
ataques al corazón, a los que dividió en dos grupos. A un grupo “A” de 566 personas se
le suministró una dosis diaria de una pastilla que no contenía ninguna droga (un
placebo), y de estos 10 sufrieron posteriormente ataques al corazón, mientras que a un
grupo “B” de 849 se les suministró una aspirina, y sólo 8 lo sufrieron. Usando un
intervalo de confianza de 95%, ¿Considera Usted que el cardiólogo estaba en lo
correcto?

2.56 Se lleva a cabo un estudio sobre la proporción de mujeres empleadas con licenciatura. De
entre las empresas grandes se han escogido dos al azar. De cada empresa se toma una
muestra aleatoria simple de 40 empleadas, obteniéndose que en la empresa A hay 16 y
en la empresa B, 22 mujeres con licenciatura. Obtenga un intervalo de confianza del 95
% para la diferencia de proporciones poblacionales de mujeres empleadas con
licenciatura.

2.9 INTERVALOS DE CONFIANZA PARA VARIANZAS.

Para obtener un intervalo de confianza del 100(1-α) % para la varianza, σ2, nos basamos
en el estadístico S², la cual tiene una distribución chi cuadrado. Así, análogamente,
consideramos ahora la siguiente probabilidad:

2 (𝑛 − 1) 𝑆 2
p ( 𝜒(1− 𝛼 < < 𝜒 2𝛼, )= 1−𝛼
2
),( 𝑛−1) 𝜎2 2
𝑛−1

la figura 2.11 ayuda a interpretar esta expresión:

Instituto Tecnológico de Colima Página 54


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

(𝑛−1) 𝑆 2
Figura 2.11: Probabilidad (1-α) de que 𝜒 2 𝛼 < 𝜎2
< 𝜒 2𝛼, 𝑛−1
(1− ),( 𝑛−1) 2
2

Manipulando la anterior expresión de probabilidad tenemos:

(𝑛 − 1) 𝑆 2 (𝑛 − 1) 𝑆 2
p( 2 < 𝜎2 < 2 )= 1−𝛼
𝜒𝛼 𝜒 𝛼
2 ,( 𝑛−1) 1− 2 ,( 𝑛−1)

de donde se obtiene el:

Teorema. Si S² es la varianza de una muestra aleatoria de n observaciones tomadas de


una distribución normal con varianza desconocida σ², entonces el intervalo de confianza de
100(1-α) % para estimar σ² es:

(𝑛−1) 𝑆 2 2 (𝑛−1) 𝑆 2
< 𝜎 < (2.27)
𝜒2𝛼 𝜒2 𝛼
,( 𝑛−1) 1− ,( 𝑛−1)
2 2

Se presenta la figura 2.12 para ayudar a interpretar el intervalo dado por (2.27):

Instituto Tecnológico de Colima Página 55


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

Figura 2.12 Intervalo de confianza de (1-α) para estimar σ² por medio de S2.

Y, para obtener un intervalo de confianza de (1-α) para la desviación estándar basta con
sacar raíces cuadradas a la expresión (2.27).

Ejemplo 2.13:

Un nuevo proceso fabrica cojinetes de bola con diámetro interior igual a 3 cm. Si se
considera que tiene distribución normal, determine un intervalo de confianza del 99% para la
varianza poblacional σ², si se toma una muestra aleatoria de 12 de estos cojinetes y midieron
sus diámetros interiores, que fueron: 3.00, 3.03, 2.99, 2.99, 3.02, 3.00, 2.99, 2.99, 2.97, 2.98,
3.02 y 3.01.

Solución. El intervalo se determina por (2.27):

(𝑛−1) 𝑆 2 (𝑛−1) 𝑆 2
< 𝜎2 <
𝜒2𝛼 𝜒2 𝛼
,( 𝑛−1) 1− ,( 𝑛−1)
2 2

Tenemos:

(1-α) = 0.99; α= 0.01, α/2 = 0.005, (1-α/2) = 0.995, y v = n-1 = 11

Por lo que, de la tabla A3: χ²0.005,11= 26.757; y χ²0.995,11= =2.603

Además, de los datos y calculando se tiene que S2 = 0.0003606,

Con lo cual, sustituyendo en (2.27):

11 ∗ 0.0003606 11 ∗ 0.0003606
≤ 𝜎2 ≤
26.757 2.603
Instituto Tecnológico de Colima Página 56
Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

El intervalo para la varianza σ² es:

𝟎. 𝟎𝟎𝟏𝟒𝟖𝟐 ≤ 𝝈𝟐 ≤ 𝟎. 𝟎𝟎𝟏𝟓𝟐𝟒

Y, el intervalo para la desviación estándar σ es:

0.0385 cm ≤ σ ≤ 0.0390 cm

Nota: En el intervalo de confianza para la varianza, el punto medio del intervalo


(0.001503) no coincide con el estimador puntual S2 = 0.003606, debido a la asimetría de
la distribución chi cuadrado▪

EJERCICIOS SECCIÓN 2.9: INTERVALOS DE CONFIANZA PARA LA VARIANZA, σ2.

2.57 En una muestra aleatoria de 30 focos, la desviación estándar de la duración de los focos
fue de 100 horas. Determine un intervalo de confianza del 98 % para la desviación
estándar, σ, de la duración de los focos.

2.58 Un ingeniero del departamento de calidad midió el espesor de 26 hojas de vidrio de


construcción. La media de su muestra es de 𝑥̅ = 6.02 mm y la desviación estándar fue s
= 0.01 mm. Encuentre un intervalo de confianza del 95 % para la desviación estándar, σ,
del espesor.

2.59 Concretos Kolima hace pruebas de la resistencia a la compresión del concreto. Hoy
prueban aleatoriamente 10 especímenes y obtienen las siguientes resistencias:

2220 2240 2254 2208 2222


2300 2280 2264 2320 2298

Construya un intervalo de confianza del 99 % para la desviación estándar de la


resistencia a la compresión.

2.60 Una universidad aplica una prueba del nivel de matemáticas a todos los alumnos de
primer ingreso. Si 64 estudiantes, seleccionados al azar en este periodo, tardaron en
promedio 40 minutos en resolver la prueba, con una varianza de 10 minutos², construya
el intervalo de confianza del 90% para la desviación estándar verdadera del tiempo que
tardan los estudiantes en resolver el examen.

2.61 En un proceso químico se fabrica un cierto polímero. Diariamente se hacen mediciones


de viscosidad en cada turno. Las siguientes 16 mediciones son las de un turno.
Determine un intervalo de confianza del 95 % para la desviación estándar.

Instituto Tecnológico de Colima Página 57


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

714 708 766 750 735 751 739 729


749 785 746 732 730 737 732 715

2.62 La longitud de los cráneos de 10 esqueletos fósiles de una especie de aves extinta tiene
una media de 5.68 cm y una desviación estándar de 0.29 cm Suponiendo que estas
mediciones están normalmente distribuidas, construya un intervalo de confianza del
95% para estimar la varianza verdadera de la longitud de los cráneos de la especie de
aves dada.

2.63 Una máquina produce láminas de plástico y se espera tener una cierta variación aleatoria
nominal en el espesor de las láminas. Para determinar que la variación del espesor se
encuentre dentro de ciertos límites, cada día se seleccionan en forma aleatoria 12
láminas de plástico y se mide su espesor en milímetros. Los datos que se obtuvieron hoy
son los siguientes:

12.3 11.9 12.2 12.8 12.1 11.7


11.8 12.6, 12.0 12.5 12.3 12.7

Si se supone que el espesor es una variable aleatoria con distribución normal, obtenga un
intervalo de confianza del 99% para estimar la varianza desconocida del espesor. Si no
es aceptable una varianza mayor de 0.9 mm, ¿existe alguna razón para preocuparse con
base en esta evidencia?

2.64 La tienda de alimentos “Soriano” adquirió 2,000 cajas de cereal para el desayuno de 680
gramos cada una. Una muestra aleatoria de 51 de estas cajas tuvo un peso neto
promedio de 670 gramos y una desviación estándar de 8 gramos.
a) Estime la desviación estándar de la población.
b) Determine un intervalo de confianza del 95% para la desviación estándar del peso
neto medio, si el fabricante del cereal asegura que la desviación estándar de su
producto es de 5 gramos.
2.65 El administrador de un hotel de playa en Manzanillo desea conocer la ocupación de
habitaciones diaria promedio de la temporada baja en primavera. La siguiente tabla
presenta el número de habitaciones ocupadas en 21 días elegidos aleatoriamente en
dicha temporada. Estime la desviación estándar, σ, para esta temporada.

44 47 52 50 54 57 64 63 50 61 44

51 50 50 50 52 58 62 60 57 63

Instituto Tecnológico de Colima Página 58


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

2.10 INTERVALO DE CONFIANZA PARA RAZONES DE DOS


VARIANZAS.

Si S1² y S2² son las varianzas de dos muestras aleatorias independientes de tamaño n1 y
n2 tomadas de dos poblaciones normales, entonces, el cociente (o razón) de dos varianzas
tiene una distribución muestral F con v1 = n1-1 y v2 = n2-1 grados de libertad:

𝑆12 𝜎22
𝐹 = (2.28)
𝑆22 𝜎12

Entonces, para construir un intervalo de confianza de (1-α) para la relación de dos


varianzas, sustituimos la expresión de F en:

𝑝 (𝐹1−𝛼, 𝑛1 −1,𝑛2 −1
≤ F ≤ 𝐹𝛼 , 𝑛1 −1,𝑛2 −1
)= 1− 𝛼
2 2

𝑆12 𝜎22
𝑝 (𝐹1−𝛼, 𝑛1 −1,𝑛2 −1
≤ 2 2 ≤ 𝐹𝛼, 𝑛1 −1,𝑛2 −1
)=1− 𝛼
2 𝑆2 𝜎1 2

Manipulando esta expresión y considerando que:


1
𝐹(1−𝛼), 𝑣2, 𝑣1 = (2.29)
𝐹𝛼, 𝑣1, 𝑣2

se llega al siguiente:

Teorema: Si 𝑆12 y 𝑆22 son las varianzas de muestras aleatorias independientes de


tamaños n1 y n2, tomadas aleatoriamente de poblaciones normales, y que tienen varianzas
desconocidas 𝜎12 y 𝜎22 , entonces un intervalo de confianza del (1-α)100% para el cociente
𝜎12 / 𝜎22 está dado por:

𝑺𝟐𝟏 𝟏 𝝈𝟐𝟏 𝑺𝟐𝟏


∗ ≤ ≤ ∗ 𝑭𝜶,𝒗𝟐,𝒗𝟏 _________ (2.30)
𝑺𝟐𝟐 𝑭𝜶,𝒗 ,𝒗 𝝈𝟐𝟐 𝑺𝟐𝟐 𝟐
𝟐 𝟏 𝟐

Intervalo que la siguiente figura 2.13 ayuda a visualizar:

Instituto Tecnológico de Colima Página 59


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

Figura 2.13: Intervalo de confianza para 𝜎12 / 𝜎22 , con base en 𝑆12 /𝑆22 .

Es conveniente considerar colocar la muestra con la mayor varianza en el numerador. Y,


para obtener límites de confianza del (1-α) 100% para σ1/σ2 es suficiente obtener la raíz
cuadrada de la expresión (2.30).

Ejemplo 2.14:

Considere dos marcas de cigarrillos con el siguiente contenido de nicotina (en mg.):

Marca A Marca B
ni 13 11
𝑆𝑖 0.6 0.8

Si los conjuntos de datos provienen de muestras tomadas al azar de poblaciones


normales con varianzas desconocidas, construya un intervalo de confianza del 98% para
𝝈𝟐𝑩
la razón de las dos varianzas de los contenidos de nicotina de las dos marcas de
𝝈𝟐𝑨
cigarrillos.

Solución:

Definimos primero que el numerador es la varianza de la marca B (por ser la mayor),


con v1 = 10 gl y el denominador es la varianza de la marca A, con v2 = 12.

El intervalo se obtiene por (2.30):

𝑆12 1 𝝈𝟐𝟏 𝑆12


2 ∗ 𝐹𝛼 ≤ 𝟐 ≤ 2 ∗ 𝐹𝛼,𝑣 ,𝑣
𝑆2 ,𝑣 ,𝑣 𝝈𝟐 𝑆2 2 2 1
2 1 2

Tenemos que la confianza es (1-α) = 0.98, ⟹ α = 0.02 y, α/2 = 0.01:

Instituto Tecnológico de Colima Página 60


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

Así F𝛼,𝑣1 ,𝑣2 = F0.01, 10,12 = 4.30 y F𝛼,𝑣2,𝑣1 = F0.01, 12,10 = 4.71
2 2

Sustituyendo valores, tenemos:


0.82 1 𝝈𝟐𝑩 0.82
∗ ≤ 𝟐 ≤ ∗ 4.71
0.62 4.30 𝝈𝑨 0.62

𝝈𝟐𝑩
0.413 ≤ 𝟐 ≤ 8.373
𝝈𝑨

Y el intervalo de confianza del 98% para la razón de desviaciones estándar es:

𝝈𝑩
0.643 ≤ ≤ 2.894 mg.▪
𝝈𝑨

𝝈𝟐
Si se hubiera construido la relación de la varianza de la marca A a la marca B, 𝝈𝟐𝑨 , el
𝑩
intervalo de confianza se tendría que ahora el numerador es A, por lo que v1 = 12 y v2 = 10.

Así F𝛼,𝑣1 ,𝑣2 = F0.01, 12,10 = 4.71 y F𝛼,𝑣2,𝑣1 = F0.01, 10,12 = 4.30
2 2

𝑆12 1 𝝈𝟐𝟏 𝑆12


y, por (2.30): ∗ ≤ ≤ ∗ 𝐹𝛼,𝑣2 ,𝑣1
𝑆2 𝐹
2 𝛼 𝝈𝟐𝟐 𝑆22 2
,𝑣 ,𝑣
2 1 2

0.62 1 𝝈𝟐𝑨 0.62


∗ ≤ ≤ ∗ 4.30
0.82 4.71 𝝈𝟐𝑩 0.82

𝜎𝐴2
0.12 ≤ ≤ 2.42
𝜎𝐵2

𝝈𝑨
Y la razón de desviaciones estándar es: 0.346 ≤ ≤ 1.556 mg.▪
𝝈𝑩

Instituto Tecnológico de Colima Página 61


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

EJERCICIOS PARA LA SECCION 2.10

2.66 Se toman dos muestras aleatorias de tamaño n1 = 11 y n2 = 16 de dos líneas de coples.


Las varianzas muestrales son 𝑆12 = 0.30 y 𝑆22 = 0.36. Construya un intervalo de confianza
del 90 % para estimar la razón de varianzas 𝝈𝟐𝟐 /𝝈𝟐𝟏 .

2.67 La pintura para carreteras se surte en dos colores: blanco y amarillo. Interesa medir la
diferencia en tiempos de secado. Se toman mediciones de ambos tipos de pintura,
resultando los siguientes tiempos de secado, en minutos:

Blanca 122 124 133 141 109 122 125 112


Amarilla 128 125 117 127 110 132 127 120 132 124

Determine un intervalo de confianza de 95 % para la razón de las desviaciones estándar


de los tiempos de secado de las pinturas.

2.68 De una muestra tomada al azar de una población normal de tamaño n1 = 25 se obtuvo
que s1 = 5 y de otra muestra aleatoria de tamaño n2 = 36 tomada de una población
normal diferente se tuvo una s2 = 3.6. Determine un intervalo de confianza del 90% para
𝝈𝟐𝟏 /𝝈𝟐𝟐 .

2.69 Un fabricante de telas está interesado en investigar la relación de desviaciones estándar


de resistencia a la ruptura de los hilos que compra. De una muestra aleatoria de 31
probetas de cada proveedor resulta: s1 = 6 psi. s2 = 4 psi. Estime un intervalo de
confianza del 95 % para la razón de desviaciones estándar 𝝈𝟏 /𝝈𝟐 de los dos hilos.

2.70 Un estudio de dos tipos de equipo de fotocopiado demuestra que 16 fallas del primer tipo
de equipo tardaron un promedio de 91.2 minutos en ser reparadas, con una desviación
estándar de 21 minutos; mientras que 21 fallas del segundo tipo de equipo tardaron un
promedio de 98.6 minutos en repararse con una desviación estándar de 18 minutos.
Obtenga un intervalo de confianza del 98% de la razón de desviaciones estándar 𝝈𝟏 /𝝈𝟐
de los dos tipos de equipo de fotocopiado.

2.71 Se compara el rendimiento de dos vehículos, A y B, en kilómetros por litro. Se realizan


21 experimentos con el vehículo A, y 25 con el B. La gasolina que se utiliza y las demás
condiciones son las mismas para ambos autos. El rendimiento promedio de gasolina
para el auto A fue de 15.32 km/lt con desviación estándar 2.54 y el auto B tuvo un
promedio de 10.22 km/lt, con desviación estándar de 3.38. Encuentre un intervalo de
confianza de 95% para la razón de desviaciones estándar σB /σA del rendimiento de
combustible de los autos A y B.

2.72 Las siguientes son las capacidades de producción de calor del carbón extraído de dos
minas (en millones de calorías por tonelada):

Instituto Tecnológico de Colima Página 62


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

Mina Calor, (en millones de calorías por tonelada)


A 8600 8420 8590 8060 8130
B 7810 7990 8020 8370 7960

Suponiendo que los datos constituyen muestras aleatorias independientes tomadas de


poblaciones normales con varianzas iguales, construya un intervalo de confianza del
99% para la razón de las dos desviaciones estándar de la población.

2.73 Doce árboles de frutos cítricos maduros, seleccionados al azar de una variedad A de
ejemplares, tienen una altura media de 13.8 pies con una desviación estándar de 2.0 pies
y 16 árboles de frutos cítricos maduros seleccionados también al azar de otra variedad B,
tienen una altura media 12.9 pies con una desviación estándar de 3.5 pies. Suponiendo
que las dos muestras aleatorias se seleccionaron de poblaciones normales con varianzas
iguales, construya un intervalo de confianza del 98% para la razón σB /σA de las dos
varianzas de la población.

Instituto Tecnológico de Colima Página 63


Estadística Inferencial I II Unidad: Inferencia Estadística: Estimación

Instituto Tecnológico de Colima Página 64

También podría gustarte