Está en la página 1de 11

INSTITUCION UNIVERSITARIA “ANTONIO JOSÉ CAMACHO”

Asignatura: ESTADÍSTICA APLICADA 2016-S2


Autor: Rubén Darío Corrales

GUIA 3 ESTIMACIÓN POR INTERVALOS DE CONFIANZA

Recordemos la noción del TEOREMA DEL LÍMITE CENTRAL para abordar en que están cimentados todos los
supuestos con que elaboramos los intervalos de confianza.

También se debe recordar que una estimación la realizamos acerca de los parámetros desconocidos de una
población, esta es la razón fundamental por la cual se hace inferencia estadística.

¿Porque se debe utilizar intervalos de confianza para realizar estimaciones de los parámetros y no simplemente las
estimaciones de estos parámetros?

Dado que los estimadores puntuales pocas veces serán iguales a los parámetros que tratan de estimar,
podemos darnos una mayor libertad en su estimación mediante el uso de la "estimación por intervalos"
o "intervalos de confianza".

Un intervalo de confianza es un intervalo estimado dentro del cual se espera encontrar el valor de un
parámetro.

Esto se puede corroborar con el siguiente experimento:


Sea 4, 6, 8 tres elementos que de una población de tamaño 3 (N = 3), µ = 6
Si seleccionamos todas las posibles muestras de tamaño 2 (n = 2) y calculamos la media en cada muestra, Por
ejemplo:
Muestra M e d i a
Muestral (x́)
4,4 4
4,6 5
4,8 6
6,4 5
6,6 6
6,8 7
8,4 6
8,6 7
8,8 8

Como se puede observar, en todas las posibles realizaciones de las muestras de tamaño 2, solo en tres de las
nueve realizaciones de la muestra, es igual el estimador al parámetros, es decir para este ejercicio la
probabilidad de que el estimador sea igual al parámetro basando la inferencia solo en el estimador puntual de
la media es del 33.3% (P = 3/9)
Se debe tener en cuenta que en la práctica solo se puede tener una realización de la muestra y esta es escogida
por medio de métodos aleatorios, entonces en general hay una probabilidad más grande de equivocarse
cuando la inferencia se lleva a cabo solo con una estimación puntual.
Definición: Sea 1- una probabilidad especificada alta y sean Z1 y Z2, dos estadísticos tales que P[Z1
   Z2] = 1-

El intervalo [Z1, Z2] recibe el nombre de Intervalo de Confianza del 100(1-)% para el parámetro
desconocido . Las cantidades Z1, Z2 reciben el nombre de Límites de confianza inferior y
superior, respectivamente, y (1-) es el Nivel de Confianza asociado con el intervalo.
(Para los casos que atañe con el cumplimiento de los objetivos planteados al inicio del curso puede
reemplazar por µ o por P como pará metros a estimar)

La interpretación de un intervalo de confianza radica en la interpretación de una probabilidad de largo


plazo, y es que, si se recopila un número grande de muestras aleatorias y se calcula un intervalo de
confianza del 100(1-)% para el parámetro  para cada una de las muestras, entonces el 100(1- )%
de esos intervalos contienen el valor verdadero de .

De acuerdo con la interpretación, el nivel de confianza del 100(1- )% no es tanto un enunciado sobre
un intervalo particular sino que pertenece a lo que pasaría si se construyera un número grande de
intervalos semejantes.

La probabilidad es 1- de que el intervalo aleatorio contenga el verdadero valor del parámetro
desconocido . El parámetro  es una constante, aunque desconocida, y los intervalos Z1 y Z2 son
variables aleatorias.

1- se conoce como el nivel de confianza que se tiene, de que el parámetro de la población está contenido
en la realización de la muestra escogida aleatoriamente.

Construcción de un intervalo de confianza para la media de la Población

Ejemplo. Cálculo de un intervalo de confianza para , con varianza ² conocida.


Debemos encontrar dos estadísticos Z1 y Z2 tales que P[Z1    Z2] = 1-

1−α
α1 α2
Z1 µ Z2

El estadístico a usar corresponde a la media muestral x́ que es el mejor estimador de la media


poblacional . Sabemos que la media muestral x́ se distribuye normalmente con valor esperado  y
x́−μ
varianza ²/n, entonces la variable asociada será: Z= tiene una distribución normal estándar.
σ /√n
Esto se demuestra mediante el uso del TEOREMA DEL LÍMITE CENTRAL.

Por lo tanto, y si a y b son dos valores constantes tales que:

P(a < x́ < b) = 1 -  como lo vimos en la distribució n muestral para la media y conociendo que la
distribución de x́ , la probabilidad anterior se puede expresar como:
P ( σa−μ <
x́−μ b−μ
/√ n σ / √ n σ / √ n )
< =1−∝

x́−μ
Como la variable Z= tiene una distribución normal estándar, y la probabilidad es 1- , entonces
σ /√n
queda una probabilidad total de  para los dos extremos, la cual podemos dividir en dos partes, 1 y 2
tales que 1 + 2 = , 1 para el límite inferior y 2 para el límite superior. Si denotamos por Z α 1 y
Z1−α 2 los valores de la distribución normal que tienen probabilidades acumuladas de 1 y 1-2,
respectivamente, entonces la probabilidad dada en la ecuación anterior se puede escribir como:

x́−μ x́−μ
(
P Z 1−α 1 <
σ /√n )
<Z α 2 =1−∝ P −Z α 1 <
σ /√n(< Z α 2 =1−∝ )
x́−μ
Manipulando la parte inferior de la desigualdad −Z α 1 < para expresarla en términos de 
σ /√n
σ
obtenemos que es equivalente a μ< x́ +Z α 1 . En forma similar, manipulando la parte superior de la
√n
σ
desigualdad obtenemos que μ> x́−Z α 2 . Combinando los resultados anteriores, la ecuación anterior
√n
de la probabilidad se puede escribir como:

σ σ
(
P x́−Z α 2
√n
< μ< x́ + Z α 1
√n )
=1−∝ Por lo general , los valores1 y 2 son iguales a /2, por lo cual la
ecuación anterior queda como:

σ σ
(
P x́−Z α / 2
√n
< μ< x́+ Z α / 2
√n
=1−∝ )
Comparando la ecuación anterior con la definición de los intervalos de confianza vemos que los valores
σ σ
x́−Z α / 2 y x́ +Z α /2 corresponden a los límites de los intervalos de confianza Z1 y Z2 mencionados
√n √n
al definir lo que es un intervalo de confianza. Por lo tanto, el intervalo de confianza está dado por:

σ σ
[ x́−Z α
2 √n
, x́ + Z α
2 √n
]
Debe observarse que el intervalo de confianza es aleatorio, ya que sus límites dependen de x́ , que es
σ
una variable aleatoria. La longitud del intervalo es constante e igual a 2 Z α /2 , y lo que varía es el
√n
punto medio (se toma la media muestral como pivote). Si para un mismo nivel de confianza queremos
reducir el tamaño de intervalo, necesariamente tenemos que usar un tamaño de muestra mayor.

El error en la estimación de la media poblacional (o error de muestreo de la media), definido como


σ
|x́−μ| es igual a Z α /2 .
√n
INTERVALOS DE CONFIANZA PARA UNA PROPORCIÓN P
Para el intervalo de confianza para la proporción se toma en cuenta el mismo procedimiento que se
elaboró para el intervalo de confianza de la media con la diferencia que la estimación puntual y el error
estándar de estimación son diferentes.

Teorema. Si ^p es la proporción de observaciones que pertenecen a una clase de interés en una


muestra aleatoria de tamaño n, entonces un intervalo de confianza aproximado de 100(1- )% para la
verdadera proporción P de la población que pertenece a esta clase es:

^p (1− ^p ) ^p (1− ^p )
(
P ^p −Z α /2
√ n √
≤ P ≤ ^p +Z α /2
n ) =1−α Intervalo de confianza para la media poblacional
conVarianza desconocida y muestras pequeñas

Cuando la varianza de una población que se distribuye Normal no es conocida, y se tiene una muestra
de tamaño menor de 30 elementos, no se puede usar la distribución normal estándar, sino que en su
lugar se debe emplear la distribución t. Es decir, la variable T definida de la siguiente manera sigue una
distribución t con n-1 grados de libertad.

x́−μ
T= se distribuye T (n−1)
s/√n

Si x́ y s son la media muestral y la desviación estándar de una muestra tomada de una POBLACIÓN
CON DISTRIBUCIÓN NORMAL con varianza ² desconocida, entonces un intervalo de confianza (T1,T2)
del 100(1-)% para µ será aquel que cumpla que: P[T1    T2] = 1-

De nuevo el estadístico a usar corresponde a la media muestral x́ , entonces la variable asociada será
x́−μ
T= que tiene una distribución t con n-1 grados de libertad. Por lo tanto si a y b son dos valores
s /√n
constantes tales que P(a < x́ < b) = 1-lo cual a su vez puede expresarse como:

a−μ x́−μ b−μ


P ( < <
σ /√ n σ / √ n σ / √ n )
=1−∝

Si vamos a considerar intervalos de confianza simétricos (1 = 2 =/2), entonces la anterior


probabilidad puede escribirse como:

x́−μ
(
P −t n−1 ;α / 2 <
σ /√n )
<t n−1 ;α / 2 =1−∝

x́−μ
Manipulando la parte inferior de la desigualdad t n−1; α / 2< para expresarla en términos de 
s/ √ n
s
obtenemos que es equivalente a μ< x́ +t n−1; α /2
. En forma similar, manipulando la parte superior de la
√n
s
desigualdad obtenemos que μ> x́−t n−1 ;α / 2 . Combinando los resultados anteriores, la ecuación
√n
anterior de la probabilidad se puede escribir como:

s s
(
P x́−t n−1 ;α / 2
√n
< μ < x́+ t n−1 ;α /2
√n )
=1−∝

Comparando la ecuaciónanterior con la definición de losintervalos de confianza vemos que los valores
s s
x́−t n−1 ;α / 2 y x́ +t n−1 ;α /2 corresponden a los límites de los intervalos de confianza T1 y T2
√n √n
mencionados al definir lo que es un intervalo de confianza.

EJERCICIOS DE INTERVALOS DE CONFIANZA PARA LA MEDIA POBLACIONAL O LA PROPORCIÓN


POBLACIONAL PARA UN GRUPO
(Se debe tener la copia de la tabla t de student y la Z normal estándar)

Obtener fotocopia de la tabla t de student del libro de Probabilidad y estadística para ingeniería y ciencias octava
edición del autor walpole, myer, myer y ye
Páginas 753 y 754
Que está en la biblioteca de la institución
1. Una firma de transporte garantiza a sus clientes que los despachos de Cali a Cualquier parte del país promedian 5
días o menos, con una desviación estándar de 2 días. Un cliente en particular halla de una muestra de 36
despachos y observa que sus tiempos han promediado 6 días. Halle un intervalo de confianza del 95%, para
estimar el tiempo promedio de despachos. ¿Debería de rechazar la compañía el argumento de la firma de
transporte sobre que los envíos toman 5 días o menos?

R/= No dice que el tiempo de envío se distribuye normal, pero como n es > o igual a 30 (n=36) se asume
aproximadamente normal, ahora bien ¿se conoce la desviación o la varianza poblacional? Si, la desviación de la
población es 2 (fíjese que cuando se da ese dato todavía no han hablado del tamaño de la muestra, por eso se
asume poblacional),

Si se conoce la desviación poblacional se trabajará con la distribución Z normal estándar y por lo cual se utilizará
el siguiente intervalo:

σ σ
[ X̄−z α
2 √n
, X̄ + z α
2 √
n ]
¿Cuánto vale la media de la muestra? o sea X =6

El único valor que falta por definir es Z α/2, que lo define la confiabilidad del intervalo, la cual es del 95%

α α
2
2 95%
2.5% 2.5%
−z α zα
0 2 1−α 2

Z α/2 = en porcentaje será desde 0 hasta donde está Z α/2 pero positivo, por lo tanto el porcentaje es de 2.5%
+ 95% que en total es 97.5%, este valor se busca en la parte interna de la tabla Z normal estándar como
0.9750, encontrándose el valor de Z α/2 como 1.96.

Luego entonces el intervalo será:

6 +/- [1.96 * (2 / √36) ]

6 +/- [1.96 * 0.333)]

6 +/- [0.65268]

De ahí que el intervalo sea = El límite inferior = 6 – 0.65268 = 5.347


= El límite superior = 6 + 0.65268 = 6.653

Con una alta confiabilidad (o una confiabilidad del 95%) se puede decir que uno de los intervalos que contiene
el valor de la media de tiempo de envío poblacional estimado está entre 5.35 y 6.65 días, luego entonces el 5
(5 días) no está contenido, pero como dice que son 5 días o menos, el intervalo debería estar de 5 hacia
abajo.

Con una alta confiabilidad se puede decir que la firma de transporte no tiene la razón.

2. Una máquina despachadora de refrescos se ajusta de tal forma que la cantidad de refresco servido está
distribuido normal. Se verifica la máquina periódicamente, tomando una muestra de 10 refrescos y se calcula su
contenido promedio. Halle un intervalo de confianza del 95%, para la cantidad promedia de llenado las lecturas en
ml fueron: 226 226 232 227 225 228 225 228 229 230.

R/= como dice que la cantidad de refresco servido se distribuye normal (que es la variable aleatoria X de este
problema), pero como n es < a 30 (n=10) se asume normal, pero se utilizará la distribución t de student, por que
no se conoce la desviación o la varianza poblacional, y se debe estimar la desviación poblacional con la
desviación muestral S (la cual se halla con los 10 datos dados)

S = con la calculadora es X σ ,n-1 (recuerde utilizar el mode SD y luego por m+ introducir los datos)
Cuando halla introducido los 10 datos le da la tecla X σ ,n-1 para obtener S y la tecla X para obtener la media
muestral.

Por lo tanto n = 10
S = 2.27 ml
X = 227.6 ml

Como no se conoce la desviación poblacional y n< 30, se trabajará con la distribución t de student con n-1 grados
de libertad y por lo cual se utilizará el siguiente intervalo:

s s
[ X̄−t α
2 √n
, X̄ +t α
2 √
n ]
El único valor que falta por definir es t α/2 , que lo define la confiabilidad del intervalo, la cual es del 95%
De manera similar que con la distribución Z se procede con la distribución t

α α
2
2 95%
2.5% 2.5%
−t α tα
0 2 1−α 2

Sí la tabla trae valor superiores de cola (0.90, 0.95, 0.975, 0.99) se procede así

t α/2 = en porcentaje será desde 0 hasta donde está t α/2 pero positivo, por lo tanto el porcentaje es de 2.5%
+ 95% que en total es 97.5%,

Pero si la tabla trae valor inferiores de cola (0.10, 0.05, 0.025, 0.01) se procede así

t α/2 = en porcentaje será desde 0 hasta donde está - t α/2 negativo, por lo tanto el porcentaje es de 2.5% que
sería 2.5% solamente.

Este valor se busca en la parte interna de la tabla t de student como 0.975, con (n-1) grados de libertad (10-1
= 9) o se busca en la parte interna de la tabla t de student como 0.025, con (n-1) grados de libertad (10-1 =
9). En cualquiera de los dos casos encontrándose el valor de t α/2, n-1 como t 0.975, 9 o t 0.025,9 = 2.2622.

Luego entonces el intervalo será:

227.6 +/- [2.2622 * (2.27 / √10) ]


227.6 +/- [2.2622 * 0.7178)]

227.6 +/- [1.5979]

De ahí que el intervalo sea = El límite inferior = 227.6 – 1.5979 = 229.1979


= El límite superior = 227.6 + 1.5979 = 226.0021

Con una alta confiabilidad (o una confiabilidad del 95%) se puede decir que uno de los intervalos que contiene
el valor de la media de llenado de l refresco poblacional estimad está entre 229.1979 y 226.0021 ml, aquí en
este problema no nos piden verificar el llenado, sino estimar cuánto es el llenado promedio de los refrescos

Con una alta confiabilidad se puede decir que el llenado de los refrescos está entre 229.1979 y 226.0021 ml.

3. una investigación sobre hábitos y costumbres de los hogares de cierta comunidad se estableció que una quinta
parte de estos utilizan estufa de gas. Se tiene alguna razón para pensar que esta proporción es menor, ya que en
una muestra aleatoria de 1000 hogares en esta comunidad se encontró que 236 utilizan estufa de gas. ¿Que
conclusión se puede obtener, si se pide trabajar con un intervalo de confianza del 99%?

R/= No dice que la proporción de personas que prefieren estufa de gas (la cual es la variable aleatoria) se distribuye
normal, pero como n es > o igual a 30 (n=1000) se asume aproximadamente normal, ahora bien ¿Qué parámetro
nos interesa? La proporción poblacional, ¿se conoce la desviación o la varianza poblacional? no, pero se puede
estimar con la desviación de la proporción muestral, usando la información, así:

Como es proporción, entonces la desviación de la proporción muestral es √( ^p q^ )/n


Y cuánto vale ^p = los que cumplen / el total de evaluados = X / n = 236/1000 = 0.236, de ahí que q^ =1-
^p =
1 – 0.236 = 0.764, observe que aquí tocó hallar la proporción muestral y su complemento, pero hay casos en que
ya viene dado y no hay que hallarlo sino utilizarlo.

Luego entonces la desviación de la proporción muestral será =

√[(0.236)*(0.764)/1000] = √0.00018 = 0.0134277

Pero ¿cuánto es la proporción poblacional a verificar (P) si es cierta?, como nos dicen que en una investigación
anterior se obtuvo una 5ª parte de preferencia por la estufa de gas, lo que es lo mismo = 1/5 = 0.2 o sea el 20%,
de ahí que P = 0.2

Cuando es con proporciones se trabaja con la distribución Z normal estándar y por lo cual se utilizará el siguiente
intervalo:

p ( 1− p) p( 1− p )
p−z α
2
√ n
, p+ z α
2
√ n

Donde ^p es lo mismo que p


El único valor que falta por definir es Z α/2, que lo define la confiabilidad del intervalo, la cual es del 99%

α α
2
2 99%
0.5% 0.5%
−z α zα
0 2 1−α 2

Z α/2 = en porcentaje será desde 0 hasta donde está Z α/2 pero positivo, por lo tanto el porcentaje es de 0.5%
+ 99% que en total es 99.5%, este valor se busca en la parte interna de la tabla Z normal estándar como
0.9950, encontrándose el valor de Z α/2 como 2.575. (Que está en la mitad de 2.57 y 2.58)

Luego entonces el intervalo será:

0.236 +/- [2.575 * (√[(0.236)*(0.764)/1000])]

0.236 +/- [2.575 * 0.0134277)]

0.236 +/- [0.034576]

De ahí que el intervalo sea = El límite inferior = 0.236 – 0.034576 = 0.2014


= El límite superior = 0.236 + 0.034576 = 0.2706

Con una alta confiabilidad (o una confiabilidad del 99%) se puede decir que uno de los intervalos que contiene
el valor de la proporción poblacional de hogares que usan estufa de gas está entre 0.2014 y 0.2706, luego
entonces el 20% no está contenido en el intervalo, por lo tanto la proporción de hogares que usan estufa de
gas están por encima del 20% ( el intervalo debería contenerlo, para decir que si está en el 20%)

Con una alta confiabilidad se puede decir que la proporción es superior al 20%.

4. En un proceso de manufactura se produce un 20% de artículos defectuosos. El fabricante seguirá con el proceso
mientras el porcentaje de artículos defectuosos no sea significativamente más grande que la norma del 20%. Se
selecciona una muestra aleatoria de 100 artículos y se inspeccionan. Si salieron 30 artículos defectuosos. ¿Cuál
es la decisión correcta?, use un intervalo de confianza del 95%.

5. Una máquina automática de café, se diseño para servir 8 onzas de bebida por taza, con una desviación estándar
de 0.9 onzas. Un analista elige una muestra aleatoria de 36 tazas, para un servicio de pruebas para el
consumidor, la cual obtuvo un promedio de 7.80 onzas, con un intervalo de confianza del 90%, determine si el
diseño cumple con la especificación.

6. Una máquina que llena cajas de cereales, pone 375 gr. de cereal cuando funciona correctamente. La cantidad
colocada en la caja tiene una distribución normal, con una desviación estándar de 30 gr. El gerente de producción
rechazará el llenado sólo si hay pruebas de que la cantidad promedio de cereal puesta en cada caja es menor. Si
se selecciona una muestra aleatoria de 35 cajas y se obtiene un promedio de 368 gr, con un intervalo de
confianza del 95%, ¿será que se rechazará el llenado?

7. En años anteriores el 20% de los clientes indicó la preferencia por el tamaño especial de pizza. Con posterioridad a
una campaña publicitaria realizada en radio y televisión promoviendo dicho producto, se seleccionó una muestra de
400 clientes, en esta muestra el 22% de los clientes indicó preferencia por el producto. De acuerdo con estos
resultados y usando un intervalo de confianza del 98%, ¿podría decirse que la campaña publicitaria no fue o si fue
efectiva?

8. Un proveedor de remaches para aviones afirma que estos tienen una tensión promedio, la cual se distribuye
normal, con una media como mínimo de 200 kilogramos / fuerza y una desviación estándar de 30 kilogramos /
fuerza. Un fabricante duda de este valor promedio y toma una muestra aleatoria de 25 remaches encontrando una
media de 195 kilogramos / fuerza. Determine si el proveedor cumple con su afirmación, utilice un intervalo de
confianza del 95%.

9. La mayoría de piezas utilizadas en los motores de un avión tienen problemas de desgaste. Una pieza utilizada en
un motor de avión tiene una vida media de 1500 horas, la cual se distribuye aproximadamente normal. Con ánimo
de aumentar la vida media de esta pieza se ha utilizado un nuevo material. Se tomó una muestra de 15 de las
nuevas piezas encontrando una vida media de 1600 horas y una desviación estándar de 100 horas. ¿Ha
producido el nuevo material un cambio significativo en la vida media de las piezas? Use un intervalo de confianza
del 97%.

10. En un diario local se afirma que por lo menos el 70% de la población está de acuerdo con la gestión del presidente
de la república sobre el proceso de paz en Colombia. Se toma una muestra de 1000 ciudadanos mayores de 18
años encontrando una proporción a favor del 65%, defina si puede el diario sostener su afirmación, use un
intervalo de confianza del 90%.

11. Una maquina produce piezas cuyas longitudes se distribuyen normalmente con media 200 mm. Un supervisor
toma una muestra de ocho piezas, obteniendo los siguientes resultados: 210, 190, 205, 220, 200, 208, 198 y 215
mm. Pruebe que los datos de la muestra provienen de una población con media 200 mm. Use un intervalo de
confianza del 98%

12. La temperatura media de operación de un motor de avión durante vuelos de instrucción es de 190º F. Se prueban
25 motores de aviones idénticos y bajo las mismas condiciones de operación, encontrándose una temperatura
media de 193º F con desviación estándar de 3º F. ¿Se deben preocupar los pilotos que operan estos aviones
porque el motor se calienta?, utilice el intervalo de confianza del 95%.

13. Se registró el tiempo transcurrido entre la facturación y la recepción del pago, para una muestra de 100 clientes en
una empresa dada, la media y la desviación estándar son respectivamente: 39.1 días y 17.3 días. Obtenga un
intervalo de confianza del 90% para el tiempo medio entre la facturación y el pago e Interprételo.

14. Empresas anunciadoras de televisión consideran que su publicidad es entendida por la mayoría de los
televidentes, por lo cual para verificar dicha consideración se entrevistaron a 2300 televidentes de los cuales 1914
no entendían la publicidad de dichos anunciantes, con un intervalo de confianza del 93% estime que porcentaje de
televidentes si entienden la publicidad de los anunciantes.

Intervalo de confianza para la proporción


Intervalos de confianza para la media: Con la distribución Z normal estándar
Con la distribución Z normal estándar
p ( 1− p) p( 1− p )

[ X̄−z α
σ
n
, X̄ + z α
σ
n ]
p−z α
2
√ n
, p+ z α
2
√ n

2 √ 2 √
Tamaño de muestra Tamaño de muestra para
s s para estimar µ estimar P

[ X̄−z α
2 √n
, X̄ + z α
2 √
n ] z σ
2

( )
2
z α P(1−P )
Con la distribución t de student

[ X̄−t α
2
s
√n
, X̄ +t α
2 √
s
n ] ( ) α
2

e
2

e2
Población infinita Población infinita

Tamaño de muestra para poblaciones finitas

n = n0 / (1+ (n0 /N))

Con N tamaño de la población


n0 = el valor de n obtenido para poblaciones infinitas
e = error permisible, si es para la media es en valores absolutos, pero si es para la proporción es en valores
porcentuales.
Z α/2 = define la confiabilidad

También podría gustarte