Está en la página 1de 24

FACULTAD DE INGENIERÍA Y ARQUITECTURA

CARRERA DE INGENIERÍA INDUSTRIAL / INGENIERÍA DE SISTEMAS

Intervalos de Confianza

ESTADÍSTICA Y PROBABILIDAD
Profesora: MSc. Vilma S. Romero Romero
2022-1 | 04-07-2022
Introducción
• Estimación Puntual, la estimación del parámetro de interés es mediante
un único valor.
 ¿Qué tan precisa es la estimación?
 ¿Cuánto es el error que se comete en la estimación?
• Estimación por Intervalo, la estimación está dada por un conjunto de
valores que conforman un intervalo, el cual se confía razonablemente que
captura el valor desconocido del parámetro. Los límites del intervalo son
calculados a partir de la muestra.

Estimación puntual

Estimación por intervalo 9.5 18.5


Límite inferior Límite superior
Intervalo de Confianza
para la Media Poblacional
Esquema General
Se considera una muestra aleatoria seleccionada de una población
con distribución normal que posee media y varianza

 Caso 1: Varianza poblacional () es conocida.


 Caso 2: Varianza poblacional () es desconocida.
Caso 1: Varianza poblacional () es conocida

Donde:
 : Media muestral
: Valor crítico. Valor Z que proporciona una probabilidad acumulada
de (1-) en la distribución normal estándar.
 : Desviación estándar poblacional
 n: Tamaño de la muestra
 1- : Nivel de confianza
Características del IC ¿Nivel de confianza?
 Si el tamaño de muestra aumenta,
entonces el error de estimación
disminuye. En consecuencia, la longitud
del intervalo disminuye.
*Error de estimación (Margen de error) 𝜇

 Si nivel de confianza aumenta,


entonces el error de estimación
aumenta. En consecuencia, la longitud
del intervalo aumenta. IC que no captura el valor
real del parámetro.
Ilustración del significado del nivel de confianza.
 La longitud del IC es una medida de la En los IC repetidos, la proporción de todos los intervalos de
precisión de la estimación. confianza del 95% que capturan el valor real de es 0.95.
Imagen adaptada de Kokoska (2015).
Ejemplo 1
Construya un intervalo de confianza del 95% para estimar la media
poblacional de una distribución normal dada la siguiente información:

= 300 = 55 n = 250

Solución:
 Nivel de confianza: 1- = 95% 1- = 0.95 = 0.05 y (1- ) = 0.975
 = = qnorm(0.975,0,1) = 1.959964 1.96
 IC al 95%: =
 Interpretación: Se tiene un 95% de confianza de que el intervalo
(293.18, 306.82) captura el valor de la media poblacional.
En R (Datos resumidos)
library(TeachingDemos)
z.test(300, stdev = 55, n =250, conf.level = 0.95)
##
Nivel de confianza
## One Sample z-test Tamaño de muestra
Media muestral
## Desviación estándar poblacional
## data: 300
## z = 86.244, n = 250.0000, Std. Dev. = 55.0000, Std. Dev. of the sample
## mean = 3.4785, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## 293.1823 306.8177 IC al 95%
## sample estimates:
## mean of 300
## 300
Ejemplo 2
Una muestra aleatoria de tamaño 9 tomada de una población con distribución
normal con una varianza poblacional de 25 registra los siguientes valores:

53 46 55 45 44 52 46 60 49

Utilice los valores de la muestra para construir un intervalo de confianza del


90% para la media de la población.
En R (Vector de datos)
# Ingreso de datos
x <- c(53,46,55,45,44,52,46,60,49)

# IC al 90%
library(TeachingDemos)
z.test(x, stdev= 5, conf.level= 0.90)
## Nivel de confianza
Vector de datos ## One Sample z-test Desviación estándar poblacional
##
## data: x
## z = 30, n = 9.0000, Std. Dev. = 5.0000, Std. Dev. of the sample mean =
## 1.6667, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
IC al 90%
## 90 percent confidence interval:  Interpretación: Con 90% de confianza,
## 47.25858 52.74142 se puede afirmar que el intervalo (47.26,
52.74) captura el valor de la media
## sample estimates:
poblacional.
## mean of x
## 50
Ejemplo 3
Se desea estudiar el rendimiento de un proceso químico. Por experiencia
previa, se sabe que el rendimiento tiene una distribución normal con
desviación estándar poblacional = 3. Los últimos cinco días de funcionamiento
de la planta dieron como resultado los siguientes porcentajes de rendimiento:

91.60 88.75 90.82 88.90 91.65

a) Estime un intervalo de confianza del 96% sobre el verdadero rendimiento


promedio.
b) La planta sugiere realizar una reingeniería del proceso si el porcentaje de
rendimiento es inferior a 80%. ¿Hay alguna evidencia que sugiera que la
planta lleve a cabo la reingeniería del proceso?
Solución:

x <- c(91.60,88.75,90.82,88.90,91.65) a) Con un 96% de confianza, se puede


z.test(x, stdev = 3, conf.level = 0.96) afirmar que el verdadero rendimiento
## promedio es capturado por el intervalo
## One Sample z-test (87.589, 93.099).
##
## data: x
b) No. El intervalo de confianza estimado en
a) muestra que el verdadero rendimiento
## z = 67.338, n = 5.0000, Std. Dev. = 3.0000, Std. Dev. of the sample
promedio es un porcentaje superior. Por
## mean = 1.3416, p-value < 2.2e-16
lo tanto, no hay evidencia que sugiera que
## alternative hypothesis: true mean is not equal to 0 la planta debe realizar la reingeniería del
## 96 percent confidence interval: proceso, al 96% de confianza.
## 87.58861 93.09939
## sample estimates:
## mean of x
## 90.344
Tamaño de muestra para estimar
¿Cuál debe ser el tamaño de muestra necesario para que fijado un nivel de
confianza se alcance una precisión (longitud) deseada en el intervalo?

 El máximo error que se puede cometer es:

 Si se fija este máximo error como E, entonces:

 Despejando n, tenemos que el tamaño de la muestra se obtiene como:


Ejemplo 4
Se desea tener una estimación de los salarios mensuales, en soles, de los
empleados de una determinada fábrica. Se sabe por registros históricos que
=300 soles. ¿Cuál debe ser el tamaño de muestra necesario de empleados a
seleccionar si se desea tener un margen de error no superior a 55 soles con
una confianza del 95%?

Solución:
 = = qnorm(0.975,0,1) = 1.959964 1.96
 n = = = 114.2955 115

 Respuesta: Se debe seleccionar como mínimo 115 empleados.


En R
library(samplingbook)
sample.size.mean(e = 55, S = 300, level = 0.95)
Nivel de confianza
##
Desviación estándar poblacional
## sample.size.mean object: Sample size for mean estimate
Margen de error
## Without finite population correction: N=Inf, precision e=55 and standard
deviation S=300
##
## Sample size needed: 115
n = 115 empleados
Continúa el ejemplo 4
¿Cuál debe ser el tamaño de muestra necesario de empleados a seleccionar si
la longitud del intervalo de confianza al 98% debe ser 70 soles?

Solución: Como la longitud del intervalo es 70 soles E = 35


 n = = (qnorm(0.99,0,1)*300/35)^2 = 397.6086 398

library(samplingbook)
sample.size.mean(e = 35, S = 300, level = 0.98)  Respuesta: Se debe seleccionar
como mínimo 398 empleados.
##
## sample.size.mean object: Sample size for mean estimate
## Without finite population correction: N=Inf, precision e=35 and
standard deviation S=300
##
## Sample size needed: 398
Caso 2: Varianza poblacional () es desconocida

Donde:
 : Media muestral
 : Valor crítico. Valor t que proporciona una probabilidad acumulada
de (1-) en la distribución t-student con (n-1) grados de libertad.
 : Desviación estándar muestral
 n: Tamaño de la muestra
 1- : Nivel de confianza
Ejemplo 5
Cierta establecimiento de comida realiza delivery de sus pedidos sin cobro
alguno. Sin embargo, los clientes suelen dar una propina a la persona que
entrega el pedido. El dueño del local está interesado en estimar el ingreso
medio de propinas por entrega. Para esto, ha seleccionado una muestra
aleatoria simple de 12 entregas y ha registrado las propinas, en soles,
recibidas por la persona encargada de la entrega:

7 7.5 5 6 8.5 2.5 10 5 4.5 0 9 3

Construir un intervalo de confianza del 97% para estimar el ingreso medio de


propinas por entrega. Asumir que la distribución de las propinas sigue una
distribución normal.
En R
# Ingreso de datos
x <- c(7,7.5,5,6,8.5,2.5,10,5,4.5,0,9,3)

# IC al 97%
t.test(x, conf.level = 0.97)
##
Nivel de confianza
## One Sample t-test
Vector de datos ##
## data: x
## t = 6.6914, df = 11, p-value = 3.415e-05
## alternative hypothesis: true mean is not equal to 0
## 97 percent confidence interval: IC al 97%
## 3.557423 7.775910
## sample estimates:  Interpretación: Con 97% de confianza, se puede
afirmar que el intervalo (S/.3.56, S/.7.78) captura el
## mean of x valor real del ingreso medio de propina por entrega.
## 5.666667
Ejemplo 6
El consumo de energía de cierta marca de lavadora está relacionado a la
duración de cada ciclo de lavado. En una muestra aleatoria de 21 lavadoras se
encontró una duración promedio de 37.8 minutos y una desviación estándar
de 5.9 minutos.

a) Asumiendo que los tiempos de lavado de cada ciclo siguen una distribución
normal, encuentre un intervalo de confianza del 99% para el tiempo medio
por ciclo de lavado.
b) La compañía que comercializa las lavadoras afirma que el tiempo medio
por ciclo de lavado es de 30 minutos. ¿Hay alguna evidencia que sugiera
que esto es falso? Justifique su respuesta usando lo obtenido en a).
Solución:
Parte a)
 : Tiempo medio por ciclo de lavado, en minutos.
 Nivel de confianza: 1- = 99% 1- = 0.99 = 0.01 y (1- ) = 0.995
 == qt(0.995,20) = 2.84534
 IC al 99%: = (34.14, 41.46)

 En R: 37.8-qt(0.995,20)*5.9/sqrt(21); 37.8+qt(0.995,20)*5.9/sqrt(21)

 Interpretación: Se tiene un 99% de confianza de que el intervalo (34.14, 41.46)


captura el valor real del tiempo medio por ciclo de lavado.

Parte b)
Sí. La afirmación hecha por la compañía es falsa, ya que el intervalo de confianza
obtenido en a) no contiene el valor de 30 min.
Ejemplo 7
“Lima Trek” es un fabricante líder de bicicletas de montaña, especialmente
diseñado para durabilidad y rendimiento. Se obtuvo una muestra aleatoria de
bicicletas montañeras y se registró el peso (en kg) de cada una, como se
muestra a continuación:

11.75 12.30 12.10 13.58 12.20 12.27 10.85 12.16


13.24 11.34 9.50 7.37 7.23 7.45 7.62

a) Asumiendo que la distribución de los pesos es normal, encontrar e


interpretar un intervalo de confianza del 96% para el peso promedio de las
bicicletas montañeras de “Lima Trek”.
b) “Lima Trek” afirma tener las bicicletas montañeras más ligeras del
mercado, con un peso promedio de 10 kg. Usando el intervalo de confianza
obtenido en la parte a), ¿está de acuerdo con esta afirmación?
Solución:
x <- c(11.75,12.30,12.10,13.58,12.20,12.27,10.85,12.16, a) Con un 96% de confianza, se puede
13.24,11.34,9.50,7.37,7.23,7.45,7.62) afirmar que el intervalo (9.40, 12.06)
t.test(x, conf.level = 0.96)
captura el verdadero valor del peso
##
promedio de las bicicletas montañeras
## One Sample t-test de “Lima Trek”.
##
## data: x b) Sí, ya que 10 está incluido en el
## t = 18.294, df = 14, p-value = 3.588e-11 intervalo de confianza estimado en a).
## alternative hypothesis: true mean is not equal to 0
## 96 percent confidence interval:
## 9.402817 12.058516
## sample estimates:
## mean of x
## 10.73067
Referencias
1. Kokoska, S. (2015). Introductory Statistics: A Problem-Sollving Approach. (2nd ed.) W. H.
Freeman and Company

2. Millones, R. et al. (2016). Estadística Aplicada en la Ingeniería y los negocios. (1ra. ed.)
Lima: Fondo Editorial de la Universidad de Lima. Código Biblioteca U.Lima: 519.5 E7

3. Montgomery. D. and Runger, G. (2013). Applied Statistics and Probability for Engineers.
(6th ed.) John Wiley & Sons, Inc.

También podría gustarte