Está en la página 1de 14

Unidad 1 / Escenario 2

Lectura Fundamental

Intervalos de confianza

Contenido

1 Introducción

2 Distribución muestral para la media, x̄

3 Distribución muestral para la proporción

4 Distribución muestral de la varianza

5 Intervalo de confianza para una muestra

Referencias

Palabras Claves: intervalo, nivel de confianza, margen de error.


1. Introducción

Para cada uno de los párametros en la población existe su equivalente en la muestra, en la siguiente tabla aparece
dicha relación:

Tabla 1: Parámetros y estimadores de la media y la proporción.


Población (parámetro) Muestra (estimador)
µ x̄
p p̂
Fuente: elaboración propia

Las estimaciones que se hacen cuando se toma una muestra pueden arrojar, o no, resultados con un valor igual
al del párametro en la población. Por ejemplo, a continuación se muestra una población de cuatro personas a las
que se les preguntó la cantidad de dinero que gastan diariamente en transporte.

Tabla 2: Dinero invertido en transporte.


Persona Dinero COP
1 10.000
2 12.000
3 12.000
4 10.000
Fuente: elaboración propia

Si se toma la muestra con los datos 1 y 2 el promedio de la población seria igual al promedio de la muestra, es
decir, µ = x̄ = 11.000, mientras que si tenemos los datos 2 y 3 mu = 11.000 6= x̄ = 12.000. Por otro lado, como en
una muestra aleatoria el promedio puede cambiar cada vez que se selecciona la muestra, entonces, los estimadores
se comportan como una variable aleatoria, y como consecuencia de esto, cada uno de ellos tiene una distribución
muestral (Triola, 2004).

2. Distribución muestral para la media, x̄

La distribución muestral para la media es la siguiente:

X̄ ∼ N (µ; σ 2 /n)
Que corresponde a una distribución normal con media µ y varianza 2
q σ /n (Anderson, Sweeney, & Williams, 2008),
−n
es decir, E(X̄) = µ y σx̄ = √σn para población infinita y σx̄ = √σn NN −1 para población finita.

POLITÉCNICO GRANCOLOMBIANO 1
Figura 1: Distribución de la media muestral.
Fuente: elaboración propia

Usualmente se utiliza dicha distribución en alguno de los siguientes escenarios:

1. La probabilidad de que la variable aleatoria X̄ sea menor o igual que un valor x¯1 P (X̄ ≤ x¯1 )

Figura 2: Distribución de la media muestral para P (X̄ ≤ x¯1).


Fuente: elaboración propia

2. La probabilidad de que la variable aleatoria X̄ sea mayor o igual que un valor x¯1 P (X̄ ≥ x¯1 )

POLITÉCNICO GRANCOLOMBIANO 2
Figura 3: Distribución de la media muestral para P (X̄ ≥ x¯1) .
Fuente: elaboración propia

3. La probabilidad de que la variable aleatoria X̄ este entre dos valores x¯1 , x¯2 .

P (x¯1 ≤ X̄ ≤ x¯2 )

Figura 4: Distribución de la media muestral para P (x¯1 ≤ X̄ ≤ x¯2 ).


Fuente: elaboración propia

Ejemplos

1. Para la construcción de una carretera nacional se require material granulado, se sabe que el costo en millones
(COP) por metro cúbico tiene una distribución normal de la siguiente manera X ∼ N (0.6; 2) asumiendo que
a través de una muestra de tamaño 49 se utiliza x̄ como estimador para µ calcule:

a) P (X̄ ≤ 1) Algebraicamente se resuleve ası́:


Partiendo de P (X̄ ≤ 1) tenemos que:
!
X̄ − µ 1−µ
P ≤
√σ √σ
n n

Cabe resaltar que:

POLITÉCNICO GRANCOLOMBIANO 3
X̄ − µ
= Z ∼ N (0, 1)
√σ
n


Reeemplazando por µ = 0.6, σ = 2 y n = 49.
!
1 − 0.6
P Z≤ √ = P (Z ≤ 1.98) = 0.98
2
7

En excel se resuelve ası́:

Figura 5: Captura de pantalla de solución en excel.


Fuente: elaboración propia

b) P (X̄ ≥ 0.3)
En este caso:
P (X̄ ≥ 0.3) = 1 − P (X̄ ≤ 0.3)
De donde:
1 − P (Z ≤ −1.48) = 1 − 0.07 = 0.93

En excel se resuelve ası́:

Figura 6: Pantallazo solución en excel.


Fuente: elaboración propia

2. El precio en COP de un activo finaciero sigue una distribución normal como sigue X ∼ N (30000; 10000000)
con base en una compra que se hace de 40 acciones se quiere observar cual es la probabilidad de:

a) P (X̄ ≤ 29000)
Algebraicamente se resuelve ası́:
Partiendo de P (X̄ ≤ 29000) tenemos que:
!
X̄ − µ 1−µ
P ≤
√σ √σ
n n


Reeemplazando por µ = 30000, σ = 10000000 y n = 40
 
29000 − 30000 
P Z ≤ √ = P (Z ≤ −2) = 0.02
10000000

40

POLITÉCNICO GRANCOLOMBIANO 4
b) P (X̄ ≥ 30050)

En este caso:
P (X̄ ≥ 30050) = 1 − P (X̄ ≤ 30050)
de donde:
1 − P (Z ≤ 0.1) = 1 − 0.54 = 0.46

3. Distribución muestral para la proporción

La proporción muestral se distribuye ası́:

3.1. Promedio

E(p̂) = p,
Donde:
p es la proporción poblacional
E(p̂) = p es el valor esperado de la proporción muestral.
Por lo tanto es un estimador insesgado.

3.2. Desviación estándar

Para población finita:

r r
N −n p(1 − p)
σp =
N −1 n

Para población infinita:

r
p(1 − p)
σp =
n

Ejemplo

Se sabe que el 60 % de los adultos de una zona del paı́s compran determinado producto. Se obtiene una muestra
de 150 adultos de esta área. ¿Cuál es la probabilidad de que la proporción muestral esté entre el 50 % y el 70 %?

POLITÉCNICO GRANCOLOMBIANO 5
r
0.6 ∗ 0.4
p = 0.6 σp =
150

Recordemos que como P es aproximadamente normal, se requiere estandarizar la variable aleatoria para poder
utilizar las tablas de probabilidades.

 
0.5 − 0.6 p − p̂ 0.7 − 0.6
P (0.5 < P < 0.7) = P ≤ ≤ = P (−2.5 < Zp < 2.5)
0.04 σp 0.04
= 0.9938 − 0.0062 = 0.9876

4. Distribución muestral de la varianza

Para la varianza muestral se tiene que:

(n − 1)s2
∼ χ2n−1
σ2

Que se lee, se distribuye chi-cuadrado con n − 1 grados de libertad χ2n−1 .

5. Intervalo de confianza para una muestra

En una estimación puntual, el valor de dicha estimación puede ser igual al valor del parámetro poblacional o no;
por ejemplo, si se tiene una población que corresponde al costo de mantenimiento un vehı́culo anualmente con los
siguientes datos:

Tabla 3: Costo mantenimiento vehı́culo.


Población
1 $600000
2 $700000
3 $800000
4 $900000
5 $1000000
Fuente: elaboración propia

El valor del promedio poblacional µ = 800000

POLITÉCNICO GRANCOLOMBIANO 6
Tomando dos muestras de tamaño 2:

Tabla 4: Muestra 1.
Muestra 1 (n1 )
1 $600000
2 $1000000

Fuente: elaboración propia

El valor del promedio muestral es x̄1 = 800000, en este caso la estimación puntual es igual al parámetro poblacional.

Tabla 5. Muestra 2
Muestra 2 (n2 )
1 $700000
2 $1000000
Fuente: elaboración propia

El valor del promedio muestral es x̄2 = 850000, aquı́ la estimación puntual NO es igual al parámetro poblacional.

Por lo tanto, en este ejemplo se puede observar la limitación de las estimaciones puntuales de acertar, o no, a los
parámetros poblacionales, ya que el interés que se tiene es concluir que pasa en la población a través de muestras,
como una solución se construyen estimaciones por intervalo.

Un intervalo de confianza se compone por tres partes fundamentales.

1. La estimación puntual.

2. Margen de error.

3. Nivel de confianza (1 − α) %.

5.1. Intervalo de confianza para la media

5.1.1. Con varianza poblacional conocida

Asumiendo varianza poblacional conocida, se tiene:

Estimación puntual:

Margen de error:

z α2 √σn

POLITÉCNICO GRANCOLOMBIANO 7
El intervalo de confianza es el siguiente:
σ
x̄ ± z α2 √
n

Donde:

x̄ + z α2 √σn se denomina lı́mite superior del intervalo.

x̄ − z α2 √σn se denomina lı́mite inferior del intervalo.

5.1.2. Con varianza poblacional desconocida

El intervalo de confianza para la media con varianza poblacional desconocida es:

s
x̄ ± t α2 √
n

Ejemplos

• El gerente de una fábrica preocupado por la demora en la producción, desea estimar el tiempo promedio que
gastan sus trabajadores en ensamblar una pieza determinada. Por experiencia se sabe que el tiempo gastado
tiene distribución normal con desviación estándar de 3,38 minutos. Se toma una muestra de seis obreros y
se registra el tiempo, en minutos, que gastan obteniendo:

Tabla 6: Muestra del tiempo en obreros.


18,5 20,6 12,9 14,6 19,8 15,0
Fuente: elaboración propia

Obtener una estimación con un nivel de confianza del 90 %.

Solución P
xi 101.4
Con los datos de la muestra se obtiene x̄ = n = 6 = 16, 9.

• Paso 1: Encontrar el nivel alfa. Si se le da el nivel alfa en la pregunta (por ejemplo, un nivel alfa de
10 %), vaya al paso 2. Para este caso, restamos el nivel de confianza del 100 %. Es decir, si tiene un nivel
de confianza del 90 por ciento, entonces el 100 % - 90 % = 10 %.
• Paso 2: divida la cantidad que se encontró en el paso 1 en 2 para obtener el nivel alfa para una prueba
de dos colas: 10 % / 2 = 5 %
• Paso 3: reste el paso 2 del 50 %: 50 % - 5 % = 45 %

POLITÉCNICO GRANCOLOMBIANO 8
• Paso 4: convierta el paso 3 a un decimal y encuentre esa zona en el centro de la tabla Z.

El más cercano de puntuación Z de 45 % (0.45) se encuentra entre en Z = 1,64 y Z=1,65; lo que haremos es
sumar estos dos datos y dividir en 2 el resultado, obteniendo Z α2 = 1, 645.
El intervalo queda entonces:
x̄ ± Z α2 σx̄
3, 83
16, 9 ± 1, 645 √
6
16, 9 − 2, 57 = 14, 32
16, 9 + 2, 57 = 19, 47
Con una confiabilidad del 90 % se estima que el tiempo promedio de ensamblado esta entre 14,32 y 19,47
minutos.

• Un supermercado vende café cuya etiqueta dice 40 onzas. Ante los reclamos hechos, el gerente toma una
muestra de 14 paquetes y encuentra un peso promedio de 34,86 y una desviación estándar de 4,23. Con una
confiabilidad del 95 % estimar el peso promedio de todos los paquetes. Datos: n = 14, número de muestras
x̄ = 34, 86 (media de la muestra).
s = 4, 23 (desviación estándar).
n − 1 = 14 − 1 = 13 (grados de libertad).
Para una confiabilidad o nivel de confianza del 95 % encontramos el valor t en la tabla de la distribución
t-Student, para ello haremos lo siguiente:

• Paso 1: encuentre el nivel alfa. Si se le da el nivel alfa en la pregunta (por ejemplo, un nivel alfa de
10 %), vaya al paso 2. Para este caso Restamos el nivel de confianza del 100 %. Es decir, si tiene un
nivel de confianza del 95 %, entonces el 100 % - 95 % = 5 %.
• Paso 2: divida la cantidad que se encontró en el paso 1 en 2 para obtener el nivel alfa para una prueba
de dos colas: 5 % / 2 = 2.5 %
• Paso 3: ubique en la columna 1, de la tabla los n − 1 grados de libertad en esta caso da 13.
• Paso 4: convierta el paso 2 a un decimal 2,5 % (0.025) y encuentre el valor que en este caso es:

t α2 ,n−1 = t0.025,n−1 = 2.1604

4, 23
x̄ ± t α2 ,n−1 Sx̄ = 34, 86 ± 2, 1604 √ = 34, 86 ± 2, 44
14
Ls = 34, 86 + 2, 44 = 32, 42
Li = 34, 86 − 2, 44 = 37, 00
Con una confianza del 95 % se puede decir que el peso promedio se encuentra entre 32,42 y 37,0 onzas.

5.2. Intervalo de confianza para la proporción

El intervalo para la proporción es: r


p̂(1 − p̂)
p̂ ± z α2
n

POLITÉCNICO GRANCOLOMBIANO 9
Ejemplo

En una muestra aleatoria de 95 empresas manufactureras, 67 han indicado que su empresa ha obtenido la certifica-
ción ISO en los dos últimos años. Halle el intervalo de confianza al 99 % de la proporción poblacional de empresas
que han recibido la certificación en los dos últimos años.

Solución
La proporción muestral está dada por:
p̂ = 67/95
Para una confiabilidad o nivel de confianza del 99 % encontramos el valor Z en la tabla de la distribución normal,
para ello haremos lo siguiente:

• Paso 1: encuentre el nivel alfa. Si se le da el nivel alfa en la pregunta (por ejemplo, un nivel alfa de 10 %),
vaya al paso 2. Para este caso Restamos el nivel de confianza del 100 %. Es decir, si tiene un nivel de confianza
del 90 %, entonces el 100 % - 99 % = 1 %.

• Paso 2:divida la cantidad que se encontró en el paso 1 en 2 para obtener el nivel alfa para una prueba de
dos colas: 1 % / 2 = 0,5 %.

• Paso3: reste el paso 2 del 50 %: 50 % - 0,5 % = 49,5 %

• Paso4: conevierta el paso 3 a un decimal y encuentre esa zona en el centro de la tabla Z.

El más cercano de puntuación Z de 49,5 % (0.495) se encuentra entre en Z = 2, 57 y Z = 2, 58; lo que haremos es
sumar estos dos datos y dividir en 2 el resultado, obteniendo Z α2 = 2, 575

Hallemos el intervalo de confianza: r


p̂(1 − p̂)
p̂ ± z α2
n
s s
67 67 67 67
67 95 1 − 95 67 95 1− 95
− 2, 58 ≤P ≤ + 2, 58
95 95 95 95

0, 71 − 0, 12 ≤ P ≤ 0, 71 + 0, 12
0, 58 ≤ P ≤ 0, 705

Ası́, la proporción de empresas con certificación ISO (con un margen de error de un 12 % y un nivel de confianza
del 99 %) se encuentra entre el 58 % y 71 %, aproximadamente.

5.3. Intervalo de confianza para la varianza

El intervalo de confianza para la varianza está dado por:

(n − 1)s2 2 (n − 1)s2
≤ σ ≤
χ2α ,n−1 χ21− α ,n−1
2 2

POLITÉCNICO GRANCOLOMBIANO 10
Donde el lı́mite inferior es:
(n − 1)s2
χ2α ,n−1
2

El lı́mite superior es:


(n − 1)s2
χ21− α ,n−1
2

Ejemplo

El director de control de calidad de una empresa quı́mica ha extraı́do una muestra aleatoria de 20 sacos de
fertilizante de 100 kilos, para estimar la varianza de los kilos de impurezas. Se ha observado que la varianza muestral
es de 6,62. Determine el intervalo de confianza al 95 % de la varianza poblacional de los kilos de impurezas.

Solución:
α
Dado que s2 = 6, 62 y n = 20 vamos a establecer los valores y cuando 2 = 0.025.

Para calcualar χ219,0.025


  α
P χ2(n−1) > χ2(α ,n−1) =
2 2
P χ219 > χ219,0.025 = 0, 025


Para calcualar χ219,0.975

  α
P χ2n−1 < χ2(1− α ,n−1) =
2 2
 
P χ219 < χ2(19,0.975) = 0, 025

χ2(19,0.975) = 8.91
Luego el intervalo de confianza es:

(n − 1)s2 2 (n − 1)s2
< σ <
χ2α ,n−1 χ21− α ,n−1
2 2

(20 − 1)6.62 (20 − 1)6.62


< σ2 <
32.85 8.91
3.8289 < σ 2 < 14.1167

En otras palabras la varianza poblacional o la varianza en kilos de impurezas se encuentra entre 3,83 y 14,12 kilos.

POLITÉCNICO GRANCOLOMBIANO 11
Referencias

[1] Montgomery, Douglas C and Runger Probabilidad y estadı́stica aplicadas a la ingenierı́a 1996.

[2] Walpole, Ronald E and Myers, Raymond H and Myers, Sharon L Probabilidad y estadı́stica para ingenieros
1999.

[3] Anderson, D.R. and Sweeney, D.J. Estadı́stica Para Administración y Economı́a 2008.

POLITÉCNICO GRANCOLOMBIANO 12
INFORMACIÓN TÉCNICA

Módulo: Estadı́stica II
Unidad 1: Muestreo, distribuciones muestrales y estimación
de parámetros.
Escenario 2: Intervalos de confianza para una muestra

Autor: Daniel Ernesto Santiago Garnica

Asesor Pedagógico: Diana Marcela Salcedo Dı́az


Diseñador Gráfico: Jully Amanda Guzman
Corrector de estilo: Felipe Garán
Asistente: Ginna Paola Quiroga

Este material pertenece al Politécnico Grancolombiano.


Por ende, es de uso exclusivo de las Instituciones
adscritas a la Red Ilumno. Prohibida su reproducción
total o parcial.

POLITÉCNICO GRANCOLOMBIANO 13

También podría gustarte