Está en la página 1de 15

Intervalos de confianza

Definiciones previas

Un estimador es una estadística de muestra (como la media de muestra x̄ ) que se usa


para aproximar un parámetro de población. Un estimado es un valor o intervalo de valores
específicos que se usan para algún parámetro de población.

Un estimado puntual es un valor individual (o punto) que se usa para aproximar un


parámetro de población.

La media de muestra x̄ es el mejor estimado puntual de la media de población μ

Un intervalo de confianza (o estimado de intervalo) es una gama (o un intervalo) de


valores que probablemente contiene el verdadero valor del parámetro de población.

Un intervalo de confianza se asocia a un grado de confianza, que es una medida de


certeza que tenemos que nuestro intervalo contiene el parámetro de población. La
definición de confianza utiliza α para describir una probabilidad que corresponde a un
área.

La probabilidad α se divide equitativamente entre dos regiones extremas sombreadas a


menudo llamadas colas de la distribución normal estándar.

El grado de confianza es la probabilidad 1−α (a menudo expresada en valor porcentual)


de que el intervalo de confianza contiene el verdadero valor del parámetro de población.
(El grado de confianza también se denomina nivel de confianza o coeficiente de
confianza)

Ejemplo

Los valores del grado de confianza que suelen usarse que suelen usarse son el 90%
( α=0 ,10 ) , 95% ( α=0 ,05 ) , y 99% ( α=0 , 01 ) , La selección de 95% es la más común
porque ofrece un buen balance entre la precisión (ancho de intervalo) y la confiabilidad
(grado de confianza).
Notación para el valor crítico


2 Es el valor z positivo que está en la frontera vertical que separa un área de α /2 en
−z α
la cola derecha de la distribución estándar. El valor 2 está en la frontera vertical del
área α /2 de la cola izquierda.

Un valor crítico es el número que está en la frontera que separa las estadísticas de

muestra que probablemente no ocurrirán. El número 2 es un valor crítico que es un
puntaje z con la propiedad de que separa un área de α /2 en la cola derecha de la
distribución normal estándar. (Hay un área de 1−α entre las fronteras que están en
−z α zα
2 y 2 .

Ejemplo

El ejemplo anterior muestra que un grado de confianza del 95% da como resultado un
z α =1,96
valor crítico de 2 . Este es el valor crítico más común, y se lista junto a otros dos
valores comunes en la tabla siguiente.

α

Grado de confianza
Valor crítico 2
90% 0,10 1,645
95% 0,05 1,96
99% 0,01 2,575
Cuando se usan datos de muestra para estimar una media de población μ , el margen
de error, denotado por E, es la máxima diferencia probable (con probabilidad 1−α )
entre la media de muestra observada x̄ y el verdadero valor de la media de población
μ . El margen de error también se denomina error máximo de la estimación.

σ
E=Z α⋅
2 √n
Como Calcular E cuando se desconoce σ

o Si n>30 , podemos sustituir σ de la fórmula anterior por la


desviación estándar de la muestra s .
o Si n≤30 , la población deberá tener una distribución normal y debemos
conocer σ para usar la fórmula anterior

Intervalo de confianza de la media de Población μ (n>30)

σ
x̄−E< μ< x̄ + E donde E=Z α ⋅
2 √n
Los valores x̄−E y x̄−E se denominan límites del intervalo de confianza.
σ σ
[
IC 1−α (μ )= x̄+ Z α⋅ ; x̄ + Z α ⋅
2 √
n 1− √ n
2
]
σ
¿ x̄±Z α ⋅
2 √n
¿ x̄±E
Ejemplo

Un fabricante produce focos que tienen un promedio de vida con distribución aproximadamente
normal y una desviación estándar de 40 horas. Si una muestra de 30 focos tiene una vida
promedio de 780 horas.
Encuentre un intervalo de confianza del 96% para la media poblacional de todos los focos que
produce esta empresa.
x ~ N ( 780 , 402 )
x ~ N ( μ , σ 2)
n = 30 σ=40 x̄=780 α =4 % 1−α =96 % Z 0 , 02=−2 , 053 Z 0 , 98=2 , 0537

σ σ σ
[
IC 96 % ( μ)= x̄ -Z α⋅ ; x̄ + Z α ⋅
2 √
n 1− √ n
2 ][
= x̄±Z α ⋅
2 √
n ]
40 40
[
¿ 780-2,0537⋅
√30
; 780+ 2,0537⋅
√ 30 ]
¿ [ 765 ; 795 ]
∴ μ ∈ (765 ; 795 )
Determinación del tamaño de la muestra

2
Z α⋅σ
( )
n=
2
E
El tamaño debe ser un número entero, por lo cual redondear hacia arriba para que la muestra
sea lo suficientemente grande.
Ejemplo
Un administrador del departamento de personal del Ministerio de Salud desea estimar el número
promedio de horas de capacitación que se dan a los médicos de cierta especialidad, con un error
de (más o menos) 3 horas y con una confianza del 90%, con base en los datos de otros
departamentos, estima que la desviación estándar de las horas de capacitación es σ =20
horas. Determinar el tamaño mínimo de la muestra que se requiere.
datos
E= 3 horas
α=10 % Z 0, 05=−1, 645 ó Z 0 , 95=1 ,645
σ =20
Z α⋅σ 2
n= ( )(
E
2
=
−1 , 645⋅20 2
3 )
=120 , 26≈121

Intervalo de confianza de la media de Población μ ( n≤30 σ desconocida )

s
x̄−E< μ< x̄ + E donde E=t α

( 2
, n−1 ) √n
Los valores x̄−E y x̄−E se denominan límites del intervalo de confianza.

s s
[
IC α % ( μ )= x̄ -t
( α
2
, n−1

) √n
; x̄ +t α ⋅
(1− 2 ,n−1) √ n ]
Ejemplo

El tiempo que tardan las cajeras de un supermercado en cobrar a los clientes sigue una
distribución normal. Para una muestra aleatoria de 15 clientes se obtuvieron los siguientes
tiempos (en minutos):

5 6,2 4,8 5,2 5,2 6,4 4,9 5,3 4,2 5 5,9


5,1 6 4,9 5,1

Encuentre un intervalo de confianza del 95% para el verdadero tiempo medio de atención de
las cajeras.

t ( 0 . 975, 14) =2. 145


n=15 x̄=5. 28 s=0 .593 α=0 . 05
t ( 0. 025 ,14 )=−2. 145
s
( √n )
μ ∈ x̄±t ( 0 .975 , 14)

0. 593 0. 593
(
μ ∈ 5. 28−2. 145
√15
; 5 .28+2. 145
√15 )
μ ∈ ( 4 .951 ; 5 .608 )
Intervalo de confianza para la proporcion de población P

La proporcion de muestra ^p es el mejor estimador estimado puntual de población P.


El margen de error del estimado P, está dado por

p^ ( 1− p^ )
E=Z α⋅
2
√ n
p^ ( 1− ^p )
^p−E< p< p^ + E

Entonces nuestro intervalo queda


donde E=Z α⋅
2
√ n

^p ( 1− p^ )
^ ^p + Z α⋅ p ( 1− p )
^ ^
^p−Z α ⋅
2
√ n
< P<
1−
2
n √
[
p∈ ^p−Z α ⋅
2
√ p^ (1− ^p )
n
; p^ +Z α ⋅
2
p^ ( 1− ^p )
n √ ]
Ejemplo

El movimiento estudiantil después de 8 días ha ido perdiendo fuerza entre sus seguidores. En una
encuesta realizada sobre una muestra aleatoria de 500 alumnos consultados sobre como votarían
ante la pregunta seguir en paro?, 290 votarán por proseguir éste.

a) Desarrolle un intervalo de confianza de 98% para la verdadera proporción de alumnos


que votará por él.

a ) Datos
n=500
290
^p= =0 .58
500
α=0 . 02 Z 0,01=−2 ,33
p^ (1− ^p )
(
P∈ p^ ±2.33
√ ) n
0 .58(1−0 .58) 0.58(1−0.58 )
( √
I . C .P = 0 . 58−2 .33
500
;0 .58+2. 33
500 √ )
¿ ( 0 .5285 ; 0 .6314 )
b) De acuerdo a lo obtenido en a) el movimiento estudiantil seguirá en paro?, justifique su
respuesta
b ) seguirá la movilizazciónl ya que
el % está entre ( 52, 85 % ; 63 ,14 % ) a un 98 % de confiabilidad
Determinación del tamaño de la muestra para estimar la proporcion p

2
Z α p^ (1− p^ )
n=
( )2

Cuando se conoce el estimado ^p E2


2
Z α 0 , 25
n=
( ) 2

Cuando no se conoce el estimado ^p E2

2
Intervalo de confianza para la varianza de población σ
2
En una población distribuida normalmente con varianza σ , seleccionamos aleatoriamente
2
muestras independientes de tamaño n y calculamos la varianza de muestra s para cada muestra.
( n−1 ) s 2
χ2=
La estadística de muestra σ2 tiene una distribución llamada chi cuadrada.

n=tamaño de la muestra
2
( n−1 ) s s2=varianza de muestra ¿
χ 2=
σ2 σ 2=varianza de población
¿
La distribución chi cuadrada está determinada por el número de grados de libertad n-1

2 2
La varianza de muestra s es el mejor estimado puntual de la varianza de población σ

Intervalo de confianza para la varianza de población

( n−1 ) s 2 2 ( n−1 ) s 2
<σ <
χ 2d χ 2I

Con este intervalo podemos determinar un intervalo para la


desviación estándar

( n−1 ) s 2 ( n−1 ) s 2
√ χ 2d
<σ<
√χ 2I
Ejemplo

El tiempo que tardan las cajeras(os) de un supermercado en cobrar a los clientes sigue una
distribución normal. Para una muestra aleatoria de 15 clientes se obtuvieron los siguientes
tiempos (en minutos):

5 6,2 4,8 5,2 5,2 6,4 4,9 5,3 4,2 5 5,9


5,1 6 4,9 5,1

Estime un intervalo del 90% de confianza para la verdadera variabilidad del tiempo de atención.

n=15 x̄=5 . 28 s=0. 593 α=0. 10 χ 2(0 . 05 ,14 )=6. 5706 χ 2( 0. 95 , 14 )=23 . 6848
( n−1 ) s2 2 ( n−1 ) s
2
≤σ ≤ 2
χ 2( 0. 95 , 14 ) χ ( 0. 05 , 14)
( n−1 ) s 2 ( n−1 ) s2
2
σ ∈ 2
( ;
χ (0 . 95 ,14 ) χ 2( 0. 05 , 14 ) )
2 2
14⋅0 . 593 14⋅0. 593
2
σ ∈ (
23 . 6848
;
6 .5706 )
2
σ ∈ ( 0 .2078 ; 0 .7492 ) /√
σ ∈ ( 0 . 4559 ; 0 . 86559 ) en min utos
Intervalos de confianza para dos poblaciones

Si S1 y S2 son dos estadísticos con distribuciones muestrales aproximadamente normales, los límites
de confianza para la diferencia de los parámetros poblacionales correspondientes a S 1 y S2 , con
muestras independientes, vienen dados por ejemplo

 Los límites de confianza de dos medias poblacionales, en el caso de que las poblaciones sean
2 2
infinitas σ 1 y σ 2 conocidas

σ 21 σ 22 σ 21 σ 22
( x̄ 1 − x̄2 )−z α 2
1 1 1 2
√ + ¿ μ −μ ¿ ( x̄ − x̄ ) +z α
n1 n2 1 2 1 2 1− 2 n1 n2
x̄ , σ , n y x̄ , σ , n
+

2 2 son las respectivas medias, desviaciones típicas y



Donde
tamaños de las dos muestras extraídas de las dos poblaciones.

 Los límites de confianza de dos medias poblacionales con Varianzas desconocidas, pero
2 2
asumiendo que σ 1 = σ 2

1 1 1 1
2 √
( x̄ 1 − x̄2 )−t (n +n −2; α ) S p n + n ¿ μ1 −μ2 ¿ ( x̄1 − x̄ 2 ) +t (n + n −2; α ) S p n + n
1 2 1 2 1 2 2 1 2 √
( n1 −1 ) S 21 + ( n2 −1 ) S 22
Donde:
S p=
√ n1 + n2 −2

 Los límites de confianza de dos medias poblacionales con Varianzas desconocidas, pero
2 2
asumiendo que σ 1 ≠ σ 2
S 21 S22 S 21 S 22
( x̄ 1− x̄2 )−t v ;
α
2
√ + ¿ μ −μ ¿ ( x̄ − x̄ ) +t
n1 n2 1 2 1 2 v ;α 2 n1 n2
+

2
S 21 S 22

v=
( n1
+
n2 )
2 2
S 21 S 22
( ) ( )
n1
+
n2

Donde: n1 −1 n2 −1

Análogamente,

 Los límites de confianza para la diferencia de dos proporciones poblacionales, siendo las
poblaciones infinitas, son dados por

^p1 ( 1− p^ 1 ) p^ 2 ( 1− p^ 2 ) p^ 1 ( 1− ^p1 ) p^ 2 ( 1− p^ 2 )


( ^p1− ^p2)−zα 2
√ n1
+
n2
¿ P1−P2 ¿ ( ^p1− p^ 2) +z α

Los límites de de confianza para el cociente de varianzas de distribuciones normales


2 n1
+
n2 √
independientes, siendo las poblaciones infinitas, son dados por
2
S1 1 σ 21 S12 1
2
⋅ ≤ ≤ ¿
S2 F Fα
2 2
σ S
( 1− α2 ;( n −1) ;(n −1))
1 2
2 2
( 2 ;( n −1 );(n −1 ))
1 2

Ejemplos

1. En un estudio que conduce el Centro de Recursos Acuáticos y que analiza el Centro de Consulta Estadística del
Instituto Politécnico y Universidad Estatal de Virginia, se comparan dos plantas de tratamiento de aguas
residuales. La planta A se ubica donde el ingreso medio de los hogares es considerado bajo y la planta B donde
el ingreso medio es considerado alto. La cantidad de agua que trata cada planta (en miles de galones por día)
se muestrea de forma aleatoria durante 10 días. Los datos son los siguientes:

Planta A 21 19 20 23 22 28 32 19 13 18

Planta B 20 39 24 33 30 28 30 22 33 24

Bajo los supuestos que sea necesario, construya un intervalo del 90% de confianza para la diferencia
de proporciones de días en que se tratan más de 30 galones entre las plantas A y B. Interprete

1 3
(
IC ^p A =
10
=0,1 ; ^pB = =0,3
10 )
X i = Cantidad de dias que se tra tan mas de 30 galones en planta i
X i ~ B ( pi ) Supuestos n es suficientemente grande

n A =n B =10 entonces p^ A =0,1 ; p^ B =0,3



α=0 , 10 z 0, 05=−1, 645 z 0, 95=1 , 645
0,1⋅0,9 0,3⋅0,7 0,1⋅0,9 0,3⋅0,7
(
IC ( p A− p B )0,9 = ( 0,1−0,3 )−1 , 645
√ 10
+
10
; ( 0,1−0,3 ) +1 ,645
10 √ +
10 )
¿ (−0 .2−0 .2849 ;−0 . 2+0. 2849 )
¿ (−0 , 485 ; 0 ,085 )

0,3⋅0,7 0,1⋅0,9 0,3⋅0,7 0,1⋅0,9


(
IC ( p B− p A )0,9 = ( 0,3−0,1 )−1 , 645
√ 10
+
10
; ( 0,3−0,1 )−1 , 645
10 √ +
10 )
¿ ( 0 .2−0 .2849 ;0 . 2+0 .2849 )
¿ (−0 , 085 ; 0 , 485 )

Con 90% de confianza se puede afirmar que el intervalo (−0,485 ; 0,085 ) contiene a la
diferencia de proporciones de días en que se tratan más de galones. Como el 0  IC, se puede

afirmar que
p A= p B

2
2. Si una muestra de tamaño n=20 tomada de una población normal con la varianza σ =225
tiene la media x=64.3 , construya un intervalo de confianza del 95% de la media de la población.

α=0 . 05 z α =z 0 .975 =1 .96


1−
2
entonces el int ervalo para μ
15 15
64 ,3−1 , 96 ≤μ≤64 , 3+1 , 96
√20 √20
57 , 7≤μ≤70 , 9
3. Un fabricante de pinturas desea determinar el tiempo de secado en promedio de una pintura para interiores. Si
en12 áreas de prueba de igual tamaño se obtuvo un tiempo de secado medio de 66,3 minutos y una desviación
estándar de 8,4 minutos, construya u intervalo del 95% para la verdadera media μ

x=66 . 3
s=8 . 4
t 0. 025 , 11 =2. 201
entonces el int ervalo para μ
8.4 8.4
66 ,3−2. 201 ≤μ≤66 ,3−2 .201
√12 √ 12
61≤μ≤71 .6
4. Construya un intervalo de confianza del 94% de la diferencia real entre las duraciones en promedio de dos tipos de
focos eléctricos, dado que una muestra tomada al azar de 40 focos de un tipo duro en promedio 418 horas de uso
continuo y 50 focos de otra clase duraron en promedio 402 horas. Si se sabe que sus desviaciones estándar

poblacionales
σ 1 =26 y σ 2=22 (conocidos)

σ 21 σ 22 σ 21 σ 22
( x̄ 1 − x̄2 )−z 1− α 2 √ + ¿ μ1 −μ2 ¿ ( x̄ 1 − x̄2 ) + z 1−α
n1 n 2 √
2
+
n1 n2

Datos
α =0 . 06 z α =z 0. 03=−1 . 88 z 0. 97 =1. 88
1−
2
entonces el int ervalo para μ 1−μ 2
262 222 26 2 222
( 418−402)−1. 88 +
40 50 √≤μ 1−μ 2≤(418−402 )+1 . 88
40 50
+
6,3≤μ1 −μ2 ≤25 , 7 existen diferencias significativas

5. Las temperaturas corporales de 106 ciudadanos norteamericanos, fueron en 98.2º Farenheit con una desviación
standard de 0,62. Para un grado de confianza de 0,95 calcule el error e intervalo de confianza que contenga la
verdadera media

x−E< μ < x+E


E=z α ⋅
δ
=1 , 96
0 .62
=0. 12
98.20−0.12< μ<98.20+0.12
a) 2 √n √106 b) 98.08< μ<98.32
6. Se ha resumido un estudio para comparar el contenido de nicotina de dos marcas de cigarros. Diez cigarrillos de la
marca A tuvieron un contenido de nicotina en promedio de 3,1 miligramos con una desviación estándar de 0,5
miligramos. Mientras que en ocho cigarros de marca B tuvieron un contenido de nicotina en promedio de 2,7
miligramos con una desviación estándar de 0,7 miligramo. Suponiendo que los dos conjuntos son de muestras
tomadas al azar de poblaciones normales con varianzas iguales, construya un intervalo de confianza del 95% de la
diferencia real en el contenido promedio de nicotina de las dos marcas de cigarrillos.

1 1 1 1
1 2
α
2 √
( x̄ 1− x̄2 )−t (n +n −2; ) S p n + n ¿ μ1 −μ2 ¿ ( x̄1 − x̄ 2 ) +t (n + n −2; ) S p n + n
1 2 1 2 1
α
2
2 √
( n1 −1 ) S 21 + ( n2−1 ) S 22
Donde:
S p=
√ n1 + n2 −2

marca A marca B
n =10 n2 =8
Re sumiendo 1
x 1=3 . 1 x 2=2. 7
s 1 =0 .5 s2 =0 .7
α =0 . 05 t (10+8−2,0. 025 )=t ( 16 ,0 . 025 )=−2 .120 t ( 10+8−2,0 . 975 )= t (16 , 0 . 975) =2. 120
( 10−1 ) ( 0 .5 )2 + ( 8−1 )( 0 . 7 )2 9 ( 0 .25 )+7 ( 0. 49 )
S p=

16
entonces el int ervalo para μ1 −μ2
=
16 √ =0 . 596

1 1 1 1
( 3. 1−2 . 7)−2. 120⋅0 . 596⋅
10 8 √
+ ≤μ1 −μ2 ≤( 3 . 1−2 .7 )+2 .120⋅0 .596⋅ +
10 8
−0 . 2≤μ1 −μ2 ≤1 (contiene el cero , no existen diferencias )

7. Un Ingeniero comercial desea estimar los ingresos medios durante el primer año de trabajo de un graduado
universitario que, en un alarde de sabiduría, tomó un curso de estadística. ¿Cuántos de tales ingresos es necesario
encontrar si queremos tener una confianza del 95%? En que la media de la población de muestra este a menos de
us$500 de la verdadera media de población? Suponga que un estudio previo reveló que, para tales ingresos,
=$6250.
2
δ 6250 2
[ ] [
n= z α ⋅ = 1. 96⋅
2
E 500
=600 .25 ]

8. Los sondeadores de opinión enfrentan diversos factores que confunden los resultados, como los las contestadoras
telefónicas. En una encuesta de 1068 personas, 673 dijeron que tenían contestadora telefónica. Utilizando estos
resultados de muestra, determine
a) El estimado puntual de p es

x 673
^p= = =0 . 630
n 1068
b) El estimado de intervalo del 95% de la proporción de la población de las personas que tienen
contestadora telefónica.
^ q^
p ^p ( 1− ^p ) ( 0 .630 )( 0 .370 )
E=z α ⋅
2
√ n √
=z α ⋅
2
n √
=1 , 96
1068
=0 . 0290

c) Intervalo de confianza
p^ −E< p < p^ +E
0.630−0.0290< p<0.630+0.0290
0.601< p<0.659
∴ p∈ [ 0,601 ;0,659 ]
∴ la verdadera proporción de personas
que posee contestadora varía entre el 60,1% y 65,9%
con un 95% de confianza .
9. Las pruebas de choque de automóviles son un ejemplo muy costoso de pruebas destructivas. Si usted estuviera a
cargo de tales pruebas de choque, no querría decirle a su supervisor que necesita chocar y destruir más de 30
automóviles para poder usar la distribución normal. Supongamos que ud. ha probado 12 automóviles deportivos
Dodge Viper (precio actual US$ 59.300). Un análisis de los 12 automóviles dañados da como resultado costos de
reparación cuya distribución al parecer tiene forma de campana, con una media de
x̄=US $ 26 .227 y s=US $ 15. 873 . Determine

a. El mejor estimado puntual de μ , del costo de reparación medio de todos los Dodge Viper implicados
en colisiones.

El mejor estimado puntual de la media de población μ es el valor de la media de muestra x̄


En este caso, entonces, el mejor estimado puntual de μ es x̄=US $ 26. 227

b. Error del estimado (si se omite la significancia α=5%


n=12 (n<30 ) σ desconocido t (0 . 025, 11 )=−2 .201 t ( 0. .975, 11 )=2.201

15. 873
E=2, 201 =10 .085 , 29
√12
2
c. El intervalo de confianza para una muestra pequeña y σ desconocida

x−E < μ <x+E


26.227−10.085,29 < μ<26.227+10.085,29
16.142< μ<36.312
μ∈ [ 16.142 ; 36.312 ]

También podría gustarte