Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Definiciones previas
Ejemplo
Los valores del grado de confianza que suelen usarse que suelen usarse son el 90%
( α=0 ,10 ) , 95% ( α=0 ,05 ) , y 99% ( α=0 , 01 ) , La selección de 95% es la más común
porque ofrece un buen balance entre la precisión (ancho de intervalo) y la confiabilidad
(grado de confianza).
Notación para el valor crítico
zα
2 Es el valor z positivo que está en la frontera vertical que separa un área de α /2 en
−z α
la cola derecha de la distribución estándar. El valor 2 está en la frontera vertical del
área α /2 de la cola izquierda.
Un valor crítico es el número que está en la frontera que separa las estadísticas de
zα
muestra que probablemente no ocurrirán. El número 2 es un valor crítico que es un
puntaje z con la propiedad de que separa un área de α /2 en la cola derecha de la
distribución normal estándar. (Hay un área de 1−α entre las fronteras que están en
−z α zα
2 y 2 .
Ejemplo
El ejemplo anterior muestra que un grado de confianza del 95% da como resultado un
z α =1,96
valor crítico de 2 . Este es el valor crítico más común, y se lista junto a otros dos
valores comunes en la tabla siguiente.
α
zα
Grado de confianza
Valor crítico 2
90% 0,10 1,645
95% 0,05 1,96
99% 0,01 2,575
Cuando se usan datos de muestra para estimar una media de población μ , el margen
de error, denotado por E, es la máxima diferencia probable (con probabilidad 1−α )
entre la media de muestra observada x̄ y el verdadero valor de la media de población
μ . El margen de error también se denomina error máximo de la estimación.
σ
E=Z α⋅
2 √n
Como Calcular E cuando se desconoce σ
σ
x̄−E< μ< x̄ + E donde E=Z α ⋅
2 √n
Los valores x̄−E y x̄−E se denominan límites del intervalo de confianza.
σ σ
[
IC 1−α (μ )= x̄+ Z α⋅ ; x̄ + Z α ⋅
2 √
n 1− √ n
2
]
σ
¿ x̄±Z α ⋅
2 √n
¿ x̄±E
Ejemplo
Un fabricante produce focos que tienen un promedio de vida con distribución aproximadamente
normal y una desviación estándar de 40 horas. Si una muestra de 30 focos tiene una vida
promedio de 780 horas.
Encuentre un intervalo de confianza del 96% para la media poblacional de todos los focos que
produce esta empresa.
x ~ N ( 780 , 402 )
x ~ N ( μ , σ 2)
n = 30 σ=40 x̄=780 α =4 % 1−α =96 % Z 0 , 02=−2 , 053 Z 0 , 98=2 , 0537
σ σ σ
[
IC 96 % ( μ)= x̄ -Z α⋅ ; x̄ + Z α ⋅
2 √
n 1− √ n
2 ][
= x̄±Z α ⋅
2 √
n ]
40 40
[
¿ 780-2,0537⋅
√30
; 780+ 2,0537⋅
√ 30 ]
¿ [ 765 ; 795 ]
∴ μ ∈ (765 ; 795 )
Determinación del tamaño de la muestra
2
Z α⋅σ
( )
n=
2
E
El tamaño debe ser un número entero, por lo cual redondear hacia arriba para que la muestra
sea lo suficientemente grande.
Ejemplo
Un administrador del departamento de personal del Ministerio de Salud desea estimar el número
promedio de horas de capacitación que se dan a los médicos de cierta especialidad, con un error
de (más o menos) 3 horas y con una confianza del 90%, con base en los datos de otros
departamentos, estima que la desviación estándar de las horas de capacitación es σ =20
horas. Determinar el tamaño mínimo de la muestra que se requiere.
datos
E= 3 horas
α=10 % Z 0, 05=−1, 645 ó Z 0 , 95=1 ,645
σ =20
Z α⋅σ 2
n= ( )(
E
2
=
−1 , 645⋅20 2
3 )
=120 , 26≈121
s
x̄−E< μ< x̄ + E donde E=t α
⋅
( 2
, n−1 ) √n
Los valores x̄−E y x̄−E se denominan límites del intervalo de confianza.
s s
[
IC α % ( μ )= x̄ -t
( α
2
, n−1
⋅
) √n
; x̄ +t α ⋅
(1− 2 ,n−1) √ n ]
Ejemplo
El tiempo que tardan las cajeras de un supermercado en cobrar a los clientes sigue una
distribución normal. Para una muestra aleatoria de 15 clientes se obtuvieron los siguientes
tiempos (en minutos):
Encuentre un intervalo de confianza del 95% para el verdadero tiempo medio de atención de
las cajeras.
0. 593 0. 593
(
μ ∈ 5. 28−2. 145
√15
; 5 .28+2. 145
√15 )
μ ∈ ( 4 .951 ; 5 .608 )
Intervalo de confianza para la proporcion de población P
p^ ( 1− p^ )
E=Z α⋅
2
√ n
p^ ( 1− ^p )
^p−E< p< p^ + E
^p ( 1− p^ )
^ ^p + Z α⋅ p ( 1− p )
^ ^
^p−Z α ⋅
2
√ n
< P<
1−
2
n √
[
p∈ ^p−Z α ⋅
2
√ p^ (1− ^p )
n
; p^ +Z α ⋅
2
p^ ( 1− ^p )
n √ ]
Ejemplo
El movimiento estudiantil después de 8 días ha ido perdiendo fuerza entre sus seguidores. En una
encuesta realizada sobre una muestra aleatoria de 500 alumnos consultados sobre como votarían
ante la pregunta seguir en paro?, 290 votarán por proseguir éste.
a ) Datos
n=500
290
^p= =0 .58
500
α=0 . 02 Z 0,01=−2 ,33
p^ (1− ^p )
(
P∈ p^ ±2.33
√ ) n
0 .58(1−0 .58) 0.58(1−0.58 )
( √
I . C .P = 0 . 58−2 .33
500
;0 .58+2. 33
500 √ )
¿ ( 0 .5285 ; 0 .6314 )
b) De acuerdo a lo obtenido en a) el movimiento estudiantil seguirá en paro?, justifique su
respuesta
b ) seguirá la movilizazciónl ya que
el % está entre ( 52, 85 % ; 63 ,14 % ) a un 98 % de confiabilidad
Determinación del tamaño de la muestra para estimar la proporcion p
2
Z α p^ (1− p^ )
n=
( )2
2
Intervalo de confianza para la varianza de población σ
2
En una población distribuida normalmente con varianza σ , seleccionamos aleatoriamente
2
muestras independientes de tamaño n y calculamos la varianza de muestra s para cada muestra.
( n−1 ) s 2
χ2=
La estadística de muestra σ2 tiene una distribución llamada chi cuadrada.
n=tamaño de la muestra
2
( n−1 ) s s2=varianza de muestra ¿
χ 2=
σ2 σ 2=varianza de población
¿
La distribución chi cuadrada está determinada por el número de grados de libertad n-1
2 2
La varianza de muestra s es el mejor estimado puntual de la varianza de población σ
( n−1 ) s 2 2 ( n−1 ) s 2
<σ <
χ 2d χ 2I
( n−1 ) s 2 ( n−1 ) s 2
√ χ 2d
<σ<
√χ 2I
Ejemplo
El tiempo que tardan las cajeras(os) de un supermercado en cobrar a los clientes sigue una
distribución normal. Para una muestra aleatoria de 15 clientes se obtuvieron los siguientes
tiempos (en minutos):
Estime un intervalo del 90% de confianza para la verdadera variabilidad del tiempo de atención.
n=15 x̄=5 . 28 s=0. 593 α=0. 10 χ 2(0 . 05 ,14 )=6. 5706 χ 2( 0. 95 , 14 )=23 . 6848
( n−1 ) s2 2 ( n−1 ) s
2
≤σ ≤ 2
χ 2( 0. 95 , 14 ) χ ( 0. 05 , 14)
( n−1 ) s 2 ( n−1 ) s2
2
σ ∈ 2
( ;
χ (0 . 95 ,14 ) χ 2( 0. 05 , 14 ) )
2 2
14⋅0 . 593 14⋅0. 593
2
σ ∈ (
23 . 6848
;
6 .5706 )
2
σ ∈ ( 0 .2078 ; 0 .7492 ) /√
σ ∈ ( 0 . 4559 ; 0 . 86559 ) en min utos
Intervalos de confianza para dos poblaciones
Si S1 y S2 son dos estadísticos con distribuciones muestrales aproximadamente normales, los límites
de confianza para la diferencia de los parámetros poblacionales correspondientes a S 1 y S2 , con
muestras independientes, vienen dados por ejemplo
Los límites de confianza de dos medias poblacionales, en el caso de que las poblaciones sean
2 2
infinitas σ 1 y σ 2 conocidas
σ 21 σ 22 σ 21 σ 22
( x̄ 1 − x̄2 )−z α 2
1 1 1 2
√ + ¿ μ −μ ¿ ( x̄ − x̄ ) +z α
n1 n2 1 2 1 2 1− 2 n1 n2
x̄ , σ , n y x̄ , σ , n
+
Los límites de confianza de dos medias poblacionales con Varianzas desconocidas, pero
2 2
asumiendo que σ 1 = σ 2
1 1 1 1
2 √
( x̄ 1 − x̄2 )−t (n +n −2; α ) S p n + n ¿ μ1 −μ2 ¿ ( x̄1 − x̄ 2 ) +t (n + n −2; α ) S p n + n
1 2 1 2 1 2 2 1 2 √
( n1 −1 ) S 21 + ( n2 −1 ) S 22
Donde:
S p=
√ n1 + n2 −2
Los límites de confianza de dos medias poblacionales con Varianzas desconocidas, pero
2 2
asumiendo que σ 1 ≠ σ 2
S 21 S22 S 21 S 22
( x̄ 1− x̄2 )−t v ;
α
2
√ + ¿ μ −μ ¿ ( x̄ − x̄ ) +t
n1 n2 1 2 1 2 v ;α 2 n1 n2
+
√
2
S 21 S 22
v=
( n1
+
n2 )
2 2
S 21 S 22
( ) ( )
n1
+
n2
Donde: n1 −1 n2 −1
Análogamente,
Los límites de confianza para la diferencia de dos proporciones poblacionales, siendo las
poblaciones infinitas, son dados por
^p1 ( 1− p^ 1 ) p^ 2 ( 1− p^ 2 ) p^ 1 ( 1− ^p1 ) p^ 2 ( 1− p^ 2 )
( ^p1− ^p2)−zα 2
√ n1
+
n2
¿ P1−P2 ¿ ( ^p1− p^ 2) +z α
Ejemplos
1. En un estudio que conduce el Centro de Recursos Acuáticos y que analiza el Centro de Consulta Estadística del
Instituto Politécnico y Universidad Estatal de Virginia, se comparan dos plantas de tratamiento de aguas
residuales. La planta A se ubica donde el ingreso medio de los hogares es considerado bajo y la planta B donde
el ingreso medio es considerado alto. La cantidad de agua que trata cada planta (en miles de galones por día)
se muestrea de forma aleatoria durante 10 días. Los datos son los siguientes:
Planta A 21 19 20 23 22 28 32 19 13 18
Planta B 20 39 24 33 30 28 30 22 33 24
Bajo los supuestos que sea necesario, construya un intervalo del 90% de confianza para la diferencia
de proporciones de días en que se tratan más de 30 galones entre las plantas A y B. Interprete
1 3
(
IC ^p A =
10
=0,1 ; ^pB = =0,3
10 )
X i = Cantidad de dias que se tra tan mas de 30 galones en planta i
X i ~ B ( pi ) Supuestos n es suficientemente grande
Con 90% de confianza se puede afirmar que el intervalo (−0,485 ; 0,085 ) contiene a la
diferencia de proporciones de días en que se tratan más de galones. Como el 0 IC, se puede
afirmar que
p A= p B
2
2. Si una muestra de tamaño n=20 tomada de una población normal con la varianza σ =225
tiene la media x=64.3 , construya un intervalo de confianza del 95% de la media de la población.
x=66 . 3
s=8 . 4
t 0. 025 , 11 =2. 201
entonces el int ervalo para μ
8.4 8.4
66 ,3−2. 201 ≤μ≤66 ,3−2 .201
√12 √ 12
61≤μ≤71 .6
4. Construya un intervalo de confianza del 94% de la diferencia real entre las duraciones en promedio de dos tipos de
focos eléctricos, dado que una muestra tomada al azar de 40 focos de un tipo duro en promedio 418 horas de uso
continuo y 50 focos de otra clase duraron en promedio 402 horas. Si se sabe que sus desviaciones estándar
poblacionales
σ 1 =26 y σ 2=22 (conocidos)
σ 21 σ 22 σ 21 σ 22
( x̄ 1 − x̄2 )−z 1− α 2 √ + ¿ μ1 −μ2 ¿ ( x̄ 1 − x̄2 ) + z 1−α
n1 n 2 √
2
+
n1 n2
Datos
α =0 . 06 z α =z 0. 03=−1 . 88 z 0. 97 =1. 88
1−
2
entonces el int ervalo para μ 1−μ 2
262 222 26 2 222
( 418−402)−1. 88 +
40 50 √≤μ 1−μ 2≤(418−402 )+1 . 88
40 50
+
6,3≤μ1 −μ2 ≤25 , 7 existen diferencias significativas
√
5. Las temperaturas corporales de 106 ciudadanos norteamericanos, fueron en 98.2º Farenheit con una desviación
standard de 0,62. Para un grado de confianza de 0,95 calcule el error e intervalo de confianza que contenga la
verdadera media
1 1 1 1
1 2
α
2 √
( x̄ 1− x̄2 )−t (n +n −2; ) S p n + n ¿ μ1 −μ2 ¿ ( x̄1 − x̄ 2 ) +t (n + n −2; ) S p n + n
1 2 1 2 1
α
2
2 √
( n1 −1 ) S 21 + ( n2−1 ) S 22
Donde:
S p=
√ n1 + n2 −2
marca A marca B
n =10 n2 =8
Re sumiendo 1
x 1=3 . 1 x 2=2. 7
s 1 =0 .5 s2 =0 .7
α =0 . 05 t (10+8−2,0. 025 )=t ( 16 ,0 . 025 )=−2 .120 t ( 10+8−2,0 . 975 )= t (16 , 0 . 975) =2. 120
( 10−1 ) ( 0 .5 )2 + ( 8−1 )( 0 . 7 )2 9 ( 0 .25 )+7 ( 0. 49 )
S p=
√
16
entonces el int ervalo para μ1 −μ2
=
16 √ =0 . 596
1 1 1 1
( 3. 1−2 . 7)−2. 120⋅0 . 596⋅
10 8 √
+ ≤μ1 −μ2 ≤( 3 . 1−2 .7 )+2 .120⋅0 .596⋅ +
10 8
−0 . 2≤μ1 −μ2 ≤1 (contiene el cero , no existen diferencias )
√
7. Un Ingeniero comercial desea estimar los ingresos medios durante el primer año de trabajo de un graduado
universitario que, en un alarde de sabiduría, tomó un curso de estadística. ¿Cuántos de tales ingresos es necesario
encontrar si queremos tener una confianza del 95%? En que la media de la población de muestra este a menos de
us$500 de la verdadera media de población? Suponga que un estudio previo reveló que, para tales ingresos,
=$6250.
2
δ 6250 2
[ ] [
n= z α ⋅ = 1. 96⋅
2
E 500
=600 .25 ]
8. Los sondeadores de opinión enfrentan diversos factores que confunden los resultados, como los las contestadoras
telefónicas. En una encuesta de 1068 personas, 673 dijeron que tenían contestadora telefónica. Utilizando estos
resultados de muestra, determine
a) El estimado puntual de p es
x 673
^p= = =0 . 630
n 1068
b) El estimado de intervalo del 95% de la proporción de la población de las personas que tienen
contestadora telefónica.
^ q^
p ^p ( 1− ^p ) ( 0 .630 )( 0 .370 )
E=z α ⋅
2
√ n √
=z α ⋅
2
n √
=1 , 96
1068
=0 . 0290
c) Intervalo de confianza
p^ −E< p < p^ +E
0.630−0.0290< p<0.630+0.0290
0.601< p<0.659
∴ p∈ [ 0,601 ;0,659 ]
∴ la verdadera proporción de personas
que posee contestadora varía entre el 60,1% y 65,9%
con un 95% de confianza .
9. Las pruebas de choque de automóviles son un ejemplo muy costoso de pruebas destructivas. Si usted estuviera a
cargo de tales pruebas de choque, no querría decirle a su supervisor que necesita chocar y destruir más de 30
automóviles para poder usar la distribución normal. Supongamos que ud. ha probado 12 automóviles deportivos
Dodge Viper (precio actual US$ 59.300). Un análisis de los 12 automóviles dañados da como resultado costos de
reparación cuya distribución al parecer tiene forma de campana, con una media de
x̄=US $ 26 .227 y s=US $ 15. 873 . Determine
a. El mejor estimado puntual de μ , del costo de reparación medio de todos los Dodge Viper implicados
en colisiones.
15. 873
E=2, 201 =10 .085 , 29
√12
2
c. El intervalo de confianza para una muestra pequeña y σ desconocida