Está en la página 1de 12

ESTADISTICA II ECO

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN POBLACIONAL P:


¿Qué son las variables cualitativas?: Una variable cualitativa es un tipo de variable
estadística que describe las cualidades, circunstancias o características de un objeto o persona, sin hacer
uso de números.
De esta manera, las variables cualitativas permiten expresar una característica, atributo, cualidad o
categoría no numérica. Por ejemplo, el sexo de una persona es una variable cualitativa, ya que es
masculino o femenino.

Dicotómicas: Sólo hay dos categorías, que son excluyentes una de la otra. Ejemplos: enfermo-sano,
muerto – vivo, mujer-hombre.

INTERVALO DE CONFIANZA PARA P: Se sabe que la distribución de la proporción muestral se


define como:

𝑃(1 − 𝑃)
̂ ~𝑁𝑜𝑟𝑚𝑎𝑙 (𝜇𝑝̂ = 𝑃; 𝜎𝒑̂ = √
𝒑 )
𝑛

Con
𝑃(1 − 𝑃) 𝒙
𝜇𝑝̂ = 𝑃 ; 𝝈𝟐𝒑̂ = ̂=
𝑦 𝒑
𝑛 𝒏
Nuestro problema consiste en estimar la proporción real P a partir de la proporción muestral 𝒑
̂.
Tipificando o estandarizando la variable 𝒑
̂ tenemos:
𝑝̂ − 𝜇𝑝̂ 𝑝̂ − 𝑃
𝒁= = ~𝑁𝑜𝑟𝑚𝑎𝑙(0; 1)
𝜎𝒑̂
√𝑃(1 − 𝑃)
𝑛
Si fijamos una probabilidad (𝟏 − 𝜶) se puede construir un intervalo de confianza simétrico con valores
de Z de la curva normal estándar, de forma que el área entre estos valores sea igual a (1 − 𝛼).

𝑃 (−𝑍𝛼⁄2 < 𝒁 < 𝑍𝛼⁄2 ) = 𝟏 − 𝜶

𝑝̂ − 𝑷
𝑃 −𝑍𝛼⁄2 < < 𝑍𝛼⁄2 =1−𝛼
√𝑃(1 − 𝑃)
( 𝑛 )
𝑥
Cuando n es grande se introduce un error muy pequeño, sustituyendo el estimador puntual 𝑝̂ = para
𝑛

la proporción poblacional P, entonces podemos escribir:

𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
𝑃 (𝑝̂ − 𝑍𝛼⁄ √ ≤ 𝑃 ≤ 𝑝̂ + 𝑍𝛼⁄ √ ) =1−𝛼
2 𝑛 2 𝑛

1
ESTADISTICA II ECO
Y despejando P, se obtiene el intervalo de confianza (IC) para P

𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
𝐼𝐶 (𝑃): ̂ − 𝑍𝛼⁄ √
(𝒑 ̂ + 𝑍𝛼⁄ √
≤𝑷≤ 𝒑 )
2 𝑛 2 𝑛

Nivel de confianza: 𝟏 − 𝜶: 99% 98% 96% 95% 90%


Nivel de significación 𝜶 1% 2% 4% 5% 10%
𝒁𝜶⁄
𝟐
2.58 2.33 2.05 1.96 1.64

Error estándar

𝑝̂ (1 − 𝑝̂ )
𝐸𝑆 = √
𝑛

Margen de error - precisión

𝑝̂ (1 − 𝑝̂ )
𝑒𝑟𝑟𝑜𝑟 = 𝑒 = 𝑍𝛼⁄2 √
𝑛

Pero cuando la población es finita y el tamaño de la muestra constituye más del 5% de la población,
se debe usar el factor finito de corrección para modificar las desviaciones estándar. Por lo tanto si se
cumple:
𝑛
∗ 100 > 5%
𝑁
El intervalo de confianza será:

𝑝̂ (1 − 𝑝̂ ) 𝑁 − 𝑛 𝑝̂ (1 − 𝑝̂ ) 𝑁 − 𝑛
𝑃 (𝑝̂ − 𝑍𝛼⁄2 √ √ ≤ 𝑃 ≤ 𝑝̂ + 𝑍𝛼⁄2 √ √ )=1−𝛼
𝑛 𝑁−1 𝑛 𝑁−1

𝑝̂ (1 − 𝑝̂ ) 𝑁 − 𝑛 𝑝̂ (1 − 𝑝̂ ) 𝑁 − 𝑛
𝐼𝐶 (𝑃): (𝑝̂ − 𝑍𝛼⁄2 √ √ ≤ 𝑃 ≤ 𝑝̂ + 𝑍𝛼⁄2 √ √ )
𝑛 𝑁−1 𝑛 𝑁−1

𝑵−𝒏
Donde 𝑵−𝟏
es el factor de corrección por población finita.

Margen de error

𝑝̂ (1 − 𝑝̂ ) 𝑁 − 𝑛
𝑒𝑟𝑟𝑜𝑟 = 𝑒 = 𝑍𝛼⁄2 √ √
𝑛 𝑁−1

2
ESTADISTICA II ECO
Ejemplo 1.- Si el porcentaje de individuos daltónicos en la muestra de tamaño 36 es igual al 30%. Se
desea estimar la proporción P de individuos daltónicos de una población con un nivel de confianza de
1 − 𝛼 = 0.95.
Solución
𝑿: Personas con daltonismo
̂ = 30% = 0.3 ; 𝑛 = 36 ; 1 − 𝛼 = 0.95 → 𝛼 = 0.05 = 5% y 𝑍𝛼⁄ = 𝑍0.05⁄ = 𝑍0.025 = 𝟏. 𝟗𝟔
𝒑 2 2
𝑥 𝑥
𝑝̂ = = 30% → 0.30 = → 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 é𝑥𝑖𝑡𝑜𝑠 𝑥 = 36(0.30) = 10.8
𝑛 36
𝑝̂(1−𝑝̂) 𝑝̂(1−𝑝̂)
𝐼𝐶 (𝑃): (𝑝̂ − 𝑍𝛼⁄2 √ 𝑛
≤ 𝑃 ≤ 𝑝̂ + 𝑍𝛼⁄2 √ 𝑛
)

0.3(1 − 0.3) 0.3(1 − 0.3)


𝐼𝐶 (𝑃): (0.3 − 1.96√ ≤ 𝑃 ≤ 0.3 + 1.96√ )
36 36

𝐼𝐶 (𝑃): (0.3 − 0.1497 ≤ 𝑃 ≤ 0.3 + 0.1497)


𝐼𝐶 (𝑃): (0.1503 ≤ 𝑃 ≤ 0.4497)
𝐼𝐶 (𝑃): (15.03 % ≤ 𝑃 ≤ 44.97 %)
Interpretación: La proporción de la población 𝑃 de individuos con daltonismo varía entre 0.1503 –
0.4497 con un nivel de confianza del 95%. En el 95% de las muestras, la proporción de la población 𝑃 de
individuos con daltonismo se encuentra en el intervalo de confianza calculada para cada muestra, sin
embrago en el 5% de las muestras la proporción de la población 𝑃 de individuos con daltonismo no se
encuentra en el intervalo de confianza.

𝑝̂ (1 − 𝑝̂ ) 0.30(1 − 0.30)
𝐸𝑟𝑟𝑜𝑟 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 = 𝐸𝑆 = √ =√ = 0.0764
𝑛 36

𝑝̂ (1 − 𝑝̂ ) 0.30(1 − 0.30)
𝑀𝑎𝑟𝑔𝑒𝑛 𝑑𝑒 𝑒𝑟𝑟𝑜𝑟 = 𝑒 = 𝑍𝛼⁄2 √ = 1.96√ = 0.1497
𝑛 36

3
ESTADISTICA II ECO
Ejemplo 2. Tomamos una muestra aleatoria de 120 alumnos, de los cuales 24 de ellos afirmaron que
usaban la cafetería del instituto. Determinar un intervalo de confianza para la proporción de estudiantes
que usan la cafetería con un nivel de confianza del 99%.

Solución
𝑿: Número de estudiantes que usan la cafetería del instituto.
𝒙 𝟐𝟒
̂=
𝑛 = 120 ; 𝒑 = = 0.20 = 𝟐𝟎%; 1 − 𝛼 = 0.99 → 𝛼 = 0.01 = 1% 𝑦 𝑍𝛼⁄2 = 𝑍0.01⁄ = 𝑍0.005 = 𝟐. 𝟓𝟖
𝒏 𝟏𝟐𝟎 2

𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
𝐼𝐶 (𝑃): (𝑝̂ − 𝑍𝛼⁄2 √ ≤ 𝑃 ≤ 𝑝̂ + 𝑍𝛼⁄2 √ )
𝑛 𝑛

0.20(1 − 0.20) 0.20(1 − 0.20)


𝐼𝐶 (𝑃): (0.20 − 2.58√ ≤ 𝑃 ≤ 0.20 + 2.58√ )
120 120

𝐼𝐶 (𝑃): (0.20 − 𝟎. 𝟎𝟗𝟒𝟐 ≤ 𝑃 ≤ 0.20 + 𝟎. 𝟎𝟗𝟒𝟐)


𝐼𝐶 (𝑃): (0.1058 ≤ 𝑃 ≤ 0.2942)
𝐼𝐶 (𝑃): (10.58 % ≤ 𝑃 ≤ 29.42 %)

𝑝̂ (1 − 𝑝̂ ) 0.20(1 − 0.20)
𝐸𝑟𝑟𝑜𝑟 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 = 𝐸𝑆 = √ =√ = 0.0365
𝑛 120

𝑝̂ (1 − 𝑝̂ ) 0.20(1 − 0.20)
𝑀𝑎𝑟𝑔𝑒𝑛 𝑑𝑒 𝑒𝑟𝑟𝑜𝑟 = 𝑒 = 𝑍𝛼⁄2 √ = 2.58√ = 0.0942
𝑛 120

Interpretación: La proporción verdadera 𝑷 de estudiantes que usan la cafetería del instituto varía
entre (0.1058 − 0.2942) con un 99% de nivel de confianza.

4
ESTADISTICA II ECO
Ejemplo 3: Se está considerando un nuevo sistema de lanzamiento de cohetes para el despliegue de
cohetes pequeños, de corto alcance. La probabilidad de que el sistema existente tenga un lanzamiento
exitoso se representa con 𝑃 = 0.80. Se toma una muestra de 40 lanzamientos experimentales con el
nuevo sistema y 34 resultan exitosos.
a) Construya un intervalo de confianza del 95% para la proporción de lanzamientos exitosos del
sistema nuevo.
𝑋: Número de lanzamientos exitosos
𝒙 𝟑𝟒
̂=
𝑺𝒊𝒔𝒕𝒆𝒎𝒂 𝒏𝒖𝒆𝒗𝒐: 𝒏 = 40 ; 𝑥 = 34 ; 𝒑 = = 𝟎. 𝟖𝟓 = 𝟖𝟓%
𝒏 𝟒𝟎
𝑍𝛼⁄ = 𝑍0.05⁄ = 𝑍0.025 = 𝟏. 𝟗𝟔
2 2

𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
𝐼𝐶 (𝑃): (𝑝̂ − 𝑍𝛼⁄ √ ≤ 𝑃 ≤ 𝑝̂ + 𝑍𝛼⁄ √ )
2 𝑛 2 𝑛

0.85(1 − 0.85) 0.85(1 − 0.85)


𝐼𝐶 (𝑃): (0.85 − 1.96√ ≤ 𝑃 ≤ 0.85 + 1.96√ )
40 40

𝐼𝐶 (𝑃): (0.85 − 𝟎. 𝟏𝟏𝟎𝟔𝟓 ≤ 𝑃 ≤ 0.85 + 𝟎. 𝟏𝟏𝟎𝟔𝟓)


𝐼𝐶 (𝑃): (0.7393 ≤ 𝑃 ≤ 0.9607)
𝐼𝐶 (𝑃): (73.93% ≤ 𝑃 ≤ 96.07%)

𝑝̂ (1 − 𝑝̂ ) 0.85(1 − 0.85)
𝐸𝑟𝑟𝑜𝑟 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 = 𝐸𝑆 = √ =√ = 0.0565
𝑛 40

𝑝̂ (1 − 𝑝̂ ) 0.85(1 − 0.85)
𝑀𝑎𝑟𝑔𝑒𝑛 𝑑𝑒 𝑒𝑟𝑟𝑜𝑟 = 𝑒 = 𝑍𝛼⁄2 √ = 1.96√ = 0.11065
𝑛 40

Interpretación: La proporción verdadera 𝑷 de lanzamientos de cohetes pequeños con el sistema nuevo


varía entre (0.7393 − 0.9607) con un 95% de nivel de confianza.

5
ESTADISTICA II ECO
b) ¿Con base en sus resultados, concluiría que el nuevo sistema es mejor?
Sistema existente 𝑃 = 0.80 = 80%
Nuevo sistema: 𝐼𝐶 (𝑃): (73.93% ≤ 𝑃 ≤ 96.07%)
Si es posible que el nuevo sistema sea mejor que el sistema existente, porque el intervalo de
confianza para la proporción de lanzamientos exitosos con el nuevo sistema
𝐼𝐶 (𝑃): (73.93% ≤ 𝑃 ≤ 𝟗𝟔. 𝟎𝟕%) contiene al 80%.
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES 𝑷𝟏 − 𝑷𝟐
Vamos a considerar que tenemos dos poblaciones de modo que en cada una de ellas estudiamos una
variable aleatoria cualitativa dicotómica (Bernoulli) de parámetros 𝑷𝟏 , 𝑷𝟐 respectivamente. De cada
población vamos a extraer muestras de tamaño 𝒏𝟏 𝐲 𝒏𝟐 .
𝑋1 ≡ 𝑥11 , 𝑥12 , … , 𝑥1𝑛1 𝑦 𝑋2 ≡ 𝑥21 , 𝑥22 , … , 𝑥2𝑛2
Entonces
𝑛1 𝑛2

𝑋1 = ∑ 𝑥1𝑖 ~𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙(𝑛1 , 𝑝1 ) y 𝑋2 = ∑ 𝑥2𝑖 ~𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙(𝑛2 , 𝑝2 )


𝑖=1 𝑖=1

Si las muestras son suficientemente grandes ocurre que una aproximación para un intervalo de
confianza al nivel (1 − 𝛼) para la diferencia de proporciones de dos poblaciones es:

(𝑝̂1 − 𝑝̂ 2 ) − (𝑃1 − 𝑃2 )
𝑍= ~𝑁(0,1)
𝑝̂ (1 − 𝑝̂1 ) 𝑝̂ 2 (1 − 𝑝̂2 )
√ 1 +
𝑛1 𝑛2
Construcción del intervalo

𝑃 (−𝑍𝛼 ≤ 𝑍 ≤ 𝑍𝛼 ) = 1 − 𝛼
2 2

(𝑝̂1 − 𝑝̂ 2 ) − (𝑃1 − 𝑃2 )
𝑃 −𝑍𝛼 ≤ ≤ 𝑍𝛼 =1−𝛼
2 𝑝̂ (1 − 𝑝̂1 ) 𝑝̂ 2 (1 − 𝑝̂2 ) 2
√ 1 +
( 𝑛1 𝑛2 )

𝑝̂1 𝑞̂1 𝑝̂2 𝑞̂2 𝑝̂1 𝑞̂1 𝑝̂2 𝑞̂2


𝑰. 𝑪. (𝑷𝟏 − 𝑷𝟐 ): (𝑝̂1 − 𝑝̂2 ) − 𝑍𝛼 √ + ≤ 𝑃1 − 𝑃2 ≤ (𝑝̂1 − 𝑝̂2 ) + 𝑍𝛼 √ +
2 𝑛1 𝑛2 2 𝑛1 𝑛2

̂𝟏 (𝟏 − 𝒑
𝒑 ̂𝟏 ) 𝒑̂𝟐 (𝟏 − 𝒑
̂𝟐 ) ̂𝟏 (𝟏 − 𝒑
𝒑 ̂𝟏 ) 𝒑̂𝟐 (𝟏 − 𝒑
̂𝟐 )
𝑰. 𝑪. (𝑷𝟏 − 𝑷𝟐 ): (𝒑 ̂ 𝟐 ) − 𝒁𝜶 √
̂𝟏 − 𝒑 + ≤ 𝑷𝟏 − 𝑷𝟐 ≤ (𝒑 ̂𝟐 ) + 𝒁𝜶 √
̂𝟏 − 𝒑 +
𝟐 𝒏𝟏 𝒏𝟐 𝟐 𝒏𝟏 𝒏𝟐

También es equivalente:

̂𝟏 (𝟏 − 𝒑
𝒑 ̂𝟏 ) 𝒑̂𝟐 (𝟏 − 𝒑
̂𝟐 ) ̂𝟏 (𝟏 − 𝒑
𝒑 ̂𝟏 ) 𝒑̂𝟐 (𝟏 − 𝒑
̂𝟐 )
𝑰. 𝑪. (𝑷𝟏 − 𝑷𝟐 ): (𝒑 ̂𝟐 ) − 𝒁𝟏−𝜶 √
̂𝟏 − 𝒑 + ≤ 𝑷𝟏 − 𝑷𝟐 ≤ (𝒑 ̂𝟐 ) + 𝒁𝟏−𝜶 √
̂𝟏 − 𝒑 +
𝟐 𝒏𝟏 𝒏𝟐 𝟐 𝒏𝟏 𝒏𝟐

6
ESTADISTICA II ECO
Ejemplo 1. Se cree que la osteoporosis está relacionada con el sexo. Para ello se elige una muestra de
100 hombres de más de 50 años y una muestra de 200 mujeres en las mismas condiciones. Se obtiene
que 10 hombres y 40 mujeres con algún grado de osteoporosis. ¿Qué podemos concluir con una confianza
del 95 %?
Solución:
Sean
𝑃1 : Incidencia de la osteoporosis en las mujeres de más de 50 años y
𝑃2 : Incidencia de la osteoporosis en los hombres de más de 50 años.
Calculemos un intervalo de confianza para la diferencia (𝑷𝟏 − 𝑷𝟐 ). Si 0 no forma parte de dicho intervalo
con una confianza del 95 % podemos decir que 𝑃1 es diferente a 𝑃2 (con tal grado de confianza, por
supuesto). Los estimadores puntuales insesgados que podemos calcular para ambos parámetros a partir
de las muestras son:
𝑥1 40 𝑥2 10
𝑝̂1 = = = 0.2; 𝑝̂ 2 = = = 0.1; 1 − 𝛼 = 0.95 entonces 𝑍𝛼 = 𝑍0.05 = 𝑍0.025 = 1.96
𝑛1 200 𝑛2 100 2 2

𝑝̂1 (1 − 𝑝̂1 ) 𝑝̂2 (1 − 𝑝̂2 ) 𝑝̂1 (1 − 𝑝̂1 ) 𝑝̂2 (1 − 𝑝̂2 )


𝑰. 𝑪. (𝑷𝟏 − 𝑷𝟐 ): (𝑝̂1 − 𝑝̂2 ) − 𝑍𝛼 √ + ≤ 𝑃1 − 𝑃2 ≤ (𝑝̂1 − 𝑝̂2 ) + 𝑍𝛼 √ +
2 𝑛1 𝑛2 2 𝑛1 𝑛2

0.2(1 − 0.2) 0.1(1 − 0.1)


𝑰. 𝑪. (𝑷𝟏 − 𝑷𝟐 ): (0.2 − 0.1) ± 1.96√ +
200 100

0.2(0.8) 0.1(0.9) 0.2(0.8) 0.1(0.9)


𝐼. 𝐶. (𝑃1 − 𝑃2 ): 0.1 − 1.96√ + ≤ 𝑃1 − 𝑃2 ≤ 0.1 + 1.96√ +
200 100 200 100

𝐼. 𝐶. (𝑃1 − 𝑃2 ): 0.1 − 0.0808 ≤ 𝑃1 − 𝑃2 ≤ 0.1 + 0.0808


𝐼. 𝐶. (𝑃1 − 𝑃2 ): 0.0192 ≤ 𝑃1 − 𝑃2 ≤ 0.1808
Interpretación: Obsérvese que como 0 % no es un valor de dicho intervalo puede concluirse con una
confianza del 95 % que hay diferente incidencia de osteoporosis en hombres que en mujeres para las
personas de más de 50 años. Esta conclusión es algo más pobre de lo que hemos obtenido con el intervalo
de confianza, pero visto de esta manera, este ejemplo puede considerarse como una introducción a los
contrastes de hipótesis.

7
ESTADISTICA II ECO
Ejemplo 2: Se desean comparar las proporciones de ranas pipiens que se encuentran en dos regiones
independientes de México. Para dar una estimación se ha tomado una muestra de 80 ranas observando
que 5 de ellas son de este tipo en la zona A, habiendo 8 de 100 en la zona B. Hallar un intervalo de
confianza al nivel de confianza del 0.95 para la diferencia de proporciones de ranas pipiens.
Solución
Sean
𝑃1 : Ranas pipiens en la zona A. y
𝑃2 : Ranas pipiens en la zona B
𝑥1 5 𝑥1 8
𝑛1 = 80 𝑥1 = 5 → 𝑝̂1 = = = 0.0625; 𝑛2 = 100 ; 𝑥2 = 8 → 𝑝̂2 = = = 0.08 ;
𝑛1 80 𝑛1 100
1 − 𝛼 = 0.95 entonces 𝛼 = 0.05 𝑦 𝑍𝛼 = 𝑍0.05 = 𝑍0.025 = 1.96
2 2

̂𝟏 (𝟏 − 𝒑
𝒑 ̂𝟏 ) 𝒑̂𝟐 (𝟏 − 𝒑
̂𝟐 ) 𝒑̂𝟏 (𝟏 − 𝒑
̂𝟏 ) 𝒑̂𝟐 (𝟏 − 𝒑
̂𝟐 )
𝑰. 𝑪. (𝑷𝟏 − 𝑷𝟐 ): (𝒑 ̂ 𝟐 ) − 𝒁𝜶 √
̂𝟏 − 𝒑 + ≤ 𝑷𝟏 − 𝑷𝟐 ≤ (𝒑 ̂ 𝟐 ) + 𝒁𝜶 √
̂𝟏 − 𝒑 +
𝟐 𝒏𝟏 𝒏𝟐 𝟐 𝒏𝟏 𝒏𝟐

0.06(1 − 0.06) 0.08(1 − 0.08)


𝑰. 𝑪. (𝑷𝟏 − 𝑷𝟐 ): (0.06 − 0.08) ± 1.96√ +
80 100

0.06(0.94) 0.08(0.92)
𝑰. 𝑪. (𝑷𝟏 − 𝑷𝟐 ): − 0.02 ± 1.96√ +
80 100

0.06(0.94) 0.08(0.92)
𝑰. 𝑪. (𝑷𝟏 − 𝑷𝟐 ): − 0.02 ± 1.96√ + = −0.02 ± 0.0744
80 100

𝑰. 𝑪. (𝑷𝟏 − 𝑷𝟐 ): − 𝟎. 𝟎𝟗𝟒𝟒 ≤ 𝑷𝟏 − 𝑷𝟐 ≤ 𝟎. 𝟎𝟓𝟒𝟒


Interpretación: La diferencia de proporciones verdadera 𝑷𝟏 − 𝑷𝟐 de ranas pipiens en la zona A y zona
B varía entre (−0.0944,0.0544) con un 95% de nivel de confianza. Podemos concluir que no hay diferencia
de la presencia de ranas pipiens en la zona A y zona B.

8
ESTADISTICA II ECO
EJERCICIOS PROPUESTOS: INTERVALOS DE CONFIANZA para Diferencia de Medias,
Proporciones
1. Queremos estudiar la influencia que puede tener el tabaco con el peso de los niños al nacer. Para
ello se consideran dos grupos de mujeres embarazadas (unas que fuman un paquete al día y otras
que no) y se obtienen los siguientes datos sobre el peso X, de sus hijos:
Muestra Media Desviación estándar muestral
35 3.6 Kg 0.5 Kg
27 3.2 Kg 0.8 Kg

En ambos grupos los pesos de los recién nacidos provienen de sendas distribuciones normales de
medias desconocidas, y con varianzas que si bien son desconocidas, podemos suponer que son las
mismas. Calcular en cuanto influye el que la madre sea fumadora en el peso de su hijo.
Solución
𝑿: Peso de los niños al nacer
𝑿𝟏 :Mujeres que fuman un paquete al día. 𝑿𝟏 ~𝑵𝒐𝒓𝒎𝒂𝒍(𝝁𝟏 , 𝝈𝟐𝟏 )
𝑿𝟐 :Mujeres que no fuman un paquete al día. 𝑿𝟐 ~𝑵𝒐𝒓𝒎𝒂𝒍(𝝁𝟐 , 𝝈𝟐𝟐 )
Las medias son desconocidas y las varianzas 𝝈𝟐𝟏 𝒚 𝝈𝟐𝟐 también son desconocidas pero son las
mismas, es decir 𝝈𝟐𝟏 = 𝝈𝟐𝟐 entonces se utiliza la distribución T- student
(𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22 (35 − 1)(0.5)2 + (27 − 1)(0.8)2
𝑆𝑝2 = = = 0.419
𝑛1 + 𝑛2 − 2 35 + 27 − 2
𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 1 − 𝛼 = 9.95 → 𝛼 = 0.05
→ 𝒕 ( 𝜶; 𝑛 =𝒕 𝟎.𝟎𝟓 = 𝒕(𝟎.𝟎𝟐𝟓; 60 𝑔𝑙𝑖𝑏) = 𝟐. 𝟎𝟎𝟎𝟑
𝟐 1 +𝑛2 −2) ( ; 35+27−2)
𝟐

𝑆2 𝑆2 𝑆2 𝑆2
𝐼. 𝐶. (𝜇1 − 𝜇2 ): ( (𝒙 ̅ 𝟐 ) − 𝒕 ( 𝜶; 𝑛
̅𝟏 − 𝒙 √ 𝑝 + 𝑝 ≤ 𝝁𝟏 − 𝝁𝟐 ≤ (𝒙
̅ 𝟏 − ̅
𝒙 𝟐 ) + 𝒕 𝜶 √ 𝑝 + 𝑝)
𝟐 1 +𝑛2 −2) 𝒏𝟏 𝒏𝟐 ( ; 𝑛1 +𝑛2 −2) 𝒏
𝟐 𝟏 𝒏𝟐

0.419 0.419
𝐼. 𝐶. (𝜇1 − 𝜇2 ): (𝟑. 𝟔 − 𝟑. 𝟐) ± 𝟐. 𝟎𝟎𝟎𝟑√ +
𝟑𝟓 𝟐𝟕

𝐼. 𝐶. (𝜇1 − 𝜇2 ): 0.4 ± 0.331651


𝐼. 𝐶. (𝜇1 − 𝜇2 ): (0.068349 ≤ 𝜇1 − 𝜇2 ≤ 0.731651)

Interpretación: Podemos concluir que si hay influencia del tabaco en mujeres que fuman un
paquete al día con las mujeres que no fuman un paquete al día porque el intervalo estimado para
la diferencia 𝜇1 − 𝜇2 no contine al cero con un nivel del 95% de confianza.

9
ESTADISTICA II ECO

2. El gasto diario en llamadas telefónicas de dos departamentos X e Y de una misma empresa sigue
una distribución normal, con gasto medio desconocido en ambos. Sin embargo, se conocen las
desviaciones típicas, que son 100 y 110 céntimos de euro para X e Y, respectivamente. La
dirección ha observado que una muestra aleatoria de 20 días, el gasto medio diario en llamadas
realizadas por el departamento X ha sido de 1100 céntimos, y de 1400 en el departamento Y.
Obtener un intervalo de confianza para la diferencia de gastos medios entre ambos
departamentos.
Solución
𝑿, 𝒀: Gasto diario en llamadas telefónicas (céntimos)
𝑿: Gasto diario en llamadas telefónicas en el departamento X i 𝑋~𝑁𝑜𝑟𝑚𝑎𝑙(𝜇1 , 𝜎1 = 100)
𝒀: Gasto diario en llamadas telefónicas en el departamento Y i 𝑌~𝑁𝑜𝑟𝑚𝑎𝑙(𝜇2 , 𝜎2 = 120)
𝑛𝑋 = 20 𝑑í𝑎𝑠 ; 𝑥̅ = 1100 𝑦 𝑛𝑌 = 20 𝑑í𝑎𝑠 ; 𝑦̅ = 1400
Las medias son desconocidas y las varianzas 𝝈𝟐𝟏 = 𝟏𝟎 𝟎𝟎𝟎 𝒚 𝝈𝟐𝟐 = 𝟏𝟒 𝟒𝟎𝟎 son conocidas y son las
diferentes, es decir 𝝈𝟐𝟏 ≠ 𝝈𝟐𝟐 entonces se utiliza la distribución Normal.
𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 1 − 𝛼 = 9.95 → 𝛼 = 0.05 𝑦 𝒁𝜶 = 𝒁𝟎.𝟎𝟓 = 𝒁𝟎.𝟎𝟐𝟓 = 𝟏. 𝟗𝟔
𝟐 𝟐

𝜎2 𝜎2 𝜎2 𝜎2
𝑰. 𝑪. (𝝁𝟏 − 𝝁𝟐 ): ̅𝟐 ) − 𝒁𝜶 √ 1 + 2 ≤ 𝝁𝟏 − 𝝁𝟐 ≤ (𝒙
̅𝟏 − 𝒙
((𝒙 ̅𝟐 ) + 𝒁𝜶 √ 1 + 2 )
̅𝟏 − 𝒙
𝟐 𝒏𝟏 𝒏𝟐 𝟐 𝒏𝟏 𝒏𝟐

14400 10 000
𝑰. 𝑪. (𝝁𝟏 − 𝝁𝟐 ): (1400 − 1100) ± 1.96√ +
20 20

𝑰. 𝑪. (𝝁𝟏 − 𝝁𝟐 ): 300 ± 68.4598


𝑰. 𝑪. (𝝁𝟏 − 𝝁𝟐 ): 231.5402 ≤ 𝝁𝟏 − 𝝁𝟐 ≤ 𝟑𝟔𝟖. 𝟒𝟓𝟗𝟖

10
ESTADISTICA II ECO

Interpretación: Podemos concluir que si hay diferencia entre los gastos diarios en llamadas
telefónicas en los departamentos X i Y porque el intervalo estimado para la diferencia 𝜇1 − 𝜇2 no
contine al cero con un nivel del 95% de confianza.
3. Se está realizando un estudio sobre la calidad del aire en dos zonas A y B. Un indicador de la
calidad es el número de microgr. de partículas en suspensión por 𝑚3 de aire, que suponemos
siguen distribuciones Normales independientes de media 62.237 en A, 61.022 en B y varianzas
iguales. En la zona A se realizan 12 mediciones, obteniéndose una varianza muestral (cuasi-
varianza) de 8.44 microg 2 y en la B 15 mediciones, con una muestral (cuasi-varianza) de 9.44 r
microg 2. Obtener la probabilidad de que la media muestral de A sea como mínimo tres unidades
superior a la media muestral de B.
Solución

𝜎12 𝜎22
𝜇(𝑥̅𝐴 −𝑥̅𝐵 ) = 𝝁𝑨 − 𝝁𝑩 = 62.237 − 61.022 = 1.215 𝜎(𝑥̅𝐴 −𝑥̅𝐵 ) = √ +
𝒏𝟏 𝒏𝟐

𝑆12 𝑆22 8.44 9.44


𝜎(𝑥̅𝐴 −𝑥̅𝐵) = √ + =√ + = 1.1544
𝑛1 𝑛2 12 15

̅𝑨 ≥ 𝟑 + 𝒙
𝒙 ̅𝑩 → 𝒙
̅𝑨 − 𝒙
̅𝑩 ≥ 𝟑
(𝑥̅𝐴 − 𝑥̅𝐵 ) − 𝜇(𝑥̅𝐴 −𝑥̅𝐵 ) 3 − 𝜇(𝑥̅𝐴 −𝑥̅𝐵) 3 − 𝜇(𝑥̅𝐴 −𝑥̅𝐵 )
̅𝑨 − 𝒙
𝑷(𝒙 ̅𝑩 ≥ 𝟑) = 𝑃 ( ≥ ) = 𝑃 (𝑍 ≥ )
𝜎(𝑥̅𝐴 −𝑥̅𝐵) 𝜎(𝑥̅𝐴 −𝑥̅𝐵 ) 𝜎(𝑥̅ 𝐴 −𝑥̅𝐵 )
3 − 1.215
̅𝑨 − 𝒙
𝑷(𝒙 ̅𝑩 ≥ 𝟑) = 𝑃 (𝑍 ≥ ) = 𝑃(𝑍 ≥ 1.5462) = 0.061 = 6.1%
1.1544

11
ESTADISTICA II ECO
4. Se sabe que en una población el 28% de las mujeres y el 25% de los hombres son fumadores. Se
extraen muestras de 42 mujeres y 40 hombres. Determinar la probabilidad de que las mujeres
fumadoras superen a los hombres fumadores en al menos el 4%.

12

También podría gustarte