Está en la página 1de 12

Metodología I - 2020 - Métodos Cuantitativos

EJERCICIOS DE DISCUSIÓN GRUPAL


TEMA: INFERENCIA - INTERVALOS DE CONFIANZA

INFERENCIA

1. ¿Cuáles son las características que deben tener las muestras?


Representatividad: una muestra es representativa si su comportamiento respecto a una característica
en particular replica el comportamiento de la población en estudio.
Aleatoriedad: una muestra es aleatoria si es seleccionada de manera tal que cada miembro de la
población tiene la misma probabilidad de ser seleccionado.

2. Sean 𝑥𝑥̅ , 𝑝𝑝̂ , s, encontrados en una muestra, la cual fue aleatoria y representativa. Escribe los
parámetros poblacionales de los que serían buenos estimadores.
La media (𝜇𝜇), la proporción poblacional (p) y el desvío poblacional (σ).

3. Indica si son verdaderas o falsas las siguientes afirmaciones


a- La distribución de medias muestrales (distribución muestral) presenta menor desvío
cuanto mayor es el tamaño muestral. V F

b- La distribución de las medias muestrales extraídas de una población normal es


normal. V F

c-Si el intervalo del 68 % central en la distribución de medias muestrales de pesos al


nacer se encuentra entre 2900y 3100gr, significa que el 68% de los pesos al nacer de los V F
niños de esa población se encuentran entre esos valores.
d- Si extraigo 100 muestras al azar con reemplazo de cierta población de media 200, el
95% de las medias muestrales obtenidas se espera que sean mayores o iguales a 200. V F

e- Al desvío de la distribución de medias muestrales lo llamamos error estándar V F

𝜎𝜎 𝜎𝜎
a) 𝑋𝑋� ~ 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁 �𝜇𝜇, �, por lo tanto su desvío , disminuye al incrementar el tamaño muestral n.
√𝑛𝑛 √𝑛𝑛

𝜎𝜎
b) 𝑋𝑋� ~ 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁 �𝜇𝜇, � si 𝑋𝑋 ~ 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁(𝜇𝜇, 𝜎𝜎). Si la población no es normal pero tiene un desvío no
√𝑛𝑛
𝜎𝜎
nulo pero finito, la media distribuye “aproximadamente” normal ( 𝑋𝑋� ≈ 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁 �𝜇𝜇, �) (Teorema
√𝑛𝑛
Central del Límite).

c) Significa que, de cada 100 muestras de esta población, en promedio, las medias de 68 de ellas
se encuentran entre 2900 y 3100 g.

d) La distribución de la media, es simétrica respecto a la misma media poblacional 𝜇𝜇. Por lo tanto, el
50% de las medias serán mayores o iguales a 200.
𝜎𝜎
e) es denominado “error estándar”.
√𝑛𝑛
Metodología I 2020 - Métodos Cuantitativos

4. Estas gráficas corresponden, una a la distribución de una variable en la población (𝑋𝑋), y la otra a la
distribución de las medias muestrales (𝑋𝑋�) extraídas de dicha población. Ambas distribuciones son
normales.
a) Indica qué gráfica corresponde a la distribución de la variable 𝑋𝑋, y cuál a la distribución de
las 𝑋𝑋�. Justifica tu respuesta.
b) ¿Cuál es el tamaño (n) de las muestras correspondientes a la distribución de las 𝑋𝑋�?

a) La distribución menos dispersa (línea punteada) corresponde a la distribución de la media


𝜎𝜎
muestral, ya que su desvío estándar es . Para cualquier tamaño de muestra n mayor a 1, el
𝑛𝑛 √
desvío de las medias muestrales es menor que el desvío de la variable X.

𝜎𝜎
< 𝜎𝜎, ∀ 𝑛𝑛 > 1
√𝑛𝑛

b) 𝜇𝜇𝑋𝑋 = 𝜇𝜇𝑋𝑋� = 50, por ser 50 el valor central de ambas distribuciones.


Las líneas verticales indican la posición de los puntos de inflexión de las curvas, por lo tanto:

𝜎𝜎 = 4
𝜎𝜎
=1
√𝑛𝑛
4
= 1 → 4 = √𝑛𝑛
√𝑛𝑛
𝑛𝑛 = 42 = 16

5. a) Sea X una variable aleatoria con distribución normal con 𝜇𝜇 = 4 y 𝜎𝜎 2 = 36, ¿cuál es la
𝑋𝑋−4
distribución de ?
6
b) Sea x1, x2 , x3 ,..... ,xn una muestra aleatoria simple de una variable N(𝜇𝜇0 , 𝜎𝜎), ¿cuál es la
𝑋𝑋�−𝜇𝜇0
distribución de 𝜎𝜎/ ?
√𝑛𝑛

𝑋𝑋−𝜇𝜇
a) Normal tipificada. = 𝑍𝑍 ~ 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁(0; 1)
𝜎𝜎

̅
𝑋𝑋−𝜇𝜇
b) Normal tipificada. = 𝑍𝑍 ~ 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁(0; 1)
𝜎𝜎/ √𝑛𝑛

2
Metodología I 2020 - Métodos Cuantitativos

3
Metodología I 2020 - Métodos Cuantitativos

6. En cierta población la dimensión del radio craneal sigue una distribución normal con media de 180
mm y desviación estándar de 14 mm. Calcula la probabilidad que una muestra aleatoria de tamaño
25 extraída de la población presente una media muestral menor a 185.
𝑋𝑋� − 180 185 − 180
𝑃𝑃(𝑋𝑋� < 185) = 𝑃𝑃 � < � = 𝑃𝑃(𝑍𝑍 < 1,79) = 0,9633
14/√25 14/√25

7. Suponiendo que la concentración de hierro en suero en hombres sanos sigue una distribución
normal con media de 120 µg/100 mL y una desviación estándar de 15 µg/100 mL, calcula la
probabilidad de que en una muestra aleatoria de 50 hombres sanos la media muestral valga entre
115 y 125 µg/100 mL.

Sea 𝑋𝑋 la concentración de hierro en suero de hombres sanos.


Sea 𝑋𝑋� la media de la concentración de hierro en suero en una muestra de 50 hombres sanos.
Por datos de letra sabemos que:
𝑋𝑋 ~ 𝑁𝑁(𝜇𝜇𝑋𝑋 = 120; 𝜎𝜎 = 15)

𝜎𝜎 15
𝑋𝑋� ~ 𝑁𝑁 �𝜇𝜇𝑋𝑋� = 120; = �
√𝑛𝑛 √50
Por lo tanto,
115 − 120 𝑋𝑋� − 120 125 − 120
𝑃𝑃(115 < 𝑋𝑋� < 125) = 𝑃𝑃 � < < � = 𝑃𝑃(−2,36 < 𝑍𝑍 < 2,36)
15/√50 15/√50 15/√50
= 𝑃𝑃(𝑍𝑍 < 2,36) − 𝑃𝑃(𝑍𝑍 < −2,36)

= 0,9909 − 0,091

= 0,9818

DISTRIBUCIÓN MUESTRAL - PROPORCIONES (APROXIMACION NORMAL)

8. Se sabe que, en cierta población, el 8% son daltónicos. Se extrae una muestra aleatoria de 150
individuos. Calcula la probabilidad de encontrar en esa muestra una proporción de daltónicos
mayor de 0,15.
𝑛𝑛 = 150, 𝑝𝑝 = 0,08
Aproximamos la distribución binomial Bin(n,p) a la distribución normal con media µ = np y varianza
Var(X) = np(1-p). Por lo tanto la distribución de proporciones tiene E(X/n) = E(p) = µ = p y Var(X/n) =
p(1-p)/n.
𝜇𝜇𝑝𝑝� = 𝑝𝑝 = 0,08
𝑝𝑝(1−𝑝𝑝) 0,08(1−0,08)
𝜎𝜎𝑝𝑝� 2 = = = 0,00049
𝑛𝑛 150
𝜎𝜎𝑝𝑝� = √0,00049 = 0,022
𝑝𝑝�−𝜇𝜇𝑝𝑝

Como 𝜎𝜎𝑝𝑝
= 𝑍𝑍 ~ 𝑁𝑁(0,1), podemos utilizar la distribución normal estándar para el cálculo de la

siguiente probabilidad:
𝑝𝑝̂ − 0,08 0,15 − 0,08 0,15 − 0,08
𝑃𝑃(𝑝𝑝̂ > 0,15) = 𝑃𝑃 � > � = 𝑃𝑃 �𝑍𝑍 > � = 𝑃𝑃(𝑍𝑍 > 3,15) = 0,0008
0,0222 0,0222 0,0222

4
Metodología I 2020 - Métodos Cuantitativos

INTERVALO CONFIANZA

1. Indica si son verdaderas o falsas las siguientes afirmaciones.


a. Si el intervalo al 95 % de confianza para la media de la edad de cierta población
V F
corresponde de 30 a 35 años, significa que el 95% de esa población tiene edades entre
esos valores.
b. Para una misma muestra un intervalo al 95 % de confianza es menor que uno al 90%.
V F
c. Si quiero disminuir el intervalo de confianza a la mitad, suponiendo todos los demás
V F
parámetro constantes, debo cuadruplicar el tamaño de la muestra.

a) Significa que de cada 100 muestras de esta población, en promedio, las medias de 95 de ellas
se encontrarán entre los 30 y los 35 años.

𝜎𝜎
b) El intervalo de confianza al (1-α)x100% para la media poblacional µ es de la forma �𝑥𝑥̅ ± 𝑧𝑧𝛼𝛼/2 �.
√𝑛𝑛

𝜎𝜎 𝜎𝜎
95% de confianza: �𝑥𝑥̅ ± 𝑧𝑧(1−0,95)/2 � = �𝑥𝑥̅ ± 1,96 �
√𝑛𝑛 √𝑛𝑛

𝜎𝜎 𝜎𝜎
90% de confianza: �𝑥𝑥̅ ± 𝑧𝑧(1−0,90)/2 � = �𝑥𝑥̅ ± 1,65 �
√𝑛𝑛 √𝑛𝑛

Si σ y n permanecen constantes, un intervalo de mayor confianza será más amplio más amplio, por
lo que es más probable que la verdadera media µ esté contenida en él.

5
Metodología I 2020 - Métodos Cuantitativos

𝜎𝜎
c) La imprecisión del intervalo de confianza es I = 𝑧𝑧𝛼𝛼/2 .
√𝑛𝑛

Tengo un intervalo de confianza construido con un tamaño de muestra de tamaño 𝑛𝑛1 :

𝜎𝜎
𝐈𝐈 = 𝑧𝑧𝛼𝛼/2
√𝑛𝑛1

2) Tengo un segundo intervalo de la mitad de la imprecisión del primero con un tamaño de muestra
𝑛𝑛2 :

𝐈𝐈 𝜎𝜎 𝜎𝜎
= 𝑧𝑧𝛼𝛼 → 𝐈𝐈 = 2. 𝑧𝑧𝛼𝛼/2
2 2 √𝑛𝑛2 √𝑛𝑛2

Igualo ambas expresiones por su imprecisión:

𝜎𝜎
𝐈𝐈 = 𝑧𝑧𝛼𝛼/2
√𝑛𝑛1
𝜎𝜎
𝐈𝐈 = 2. 𝑧𝑧𝛼𝛼/2
√𝑛𝑛2
𝜎𝜎 𝜎𝜎
𝑧𝑧𝛼𝛼/2 = 2. 𝑧𝑧𝛼𝛼/2
√𝑛𝑛1 √𝑛𝑛2

𝑧𝑧𝛼𝛼/2 y σ se cancelan debido a que están de ambos miembros de la ecuación,

1 2
= .
√𝑛𝑛1 √𝑛𝑛2

Invierto ambos miembros de la ecuación y despejo 𝑛𝑛2 en función de 𝑛𝑛1 :

√𝑛𝑛2
�𝑛𝑛1 =
2
𝑛𝑛2
𝑛𝑛1 = → 4. 𝑛𝑛1 = 𝑛𝑛2
4

Observo que para obtener un intervalo de la mitad de longitud debo cuadruplicar el tamaño
muestral. La afirmación es verdadera.

2. A partir de una sola muestra aleatoria simple de tamaño n de una población normal, se determina
un intervalo de confianza para la media poblacional. ¿Cuál tiene mayor longitud, un intervalo de
confianza al 95% u otro al 99%? Justifica tu respuesta.
El de 99%. Ver ejercicio 1, b.

3. Se desea estimar la talla de una población de niños de 12 meses, cuyo desvío poblacional es 20
cm. Para ello se toma una muestra aleatoria de 35 niños de dicha población. Se calcula su media
aritmética y resulta ser 110.
a. Estima con una confianza del 95% la talla promedio de la población

6
Metodología I 2020 - Métodos Cuantitativos

b. Si se quiere obtener una mejor estimación (intervalo más chico), pero con la misma
confianza, ¿qué sugerirías modificar?
a)
𝜎𝜎 = 20 cm
𝑛𝑛 = 35
𝑥𝑥̅ = 110 cm
𝜎𝜎
Intervalo de confianza para la media poblacional µ al (1-α)x100% de confianza: 𝑥𝑥̅ ± 𝑧𝑧𝛼𝛼/2
√𝑛𝑛
𝑧𝑧𝛼𝛼/2 = 𝑧𝑧0,05/2 = 𝑧𝑧0,025 = 1,96
Sustituyo los valores de la letra en la expresión para el intervalo de confianza:
20
110 ± 1,96
√35
110 ± 6,6
El intervalo de confianza al 95% para la media poblacional de la de la talla es:
(103,4; 116,6) cm.

b) Se sugiere aumentar n.

4. A partir de los datos de los pesos de una muestra de 130 recién nacidos pertenecientes a una
policlínica barrial, se calculan media y desvío estándar muestrales, resultando: x = 3260 g y s =
562 g. Halla el intervalo de confianza al 95% para la media del peso de los recién nacidos que se
atienden en la policlínica.

𝑥𝑥̅ = 3260 gr
s = 562 g
El desvío poblacional σ es desconocido, por lo tanto la forma del intervalo de confianza para la media
𝑛𝑛−1 𝑠𝑠
poblacional al (1-σ)x100% es: 𝑥𝑥̅ ± 𝑡𝑡𝛼𝛼/2 , pero como n>30 es posible aproximar la distribución t-
𝑛𝑛√
𝑛𝑛−1
student por la distribución normal y utilizar 𝑧𝑧𝛼𝛼/2 en lugar de 𝑡𝑡𝛼𝛼/2 .
𝑧𝑧𝛼𝛼/2 = 𝑧𝑧0,05/2 = 𝑧𝑧0,025 = 1,96
562
3260 ± 1,96
√130
3260 ± 97
El intervalo de confianza al 95% para la media poblacional del peso de los recién nacidos es:
(3163; 3357) g

5. Una muestra de la talla de 100 varones de 4 meses presenta un intervalo de confianza al 95%
entre 91 y 93 cm. (Asumir que la distribución de tallas es normal y no se conoce el desvío
poblacional).
a. Calcula la media muestral y el desvío muestral.
b. Halla el intervalo del 90% de confianza para la media poblacional.

a) Si el intervalo de confianza es (91; 93) cm, el valor localizado en el medio de ambos valores
es el correspondiente a 𝑥𝑥̅ .
93 + 91
𝑥𝑥̅ = = 92 cm.
2

7
Metodología I 2020 - Métodos Cuantitativos

La imprecisión del intervalo de confianza es 1 cm. Para un intervalo de confianza al 95% la


𝑛𝑛−1 𝑠𝑠
imprecisión se calcula: 𝑡𝑡𝛼𝛼/2 , pero como n > 30, es posible aproximar la distribución t-student
√𝑛𝑛
𝑛𝑛−1
por la distribución normal y utilizar 𝑧𝑧𝛼𝛼/2 en lugar de 𝑡𝑡𝛼𝛼/2 . Por lo tanto:
𝑠𝑠
1 cm = 1,96
√100
1. √100
= 𝑠𝑠 = 5,1
1,96

𝑠𝑠 5,10
b) 𝑥𝑥̅ ± 𝑧𝑧𝛼𝛼/2 = 92 ± 1,65 = (91,2; 92,8) cm
√𝑛𝑛 √100

6. Se cree que la vitamina C puede ser útil para reducir el aumento de los depósitos de colesterol en
las paredes internas de las arterias, reduciendo así la posibilidad de ataques al corazón. Se
observó el nivel de colesterol en sangre de 15 personas (con valores encima de lo normal) antes y
después de un tratamiento de un mes con 500 mg de vitamina C por día.
a. Los datos recolectados para esta muestra presentaron una media de disminución de la
colesterolemia de 64,3 mg por 100 mL con un desvío de s = 18,9 mg por 100 mL. Estimar la
disminución promedio por persona del nivel de colesterol usando un intervalo de 95% de
confianza, suponiendo que la colesterolemia se distribuye normalmente.
b. ¿Cuántas personas con nivel de colesterol elevado se deben incluir en el experimento si se
desea estimar la disminución media del nivel de colesterol con un error menor a 2 mg por 100 mL
con confianza de 0,95?

a)
𝑥𝑥̅ = 64,3 mg/100 mL
s = 18,9 mg/100 mL
n = 15
Como n < 30, utilizamos la distribución t-student.
𝑛𝑛−1 14
𝑡𝑡𝛼𝛼/2 = 𝑡𝑡0,025 = 2,14.
14
𝑠𝑠 18,9
𝑥𝑥̅ ± 𝑡𝑡0,025 → 64,3 ± 2,14 → 64,3 ± 10,4 = (53,9; 74,7) mg/100 mL.
√𝑛𝑛 √15

8
Metodología I 2020 - Métodos Cuantitativos

b) Despejando n de la definición de imprecisión y utilizando la distribución normal estándar para


estimar el tamaño muestral:
𝜎𝜎
I = 𝑍𝑍𝛼𝛼/2
√𝑛𝑛
𝜎𝜎 2
𝑛𝑛 = (𝑍𝑍0,05/2 )2 2
I
2
18,9
𝑛𝑛 = 1,962 2 = 343,06 ≈ 344
2

7. Mediante una muestra de 16 asmáticos de una zona rural, se estimó la velocidad pico flujo
espiratorio para esa zona. Los límites del intervalo de confianza para el 95% de confianza fueron:
325 L/min y 375 L/min. Si se supone que los datos se distribuyen normalmente, se pide:
a. Calcula la media y el desvío muestral.
b. Halla el intervalo para el 90% de confianza.

a) La imprecisión del intervalo de confianza es (375 – 350) = 25 L/min. Para un intervalo de


𝑛𝑛−1 𝑠𝑠
confianza al 95% la imprecisión se calcula: I = 𝑡𝑡𝛼𝛼/2 . (n < 30).
√𝑛𝑛
𝑛𝑛−1 15
𝑡𝑡𝛼𝛼/2 = 𝑡𝑡0,025 = 2,13
Por lo tanto:
𝑠𝑠
25 = 2,13
√16
25. √16
= 𝑠𝑠 = 46,9
2,13

a)L1=325; L2=375 , entonces la media es 350


b) Utilizando el desvío obtenido en la parte a:
𝑛𝑛−1 16−1 15
𝑡𝑡𝛼𝛼/2 = 𝑡𝑡0,1/2 = 𝑡𝑡0,05 = 1,75
𝑛𝑛−1
𝑠𝑠 46,9
𝑥𝑥̅ ± 𝑡𝑡𝛼𝛼/2 = 350 ± 1,75 = (329,5; 370,5) L/min.
√ 𝑛𝑛 √16

8. La lluvia pura que cae a través del aire limpio registra un valor de pH de 5,7.
a. Se analiza el pH de muestras de agua de 20 caídas de lluvia y se encuentra un pH promedio
de 3,7 con una desviación estándar de s = 0,5. Encontrar un intervalo de confianza del 99% para
el pH medio y relacionarlo con el de lluvia pura.
b. Supongamos que se desea estimar el pH medio del agua de las lluvias en un área sometida a
una fuerte contaminación debido a las descargas de humo de una planta de electricidad. Se
sabe que s = 0,5 y se desea que la estimación se encuentre a una distancia de la media menor a
0,1 con una probabilidad de 0,95. ¿Cuántas aguas de lluvia se debe incluir en la muestra? (una
medición de pH por caída), ¿sería válido seleccionar todas las muestras de agua de una sola
caída de lluvia?
a)
𝑥𝑥̅ = 3,7
s = 0,5
n = 20

9
Metodología I 2020 - Métodos Cuantitativos

Utilizamos distribución t-student. (n<30)


𝑛𝑛−1 20−1 19
𝑡𝑡𝛼𝛼/2 = 𝑡𝑡0,10/2 = 𝑡𝑡0,005 = 2,86
𝑛𝑛−1 𝑠𝑠 0,5
𝑥𝑥̅ ± 𝑡𝑡𝛼𝛼/2 = 3,7 ± 2,86 = (3,4; 4,0)
√𝑛𝑛 √20
b)
Para la estimación de tamaño muestral a partir de la imprecisión utilizamos la distribución
normal:
𝜎𝜎
I = 𝑍𝑍𝛼𝛼/2
√𝑛𝑛
Despejando n:
𝑠𝑠 2
𝑛𝑛 = (𝑍𝑍0,05/2 )2 2
I
2
0,5
𝑛𝑛 = 1,962 = 96,04 ≈ 97
0,12

No sería válido tomar todas las muestras de una sola caída de agua, ya que es menos probable
que éstas sean realmente representativas del comportamiento del pH en respuesta a la polución.
Por ejemplo, si existe alguna estacionalidad en el fenómeno, una sola caída de agua no va a
recuperar esa variabilidad..

9. Admitiendo que los coeficientes intelectuales tienen una distribución normal con desvío standard
de 30 puntos. Hallar el tamaño de muestra necesario para estimar la media poblacional, con una
probabilidad del 90% de que la media muestral no difiera de la verdadera en más de 5 puntos.

Para la estimación de tamaño muestral a partir de la imprecisión utilizamos la distribución


normal:
𝑍𝑍𝛼𝛼/2 para α = 0,1 es 1,65.
𝜎𝜎
I = 𝑍𝑍𝛼𝛼/2
√𝑛𝑛
Despejando n:
𝜎𝜎 2
𝑛𝑛 = (𝑍𝑍0,1/2 )2 2
I
2
30
𝑛𝑛 = 1,652 2 = 98,01 ≈ 99
5

INTERVALO DE CONFIANZA PARA PROPORCIONES

1. El encargado de archivos de expedientes médicos del Hospital H extrajo al azar una muestra
de 325 historias clínicas de pacientes y encontró que un 8 por ciento de ellas correspondía a
pacientes con patología neurológica. Construye los intervalos de 90, 95 y 99 por ciento de
confianza para la proporción real de historias clínicas neurológicas del Hospital H.

Verifico la correcta aproximación de la distribución binomial por la distribución normal:


¿n.p > 5?
325 x 0,08 = 26 > 5.

10
Metodología I 2020 - Métodos Cuantitativos

𝑝𝑝̂ = 0,08
El intervalo de al (1-α)x100% de confianza para la proporción poblacional p se calcula:
𝑝𝑝̂ (1 − 𝑝𝑝̂ )
𝑝𝑝̂ ± 𝑍𝑍𝛼𝛼/2 �
𝑛𝑛
𝑝𝑝�(1−𝑝𝑝�) 0,08(0,92)
Con 90% de confianza: 𝑝𝑝̂ ± 𝑍𝑍𝛼𝛼/2 � = 0,08 ± 1,64� = (0,055; 0,105)
𝑛𝑛 325

𝑝𝑝�(1−𝑝𝑝�) 0,08(0,92)
Con 95% de confianza:𝑝𝑝̂ ± 𝑍𝑍𝛼𝛼/2 � = 0,08 ± 1,96� = (0,051; 0,109)
𝑛𝑛 325

𝑝𝑝�(1−𝑝𝑝�) 0,08(0,92)
Con 99% de confianza:𝑝𝑝̂ ± 𝑍𝑍𝛼𝛼/2 � = 0,08 ± 2,58� = (0,041; 0,119)
𝑛𝑛 325

2. Una encuesta urbana efectuada a una muestra aleatoria de 150 familias en cierta comunidad
urbana reveló que, en 120 de ellas, por lo menos uno de los miembros de la familia tenía alguna
modalidad de cobertura asistencial privada (Mutual y/o Emergencia Móvil). Calcula los intervalos
de confianza del 90, 95 y 99% para la proporción de familias en la comunidad con alguna
modalidad de cobertura asistencial privada.

𝑝𝑝̂ = 120/150 = 0,8


Verifico la correcta aproximación de la distribución binomial por la distribución normal:
¿n.p > 5?
150 x 0,8 = 120 > 5.
El intervalo de al (1-α)x100% de confianza para la proporción poblacional p se calcula:
𝑝𝑝̂ (1 − 𝑝𝑝̂ )
𝑝𝑝̂ ± 𝑍𝑍𝛼𝛼/2 �
𝑛𝑛
𝑝𝑝�(1−𝑝𝑝�) 0,8(0,2)
Con 90% de confianza: 𝑝𝑝̂ ± 𝑍𝑍𝛼𝛼/2 � = 0,8 ± 1,64� = (0,75; 0,85)
𝑛𝑛 150

𝑝𝑝�(1−𝑝𝑝�) 0,8(0,2)
Con 95% de confianza: 𝑝𝑝̂ ± 𝑍𝑍𝛼𝛼/2 � = 0,8 ± 1,96� = (0,74; 0,86)
𝑛𝑛 150

𝑝𝑝�(1−𝑝𝑝�) 0,8(0,2)
Con 99% de confianza: 𝑝𝑝̂ ± 𝑍𝑍𝛼𝛼/2 � = 0,8 ± 2,58� = (0,72; 0,88)
𝑛𝑛 150

3. ¿Cuántos niños de 5 años se deben incluir en una muestra, tomada para estimar la fracción de
niños que han sido correctamente vacunados hasta esa edad, si se desea que la estimación tenga
un error menor a 0,005 con probabilidad de 0,95 Hacer el cálculo suponiendo una estimación
previa de 0,9 para la fracción real? Luego hacer el cálculo sin estimación previa.

Al igual que para el cálculo del tamaño muestral para estimar la media poblacional, se utiliza la imprecisión
del intervalo de confianza para estimar la proporción poblacional.
IC al (1-α)x100% de confianza para la proporción poblacional p:

𝑝𝑝̂ (1 − 𝑝𝑝̂ )
𝑝𝑝̂ ± 𝑍𝑍𝛼𝛼/2 �
𝑛𝑛
𝑝𝑝�(1−𝑝𝑝�)
Imprecisión = I = 𝑍𝑍𝛼𝛼/2 �
𝑛𝑛

11
Metodología I 2020 - Métodos Cuantitativos

Despejando n de esta expresión obtengo:


(𝑍𝑍𝛼𝛼/2 )2 𝑝𝑝̂ (1 − 𝑝𝑝̂ ) 1,962 𝑝𝑝̂ (1 − 𝑝𝑝̂ )
𝑛𝑛 = = .
I2 0,0052
Si no tengo una estimación previa de la proporción poblacional p, utilizo 𝑝𝑝̂ = 0,5, que es el valor que me dará
el mayor tamaño muestral posible:
1,962 0,5(1 − 0,5)
𝑛𝑛 = = 38416
0,0052
Si tengo estimación previa la utilizo como estimador de p:
1,962 0,9(1 − 0,9)
𝑛𝑛 = = 13829,76 ~ 13830
0,0052

(Preguntas del 1er. Parcial 2013.)Las preguntas refieren a la Tabla 2 del artículo artículo “
Lactancia materna y cáncer de mama: un estudio caso-control en pacientes del Hospital
Nacional Arzobispo Loayza, Lima-Perú”
.
A) Investigadores que comienzan un estudio pretenden estimar la proporción de mujeres
universitarias entre aquellas a las que se les ha realizado un diagnóstico de cáncer de mama
¿Cuál es el tamaño de la muestra necesario para realizar esta estimación con una imprecisión
de 2 puntos porcentuales y una confianza del 95%, tomando como referencia este trabajo?
(Marcar el valor más cercano).

a) 779 b) 601 c)103 d)398


B) ¿Cuál de estos valores es la mejor estimación del desvío de las medias de edad de mujeres
con cáncer de mama en muestras de igual tamaño que la considerada en el artículo?

a) 0,11 b) 1,11 c) 8,4 d) 11,3

C) ¿Cuál es el tamaño de la muestra necesario para estimar la media de edad de las mujeres con
cáncer de mama, tomando como referencia este trabajo, con una confianza del 95% con una
imprecisión de 0.5 años? (Marcar el valor más cercano).

a) 43 b) 277 c) 1085 d) 1963

D) ¿Cuál es el límite superior de un intervalo de confianza del 90% para la media de edad de
menarquia de los casos?

a) 12,57 b) 12,62 c) 12,83 d) 13,18

E) Si en un trabajo posterior se reclutan 450 mujeres con cáncer de mama y se encuentra una
dispersión igual a la de este estudio para la edad de la menarquia, ¿cómo será la longitud del
intervalo de confianza con respecto a la de este estudio?

a) Igual b) Menor c) Mayor d) No se puede predecir

12

También podría gustarte