Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INFERENCIA
2. Sean 𝑥𝑥̅ , 𝑝𝑝̂ , s, encontrados en una muestra, la cual fue aleatoria y representativa. Escribe los
parámetros poblacionales de los que serían buenos estimadores.
La media (𝜇𝜇), la proporción poblacional (p) y el desvío poblacional (σ).
𝜎𝜎 𝜎𝜎
a) 𝑋𝑋� ~ 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁 �𝜇𝜇, �, por lo tanto su desvío , disminuye al incrementar el tamaño muestral n.
√𝑛𝑛 √𝑛𝑛
𝜎𝜎
b) 𝑋𝑋� ~ 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁 �𝜇𝜇, � si 𝑋𝑋 ~ 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁(𝜇𝜇, 𝜎𝜎). Si la población no es normal pero tiene un desvío no
√𝑛𝑛
𝜎𝜎
nulo pero finito, la media distribuye “aproximadamente” normal ( 𝑋𝑋� ≈ 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁 �𝜇𝜇, �) (Teorema
√𝑛𝑛
Central del Límite).
c) Significa que, de cada 100 muestras de esta población, en promedio, las medias de 68 de ellas
se encuentran entre 2900 y 3100 g.
d) La distribución de la media, es simétrica respecto a la misma media poblacional 𝜇𝜇. Por lo tanto, el
50% de las medias serán mayores o iguales a 200.
𝜎𝜎
e) es denominado “error estándar”.
√𝑛𝑛
Metodología I 2020 - Métodos Cuantitativos
4. Estas gráficas corresponden, una a la distribución de una variable en la población (𝑋𝑋), y la otra a la
distribución de las medias muestrales (𝑋𝑋�) extraídas de dicha población. Ambas distribuciones son
normales.
a) Indica qué gráfica corresponde a la distribución de la variable 𝑋𝑋, y cuál a la distribución de
las 𝑋𝑋�. Justifica tu respuesta.
b) ¿Cuál es el tamaño (n) de las muestras correspondientes a la distribución de las 𝑋𝑋�?
𝜎𝜎
< 𝜎𝜎, ∀ 𝑛𝑛 > 1
√𝑛𝑛
𝜎𝜎 = 4
𝜎𝜎
=1
√𝑛𝑛
4
= 1 → 4 = √𝑛𝑛
√𝑛𝑛
𝑛𝑛 = 42 = 16
5. a) Sea X una variable aleatoria con distribución normal con 𝜇𝜇 = 4 y 𝜎𝜎 2 = 36, ¿cuál es la
𝑋𝑋−4
distribución de ?
6
b) Sea x1, x2 , x3 ,..... ,xn una muestra aleatoria simple de una variable N(𝜇𝜇0 , 𝜎𝜎), ¿cuál es la
𝑋𝑋�−𝜇𝜇0
distribución de 𝜎𝜎/ ?
√𝑛𝑛
𝑋𝑋−𝜇𝜇
a) Normal tipificada. = 𝑍𝑍 ~ 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁(0; 1)
𝜎𝜎
̅
𝑋𝑋−𝜇𝜇
b) Normal tipificada. = 𝑍𝑍 ~ 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁(0; 1)
𝜎𝜎/ √𝑛𝑛
2
Metodología I 2020 - Métodos Cuantitativos
3
Metodología I 2020 - Métodos Cuantitativos
6. En cierta población la dimensión del radio craneal sigue una distribución normal con media de 180
mm y desviación estándar de 14 mm. Calcula la probabilidad que una muestra aleatoria de tamaño
25 extraída de la población presente una media muestral menor a 185.
𝑋𝑋� − 180 185 − 180
𝑃𝑃(𝑋𝑋� < 185) = 𝑃𝑃 � < � = 𝑃𝑃(𝑍𝑍 < 1,79) = 0,9633
14/√25 14/√25
7. Suponiendo que la concentración de hierro en suero en hombres sanos sigue una distribución
normal con media de 120 µg/100 mL y una desviación estándar de 15 µg/100 mL, calcula la
probabilidad de que en una muestra aleatoria de 50 hombres sanos la media muestral valga entre
115 y 125 µg/100 mL.
𝜎𝜎 15
𝑋𝑋� ~ 𝑁𝑁 �𝜇𝜇𝑋𝑋� = 120; = �
√𝑛𝑛 √50
Por lo tanto,
115 − 120 𝑋𝑋� − 120 125 − 120
𝑃𝑃(115 < 𝑋𝑋� < 125) = 𝑃𝑃 � < < � = 𝑃𝑃(−2,36 < 𝑍𝑍 < 2,36)
15/√50 15/√50 15/√50
= 𝑃𝑃(𝑍𝑍 < 2,36) − 𝑃𝑃(𝑍𝑍 < −2,36)
= 0,9909 − 0,091
= 0,9818
8. Se sabe que, en cierta población, el 8% son daltónicos. Se extrae una muestra aleatoria de 150
individuos. Calcula la probabilidad de encontrar en esa muestra una proporción de daltónicos
mayor de 0,15.
𝑛𝑛 = 150, 𝑝𝑝 = 0,08
Aproximamos la distribución binomial Bin(n,p) a la distribución normal con media µ = np y varianza
Var(X) = np(1-p). Por lo tanto la distribución de proporciones tiene E(X/n) = E(p) = µ = p y Var(X/n) =
p(1-p)/n.
𝜇𝜇𝑝𝑝� = 𝑝𝑝 = 0,08
𝑝𝑝(1−𝑝𝑝) 0,08(1−0,08)
𝜎𝜎𝑝𝑝� 2 = = = 0,00049
𝑛𝑛 150
𝜎𝜎𝑝𝑝� = √0,00049 = 0,022
𝑝𝑝�−𝜇𝜇𝑝𝑝
�
Como 𝜎𝜎𝑝𝑝
= 𝑍𝑍 ~ 𝑁𝑁(0,1), podemos utilizar la distribución normal estándar para el cálculo de la
�
siguiente probabilidad:
𝑝𝑝̂ − 0,08 0,15 − 0,08 0,15 − 0,08
𝑃𝑃(𝑝𝑝̂ > 0,15) = 𝑃𝑃 � > � = 𝑃𝑃 �𝑍𝑍 > � = 𝑃𝑃(𝑍𝑍 > 3,15) = 0,0008
0,0222 0,0222 0,0222
4
Metodología I 2020 - Métodos Cuantitativos
INTERVALO CONFIANZA
a) Significa que de cada 100 muestras de esta población, en promedio, las medias de 95 de ellas
se encontrarán entre los 30 y los 35 años.
𝜎𝜎
b) El intervalo de confianza al (1-α)x100% para la media poblacional µ es de la forma �𝑥𝑥̅ ± 𝑧𝑧𝛼𝛼/2 �.
√𝑛𝑛
𝜎𝜎 𝜎𝜎
95% de confianza: �𝑥𝑥̅ ± 𝑧𝑧(1−0,95)/2 � = �𝑥𝑥̅ ± 1,96 �
√𝑛𝑛 √𝑛𝑛
𝜎𝜎 𝜎𝜎
90% de confianza: �𝑥𝑥̅ ± 𝑧𝑧(1−0,90)/2 � = �𝑥𝑥̅ ± 1,65 �
√𝑛𝑛 √𝑛𝑛
Si σ y n permanecen constantes, un intervalo de mayor confianza será más amplio más amplio, por
lo que es más probable que la verdadera media µ esté contenida en él.
5
Metodología I 2020 - Métodos Cuantitativos
𝜎𝜎
c) La imprecisión del intervalo de confianza es I = 𝑧𝑧𝛼𝛼/2 .
√𝑛𝑛
𝜎𝜎
𝐈𝐈 = 𝑧𝑧𝛼𝛼/2
√𝑛𝑛1
2) Tengo un segundo intervalo de la mitad de la imprecisión del primero con un tamaño de muestra
𝑛𝑛2 :
𝐈𝐈 𝜎𝜎 𝜎𝜎
= 𝑧𝑧𝛼𝛼 → 𝐈𝐈 = 2. 𝑧𝑧𝛼𝛼/2
2 2 √𝑛𝑛2 √𝑛𝑛2
𝜎𝜎
𝐈𝐈 = 𝑧𝑧𝛼𝛼/2
√𝑛𝑛1
𝜎𝜎
𝐈𝐈 = 2. 𝑧𝑧𝛼𝛼/2
√𝑛𝑛2
𝜎𝜎 𝜎𝜎
𝑧𝑧𝛼𝛼/2 = 2. 𝑧𝑧𝛼𝛼/2
√𝑛𝑛1 √𝑛𝑛2
1 2
= .
√𝑛𝑛1 √𝑛𝑛2
√𝑛𝑛2
�𝑛𝑛1 =
2
𝑛𝑛2
𝑛𝑛1 = → 4. 𝑛𝑛1 = 𝑛𝑛2
4
Observo que para obtener un intervalo de la mitad de longitud debo cuadruplicar el tamaño
muestral. La afirmación es verdadera.
2. A partir de una sola muestra aleatoria simple de tamaño n de una población normal, se determina
un intervalo de confianza para la media poblacional. ¿Cuál tiene mayor longitud, un intervalo de
confianza al 95% u otro al 99%? Justifica tu respuesta.
El de 99%. Ver ejercicio 1, b.
3. Se desea estimar la talla de una población de niños de 12 meses, cuyo desvío poblacional es 20
cm. Para ello se toma una muestra aleatoria de 35 niños de dicha población. Se calcula su media
aritmética y resulta ser 110.
a. Estima con una confianza del 95% la talla promedio de la población
6
Metodología I 2020 - Métodos Cuantitativos
b. Si se quiere obtener una mejor estimación (intervalo más chico), pero con la misma
confianza, ¿qué sugerirías modificar?
a)
𝜎𝜎 = 20 cm
𝑛𝑛 = 35
𝑥𝑥̅ = 110 cm
𝜎𝜎
Intervalo de confianza para la media poblacional µ al (1-α)x100% de confianza: 𝑥𝑥̅ ± 𝑧𝑧𝛼𝛼/2
√𝑛𝑛
𝑧𝑧𝛼𝛼/2 = 𝑧𝑧0,05/2 = 𝑧𝑧0,025 = 1,96
Sustituyo los valores de la letra en la expresión para el intervalo de confianza:
20
110 ± 1,96
√35
110 ± 6,6
El intervalo de confianza al 95% para la media poblacional de la de la talla es:
(103,4; 116,6) cm.
b) Se sugiere aumentar n.
4. A partir de los datos de los pesos de una muestra de 130 recién nacidos pertenecientes a una
policlínica barrial, se calculan media y desvío estándar muestrales, resultando: x = 3260 g y s =
562 g. Halla el intervalo de confianza al 95% para la media del peso de los recién nacidos que se
atienden en la policlínica.
𝑥𝑥̅ = 3260 gr
s = 562 g
El desvío poblacional σ es desconocido, por lo tanto la forma del intervalo de confianza para la media
𝑛𝑛−1 𝑠𝑠
poblacional al (1-σ)x100% es: 𝑥𝑥̅ ± 𝑡𝑡𝛼𝛼/2 , pero como n>30 es posible aproximar la distribución t-
𝑛𝑛√
𝑛𝑛−1
student por la distribución normal y utilizar 𝑧𝑧𝛼𝛼/2 en lugar de 𝑡𝑡𝛼𝛼/2 .
𝑧𝑧𝛼𝛼/2 = 𝑧𝑧0,05/2 = 𝑧𝑧0,025 = 1,96
562
3260 ± 1,96
√130
3260 ± 97
El intervalo de confianza al 95% para la media poblacional del peso de los recién nacidos es:
(3163; 3357) g
5. Una muestra de la talla de 100 varones de 4 meses presenta un intervalo de confianza al 95%
entre 91 y 93 cm. (Asumir que la distribución de tallas es normal y no se conoce el desvío
poblacional).
a. Calcula la media muestral y el desvío muestral.
b. Halla el intervalo del 90% de confianza para la media poblacional.
a) Si el intervalo de confianza es (91; 93) cm, el valor localizado en el medio de ambos valores
es el correspondiente a 𝑥𝑥̅ .
93 + 91
𝑥𝑥̅ = = 92 cm.
2
7
Metodología I 2020 - Métodos Cuantitativos
𝑠𝑠 5,10
b) 𝑥𝑥̅ ± 𝑧𝑧𝛼𝛼/2 = 92 ± 1,65 = (91,2; 92,8) cm
√𝑛𝑛 √100
6. Se cree que la vitamina C puede ser útil para reducir el aumento de los depósitos de colesterol en
las paredes internas de las arterias, reduciendo así la posibilidad de ataques al corazón. Se
observó el nivel de colesterol en sangre de 15 personas (con valores encima de lo normal) antes y
después de un tratamiento de un mes con 500 mg de vitamina C por día.
a. Los datos recolectados para esta muestra presentaron una media de disminución de la
colesterolemia de 64,3 mg por 100 mL con un desvío de s = 18,9 mg por 100 mL. Estimar la
disminución promedio por persona del nivel de colesterol usando un intervalo de 95% de
confianza, suponiendo que la colesterolemia se distribuye normalmente.
b. ¿Cuántas personas con nivel de colesterol elevado se deben incluir en el experimento si se
desea estimar la disminución media del nivel de colesterol con un error menor a 2 mg por 100 mL
con confianza de 0,95?
a)
𝑥𝑥̅ = 64,3 mg/100 mL
s = 18,9 mg/100 mL
n = 15
Como n < 30, utilizamos la distribución t-student.
𝑛𝑛−1 14
𝑡𝑡𝛼𝛼/2 = 𝑡𝑡0,025 = 2,14.
14
𝑠𝑠 18,9
𝑥𝑥̅ ± 𝑡𝑡0,025 → 64,3 ± 2,14 → 64,3 ± 10,4 = (53,9; 74,7) mg/100 mL.
√𝑛𝑛 √15
8
Metodología I 2020 - Métodos Cuantitativos
7. Mediante una muestra de 16 asmáticos de una zona rural, se estimó la velocidad pico flujo
espiratorio para esa zona. Los límites del intervalo de confianza para el 95% de confianza fueron:
325 L/min y 375 L/min. Si se supone que los datos se distribuyen normalmente, se pide:
a. Calcula la media y el desvío muestral.
b. Halla el intervalo para el 90% de confianza.
8. La lluvia pura que cae a través del aire limpio registra un valor de pH de 5,7.
a. Se analiza el pH de muestras de agua de 20 caídas de lluvia y se encuentra un pH promedio
de 3,7 con una desviación estándar de s = 0,5. Encontrar un intervalo de confianza del 99% para
el pH medio y relacionarlo con el de lluvia pura.
b. Supongamos que se desea estimar el pH medio del agua de las lluvias en un área sometida a
una fuerte contaminación debido a las descargas de humo de una planta de electricidad. Se
sabe que s = 0,5 y se desea que la estimación se encuentre a una distancia de la media menor a
0,1 con una probabilidad de 0,95. ¿Cuántas aguas de lluvia se debe incluir en la muestra? (una
medición de pH por caída), ¿sería válido seleccionar todas las muestras de agua de una sola
caída de lluvia?
a)
𝑥𝑥̅ = 3,7
s = 0,5
n = 20
9
Metodología I 2020 - Métodos Cuantitativos
No sería válido tomar todas las muestras de una sola caída de agua, ya que es menos probable
que éstas sean realmente representativas del comportamiento del pH en respuesta a la polución.
Por ejemplo, si existe alguna estacionalidad en el fenómeno, una sola caída de agua no va a
recuperar esa variabilidad..
9. Admitiendo que los coeficientes intelectuales tienen una distribución normal con desvío standard
de 30 puntos. Hallar el tamaño de muestra necesario para estimar la media poblacional, con una
probabilidad del 90% de que la media muestral no difiera de la verdadera en más de 5 puntos.
1. El encargado de archivos de expedientes médicos del Hospital H extrajo al azar una muestra
de 325 historias clínicas de pacientes y encontró que un 8 por ciento de ellas correspondía a
pacientes con patología neurológica. Construye los intervalos de 90, 95 y 99 por ciento de
confianza para la proporción real de historias clínicas neurológicas del Hospital H.
10
Metodología I 2020 - Métodos Cuantitativos
𝑝𝑝̂ = 0,08
El intervalo de al (1-α)x100% de confianza para la proporción poblacional p se calcula:
𝑝𝑝̂ (1 − 𝑝𝑝̂ )
𝑝𝑝̂ ± 𝑍𝑍𝛼𝛼/2 �
𝑛𝑛
𝑝𝑝�(1−𝑝𝑝�) 0,08(0,92)
Con 90% de confianza: 𝑝𝑝̂ ± 𝑍𝑍𝛼𝛼/2 � = 0,08 ± 1,64� = (0,055; 0,105)
𝑛𝑛 325
𝑝𝑝�(1−𝑝𝑝�) 0,08(0,92)
Con 95% de confianza:𝑝𝑝̂ ± 𝑍𝑍𝛼𝛼/2 � = 0,08 ± 1,96� = (0,051; 0,109)
𝑛𝑛 325
𝑝𝑝�(1−𝑝𝑝�) 0,08(0,92)
Con 99% de confianza:𝑝𝑝̂ ± 𝑍𝑍𝛼𝛼/2 � = 0,08 ± 2,58� = (0,041; 0,119)
𝑛𝑛 325
2. Una encuesta urbana efectuada a una muestra aleatoria de 150 familias en cierta comunidad
urbana reveló que, en 120 de ellas, por lo menos uno de los miembros de la familia tenía alguna
modalidad de cobertura asistencial privada (Mutual y/o Emergencia Móvil). Calcula los intervalos
de confianza del 90, 95 y 99% para la proporción de familias en la comunidad con alguna
modalidad de cobertura asistencial privada.
𝑝𝑝�(1−𝑝𝑝�) 0,8(0,2)
Con 95% de confianza: 𝑝𝑝̂ ± 𝑍𝑍𝛼𝛼/2 � = 0,8 ± 1,96� = (0,74; 0,86)
𝑛𝑛 150
𝑝𝑝�(1−𝑝𝑝�) 0,8(0,2)
Con 99% de confianza: 𝑝𝑝̂ ± 𝑍𝑍𝛼𝛼/2 � = 0,8 ± 2,58� = (0,72; 0,88)
𝑛𝑛 150
3. ¿Cuántos niños de 5 años se deben incluir en una muestra, tomada para estimar la fracción de
niños que han sido correctamente vacunados hasta esa edad, si se desea que la estimación tenga
un error menor a 0,005 con probabilidad de 0,95 Hacer el cálculo suponiendo una estimación
previa de 0,9 para la fracción real? Luego hacer el cálculo sin estimación previa.
Al igual que para el cálculo del tamaño muestral para estimar la media poblacional, se utiliza la imprecisión
del intervalo de confianza para estimar la proporción poblacional.
IC al (1-α)x100% de confianza para la proporción poblacional p:
𝑝𝑝̂ (1 − 𝑝𝑝̂ )
𝑝𝑝̂ ± 𝑍𝑍𝛼𝛼/2 �
𝑛𝑛
𝑝𝑝�(1−𝑝𝑝�)
Imprecisión = I = 𝑍𝑍𝛼𝛼/2 �
𝑛𝑛
11
Metodología I 2020 - Métodos Cuantitativos
(Preguntas del 1er. Parcial 2013.)Las preguntas refieren a la Tabla 2 del artículo artículo “
Lactancia materna y cáncer de mama: un estudio caso-control en pacientes del Hospital
Nacional Arzobispo Loayza, Lima-Perú”
.
A) Investigadores que comienzan un estudio pretenden estimar la proporción de mujeres
universitarias entre aquellas a las que se les ha realizado un diagnóstico de cáncer de mama
¿Cuál es el tamaño de la muestra necesario para realizar esta estimación con una imprecisión
de 2 puntos porcentuales y una confianza del 95%, tomando como referencia este trabajo?
(Marcar el valor más cercano).
C) ¿Cuál es el tamaño de la muestra necesario para estimar la media de edad de las mujeres con
cáncer de mama, tomando como referencia este trabajo, con una confianza del 95% con una
imprecisión de 0.5 años? (Marcar el valor más cercano).
D) ¿Cuál es el límite superior de un intervalo de confianza del 90% para la media de edad de
menarquia de los casos?
E) Si en un trabajo posterior se reclutan 450 mujeres con cáncer de mama y se encuentra una
dispersión igual a la de este estudio para la edad de la menarquia, ¿cómo será la longitud del
intervalo de confianza con respecto a la de este estudio?
12