Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INTRODUCIÓN
Definición:
Si una población se puede dividir en “segmentos”, que no presenten traslapes, en tal forma que
la varianza dentro cada segmento sea mínima y que los segmentos se diferencien entre ellos
ampliamente en sus medias, estos segmentos se llaman “estratos”. Si posteriormente dentro de
cada estrato se toma una muestra irrestricta aleatoria, a este procedimiento se le llama
“Muestreo Aleatorio Estratificado”
L = número de estratos
Ni = número de unidades muestrales en el estrato i
N = número de unidades muestrales en la población
= N1 + N2 + …. + NL
EJEMPLO 1:
Una empresa publicitaria está interesada en determinar qué tanto debe enfatizar la publicidad
televisiva en un determinado municipio, y decide realizar una encuesta por muestreo para
estimar el número promedio de horas por semana que se ve la televisión en los hogares del
municipio. Éste comprende dos localidades, llamadas pueblo A y pueblo B, y un área rural. El
pueblo A circunda una fábrica, y la mayoría de los hogares son de trabajadores fabriles con
niños en edad escolar. El pueblo B es un suburbio exclusivo de una ciudad vecina y consta de
habitantes más viejos con pocos niños en casa. Existen 155 hogares en el pueblo A, 62 en el
pueblo B y 93 en el área rural. Analice los méritos de usar muestreo aleatorio estratificado en
esta situación.
Solución:
N= N1+N2+…+NL N1 = 155
N2 = 62 L= 3
N3 = 93 N = 310
Página 1 de 26
Pueblo A, Pueblo B, Área Rural, son 3 grupos naturales (segmentos). Los elementos de cada
segmento “supuestamente” presentan tendencias similares de comportamiento dentro de ellos
(varianza mínima en la variable de interés y = # de horas que se ve TV en los hogares de cada
grupo) y “supuestamente” se diferencian entre ellos en las medias de la variable de interés.
Considerando cada segmento como un estrato se reduce el límite para el error de estimación.
Además, la empresa publicitaria puede tener, por separado, estimaciones para cada estrato.
****************************
EJEMPLO 2:
Se seleccionan las muestras irrestrictas aleatorias y se realizan las entrevistas. Los resultados
correspondientes (y los cálculos correspondientes) se muestran a continuación.
Estime el tiempo promedio que se ve televisión, en horas por semana, para (a) todos los
hogares en el pueblo A y (b) todos los hogares en el pueblo B. En ambos casos fije un límite
para el error de estimación y el intervalo de confianza de aprox 95%.
Solución:
Página 2 de 26
a) Estimador
1 1
𝜇̂ = 𝑦̅𝑒𝑠𝑡 = [𝑁1 𝑦̅1 + 𝑁2 𝑦̅2 + 𝑁3 𝑦̅3 ] = [(155)(33.9) + (62)(25.125) + (93)(19)]
𝑁 310
= 27.675 = 27.7 (Estimador puntual de las horas promedio que ve TV el Municipio,
redondeado a un decimal)
𝐿
1 𝑁𝑖 − 𝑛𝑖 𝑠𝑖 2
2√ 2 ∑ 𝑁𝑖 2 ( )( )
𝑁 𝑁𝑖 𝑛𝑖
𝑖=1
-----------------
Ahora: La estimación para cada estrato (Utilizar fórmulas Muestreo Irrestricto Aleatorio)
-----------------
Límite:
𝑠2 𝑁−𝑛 35.3578947 155−20
2 ∗ √𝑛 ( ) =2∗√ ( ) = 2.48175687 = 2.5
𝑁 20 155
Intervalo:
33.9 ± 2.48175687 → [31.4 , 36.4]] (Estimador por intervalo de las horas promedio que ve TV el
Pueblo A, en horas por semana, redondeado a un decimal)
Página 3 de 26
Pueblo B:
Límite:
𝑠2 𝑁−𝑛 232.410714 62−8
2 ∗ √𝑛 ( ) =2∗√ ( ) = 10.0603736 = 10.1
𝑁 8 62
Intervalo:
25.125 ± 10.0603736 → [15.07 , 35.2] (Estimador por intervalo de las horas promedio que ve TV el
Pueblo B, en horas por semana, redondeado a un decimal)
Zona Rural:
Límite:
𝑠2 𝑁−𝑛 87.6363636 93−12
2 ∗ √𝑛 ( ) =2∗√ ( ) = 5.04408716 = 5.0
𝑁 12 93
Intervalo:
19 ± 5.04408716 → [14 , 24] (Estimador por intervalo de las horas promedio que ve TV la
Zona Rural, en horas por semana, redondeado a un decimal)
Gráficamente:
****************************
EJEMPLO 3:
En el Ejemplo anterior estime el número total de horas por semana que las familias del
municipio dedican a ver televisión. Fije un límite para el error de estimación. Calcule el intervalo
de confianza.
Página 4 de 26
Solución:
a) Estimador:
𝜏̂ = 𝑁 𝑦̅𝑒𝑠𝑡 = (310)(27.675) = 8579.25 𝐻𝑜𝑟𝑎𝑠
b) Límite:
𝐿
𝑁𝑖 − 𝑛𝑖 𝑠𝑖 2
2√∑ 𝑁𝑖 2 ( )( )
𝑁𝑖 𝑛𝑖
𝑖=1
*******************************
EJEMPLO 4:
Una encuesta anterior sugiere que las varianzas de los estratos para el Ejemplo 1 son 12 25 ,
22 225 y 32 100 . Deseamos estimar la media poblacional mediante yest . Seleccione el
tamaño de muestra para obtener un límite en el error de estimación igual a 2 horas, si las
fracciones asignadas son w1 = 1/3, w2 = 1/3, y w3 = 1/3. En otras palabras, se debe tomar un
número igual de observaciones de cada estrato.
Solución:
2
𝑁𝑖 2 𝜎𝑖
∑𝐿𝑖=1
𝑤𝑖
𝑛= 2 𝐿
𝑁 𝐷 + ∑𝑖=1 𝑁𝑖 𝜎𝑖 2
𝑛𝑖 = 𝑤𝑖 𝑛
𝐵2 (2)2
B = 2 horas; D= = =1 [Nota: A partir de ahora tener cuidado con la puntuación]
4 4
Página 5 de 26
N = N1 + N2 + N3 = 155 + 62 +93 = 310
𝐿 2
𝑁𝑖 2 𝜎𝑖 (155)2 (25) (62)2 (225) (93)2 (100)
∑ = + + = 6′991.275
𝑤𝑖 1 1 1
𝑖=1 3 3 3
3
6′991.275
Entonces: 𝑛= = 56,7358491 → 57 𝑂𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠
96.100+27.125
𝑛𝑖 = 𝑤𝑖 𝑛
1
n1 = ( ) (56,7358491) = 18,9119497 → 19
3
1
n2 = ( ) (56,7358491) = 18,9119497 → 19
3
1
n3 = ( ) (56,7358491) = 18,9119497 → 19
3
57
********************************
EJEMPLO 5:
Así como en el Ejemplo 4, supóngase que las varianzas del Ejemplo 1 son aproximadas por
12 25 , 22 225 y 32 100 . Deseamos estimar el total poblacional con un límite de 400
horas para el error de estimación. Seleccione el tamaño de muestra apropiado, si se va a tomar
el mismo número de observaciones en cada estrato.
Solución:
2 2
𝐿 𝑁𝑖 𝜎𝑖
∑𝑖=1
𝑤𝑖
𝑛= 𝐿
𝑁 2 𝐷 + ∑𝑖=1 𝑁𝑖 𝜎𝑖 2
𝐵2 (400)2
B = 400 horas; D= = = 0,41623309
4𝑁2 (4)(310)2
Página 6 de 26
N = N1 + N2 + N3 = 155 + 62 +93 = 310
𝐿 2
𝑁𝑖 2 𝜎𝑖 (155)2 (25) (62)2 (225) (93)2 (100)
∑ = + + = 6′991.275
𝑤𝑖 1 1 1
𝑖=1 3 3 3
3
6′991.275
Entonces: 𝑛= = 104, 153073
40.000+27.125
1
n1 = ( ) (104,153073) = 34,7176909 → 35
3
1
n2 = ( ) (104,153073) = 34,7176909 → 35
3
1
n3 = ( ) (104,153073) = 34,7176909 → 35
3
105
************************************
ASIGNACIÓN DE LA MUESTRA
La empresa publicitaria del Ejemplo 1 encontró que cuesta más obtener una observación del
área rural que una de cualquier pueblo. El incremento es debido a los costos de traslado de un
hogar rural a otro. El costo por observación en cada pueblo se ha estimado en $9.00 (esto es,
c1 = c2 = 9), y los costos por observación en el área rural se han estimado en $16.00 (esto es,
c3 = 16). Las desviaciones estándar por estrato se toman del Ejemplo anterior (5, 15 y 10,
respectivamente). Encuentre el tamaño de muestra total n y los tamaños de muestra para los
estratos (n1, n2 y n3) que permiten a la empresa estimar, al mínimo costo, el tiempo promedio
que se ve televisión, con un límite para el error de estimación igual a 2 horas.
Página 7 de 26
Solución:
𝑁𝑘 𝜎𝑘
[∑𝐿𝑘=1 ] [∑𝐿𝑖=1 𝑁𝑖 𝜎𝑖 √𝑐𝑖 ]
𝑐
√ 𝑘
𝑛=
𝑁 2 + ∑𝐿𝑖=1 𝑁𝑖 𝜎𝑖2
𝐵2 (2)2
B = 2 horas D= 4
= 4
=1 𝑁 2 𝐷 = (310)2 (1) = 96100
Desv.est del
ejemplo anterior
𝑁 𝜎 𝑁 𝜎 (155)(5) (62)(15) (93)(10)
∑𝐿𝑘=1 𝑘 𝑘 = ∑3𝑘=1 𝑘 𝑘 = + + = 800,8333333
√𝑐𝑘 √ 𝑐𝑘 √9 √9 √16
3 Varianza del
ejemplo anterior
∑ 𝑁𝑖 𝜎𝑖2 = (155)(25) + (62)(225) + (93)(100) = 27125
𝑖=1
Entonces:
(800,8333333)(8835)
𝑛= = 57,418239 → 58
96100 + 27125
𝑁𝑖 𝜎𝑖
√ 𝑐𝑖
𝑛𝑖 = [ 𝑁 𝜎 ]∗𝑛
∑𝑘=1 𝑘 𝑘
𝐿
√ 𝑐𝑘
𝑛𝑖 = = =
(155)(5) (62)(15) (93)(10) 258,3333333 + 310 + 232,5 800,8333333
+ +
√9 √9 √16
Página 8 de 26
258,3333333
𝑛1 = [ ] (57,418239) = 18,5220126 → 19
800,833333
310
𝑛2 = [ ] (57,418239) = 22,2264151 → 22
800,833333
232,5
𝑛3 = [ ] (57,418239) = 16,6698113 → 17
800,833333
58 → NOTA: Al mínimo costo
*************************************
Asignación de Neyman:
En algunas ocasiones, el costo por obtener información es el mismo para todos los estratos.
También si los costos son desconocidos, pero hay alguna razón para “suponer” que los costos
por observación son iguales.
La firma publicitaria del Ejemplo 1 decide utilizar entrevistar por teléfono en lugar de entrevistas
personales, porque todos los hogares en el municipio tienen teléfono y este método reduce los
costos. El costo de obtener una observación es entonces el mismo en los tres estratos.
Considere las desviaciones estándar de 5, 15 y 10, respectivamente. La empresa desea estimar
la media poblacional µ con un límite para el error de estimación igual a 2 horas. Encuentre el
tamaño aproximado de la muestra n y los tamaños de muestra para los tres estratos (n1, n2 y
n3).
Solución:
[∑𝐿𝑖=1 𝑁𝑖 𝜎𝑖 ]2
𝑛= 2
𝑁 𝐷 + ∑𝐿𝑖=1 𝑁𝑖 𝜎𝑖 2
𝐵2 (2)2
B = 2 horas D= = =1 𝑁 2 𝐷 = (310)2 (1) = 96100
4 4
𝐿 3
𝑖=1 𝑖=1
Página 9 de 26
𝐿
Entonces:
[2635]2
𝑛= = 56,3459119 → 57
96100 + 27125
𝑁𝑖 𝜎𝑖
𝑛𝑖 = [ 𝐿 ]∗𝑛
∑𝑖=1 𝑁𝑖 𝜎𝑖
(155)(5)
𝑛1 = [ ] ∗ (56,3459119) = 16,572327 → 17
2635
(62)(15)
𝑛2 = [ ] ∗ (56,3459119) = 19,8867925 → 20
2635
(93)(10)
𝑛3 = [ ] ∗ (56,3459119) = 19,8867925 → 20
2635
57 →
************************************
EJEMPLO 8:
Una investigadora quiso estimar el peso promedio de 90 ratas (50 machos y 40 hembras) que
han sido alimentadas con cierta dieta. Las ratas fueron separadas por sexo, por lo que el uso del
muestreo aleatorio estratificado con dos estratos pareció apropiado. Para aproximar la
variabilidad dentro de cada estrato, la investigadora seleccionó la rata más grande y la más
pequeña en cada estrato y las pesó. Ella encontró que la amplitud de variación fue de 10
gramos para los machos y de 8 para las hembras. ¿Qué tan grande debió tomarse la muestra
para estimar el promedio poblacional con un límite de 1 gramo para el error de estimación?
Suponga que el costo de muestreo fue el mismo para ambos estratos.
Solución:
Página 10 de 26
N1= 50 Machos N2= 40 Hembras N = 90 Animales
Amplitud
10 8
𝜎1 ≈ = 2,5 𝜎2 ≈ = 2,0
4 4
𝐵2 (1)2
B=1 D= = = 0,25 𝑁 2 𝐷 = (90)2 (0,25) = 2025
4 4
Asignación de Neyman:
[∑𝐿𝑖=1 𝑁𝑖 𝜎𝑖 ]2
𝑛=
𝑁 2 𝐷 + ∑𝐿𝑖=1 𝑁𝑖 𝜎𝑖 2
Entonces:
[205]2
𝑛= = 16,8268268 → 17 𝐴𝑛𝑖𝑚𝑎𝑙𝑒𝑠
2025 + 472,5
𝑁𝑖 𝜎𝑖
𝑛𝑖 = [ 𝐿 ]∗𝑛
∑𝑖=1 𝑁𝑖 𝜎𝑖
Por tanto:
125
𝑛1 = [ ] ∗ (16,8268268) = 10,2602603 → 10 𝑀𝑎𝑐ℎ𝑜𝑠
205
80
𝑛2 = [ ] ∗ (16,8268268) = 6,56656657 → 7 𝐻𝑒𝑚𝑏𝑟𝑎𝑠
205
17 𝐴𝑛𝑖𝑚𝑎𝑙𝑒𝑠
***************************************
Página 11 de 26
Asignación Proporcional:
Además de encontrar costos iguales, en algunas ocasiones resultan las mismas varianzas.
NOTA: En algunos textos es la única fórmula recomendada para Muestreo Aleatorio Estratificado
(Allí no consideran los casos de costos y varianzas diferentes en los estratos).
EJEMPLO 9: Asignación Proporcional (costos y varianzas iguales)
La empresa publicitaria del Ejemplo 1 considera que las varianzas aproximadas que se usaron
en los ejemplos previos son erróneas y que las varianzas de los estratos son iguales. El valor
común de σi fue aproximado por 10 en un estudio preliminar. Se van a efectuar entrevistas por
teléfono, por lo que los costos serán iguales en todos los estratos. La empresa desea estimar el
número promedio de horas por semana que se ve la televisión en los hogares del municipio, con
un límite para el error de estimación igual a 2 horas. Encuentre el tamaño de muestra y los
tamaños de estratos necesarios para lograr esta exactitud.
Solución:
∑𝐿𝑖=1 𝑁𝑖 𝜎𝑖 2
𝑛=
1
𝑁𝐷 + 𝑁 ∑𝐿𝑖=1 𝑁𝑖 𝜎𝑖 2
𝐵2 (2)2
B = 2 Horas D= = =1 𝑁𝐷 = (310) (1) = 310
4 4
𝐿 3
𝑖=1 𝑖=1
Entonces:
31000
𝑛= = 75,6097561 → 76
1
310 + ( ) (31000)
310
𝑛𝑖 = =
155 + 62 + 93 310
Por tanto:
155
𝑛1 = [ ] ∗ (75,6097561) = 37,804878 → 38
310
Página 12 de 26
62
𝑛2 = [ ] ∗ (75,6097561) = 15,1219512 → 15
310
93
𝑛3 = [ ] ∗ (75,6097561) = 22,6829268 → 23
310
76
*************************************
En la situación del tiempo de ver televisión que hemos estado tratando en estos ejemplos,
supóngase que los costos son como los especificados en el Ejemplo 6. Esto es, c1 = c2 = 9 y c3
= 16. Vamos a aproximar las desviaciones estándar con 5, 15 y 10, respectivamente. Dado que
la empresa publicitaria tiene únicamente $500 para gastar en muestreo, elija el tamaño de
muestra y la asignación correspondiente.
Solución:
Presupuesto $500
c1 = c2 = 9 c3 = 16
σ1 = 5 σ2 = 15 σ3 = 10
NOTA: No se puede utilizar la fórmula para “n” del ejemplo 6, ¿por qué?
Respuesta: Las fórmulas utilizadas anteriormente suponen que no tenemos restricción en
presupuesto.
Entonces, primero el valor de “n” se calcula en forma diferente.
𝑐1 𝑛1 + 𝑐2 𝑛2 + 𝑐3 𝑛3 ≤ 500 → 9𝑛1 + 9𝑛2 + 16𝑛3 = 500 (una ecuación con tres incógnitas)
Recordemos que 𝑛𝑖 = 𝑤𝑖 𝑛
Página 13 de 26
258,3333333
𝑛1 = [ ] (𝑛) = (0.32258065)(𝑛)
800,833333
310
𝑛2 = [ ] (𝑛) = (0.38709677)(𝑛)
800,833333
232,5
𝑛3 = [ ] (𝑛) = (0.29032258)(𝑛)
800,833333
Nota: ∑ 𝑤𝑖 = 1
Entonces reemplazamos:
(11,0322581)(𝑛) = 500
𝑛 = 45,3216374
(Note, esta excepción para el redondeo de “n”. Ahora se hace hacia el entero inferior)
**************************
Página 14 de 26
ESTIMACIÓN DE UNA PROPORCIÓN POBLACIONAL
EJEMPLO 11:
Solución:
Sí ven el programa: 𝑝
̂1 = 0,80; 𝑝
̂2 = 0,25; 𝑝
̂3 = 0,50
a) Estimador:
𝐿
1 1
𝑝̂
𝑒𝑠𝑡 = ∑ 𝑁𝑖 𝑝̂𝑖 = [(155)(0,80) + (62)(0,25) + (93)(0,50)]
𝑁 310
𝑖=1
= 0,60 → 60% (𝑒𝑠𝑡𝑖𝑚𝑎𝑐𝑖ó𝑛 𝑝𝑢𝑛𝑡𝑢𝑎𝑙 𝑑𝑒 𝑙𝑎 𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛)
b) Límite:
𝐿
1 𝑁𝑖 − 𝑛𝑖 𝑝𝑖 𝑞𝑖
2√ 2 ∑ 𝑁𝑖2 ( )( )
𝑁 𝑁𝑖 𝑛𝑖 − 1
𝑖=1
Página 15 de 26
c) Intervalo (confiab aprox 95%):
***************************************
Los datos del Ejemplo 2 fueron tomados de un muestreo realizado el año pasado. La empresa
publicitaria quiere ahora efectuar un nuevo estudio en el mismo municipio para estimar la
proporción de hogares donde ven el programa X. Aunque las fracciones p1, p2 y p3 requeridas
por las fórmulas de proporciones son desconocidas, pueden ser aproximadas por las
estimaciones del estudio anterior, esto es, p̂1 = 0.80, p̂ 2 = 0.25 y p̂3 = 0.50. El costo por
obtener una observación es $9 para cualquiera de los pueblos y $16 para el área rural, esto es
c1 = c2 = 9 y c3 = 16. Los hogares que se encuentran dentro de los estratos son N1 = 155, N2
= 62 y N3 = 93. La empresa quiere estimar la proporción poblacional p, con un límite para el
error de estimación igual a 0.1. Encuentre el tamaño de la muestra n y los tamaños de los
estratos n1, n2 y n3, que darán el límite deseado a un costo mínimo.
Solución:
Asignación Óptima:
𝑝 𝑞
[∑𝐿𝑘=1 𝑁𝑘 √ 𝑘𝑐 𝑘 ] [∑𝐿𝑖=1 𝑁𝑖 √𝑝𝑖 𝑞𝑖 𝑐𝑖 ]
𝑘
𝑛=
𝑁 𝐷 + ∑𝐿𝑖=1 𝑁𝑖 𝑝𝑖 𝑞𝑖
2
Tenemos que:
𝐵2 (0,1)2
B = 0,1 D= = = 0,0025 𝑁 2 𝐷 = (310)2 (0,0025) = 240,25
4 4
3
𝑝𝑘 𝑞𝑘 (0,80)(0,20) (0,25)(0,75) (0,50)(0,50)
∑ 𝑁𝑘 √ = 155 √ + 62 √ + 93 √
𝑐𝑘 9 9 16
𝑘=1
= 20,6666667 + 8,94892917 + 11,625 = 41,2405958
Página 16 de 26
3
Entonces:
(41,2405958)(452,540363)
𝑛= = 62,2256704 → 63
(240,25)(59,675)
20,666667
𝑛1 = [ ] (62,2256704) = 31,1827985 → 31
41,2405958
8,94892917
𝑛2 = [ ] (62,2256704) = 13,5025478 → 14
41,2405958
11,625
𝑛3 = [ ] (62,2256704) = 17,5403241 → 18
41,2405958
63
*************************************
Supóngase que en Ejemplo anterior se van a efectuar entrevistas por teléfono, por lo que los
costos de muestreo son los mismos en todos los estratos. La fracción pi se aproximará por p̂ i , i
= 1, 2, 3. Deseamos estimar la proporción poblacional p con un límite de 0.1 para el error de
estimación. Encuentre el tamaño de muestra apropiado para lograr este límite al costo mínimo.
Solución:
Asignación de Neyman:
2
[∑𝐿𝑖=1 𝑁𝑖 √𝑝𝑖 𝑞𝑖 ]
𝑛= 2
𝑁 𝐷 + ∑𝐿𝑖=1 𝑁𝑖 𝑝𝑖 𝑞𝑖
Tenemos que:
Página 17 de 26
𝐵2 (0,1)2
B = 0,1 D= = = 0,0025 𝑁 2 𝐷 = (310)2 (0,0025) = 240,25
4 4
Entonces:
(135,3467875)2
𝑛= = 61,0777791 → 62
240,25 + 59,675
𝑛𝑖 = =
62 + 26,8467875 + 46,5 135,3467875
Por tanto:
62
𝑛1 = [ ] (61,0777791) = 27,9786641 → 28
135,3467875
26,8467875
𝑛2 = [ ] (61,0777791) = 12,1151169 → 12 → 13
135,3467875
46,5
𝑛3 = [ ] (61,0777791) = 20,9839981 → 21
135,3467875
62
************************************
En la encuesta de televisión del Ejemplo 12 la empresa publicitaria planea utilizar entrevistas por
teléfono, por lo que los costos de muestreo no varían de un estrato a otro. Los tamaños de los
Página 18 de 26
estratos son N1 = 155, N2 = 62 y N3 = 93. Los resultados de la encuesta del año pasado
(véanse tablas del Ejemplo 2) parecen divergir de los de este año. La empresa considera que la
proporción de hogares donde se ve el programa X está cercana a 0.4 en cada uno de los tres
estratos, y desea estimar la proporción poblacional p con un límite de 0.1 para el error de
estimación. Encuentre el tamaño de muestra n y la asignación que provee este límite a mínimo
costo.
Solución:
Asignación Proporcional:
∑𝐿𝑖=1 𝑁𝑖 𝑝𝑖 𝑞𝑖
𝑛=
1
𝑁𝐷 + 𝑁 ∑𝐿𝑖=1 𝑁𝑖 𝑝𝑖 𝑞𝑖
Tenemos que:
𝐵2 (0,1)2
B = 0,1 D= = = 0,0025 𝑁𝐷 = (310) (0,0025) = 0,775
4 4
Entonces:
74,4
𝑛= = 73,3004926 → 74
1
0,775 + (310) (74,4)
𝑛𝑖 = ( ) 𝑛 → 𝑛𝑖 = ( )𝑛
155 + 62 + 93 310
Por tanto:
155
𝑛1 = ( ) (73,3004926) = 36,6502493 → 37
310
62
𝑛2 = ( ) (73,3004926) = 14,6600985 → 15
310
93
𝑛3 = ( ) (73,3004926) = 21,9901478 → 22
310
74
Página 19 de 26
*****************************************
Método para Delimitar los Estratos: Se denomina “Método Acumulativo de la Raíz Cuadrada
de la Frecuencia”
EJEMPLO 15:
Un investigador desea estimar el promedio anual de ventas para 56 empresas, usando una
muestra de n = 15 empresas. Se encuentran disponibles datos de frecuencias en una
clasificación por incrementos de $50 000, y se presentan en la tabla siguiente. ¿Cómo podemos
asignar las empresas a L = 3 estratos?
Solución:
20,27
Para L=3: = 6,76 → (2)(6,76) = 13.52
3
Página 20 de 26
Lo más cercano a 13,52 es 14,2943502
Con esta técnica los tamaños de muestra iguales en los estratos quedan cerca de la óptima.
Antes de realizar una encuesta, los experimentadores deben considerar qué tan grande deben tolerar el error de estimación, y de acuerdo con
esto, seleccionar el tamaño de la muestra. Esta muestra debe ser entonces asignada a los diferentes estratos-
Página 21 de 26
ESTADÍSTICA III
UNIDAD 3 - MUESTREO ALEATORIO ESTRATIFICADO
PARTE 2 – EJERCICIOS PROPUESTOS
1- Una cadena de almacenes está interesada en estimar la proporción de cuentas por cobrar
negligentes. La cadena consiste de 4 almacenes. Así que el costo de muestreo es reducido.
Se usa muestreo aleatorio estratificado, con cada tienda como un estrato. Ya que no se
dispone de información referente a las proporciones poblacionales antes del muestreo, se
usa la asignación proporcional. De la siguiente tabla, estime p, la proporción de cuentas
negligentes para la cadena, y fije un límite para el error de estimación.
Estrato I Estrato II Estrato III Estrato IV
Número de cuentas por cobrar N1 = 65 N2 = 42 N3 = 93 N4 = 25
Tamaño de muestra n1 = 14 n2 = 9 n3 = 21 n4 = 6
Número muestral de cuentas negligentes 4 2 8 1
(Resp: p̂ est =0.30, B = 0.117)
Página 22 de 26
4- Se forma una comisión de zonificación Estrato I Estrato II
para estimar el valor promedio de avalúo N 110 N 168
en un suburbio residencial de una ciudad. 1 2
El suburbio se divide en dos distritos, y se n 20 n 30
1 2
tienen listas separadas de las viviendas de
cada distrito. De los datos presentados en n n
1 2
la tabla de la derecha, estime el valor y i 240000 y i 420000
promedio de avalúo para todas las casas i 1 i 1
en el suburbio, y establezca un límite para n n
el error de estimación (nótese que se 1 2
y i2 2980000000 y i2 6010000000
utilizó la asignación proporcional). i 1 i 1
(Resp: y est 13208 .63, B 560 .48 )
6- Una escuela desea estimar la calificación promedio que Estrato I Estrato II Estrato III
puede ser obtenida en un examen de comprensión de
lectura por estudiantes de quinto grado. Los estudiantes 80 92 85 82 42 32
de la escuela son agrupados en tres estratos, los que 68 85 48 75 36 31
aprenden rápido en el estrato I, los que aprenden 72 87 53 73 65 29
normalmente en el estrato II, y los que aprenden lento 85 91 65 78 43 19
en el estrato III. La escuela decide esta estratificación 90 81 49 69 53 14
porque de esta manera se reduce la variabilidad en las 62 79 72 81 61 31
calificaciones del examen. El quinto grado contiene 55 61 83 53 59 42 30
estudiantes en el estrato I, 80 en el estrato II y 65 en el 68 52 39 32
estrato III. Una muestra aleatoria estratificada de 50 71 61
estudiantes es asignada proporcionalmente, y produce 59 42
muestras irrestrictas aleatorias de n1 = 14, n2 = 20 y n3 =
Página 23 de 26
16. El examen se aplica a la muestra de estudiantes y
se obtienen los resultados de la tabla de la derecha.
Estime la calificación promedio para este grado y
establezca un límite parta el error de estimación.
(Resp: yest 59.99, B 3.032
8- Utilizando los datos del Ejercicio 6, encuentre el tamaño de muestra requerido para estimar
la calificación promedio, con un límite de 4 puntos para el error de estimación. Use
asignación proporcional. (Resp: n = 33)
9- Repita el Ejercicio 8, ahora usando la asignación de Neyman. Compare los resultados con la
respuesta del Ejercicio 8. (Resp: n = 32)
10- Un guardabosque quiere estimar el número total de hectáreas plantadas de árboles en las
fincas de un municipio. Ya que el número de hectáreas de árboles varía considerablemente
con respecto al tamaño de la finca, decide estratificar con base en el tamaño de las fincas.
Las 240 fincas del municipio son puestas en una de cuatro categorías de acuerdo con el
tamaño. Una muestra aleatoria estratificada de 40 fincas, seleccionada mediante asignación
proporcional, produce los resultados de la siguiente tabla (número de hectáreas plantadas
de árboles). Estime el número total de hectáreas plantadas de árboles en las fincas del
municipio, y fije un límite para el error de estimación.
11- El estudio del Ejercicio 10 se va a hacer anualmente, con el límite para el error de
estimación de 5000 hectáreas. Encuentre un tamaño de muestra aproximado para adquirir
este límite si se usa la asignación de Neyman. Use los datos del Ejercicio 10. (Resp: n =
60).
Página 24 de 26
12- Una psicóloga que está trabajando con un grupo de adultos con retraso mental, desea
estimar su tiempo de reacción promedio a un cierto estímulo. Ella considera que varones y
mujeres probablemente presentarán una diferencia en tiempos de reacción, por lo que
desea estratificar con base en los sexos. El grupo de 96 personas tiene 43 varones. En
estudios previos de este tipo de investigaciones se ha encontrado que los tiempos
presentan una amplitud de variación de 5 a 20 segundos para varones y de 3 a 14
segundos para mujeres. Los costos de muestreo son los mismos para ambos estratos.
Usando la asignación óptima, encuentre el tamaño de muestra aproximado necesario para
estimar el tiempo de reacción promedio para el grupo, con un límite aproximado a un
segundo. (Resp: n = 29).
13- El Concejo Municipal está interesado en ampliar las instalaciones de un centro de atención
diurna para niños con retraso mental. La ampliación va a incrementar los costos de
asistencia a los niños del centro. Se va a realizar una encuesta por muestreo para estimar la
proporción de familias con niños afectados que utilizarán las instalaciones ampliadas. Las
familias están divididas en aquellas que usan las instalaciones y aquellas que no lo hacen.
Algunas familias viven en la ciudad donde se encuentra localizado el centro, y otras viven en
las áreas rurales o suburbanas de los alrededores. Entonces se usa muestreo aleatorio
estratificado con personas en la ciudad que usan las instalaciones, personas de los
alrededores que las usan, personas en la ciudad que no las usan, y personas en los
alrededores que no las usan, formando los estratos I, II, III y IV, respectivamente.
Aproximadamente 90% de los que usan las instalaciones y 50% de los que no las usan van
a utilizar las nuevas instalaciones. Los costos por efectuar la observación de un cliente
actual es de $4, y de $8 para uno que no lo es. La diferencia en el costo resulta de la
dificultad para localizar a quienes no usan las instalaciones. Registros existentes nos dan N1
= 97, N2 = 43, N3 = 145 y N4 = 68. Encuentre el tamaño de muestra aproximado y la
asignación necesaria para estimar la proporción poblacional con un límite de 0.05 para el
error de estimación. (Resp: n = 158, n1 = 39, n2 = 17, n3 = 69, n4 = 33) .
14- Se lleva a cabo la encuesta del Ejercicio 13 y se obtiene la siguiente proporción de familias
que usarán las nuevas instalaciones: pˆ 1 0.87 , pˆ 2 0.93 , pˆ 3 0.60 , pˆ 4 0.53 . Estime la
proporción poblacional p, y establezca un límite para el error de estimación. ¿Se logró el
límite deseado? (Resp: pˆ est 0.701, B 0.0503 )
15- Suponga que en el Ejercicio 13 el costo total de muestreo se fija en $400. Elija el tamaño de
muestra y la asignación que minimiza la varianza del estimador p̂ est para este costo fijado.
(Resp: n = 62, n1 = 17, n2 = 6, n3 = 26, n4 = 13) .
16- Considere la información que se da en el Ejemplo 17 (visto en clase) sobre las 56 empresas
comerciales.
Página 25 de 26
b) Ahora suponga que el punto divisorio entre los dos estratos es cambiado a 300000.
Suponga que se toman las mismas 15 mediciones en una muestra aleatoria estratificada
de n1 = 8 y n2 = 7. Nótese que este muestreo cambia el valor 280 del estrato 2 al estrato
1. (Este resultado no es probable que se presente en la práctica, y se utiliza aquí sólo
con fines explicativos). Encuentre yest y calcule la varianza estimada de yest . La
respuesta numérica debe indicar la superioridad del método acumulativo de la raíz
cuadrada de frecuencias.
(Resp: (a) yest 251 .07, Vˆ yest 141 .81 ) (b) yest 250 .05, Vˆ yest 181 .25 )
19- Una verificación de control de calidad estándar para baterías de Mes A Mes B
automóviles consiste simplemente en registrar su peso. Un
embarque particular de una fábrica consistió de baterías producidas 61.5 64.5
en dos meses diferentes, con el mismo número de baterías para 63.5 63.8
cada mes. El investigador decide estratificar con base en meses 63.5 63.5
para el muestreo de inspección a fin de observar la variación 64.0 66.5
mensual. Las muestras irrestrictas aleatorias de pesos de baterías 63.8 63.5
para los dos meses mostraron las mediciones (en libras) que 64.5 64.0
aparecen a la derecha. Estime el peso promedio de las baterías en
la población (el embarque), y fije un límite para el error de
estimación. Descarte la cpf. El estándar de la fábrica para este tipo
de baterías es de 69 libras. ¿Considera usted que el embarque
cumple el estándar promedio?
(Resp: yest 63.88, B 0.628 )
Página 26 de 26