Está en la página 1de 26

ESTADÍSTICA III

UNIDAD 3 - MUESTREO ALEATORIO ESTRATIFICADO


PARTE 1 – EJEMPLOS DE CLASE

INTRODUCIÓN

Definición:

Si una población se puede dividir en “segmentos”, que no presenten traslapes, en tal forma que
la varianza dentro cada segmento sea mínima y que los segmentos se diferencien entre ellos
ampliamente en sus medias, estos segmentos se llaman “estratos”. Si posteriormente dentro de
cada estrato se toma una muestra irrestricta aleatoria, a este procedimiento se le llama
“Muestreo Aleatorio Estratificado”

CÓMO SELECCIONAR UNA MUESTRA ALEATORIA ESTRATIFICADA

Se utiliza la siguiente notación:

L = número de estratos
Ni = número de unidades muestrales en el estrato i
N = número de unidades muestrales en la población
= N1 + N2 + …. + NL

EJEMPLO 1:

Una empresa publicitaria está interesada en determinar qué tanto debe enfatizar la publicidad
televisiva en un determinado municipio, y decide realizar una encuesta por muestreo para
estimar el número promedio de horas por semana que se ve la televisión en los hogares del
municipio. Éste comprende dos localidades, llamadas pueblo A y pueblo B, y un área rural. El
pueblo A circunda una fábrica, y la mayoría de los hogares son de trabajadores fabriles con
niños en edad escolar. El pueblo B es un suburbio exclusivo de una ciudad vecina y consta de
habitantes más viejos con pocos niños en casa. Existen 155 hogares en el pueblo A, 62 en el
pueblo B y 93 en el área rural. Analice los méritos de usar muestreo aleatorio estratificado en
esta situación.

Solución:

N= N1+N2+…+NL N1 = 155
N2 = 62 L= 3
N3 = 93 N = 310

Página 1 de 26
Pueblo A, Pueblo B, Área Rural, son 3 grupos naturales (segmentos). Los elementos de cada
segmento “supuestamente” presentan tendencias similares de comportamiento dentro de ellos
(varianza mínima en la variable de interés y = # de horas que se ve TV en los hogares de cada
grupo) y “supuestamente” se diferencian entre ellos en las medias de la variable de interés.

Considerando cada segmento como un estrato se reduce el límite para el error de estimación.

Además, la empresa publicitaria puede tener, por separado, estimaciones para cada estrato.

****************************

ESTIMACIÓN DE UNA MEDIA Y UN TOTAL POBLACIONALES

EJEMPLO 2:

Suponga que se lleva a cabo la encuesta planeada en el ejemplo anterior. La empresa


publicitaria tiene tiempo y dinero suficiente para entrevistar n = 40 hogares, y decide
seleccionar muestras aleatorias de tamaño n1 = 20 del pueblo A, n2 = 8 del pueblo B, y n3 = 12
del área rural (Después analizaremos la elección de los tamaños de muestra).

Se seleccionan las muestras irrestrictas aleatorias y se realizan las entrevistas. Los resultados
correspondientes (y los cálculos correspondientes) se muestran a continuación.

Estime el tiempo promedio que se ve televisión, en horas por semana, para (a) todos los
hogares en el pueblo A y (b) todos los hogares en el pueblo B. En ambos casos fije un límite
para el error de estimación y el intervalo de confianza de aprox 95%.

Tiempo que se ve televisión Cálculos


(horas/semana)
Estrato 1, Estrato Estrato 3, Estrato 1 Estrato 2 Estrato 3
Pueblo A 2, Área Rural
Pueblo B
35 28 26 27 4 49 8 15 21 n1 = 20 n2 = 8 n3 = 12
41 43 29 10 15 41 7 14 30 y1  33.9 y 2  25.125 y3  19
32 37 36 25 30 20 11 12
25 29 31 32 34 24 s12  35.3578947 s22  232.410714 s32  87.6363636
39 38 40 N1 = 155 N2 = 62 N3 = 93
45 28 27
35 34

Solución:

Página 2 de 26
a) Estimador

1 1
𝜇̂ = 𝑦̅𝑒𝑠𝑡 = [𝑁1 𝑦̅1 + 𝑁2 𝑦̅2 + 𝑁3 𝑦̅3 ] = [(155)(33.9) + (62)(25.125) + (93)(19)]
𝑁 310
= 27.675 = 27.7 (Estimador puntual de las horas promedio que ve TV el Municipio,
redondeado a un decimal)

b) Límite para el Error de Estimación

𝐿
1 𝑁𝑖 − 𝑛𝑖 𝑠𝑖 2
2√ 2 ∑ 𝑁𝑖 2 ( )( )
𝑁 𝑁𝑖 𝑛𝑖
𝑖=1

1 155 − 20 35.3578947 62 − 8 232.410714


= 2√ 2 [(155)2 ( )( ) + (62)2 ( )( )+ ⋯]
(310) 155 20 62 8
= 2.80679129

c) Intervalo de Confianza (aprox 95%)

27.675 ± 2.80679129 → [[28.8682087 , 30.4817913] −→ [29.9 , 30.5 ] (Estimador por intervalo


de las horas promedio que ve TV el Municipio, en horas por semana, redondeado a un decimal)

-----------------

Ahora: La estimación para cada estrato (Utilizar fórmulas Muestreo Irrestricto Aleatorio)

-----------------

Pueblo A: (Estimador puntual se conoce, ver arriba, y1  33.9 )

Límite:
𝑠2 𝑁−𝑛 35.3578947 155−20
2 ∗ √𝑛 ( ) =2∗√ ( ) = 2.48175687 = 2.5
𝑁 20 155

Intervalo:
33.9 ± 2.48175687 → [31.4 , 36.4]] (Estimador por intervalo de las horas promedio que ve TV el
Pueblo A, en horas por semana, redondeado a un decimal)

Página 3 de 26
Pueblo B:

Límite:
𝑠2 𝑁−𝑛 232.410714 62−8
2 ∗ √𝑛 ( ) =2∗√ ( ) = 10.0603736 = 10.1
𝑁 8 62

Intervalo:
25.125 ± 10.0603736 → [15.07 , 35.2] (Estimador por intervalo de las horas promedio que ve TV el
Pueblo B, en horas por semana, redondeado a un decimal)

Zona Rural:

Límite:
𝑠2 𝑁−𝑛 87.6363636 93−12
2 ∗ √𝑛 ( ) =2∗√ ( ) = 5.04408716 = 5.0
𝑁 12 93

Intervalo:
19 ± 5.04408716 → [14 , 24] (Estimador por intervalo de las horas promedio que ve TV la
Zona Rural, en horas por semana, redondeado a un decimal)

Gráficamente:

****************************

EJEMPLO 3:

En el Ejemplo anterior estime el número total de horas por semana que las familias del
municipio dedican a ver televisión. Fije un límite para el error de estimación. Calcule el intervalo
de confianza.

Página 4 de 26
Solución:

a) Estimador:
𝜏̂ = 𝑁 𝑦̅𝑒𝑠𝑡 = (310)(27.675) = 8579.25 𝐻𝑜𝑟𝑎𝑠

b) Límite:
𝐿
𝑁𝑖 − 𝑛𝑖 𝑠𝑖 2
2√∑ 𝑁𝑖 2 ( )( )
𝑁𝑖 𝑛𝑖
𝑖=1

155 − 20 35.3578947 62 − 8 232.410714


= 2√(155)2 ( )( ) + (62)2 ( )( ) + ⋯ = 870.105301
155 20 62 8

c) Intervalo (conf aprox 95%):


8579.25 ± 870.105301 → [7709 , 9449] 𝐻𝑜𝑟𝑎𝑠 𝑡𝑜𝑡𝑎𝑙𝑒𝑠 𝑒𝑛 𝑒𝑙 𝑀𝑐𝑝𝑖𝑜

*******************************

SELECCIÓN DEL TAMAÑO DE MUESTRA PARA ESTIMAR LA MEDIA Y EL TOTAL DE LA


POBLACIÓN

EJEMPLO 4:

Una encuesta anterior sugiere que las varianzas de los estratos para el Ejemplo 1 son  12  25 ,
 22  225 y  32  100 . Deseamos estimar la media poblacional mediante yest . Seleccione el
tamaño de muestra para obtener un límite en el error de estimación igual a 2 horas, si las
fracciones asignadas son w1 = 1/3, w2 = 1/3, y w3 = 1/3. En otras palabras, se debe tomar un
número igual de observaciones de cada estrato.

Solución:

2
𝑁𝑖 2 𝜎𝑖
∑𝐿𝑖=1
𝑤𝑖
𝑛= 2 𝐿
𝑁 𝐷 + ∑𝑖=1 𝑁𝑖 𝜎𝑖 2
𝑛𝑖 = 𝑤𝑖 𝑛
𝐵2 (2)2
B = 2 horas; D= = =1 [Nota: A partir de ahora tener cuidado con la puntuación]
4 4

Página 5 de 26
N = N1 + N2 + N3 = 155 + 62 +93 = 310

𝐿 2
𝑁𝑖 2 𝜎𝑖 (155)2 (25) (62)2 (225) (93)2 (100)
∑ = + + = 6′991.275
𝑤𝑖 1 1 1
𝑖=1 3 3 3
3

∑ 𝑁𝑖 𝜎𝑖 2 = (155)(25) + (62)(225) + (93)(100) = 27.125


𝑖=1

𝑁 2 𝐷 = (310)2 (1) = 96.100

6′991.275
Entonces: 𝑛= = 56,7358491 → 57 𝑂𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠
96.100+27.125

Para cada Estrato:

𝑛𝑖 = 𝑤𝑖 𝑛
1
n1 = ( ) (56,7358491) = 18,9119497 → 19
3
1
n2 = ( ) (56,7358491) = 18,9119497 → 19
3
1
n3 = ( ) (56,7358491) = 18,9119497 → 19
3
57

********************************

EJEMPLO 5:

Así como en el Ejemplo 4, supóngase que las varianzas del Ejemplo 1 son aproximadas por
 12  25 ,  22  225 y  32  100 . Deseamos estimar el total poblacional  con un límite de 400
horas para el error de estimación. Seleccione el tamaño de muestra apropiado, si se va a tomar
el mismo número de observaciones en cada estrato.

Solución:
2 2
𝐿 𝑁𝑖 𝜎𝑖
∑𝑖=1
𝑤𝑖
𝑛= 𝐿
𝑁 2 𝐷 + ∑𝑖=1 𝑁𝑖 𝜎𝑖 2

𝐵2 (400)2
B = 400 horas; D= = = 0,41623309
4𝑁2 (4)(310)2

Página 6 de 26
N = N1 + N2 + N3 = 155 + 62 +93 = 310

𝐿 2
𝑁𝑖 2 𝜎𝑖 (155)2 (25) (62)2 (225) (93)2 (100)
∑ = + + = 6′991.275
𝑤𝑖 1 1 1
𝑖=1 3 3 3
3

∑ 𝑁𝑖 𝜎𝑖 2 = (155)(25) + (62)(225) + (93)(100) = 27.125


𝑖=1

𝑁 2 𝐷 = (310)2 (0,41623309) = 40.000

6′991.275
Entonces: 𝑛= = 104, 153073
40.000+27.125

Para cada Estrato: 𝑛𝑖 = 𝑤𝑖 ∗ 𝑛

1
n1 = ( ) (104,153073) = 34,7176909 → 35
3
1
n2 = ( ) (104,153073) = 34,7176909 → 35
3
1
n3 = ( ) (104,153073) = 34,7176909 → 35
3
105

************************************

ASIGNACIÓN DE LA MUESTRA

EJEMPLO 6: Asignación Óptima (Minimiza costos):

La empresa publicitaria del Ejemplo 1 encontró que cuesta más obtener una observación del
área rural que una de cualquier pueblo. El incremento es debido a los costos de traslado de un
hogar rural a otro. El costo por observación en cada pueblo se ha estimado en $9.00 (esto es,
c1 = c2 = 9), y los costos por observación en el área rural se han estimado en $16.00 (esto es,
c3 = 16). Las desviaciones estándar por estrato se toman del Ejemplo anterior (5, 15 y 10,
respectivamente). Encuentre el tamaño de muestra total n y los tamaños de muestra para los
estratos (n1, n2 y n3) que permiten a la empresa estimar, al mínimo costo, el tiempo promedio
que se ve televisión, con un límite para el error de estimación igual a 2 horas.

Página 7 de 26
Solución:

𝑁𝑘 𝜎𝑘
[∑𝐿𝑘=1 ] [∑𝐿𝑖=1 𝑁𝑖 𝜎𝑖 √𝑐𝑖 ]
𝑐
√ 𝑘
𝑛=
𝑁 2 + ∑𝐿𝑖=1 𝑁𝑖 𝜎𝑖2

𝐵2 (2)2
B = 2 horas D= 4
= 4
=1 𝑁 2 𝐷 = (310)2 (1) = 96100

Desv.est del
ejemplo anterior
𝑁 𝜎 𝑁 𝜎 (155)(5) (62)(15) (93)(10)
∑𝐿𝑘=1 𝑘 𝑘 = ∑3𝑘=1 𝑘 𝑘 = + + = 800,8333333
√𝑐𝑘 √ 𝑐𝑘 √9 √9 √16

∑ 𝑁𝑖 𝜎𝑖 √𝑐𝑖 = (155)(5)(√9) + (62)(15)(√9) + (93)(10)(√16) = 8835


𝑖=1

3 Varianza del
ejemplo anterior
∑ 𝑁𝑖 𝜎𝑖2 = (155)(25) + (62)(225) + (93)(100) = 27125
𝑖=1

Entonces:

(800,8333333)(8835)
𝑛= = 57,418239 → 58
96100 + 27125

Asignación en los Estratos:

𝑁𝑖 𝜎𝑖
√ 𝑐𝑖
𝑛𝑖 = [ 𝑁 𝜎 ]∗𝑛
∑𝑘=1 𝑘 𝑘
𝐿
√ 𝑐𝑘

𝑛𝑖 = = =
(155)(5) (62)(15) (93)(10) 258,3333333 + 310 + 232,5 800,8333333
+ +
√9 √9 √16

Por tanto: [Note: ni = wi * n ]

Página 8 de 26
258,3333333
𝑛1 = [ ] (57,418239) = 18,5220126 → 19
800,833333

310
𝑛2 = [ ] (57,418239) = 22,2264151 → 22
800,833333

232,5
𝑛3 = [ ] (57,418239) = 16,6698113 → 17
800,833333
58 → NOTA: Al mínimo costo

*************************************

Asignación de Neyman:

En algunas ocasiones, el costo por obtener información es el mismo para todos los estratos.

También si los costos son desconocidos, pero hay alguna razón para “suponer” que los costos
por observación son iguales.

EJEMPLO 7: Asignación de Neyman (costos iguales)

La firma publicitaria del Ejemplo 1 decide utilizar entrevistar por teléfono en lugar de entrevistas
personales, porque todos los hogares en el municipio tienen teléfono y este método reduce los
costos. El costo de obtener una observación es entonces el mismo en los tres estratos.
Considere las desviaciones estándar de 5, 15 y 10, respectivamente. La empresa desea estimar
la media poblacional µ con un límite para el error de estimación igual a 2 horas. Encuentre el
tamaño aproximado de la muestra n y los tamaños de muestra para los tres estratos (n1, n2 y
n3).

Solución:

[∑𝐿𝑖=1 𝑁𝑖 𝜎𝑖 ]2
𝑛= 2
𝑁 𝐷 + ∑𝐿𝑖=1 𝑁𝑖 𝜎𝑖 2

𝐵2 (2)2
B = 2 horas D= = =1 𝑁 2 𝐷 = (310)2 (1) = 96100
4 4

𝐿 3

∑ 𝑁𝑖 𝜎𝑖 = ∑ 𝑁𝑖 𝜎𝑖2 = (155)(25) + (62)(225) + (93)(100) = 27125


2

𝑖=1 𝑖=1

Página 9 de 26
𝐿

∑ 𝑁𝑖 𝜎𝑖 = (155)(5) + (62)(15) + (93)(10) = 2635


𝑖=1

Entonces:
[2635]2
𝑛= = 56,3459119 → 57
96100 + 27125

Asignación en los Estratos (ni = wi * n):

𝑁𝑖 𝜎𝑖
𝑛𝑖 = [ 𝐿 ]∗𝑛
∑𝑖=1 𝑁𝑖 𝜎𝑖

(155)(5)
𝑛1 = [ ] ∗ (56,3459119) = 16,572327 → 17
2635

(62)(15)
𝑛2 = [ ] ∗ (56,3459119) = 19,8867925 → 20
2635

(93)(10)
𝑛3 = [ ] ∗ (56,3459119) = 19,8867925 → 20
2635
57 →

NOTE: “n” es casi igual al ejemplo anterior, pero la


asignación ha cambiado ya podemos tomar un
poco de más observaciones en rural (ya no
tienen costo más alto).

************************************

EJEMPLO 8:

Una investigadora quiso estimar el peso promedio de 90 ratas (50 machos y 40 hembras) que
han sido alimentadas con cierta dieta. Las ratas fueron separadas por sexo, por lo que el uso del
muestreo aleatorio estratificado con dos estratos pareció apropiado. Para aproximar la
variabilidad dentro de cada estrato, la investigadora seleccionó la rata más grande y la más
pequeña en cada estrato y las pesó. Ella encontró que la amplitud de variación fue de 10
gramos para los machos y de 8 para las hembras. ¿Qué tan grande debió tomarse la muestra
para estimar el promedio poblacional con un límite de 1 gramo para el error de estimación?
Suponga que el costo de muestreo fue el mismo para ambos estratos.

Solución:

Página 10 de 26
N1= 50 Machos N2= 40 Hembras N = 90 Animales

Amplitud
10 8
𝜎1 ≈ = 2,5 𝜎2 ≈ = 2,0
4 4

𝐵2 (1)2
B=1 D= = = 0,25 𝑁 2 𝐷 = (90)2 (0,25) = 2025
4 4

Asignación de Neyman:
[∑𝐿𝑖=1 𝑁𝑖 𝜎𝑖 ]2
𝑛=
𝑁 2 𝐷 + ∑𝐿𝑖=1 𝑁𝑖 𝜎𝑖 2

∑ 𝑁𝑖 𝜎𝑖 2 = (50)(2,5)2 + (40)(2,0)2 = 472,5


𝑖=1

∑ 𝑁𝑖 𝜎𝑖 = (50)(2,5) + (40)(2,0) = 125 + 80 = 205


𝑖=1

Entonces:
[205]2
𝑛= = 16,8268268 → 17 𝐴𝑛𝑖𝑚𝑎𝑙𝑒𝑠
2025 + 472,5

Asignación en los Estratos:

𝑁𝑖 𝜎𝑖
𝑛𝑖 = [ 𝐿 ]∗𝑛
∑𝑖=1 𝑁𝑖 𝜎𝑖

Por tanto:

125
𝑛1 = [ ] ∗ (16,8268268) = 10,2602603 → 10 𝑀𝑎𝑐ℎ𝑜𝑠
205

80
𝑛2 = [ ] ∗ (16,8268268) = 6,56656657 → 7 𝐻𝑒𝑚𝑏𝑟𝑎𝑠
205
17 𝐴𝑛𝑖𝑚𝑎𝑙𝑒𝑠

***************************************

Página 11 de 26
Asignación Proporcional:

Además de encontrar costos iguales, en algunas ocasiones resultan las mismas varianzas.

NOTA: En algunos textos es la única fórmula recomendada para Muestreo Aleatorio Estratificado
(Allí no consideran los casos de costos y varianzas diferentes en los estratos).
EJEMPLO 9: Asignación Proporcional (costos y varianzas iguales)

La empresa publicitaria del Ejemplo 1 considera que las varianzas aproximadas que se usaron
en los ejemplos previos son erróneas y que las varianzas de los estratos son iguales. El valor
común de σi fue aproximado por 10 en un estudio preliminar. Se van a efectuar entrevistas por
teléfono, por lo que los costos serán iguales en todos los estratos. La empresa desea estimar el
número promedio de horas por semana que se ve la televisión en los hogares del municipio, con
un límite para el error de estimación igual a 2 horas. Encuentre el tamaño de muestra y los
tamaños de estratos necesarios para lograr esta exactitud.

Solución:
∑𝐿𝑖=1 𝑁𝑖 𝜎𝑖 2
𝑛=
1
𝑁𝐷 + 𝑁 ∑𝐿𝑖=1 𝑁𝑖 𝜎𝑖 2

𝐵2 (2)2
B = 2 Horas D= = =1 𝑁𝐷 = (310) (1) = 310
4 4

𝐿 3

∑ 𝑁𝑖 𝜎 = ∑ 𝑁𝑖 𝜎𝑖2 = (155)(10)2 + (62)(10)2 + (93)(10)2 = 31000


2

𝑖=1 𝑖=1

Entonces:
31000
𝑛= = 75,6097561 → 76
1
310 + ( ) (31000)
310

Asignación en los Estratos:

𝑁𝑖 Tamaño de la muestra son Proporcionales


𝑛𝑖 = [ ] ∗ 𝑛 a los tamaños de los estratos
𝑁 (Recuerde Ejemplo 4)

𝑛𝑖 = =
155 + 62 + 93 310

Por tanto:

155
𝑛1 = [ ] ∗ (75,6097561) = 37,804878 → 38
310

Página 12 de 26
62
𝑛2 = [ ] ∗ (75,6097561) = 15,1219512 → 15
310

93
𝑛3 = [ ] ∗ (75,6097561) = 22,6829268 → 23
310
76

*************************************

LIMITACIÓN EN PRESUPUESTO PARA EL MUESTREO

En ocasiones la cantidad de dinero que se va a gastar en el muestreo es fijada antes.

EJEMPLO 10: (Presupuesto limitado)

En la situación del tiempo de ver televisión que hemos estado tratando en estos ejemplos,
supóngase que los costos son como los especificados en el Ejemplo 6. Esto es, c1 = c2 = 9 y c3
= 16. Vamos a aproximar las desviaciones estándar con 5, 15 y 10, respectivamente. Dado que
la empresa publicitaria tiene únicamente $500 para gastar en muestreo, elija el tamaño de
muestra y la asignación correspondiente.

Solución:

Presupuesto $500

c1 = c2 = 9 c3 = 16
σ1 = 5 σ2 = 15 σ3 = 10

Esquema de asignación → Asignación Óptima (costos diferentes, varianzas diferentes).

 NOTA: No se puede utilizar la fórmula para “n” del ejemplo 6, ¿por qué?
 Respuesta: Las fórmulas utilizadas anteriormente suponen que no tenemos restricción en
presupuesto.
 Entonces, primero el valor de “n” se calcula en forma diferente.

Veamos, un poquito de álgebra:

Ya que el costo total debe ser igual a $500, tenemos que:

𝑐1 𝑛1 + 𝑐2 𝑛2 + 𝑐3 𝑛3 ≤ 500 → 9𝑛1 + 9𝑛2 + 16𝑛3 = 500 (una ecuación con tres incógnitas)

Recordemos que 𝑛𝑖 = 𝑤𝑖 𝑛

Como el ejemplo 6 fue de asignación óptima, de allá traemos lo siguiente:

Página 13 de 26
258,3333333
𝑛1 = [ ] (𝑛) = (0.32258065)(𝑛)
800,833333

310
𝑛2 = [ ] (𝑛) = (0.38709677)(𝑛)
800,833333

232,5
𝑛3 = [ ] (𝑛) = (0.29032258)(𝑛)
800,833333

Nota: ∑ 𝑤𝑖 = 1

Entonces reemplazamos:

→ 9(0.32258065)𝑛 + 9(0.38709677)𝑛 + 16(0.29032258)𝑛 = 500 (una ecuación con una incógnita)

 (11,0322581)(𝑛) = 500

 𝑛 = 45,3216374

Por tanto n= 45 para que el costo sea menor a 500

(Note, esta excepción para el redondeo de “n”. Ahora se hace hacia el entero inferior)

Y la asignación por estratos estará dada por:

𝑛1 = (0.32258065)(𝑛) = (0,32258065)(45) = 14,516129 → 15

𝑛2 = (0.38709677)(𝑛) = (0,38709677)(45) = 17,4193548 → 17

𝑛3 = (0.29032258)(𝑛) = (0,29032258)(45) = 13,0645161 → 13  n = 15 + 17 + 13 = 45

(Note esta excepción a la regla planteada anteriormente: aquí, en la fórmula de la asignación,


n = 45 y no es n = 45,3216374)

**************************

Página 14 de 26
ESTIMACIÓN DE UNA PROPORCIÓN POBLACIONAL

EJEMPLO 11:

La empresa publicitaria quiso estimar la Número


proporción de hogares en el municipio donde se de
ve el programa X (Recordemos: N1 = 155, N2 = Tamaño hogares
62, N3 = 93). Una muestra aleatoria estratificada Estrato de donde se p̂ i
de n = 40 es seleccionada con asignación muestra ve el
proporcional. En otras palabras, se toma una programa
muestra irrestricta aleatoria de cada estrato; los X
tamaños de las muestras son n1 = 20, n2 = 8 y 1 n1 = 20 16 0.80
n3 = 12. Las entrevistas son tomadas en los 40 2 n2 = 8 2 0.25
hogares muestreados. Los resultados se 3 n3 = 12 6 0.50
presentan en la tabla de la derecha. Estime la
proporción de hogares donde se ve el programa
X, y fije un límite para el error de estimación,
presente el intervalo de confianza.

Solución:

N1 = 155; N2 = 62; N3 = 93; N = 310


n1 = 20; n2 = 8; n3 = 12; n = 40

Sí ven el programa: 𝑝
̂1 = 0,80; 𝑝
̂2 = 0,25; 𝑝
̂3 = 0,50

a) Estimador:

𝐿
1 1
𝑝̂
𝑒𝑠𝑡 = ∑ 𝑁𝑖 𝑝̂𝑖 = [(155)(0,80) + (62)(0,25) + (93)(0,50)]
𝑁 310
𝑖=1
= 0,60 → 60% (𝑒𝑠𝑡𝑖𝑚𝑎𝑐𝑖ó𝑛 𝑝𝑢𝑛𝑡𝑢𝑎𝑙 𝑑𝑒 𝑙𝑎 𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛)

b) Límite:

𝐿
1 𝑁𝑖 − 𝑛𝑖 𝑝𝑖 𝑞𝑖
2√ 2 ∑ 𝑁𝑖2 ( )( )
𝑁 𝑁𝑖 𝑛𝑖 − 1
𝑖=1

1 155−20 (0,8)(0,2) 62−8 (0,25)(0,75) 93−12 (0,5)(0,5)


2√
(310)2
[(155)2 ( 155 ) ( 19 ) + (62)2 (
62
)(
7
)+ (93)2 (
93
)(
11
)] =
0,13488248

Página 15 de 26
c) Intervalo (confiab aprox 95%):

0,60 ± 0,13488248 → [0.46511752 , 0.73488248] → [47% , 73%]


(𝑒𝑠𝑡𝑖𝑚𝑎𝑐𝑖ó𝑛 𝑝𝑜𝑟 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑙𝑎 𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛)

***************************************

SELECCIÓN DEL TAMAÑO DE LA MUESTRA Y ASIGNACIÓN DE LA MUESTRA PARA


ESTIMAR PROPORCIONES

EJEMPLO 12: Costos diferentes.

Los datos del Ejemplo 2 fueron tomados de un muestreo realizado el año pasado. La empresa
publicitaria quiere ahora efectuar un nuevo estudio en el mismo municipio para estimar la
proporción de hogares donde ven el programa X. Aunque las fracciones p1, p2 y p3 requeridas
por las fórmulas de proporciones son desconocidas, pueden ser aproximadas por las
estimaciones del estudio anterior, esto es, p̂1 = 0.80, p̂ 2 = 0.25 y p̂3 = 0.50. El costo por
obtener una observación es $9 para cualquiera de los pueblos y $16 para el área rural, esto es
c1 = c2 = 9 y c3 = 16. Los hogares que se encuentran dentro de los estratos son N1 = 155, N2
= 62 y N3 = 93. La empresa quiere estimar la proporción poblacional p, con un límite para el
error de estimación igual a 0.1. Encuentre el tamaño de la muestra n y los tamaños de los
estratos n1, n2 y n3, que darán el límite deseado a un costo mínimo.

Solución:

Asignación Óptima:
𝑝 𝑞
[∑𝐿𝑘=1 𝑁𝑘 √ 𝑘𝑐 𝑘 ] [∑𝐿𝑖=1 𝑁𝑖 √𝑝𝑖 𝑞𝑖 𝑐𝑖 ]
𝑘
𝑛=
𝑁 𝐷 + ∑𝐿𝑖=1 𝑁𝑖 𝑝𝑖 𝑞𝑖
2

Tenemos que:

𝐵2 (0,1)2
B = 0,1 D= = = 0,0025 𝑁 2 𝐷 = (310)2 (0,0025) = 240,25
4 4

3
𝑝𝑘 𝑞𝑘 (0,80)(0,20) (0,25)(0,75) (0,50)(0,50)
∑ 𝑁𝑘 √ = 155 √ + 62 √ + 93 √
𝑐𝑘 9 9 16
𝑘=1
= 20,6666667 + 8,94892917 + 11,625 = 41,2405958

∑ 𝑁𝑖 √𝑝𝑖 𝑞𝑖 𝑐𝑖 = 155 √(0,80)(0,20)(9) + 62 √(0,25)(0,75)(9) + 93 √(0,50)(0,50)(16)


𝑖=1
= 452,540363

Página 16 de 26
3

∑ 𝑁𝑖 𝑝𝑖 𝑞𝑖 = (155)(0,80)(0,20) + (62)(0,25)(0,75) + (93)(0,50)(0,50) = 59,675


𝑖=1

Entonces:
(41,2405958)(452,540363)
𝑛= = 62,2256704 → 63
(240,25)(59,675)

Asignación en los Estratos:


𝑝𝑞
𝑁𝑖 √ 𝑐𝑖 𝑖
𝑖
𝑛𝑖 = 𝑛
𝑝 𝑞
∑𝐿𝑘=1 𝑁𝑘 √ 𝑘𝑐 𝑘
[ 𝑘 ]
Por tanto:

20,666667
𝑛1 = [ ] (62,2256704) = 31,1827985 → 31
41,2405958

8,94892917
𝑛2 = [ ] (62,2256704) = 13,5025478 → 14
41,2405958

11,625
𝑛3 = [ ] (62,2256704) = 17,5403241 → 18
41,2405958
63

*************************************

EJEMPLO 13: Costos Iguales.

Supóngase que en Ejemplo anterior se van a efectuar entrevistas por teléfono, por lo que los
costos de muestreo son los mismos en todos los estratos. La fracción pi se aproximará por p̂ i , i
= 1, 2, 3. Deseamos estimar la proporción poblacional p con un límite de 0.1 para el error de
estimación. Encuentre el tamaño de muestra apropiado para lograr este límite al costo mínimo.

Solución:

Asignación de Neyman:

2
[∑𝐿𝑖=1 𝑁𝑖 √𝑝𝑖 𝑞𝑖 ]
𝑛= 2
𝑁 𝐷 + ∑𝐿𝑖=1 𝑁𝑖 𝑝𝑖 𝑞𝑖

Tenemos que:

Página 17 de 26
𝐵2 (0,1)2
B = 0,1 D= = = 0,0025 𝑁 2 𝐷 = (310)2 (0,0025) = 240,25
4 4

∑ 𝑁𝑖 √𝑝𝑖 𝑞𝑖 = 155 √(0,8)(0,2) + 62 √(0,25)(0,75) + 93 √(0,5)(0,5)


𝑖=1
= 62 + 26,8467875 + 46,5 = 135,3467875

∑ 𝑁𝑖 𝑝𝑖 𝑞𝑖 = (155)(0,8)(0,2) + (62)(0,25)(0,75) + (93)(0,5)(0,5) = 59,675


𝑖=1

Entonces:
(135,3467875)2
𝑛= = 61,0777791 → 62
240,25 + 59,675

Asignación en los Estratos:


𝑁𝑖 √𝑝𝑖 𝑞𝑖
𝑛𝑖 = [ 𝐿 ]𝑛
∑𝑖=1 𝑁𝑖 √𝑝𝑖 𝑞𝑖

𝑛𝑖 = =
62 + 26,8467875 + 46,5 135,3467875
Por tanto:

62
𝑛1 = [ ] (61,0777791) = 27,9786641 → 28
135,3467875

26,8467875
𝑛2 = [ ] (61,0777791) = 12,1151169 → 12 → 13
135,3467875

46,5
𝑛3 = [ ] (61,0777791) = 20,9839981 → 21
135,3467875
62

(NOTA  Excepción a la regla de redondeo: Redondear la asignación para que se ajuste al


tamaño de la muestra)

************************************

EJEMPLO 14: Costos Iguales. Varianzas iguales

En la encuesta de televisión del Ejemplo 12 la empresa publicitaria planea utilizar entrevistas por
teléfono, por lo que los costos de muestreo no varían de un estrato a otro. Los tamaños de los

Página 18 de 26
estratos son N1 = 155, N2 = 62 y N3 = 93. Los resultados de la encuesta del año pasado
(véanse tablas del Ejemplo 2) parecen divergir de los de este año. La empresa considera que la
proporción de hogares donde se ve el programa X está cercana a 0.4 en cada uno de los tres
estratos, y desea estimar la proporción poblacional p con un límite de 0.1 para el error de
estimación. Encuentre el tamaño de muestra n y la asignación que provee este límite a mínimo
costo.

Solución:

Asignación Proporcional:
∑𝐿𝑖=1 𝑁𝑖 𝑝𝑖 𝑞𝑖
𝑛=
1
𝑁𝐷 + 𝑁 ∑𝐿𝑖=1 𝑁𝑖 𝑝𝑖 𝑞𝑖

Tenemos que:

𝐵2 (0,1)2
B = 0,1 D= = = 0,0025 𝑁𝐷 = (310) (0,0025) = 0,775
4 4

∑ 𝑁𝑖 𝑝𝑖 𝑞𝑖 = (155)(0,4)(0,6) + (62)(0,4)(0,6) + (93)(0,4)(0,6) = 74,4


𝑖=1

Entonces:
74,4
𝑛= = 73,3004926 → 74
1
0,775 + (310) (74,4)

Asignación en los Estratos:


𝑁𝑖
𝑛𝑖 = ( ) 𝑛
𝑁

𝑛𝑖 = ( ) 𝑛 → 𝑛𝑖 = ( )𝑛
155 + 62 + 93 310

Por tanto:

155
𝑛1 = ( ) (73,3004926) = 36,6502493 → 37
310

62
𝑛2 = ( ) (73,3004926) = 14,6600985 → 15
310

93
𝑛3 = ( ) (73,3004926) = 21,9901478 → 22
310
74

Página 19 de 26
*****************************************

ADICIONAL: UNA REGLA ÓPTIMA PARA FORMAR LOS ESTRATOS:

En algunas ocasiones tenemos frecuencias de datos en categorías generales de la


variable de interés o de otra variable altamente correlacionada.

Método para Delimitar los Estratos: Se denomina “Método Acumulativo de la Raíz Cuadrada
de la Frecuencia”

EJEMPLO 15:

Un investigador desea estimar el promedio anual de ventas para 56 empresas, usando una
muestra de n = 15 empresas. Se encuentran disponibles datos de frecuencias en una
clasificación por incrementos de $50 000, y se presentan en la tabla siguiente. ¿Cómo podemos
asignar las empresas a L = 3 estratos?

Ingreso Frecuencia Frecuencia


(en miles) Frecuencia
acumulada
100 – 150 11 3.31662479 3.31662479
150 – 200 14 3.74165739 7.05828218
200 – 250 9 3.00000000 10.0582822
250 – 300 4 2.00000000 12.0582822
300 – 350 5 2.23606798 14.2943502
350 – 400 8 2.82842712 17.1227773
400 – 450 3 1.73205081 18.8548281
450 – 500 2 1.41421356 20.2690416
56

Solución:

Procedimiento: Encontrar intervalos iguales en la columna de la Raíz Cuadrada.

20,27
Para L=3: = 6,76 → (2)(6,76) = 13.52
3

Porque se quieren 3 estratos Para encontrar el 2° límite

En la tabla: Lo más cercano a 6,76 es 7,05828218 Marca los límites


del estrato

Página 20 de 26
Lo más cercano a 13,52 es 14,2943502

Entonces, resultan los siguientes estratos:

Estrato I: Empresas con ingresos entre $100.000 y $200.000


Estrato II: Empresas con ingresos entre $200.001 y $350.000
Estrato III: Empresas con ingresos entre $350.001 y $500.000

Entonces: La muestra de n=15 se obtiene tomando 5 de cada estrato.

Con esta técnica los tamaños de muestra iguales en los estratos quedan cerca de la óptima.

RESUMEN DE ESTA UNIDAD:


Una muestra aleatoria estratificada se obtiene separando los elementos de la población en grupos, o estratos, de tal manera que cada elemento
pertenezca a uno y sólo uno de los estratos, y entonces se obtiene una muestra irrestricta aleatoria de manera independiente en cada estrato.
Este diseño de muestreo presenta tres ventajas principales sobre el muestreo irrestricto aleatorio: Primero, la varianza del estimador de la
media poblacional es por lo común reducida porque la varianza de las observaciones dentro de cada estrato es usualmente más pequeña que la
de toda la población. Segundo, el costo por recolectar y analizar los datos es frecuentemente reducido por la separación de una población
grande en estratos más pequeños. Tercero, se pueden obtener estimaciones separadas para estratos individuales sin seleccionar otra muestra y,
por lo tanto, sin costo adicional.

Antes de realizar una encuesta, los experimentadores deben considerar qué tan grande deben tolerar el error de estimación, y de acuerdo con
esto, seleccionar el tamaño de la muestra. Esta muestra debe ser entonces asignada a los diferentes estratos-

Página 21 de 26
ESTADÍSTICA III
UNIDAD 3 - MUESTREO ALEATORIO ESTRATIFICADO
PARTE 2 – EJERCICIOS PROPUESTOS

1- Una cadena de almacenes está interesada en estimar la proporción de cuentas por cobrar
negligentes. La cadena consiste de 4 almacenes. Así que el costo de muestreo es reducido.
Se usa muestreo aleatorio estratificado, con cada tienda como un estrato. Ya que no se
dispone de información referente a las proporciones poblacionales antes del muestreo, se
usa la asignación proporcional. De la siguiente tabla, estime p, la proporción de cuentas
negligentes para la cadena, y fije un límite para el error de estimación.
Estrato I Estrato II Estrato III Estrato IV
Número de cuentas por cobrar N1 = 65 N2 = 42 N3 = 93 N4 = 25
Tamaño de muestra n1 = 14 n2 = 9 n3 = 21 n4 = 6
Número muestral de cuentas negligentes 4 2 8 1
(Resp: p̂ est =0.30, B = 0.117)

2- Una corporación desea estimar el número total I II III


de horas-hombre perdidas debido a accidentes (obreros) (técnicos) (administrativos)
de los empleados, en un mes determinado. Ya
que los obreros, los técnicos y los 2 2 2
 1  36  2  25 3  9
administrativos tienen diferentes tasas de
accidentes, el investigador decide usar muestreo N1  132 N  92 N  27
2 3
aleatorio estratificado, con cada grupo formando
un estrato. Datos de años previos sugieren las
varianzas mostradas en la tabla de la derecha,
para el número de horas-hombre perdidas por
empleado en los tres grupos, y de datos actuales
se obtienen los tamaños de los estratos.
Determine la asignación de Neyman para una
muestra de n = 30 empleados.
(Resp: n1 = 18, n2 = 10, n3 = 2)

3- Para el Ejercicio 2, estime el número total de I II III


horas-hombre perdidas durante el mes indicado, y (obreros) (técnicos) (administ.)
establezca un límite para el error de estimación. 8 24 0 4 5 1
Use los datos de la tabla de la derecha, obtenidos 0 16 32 0 24 8
de una muestra de 18 obreros, 10 técnicos y 2 6 0 16 8 12
administrativos. 7 4 4 3 2
9 5 8 1 8
(Resp: ˆ  1903 .90 , B  676 .80 ) 18 2 0

Página 22 de 26
4- Se forma una comisión de zonificación Estrato I Estrato II
para estimar el valor promedio de avalúo N  110 N  168
en un suburbio residencial de una ciudad. 1 2
El suburbio se divide en dos distritos, y se n  20 n  30
1 2
tienen listas separadas de las viviendas de
cada distrito. De los datos presentados en n n
1 2
la tabla de la derecha, estime el valor  y i  240000  y i  420000
promedio de avalúo para todas las casas i 1 i 1
en el suburbio, y establezca un límite para n n
el error de estimación (nótese que se 1 2
 y i2  2980000000  y i2  6010000000
utilizó la asignación proporcional). i 1 i 1
(Resp: y est  13208 .63, B  560 .48 )

5- Una Corporación desea obtener información acerca de la efectividad de una máquina


comercial.Se va a entrevistar por teléfono a un número de jefes de división, para pedirles
que califiquen la maquinaria con base en una escala numérica. Las divisiones están
localizadas en Norteamérica, Europa y Asia. Es por eso que se usa muestreo estratificado.
Los costos son mayores para las entrevistas de los jefes de división localizados fuera de
Norteamérica. La tabla que aparece a continuación proporciona los costos por entrevista,
varianzas aproximadas de las calificaciones, y los Ni que se han establecido. La
Corporación quiere estimar la calificación promedio con V  yest   0.1 . Elija el tamaño de
muestra n que obtiene este límite y encuentre la asignación apropiada.
Estrato I Estrato II Estrato III
(Norteamérica) (Europa) (Asia)
c1  $9 c 2  $25 c 3  $36
  2.25
2
1   3.24
2
2  32  3.24
N 1  112 N 2  68 N 3  39
(Resp: n = 26, n1 = 16, n2 = 7, n3 = 3)

6- Una escuela desea estimar la calificación promedio que Estrato I Estrato II Estrato III
puede ser obtenida en un examen de comprensión de
lectura por estudiantes de quinto grado. Los estudiantes 80 92 85 82 42 32
de la escuela son agrupados en tres estratos, los que 68 85 48 75 36 31
aprenden rápido en el estrato I, los que aprenden 72 87 53 73 65 29
normalmente en el estrato II, y los que aprenden lento 85 91 65 78 43 19
en el estrato III. La escuela decide esta estratificación 90 81 49 69 53 14
porque de esta manera se reduce la variabilidad en las 62 79 72 81 61 31
calificaciones del examen. El quinto grado contiene 55 61 83 53 59 42 30
estudiantes en el estrato I, 80 en el estrato II y 65 en el 68 52 39 32
estrato III. Una muestra aleatoria estratificada de 50 71 61
estudiantes es asignada proporcionalmente, y produce 59 42
muestras irrestrictas aleatorias de n1 = 14, n2 = 20 y n3 =

Página 23 de 26
16. El examen se aplica a la muestra de estudiantes y
se obtienen los resultados de la tabla de la derecha.
Estime la calificación promedio para este grado y
establezca un límite parta el error de estimación.
(Resp: yest  59.99, B  3.032

7- Suponga que la calificación promedio para el examen de la clase del Ejercicio 6 se va a


estimar de nuevo al final del año escolar. Los costos de muestreo son iguales en todos los
estratos, pero las varianzas son diferentes. Encuentre la asignación óptima (Neyman) para
una muestra de tamaño 50, usando los datos del Ejercicio 6 para aproximar las varianzas.
(Resp: n1 = 12, n2 = 20, n3 = 18)

8- Utilizando los datos del Ejercicio 6, encuentre el tamaño de muestra requerido para estimar
la calificación promedio, con un límite de 4 puntos para el error de estimación. Use
asignación proporcional. (Resp: n = 33)

9- Repita el Ejercicio 8, ahora usando la asignación de Neyman. Compare los resultados con la
respuesta del Ejercicio 8. (Resp: n = 32)

10- Un guardabosque quiere estimar el número total de hectáreas plantadas de árboles en las
fincas de un municipio. Ya que el número de hectáreas de árboles varía considerablemente
con respecto al tamaño de la finca, decide estratificar con base en el tamaño de las fincas.
Las 240 fincas del municipio son puestas en una de cuatro categorías de acuerdo con el
tamaño. Una muestra aleatoria estratificada de 40 fincas, seleccionada mediante asignación
proporcional, produce los resultados de la siguiente tabla (número de hectáreas plantadas
de árboles). Estime el número total de hectáreas plantadas de árboles en las fincas del
municipio, y fije un límite para el error de estimación.

Estrato I Estrato II Estrato III Estrato IV


(0-200 hect) (201-400 hect) (401-600 hect) (más de 601 hect)
N1 = 86 97 67 N2 = 72 125 155 N3 = 52 142 256 N4 = 30 167 655
n1 = 14 42 125 n2 = 12 67 96 n3 = 9 310 440 n4 = 5 220 540
25 92 256 47 495 510 780
105 86 310 236 320 396
27 43 220 352 196
45 59 142 190
53 21
(Resp: ˆ  50505 .60 , B  8663 .12 )

11- El estudio del Ejercicio 10 se va a hacer anualmente, con el límite para el error de
estimación de 5000 hectáreas. Encuentre un tamaño de muestra aproximado para adquirir
este límite si se usa la asignación de Neyman. Use los datos del Ejercicio 10. (Resp: n =
60).

Página 24 de 26
12- Una psicóloga que está trabajando con un grupo de adultos con retraso mental, desea
estimar su tiempo de reacción promedio a un cierto estímulo. Ella considera que varones y
mujeres probablemente presentarán una diferencia en tiempos de reacción, por lo que
desea estratificar con base en los sexos. El grupo de 96 personas tiene 43 varones. En
estudios previos de este tipo de investigaciones se ha encontrado que los tiempos
presentan una amplitud de variación de 5 a 20 segundos para varones y de 3 a 14
segundos para mujeres. Los costos de muestreo son los mismos para ambos estratos.
Usando la asignación óptima, encuentre el tamaño de muestra aproximado necesario para
estimar el tiempo de reacción promedio para el grupo, con un límite aproximado a un
segundo. (Resp: n = 29).

13- El Concejo Municipal está interesado en ampliar las instalaciones de un centro de atención
diurna para niños con retraso mental. La ampliación va a incrementar los costos de
asistencia a los niños del centro. Se va a realizar una encuesta por muestreo para estimar la
proporción de familias con niños afectados que utilizarán las instalaciones ampliadas. Las
familias están divididas en aquellas que usan las instalaciones y aquellas que no lo hacen.
Algunas familias viven en la ciudad donde se encuentra localizado el centro, y otras viven en
las áreas rurales o suburbanas de los alrededores. Entonces se usa muestreo aleatorio
estratificado con personas en la ciudad que usan las instalaciones, personas de los
alrededores que las usan, personas en la ciudad que no las usan, y personas en los
alrededores que no las usan, formando los estratos I, II, III y IV, respectivamente.
Aproximadamente 90% de los que usan las instalaciones y 50% de los que no las usan van
a utilizar las nuevas instalaciones. Los costos por efectuar la observación de un cliente
actual es de $4, y de $8 para uno que no lo es. La diferencia en el costo resulta de la
dificultad para localizar a quienes no usan las instalaciones. Registros existentes nos dan N1
= 97, N2 = 43, N3 = 145 y N4 = 68. Encuentre el tamaño de muestra aproximado y la
asignación necesaria para estimar la proporción poblacional con un límite de 0.05 para el
error de estimación. (Resp: n = 158, n1 = 39, n2 = 17, n3 = 69, n4 = 33) .

14- Se lleva a cabo la encuesta del Ejercicio 13 y se obtiene la siguiente proporción de familias
que usarán las nuevas instalaciones: pˆ 1  0.87 , pˆ 2  0.93 , pˆ 3  0.60 , pˆ 4  0.53 . Estime la
proporción poblacional p, y establezca un límite para el error de estimación. ¿Se logró el
límite deseado? (Resp: pˆ est  0.701, B  0.0503 )

15- Suponga que en el Ejercicio 13 el costo total de muestreo se fija en $400. Elija el tamaño de
muestra y la asignación que minimiza la varianza del estimador p̂ est para este costo fijado.
(Resp: n = 62, n1 = 17, n2 = 6, n3 = 26, n4 = 13) .

16- Considere la información que se da en el Ejemplo 17 (visto en clase) sobre las 56 empresas
comerciales.

a) Suponga que se tienen n = 15 observaciones para formar una muestra aleatoria


estratificada con dos estratos únicamente. Encuentre el punto de división óptimo entre
los estratos. Con n1 = 7 y n2 = 8, suponga que los resultados de las mediciones en la
muestra (en miles de pesos) son los siguientes: 110, 142, 212, 227, 167, 130, 194 para
el estrato 1, y 387, 345, 465, 308, 280, 480, 355 y 405 para el estrato 2. Estime µ
mediante yest y calcule la varianza estimada de yest .

Página 25 de 26
b) Ahora suponga que el punto divisorio entre los dos estratos es cambiado a 300000.
Suponga que se toman las mismas 15 mediciones en una muestra aleatoria estratificada
de n1 = 8 y n2 = 7. Nótese que este muestreo cambia el valor 280 del estrato 2 al estrato
1. (Este resultado no es probable que se presente en la práctica, y se utiliza aquí sólo
con fines explicativos). Encuentre yest y calcule la varianza estimada de yest . La
respuesta numérica debe indicar la superioridad del método acumulativo de la raíz
cuadrada de frecuencias.
(Resp: (a) yest  251 .07, Vˆ  yest   141 .81 ) (b) yest  250 .05, Vˆ  yest   181 .25 )

17- Si no se tiene información disponible sobre la variable de Número de


interés primordial, digamos y, entonces la estratificación Empleados Frecuencia
óptima puede ser aproximada mediante el uso de otra 0 – 10 2
variable, digamos x, la cual está altamente correlacionada 11 – 20 4
con y. Suponga que un investigador desea estimar el 21 – 30 6
número promedio de días de ausencia por enfermedad, 31 – 40 6
otorgados por cierto grupo de empresas en un año 41 – 50 5
determinado. No se tiene disponible información referente a 51 – 60 8
días de ausencia por enfermedad, pero se puede encontrar 61 – 70 10
información sobre el número de empleados por empresa. 71 – 80 14
Suponga que para estas empresas se tiene que el número 81 – 90 19
total de días de ausencia por enfermedad está altamente 91 – 100 13
correlacionado con el número de empleados. Use los datos 101 – 110 3
de frecuencias de la tabla de la derecha parta dividir 111 – 120 7
óptimamente las 97 empresas en L = 4 estratos, para los
cuales es posible usar tamaños de muestra iguales.
(Resp: puntos de división: 40, 70, 90)

18- Considere el Ejercicio 21 de la Unidad II (MAS). El auditor desea ahora submuestrear


algunas de las 20 cuentas para una auditoría más detallada. Separe las 20 cuentas en dos
estratos, aplicando el método acumulativo de la raíz cuadrada de frecuencias a las
cantidades dadas.

19- Una verificación de control de calidad estándar para baterías de Mes A Mes B
automóviles consiste simplemente en registrar su peso. Un
embarque particular de una fábrica consistió de baterías producidas 61.5 64.5
en dos meses diferentes, con el mismo número de baterías para 63.5 63.8
cada mes. El investigador decide estratificar con base en meses 63.5 63.5
para el muestreo de inspección a fin de observar la variación 64.0 66.5
mensual. Las muestras irrestrictas aleatorias de pesos de baterías 63.8 63.5
para los dos meses mostraron las mediciones (en libras) que 64.5 64.0
aparecen a la derecha. Estime el peso promedio de las baterías en
la población (el embarque), y fije un límite para el error de
estimación. Descarte la cpf. El estándar de la fábrica para este tipo
de baterías es de 69 libras. ¿Considera usted que el embarque
cumple el estándar promedio?
(Resp: yest  63.88, B  0.628 )

Página 26 de 26

También podría gustarte