Está en la página 1de 17

MUESTREO ALEATORIO DE UNA POBLACION ESTRATIFICADA

Con el fin de asegurar una mayor representatividad de la muestra probabilística a elegir de


la población completa {𝑦𝑖 : 𝑦1 , 𝑦2 … … , 𝑦𝑛 } esta población es clasificada en L estratos
independientes; por tanto, cada estrato formado constituye una sub población con todas las
características, marco de muestreo y parámetros de un universo independiente, y, en
consecuencia, deberán ser tratados como tales.

La información del universo completo puede ser clasificada:

Estrato Elementos 𝑁ℎ 𝑤ℎ 𝑦̅ℎ 𝑠2ℎ


1 𝑦11 𝑦12 … 𝑦1𝑁1 𝑁1 𝑤1 𝑦̅1 𝑠 21
2 𝑦21 𝑦22 … 𝑦2𝑁2 𝑁2 𝑤2 𝑦̅2 𝑠22
… … … … … …
… … … … … …
L 𝑦𝐿1 𝑦𝐿2 … 𝑦𝐿𝑁𝐿 𝑁𝐿 𝑤𝐿 𝑦̅𝐿 𝑠2𝐿
total N 1 𝑌̅
Con el fin de estimar los parámetros de esta población estratificada se extrae una muestra
simple aleatoria en forma independiente de cada uno de los estratos construidos tratando a
cada estrato como un universo separado; esta forma de muestrear permitirá asegurar que
la muestra total elegida este cargad con información de todas las partes importantes
(estratos) de la población en general.

La información recopilada con la muestra seria:

h muestra aleatoria 𝑛ℎ 𝑤ℎ 𝑦̅ℎ 𝑁ℎ 𝑦̅ℎ 𝑠 2 ℎ 𝑣(𝑦̅ℎ )


1 𝑦11 𝑦12 … 𝑦1𝑁1 𝑛1 𝑤1 𝑦̅1 𝑁ℎ 𝑦̅ℎ 𝑠 2 1 𝑣(𝑦̅1 )
2 𝑦21 𝑦22 … 𝑦2𝑁2 𝑛2 𝑤2 𝑦̅2 𝑁ℎ 𝑦̅ℎ 𝑠 2 2 𝑣(𝑦̅2 )
…. … … … …
…. … … … …
L 𝑦𝐿1 𝑦𝐿2 … 𝑦𝐿𝑁𝐿 𝑛𝐿 𝑤𝐿 𝑦̅𝐿 𝑁ℎ 𝑦̅ℎ 𝑠2𝐿 𝑣(𝑦̅𝐿 )
total n 1 ∑ 𝑁ℎ 𝑦̅ℎ
a.- estimación del promedio poblacional
∑𝐿 𝑁ℎ 𝑦̅ℎ
𝑦̅𝑒 = = ∑𝐿 𝑤ℎ 𝑦̅ℎ
𝑁

Por tratarse de muestras simples aleatorias independientes en cada estrato la varianza del
estimador del promedio será:
𝑣(𝑦̅
𝑣(𝑦̅𝑒 ) = ∑𝐿 𝑁2 ℎ ∗ ℎ)
= ∑𝐿 𝑤2 ℎ 𝑣(𝑦̅ℎ )
𝑁2

1−𝑓ℎ
𝑣(𝑦̅𝑒 ) = ∑ 𝑤2 ℎ ∗ 𝑠ℎ 2 ∗ 𝑛ℎ

A través de la muestra, esta varianza se estima


1−𝑓ℎ
𝑣(𝑦̅𝑒 ) = ∑𝐿 𝑤2 ℎ ∗ 𝑠ℎ 2 ∗ 𝑛ℎ
El error estándar estimado: 𝑠(𝑦̅ 𝑒 ) = √𝑣(𝑦̅ 𝑒 )

Los límites de confianza correspondientes son:

𝐿. 𝐶.: (𝑦̅) = 𝑦̅𝑒 ± 𝑡𝛿 ∗ 𝑠(𝑦̅ 𝑒 )

𝛿 Son los grados de libertad efectivos estimados según la relación Satterthwaite.


∑ 𝑔ℎ 𝑠 4 ℎ
𝛿 = [∑ 𝑔ℎ 𝑠 2 ℎ ]2 /[ ]
𝑛ℎ −1

𝑁ℎ (𝑁ℎ −𝑛ℎ )
Donde 𝑔ℎ = 𝑛ℎ

b.- Estimación del total poblacional:

𝑌𝑒 = ∑ 𝑁ℎ 𝑦̅ℎ = 𝑁 ∗ 𝑦̅𝑒

La varianza a través del estimador del promedio será

𝑣(𝑦𝑒) = 𝑁 2 ∗ 𝑣(𝑦̅ 𝑒 )

El error estándar estimado: 𝑠(𝑦̅ 𝑒 ) = √𝑣(𝑦̅ 𝑒 )

Los límites de confianza correspondientes son:

𝐿. 𝐶.(𝑦) = 𝑁𝑦𝑒 ± 𝑡𝛿 𝑁 ∗ 𝑠(𝑦̅ 𝑒 )

c.- Estimación del tamaño de muestra total y su asignación entre los estratos:

La forma general para estimar n cuando deseamos estimar el promedio poblacional es:
∑ 𝑤ℎ 2 𝑠ℎ 2
[ ]
𝑤ℎ
𝑛= 1 ;
[𝑣0 +( )∗∑ 𝑤ℎ 2 𝑠ℎ 2 ]
𝑁

Donde

𝑣0 = Varianza deseada para el estimador: (𝑑/𝑡)2

Según la manera en que se desea distribuir la muestra entre los estratos se obtienen formas
particulares

C.1.- Asignación optima


2
[∑ 𝑤ℎ 2 𝑠ℎ ]
𝑛= 1
[𝑣0 +( ) ∑ 𝑤ℎ 𝑠2 ℎ ]
𝑁

En qué caso el tamaño de la muestra en cada estrato será:


𝑤 𝑠ℎ 𝑛𝑁 𝑠
𝑛ℎ = 𝑛 ∗ ∑ 𝑤ℎ = ∑ 𝑁ℎ 𝑠ℎ
ℎ 𝑠ℎ ℎ ℎ
c.2.- Asignación proporcional
2
[∑ 𝑤ℎ 2 𝑠ℎ ]
𝑛= 1
[𝑣0 +( ) ∑ 𝑤ℎ 𝑠2 ℎ ]
𝑁

En este caso el tamaño de muestra en cada estrato será:


𝑛𝑁ℎ
𝑛ℎ = 𝑛𝑤ℎ = 𝑁

ESTUDIO DE PROPORCIÓN

Para el caso:

𝑦𝑖 = 1 : Si el elemento i-èsimo tiene el atributo c

𝑦𝑖 = 0 : Si el elemento i-èsimo tiene el atributo c

𝑝ℎ = 𝑎𝑛 /𝑛ℎ : Proporción de elementos del estrato h con el atributo c en la muestra.

𝑞ℎ = 1 − 𝑝ℎ : Proporción de elementos del estrato h sin el atributo c en la muestra.

d.- Estimado de la proporción de elementos con un atributo c.


∑𝐿 𝑁ℎ 𝑃ℎ
𝑝𝑒 = = ∑𝐿 𝑁ℎ 𝑃ℎ
𝑁

𝑎
Donde 𝑃ℎ = 𝑛ℎ

Su varianza es:

1 𝑁ℎ 2 (𝑁ℎ − 𝑛ℎ )
𝑣(𝑝𝑒 ) = ( 2 ) ∑ [ ] 𝑝ℎ 𝑞ℎ /𝑛ℎ
𝑁 𝑁ℎ − 1

La cual será estimada por:


1
𝑣(𝑝𝑒 ) = (𝑁2) ∑ 𝑁ℎ 2 (1 − 𝑓ℎ )𝑝ℎ 𝑞ℎ /𝑛ℎ − 1

CASOS Y PROBLEMAS RESUELTOS:

1.- Se desea estimar tanto el área cultivada promedio por inca como el área total cultivada
en una región agrícola que agrupa a 2,010 fincas. Para tal efecto las fincas fueron
estratificadas según la superficie total que poseen; es decir, para cada finca se disponía de
su área total y a través de ella se clasifico a las incas en los 7 estratos. Posteriormente, y
en forma independiente, dentro de cada estrato fueron seleccionadas muestras simples
aleatorias eligiendo y visitando solo al 10% de las fincas del estrato. Los resultados
obtenidos fueron:
número de información con las
Estrato fincas muestras
Sub. Total
(Has) 𝑁ℎ 𝑤ℎ 𝑛ℎ 𝑦̅ℎ 𝑠ℎ
Hasta 40 394 0,1960 40 5,4 8,3
40,1 - 80 461 0,2294 46 16,3 13,3
80,1 - 120 391 0,1945 39 24,3 15,1
120,1 - 180 334 0,1662 33 34,5 19,8
180,1 - 250 169 0,0841 17 42,1 24,5
250,1 - 350 113 0,0562 11 50,1 26,0
350,1 - mas 148 0,0736 15 63,8 35,2
total 2,010 1 201
Respuesta:

a.- Estimación de la superficie cultivada promedio por finca

∑ 𝑁ℎ 𝑦̅ℎ
𝑦̅𝑒 = = ∑ 𝑤ℎ 𝑦̅ℎ =
𝑁
[0.1960 ∗ 5.4 + 0.2294 ∗ 16.3 + ⋯ + 0.0736 ∗ 63.8]

𝑦̅𝑒 = 26.3 Hectáreas cultivadas por finca

Su varianza estimada será:


∑ 𝑤ℎ 2 (1−𝑓ℎ )𝑠ℎ 2
𝑣(𝑦̅𝑒 ) = 𝑛ℎ

8.32
= [(0.1960)2 ∗ (1 − 0.1) ∗ + ⋯ + (0.0736)2 (1 − 0.1) ∗ 35.22 /15]
40

𝑣(𝑦̅𝑒 ) = 1.5386 = 1.24 Hectáreas cultivadas

Para establecer los límites de confianza para superficie cultivada promedio de la


región se deberán considerar a los correspondientes grados de libertad efectivos
según la relación de Satterthwaite:
𝑔ℎ 2 𝑠 4 ℎ
𝛿 = [∑𝐿 𝑔ℎ 𝑠 2 ℎ ]2 / ∑ ( )
𝑛ℎ −1

𝑁 2 ℎ (1−𝑓ℎ )
Donde: 𝑔ℎ = 𝑛ℎ

Con la información disponible

[3486.90(8.3)2 +⋯+1312.27(35.2)2 ]
𝛿 = (2486.90)2(8.3)2 +⋯+(1312.27)2(35.2)2

𝛿 = 106 Grados de libertad efectivos

El valor t-Student para un nivel de seguridad 95% con 106 grados de libertad es 1.99
aproximadamente.
𝐿. 𝐶.(𝑦̅) = 𝑦̅𝑒 ± 𝑡𝛿 𝑠(𝑦̅ 𝑒 )

= 26.3 ± 1.99 ∗ 1.24

𝐿. 𝐶.(𝑦̅) = (28.8; 23.8) Hectáreas cultivadas por finca.

b.- Estimación de la superficie cultivada total de la región.

𝑌𝑒 = 𝑁 ∗ 𝑦̅𝑒 = 2.010 ∗ 26.3

= 52.863 Hectáreas cultivadas en toda la región.

Su varianza estimada será:

𝑣(𝑦𝑒 ) = 𝑁 2 ∗ 𝑣𝑦̅𝑒 = (2.010)2 (1.5386) = 6`216,097.86

Su error estándar es:

𝑠(𝑦𝑒 ) = 𝑁 ∗ 𝑠(𝑦̅ 𝑒 ) = 2,010 ∗ 1.24 = 2,492.4

Los límites de confianza serán:

𝐿. 𝐶. (𝑌) = 𝑁 ∗ 𝑙. 𝑐. (𝑦̅) = 2,010 ∗ (28.8; 23.8)

𝐿. 𝐶.(𝑦) = (47,838; 57,888)

Hectáreas cultivadas en total por las 2,010fincas de la región.

2.- En una región forestal de desea estimar tanto el volumen de madera total existente,
como al volumen de madera por árbol. La región contiene 640 árboles de madera comercial
con una clara zonificación interna distinguiéndose tres estratos.

Estrato (h) Tipología


1 Bosque denso
2 Bosque abierto
3 Pradera

En cada uno de los estratos conformados se tomó una muestra simple aleatoria de 20
árboles, procediéndose a cubicar el volumen de madera de registran cada árbol
seleccionado; como resultado de logro la información siguiente:

h 𝑁ℎ 𝑛ℎ 𝑦̅ℎ 𝑠ℎ 𝑁ℎ 𝑠ℎ 𝑁ℎ 𝑠 2 ℎ (1 − 𝑓ℎ ) Producto 𝑁ℎ 𝑦̅ℎ


1 246 20 18,1 20,1 4945 99386 0,919 1123439 4452,6
2 322 20 105,2 69,8 22475 1568797 0,938 23691657 33874,4
3 72 20 190,8 130,4 9389 1224230 0,722 3182199 13737,6
640 36809 2892413 27997295 52064,6
Respuesta:

a.- Volumen de madera por árbol de la zona forestal.

[∑3 𝑁ℎ 𝑦̅ ℎ ] 52,064.6
𝑦̅ℎ = ∑3 𝑁ℎ
= = 81.35 Pies por árbol.
640

Su varianza estimada:
1 1 27´997,295
𝑣(𝑦̅ℎ) = (𝑁2) ∑3(𝑁2 ℎ (1 − 𝑓ℎ )𝑠2 ℎ ) 𝑛 = (640)2

= 68.3528

El error estándar correspondiente:

𝑆(𝑦̅̅̅𝑒̅) = √68.3528 = 8.27 𝑝𝑖𝑒𝑠

El coeficiente de variación del estimado logrado será.


𝑆(𝑦
̅̅̅̅)
𝑒 8.27
𝑐. 𝑣 (𝑦̅𝑒 ) = ∗ 100 = (81.35) ∗ 100 = 10.16%
𝑦̅𝑒

Si consideramos un valor aproximado para t student 𝑡 = 1.96 para un 95% de seguridad,


el margen de error logrado, a través de una muestra total de 60 árboles en la estimación del
volumen promedio de madera por árbol de la zona forestal, seria:

𝑑 = 𝑡 ∗ 𝑠(𝑦̅𝑒 ) = 1.96 ∗ 8.27 = 16.21 Pies de madera por árbol.

Así, los límites de confianza correspondientes serian:

𝑙. 𝑐. (𝑦̅𝑒 ) = 𝑦̅𝑒 ± 𝑡 ∗ 𝑠(𝑦̅𝑒 ) = 81.35 ± 16.21 = (97.56; 65.14) Pies

La amplitud lograda

= 97.56 − 65.14 = 32.42 = 2(16.21) = 2 ∗ 𝑑

Esta amplitud es susceptible de ser reducida aumentando el tamaño de la muestra total y


distribuyéndola adecuadamente en cada uno de los estratos identificados, sea considerado
una asignación proporcional o asumiendo una asignación óptima.

Si deseáramos disminuir el margen de error a 𝑑 = 3.125 pies de madera. ¿Qué tamaño de


muestra deberíamos utilizar y como distribuirla entre los estratos?

Nivel de seguridad

𝛼 = 0.05

𝑧 = 1.96

Varianza deseada

𝑣0 (𝑦̅𝑒 ) = [𝑑/𝑡]2
3.125 2
= [ 1.96 ]

= 2.5421

Error estándar deseado:

𝑠0 (𝑦̅𝑒 ) = 1.5944

Coeficiente de variación deseado

𝑐. 𝑣.0 (𝑦̅𝑒 ) = [𝑠0 (𝑦̅𝑒 )/𝑦̅𝑒 ] ∗ 100


1.5944
= ∗ 100
81.35

= 2% Aproximadamente
𝑛𝑁ℎ
a.1.- Asumiendo una afijación proporcional (𝑛ℎ = = 𝑛𝑤ℎ )
𝑁

∑3 𝑤ℎ 𝑠2 ℎ (1/𝑁) ∑ 𝑁ℎ 𝑠2 ℎ 2892482/640
𝑛= 1 = 1 = 2.5421+2892413/(640)2 = 471 Arboles
[𝑑/𝑡]2 +( ) ∑ 𝑤ℎ 𝑠2 ℎ 𝑣0 (𝑦𝑒 )+( 2 ) ∑ 𝑁ℎ 𝑠2 ℎ
𝑁 𝑁

Para cada estrato de la zona forestal le corresponderá;


𝑁 246
𝑛1 = 𝑛 ( 𝑁1 ) = 471 (640) = 181 Árboles en el bosque denso.

𝑁 322
𝑛2 = 𝑛 ( 𝑁2) = 471 (640) = 237 Árboles en el bosque abierto.

𝑁 72
𝑛3 = 𝑛 ( 𝑁3) = 471 (640) = 53 Árboles en la pradera.

a.2. Asumiendo una afijación optima (𝑛ℎ = 𝑛𝑁ℎ 𝑠ℎ / ∑ 𝑁ℎ 𝑠ℎ )


2
(∑3 𝑤ℎ 𝑆ℎ ) (1/𝑁)(∑ 𝑁ℎ 𝑆ℎ )2 [36,809]2 /6402
𝑛= 1 = 1 = 2.5421+2892413/(640)2 = 344 Arboles
[𝑑/𝑡]2 +( ) ∑ 𝑤ℎ 𝑠2 ℎ 𝑣0 (𝑦𝑒 )+( 2 ) ∑ 𝑁ℎ 𝑠2 ℎ
𝑁 𝑁

𝑁 4945
𝑛1 = 𝑛 ( 𝑠 1 ) = 344 (36809) = 46 Árboles en el bosque denso.
1

𝑁 22475
𝑛2 = 𝑛 ( 2) = 344 ( ) = 210 Árboles en el bosque abierto.
𝑠2 36809

𝑁 9389
𝑛3 = 𝑛 ( 𝑠 3) = 344 (36809) = 88 Árboles en la pradera.
3

Como para el estrato 3 el número de arboles 𝑛3 = 88 > 𝑁3 = 72 es necesario reajustar el


tamaño de muestra para el estrato 3; esta reconstrucción se ejecutara considerando solo los
estratos 1 y 2
Estrato 𝑁ℎ 𝑁ℎ 𝑠ℎ 𝑁ℎ 𝑠 2 ℎ
1 246 4,944,6 99386
2 322 22,475.6 1568797
Total 568 27420,2 1668,183

El tamaño de la muestra para investigar solo a estos dos estratos seria:

2 1 2
(∑2 𝑤ℎ 𝑆ℎ ) (
𝑁 2 ) (∑2 𝑁ℎ 𝑆ℎ )
𝑛= =
𝑑 2 1 1
[ ] + ( ) ∑ 𝑤ℎ 𝑠 2 ℎ 𝑣0 (𝑦𝑒 ) + ( 2 ) ∑ 𝑁ℎ 𝑠 2 ℎ
𝑡 𝑁 𝑁

[27,420]2 /6402
= 1668183 = 277 Arboles
2.5421+
(640) 2

𝑁1 𝑠1 4945
𝑛1 = 𝑛𝑟 (∑ ) = 277 (27420) = 50 Árboles en el bosque denso.
2 𝑁ℎ 𝑆ℎ

𝑁1 𝑠1 22476
𝑛2 = 𝑛𝑟 (∑ ) = 277 (27420) = 227 Árboles en el bosque abierto.
𝑁ℎ 𝑆ℎ

𝑛3 = 𝑛 − 𝑛𝑟 = 𝑛 − (𝑛1 + 𝑛2 ) = 344 − (50 + 227) = 67 Árboles en la pradera.

Muestra total =344 Árboles.

b.- Volumen total de madera en la zona forestal

𝑌𝑒 = ∑3 𝑁ℎ 𝑦̅ℎ = 52,064.6 Pies de madera.

Su varianza estimada:
∑3 𝑁 2 ℎ (1−𝑓ℎ )𝑠2 ℎ
𝑣𝑦̅𝑒 = = 279979295
𝑛ℎ

El error estándar correspondiente:

𝑠(𝑦𝑒 ) = √27997295 = 5291 Pies

El coeficiente de variación del estimado logrado será:


𝑠(𝑦𝑒 ) 5291
𝑐. 𝑣. (𝑦𝑒 ) = ∗ 100 = (52064.6) ∗ 100 = 10.16%
𝑦𝑒

Si consideramos un valor aproximado para t student 𝑧 = 1.96 para un nivel de seguridad


de 95% los límites de confianza logrados, a través de una muestra total de 60 árboles en la
zona forestal, serian:

𝑙. 𝑐. (𝑦) = 𝑦𝑒 ± 𝑡 ∗ 𝑠𝑦𝑒 = 52064.6 ± 1.96 ∗ 5291 = (62435; 41695) Pies de madera

Amplitud = 62435 − 41695 = 20740 Pies de madera.


El margen de error logrado para la estimación es entonces:

𝑑 = 𝑧 ∗ 𝑠(𝑦𝑒 ) = 1.96 ∗ 5291 = 10370 Pies de madera

Este margen de error es susceptible de ser reducido aumentando el tamaño de la muestra


total y distribuyendo adecuadamente est4e tamaño en cada uno de los estratos
identificados, sea considerado una asignación proporcional o asumiendo una asignación
óptima.

Si es necesario reducir el margen de error permisible para estimar al volumen total de


madera de la zona forestal a:

𝑑 = 10370 − 8370 = 2000 pies de madera.

¿Cuál será el tamaño de muestra necesario tomar para cada estrato de la zona?

Nivel de seguridad:

𝛼 = 0.05

𝑧 = 1.96

Varianza deseada:

𝑣0 (𝑦𝑒 ) = [𝑑/𝑧]2 = [2000/1.96]2 = 1041232.82

Error estándar deseado:

𝑆0 (𝑦𝑒 ) = √1041232.82 = 1020 Pies de madera.

Coeficiente de variación deseado.


𝑆0 (𝑦𝑒 ) 1020
𝑐. 𝑣.0 (𝑦𝑒 ) = [ ] ∗ 100 = 520064.6 ∗ 100 = 2% Aproximadamente.
𝑦𝑒

𝑛𝑁ℎ
b.1.- Asumiendo una afijación proporcional (𝑛ℎ = = 𝑛𝑤ℎ )
𝑁

1
∑3 𝑤ℎ 𝑠 2 ℎ (𝑁) ∑ 𝑁ℎ 𝑠 2 ℎ
𝑛= = =
𝑑 2 1 𝑣0 (𝑦𝑒 ) + (
1
) ∑ 𝑁ℎ 𝑠 2 ℎ
[ ] + ( ) ∑ 𝑤ℎ 𝑠 2 ℎ 𝑁2
𝑡 𝑁
2892482/640
= 471 Arboles
2.5421+2892413/(640)2

Para cada estrato de la zona forestal le corresponderá;


𝑁 246
𝑛1 = 𝑛 ( 𝑁1 ) = 471 (640) = 181 Árboles en el bosque denso.

𝑁 322
𝑛2 = 𝑛 ( 𝑁2) = 471 (640) = 237 Árboles en el bosque abierto.
𝑁 72
𝑛3 = 𝑛 ( 𝑁3) = 471 (640) = 53 Árboles en la pradera.

a.2. Asumiendo una afijación optima (𝑛ℎ = 𝑛𝑁ℎ 𝑠ℎ / ∑ 𝑁ℎ 𝑠ℎ )


2
(∑3 𝑤ℎ 𝑆ℎ ) (1/𝑁)(∑ 𝑁ℎ 𝑆ℎ )2 [36,809]2 /6402
𝑛= 1 = 1 = 2.5421+2892413/(640)2 = 344 Arboles
[𝑑/𝑡]2 +( ) ∑ 𝑤ℎ 𝑠2 ℎ 𝑣0 (𝑦𝑒 )+( 2 ) ∑ 𝑁ℎ 𝑠2 ℎ
𝑁 𝑁

𝑁 4945
𝑛1 = 𝑛 ( 𝑠 1 ) = 344 (36809) = 46 Árboles en el bosque denso.
1

𝑁 22475
𝑛2 = 𝑛 ( 𝑠 2) = 344 (36809) = 210 Árboles en el bosque abierto.
2

𝑁 9389
𝑛3 = 𝑛 ( 3) = 344 ( ) = 88 Árboles en la pradera.
𝑠3 36809

Como para el estrato 3 el número de arboles 𝑛3 = 88 > 𝑁3 = 72 es necesario reajustar el


tamaño de muestra para el estrato 3; esta reconstrucción se ejecutara considerando solo los
estratos 1 y 2 (Ver: Técnicas de muestreo W.cochran. sec 5.8).

Estrato 𝑁ℎ 𝑁ℎ 𝑠ℎ 𝑁ℎ 𝑠 2 ℎ
1 246 4,944,6 99386
2 322 22,475.6 1568797
Total 568 27,420.2 1668.183
El tamaño de la muestra para investigar solo a estos dos estratos seria:
2
(∑2 𝑤ℎ 𝑆ℎ ) (1/𝑁2 )(∑2 𝑁ℎ 𝑆ℎ )2 [27,420]2 /6402
𝑛= 1 = 1 = 1668183 = 277 Arboles
[𝑑/𝑡]2 +( ) ∑ 𝑤ℎ 𝑠2 ℎ 𝑣0 (𝑦𝑒 )+( 2 ) ∑ 𝑁ℎ 𝑠2 ℎ 2.5421+
(640) 2
𝑁 𝑁

𝑁1 𝑠1 4945
𝑛1 = 𝑛𝑟 (∑ ) = 277 (27420) = 50 Árboles en el bosque denso.
2 𝑁ℎ 𝑆ℎ

𝑁1 𝑠1 22476
𝑛2 = 𝑛𝑟 (∑ ) = 277 (27420) = 227 Árboles en el bosque abierto.
𝑁ℎ 𝑆ℎ

𝑛3 = 𝑛 − 𝑛𝑟 = 𝑛 − (𝑛1 + 𝑛2 ) = 344 − (50 + 227) = 67 Árboles en la pradera.

Muestra total =344 Árboles.

3.- De las 24000familias de un pueblo se desea seleccionar una muestra representativa con
el fin de estimar el valor promedio de los bienes familiares que pueden ser convertidos
rápidamente en dinero efectivo por familia. Las familias son estratificadas en dos estratos,
uno de rentas altas y el otro de rentas bajas; se piensa que sea una familia en el estrato de
renta de renta alta posee cerca de 9 veces más bienes de este tipo que los poseídos por un
hogar de renta baja; y se espera que la desviación estándar en cada estrato sea proporcional
a la raíz cuadrada de la media del estrato. Existen 4000 familias en el estrato de renta alta
y 20000 familias en el estrato de renta baja.

a.- como distribuiría una muestra estratificada de 1000 hogares en cada uno de los estratos.
b.- si el objetivo fuera estimar la diferencia entre el valor promedio de los bienes
convertibles rápidamente en dinero por familia de los dos estratos, ¿cómo debe estar
distribuida la muestra en los estratos?

Respuesta:

Estrato 𝑁ℎ 𝑦̅ℎ 𝑠ℎ 𝑛ℎ
renta alta 4000 9y 𝑘√9𝑦̅ ……
renta baja 20000 y 𝑘 √𝑦̅ ……
24000 1000
a.- Asumiendo una asignación optima del tamaño de muestra:
𝑛𝑁 𝑆
𝑛ℎ = ∑ 𝑁ℎ 𝑆ℎ , para h: 1,2
ℎ ℎ

𝑘√9𝑦̅
𝑛1 = 1000 ∗ 4000 ∗ = 375
4000𝑘√9𝑦̅+20,000𝑘√𝑦̅

𝑘√𝑦̅
𝑛2 = 1000 ∗ 20000 ∗ = 625
4000𝑘√9𝑦̅+20,000𝑘√𝑦̅

Total =1000

b.- Para estimar la diferencia de promedio entre estratos como cada estrato es muestreado
independientemente.

𝑠1 2 𝑠 2 2
𝑣(𝑦̅1 −𝑦̅2 ) = 𝑣(𝑦̅1 ) + 𝑣(𝑦̅2 ) = +
𝑛1 𝑛2

El objetivo es:

Minimizar: 𝑣(𝑦̅1 ) + 𝑣(𝑦̅2 )

Sujeto a: 𝑛1 +𝑛2 = 𝑛
𝑠2 1 𝑠2 2
Min Φ: + + 𝑡(𝑛 − 𝑛1 − 𝑛2 )
𝑛1 𝑛2

𝑑Φ 𝑠2 ℎ
= −𝑡 =0
𝑑𝑛ℎ 𝑛ℎ

∑ 𝑠ℎ
𝑛ℎ = 𝑠ℎ /√𝑡 ; Luego ∑ 𝑛ℎ = = 𝑛 , entonces 𝑡 = (∑ 𝑠ℎ )2 /𝑛2
√𝑡

Así
𝑛𝑠
𝑛ℎ = ∑ 𝑠ℎ

𝑘√9𝑦̅
𝑛1 = 1000 ∗ [𝑘√9𝑦̅+√𝑦̅] = 750

𝑘√𝑦̅
𝑛2 = 1000 ∗ [𝑘√9𝑦̅+√𝑦̅] = 250
Total =1000

4.- En una región agrícola conformada por 2010 fincas, la superficie total y la superficie
cultivada con maíz fue investigado en cada una de las unidades agrícolas. Con los
resultados, las fincas fueron clasificadas según su tamaño total en 7 estratos y se obtuvo la
información siguiente:

número
estrato de fincas superficie cultiva con maíz
(h) sup total promedio des estándar
(has) 𝑁ℎ 𝑦̅ℎ 𝑆ℎ
1 hasta 40 394 5,4 8,3
2 40,1 a 80 461 16,3 13,3
3 80,1 a 120 391 24,3 15,1
4 120,1 a 180 334 34,5 19,8
5 180,1 a 250 169 42,1 24,5
6 250,1 a 350 113 50,1 26,0
7 350,1 a mas 148 63,8 35,2
2010 26,3
Con el fin de actualizar la información de la zona se desea realizar una nueva encuesta por
muestreo seleccionando una muestra de 100 fincas, determinar el número de fincas que
deberán ser visitadas en cada estrato asumiendo:

a.- Asignación proporcional.

b.- Asignación óptima.

c.- Compare las precisiones esperadas lograr a través de los dos métodos de asignación,
respecto a utilizar una muestra simple aleatoria.

d.- Verificar que se cumple:


1 𝑁−𝑛
𝑣(𝑦̅)𝐴 = 𝑣(𝑦̅𝑒 )𝑃 + [∑ 𝑁ℎ (𝑦̅ℎ − 𝑦̅)2 − (𝑁) ∑(𝑁 − 𝑁ℎ )𝑆 2 ℎ ] ∗ [𝑁(𝑁−1)𝑛]

Respuesta:

𝑁ℎ
h 𝑤ℎ = 𝑁 𝑤ℎ 𝑁ℎ 𝑤ℎ 𝑆 2 ℎ 𝑤ℎ (𝑦̅ℎ − 𝑦̅)2 𝑆 2ℎ ∑ 𝑌 2 ℎ𝑖
1 0,196 1,6268 13,5024 85,6148 68,89 38563
2 0,229 3,0457 40,5078 22,9000 176,89 203853
3 0,195 2,9445 44,4620 0,7800 228,01 319805
4 0,166 3,2868 65,0786 11,1618 392,04 528093
5 0,084 2,0580 50,4210 20,9698 600,25 400379
6 0,056 1,4560 37,8560 31,7206 676,00 359343
7 0,074 2,6048 91,6890 104,0625 1239,04 784564
1 17,0226 343,5168 277,2095 3381,12 2634600
a.- Asignación proporcional: 𝑛ℎ = 𝑛 ∗ 𝑤ℎ del tamaño de muestra:

𝑁ℎ
h 𝑤ℎ = 𝑛ℎ = 100 ∗ 𝑤ℎ
𝑁
1 0,196 20
2 0,229 23
3 0,195 19
4 0,166 17
5 0,084 8
6 0,056 6
7 0,074 7
Total 100
𝑤ℎ 𝑠ℎ
b.- asignación óptima: 𝑛ℎ = 𝑛 ∗ (∑ ) del tamaño de muestra.
𝑤ℎ 𝑠ℎ

𝑁ℎ 𝑤ℎ 𝑠ℎ
𝑤ℎ = 𝑛ℎ = 100 ∗ ( )
h 𝑁 𝑤ℎ 𝑁ℎ ∑ 𝑤ℎ 𝑠ℎ
1 0,196 1,6268 10
2 0,229 3,0457 18
3 0,195 2,9445 17
4 0,166 3,2868 19
5 0,084 2,0580 12
6 0,056 1,4560 9
7 0,074 2,6048 15
1 17,0226 100
c.- Precisiones esperadas con los métodos de asignación

Varianza esperada con la asignación proporcional, para el estimador del promedio de la


superficie cultivada con maíz:
1−𝑓 1
𝑣(𝑦̅𝑒 )𝑜 = 𝑛
∗ ∑ 𝑤ℎ 𝑠 2 ℎ = (𝑛) ∗ ∑ 𝑤ℎ 𝑠 2 ℎ Despreciando (1 − 𝑓) = 1

343.5168
= = 3.345
100

Varianza esperada con la asignación óptima, para el estimador del promedio de la


superficie cultivada con maíz:
(∑ 𝑤ℎ 𝑠ℎ )2 ∑ 𝑤ℎ 𝑠2 ℎ (∑ 𝑤ℎ 𝑠ℎ )2
𝑣(𝑦̅𝑒 )𝑜 = − = Considerando (1 − 𝑓) = 1
𝑛 𝑁 𝑛

(17.0226)2
= = 2.898
100

Varianza esperada con una muestra simple aleatoria, para el estimador del promedio de la
superficie cultivada con maíz.
1
𝑣(𝑦̅)𝐴 = (𝑛) ∑ 𝑤ℎ 𝑠 2 ℎ + (1/𝑛) ∑ 𝑤ℎ (𝑦̅ℎ − 𝑦̅)2

343.5168 277.2095
= + = 6.207
100 100
Luego respecto al muestreo simple aleatorio, las precisiones esperadas con el muestreo
estratificado tendrían el comportamiento siguiente:

Método varianza esperada precisión relativa


𝑣(𝑦̅)𝐴
∗ 100
𝑣(𝑦̅𝑒 )
simple aleatorio 6,207
asignación proporcional 3,435 181%
asignación optima 2,898 214%
Se esperaría lograr mayor precisión utilizando el muestreo estratificado con una asignación
óptima del tamaño de muestra entre siete estratos.

d.- Verificar que se cumple:


1 𝑁−𝑛 1−𝑓
𝑣(𝑦̅)𝐴 = 𝑣(𝑦̅𝑒 )𝑃 + [∑ 𝑁ℎ (𝑦̅ℎ − 𝑦̅)2 − 𝑁 ∑(𝑁−𝑁 2 ] ∗ [ 𝑁−1 ∗ 𝑁] = 𝑛 ∑ 𝑤 2 + [∑ 𝑤ℎ (𝑦̅ℎ − 𝑦̅)2 −
ℎ )𝑠 ℎ𝑠 ℎ
1 1 𝑁−𝑛
∑ 𝑠 2 ℎ + ∑ 𝑤ℎ 𝑠 2 ℎ ][ ]
𝑁 𝑁 𝑛(𝑁−1)

3381.12 343.5168
= 0.95 ∗ 3.435 + [277.2095 − + ] [2010 − 100]2009 ∗ 100
2010 2010

𝑣(𝑦̅)𝐴 = 3.263 + 2.621 = 5.884

Directamente calculada la varianza esperada con una muestra simple aleatoria seria:

𝑣(𝑦̅)𝐴 = (1 − 𝑓)𝑆 2 /𝑛
1
Donde 𝑆 2 = (2009) [2634600 − 2010(26.3)2 ] = 619.3644

619.3644
𝑣(𝑦̅)𝐴 = 0.95 ∗ = 5.884 Vemos que se cumple.
100

5.- Un especialista propone tomar una muestra estratificada aleatoria de una población que
ha sido dividida en dos estratos; espera que sus costos de trabajo de campo tendrán la
forma: ∑ 𝑐ℎ 𝑛ℎ

Sus estimaciones preliminares sobre los valores principales para los dos estratos son:

estrato 𝑤ℎ 𝑠ℎ 𝑐ℎ
1 0,4 10 4
2 0,6 20 9
𝑛1 𝑛2
a.- Determinar los valores ,
𝑛 𝑛
que minimizan al costo de trabajo de campo de la investigación
asumiendo una misma varianza 𝑣(𝑦̅𝑒 ) predeterminada.

b.- Encontrar el tamaño de muestra requerido para que una asignación óptima se pueda lograr una
varianza 𝑣(𝑦̅𝑒 ) = 1(ignore la corrección de población finita 𝑐. 𝑝. 𝑓. : (1 − 𝑓) = 1).

c.- ¿Cuál será el costo total del trabajo de campo que se espera incurrir para l investigación?

Después de realizar la encuesta el muestrista encontró que sus costos efectivos de trabajo decampo
fueron:
𝑐1 = 2; 𝑐2 = 12

d.- ¿En cuánto supero el costo efectivo al costo esperado?

e.- ¿Si se hubiera conocido los verdaderos costos de trabajo de campo por adelantado,
podría haberse obtenido la varianza prevista 𝑣(𝑦̅𝑒 ) = 1 con el presupuesto asignado para
cubrir los costos de trabajo campo resultante de la pregunta c?

Respuesta:

Con la información supuesta preliminarmente disponible

estrato √𝑐ℎ 𝑤ℎ 𝑠ℎ 𝑤ℎ 𝑆ℎ /√𝑐ℎ 𝑤ℎ 𝑠ℎ √𝑐ℎ 𝑐ℎ


1 2 4 2 8
2 3 12 4 36
total 16 6 44
a.- Si el objetivo es minimizar 𝑐 = ∑ 𝑐ℎ 𝑛ℎ sujeto a una 𝑣(𝑦̅𝑒 ) predeterminada, la
asignación de la muestra en los estratos deberán ajustarse a una asignación óptima.

(Ver: “técnicas de muestreo w.cocrhanec 5.5”)


𝑤ℎ 𝑠ℎ ∑ 𝑤ℎ 𝑠ℎ
𝑛ℎ = 𝑛( )/[ ]
√𝑐ℎ √𝑐ℎ

Luego las relaciones 𝑛ℎ /n que logran el objetivo serán:


𝑛ℎ
= (𝑤ℎ 𝑠ℎ /√𝑐ℎ )/[∑ 𝑤ℎ 𝑠ℎ / √𝑐ℎ ]
𝑛

estrato 𝑛ℎ /𝑛 𝑤ℎ 𝑠ℎ /√𝑐ℎ )/[∑ 𝑤ℎ 𝑠ℎ / √𝑐ℎ


1 𝑛1 /𝑛 2/6=1/3
2 𝑛2 /𝑛 4/6=2/3
b.- El tamaño de muestra requerido para que utilizando una asignación óptima se pueda
lograr una varianza 𝑣(𝑦̅𝑒 ) = 1 ignorando la 𝑐. 𝑝. 𝑓. : (1 − 𝑓) = 1 es: (ver: “técnicas de
muestro w., cocrhan sec 5.5”)
∑ 𝑤ℎ 𝑠ℎ
𝑛 = (∑ 𝑤ℎ 𝑠ℎ √𝑐ℎ )( )/𝑣𝑜 (𝑦̅𝑒 )𝑂
√𝑐ℎ

𝑛 = 264 Observaciones serán necesarias

La forma de asignar estas observaciones en los estratos será:


1 1
Estrato 1: 𝑛1 = 𝑛 (3) = 264 (3) = 88 observaciones

2 2
Estrato 2: 𝑛2 = 𝑛 (3) = 264 (3) = 176 observaciones
c.- Costo total por trabajo de campo que se esperaría tener

Estrato 𝑛ℎ 𝑐ℎ 𝑐ℎ 𝑛ℎ
1 88 4 352
2 176 9 1584
total 264 1936
1936 de costo esperado

d.- Si los costos reales fueron 𝑐1 = 2 𝑐2 = 12 ; el costo efectivo de los trabajos de campo
es:

Estrato 𝑛ℎ 𝑐ℎ 𝑐ℎ 𝑛ℎ 𝑤ℎ 𝑆ℎ √𝑐ℎ 𝑤ℎ 𝑆ℎ √𝑐ℎ


1 88 2 176 0,4 10 2 5,65
2 176 12 2112 0,6 20 12 41,57
total 264 2288 47,22

El costo real supero al costo esperado en: 2288 − 1936 = 352

e.- ¿Podría haberse obtenido la varianza prevista 𝑣(𝑦̅𝑒 ) = 1 con el presupuesto asignado
para cubrir los costos de trabajo de campo equivalente a 1936?

Remplazando el valor óptimo de: 𝑛ℎ 𝑒𝑛 ∑ 𝑛ℎ ∗ 𝑐ℎ


𝑤ℎ 𝑠ℎ
∑ 𝑛ℎ ∗ 𝑐ℎ = ∑{[𝑛𝑤ℎ 𝑠ℎ /√𝑐ℎ ]/ ∑ } ∗ 𝑐ℎ
√ 𝑐ℎ

𝑤ℎ 𝑆ℎ
= 𝑛[∑ 𝑤ℎ 𝑆ℎ √𝑐ℎ ]/ ∑ ]
√ 𝑐ℎ

Como el tamaño demuestra requerido para lograr 𝑣(𝑦̅𝑒 ) varianza predeterminada es:
𝑤ℎ 𝑠ℎ
𝑛 = (∑ 𝑤ℎ 𝑠ℎ √𝑐ℎ )/(∑ )/𝑣0 (𝑦̅𝑒 ) ; reemplazando este valor ∑ 𝑛ℎ ∗ 𝑐ℎ =
√ 𝑐ℎ
2
(∑ 𝑤ℎ 𝑠ℎ √𝑐ℎ ) / 𝑣0 (𝑦̅𝑒 ); luego
2
∑ 𝑛ℎ ∗ 𝑐ℎ ∗ 𝑣0 (𝑦̅𝑒 ) = (∑ 𝑤ℎ 𝑠ℎ √𝑐ℎ )

La desigualdad de cauchy-Shwartz plantea que:


2
(∑ 𝑛ℎ ∗ 𝑐ℎ ) ∗ 𝑣0 (𝑦̅𝑒 ) = (∑ 𝑤ℎ 𝑠ℎ √𝑐ℎ )

El investigador modificara y controlara el valor de: (∑ 𝑛ℎ ∗ 𝑐ℎ ) ∗ 𝑣0 (𝑦̅𝑒 ) para lograr


2
establecer una igualdad con la cantidad fija: (∑ 𝑤ℎ 𝑠ℎ √𝑐ℎ ) . Así, si deseamos una
varianza 𝑣(𝑦̅𝑒 ) = 1 el presupuesto mínimo necesario para cubrir los costos reales de
trabajo de campo deberán ser:
2 (47.22)2
∑ 𝑛ℎ ∗ 𝑐ℎ = (∑ 𝑤ℎ 𝑠ℎ √𝑐ℎ ) / 𝑣0 (𝑦̅𝑒 ) = =2230
1
Como el presupuesto inicial disponible solo era 1,936 mucho menor al costo real
necesario de 2230 no se podrá cumplir con el deseo de obtener una varianza 𝒗𝟎 (𝑦̅𝑒 ) = 1.

También podría gustarte