Está en la página 1de 7

MUESTREO ESTRATIFICADO.

ESTIMACION DE LA MEDIA Y LA
PROPORCION POBLACIONAL.

En muchos estudios de investigación, la población a ser muestreada es heterogénea,


respecto a la variable en estudio de mayor interés, pero es factible dividirla en
subpoblaciones homogéneas llamados estratos; entonces se puede hacer uso del muestreo
estratificado.
Las subdivisiones de la población (estratos) constituyen una partición, es decir cada
elemento de la población pertenece a un solo estrato y la unión de todos ellos conforman
la población.
En lo que se refiere al método de selección a cada uno de los estratos se le trata de manera
independiente, sin embargo en el método de estimación, todos los estratos contribuyen de
manera ponderada para la obtención del indicador global. Si la muestra estratificada se
obtiene seleccionando una muestra aleatoria simple en cada estrato de forma
independiente, el muestreo se denomina muestreo aleatorio estratificado (MAE).
Generalmente para formar la muestra estratificada se obtienen elementos de todos los
estratos.
Puede usarse muestreo estratificado en estudios tales como:
• Volumen de ventas, usando el criterio de estratificación al número de empleados (o
clientes): supermercados, tiendas grandes, tiendas pequeñas.
• Calidad de atención en Hospitales, usando la variable de estratificación al número
de pacientes: grandes hospitales, Clínicas medias, Clínicas pequeñas.
• Rendimiento académico al concluir la educación secundaria: Institución educativa
pública, Institución educativa privada, etc.

En el muestreo estratificado una población heterogénea con N unidades, X1, X2, . . . ,XN
se divide en L subpoblaciones o estratos lo más homogéneos posibles no encubiertos 𝑋ℎ𝑖
con:
h = 1, 2, . . . , L (estratos)
i = 1, 2, . . . , 𝑁ℎ ( i-ésimo elemento en cada estrato)
de tamaño N1, N2, . . . , NL. La muestra estratificada de tamaño n se obtiene seleccionando
𝑛ℎ elementos ( h = 1, 2, . . . , L) de cada uno de los L estratos en que se subdivide la
población de forma independiente.
La formación de estratos en la población y la formación de la muestra estratificada se
puede expresar de la siguiente manera:

Población

𝑋11 𝑋12 𝑋13 . . . 𝑋1𝑁1 ℎ=1


𝑋21 𝑋22 𝑋23 . . . 𝑋2𝑁2 ℎ=2
. . .
𝑋1, 𝑋2 , . . . , 𝑋𝑁 dividir en L estratos ∑𝐿ℎ=1 𝑁ℎ =N
. . .
. . .
{𝑋𝐿1 𝑋𝐿2 𝑋𝐿3 . . . 𝑋𝐿𝑁𝐿 ℎ=𝐿
Muestra

𝑥11 𝑥12 𝑥13 . . . 𝑥1𝑛1 ℎ=1


𝑥21 𝑥22 𝑥23 . . . 𝑥2𝑛2 ℎ=2
. . .
𝑥1 , 𝑥2 , . . . , 𝑥𝑛 se extrae una muestra de cada estrato
. . .
. . .
𝑥 𝑥 𝑥
{ 𝐿1 𝐿2 𝐿3 . . . 𝑥𝐿𝑛𝐿 ℎ=𝐿

es decir: ∑𝐿ℎ=1 𝑛ℎ = n

Entonces al dividir la población en h estratos (generalmente de diferente tamaño) de


tamaño 𝑁ℎ de cada uno de los cuales seleccionamos de modo independiente 𝑛ℎ unidades
(mediante muestreo aleatorio simple si no se especifica otra cosa), obtenemos la muestra
estratificada de tamaño n.

Notaciones:

ℎ: indica el número del estrato ( h = 1, 2, . . . , L )

𝑖: indica la unidad dentro del estrato ( i = 1, 2, . . . , 𝑁ℎ )

𝑁ℎ : número de unidades en el estrato ℎ o tamaño del estrato h

𝑛ℎ : número de unidades de la muestra obtenida del estrato ℎ

𝑋ℎ𝑖 : valor observado en la i-ésima unidad del estrato ℎ


𝑁ℎ
𝑊ℎ = : ponderación del estrato ℎ en la población
𝑁

𝑛ℎ
𝑓ℎ = : fracción de muestreo en el estrato ℎ
𝑁ℎ

𝑁 ℎ 𝑋
∑𝑖=1 ℎ𝑖
𝜇ℎ = : media poblacional del estrato ℎ
𝑁ℎ

𝑛ℎ 𝑥
∑𝑖=1 ℎ𝑖
𝑥̅ℎ = : media muestral del estrato ℎ
𝑛ℎ

𝑁ℎ (𝑋 − 𝜇 )2
∑𝑖=1 ℎ𝑖 ℎ
𝜎ℎ2 = : varianza poblacional del estrato ℎ
𝑁ℎ

𝑛ℎ (𝑥 − 𝑥̅ )2
∑𝑖=1 ℎ𝑖 ℎ
𝑠ℎ2 = : varianza muestral del estrato ℎ
𝑛ℎ − 1

𝑁ℎ − 𝑛ℎ 𝑁ℎ − 𝑛ℎ
≈ : factor de corrección para poblaciones finitas
𝑁ℎ −1 𝑁ℎ
La estimación de los principales indicadores puede hacerse según dos situaciones:

• Cuando los 𝑛ℎ son obtenidos sin criterios de afijación


• Cuando los 𝑛ℎ son obtenidos con criterios de afijación

Cuando los 𝒏𝒉 son obtenidos sin criterios de afijación

Se refiere al caso en el que el tamaño de muestra 𝑛ℎ de cada estrato es obtenido de manera


arbitraria, o a criterio del investigador.

1. Estimación de la media poblacional

i) El parámetro
𝑁ℎ
∑𝐿
ℎ=1 𝑁ℎ ∑𝑖=1 𝑋ℎ𝑖
𝑁ℎ
∑𝐿ℎ=1 ∑𝑖=1 𝑋ℎ𝑖 𝑁ℎ ∑𝐿ℎ=1 𝑁ℎ 𝜇ℎ
𝑋̅ = 𝜇 = = = = ∑𝐿ℎ=1 𝑊ℎ 𝜇ℎ
𝑁 𝑁 𝑁

ii) Estimador de la media poblacional


Es la media estratificada, definida como:

∑𝐿ℎ=1 𝑁ℎ 𝑥̅ ℎ
𝑥̅𝑠𝑡 = = ∑𝐿ℎ=1 𝑊ℎ 𝑥̅ℎ
𝑁

𝑁ℎ
𝑥̅𝑠𝑡 es insesgado y los coeficientes de ponderación 𝑊ℎ = cumplen lo siguiente:
𝑁
𝑁ℎ ∑𝐿ℎ=1 𝑁ℎ 𝑁
∑𝐿ℎ=1 𝑊ℎ = ∑𝐿ℎ=1 = = = 1
𝑁 𝑁 𝑁

iii) varianza del estimador de la media poblacional

𝝈𝟐𝒉
𝜎𝑥̅2𝑠𝑡 = V(𝑥̅𝑠𝑡 ) = V(∑𝐿ℎ=1 𝑊ℎ 𝑥̅ℎ ) = ∑𝐿ℎ=1 𝑊ℎ2 𝑉(𝑥̅ℎ ) = ∑𝑳𝒉=𝟏 𝑾𝟐𝒉 muestreo con
𝒏𝒉
reposición
𝝈𝟐 𝑵 − 𝒏
𝜎𝑥̅2𝑠𝑡 = V(𝑥̅𝑠𝑡 ) = V(∑𝐿ℎ=1 𝑊ℎ 𝑥̅ℎ ) = ∑𝐿ℎ=1 𝑊ℎ2 𝑉(𝑥̅ℎ ) = ∑𝑳𝒉=𝟏 𝑾𝟐𝒉 𝒉 ( 𝒉 𝒉) muestreo sin
𝒏𝒉 𝑵𝒉
reposición

iv) Estimador de la varianza del estimador de la media poblacional

𝑠ℎ2
𝜎̂𝑥̅2𝑠𝑡 = 𝑉̂ (𝑥̅ 𝑠𝑡 ) = ∑𝐿ℎ=1 𝑊ℎ2 muestreo con reposición
𝑛ℎ
𝑠2 𝑁 − 𝑛
𝜎̂𝑥̅2𝑠𝑡 = 𝑉̂ (𝑥̅ 𝑠𝑡 ) = ∑𝐿ℎ=1 𝑊ℎ2 ℎ ( ℎ ℎ) muestreo sin reposición
𝑛ℎ 𝑁ℎ
v) Intervalo confidencial para la media poblacional

P [𝑥̅𝑠𝑡 − 𝑍(1− 𝛼) 𝜎𝑥̅ 𝑠𝑡 ≤ 𝜇 ≤ 𝑥̅𝑠𝑡 + 𝑍(1− 𝛼) 𝜎𝑥̅ 𝑠𝑡 ] = 1 – 𝛼 cuando se conoce 𝜎ℎ2


2 2

P [𝑥̅𝑠𝑡 − 𝑡(𝑛−1 , 𝛼 𝜎
̂
1− ) 𝑥̅ 𝑠𝑡
≤ 𝜇 ≤ 𝑥̅𝑠𝑡 + 𝑡(𝑛−1 , 𝛼 𝜎
̂ ]
1− ) 𝑥̅ 𝑠𝑡
= 1 – 𝛼 cuando no se conoce 𝜎ℎ2
2 2

t = Tabla t

Ejemplo:

Una granja tiene 1000 cerdos, listos para su comercialización, de 3 razas diferentes. Para
estimar el peso (en Kg) se ha tomado la siguiente información:

Raza 𝑁ℎ 𝑛ℎ
A 350 10 150, 160, 188, 166, 148, 150, 155, 150, 152, 170
B 500 15 140, 128, 125, 130, 135, 144, 160, 162, 128, 120, 125, 123, 120,
130, 150
C 150 10 120, 110, 112, 114, 118, 125, 128, 120, 100, 98
1000 35

Se pide:
a.- Estimar puntualmente el peso promedio de los cerdos en la granja
b.- Estimar en un intervalo confidencial del 95% el peso promedio de los cerdos en la
granja.

Solución:
a.-

Raza 𝑁ℎ 𝑛ℎ 𝑥̅ ℎ 𝑠ℎ2
A 350 10 150, 160, 188, 166, 148, 150, 155, 150, 152, 170 158.90 160.10
B 500 15 140, 128, 125, 130, 135, 144, 160, 162, 128, 134.66̅ 187.52
120, 125, 123, 120, 130, 150
C 150 10 120, 110, 112, 114, 118, 125, 128, 120, 100, 98 114.50 97.16̅

1000 35

∑3ℎ=1 𝑁ℎ 𝑥̅ ℎ ̅)+150(114.50)
350(158.9)+500(134.66
𝑥̅𝑠𝑡 = = = 140.12 kg.
𝑁 1000

𝑛ℎ 𝑥
∑𝑖=1 ℎ𝑖
𝑥̅ℎ = 𝑛ℎ

b.- Como la varianza poblacional es desconocida, el intervalo confidencial para 𝜇 es igual a:

P [𝑥̅𝑠𝑡 − 𝑡(𝑛−1 , 𝛼 𝜎
̂
1− ) 𝑥̅ 𝑠𝑡
≤ 𝜇 ≤ 𝑥̅𝑠𝑡 + 𝑡(𝑛−1 , 𝛼 𝜎
̂ ]
1− ) 𝑥̅ 𝑠𝑡
= 1–𝛼
2 2
entonces, usamos la varianza estimada y como n/N = 35/1000 = 0.035 < 0.05 se usa
varianza para muestreo con reposición.

𝑠ℎ2 350 160.10 500 187.52 150 ̅


97.16
𝜎̂𝑥̅2𝑠𝑡 = ∑3ℎ=1 𝑊ℎ2 = (1000)2 ( ) + (1000)2 ( ) + (1000)2 ( ) = 5.3 𝑘𝑔2
𝑛ℎ 10 15 10

𝜎̂𝑥̅𝑠𝑡 = 2.3 kg.

𝑛 𝑛
ℎ 𝑥2 − (∑ 𝑥ℎ𝑖 )2
ℎ (𝑥 − 𝑥̅ )2
∑𝑖=1 ∑𝑖=1 ℎ𝑖
ℎ𝑖 ℎ 𝑛ℎ
𝑠ℎ2 = =
𝑛ℎ − 1 𝑛ℎ −1

𝑡(𝑛−1, 1−𝛼/2) = 𝑡(34, 0.975) ≈2

Por tanto:

P[140.12 − 2 (2.3) ≤ 𝜇 ≤ 140.12 + 2 (2.3)] = 0.95

P[140.12 − 4.6 ≤ 𝜇 ≤ 140.12 + 4.6] = 0.95

𝑃[135.52 ≤ 𝜇 ≤ 144.72] = 0.95

Por tanto, estimamos que el peso promedio de los cerdos es de 140.12 Kg. con un límite
para el error de estimación de ± 4.6 Kg.

4.6
Nota: El error de muestreo es aproximadamente igual a d = 2 (2.3) = 4.6 kg. o d = 140.12
x 100 = 3.3% ( este resultado indica que el tamaño de muestra es aceptable).

2. Estimación de la proporción poblacional

La variable puede ser cualitativa o cuantitativa dicotómica, es decir:

1 𝑆𝑖 (é𝑥𝑖𝑡𝑜)
Si los datos 𝑋ℎ𝑖 = {
0 𝑁𝑜 (𝑓𝑟𝑎𝑐𝑎𝑠𝑜)

i) Parámetro
𝑁 𝑁
∑𝐿ℎ=1 ∑𝑖=1
ℎ 𝑋
ℎ𝑖 𝐴

𝑁ℎ ∑𝑖=1 𝑋ℎ𝑖 ∑𝐿ℎ=1 𝑁ℎ 𝑃ℎ
𝑃= =𝑁 = ∑𝐿ℎ=1 = ∑𝐿ℎ=1 𝑊ℎ 𝑃ℎ =
𝑁 𝑁 𝑁ℎ 𝑁

ii) Estimador de la proporción poblacional


Es la proporción estratificada, definida como:
𝑛ℎ 𝑋
∑𝐿ℎ=1 𝑁ℎ 𝑝ℎ ∑𝑖=1 ℎ𝑖 1
𝑝𝑠𝑡 = ∑𝐿ℎ=1 𝑊ℎ 𝑝ℎ = 𝑝ℎ = 𝑋ℎ𝑖 = {
𝑁 𝑛ℎ 0
iii) Varianza del estimador de la proporción poblacional
𝑃ℎ 𝑄 ℎ
𝜎𝑝2𝑠𝑡 = V(𝑝𝑠𝑡 ) = V(∑𝐿ℎ=1 𝑊ℎ 𝑝ℎ ) = ∑𝐿ℎ=1 𝑊ℎ2 𝑉(𝑝ℎ ) = ∑𝐿ℎ=1 𝑊ℎ2 muestreo con
𝑛ℎ
reposición
𝑃ℎ 𝑄ℎ 𝑁ℎ − 𝑛ℎ
𝜎𝑝2𝑠𝑡 = V(𝑝𝑠𝑡 ) = V(∑𝐿ℎ=1 𝑊ℎ 𝑝ℎ ) = ∑𝐿ℎ=1 𝑊ℎ2 𝑉(𝑝ℎ ) = ∑𝐿ℎ=1 𝑊ℎ2 ( 𝑁 ) muestreo sin
𝑛ℎ ℎ
reposición
iv) Estimador de la varianza del estimador de la proporción poblacional
Como generalmente 𝑃ℎ 𝑄ℎ no se conocen se utiliza el estimador.
𝑝ℎ 𝑞 ℎ
𝜎̂𝑝2𝑠𝑡 = 𝑉̂ (𝑝𝑠𝑡 ) = ∑𝐿ℎ=1 𝑊ℎ2 muestreo con reposición
𝑛ℎ

𝑝ℎ 𝑞ℎ 𝑁ℎ − 𝑛ℎ
𝜎̂𝑝2𝑠𝑡 = 𝑉̂ (𝑝𝑠𝑡 ) = ∑𝐿ℎ=1 𝑊ℎ2 ( 𝑁 ) muestreo sin reposición
𝑛ℎ ℎ

v) Intervalo confidencial para la proporción poblacional

P [𝑝𝑠𝑡 − 𝑍(1− 𝛼) 𝜎𝑝𝑠𝑡 ≤ 𝑃 ≤ 𝑝𝑠𝑡 + 𝑍(1− 𝛼) 𝜎𝑝𝑠𝑡 ] = 1 – 𝛼 cuando se conoce 𝑃ℎ


2 2

P [𝑝𝑠𝑡 − 𝑍(1− 𝛼) 𝜎̂𝑝𝑠𝑡 ≤ 𝑃 ≤ 𝑝𝑠𝑡 + 𝑍(1− 𝛼) 𝜎̂𝑝𝑠𝑡 ] = 1 – 𝛼 cuando no se conoce 𝑃ℎ


2 2

Ejemplo:

Suponga que se desea información acerca de las viviendas que hacen uso de telecable.
Para efectos de dicha investigación se ha distribuido a la ciudad en 4 estratos (A, B, C,
D), obteniéndose una muestra aleatoria de 200 viviendas, con los siguientes resultados:
𝑛ℎ
Estratos 𝑁ℎ 𝑛ℎ
∑ 𝑋ℎ𝑖
𝑖=1
A 500 20 15
B 800 40 20
C 1500 50 10
D 3000 90 5
Total 5800 200

Se pide:
a.- Estimar puntualmente la proporción de viviendas con telecable
b.- Estimar en un intervalo al 95% de confianza la proporción de viviendas con telecable.

Solución:
a.-
𝑛ℎ
Estratos 𝑁ℎ 𝑛ℎ 𝑝ℎ 𝑞ℎ
∑ 𝑋ℎ𝑖
𝑖=1
A 500 20 15 0.75 0.25
B 800 40 20 0.50 0.50
C 1500 50 10 0.20 0.80
D 3000 90 5 0.05̅ 0.94̅
Total 5800 200

∑4ℎ=1 𝑁ℎ 𝑝ℎ ̅)
500(0.75)+800(0.5)+1500(0.2)+3000(0.05
𝑝𝑠𝑡 = = = 0.21408 ≈ 21.4%, es decir de cada
𝑁 5800
100 viviendas 21 tienen
telecable.
𝑛ℎ 𝑋
∑𝑖=1 ℎ𝑖
𝑝ℎ = 𝑛ℎ

b.- Como no se conoce la varianza poblacional usaremos la varianza estimada, y además


como la fracción de muestreo n/N = 200/5800 = 0.03 < 0.05 calculamos la varianza para
muestreo con reposición, sin factor de corrección para poblaciones finitas.

𝑝ℎ 𝑞 ℎ 500 0.75(0.25) 800 0.50(0.50) 1500 0.20(0.80)


𝜎̂𝑝2𝑠𝑡 = ∑4ℎ=1 𝑊ℎ2 = (5800)2 ( ) + (5800)2 ( ) + (5800)2 ( )+
𝑛ℎ 20 40 50
3000
(5800)2

̅ (0.94
0.05 ̅)
( ) = 0.00055858
90

𝜎̂𝑝𝑠𝑡 = 0.0236

Luego, el intervalo de confianza para estimar la proporción de viviendas con telecable es:

P [𝑝𝑠𝑡 − 𝑍(1− 𝛼) 𝜎̂𝑝𝑠𝑡 ≤ 𝑃 ≤ 𝑝𝑠𝑡 + 𝑍(1− 𝛼) 𝜎̂𝑝𝑠𝑡 ] = 1 – 𝛼


2 2

P[0.21408 − 1.96(0.0236) ≤ 𝑃 ≤ 0.21408 + 1.96(0.0236)] = 0.95

P[0.21408 − 0.046256 ≤ 𝑃 ≤ 0.21408 + 0.046256] = 0.95

P[ 0.17 ≤ 𝑃 ≤ 0.26] = 0.95

Por tanto, estimamos que la proporción de viviendas con Telecable es del 21.4% con un
error de estimación o muestreo del 4.6%.

También podría gustarte