Documentos de Académico
Documentos de Profesional
Documentos de Cultura
UNIDAD 4
MUESTREO ESTRATIFICADO
4.1. Introducción.
2
V Y 1 f Y
S
n
De forma más precisa podemos decir que en el muestreo estratificado, una población
heterogénea con N unidades u i i 1, 2, ,N se subdivide en L subpoblaciones lo más
homogéneas posibles no solapadas de tamaños N1, N2,…, NL . , denominadas estratos
u h i hi 11,, 22,, ,, LNh .
Figura 4.1.
Figura 4.2.
132
Unidad 4. Muestreo Estratificado.
Son diversos los motivos que aconsejan efectuar una partición de la población en L
estratos, no solapados, entre los que destacan los siguientes:
6. Una razón para utilizar muestreo estratificado es cuando existe una variable
precisa para la estratificación cuyos valores permitirán dividir
convenientemente la población en estratos homogéneos. Las variables utilizadas
para la estratificación deberán estar correlacionadas con las variables objeto de
la investigación. La estratificación se realiza de acuerdo a ciertos criterios que
suelen venir definidos por los valores de determinadas variables llamadas
variables de estratificación. Por ejemplo, si se quiere estudiar el volumen de
133
Unidad 4. Muestreo Estratificado.
Vamos a considerar que seleccionamos o elegimos en cada estrato las unidades para
la muestra mediante muestreo aleatorio simple sin reposición y que la selección se
realiza de forma independiente en cada estrato.
L Nh
θ X hi (4.1)
h 1 i 1
El parámetro θ puede ser estimado mediante la suma extendida a todos los estratos de
los estimadores lineales insesgados de Horvitz y Thompson en cada estrato, es decir
mediante el estimador:
L nh
Xh i
θ (4.2)
h 1 i 1 π h i
134
Unidad 4. Muestreo Estratificado.
~
donde π h i es la probabilidad de que la unidad u h i pertenezca a la muestra (Yh ) de
n h unidades, obtenida de entre las N h unidades del estrato h-ésimo.
La insesgadez del estimador θ se puede probar introduciendo la variable auxiliar e h i
definida como:
~ ) con probabilidad n
1 si u h i (Y πh i h
h
Nh
eh i
0 si u h i (Y~ ) con probabilidad 1 π 1 n h
h hi
Nh
L nh
Sea θ w h i X h i un estimador lineal insesgado del parámetro poblacional:
h i
L Nh
θ X hi
h 1 i 1
Se tiene:
L nh L Nh L Nh
E(θ) E w h i X h i E w h i X h i e h i w h i X h i E(e h i )
h 1 i 1 h 1 i 1 h 1 i 1
L Nh L Nh
1
w h i X h i π h i
X hi w h i Xh i πh i Xh i w h i
h 1 i 1
h 1 i 1
πh i
Por insegadez
θ
E (θ )
L Nh
Con lo que el estimador lineal insesgado para el parámetro θ X hi es:
h 1 i 1
L nh L nh
Xh i
θ w h i X h i
h 1 i 1 h 1 i 1 π h i
Obtendremos:
L nh
Yh i L nh
Y L
1 nh
Total θ Y X h i Yh i Y st h i N h Y hi
h 1 i 1 π h i h 1 i 1
n h h 1 nh i 1
Nh
L L L
N h Y h N h y h Y h
h 1 h 1 h 1
135
Unidad 4. Muestreo Estratificado.
Yh i
nh
Yh i L L
1 nh Y
Media θ Y Xh i Y st N h i
h 1 i 1 π h i
N h 1 N i 1
nh
Nh
L nh L nh L
N 1 1
h Yh i Wh Y hi Wh y h
h 1 N n h i 1 h 1 nh i 1 h 1
L
N L N h
N
h 1
Wh h
h 1 N
h 1
N
N
1
L nh
Ah i L nh
A
Total de clase θ A X h i A h i A st h i
h 1 i 1 π h i h 1 i 1
nh
Nh
1L nh L L
Nh A hi N h P h A h
h 1 nh i 1 h 1 h 1
El estimador del total de clase poblacional es la suma de los estimadores del total de
clase en cada estrato.
Ah i L
1 nh A h i L
1 nh A h i
Proporción θ P Xh i P st nh
N h 1 N i 1 π h i h 1 N i 1
Nh
L
Nh 1 nh L
1 nh L
A h i Wh A h i Wh p h
h 1 N n h i 1 h 1 nh i 1 h 1
L L L
S2
V( Y st ) V Y h V(Y h ) N 2h (1 f h ) h (4.3)
h 1 h 1 h 1 nh
L L L
S2
V( Y st ) V( y st ) V Wh y h Wh2 V( y h ) Wh2 (1 f h ) h (4.4)
h 1 h 1 h 1 nh
L L L
N h Ph Q h
V( A st ) V A h V(A h ) N 2h (1 f h ) (4.5)
h 1 h 1 h 1 Nh 1 n h
L L L
N h Ph Q h
V( P st ) V Wh P h Wh2 V(P h ) Wh2 (1 f h ) (4.6)
h 1 h 1 h 1 Nh 1 n h
nh 1
2 nh nh
1 nh 2
Sh
n h 1 i 1
(Yh i y h ) 2
n h 1 n h
i 1
(Yhi y h ) 2
n h 1
σh (4.7)
1 Nh Nh 1 Nh
Nh
S
2
N h 1 i 1
(Yh i Y h ) 2
Nh 1 Nh
(Y Yh )2 σ 2h (4.8)
Nh 1
h hi
i 1
2 nh Nh
Sh Ph Qh , S2h Ph Q h (4.9)
n h 1 Nh 1
2 nh Nh
con lo que Sh P h Q h es un estimador insesgado para S2h Ph Q h
n h 1 Nh 1
2
L
Sh
V(Y st ) N 2h (1 f h ) (4.10)
h 1 nh
137
Unidad 4. Muestreo Estratificado.
2
L
Sh
V(Y st ) Wh2 (1 f h ) (4.11)
h 1 nh
L
n Ph Qh L
Ph Qh
V(A st ) N (1 f h ) h
2
N 2h (1 f h ) (4.12)
n h 1 n h n h 1
h
h 1 h 1
L
P h Qh
V(P st ) W (1 f h ) 2
(4.13)
nh 1
h
h 1
L
k S2h
V( Y st ) N 2h (1 ) (4.14)
h 1 Nh k
L
k S2h
V( y st ) Wh2 (1 ) (4.15)
h 1 Nh k
L
k N h Ph Q h
V( A st ) N 2h (1 ) (4.16)
h 1 N h N h 1 k
L
k N h Ph Q h
V( P st ) Wh2 (1 ) (4.17)
h 1 Nh Nh 1 k
nh N k Nh n h / k n h
fh h kf Wh
Nh Nh N n/k n
- Las fracciones de muestreo en los estratos son iguales y coinciden con la fracción
global de muestreo f, siendo su valor la constante de proporcionalidad.
L
S2h L
S2 (1 k ) L
V( Y st ) N 2h (1 f h ) N 2h (1 k ) h N h S2h (4.19)
h 1 n h h 1 k Nh k h 1
L
S2h L
n2 S2 (1 k ) L n h 2 (1 k ) L
V( y st ) Wh2 (1 f h ) h2 (1 k ) h Sh n Wh S2h
h 1 n h h 1 n nh n h 1 n h 1
(4.20)
L
N h Ph Q h L 2 N h Ph Q h (1 k ) L N 2h
V( A st ) N 2h (1 f h ) N h (1 k ) Ph Q h
h 1 Nh 1 n h h 1 Nh 1 k Nh k h 1 N h 1
(4.21)
L
N h Ph Q h L 2 N h Ph Q h (1 k ) L 2 Ph Q h
V( P st ) Wh2 (1 f h ) Wh (1 k ) Wh N 1
h 1 Nh 1 n h h 1 Nh 1 k Nh k h 1 h
(4.22)
139
Unidad 4. Muestreo Estratificado.
Nh
Sh
N h Sh N WS
nh n L n L n L h h (4.23)
Nn
h 1
N n Sh
h 1 N
Sh
h 1
Wn Sh
Los valores de n h para la estimación de la media van a coinciden con los valores del
estimador del total en afijación de mínima varianza.
N hS Nh Nh n
Sh S n h n L
n L
n Wh n k N h , con k
N S N
N N
n n
h 1 h 1
Una vez calculados los valores de n h para afijación de mínima varianza, vamos a ver
cuánto vale la varianza del estimador de la media y del total para este tipo de
afijación. Tenemos:
L
n h S2h L
2 Sh
2 L
S2h
V( y st ) W (1
2
h ) Wh Wh
h 1 N h n h h 1 n h h 1 N
L
S2h L
S2h L
Wh Sh 1 L
Wh2 Wh Wh S2h
Wh Sh N h 1 1 N h 1
h 1
n L
h 1
n L
WnSh
h 1
W S
h 1
n h
140
Unidad 4. Muestreo Estratificado.
2
1 L 1 L
Wh Sh Wh S2h
n h 1 N h 1
2
1 L 1 L
V( y st ) Wh Sh Wh S2h (4.24)
n h 1 N h 1
L
n h S2h L
S2 L
V( Y st ) N 2h (1 ) N 2h h N h S2h
h 1 N h n h h 1 n h h 1
L
S2h L L
N h Sh L
N 2h N h S2h N h S2h
N h Sh 1
h 1
n L
h 1 h 1
n L
h 1
N S
h 1
n h N S
h 1
n h
2
1 L L
V( Y st ) N h Sh N h S2h (4.25)
n h 1 h 1
Nh Nh
Nh Ph Q h Wh Ph Q h
N h Sh N h 1 N h 1
nh n L
n L
n L
(4.26)
N S
Nh Nh
h 1
n h N
h 1
h
N h 1
Ph Q h W
h 1
h
N h 1
Ph Q h
2
1 L Nh L
1 Wh N h Ph Q h
V( Pst ) Wh Ph Q N h 1 (4.27)
n h 1 Nh 1 Nh 1
2
1 L Nh 1 L Nh
V( A st ) N h Ph Q N h Ph Q h (4.28)
n h 1 Nh 1 N h 1 Nh 1
N h Sh / c h Wh Sh / c h
nh n L
n L
(4.29)
N S
h 1
n h / ch W S
h 1
n h / ch
Los valores de n h para la estimación de la media coinciden con sus valores para la
estimador del total en afijación óptima. No olvidemos que esta coincidencia también
se daba en afijación de mínima varianza.
Una vez calculados los valores de n h para afijación óptima, vamos a ver cuánto vale
la varianza del estimador de la media y del total para este tipo de afijación.
Tenemos:
1 L L 1 L
V( y st ) Wh Sh / c h Wh Sh c h Wh S2h (4.30)
n h 1 h 1 N h 1
1 L L L
V( Y st ) N h Sh / c h N h Sh c h N h S2h (4.31)
n h 1 h 1 h 1
Nh PQ Nh PQ
Nh h h Wh h h
N h Sh / c h N h 1 ch N h 1 ch
nh n L
n L
n L
N S
Nh PQ Nh PQ
h 1
n h / ch Nh
h 1
h h
N h 1 ch
W
h 1
h h h
N h 1 ch
(4.32)
142
Unidad 4. Muestreo Estratificado.
2
1 L Nh 1 L Nh
V( P st ) Wh Ph Q Wh Ph Q (4.33)
n h 1 N h 1 N h 1 N h 1
2
1 L Nh L
Nh
V( A st ) N h Ph Q N h Ph Q (4.34)
n h 1 N h 1 h 1 N h 1
L N N
1 h
1 L h
S2 (Yhi Y) 2 (Yhi Y h Y h Y) 2
N 1 h 1 i 1 N 1 h 1 i 1
1 L Nh L Nh L Nh
hi
N 1 h 1 i 1
( Y Y h ) 2
( Y h Y ) 2
2 ( Y Y h ) ( Y h Y )
hi
h 1 i 1 h 1 i 1
0
N N
1 L h 1 L h 1 L
h i
N 1 h 1 i 1
( Y Y h ) 2
N 1 h 1 i 1
( Y h Y ) 2
(N h 1)S2h
N 1 h 1
1 L 1 L 1 L
N 1 h 1
N h (Y h Y ) 2
N 1 N
N h 1
N h Sh N h ( Y h Y ) 2
2
N h 1
Nh 1 Nh
L
Nh 2 L Nh L L
Sh ( Y h Y ) 2 Wh S2h Wh ( Y h Y ) 2
h 1 N h 1 N h 1 h 1
En efecto, tenemos:
L Nh L Nh
h 1 i 1 h 1 i 1
143
Unidad 4. Muestreo Estratificado.
L Nh Nh
Y h Yhi Y Yhi N h Y h N h Y h Y
2
h 1 i i
Nh Y h Nh Y h
L
Nh Yh Nh Yh Y Nh Yh Nh Yh Y 0
2 2
h 1
S2 1 f L 1 f L
(1 f )
n n
Wh S2h Wh (Y h Y) 2 VMAS ( y)
VMEP ( y)
h 1
nh 1
La igualdadse da
si Y h Y h 1,..,L
VMAS ( y) VMEP ( y) 0
1 f L 1 L 2
2
1 L
VMEP ( y) VMEMV ( y)
n
Wh S Wh Sh Wh S2h
2
h
n h 1 N h 1
h 1
1 L 1 L 1 L 2
2
1 L
Wh S2h Wh S2h Wh Sh Wh S2h
n h 1 N h 1 n h 1 N h 1
2
1 L 1 L 1 L L
Wh S2h Wh S2h Wh ( Sh S)
0 con S Wh S2h
n h 1 n h 1 n h 1 La igualdadse da h 1
si Sh S h 1,..,L
precisiones cuando las cuasidesviaciones típicas de los estratos son todas iguales. Por
tanto, la ganancia en precisión del muestreo estratificado con afijación de mínima
varianza respecto del muestreo estratificado con afijación proporcional será mayor
cuanto más distantes entre sí sean las cuasidesviaciones típicas de los estratos; es
decir, para que el muestreo estratificado sea más preciso es conveniente que los
estratos sean heterogéneos entre sí en desviación típica y que constituye una de las
especificaciones clásicas en el muestreo estratificado.
Media.
(1 f) L 1
n
L W h S2h
e 2 V( y st ) h h n
W S 2
N W S2 n
h h
1 L
h 1
(4.36)
e Wh S2h
n h 1 h 1 2
N h 1
Total.
L
1
n N N h S2h
(1 f ) L L
e 2 V( Y st ) N h S2h
n
N
N h S2h n h 1
L
(4.37)
e Nh S
f h 1 h 1 2 2
h
N h 1
145
Unidad 4. Muestreo Estratificado.
L L
Nh
Wh S2h h 1
W
Nh 1
Ph Q h
h
n h 1
(4.38)
1 L 1 L Nh
e Wh Sh e 2 Wh
2 2
Ph Q h
N h 1 N h 1 Nh 1
L L
Nh
N N h S2h N Nh Ph Q h
h 1 N h 1
n h 1
L
L
(4.39)
Nh
e N h Sh e 2 N h
2 2
Ph Q h
h 1 h 1 N h 1
Media.
2
L
2 Wh Sh
1
e 2 V( y st ) Wh Sh Wh S2h n h 1 L
L L
1
(4.40)
n h 1 N h 1 1
e 2 Wh S2h
N h 1
Total.
2
L
2 N h Sh
1
e 2 V( Y st ) N h Sh N h S2h n h 1 L
L L
(4.41)
n h 1 h 1 e 2 N h S2h
h 1
2
L
2
L Nh
N h Sh Nh P Q
h 1 N 1
h h
n h 1 L n
h
L
(4.43)
N
e 2 N h S2h e2 Nh h
Ph Q h
h 1 h 1 N h 1
Media.
1 L L 1 L
e 2 V( y st ) Wh Sh / c h Wh Sh c h Wh S2h , despejando n:
n h 1 h 1 N h 1
L L
Wh Sh / c h Wh Sh c h
n h 1 h 1
L
(4.44)
1
e 2 Wh S2h
N h 1
Total.
L L
N h Sh / c h N h Sh c h
n h 1 L
h 1 (4.45)
e 2 N h S2h
h 1
L Nh L Nh
Wh Ph Q h / c h Wh Ph Q h c h
h 1 N h 1 N h 1
n L
h 1 4.46)
1 N
e 2 Wh h
Ph Q h
N h 1 N h 1
L Nh L Nh
Nh Ph Q h / c h N h Ph Q h c h
h 1 Nh 1 Nh 1
n L
h 1 (4.47)
N
e2 Nh h
Ph Q h
h 1 Nh 1
147
Unidad 4. Muestreo Estratificado.
σ( θ)
2. Error relativo e r CV(θ)
Prefijado.
E(θ)
Media.
W h S2h
n h 1
(4.48)
1 L
Y e r Wh S2h
2 2
N h 1
Total.
L
N N h S2h
n h 1
L
(4.49)
N Y er Nh S
2 2 2 2
h
h 1
L
Nh
N Nh Ph Q h
h 1 N h 1
n L
(4.51)
Nh
N2P2 er N h
2
Ph Q h
h 1 N h 1
Media.
2
L
Wh Sh
n h 1 (4.52)
1 L
Y e r Wh S2h
2 2
N h 1
148
Unidad 4. Muestreo Estratificado.
Total.
2
L
N h Sh
n h 1 (4.53)
L
N Y er Nh S
2 2 2 2
h
h 1
2
L Nh
Nh Ph Q h
h 1 N h 1
n (4.55)
L
Nh
N P er Nh
2 2 2
Ph Q h
h 1 N h 1
Media.
L L
Wh Sh / c h Wh Sh c h
n h 1 h 1 (4.56)
1 L
Y e r Wh S2h
2 2
N h 1
Total.
L L
N h Sh / c h N h Sh c h
n h 1 h 1
L
(4.57)
Y e N h S2h
2 2
h 1
Proporción.
L Nh L Nh
Wh Ph Q h / c h Wh Ph Q h c h
h 1 N h 1 N h 1
n L
h 1 (4.58)
1 N
P 2 e r Wh
2 h
Ph Q h
N h 1 N h 1
149
Unidad 4. Muestreo Estratificado.
Total de clase.
L Nh L Nh
Nh Ph Q h / c h N h Ph Q h c h
h 1 N h 1 N h 1
n L
h 1 (4.59)
Nh
P2 er Nh
2
Ph Q h
h 1 N h 1
3. Error de muestreo y coeficiente de confianza prefijados. e1 Z / 2 σ( θ )
Media.
n
1
2 (1 f )
L L
e1 Z / 2 V( y st ) Z / 2 Wh S2h Z / 2 h h
N W S2
2 2 2
n h 1 n h 1
Despejando n, resulta:
W
2
Z /2 h S2h
n L
h 1
(4.60)
1
e1 Z / 2 Wh S2h
2 2
N h 1
Total.
n
1
(1 f ) L L
e1 Z / 2 V( Y st ) Z / 2 N h Sh Z / 2 N
N h S2h
2 2 2 2 2
f h 1 n h 1
N
Despejando n, resulta:
L
Z / 2 N N h S2h
2
n h 1
L (4.61)
e1 Z / 2 N
2 2 2
h S h
h 1
Proporción.
L
Nh
W
2
Z /2 Ph Q h
Nh 1
h
h 1
n L
(4.62)
1 Nh
e1 Z / 2 Wh
2 2
Ph Q h
N h 1 Nh 1
Total de clase.
L
Nh
Z / 2 N Nh
2
Ph Q h
h 1 Nh 1
n L
(4.63)
Nh
e1 Z / 2 N h
2 2
Ph Q h
h 1 Nh 1
Media.
1 L 2
W S 1 W S2
L
e1 Z / 2 V( y st ) Z / 2
2 2 2
n h 1 h h
N h 1
h h
2
2
L
Z / 2 Wh Sh
n h 1 (4.64)
L
2 1
e1 Z / 2
2
Wh S2h
N h 1
Total.
1 L 2
N S N S2
L
e1 Z / 2 V( Y st ) Z / 2
2 2 2
n h 1 h h h 1 h h
2
L
N h Sh
2
Z α/2
n h 1 (4.65)
L
e1 Z α /2
2 2
N
h 1
h S 2
h
Proporción
2
L Nh
Z / 2 Wh Ph Q h
2
h 1 N h 1
n L
(4.66)
2 1 Nh
e1 Z / 2
2
Wh Ph Q h
N h 1 N h 1
151
Unidad 4. Muestreo Estratificado.
Total de clases
2
L Nh
Z α/2
2
Nh Ph Q h
h 1 N h 1
n (4.67)
L
Nh
e1 Z α /2
2 2
Nh Ph Q h
h 1 N h 1
Media.
2 1 L 1 L
L
e1 Z / 2 V( y st ) Z / 2 Wh Sh / c h Wh Sh c h Wh S2h
2 2
n h 1 h 1 N h 1
2 L
L
Z / 2 Wh Sh / c h Wh Sh c h
n h 1 h 1 (4.68)
L
1
e1 Z / 2
2 2
Wh S2h
N h 1
Total.
2 L
L
Z / 2 N h Sh / c h N h Sh c h
n h 1 h 1 (4.69)
L
e1 Z / 2 N h S2h
2 2
h 1
Proporción.
2 L
L
Nh Nh
Z / 2 Wh Ph Q h / c h Wh Ph Q h c h
h 1 Nh 1 h 1 Nh 1
n L
(4.70)
2 1 Nh
e1 Z / 2
2
Wh Ph Q
N h 1 Nh 1
Total de clase.
2 L
L
Nh Nh
Z / 2 N h Ph Q h / c h N h Ph Q h c h
h 1 Nh 1 h 1 Nh 1
n L
(4.71)
N
e1 Z / 2 N h
2 2 h
Ph Q
h 1 Nh 1
152
Unidad 4. Muestreo Estratificado.
Media.
W
2
Z α/2 h S2h
n h 1
(4.72)
1 L
Y e r1 Z α/2
2 2 2
Wh S2h
N h 1
Total.
L
Z α/2 N N h S2h
2
n h 1
L
(4.73)
N Y e r1 Z α/2 N
2 2 2 2 2
h S h
h 1
Proporción.
L
Nh
h 1
Z α/2
2
N h 1
W
Ph Q h h
n L
(4.74)
2 1 Nh
P 2 e r1 Z α/2
2
Wh Ph Q h
N h 1 N h 1
Total de clase.
L
Nh
Z α/2 N N h
2
Ph Q h
h 1 N h 1
n L
(4.75)
Nh
N P e r1 Z α/2
2 2 2 2
Nh Ph Q h
h 1 N h 1
Media.
2
L
Z α/2 Wh Sh
2
n h 1 (4.76)
L
1
Y e r1 Z α/2
2 2 2
Wh S2h
N h 1
153
Unidad 4. Muestreo Estratificado.
Total.
2
2
L
Z α/2 N h Sh
n h 1 (4.77)
L
N Y e r1 Z α/2 N
2 2 2 2 2
h S h
h 1
Proporción.
2
L Nh
Z α/2 Wh Ph Q h
2
h 1 Nh 1
n L
(4.78)
2 1 Nh
P 2 e r1 Z α/2
2
N h 1
Wh
Nh 1
Ph Q h
Total de clase
2
L Nh
Z α/2
2
Nh Ph Q h
h 1 Nh 1
n (4.79)
L
Nh
N P e r1 Z α/2
2 2 2 2
Nh Ph Q h
h 1 Nh 1
Media.
2 L
L
Z α/2 Wh Sh / c h Wh Sh c h
n h 1 h 1 (4.80)
L
2 1
Y e r1 Z α/2
2 2
Wh S2h
N h 1
Total.
2 L
L
Z α/2 N h Sh / c h N h Sh c h
n h 1 h 1 (4.81)
L
Y e r1 Z α/2 N h S2h
2 2 2
h 1
Proporción.
2 L
L
Nh Nh
Z α/2 Wh Ph Q h / c h Wh Ph Q h c h
h 1 N h 1 h 1 N h 1
n L
(4.82)
1 N
P 2 e r1 Z α/2
2 2 h
Wh Ph Q h
N h 1 N h 1
154
Unidad 4. Muestreo Estratificado.
Total de clase.
2 L
L
Nh Nh
Z α/2 N h Ph Q h / c h N h Ph Q h c h
h 1 N h 1 h 1 N h 1
n L
(4.83)
Nh
P 2 e r1 Z α/2 N h
2 2
Ph Q h
h 1 N h 1
Valores de Y 2 3 4 7 10 12 16 20 25 30 35 50 60 100
Frecuencias (ni) 20 30 60 100 150 200 120 80 50 20 18 10 8 4
Solución.
Nh
1 Nh
1 Nh ( (Yh i n i ) 2
S2h
N h 1 i 1
(Yh i Y h ) 2 Yh i 2 n i i 1
N h 1 i 1 Nh
155
Unidad 4. Muestreo Estratificado.
N1
N1 ( (Y1 i n i ) 2
1 1 (1070) 2
S12 1i i i 1 3.63
2
210 1 210
Y n 6210
N1 1 i 1 N1
N2
N2 ( (Y2 i n i ) 2
1 1 (8670) 2
S22 2i i i 1 20.85
2
600 1 600
Y n 137770
N 2 1 i 1 N2
N3
1
N3 ( (Y3 i n i ) 2
1 (2810) 2
S32 3i i i 1 344.32
2
60 1 60
Y n 133850
N3 1 i 1 N3
L
k S2h 3
n S2
V( y st ) Wh2 (1 ) Wh2 (1 h ) h
h 1 N h k h 1 Nh n h
n h n Wh , h = 1, 2, 3 n = 100
210 600 60
n1 100 24 n 2 100 69 n 3 100 7
870 870 870
(1 k ) L (1 n / N)
VP ( y st )
n h 1
Wh S2h
n
W1S12 W2S22 W3S32
100
(1 )
870 210 3.63 600 20.85 120 344.32 0.555
100 870 870 870
N h Sh
Para afijación de mínima varianza se utiliza la expresión n h n L
N S
h 1
n h
N 2S 2 600 4.57
n 2 100 100 65
N1S1 N 2S2 N 3S3 210 1.9 600 4.57 60 18.56
N 3S3 60 18.56
n 3 100 100 26
N1S1 N 2S2 N 3S3 210 1.9 600 4.57 60 18.56
2 2
1 L 1 L 1 210 600 60
VMV ( y st ) Wh Sh Wh S2h 1.9 4.57 18.56
n h 1 N h 1 100 870 870 870
1 210 600 60
3.63 20.85 344.32 0.2391 0.0448 0.194
870 870 870 870
S2
V( y) (1 f)
n
2
14
N 14
Yi n i
Yi i1 n
1 1
donde : S2
N 1 i 1
(Yi Y) 2
870 1 i 1 870
i
157
Unidad 4. Muestreo Estratificado.
14
Yn i i
12350
Y i 1
14.2
870 870
Yi Y n i
14
1 1
S2 102516.8 117.97
2
870 1 i 1 869
S2 100 117.97
Luego V( y) (1 f ) (1 ) 1.044
n 870 100
1.044 0.194
G 100 81.4%
1.044
N h Sh / c h
nh n L
N S
h 1
n h / ch
N1S1 / c1 60 18.56 / 25
n 3 100 100 17
N1S1 / c1 N 2S2 / c 2 N 3S3 / c h 1307.22
1 L L 1 L
V( y st ) Wh Sh / c h Wh Sh c h Wh S2h
n h 1 h 1 N h 1
1 W1 S1 W2 S2 W3 S3
100 c1
c2
c 3
W1 S1 c1 W2 S2 c 2 W3 S3 c 3
158
Unidad 4. Muestreo Estratificado.
1
870
W1 S12 W2 S22 W3 S32 0.2925 0.0369 0.2556
e) En una encuesta de salarios posterior podemos considerar los resultados de la
encuesta actual como valores producidos por una muestra piloto, y podrán ser
utilizados en el cálculo de tamaños muestrales para cometer errores prefijados.
23.91 23.91
n 81
1 0.2948
0.5 2 39.00
870
L
N
( 1) N h S2h
V( Yst ) V( Yst ) n
e r1 Z α/2 CV( Y ) Z α/2 e r1 Z α/2 Z α/2 h 1
2 2 2
2
E(Yst ) Y Y2
donde:
n
(1 )
(1 k ) L L
N L
V( Y st ) N h S2h
k h 1 n
N
N h S2h (
h 1 n
1) N h S2h
h 1
N
L
Z α/2 N N h S 2h
2
Ejemplo 4.2. Supongamos conocidos los siguientes datos de una población dividida
en tres estratos: S12 9 , S12 225 , S12 1600 , N1 = 1000, N2 = 600, N3 = 200,
C1 = 1000, C2 = 1200 y C3 = 2000. Considerando muestreo sin reposición, se pide:
Solución.
Afijación proporcional
(1 f ) L W h S2h
255.2
e 2 V(Y) V( y st ) Wh S2h n h 1
1 3
255.2
189
Wh S2h
n h 1 1.21
e2
N h 1 1800
n h n Wh , h = 1, 2, 3 n = 189
n 90
Wh Sh
nh n L
W S
h 1
n h
Afijación óptima.
1 L L 1 L
e 2 V( y st ) Wh Sh / c h Wh Sh c h Wh S2h
n h 1 h 1 N h 1
3 3
Wh Sh / c h Wh Sh c h
n h 1 h 1 0.293420.424 91
3
1 1
e 2 Wh S2h 1.21 255.2
N h 1 1800
Una vez hallado el tamaño de muestra realizamos la afijación óptima como sigue:
Wh Sh / c h
nh n 3
W S
h 1
n h / ch
donde c 0 representa un costo fijo dado y los c h son también conocidos y representan
el costo unitario en el estrato h (h = 1, 2, …, L). Se pide:
Estrato Wh Sh ch
1 0.4 4 1
2 0.3 5 2
3 0.3 6 3
Solución.
L n S2 L
S2 L S2
mín Wh2 (1 h ) h Wh2 h Wh h
h 1 N h n h h 1 n h h 1 Nh
L
c0 ch n h C
h 1
L
S2h L S2 L
(n h , λ) Wh2 Wh h λ c 0 c h n h C
h 1 n h h 1 N h 1
Tenemos:
S2 c L
Wh2 h h 0 ( h 1,2,..., L) C0 c h n h 0
nh nh 2 nh h 1
162
Unidad 4. Muestreo Estratificado.
2/3
Wh4S4h Wh2S2h
c
2 2 2 2/3
W 4S 4 c 2h ch
h h4 h
2 nh nh 2 n 3h 2
nh
k
h 1
nh
h 1
c h
n
1.08 1.03
n 2 1000 271 n 3 1000 259
3.98 3.98
42 52 62
0.4 0.3 0.3 0.026259 0.00139 0.024869
10000 10000 10000
Wh Sh / c h
nh n L
W S
h 1
n h / ch
0.4 4 / 1 1.6
n1 1000 1000 432
0.4 4 / 1 0.3 5 / 2 0.3 6 / 3 3.7
1.06 1.04
n 2 1000 287 n 3 1000 281
3.7 3.7
163
Unidad 4. Muestreo Estratificado.
L
S2h n L
S2 L S2 42 52 62
Min V( y st ) Wh2 (1 h ) Wh2 h Wh h (0.4) 2 (0.3) 2 (0.3) 2
h 1 nh N h h 1 n h h 1 N 432 287 281
42 52 62
0.4 0.3 0.3 0.025296 0.00139 0.023906
10000 10000 10000
Resulta ligeramente más precisa la afijación óptima con función de costo lineal.
La ganancia en precisión se cuantifica de la siguiente forma:
Vamos a considerar que seleccionamos en cada estrato las unidades para la muestra
mediante muestreo aleatorio simple con reposición y que la selección se realiza de
manera independiente en cada estrato. Un estimador de un parámetro poblacional
puede expresarse como suma de las estimaciones para el parámetro en los diferentes
estratos mediante muestreo aleatorio simple con reposición. Cualquier parámetro
poblacional puede expresarse como suma de los valores de la variable en estudio (o
una función lineal suya) sobre las unidades de los estratos.
Que puede ser estimado mediante la suma extendida a todos los estratos de los
estimadores lineales insesgados de Hansen y Hurwitz en cada estrato, es decir
mediante el estimador:
164
Unidad 4. Muestreo Estratificado.
L nh
Xh i
θ (4.85)
h 1 i 1 n h Ph i
Se observa que la expresión del estimador es la misma con reposición que sin
reposición pues:
L nh
Xh i L nh
Xh i L nh
X
θ HH h i θ HT (4.86)
h 1 i 1 n h Ph i h 1 i 1
1 h 1 i 1
nh
nh
Nh Nh
Por otra parte, como en todos los estratos se realiza muestreo aleatorio simple con
reposición, el estimador de Hansen y Hurwitz en cada estrato coincide con el
estimador Horwitz y Thompson, con lo que los estimadores en muestreo aleatorio
estratificado con reposición coincidirán con los ya estudiados (en las secciones
anteriores) para el caso de sin reposición.
La insesgadez del estimador θ se puede probar introduciendo la variable auxiliar e h i
definida como el número de veces que la unidad u h i pertenece a la muestra de n h
unidades seleccionada en el estrato h-ésimo. Por su forma de definición la variable
e h i es una binomial de parámetros (n h , Ph i ) (n h ,1/ N h ) cuya valor esperado
(esperanza matemática) es n h Ph i n h 1/N h n h /N h .
L nh
Sea θ w h i X h i un estimador lineal insesgado del parámetro poblacional:
h i
L Nh
θ X hi
h 1 i 1
Se tiene:
L nh L Nh L Nh
E(θ) E w h i X h i E w h i X h i e h i w h i X h i E(e h i )
h 1 i 1 h 1 i 1 h 1 i 1
L Nh L Nh
1
w h i X h i n h Ph i
X hi w h i X h i n h Ph i X h i w h i
h 1 i 1
h 1 i 1
n h Ph i
Por insegadez
θ
E (θ )
L Nh
Con lo que el estimador lineal insesgado para el parámetro θ X hi es:
h 1 i 1
L nh L nh
Xh i L nh
Xh i
θ w h i X h i
h 1 i 1 h 1 i 1 n h Ph i h 1 i 1 n h /N h
165
Unidad 4. Muestreo Estratificado.
Concluimos que los estimadores lineales insesgados del total, media, total de clase y
proporción serán los mismos en los casos de con reposición y sin reposición.
L L L L
Y st Y h Y st Wh y h P st Wh p h A st A h
h 1 h 1 h 1 h 1
L L L
σ2
V( Y st ) V Y h V(Y h ) N 2h h (4.87)
h 1 h 1 h 1 nh
L L L
σ2
V( y st ) V Wh y h Wh2 V( y h ) Wh2 h (4.88)
h 1 h 1 h 1 nh
L L L
PQ
V( A st ) V A h V(A h ) N 2h h h (4.89)
h 1 h 1 h 1 nh
L L L
PQ
V( P st ) V Wh P h Wh2 V(P h ) Wh2 h h (4.90)
h 1 h 1 h 1 nh
n 1
2 nh nh
1 nh 2
Sh
n h 1 i 1
(Yh i y h ) 2 h
n h 1 n h
i 1
(Yhi y h ) 2
n h 1
σh (4.91)
Nh
1
σ 2h
Nh
(Y
i 1
hi Yh )2 (4.92)
2 nh N 1 N 1 N h
Sh P h Q h , σ 2h h S2h h Ph Q h Ph Q h (4.93)
n h 1 Nh N h N h 1
166
Unidad 4. Muestreo Estratificado.
2 nh
con lo que Sh P h Q h es un estimador insesgado para σ 2h Ph Q h .
n h 1
2
Sh L
V(Y st ) N 2h (4.94)
h 1 nh
2
Sh L
V( y st ) Wh2 (4.95)
h 1 nh
L
n h P h Qh L
P h Qh
V(A st ) N 2h N 2h (4.96)
h 1 nh 1 nh h 1 nh 1
L
P h Qh
V(P st ) W 2
(4.97)
n h 1
h
h 1
Dada la forma en que están definidos los cálculos de los n h para las afijaciones
uniformes y proporcional, dichas afijaciones no van a verse afectadas por el hecho de
que el muestreo sea con o sin reposición. Sin embargo sí cambiaran las varianzas de
los estimadores, las afijaciones de mínima varianza y óptima si van a verse afectadas
por la existencia de reposición o no, ya que el cálculo de n h depende de las varianzas
en los estratos.
L
σ 2h
V( Y st ) N 2h (4.98)
h 1 k
L
σ 2h
V( y st ) Wh2 (4.99)
h 1 k
167
Unidad 4. Muestreo Estratificado.
L
Ph Q h
V( A st ) N 2h (4.100)
h 1 k
L
Ph Q h
V( P st ) Wh2 (4.101)
h 1 k
Este tipo de afijación que consiste en asignar a cada estrato un número de unidades
muestrales n h proporcional a su tamaño N h , no interviene para nada en el reparto
de unidades muestrales entre los estratos el hecho de que haya o no reposición. Las n
unidades de la muestra se distribuyen proporcionalmente a los tamaños de los
estratos, expresados en número de unidades.
n N n / k nh
n h Nh k n k N k , Wh h h
N N n/k n
n h n Wh (4.102)
L
σ 2h L
2 σh
2
1 L
V( Y st ) N Nh
2
h N h σ 2h (4.103)
h 1 n h h 1 k N h k h 1
L
σ 2h L
n 2h σ 2h 1 L n h 2 1 L
V( y st ) W 2
2
h σ h Wh σ 2h (4.104)
h 1 n h h 1 n n h n h 1 n n h 1
L
Ph Q h L 2 Ph Q h 1 L
V( A st ) N 2h Nh N h Ph Q h (4.105)
h 1 nh h 1 k N h k h 1
L
Ph Q h L n 2h Ph Q h 1 L n h 1 L
V( P st ) Wh2 2 Ph Q h Wh Ph Q h (4.106)
h 1 nh h 1 n nh n h 1 n n h 1
Nh
σh
Wh σ h N N σ
nh n L n L n L h h (4.107)
Nn
h 1
Wn σ h
h 1 N
σh
h 1
Nnσh
Los valores de n h para la estimación de la media van a coinciden con los valores del
estimador del total en afijación de mínima varianza.
Nhσ Nh Nh n
σh σ n h n L
n L
n Wh n k N h , con k
N σ N
N N
n n
h 1 h 1
Una vez calculados los valores n h para afijación de mínima varianza en el caso de la
estimación de la media con reposición, vamos a ver cuánto vale la varianza del
estimador de la media y del total para este tipo de afijación.
Tenemos:
2
L
σ2 L
σ 2h L
Wh σ h 1 L
V( y st ) W h Wh2
2
Wn σ h
h
n h h 1 Wh σ h 1 n h 1
h 1
n L
h 1
n L
Wn σ h
h 1
W σ
h 1
n h
2
1 L
V( y st ) Wn σ h (4.108)
n h 1
2
L
σ 2h L
σ 2h L
Nh σh 1 L
V( Y st ) N 2
N 2h Nh σh
h
n h h 1 Nhσh 1 n h 1
h 1
n L
h 1
n L
Nnσh
h 1
N σ
h 1
n h
2
1 L
V( Y st ) N h σ h (4.109)
n h 1
Nhσh N h Ph Q h Wh Ph Q h
nh n L
n L
n L
(4.110)
N σ
h 1
n h N
h 1
h Ph Q h W
h 1
h Ph Q h
169
Unidad 4. Muestreo Estratificado.
2 2
1 L 1 L
V( P st ) Wh σ h Wh Ph Q h (4.111)
n h 1 n h 1
2 2
1 L 1 L
V( A st ) N h σ h N h Ph Q h (4.112)
n h 1 n h 1
Wh σ h / c h Nh σh / ch
nh n L
n L
(4.113)
W σ
h 1
n h / ch N σ
h 1
n h / ch
Los valores de n h para la estimación de la media coinciden con sus valores para la
estimador del total en afijación óptima. No olvidemos que esta coincidencia también
se daba en afijación de mínima varianza.
Tenemos:
L
σ 2h L
σ 2h L
Wh σ h c h
V( y st ) Wh2 Wh2
h 1 n h h 1 Wh σ h / c h h 1
n
1
n L
W σ
L
W σ
h 1
n h / ch
h 1
n h / ch
1 L L
V( y st ) Wh σ h / c h Wh σ h c h (4.114)
n h 1 h 1
170
Unidad 4. Muestreo Estratificado.
σ 2h
L L
σ 2h L
Nh σh ch
V( Y st ) N N 2h
2
h
h 1 n h h 1 Nh σh / ch h 1
n
1
n L
N σ
L
N σ
h 1
n h / ch
h 1
n h / ch
1 L L
V( Y st ) N h σ h / c h N h σ h c h (4.115)
n h 1 h 1
Wh σ h / c h Wh Ph Q h / c h N h Ph Q h / c h
nh n L
n L
n L
W σ
h 1
n h / ch W
h 1
n Ph Q h / c h N
h 1
n Ph Q h / c h
(4.116)
L
Ph Q h 1 L L
V( P st ) Wh2 Wh Ph Q h / c h Wh Ph Q h c h
h 1 Wh Ph Q h / c h n h 1 h 1
n L
W h 1
n Ph Q h / c h
(4.117)
L
Ph Q h 1 L L
V( A st ) N 2h Nh Ph Q h / c h N h Ph Q h c h
h 1 N h Ph Q h / c h n h 1 h 1
n L
N
h 1
n Ph Q h / c h
(4.118)
Tenemos:
N N
1 L h 1 L h
σ2
N h 1 i 1
( Yhi Y ) 2
N h 1 i 1
( Yh i Y h Y h Y ) 2
171
Unidad 4. Muestreo Estratificado.
1 L Nh L Nh L Nh
( Yh i Y h )
N h 1 i 1
2
( Y h Y ) 2 ( Yh i Y h )( Y h Y )
2
h 1 i 1
h 1 i 1
0
N N
1 L h 1 L h 1 L 1 L
( Yh i Y h ) 2 ( Y h Y ) 2 N h σ 2h N h ( Y h Y ) 2
N h 1 i 1 N h 1 i 1 N h 1 N h 1
L
Nh 2 L Nh L L
σh ( Y h Y ) 2 Wh σ 2h Wh ( Y h Y ) 2
h 1 N h 1 N h 1 h 1
L L
σ2 1 L 1 L
σ 2 Wh σ 2h Wh ( Y h Y ) 2 Wh σ 2h Wh ( Y h Y ) 2
h 1 h 1 n
n h
1
n h
1
VMAS ( y) VMEP ( y) 0
VMAS ( y )
VMEP ( y )
La igualdadse da
si Y h Y h 1,..,L
1 L
2 2
1 L 1 L L
VMEP ( y) VMEMV ( y) Wh σ h Wh σ h Wh σ h Wh σ h
2 2
n h 1 n h 1 n h 1 h 1
172
Unidad 4. Muestreo Estratificado.
2
L
1 L 1 L 1 L
Wh σ 2h Wh σ h
Wh σ 2h σ 2 Wh σ 2h 2 σ 2 σ 2
n h 1 h 1 n h 1 n h 1
σ
L
1 1 W (σ 2 2 σ σ 2)
L L L
h h
n h 1
W σ 2
2 σ
h 1
Wh σ h σ 2
h 1
Wh h h
n h 1
σ 1
1 L L
n h 1
Wh (σ 2h σ) 2
0 con σ Wh σ h VMEP ( y ) VMEMV ( y )
h 1
La igualdad se da
si σ h σ h 1,..,L
Se produce igualdad de eficiencias cuando las varianzas y las medias de los estratos
son constantes, y se produce la máxima diferencia de eficiencias cuanto más
distantes sean las varianzas y las medias de los estratos, es decir, cuanto mayor sea la
heterogeneidad entre los estratos, tal como es lógico en muestreo estratificado.
173
Unidad 4. Muestreo Estratificado.
Media.
L
1 L W h σ 2h
e 2 V( y st )
n h 1
Wh σ 2h n h 1
e2
(4.120)
Total.
L
N N h σ 2h
N L
e 2 V( Y st )
n h 1
N h σ 2h n h 1
e2
(4.121)
Wh σ 2h W h Ph Q h
n h 1
h 1
(4.122)
e2 e2
L L
N N h σ 2h N N h Ph Q h
n h 1
h 1
(4.123)
e2 e2
Media.
2
L
2 Wh σ h
1
e 2 V( y st ) Wh σ h n h 1 2
L
(4.124)
n h 1 e
174
Unidad 4. Muestreo Estratificado.
Total.
2
L
2 Nh σh
1
e 2 V( Y st ) N h σ h n h 1 2
L
(4.125)
n h 1 e
2 2
L L
Wh σ h Wh Ph Q h
n h 1 2 n h 1 (4.126)
e e2
2 2
L L
Nh σh Nh Ph Q h
n h 1 2 n h 1 (4.127)
e e2
Media.
1 L L
e 2 V( y st ) Wh σ h / c h Wh σ h c h , despejando n resulta:
n h 1 h 1
L L
Wh σ h / c h Wh σ h c h
n h 1 h 1
2
(4.128)
e
Total.
L L
h h N σ / c h N h σ h ch
n h 1 h 1
2
(4.129)
e
L L
Wh Ph Q h / c h Wh Ph Q h c h
n h 1 h 1 (4.130)
e2
L L
Nh Ph Q h / c h N h Ph Q h c h
n h 1 h 1 (4.131)
e2
σ( θ)
2. Error relativo e r CV(θ)
Prefijado.
E(θ)
Media.
L
W h σ 2h
n h 1
2
(4.132)
Y e2
Total.
L
N h σ 2h
n h 1
2
(4.133)
N Y e2
2
W h Ph Q h
n h 1
(4.134)
P2 e2
L
N h Ph Q h
n h 1
(4.135)
N P2 e2
Media.
2
L
Wh σ h
n h 1 2 2 (4.136)
Y e
176
Unidad 4. Muestreo Estratificado.
Total.
2
L
Nh σh
n h 1 2 2 2 (4.137)
N Y e
Proporción.
2
L
Wh Ph Q h
n h 1 2 2 (4.138)
P e
Total de clase
2
L
N h Ph Q h
n h 1 2 2 2 (4.139)
N P e
Media.
L L
Wh σ h / c h Wh σ h c h
n h 1 h 1
2 2
(4.140)
Y e
Total.
L L
Nh σh / ch Nh σh ch
n h 1 h 1
2 2
(4.141)
Y e
Proporción.
L L
Wh Ph Q h / c h Wh Ph Q h c h
n h 1 h 1 (4.142)
P2 e2
Total de clase.
L L
Nh Ph Q h / c h N h Ph Q h c h
n h 1 h 1
2 2
(4.143)
P e
177
Unidad 4. Muestreo Estratificado.
3. Error de muestreo y coeficiente de confianza prefijados. e1 Z / 2 σ( θ )
Media.
L
W
2
Z /2 h σ 2h
1 L
e1 Z / 2 V( y st ) Z / 2 Wh σ 2h n h 1
2 2 2
2
(4.144)
n h 1 e 1
Total.
L
Z / 2 N N h σ 2h
2
N L
e1 Z / 2 V( Y st ) Z / 2 N h σ 2h n h 1
2 2 2
2
(4.145)
n h 1 e1
Proporción.
L
W
2
Z /2 h Ph Q h
n h 1
2
(4.146)
e1
Total de clase.
L
Z / 2 N N h Ph Q h
2
n h 1
2
(4.147)
e 1
Media.
2
L
Wn σ h
2
2 Z /2
1 L h 1
e1 Z / 2 V( y st ) Z / 2 Wn σ h n
2 2 2
2
n h 1 e1
(4.148)
Total.
2
L
Nh σh
2
2 Z /2
1 L h 1
e1 Z / 2 V( Y st ) Z / 2 Nh σh n
2 2 2
2
n h 1 e1
(4.149)
178
Unidad 4. Muestreo Estratificado.
Proporción
2
L
Wh Ph Q h
2
Z /2
n h 1 (4.150)
2
e1
Total de clases
2
2
L
Z α/2 N h Ph Q h
n h 1 (4.151)
2
e1
Media.
1 L L
e1 Z / 2 V( y st ) Z / 2 h h h Wh σ h c h
2 2 2
W σ / c
n h 1 h 1
2 L
L
Z / 2 Wh σ h / c h Wh σ h c h
n h 1 h 1 (4.152)
2
e1
Total.
2 L
L
Z / 2 Nh σh / ch N h σh ch
n h 1 h 1 (4.153)
2
e1
Proporción.
2 L
L
Z / 2 Wh Ph Q h / c h Wh Ph Q h c h
n h 1 h 1 (4.154)
2
e1
Total de clase.
2 L
L
Z / 2 Nh Ph Q h / c h N h Ph Q h c h
n h 1 h 1 (4.155)
2
e1
179
Unidad 4. Muestreo Estratificado.
Media.
L
Z /2
2
W h σ 2h
n h 1
2 2
(4.156)
Y e 1
Total.
L
N
2
Z /2 h σ 2h
n h 1
2 2
(4.157)
N Y e1
Proporción.
L
W
2
Z /2 h Ph Q h
n h 1
2 2
(4.158)
P e1
Total de clase.
L
Nh
N
2
Z /2 Ph Q h
N h 1
h
h 1
n 2
(4.159)
N P 2 e1
Media.
2
L
Wh σ h
2
Z /2
n h 1 (4.160)
2 2
Y e1
Total.
2
L
Z / 2 Nh σh
2
n h 1 (4.161)
2 2 2
N Y e1
180
Unidad 4. Muestreo Estratificado.
Proporción.
2
L
Wh Ph Q h
2
Z /2
n h 1 (4.162)
2 2
P e1
Total de clase
2
L
N h Ph Q h
2
Z /2
n h 1 (4.163)
2 2 2
N P e1
Media.
2 L
L
Z / 2 Wh σ h / c h Wh σ h c h
n h 1 h 1 (4.164)
2 2
Y e1
Total.
2 L
L
Z / 2 N h σh / ch N h σh ch
n h 1 h 1 (4.165)
2 2
Y e1
Proporción.
2 L
L
Z / 2 Wh Ph Q h / c h Wh Ph Q h c h
n h 1 h 1 (4.166)
2 2
P e1
Total de clase.
2 L
L
Z / 2 Nh Ph Q h / c h N h Ph Q h c h
n h 1 h 1 (4.167)
2 2
P e1
181
Unidad 4. Muestreo Estratificado.
Pueblo A 35 28 26 41 43 29 32 37 36 25 29 31 39 38 40 45 28 27 35 34
Pueblo B 27 4 49 10 15 41 25 30
Área rural 8 15 21 7 14 30 20 11 12 32 34 24
Estimar el tiempo promedio que se ve la televisión, en horas por semana, en cada uno
de los estratos y en todo el municipio fijando límites para el error de estimación a
través de intervalos de confianza al 95%. Suponer muestreo con reposición.
Solución
Para resolver este ejemplo, comenzamos introduciendo los datos en tres columnas,
una por cada estrato (en este caso serían los pueblos) en una hoja de cálculo de
Excel. A continuación para calcular los datos necesarios en cada estrato, en el menú
Datos elegimos Análisis de datos, seleccionamos Estadística descriptiva y
rellenamos la pantalla de entrada como se indica en la figura 4.3. Al pulsar Aceptar
se obtienen los estadísticos muestrales por estrato de la figura 4.4
Figura 4.3.
182
Unidad 4. Muestreo Estratificado.
Figura 4.4.
2 2 2
S1 35.36 S2 232.41 S3 87.63
1.768 29.051 7.302
n1 20 n2 8 n3 12
- Para hallar la estimación del tiempo promedio que se ve la televisión en horas por
semana en todo el municipio y su error para muestreo con reposición, se tendrán
en cuenta las siguientes expresiones:
2
L L
Sh
Y st Wh y h V( y st ) Wh2
h 1 h 1 nh
2 2 2 2
h Nh nh Wh Wh
yh Sh Wh y h Sh / n h Wh2 Sh / n h
1 155 20 0.5 33.9 35.36 16.95 0.25 1.768 0.442
2 62 8 0.2 25.13 232.41 5.026 0.04 29.051 1.162
3 93 12 0.3 19.0 87.63 5.7 0.09 7.302 0.657
∑ 310 40 1.0 27.676 2.261
183
Unidad 4. Muestreo Estratificado.
Por otro lado, el error de estimación a través de intervalos de confianza al 95% será:
Z 0.025 ( y st ) 1.96 2.261 2.947
Ejemplo 4.5. Una población de tamaño 1000 está dividida en tres estratos para los
que se conocen los siguientes datos: 1 4 , 2 12 , 3 80 , W1 = 0.6, W2 = 0.3 y
W3 = 0.1. Se pide:
a) Determinar el tamaño de muestra que con afijación proporcional da una varianza
del estimador de la media igual a 5, considerando muestreo con reposición.
Realizar las respectivas afijaciones proporcionales.
b) ¿Qué resultados se obtendrían con afijación de mínima varianza? Realizar las
respectivas afijaciones de mínima varianza.
Solución.
h Wh Nh h h2 Wh h Wh h2
1 0.6 600 4 16 2.4 9.6
2 0.3 300 12 144 3.6 43.2
3 0.1 100 80 6400 8.0 640.0
∑ 1.0 1000 14.0 692.8
1 L Wh σ 2h
692.8
e 2 V( y st ) Wh σ 2h n h 1 2 139
n h 1 e 5
n1 n W1 139 0.6 83
n 2 n W2 139 0.3 42
n 3 n W3 139 0.1 14
184
Unidad 4. Muestreo Estratificado.
Wh σ h
nh n L
W σ
h 1
n h
Estratos
I II III
Wh 0.2 0.3 0.5
Ph 0.5 0.6 0.4
Solución.
Tenemos:
2
P(1 P) 1 3
VMAS (P) y VSTMV (P) Wh Ph Q h
n n h 1
L
Teniendo presente que P Wh Ph se tiene el siguiente cuadro de información:
h 1
185
Unidad 4. Muestreo Estratificado.
Estrato Wh Ph 1 Ph Wh Ph Ph (1 Ph ) Wh Ph (1 Ph ) Wh Ph (1 Ph )
I 0.2 0.5 0.5 0.10 0.5 0.1 0.05
II 0.3 0.6 0.4 0.18 0.49 0.147 0.072
III 0.5 0.4 0.6 0.20 0.49 0.245 0.12
0.48 1.48 0.492 0.242
Wh Ph Q h
nh n 3
W
h 1
h Ph Q h
W
h 1
h Ph Q h 0.2 0.5 0.5 0.3 0.6 0.4 0.5 0.4 0.6 0.1 0.147 0.245 0.492
P(1 P) 3
PQ 1 3
VMAS (P) y VSTP (P) Wh2 h h Wh Ph (1 Ph )
n h 1 nh n h 1
P (1 P) 1 3
VMAS (P) VSTMV (P) Wh Ph (1 Ph )
n n h 1
186
Unidad 4. Muestreo Estratificado.
3
n Wh Ph (1 Ph )
1000 0.242
n h 1
970
P (1 P) 0.48(1 0.48)
n h n Wh
0.245
n1 970 0.2 194 n 2 970 0.3 291 n 3 970 483
0.492
4.6. Postestratificación.
Ejemplos típicos son las características personales como edad, el sexo, la estatura, el
nivel de educación, etc.
Los tamaños de los estratos N h se pueden obtener de manera bastante exacta a partir
de las estadísticas oficiales, pero las unidades se pueden clasificar en estratos
solamente después de conocer los datos de la muestra. Por lo tanto, puede suponerse
que los Wh y los N h son conocidos.
Este método se utiliza cuando se desconocen a priori las unidades que pertenecen a
cada estrato. Obtenida la muestra, las unidades se asignan al estrato correspondiente.
L
Y ´ Wh y h
h 1
L
Y post W´h y h (4.168)
h 1
187
Unidad 4. Muestreo Estratificado.
L L L
E( Y post ) Y W´h Y h Wh Y h (W´h .Wh )Y h
h 1 h 1 h 1
2
2
S2 L
L
ECM(Y post ) W´h h (1 f h ) (W´h .Wh )Y h
h 1 nh h 1
L
El estimador del total es: Y post N´h y h (4.169)
h 1
Nn L ´ 2 Nn L 2
V( Y post ) N hS' h N n 2
N 2 n h 1 h 1
S' h (1 f ´h )
Nn L ´ 2 Nn L 2
V(Y post ) N h S' h N n 2
N 2 n h 1 h 1
S' h (1 f ´h )
N n L ´ 2 N(N n) L 2
V( Y post ) N 2 V( Y post ) N hS' h n 2
n h 1 h 1
S' h (1 f ´h )
N n L ´ 2 N(N n) L 2
V(Y post ) N 2 V( Y post ) N h S' h n 2
n h 1 h 1
S' h (1 f ´h )
Nh
Para las proporciones y totales de clase cambiamos S' 2h por Ph (1 Ph ) y S' 2h
Nh 1
n h
por P´h (1 P´h ) .
n h 1
Realizar una estimación del ingreso neto del farmacéutico y de su error relativo de
muestreo.
Solución.
2
Y post N´h y h 750 303.728 346 176.788 288964.648 euros
h 1
N n 2 ´ 2 N(N n) 2 2
V(Y post ) N h S' h n 2
n h 1 h 1
S' h (1 f ´h )
1096 24
(750 1711.03875 346 787.38643)
24
1096(1096 24) 10 14
1711.03875 (1 ) 787.38643 (1
24 2
750 346)
V(Y post ) 74473303.48
CV(Y post )
0.02986 0.03 (3%)
Y post 288964.648