Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Capítulo V
MUESTRAS COMPLEJAS
Introducción
Hasta el momento se han desarrollado los diseños muestrales simples, es decir
solo se aplica el MAS, el MAE (con MAS dentro de cada estrato) o el de
conglomerados (utilizando MAS o sistemático para la selección de las UPMs o
USMs).
La mayoría de estudios de gran magnitud, comprenden el uso de varios
diseños muestrales a la vez o a combinación de estos. Así mismo, para estimar
la variable de interés se puede hacer uso de variables auxiliares, lo que implica
el uso de estimadores como de regresión, razón o diferencia. Este tipo de
situaciones, se refiere al análisis de Muestras o Encuestas Complejas.
En este capítulo se analizará los aspectos teóricos de datos provenientes de
muestras complejas.
1. Definición
Se acostumbra llamar muestra o encuesta compleja cuando se tiene la
combinación de estratos, estimadores de razón, regresión o diferencia y varias
etapas de muestreo. Con tener dos de estas características se le llama
encuesta compleja.
Una encuesta compleja resulta cuando ya no es posible utilizar el muestreo
aleatorio simple debido al alto costo de obtención del marco muestral, así como
el tiempo que cuesta obtenerlos. En estos casos es necesario realizar otros
diseños como conglomerados multietápico, probabilidades desiguales y otras
formas de estratificación.
El muestreo simple exige tener un listado muy detallado de las unidades de
análisis. Por lo general este marco rara vez se dispone, y su acceso no es
inmediato, además que sería muy costoso obtenerlo. Para reducir el costo se
definen muestras complejas aumentando el número de etapas en el diseño, lo
que conlleva a la disminución de la precisión pero una ganancia en el acceso
y demora en la recogida de los datos.
nh 2
1 f h i 1 yi rh xi L
1 f h S 2
^ L
V y st Wh2 Wh2
nh 1
rs rsh
h 1 nh h 1 nh
^
IC y st rs Z 1 2 V y st rs
b) Estimador Combinado
y st
Se considera inicialmente la razón de los estimadores estratificados rc y se
x st
forma el estimador de la media
y st r c rc x
nh 2
1 f h i 1 yi rc xi L
1 f h S 2
^ L
V y st Wh2 Wh2
nh 1
rc rch
h 1 nh h 1 nh
^
IC y st rc Z 1 2 V y st rc
L
y st ls Wh y lh
h 1
Donde:
y l h y h b1h xh x h
La varianza de este estimador es:
1 f h 1 f h
s2yh b12h sxh2 2b1h sxyh Wh2 s
^ L L
V y st ls Wh2 2
yh b12h sxh
2
h 1 nh h 1 nh
^
IC y st ls Z 1 2 V y st ls
b) Estimador Combinado
El estimador combinado para la media es:
y st l c y st b1 x x st
L L L
Con y st Wh y h , x st Wh x h y x Wh xh
h 1 h 1 h 1
1 f h 1 f h
W s
^ L L
2b1sxyh Wh2
2 2
V y st lc h
2
s 2yh b1 sxh
2 2
yh b1 sxh
2
h 1 nh h 1 nh
Donde:
L
b h 1h
Wh2 1 f h 2 sxyh
b1 h 1
L
h sxh b1h 2
nh sxh
h
h 1
^
IC y st lc Z 1 2 V y st lc
Ejemplo
En la sierra central de Lima existen 3 comunidades campesinas dedicadas a la
agricultura y ganadería. Un investigador desea realizar un muestreo en esa
zona con la finalidad de estimar el área de terreno cultivado; para lo cual
coordina con el encargado de estadística en el Ministerio de Agricultura, quien
le brinda una muestra de familias que viven en las 3 comunidades campesinas.
Nh Wh nh xh fh
rh yrh S rh2
Comunidad
A 80 0,33 12 2.4 0.15 1.45/2.358=0.61 1,48 0.056
B 60 0,25 9 2.2 0.15 1.989/2.178=0.91 2,01 0.052
C 100 0,42 15 2.0 0.15 1.847/2.027=0.91 1,82 0.094
Total 240 1.00 36
L
y st rs Wh y rh 0.33 1.48 0.25 2.01 0.42 1.82 1.75
h 1
1 f h S 2 1 0.15 1 0.15
W
^ L
V y st rs h
2
rsh 0.332 0.056 ... 0.422 0.094 0.0017
h 1 nh 12 9
IC y st rs Z1 2 V y st rs IC 1.75 1.96 0.0017 1.67;1.83
Solución:
Nh Wh nh xh fh
b1h yh
2
s yh 2
sxh
Comunidad xh
A 80 0,33 12 2.4 0.15 0.913 1.45 2.36 0.306 0.337
B 60 0,25 9 2.2 0.15 0.767 1.98 2.18 0.626 1.009
C 100 0,42 15 2.0 0.15 0.647 1.85 2.03 0.413 0.911
Total 240 1.00 36
y l h y h b1h xh x h
L
y st ls Wh y lh 0.33 1.49 0.25 1.99 0.42 1.83 1.76
h 1
1 f h 1 0.15 1 0.15
s 0.332
^ L
V y st ls Wh2 2
yh b12h sxh
2
0.025 ... 0.422 0.032 0.0007
h 1 nh 12 9
IC y st ls Z1 2 V y st rs IC 1.76 1.96 0.0007 1.71;1.81
Wh nh fh 2
sxh h b1h
Comunidad
A 0,33 12 0.15 0.337 0.003 0.913
B 0,25 9 0.15 1.009 0.006 0.767
C 0,42 15 0.15 0.911 0.009 0.647
Total 1.00 36 0.018
Wh2 1 f h 2
h sxh
nh
L
b h 1h
0.003 0.913 0.006 0.767 0.009 0.647
b1 h 1
L
0.727
0.018
h
h 1
1 f h 1 0.15 1 0.15
s
^ L
Wh2 0.025 ... 0.422 0.032 0.0008
2
V y st lc
2
yh b1 sxh
2
0.332
h 1 nh 12 9
IC y st lc Z1 2 V y st rs IC 1.75 1.96 0.0008 1.69;1.81
Número de Unidades
Estrato Conglomerados
1 2 3 … M
1 y11 y12 y13 … y1M
2 y21 y22 y23 … y2M
1
N1 yN11 yN1 2 yN1 3 … yN M
1
Para la media
El estimador de la media poblacional del total por conglomerado es:
1 L L
yt N h y th Wh y th
N h 1 h 1
nh
yi
i 1
y th h 1,..., L
nh
L
N h y th
h 1
yc L
Nh M h
h 1
Esta expresión tiene la forma de un estimador de razón combinada. La
varianza de y c puede estimarse por:
L
1 Nh Nh nh
V yc Sch2
M2 h 1 nh
2
S : Es la varianza de los términos yih
ch y c M ih h 1,..., L
M: Es el tamaño de la población y puede ser estimado por:
L
M Nh M h
h 1
Cantidad Cantidad
Total de Cantidad de Total de Cantidad de
de de
Bloque ingresos arrendatarios Bloque ingresos arrendatarios
Residentes Residentes
(yi) (ai) (yi) (ai)
(Mi) (Mi)
1 8 96000 4 14 10 49000 5
2 12 121000 7 15 9 53000 4
3 4 42000 1 16 3 50000 1
4 5 65000 3 17 6 32000 4
5 6 52000 3 18 5 22000 2
6 6 40000 4 19 5 45000 3
7 7 75000 4 20 4 37000 1
8 5 65000 2 21 6 51000 3
9 8 45000 3 22 8 30000 3
10 3 50000 2 23 7 39000 4
11 2 85000 1 24 3 47000 0
12 6 43000 3 25 8 41000 3
13 5 54000 2 Total 151 1329000 72
Cantidad de
Cantidad de Total de ingresos
Bloque arrendatarios
Residentes (Mi) (yi)
(ai)
1 2 18000 1
2 5 52000 2
3 7 68000 3
4 4 36000 1
5 3 45000 2
6 8 96000 3
7 6 64000 2
8 10 115000 5
9 3 41000 1
10 1 12000 0
Total 49 547000 20
L
M Nh M h 415 6.04 168 4.9 3329.8
h 1
L
1 Nh Nh nh 1 415 415 25 2 168 168 10 2
V yc Sch2 25998 8657 412563
M2 h 1 nh 3329.82
25 25
IC 9385 1.96 412563.8 8126.07;10643.93
Estime un intervalo del 95% de confianza para los residentes que arriendan
vivienda