Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Curso 2022/23
1/97
Introducción
2/97
Introducción
3/97
Introducción
4/97
Criterio para formar conglomerados
5/97
Ventajas del muestreo por conglomerados
6/97
Inconvenientes del muestreo por conglomerados
7/97
Inconvenientes del muestreo por conglomerados
8/97
Diferencias entre estratos y conglomerados
9/97
Diferencias entre estratos y conglomerados
10/97
Diferencias entre estratos y conglomerados
11/97
Diseño muestral en una etapa y parámetros asociados
M
▶ Se tienen N =
P
Ni unidades elementales de la población, donde el
i=1
N
número medio de unidades por conglomerado es N = .
M
12/97
Diseño muestral en una etapa y parámetros asociados
13/97
Diseño muestral en una etapa y parámetros asociados
X m
X
ns = Ni = Ni
i∈sc i=1
14/97
Probabilidades de inclusión de los elementos poblacionales
πklc = P(Ck , Cl ∈ sc )
15/97
Probabilidades de inclusión de las unidades elementales
▶ Se define
∆cij = πijc − πic πjc
16/97
Definición de parámetros
▶ Dada la población U y la caracterı́stica Y tal que Yij es la
observación de la unidad j del conglomerado i, se pueden definir los
siguientes parámetros:
– Total de la población
M
X
Y = Yi
i=1
17/97
Definición de parámetros
Y
Yc =
M
– Cuasivarianza poblacional
M Ni
1 XX
SY2 = (Yij − Y )2
N − 1 i=1 j=1
18/97
Descomposición de la varianza
▶ Ası́,
X Ni
M X Ni
M X
X Ni
M X
X
(Yij − Y )2 = (Yij − Y i )2 + (Y i − Y )2
i=1 j=1 i=1 j=1 i=1 j=1
(N − 1) = (N − M) + (M − 1)
19/97
Descomposición de la varianza
▶ Ası́
M
X M
X
(N − 1)SY2 = (Ni − 1)Si2 + Ni (Y i − Y )2
i=1 i=1
▶ donde
iN
1 X
Si2 = (Yij − Y i )2
Ni − 1 j=1
▶ Se resume en que
20/97
Descomposición de la varianza
▶ Se define el coeficiente de homogeneidad δ de los conglomerados:
(N − 1) SCD
δ =1−
(N − M) SCT
M −1
− ≤δ≤1
N −M
M−1
▶ El valor δ = − N−M se obtiene cuando la heterogeneidad dentro
de los conglomerados es máxima.
21/97
Estimadores de los parámetros poblacionales
M X
M M M
X Yi Yj XX Yi Yj
V (Y
b) = ∆cij = (πijc − πic πjc ) c c
i=1 j=1
πic πjc i=1 j=1
π i πj
22/97
Estimadores de los parámetros poblacionales
M M
!2
b) = −1 Yi Yj
XX
V (Y (π c − πic πjc ) − c
2 i=1 j=1 ij πic πj
!2
X X (πijc − πic πjc )
V b) = −1
b (Y Yi Yj
− c
2 i∈s j∈s πijc πic πj
c c
23/97
Estimadores de los parámetros poblacionales
24/97
Estimadores de los parámetros poblacionales
Ni Y i
= cte
πic
Si Y i ≈ cte ⇒
Ni
= cte
πic
25/97
Estimadores de los parámetros poblacionales
▶ Es decir,
!2 !2 !2
Yi Yj Ni Y i Nj Y j Ni Nj
− c = − ∝ − c
πic πj πic πjc πic πj
26/97
Estimadores de los parámetros poblacionales
27/97
Estimadores de los parámetros poblacionales
Resumen
28/97
Muestreo aleatorio simple de conglomerados en una etapa
M
▶ Se desea estimar el total poblacional Y =
P
Yi , distinguiendo entre
i=1
el estimador directo y el estimador indirecto.
29/97
Estimador directo
▶ Utilizando las propiedades del estimador de Horvitz-Thompson para
conglomerados se tiene que un estimador del total poblacional es
b =M
X
Y Yi = M Y
b
c
m i∈s
c
▶ La varianza de Y
b viene dada por
m
(1 − M ) 2
V (Y
b) = M2 Sy
m
M
(M − m) M X
(Yi − Y c )2
m M − 1 i=1
30/97
Estimador directo
m
b ) = M 2 (1 − M ) S
b 2 = (M − m) M
X b )2
V
b (Y
y (Yi − Y c
m m m − 1 i∈s
c
N
donde N = M es el número medio de elementos por conglomerado.
31/97
Estimador directo
32/97
Estimador indirecto (de razón)
M
X
▶ Conociendo N = Ni se puede usar un estimador de razón
i=1
donde Ni es el número de unidades elementales del conglomerado
i-ésimo que se toma como variable auxiliar de Y .
M
P
Yi
Y MY c
R= = i=1
M
= =Y
N P N
Ni
i=1
33/97
Estimador indirecto (de razón)
▶ En consecuencia,
P
Yi
YR = N Pi∈sc
b = NR
b
N
i∈sc i
34/97
Estimador indirecto (de razón)
m
(1 − M) 1 X
M2 Ni2 (Y i − Y R )2
b
m m−1 i∈sc
Y
bR
▶ De manera inmediata se obtiene V
b
b (Y b
R ) dado que Y R = .
N
35/97
Estimador indirecto (de razón)
m
(1 − M )M 2 X 2
N (Y i − Y R )2
b b
V
b (Y R) =
m(m − 1)N 2 i∈s i
c
36/97
Ejemplo (Elementary Survey Sampling (7ed) - Scheaffer et al.)
37/97
Conglomerado Ni Yi Conglomerado Ni Yi
1 8 96000 14 10 49000
2 12 121000 15 9 53000
3 4 42000 16 3 50000
4 5 65000 17 6 32000
5 6 52000 18 5 22000
6 6 40000 19 5 45000
7 7 75000 20 4 37000
8 5 65000 21 6 51000
9 8 45000 22 8 30000
10 3 50000 23 7 39000
11 2 85000 24 3 47000
12 6 43000 25 8 41000
P P
13 5 54000 i
Ni = 151 i
Yi = 1329000
38/97
Ejemplo (Elementary Survey Sampling (7ed) - Scheaffer et al.)
▶ El estimador de la media es
P
Yi 1329000
Y R = i∈sc
b
P = = 8801
N
i∈sc i 151
▶ En cuanto a la varianza
m 2
(1 − M )M 2 X 2
N Yi −Y
b b
b (Y
V R) = =
m(m − 1)N 2 i∈s i
c
m 2
(1 − M
) X
−
b
2 Y i N i Y
m(m − 1)N i∈sc
39/97
Ejemplo (Elementary Survey Sampling (7ed) - Scheaffer et al.)
41/97
Eficiencia de los conglomerados usando m.a.s.
Vmcm (Y
b) N −M
=1+ δ
Vmas (Y )
b M −1
42/97
Muestreo con probabilidades proporcionales al tamaño
e) Se tenga
∆kl = πkl − πk πl < 0.
para que la varianza de Yates-Grundig sea positiva.
43/97
Muestreo con probabilidades proporcionales al tamaño (pps)
44/97
Muestreo con probabilidades proporcionales al tamaño (pps)
donde Y
b es la media del i-ésimo conglomerado.
i
▶ La varianza es
m 2
1 Xb
b Y
V b
pps = Yi −Y
b
pps
m(m − 1) i=1
45/97
Muestreo con probabilidades proporcionales al tamaño (pps)
▶ Y su varianza es
m
M2 Xb 2
V
b Y bpps = Yi −Y
b
pps
m(m − 1) i=1
46/97
Muestreo de conglomerados combinado con estratificación
47/97
Muestreo de conglomerados combinado con estratificación
48/97
Muestreo de conglomerados combinado con estratificación
Se toman los datos del ejemplo anterior que constituyen la muestra del
estrato 1, donde M1 = 415 y m1 = 25.
Conglomerado Ni Yi Conglomerado Ni Yi
1 8 96000 14 10 49000
2 12 121000 15 9 53000
3 4 42000 16 3 50000
4 5 65000 17 6 32000
5 6 52000 18 5 22000
6 6 40000 19 5 45000
7 7 75000 20 4 37000
8 5 65000 21 6 51000
9 8 45000 22 8 30000
10 3 50000 23 7 39000
11 2 85000 24 3 47000
12 6 43000 25 P 8 P 41000
13 5 54000 Ni = 151 Yi = 1329000
i i
49/97
Muestreo de conglomerados combinado con estratificación
Se coge también una ciudad cercana más pequeña que se considera como
el estrato 2. En el estrato 2 se toman m2 = 10 conglomerados que se
muestrean de M2 = 168.
Cluster Ni Yi
1 2 18000
2 5 52000
3 7 68000
4 4 36000
5 3 45000
6 8 96000
7 6 64000
8 10 115000
9 3 41000
10 1 12000
50/97
Muestreo de conglomerados combinado con estratificación
▶ Hay que estimar el ingreso per cápita promedio en las dos ciudades
combinadas y el error de estimación, dados los datos adicionales de
la tabla anterior.
51/97
Muestreo de conglomerados combinado con estratificación
1 b
M1 Y1 + M2 Y
b2
M
1 b
M1 N 1 + M2 N
b
2
M
b M1 Y
b1 + M2 Y
b2
Y =
M1 N
b +M N
1
b
2 2
52/97
Muestreo de conglomerados combinado con estratificación
53/97
Muestreo de conglomerados combinado con estratificación
b 2 es la varianza de los términos
▶ La primera varianza S Yi − Ni Y
b
C1
del estrato 1.
▶ De este modo,
54/97
Muestreo de conglomerados combinado con estratificación
▶ Para el estrato 1
b 2 = 259982
SC1
▶ y para el estrato 2
b 2 = 86572
SC2
M1 N
b +M N
1 2 2 = 3328,8
b
55/97
Muestreo de conglomerados combinado con estratificación
▶ entonces
b
V
b (Y ) = 412563,8
56/97
Ejemplo en R
cluster.mu = function (M , m.vec , y , total =T , N = NA ) {
# M = n ú mero de conglomerados en la poblaci ó n
# N = n ú mero de elementos en la poblaci ó n
# m.vec = vector de los tama ñ os de los conglomerados en la muestra
# y = Un vector de totales por conglomerado , o una lista de las
# observaciones por conglomerado ( esto se fija por ’ total ’)
m = length ( m.vec )
B = 2 * sqrt ( var.mu.hat )
cbind ( mu.hat , s2.c , var.mu.hat , B )
}
57/97
Ejemplo en R
Se toma un ejemplo:
# Ejemplo
m = c (55 ,60 ,63 ,58 ,71 ,78 ,69 ,58 ,52 ,71 ,73 ,64 ,69 ,58 ,63 ,75 ,78 ,51 ,67 ,70)
y = c (2210 ,2390 ,2430 ,2380 ,2760 ,3110 ,2780 , 2370 ,1990 ,2810 ,2930 ,
2470 ,2830 ,2370 ,2390 ,2870 ,3210 ,2430 ,2730 ,2880)
58/97
Ejemplo con la librerı́a survey
59/97
Muestreo por conglomerados bietápico
60/97
Muestreo por conglomerados bietápico
61/97
Muestreo por conglomerados bietápico
62/97
Muestreo por conglomerados bietápico
63/97
Muestreo por conglomerados bietápico
64/97
Muestreo por conglomerados bietápico
65/97
Muestreo por conglomerados bietápico
66/97
Muestreo por conglomerados bietápico
67/97
Muestreo por conglomerados bietápico
68/97
Muestreo por conglomerados bietápico
69/97
Muestreo por conglomerados bietápico: Resumen
70/97
Muestreo por conglomerados bietápico
71/97
Fórmulas en muestreo de conglomerados bietápico
72/97
Fórmulas en muestreo de conglomerados bietápico
M
▶ N=
P
Ni ≡ el número de elementos de la población.
i=1
N
▶ N= ≡ el tamaño medio del conglomerado de la población.
M
ni
b = 1 P
▶ Y Yij ≡ la media muestral del i-ésimo conglomerado.
i
ni j=1
73/97
Fórmulas en muestreo de conglomerados bietápico
m
P
Ni Y
b
i
b M i=1
Y =
N m
▶ La varianza estimada de Y es
b
m b2
b M −m 1 b2 1 X
2 Ni − ni S i
V
b (Y )= S
2 b + 2 N i
M mN mMN i=1 N i ni
74/97
Fórmulas en muestreo de conglomerados bietápico
▶ donde
m
2
P
Ni Y i − N · Y
b b
b2 i=1
Sb =
m−1
ni
P 2
Yij − Y
b
i
j=1
b2
S = , i = 1, 2, . . . , m
i
ni − 1
75/97
Fórmulas en muestreo de conglomerados bietápico
2 m b2
b) = 1 − m M Sb2 + M ni S
X
2 i
V
b (Y N 1 −
M m b m i=1 i Ni ni
m
P
Ni
i=1
N
b =M
m
76/97
Fórmulas en muestreo de conglomerados bietápico
m
P
Ni Y
b
i
b i=1
YR = m
P
Ni
i=1
77/97
Ejemplo (Elementary Survey Sampling (7ed) - Scheaffer et al.)
▶ Debido a que las plantas están muy dispersas, decide utilizar el muestreo
por conglomerados, especificando cada planta como un conglomerado de
máquinas. Cada planta contiene muchas máquinas y comprobar el registro
de reparación de cada máquina llevarı́a mucho tiempo.
78/97
Ejemplo (Elementary Survey Sampling (7ed) - Scheaffer et al.)
79/97
Ejemplo (Elementary Survey Sampling (7ed) - Scheaffer et al.)
m
P
Ni Y
b
i m
b M i=1 1 1 X b 1
Y = = Ni Y i = 240,02 = 4,80
N m N m i=1
50
m b2
m 1 b2 1 X
2 Ni − ni S i
V (Y ) = 1 −
b
b S + N
M mN 2 b mMN 2 i=1 i Ni ni
80/97
Ejemplo (Elementary Survey Sampling (7ed) - Scheaffer et al.)
▶ donde
m
2
P b −N ·Y
b
Ni Y i
b2 = i=1
Sb = 27,722
m−1
m b2
X Ni − ni Si
Ni2 = 21,985
i=1
Ni ni
▶ Con lo que
10 1 1
)= 1− 27,722 +
b
V
b (Y
2
21,985 = 0,0371
90 10 · 50 10 · 90 · 502
▶ De este modo, un intervalo de confianza al 95 % es:
r
p
Y ∓ 1,96 V ) = 4,80 ∓ 1,96 0,0371 = 4,80 ∓ 0,39
b b
b (Y
81/97
Ejemplo (Elementary Survey Sampling (7ed) - Scheaffer et al.)
= 90 · 240,02 = 21602
b
Y
b = NY
V b ) = N 2V
b (Y b
b (Y ) = 45002 · 0,0371 = 7,513 × 105
q p
b ∓ 1,96 ·
Y V b ) = 21602 ∓ 1,96 ·
b (Y 7,513 × 105 = [19903; 23301]
82/97
Ejemplo (Elementary Survey Sampling (7ed) - Scheaffer et al.)
m m
1
P P
Ni Y
b
i m Ni Y
b
i
b i=1 i=1 240,02
YR = m = m = = 4,60
P 1
P 52,2
Ni m Ni
i=1 i=1
83/97
Ejemplo (Elementary Survey Sampling (7ed) - Scheaffer et al.)
m
2
Ni2 Y
P b −Y
b
i R
b2 = i=1
SR = 35,12
m−1
84/97
Ejemplo (Elementary Survey Sampling (7ed) - Scheaffer et al.)
▶ Y ası́
10 1 1
1− 35,12 +
b
b (Y
V ) = 2
21,985 =
90 10 · 52,2 10 · 90 · 52,22
0,0492
85/97
Ejemplo
Ni 3 2 4 3 6 3 5 4 6 3
ni 2 2 2 2 2 2 2 2 3 2
yi 23, 27 18, 3 37, 12 22, 21 18, 62 21, 25 3, 12 7, 36 2, 12, 51 18, 17
86/97
Ejemplo con R
d o s . e t a p a s . c o n g l o m e r a d o = function (M , m , y , N = NA , Ni , ni ) {
87/97
Ejemplo con R
88/97
Ejemplo con R
# EJEMPLO
M = 112
m = 10
N = 306
Ni = c (3 ,2 ,4 ,3 ,6 ,3 ,5 ,4 ,6 ,3)
ni = c (2 ,2 ,2 ,2 ,2 ,2 ,2 ,2 ,3 ,2)
d o s . e t a p a s . c o n g l o m e r a d o (M , m , y , N , Ni , ni )
mu.hat = 31 .97124
var.mu = 48 .82493
B = 13 .97497
yi.bar = 25 10 .5 24 .5 21 .5 40 23 7 .5 21 .5 21 .66667 17 .5
s2i = 8 112 .5 312 .5 0 .5 968 8 40 .5 420 .5 670 .3333 0 .5
s2.b = 3816 .614
89/97
EPA
▶ El criterio que se sigue para definir los estratos es, o bien la situación
geográfica, o bien el tamaño de los conglomerados, o bien una
variable auxiliar X relacionada con Y .
90/97
EPA
91/97
EPA
▶ Esto es difı́cil de conseguir, ya que por una parte esta relación viene
afectada por el paso del tiempo, y por otra hay errores tales como
omisiones, duplicidades, etc.
92/97
EPA
93/97
EPA
▶ Como las secciones censales varı́an con el tiempo, con cada Censo o
Padrón al inicio de cada año se realiza una actualización de las
mismas y si es necesario se dividen o se fusionan las secciones
censales.
94/97
EPA
95/97
EPA
96/97
EPA
97/97