Está en la página 1de 5

Muestreo por Conglomerados.

1.-Introduccin:
Paraaplicar estediseo, seprecisaquelapoblacin estdivididaen subpoblaciones,
conglomerados, que no se solapen. Se selecciona una muestra probabilstica de
conglomerados y se mide la variable de inters en todos los individuos de los
conglomeradoselejidos.
Cuestiones tcnicas que plantea este muestreo:
i) Construccin de Conglomerados: Los conglomerados deben estar constituidos por
unidades lo ms heterogneas posibles; Sin embargo, los conglomerados deben ser
homogeneosentreellos.
ii) Unavez seleccionadounconglomeradosemidelarespuestadetodoslosindividuos
queloconstituyen.
iii) Si los conglomerados setomanconm.a.s., alahoraderealizar las estimaciones lo
nico que hay que tener en consideracin es identificar el conglomerado como
individuo.
Ejemplo:
Poblacin: Todoslospacientesingresadosenunhospital pblicodeCastillay Lenel
23deOctubrede2002.
Parmetro: Costomediodel pacienteenestaComunidadAutnoma:
Conglomerado: Hospitales; Discusin, en una situacin real, podramos tomar todos
loshospitalesdelaComunidad?
Individuo: Pacienteingresadoenesafecha;
Variabledeinteres: Costediariodeatencindel paciente.
Notacin:
N
I
: Nmero de conglomerados en que est dividida la poblacin y n
I
: Nmero de
conglomeradostomadoenlamuestra.

k
: Respuestatotal alavariabledeinters detodos los individuos queconformanel
k_simoconglomerado.
2.- Muestreo Aleatorio Simple de n
I
conglomerados
2.1.- Caso N
i
N
j
M
N
N
I
:
Nota: Enesteapartado seresuelvensimultnemanetedos situaciones, laprimeraenlaque
exactamentetodos los conglomerados tienenel mismo nmero deindividuos y lasegunda
en la que aun no coincidiendo, el nmero de individuos entre conglomerados es
aproximadamenteel mismo.
Si el nmero de individuos N
i
no es exactamente el mismo entre conglomerados pero s
muyprximo, setomaM
k1
N
I

N
k
N
I

c

N
I
n
I
ks
I

k
,
Var
c

N
I
2
1f
I

n
I

U
I
2
,
U
I
2

kU
I

U
I
2
N
I
1
; f
I

n
I
N
I
Var
c

N
I
2
1f
I

n
I
S
s
I
2
;
U
I
2
S
s
I
2

ks
I


k
s
I
2
n
I
1
Coeficiente de correlacin intraconglomerados:
Seay
ij
,y
iz
unodelosposiblesparesdeobservacionesdelavariabledeintersdel i-simo
conglomerado
EncadaconglomeradodeM elementossepuedentomar
M
2
paresdevalores
ParalosN
I
conglomeradossetienenN
I
M
2
paresposibles
El coeficiente de correlacin intraconglomerados se define como el coeficiente de
correlacinlineal entretodoslosparesespecificadosanteriormente, detal formaquedicho
coeficienteseruna"medidadehomogeneidad" dentrodelosconglomerados

Covy
ij
,y
iz

y
ij
y
iz


Covy
ij
,y
iz

2

1
N
I
M
2
i1
N
I

jz
M

y
ij
yy
iz
y

2
A partir de diversos clculos, se puede expresar la varianza del estimador de la media
poblacional enfuncindel coeficientedecorrrelacinintraconglomerados:
Var

1 f

2
n
I
M
1 M 1;
2

i1
N
I

j
M

y
ij
y
2
N1
Por tanto:
Var
cong

Var
mas

1 M 1 :
Si 0conglomeradospeor quem.a.s
Si 0conglomeradosigual quem.a.s
Si 0conglomeradosmejor quem.a.s
Estimacin del coeficiente de correlacin intraconglomerados:


S
b
2
S
2
M1S
2
; S
b
2

1
n
I
1
i1
n
I

j1
M
y
i
y
2
yS
2

1
n
I
M1
i1
n
I

j1
M
y
ij
y
2
Estimacin de la varianza del estimador:
Var

1 f
S
2
n
I
M
1 M 1

Obtencin del nmero de conglomerados n


I
fijados B y k:
n
I

n
0
n
0
N
I
1

: n
0

k
2

U
I
2
B
2
: n
0

N
I
2
k
2

U
I
2
B
2
Una forma de actuar es tomar una muestra previa de n
I

conglomerados con el mismo


diseoyestimar

U
I
2

kU
I

U
I
2
N
I
1
;
U
I
2
S
s
I
2

ks
I


k
s
I
2
n
I

1
2.2 Caso N
i
N
j
:

c

n
I
i1

i
n
I
i1

N
i
;
Var

c

1f
I

M
2
n
I
ks
I

c
N
k

2
n
I
1
;f
I

n
I
N
I
i) Si N conocido:

c
N

c
; Var
c
N
2
Var

ii) Si N desconocido:

c

N
I
n
I
ks
I

k
; Var
c

N
I
2
1f
I

n
I
k1
n
I

k1
n
I

k
n
I
2
n
I
1
P
c

n
I
i1

A
i
n
I
i1

N
i
; / A
i
: Nmero de individuos en el conglomerado i-simo con la
caractersticadeinters. VarP
c

1f
I

M
2
n
I
k1
n
I

A
k
PcN
k
2
n
I
1
Obtencin del nmero de conglomerados n
I
fijado B y k
i) Parmetrodeinters :
Var

c

1f
I

M
2
n
I
ks
I

c
N
i

2
n
I
1

B
k
2
/
ks
I

c
N
i

2
n
I
1
estimadoconlamuestraprevia
Habraquedespejar n
I
delafrmula
ii) Parmetrodeinters conN conocido:
Var
c
N
2
1f
I

M
2
n
I
ks
I

c
N
i

2
n
I
1

B
k
2
/
ks
I

c
N
i

2
n
I
1
estimadoconmuestraprevia
Habraquedespejar n
I
delafrmula
iii) Parmetrodeinters conN desconocido:
Var
c

N
I
2
1f
I

n
I
k1
n
I

k1
n
I

k
n
I
2
n
I
1

B
k
2
/
k1
n
I

k1
n
I

k
n
I
2
n
I
1
estimadoconlamuestraprevia
Habraquedespejar n
I
delafrmula
iv) ParmetrodeintersP:
P
c

n
I
i1

A
i
n
I
i1

N
i
; VarP
c

1f
I

M
2
n
I
k1
n
I

A
k
PcN
i
2
n
I
1

B
k
2
/
k1
n
I

A
k
PcN
i
2
n
I
1
estimadoconlamuestraprevia
Habraquedespejar n
I
delafrmula
3.- Ejemplo:
Unfabricantedesierras decintaquiereestimar el costo medio mensual dereparacin
paralas sierras quehavendidoaciertas industrias. El fabricantenopuedeobtener el costo
dereparacinparacadasierra, peropuedeobtener lacantidadtotal gastadaenreparaciny
el nmero de sierras que tiene cada industria. Por tanto decide usar muestreo por
conglomerados, tomando cada industria como un conglomerado. El fabricante selecciona
una muestra aleatoria simple de n
I
20 de N
I
96 industrias a las que da servicio. Los
datos muestrales sobre costo total de reparaciones de todas las sierras por industria, en
dlares, yel nmerodesierraspor industriasepresentanenlatablasiguiente:
Industria: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
NSierras: 3 7 11 9 2 12 14 3 5 9 8 6 3 2 1 4 12 6 5
CosteTotal: 50 110 230 140 60 280 240 45 60 230 140 130 70 50 10 60 280 150 1
a) Estimar el costo promedio de reparacin por sierra para el mes pasado, y calcular un
intervalodeconfianzadel 95%.
b) Estimar lacantidadtotal gastadapor las96industriasenlareparacindesierras.
c) Despus deverificar sus registros deventas, el fabricantesepercatadequehavendido
un total de 710 sierras a esas industrias. Usando esta informacin adicional, estimar la
cantidadtotal gastadaenreparacindesierraspor estasindustriasycalcular unintervalode
confianzadel 95%.
d) El fabricantequiereahoraestimar el costodereparacinpromediopor sierraparael mes
siguiente. Cuntos conglomerados debeseleccionaraenlamuestrasi quierequeel lmite
parael error deestimacinseamenor que10$(conunaconfianzadel 95%)?.
Solucin: (datossierras.mat)
Apartadoa):
muc 19.7308
icmuc 17.9863, 21.4753
Apartadob):
tc 12312
ictc 1.0e004*[ 0.9200, 1.5424]
Apartadoc):
tc2 1.4009e004
ictc2 1.0e004*[ 1.2770, 1.5247]
Apartadod):
nIest 24.2707

También podría gustarte