Está en la página 1de 29

Captulo4

MUESTREOESTRATIFICADO
1
Captulo4.Diseosestratificados
1. Principios y objetivos: Notacin
2. Diseo muestral.
3. Probabilidad de inclusin y estimacin
4. Reparto (afijacin) proporcional
5. Reparto ptimo o de Neyman
6. Resultados globales/locales
7 Tamao de muestra 7. Tamao de muestra
8. Algunas notas
2
Diseo estratificado
1 Principios y objetivos; notacin 1. Principios y objetivos; notacin
2
1
1 S V
n
Y
|
|

|
=
|
|

|

1 S V
n N
Y
|
.

\
=
|
.

\
3
Diseo estratificado
Estructura de la varianza y descomposicin de la varianza
Si somos capaces de:
repartir las unidades de la poblacin en grupos segn una variable
auxiliar X cualitativa tal que la varianza al interior de los estratos sea
l i l b l ms pequea que la varianza global
definir un estimador que slo dependa de la varianza al interior de
los estratos los estratos
entonces, se obtiene generalmente un estimador mas preciso que el
estimador ASSR estimador ASSR
4
Diseo estratificado
( ) ( ) ( ) Y Y Y Y Y Y
h h h , h ,
+ =
o o
Severificaque
( ) ( ) ( )
2 2 2

+

=


e e e h U
h
h U
h h ,
h U
h ,
h h h
Y Y Y Y Y Y
o o
o
o
o
( ) ( ) ( )
2 2 2

+

=


e e h
h h
h U
h h ,
h U
h ,
Y Y N Y Y Y Y
h h
o
o
o
o
Variabilidadtotal=Variabilidad+Variabilidad
intragruposintergrupos
Descomposicindelavarianza
( )

+ =
h
h
h
h
h
h
Y Y
N
N
N
N
2
2 2
o o
p
5
2 2 2
INTER INTRA
o o o + =
Diseo estratificado
( )

h h
Y Y
N
S
N
S
2
2
2
Casivarianza
( )

~
h
h
h
h
h
h
Y Y
N
N
S
N
N
S
2
2
Ratiodecorrelacin:
medida de la relacin entre una variable cuantitativa y una variable categrica
( )
( )
2
2
2
2
2
o
o
q
INTER h
h h
Y y
Y Y N
=


=
6
( ) o
h U k
h , k
h
Y y

e
Diseo estratificado
Notacin
l i di idid h El universo U esta dividido en H estratos: U
h
, h=1,,H
U
1
U
2
U
h
U
H
Universo Estratoh
Y
h
Y
N N
h
2
h
o
T T
h
o
2
S
2
2
h
S
S
2
N N +N + +N + +N
H
h
Y
N
Y
7
N= N
1
+N
2
++N
h
++N
H
H h
h
h
h
T T T T
Y
N
Y
+ . + + . + =
=

=
1
1
Diseo estratificado
2 Di l
3.Diseosestratificados
2.Diseomuestral
Undiseomuestralesestratificadosi:
E d t t l i t i l d t fij h Encadaestrato,seseleccionaunamuestrasimpledetamaofijonh
laseleccindeunamuestraenunestratoesindependientedelaseleccin
delasmuestrasenlosotrosestratos
(Laestratificacinsepuedegeneralizaraotrosmtodosdeextraccin)
8
Diseo estratificado
Se nota S
h
, la muestra aleatoria seleccionada en el estrato h mediante el
diseo p
h
(.)
La muestra S es:
h
h
S S =
Un valor posible s de S se nota:
h
h
h
s s =
Dado la independencia de las extracciones entre los estratos, el diseo de
muestra es: muestra es:
( ) ( )
[
H
( ) ( )
[
=
= h
h h
p p
1
s s
9
Diseo estratificado
Se observan H muestras (extraccines independientes en cada estrato)
Muestra global Submuestra h
(ASSR)

(ASSR)
n n
h

=
h
h
n n
h
h
N
n
f =
Esposibleque:
h
h
N
f
Y

h
Y

h
T

2
h
S
N
N
n
n
h h
=
10
Diseo estratificado
3 Probabilidades de inclusin y estimacin 3.Probabilidadesdeinclusinyestimacin
probabilidades de inclusin probabilidadesdeinclusin
probabilidaddeinclusindelaunidado h
h
h
U k
N
n
e = ,
o
t
h
probabilidad de que a y b pertenezcan a la muestra:
( )
( )
h
h h
h h
U y
N N
n n
e

= | o t
o|
,
1
1
probabilidaddequeayb pertenezcanalamuestra:
l h
l h
l h
U U
N N
n n
e e = | o t
o|
,
11
Diseo estratificado
Estimacin del total
h
H
h
h
H
h
h
Y

N

= =
1 1
Estimador sinsesgo
Estimador
h h = = 1 1
h
T

:testimadordeltotalenestratoh.
t
i h
=N
h
/n
h
(depende del estrato). t
i,h
N
h
/n
h
(dependedelestrato).
( ) ( ) ( )
2 2 2
1
1
h
H H H
S
n
N y V N y N V T

V
|
|

=
Varianzadelestimador
( ) ( ) ( )
1 1 1
1
h
h h
h
h
h
h
h
h
h h S
n N
N y V N y N V T V
|
.

=
= = =
1
| |
Estimacindelavarianzadelestimador
12
( )
2
1
2
1
1
h
h h
h
H
h
h
s T

n N
n
N
|
.
|

\
|
=

=
Diseo estratificado
Estimacin de la media
h
H
h
h y N
N N
T

Y

= =
.
1
1
Estimador sinsesgo
Estimador
h
N N
=1
Varianzadelestimador
2
2
2
1
1
h
h
H
h
S
n N
Y
V
|
|
|

|
=
|
.
|

\
|

.
1
2
h
h h
h
S
n N N
Y
V
|
|
.

\
|
.

\
=
Estimacin de la varianza del estimador
2
1
2
2
1
1
h
h h
h
H
h
h
s
n N
n
N
N
Y
V

|
|
.
|

\
|
=
|
.
|

\
|

.
Estimacindelavarianzadelestimador
13
1 h h h
n N N
. \
. \
=
Diseo estratificado
Estimacindeunaproporcin
h
h
p
N
N
p

=
Estimador
Estimador sinsesgo
h
N

Varianzadelestimador
( )
( )
h
h h
h
h
h
h
n
P P
N
n
N
N
p V

|
|
.
|

\
|
|
.
|

\
|
=

1
1
2

Estimacindelavarianzadelestimador
( )
( )

|
|
.
|

\
|
|
.
|

\
|
=
h
h
h h
h
h h
n
p p
N
n
N
N
p V
1
1
1
2

14
Diseo estratificado
Aplicacinnumrica
S di d bl i d 1060 S d ti l di Se dispone de una poblacin de 1060 empresas. Se desea estimar el nmero medio
de empleados por empresa. La poblacin est compuesta de 5 estratos definidos a partir
del tamao de la empresa segn el nmero de empleados en clase. Esta informacin es
conocida a partir de los registros oficiales que no dan el nmero exacto de empleados, p g q p
sino el tamao en clase.
Se dispone de un presupuesto que permite encuestar 300 empresas. Se decide realizar
un muestreo aleatorio simple en cada estrado segn el reparto indicado en la tabla.
Estrato
Sobre cada empresa, se mide la variable Y:nmero de empleados y se calcula la media
y la varianza de dicha variable en cada estrato. Escoger un estimador, dar su expresin.
Hacer una estimacin de Y por punto y por intervalo.
Estrato
segntamao
empresa
N
h
n
h
0-9
10 19
500
300
130
80
5
12
1.5
4 0
h
y
2
h
s
10-19
20-49
50-499
500 y ms
300
150
100
10
80
60
25
5
12
30
150
600
4.0
8.0
100.0
2500.0
15
Total 1060 300
Diseo estratificado
Nota: seleccin de los estratos Nota:seleccindelosestratos
estratoshomogneosconrespectoaltemaestudiado
criteriosdeestratificacin(variablescualitativas):
disponibilidad
correlacionados coneltemaestudiadoenlaencuesta:categorasocial,el
niveldeinstruccin,eltamaodelhogar,eltipodehbitat
Generalmente,seemplearn:
i i di i l criterioscorrespondientesaunatipologa
criteriosdetamao
Unaestratificacinpuedesereficazparaelestudiodeunfenmeno,por
ejemplolamortalidad,yserlopocoparaelestudiodeotrosfenmenos,por
ejemplo la actividad econmica o los movimientos migratorios.
16
ejemplolaactividadeconmicaolosmovimientosmigratorios.
Diseo estratificado
4.Repartoproporcional(Afijacinproporcional)
Elrepartoproporcionalconsisteenutilizarlamismatasademuestreoen
todoslosestratos
N
N
n
n
h h
=
Laexpresindelavarianzadelestimadorencasodemuestreo
estratificado:
2
h
H
2
h
1 n N
|
|

|
|
|

|
.
S
) f (
ra int
2
1
Y
V
|
|

|
.
2
h h
h
H
1 h
2
h
n
1
N
n
1
N
N
Y
V
h
S
|
|
.
|

\
|
=
|
.
|

\
|

=
Sesimplificaysepuedeescribir
n
) f (
ra int
1
Y
V =
|
.
|

\
|
s
2
| |
.
y,laestimacindeestavarianzase
calcula mediante
17
n
s
) f (

ra int
1
Y
V =
|
.
|

\
|
.
calculamediante:
Diseo estratificado
Ej l P di idid d i ( t t ) Ejemplo:Pasdivididoendosregiones(estratos)
Estrato Nmero Poblacin
h de aldeas
(N
h
)
Total
Y
S
h
1 3 000 956 800 100 319
2 1 000 605 000 200 605
Total 4 000 1 561 800 390
Estrato Proporcional
1 60
2 20
Total 80
18
Diseo estratificado
Ejemplo de las empresas Ejemplo de las empresas
19
Diseo estratificado
5.RepartoptimodeNeyman
ElrepartodeNeymanconsisteenminimizarlavarianzadelestimador,
loqueconducea
( )
|
|

|
|
|

=
2 2
1
1
h
H
S
n
N T

V Min

( )
|
.

\
|
.

=
=1
1
h
h h
h
h
S
n N
N T V Min
n n
h
h
=

n
S N
S N
n
h h
h

n
S N
S
N
n
f
h h
h
h
h
h

= =

20
S N
h
h h

S N N
h
h h h
Diseo estratificado
Con la siguiente notacin:
h
h
h
S N
N
S

=
1
La expresin de la varianza del estimador en caso de muestreo estratificado:
Conlasiguientenotacin:
Laexpresindelavarianzadelestimadorencasodemuestreoestratificado:
2
h h
h
H
1 h
2
2
h
n
1
N
n
1
N
N
Y
V
h
S
|
|
.
|

\
|
=
|
.
|

\
|

=
.
( )
2
2 1 1
S S ) Y

( V =
h h . \
sesimplificaysepuedeescribir:
( )
ra int
S
N
S
n
) Y ( V
yelestimadordelavarianzadelamediaseexpresamediante:
( )
2
2
1 1
ra int
s
N
s
n
) Y

( V

=
21
Diseo estratificado
Ej l P di idid d i ( t t ) Ejemplo:Pasdivididoendosregiones(estratos)
Estrato Nmero Poblacin
Y
h de aldeas
(N
h
)
Total
Y
S
h
1 3 000 956 800 100 319
Y
h
2 1 000 605 000 200 605
Total 4 000 1 561 800 390
Estrato Proporcional Neyman
1 60 48 1 60 48
2 20 32
Total 80 80
22
Diseo estratificado
Ejemplo de las empresas Ejemplo de las empresas
23
Diseo estratificado
6 Obj i l b l / Obj i l l
3. Diseos estratificados
6. Objetivos globales/ Objetivos locales
Bsqueda de precisin a nivel de cada estrato
Cuando se desea obtener informacin significativa para cada estrato, habr
que dar una ventaja relativa a los estratos menos poblados, generalmente en
detrimento de la precisin global detrimento de la precisin global.
Si se desea la misma precisin a nivel de cada estrato y si se estima que los p y q
estratos presentan la misma heterogeneidad para el carcter estudiado, se
debern tomar tamaos de muestra similares en cada uno.
24
Diseo estratificado
Volvamosalpasdivididoendosregiones
Estrato
h
Nmero
de aldeas
(N
h
)
Poblacin
Total
T
S
h
1 3 000 956 800 100 319
Y
h
1 3 000 956 800 100 319
2 1 000 605 000 200 605
Total 4 000 1 561 800 390
S S
2 2
| | | |
Ahora,sedeseaobtenerintervalosdeconfianzadelamismaamplitudparala
estimacindeltamaomediodelasaldeasencadaunodelosdosestratos.
( ) ( )
V V y y
1 2
=
n N
n
n N
n S S
2
2
2
2
2
1
2
1
1
1
1 1
|
.
|

\
|
=
|
.
|

\
|

S S S S
2 2 2 2
+ S
n
S
n
S S
1
1
2
2
1 2
= =
+
n
Despreciando las tasas de muestreo para simplificar:
conn=80,seobtiene:
25
n
1
=16n
2
=64
Diseo estratificado
Aqu, para obtener una estimacin precisa para el estrato 2 (que contiene
menos aldeas que el estrato 1, pero con tamaos ms dispersos), se debe
privilegiar la asignacin de unidades encuestadas hacia este estrato.
Resumen
Y
h
Estrato h Nmero
de aldeas
(Nh)
Poblacin
Total S
h
Rep.
Prop.
Rep.
Neyman
Misma
precisin
en los dos
estratos
1 3 000 956 800 100 319 60 48 16
2 1 000 605 000 200 605 20 32 64
Total 4 000 1 561 800 390
26
Diseo estratificado
7.Tamaodemuestra
( )
2
h
h
h h
h
S
na
na N
N T


=

=
k
1 h
V
( )
n a n
h h
= Senota:
( ) V T

= V
Sedesea: fijadoapriori

= =
=
H
h
h h
H
h
h
h
h
S N S
a
N
n
1
2
1
2
2
1
V

=
H
h
h
h
h
S
a
N
n
1
2
2
Finalmente:
27

=
+
=
H
h
h h
h
S N V
n
1
2
Diseo estratificado
Problemademinimizacin:

H
h
h
S
a
N
2
2

=
+
H
h h
h
h
a
S N V
a
Min
h
1
2
1

=
=
H
h
h
h
a con
1
1
1
= h 1

|
|
|

|
H
S N
2

=
h h
h
S N
S N
a

=
+
|
|
.

\
=
H
h h
h
h h
S N V
S N
n
2
1
*
28


h
h h
S N

=
+
h
h h
S N V
1
Diseo estratificado
7. Algunas notas
1. El reparto proporcional no depende de y (no hace falta conocimiento sobre y, ni
media, ni varianza, etc.). Basta conocer N
h
y la variable auxiliar
2. EL reparto de Neyman requiere un buen conocimiento de s
h
:
E t t i - Encuestas anteriores
- Expertos
- Muestreos en dos fases
3. Se ve que
Y

V Y

V Y

V s s
ASSR PROP OPT
Y V Y V Y V s s
Silasvarianzasson
conocidasconuna
29
buenaprecisin
Diseo estratificado

También podría gustarte