Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Claseunamhjv 3
Claseunamhjv 3
MUESTREO ESTRATIFICADO
i.
MUESTREO ESTRATIFICADO
Se supone que se conoce el nmero de
unidades en cada estrato (Nh).
Aunque esto se ver despus, es importante
sealar que si se usan estimadores de razn o
de regresin o si el muestreo se hace con
probabilidad proporcional al tamao, los
estratos se forman con subconjuntos de
unidades
donde
sea
constante
la
proporcionalidad de Y a X, aunque esa
proporcionalidad cambie de estrato a estrato.
MUESTREO ESTRATIFICADO
Como ejemplos de la razn estadstica para usar
estratos, considrense:
(a) En un muestreo donde interesa conocer
alguna caracterstica de los hogares en la Ciudad
de Mxico (por ejemplo: gastos en alimentos,
ropa, ingresos, tipo de casa habitacin, aos de
escolaridad del padre, nmero de hijos, etctera).
Se sabe que esas caractersticas dependen
fuertemente del nivel socioeconmico de las
familias, por lo tanto conviene hacer estratos
considerando reas de la ciudad con niveles
socioeconmicos semejantes.
MUESTREO ESTRATIFICADO
As, las colonias se pueden clasificar a priori
con relacin al nivel socioeconmico como:
muy alto, alto, medio, medio bajo y bajo,
formando de esta manera cinco estratos.
La encuesta se planea para cada estrato por
separado. El efecto de formacin de estratos
es reducir la variabilidad de los
estimadores. La variabilidad de Y se puede
reducir mucho si los estratos son muy
homogneos dentro de cada uno de ellos y
heterogneos entre los mismos.
MUESTREO ESTRATIFICADO
(b) En un muestreo para estimar la cosecha
total de caf en Mxico, se conoca que el
estado fisiolgico, edad y estado de sanidad de
los rboles influye mucho en su produccin.
Entonces, se tomaron como estratos,
categoras de rboles bien definidas y
homogneas en lo que respecta a edad,
estados fisiolgicos y de sanidad. Adems, los
predios se agruparon en estratos de acuerdo a
la regin ecolgica donde estaban ubicados.
Esto es porque la productividad del caf vara
segn las condiciones ecolgicas como altura
sobre el nivel del mar, vientos, temperaturas
extremas, etctera.
MUESTREO ESTRATIFICADO
(c) En una encuesta para estimar el consumo
de energa elctrica es conveniente agrupar
las fbricas en estratos, as quedaran
agrupadas en: fbricas grandes, fbricas
pequeas, empresas de produccin familiar y
un estrato final constituido por casahabitacin. Esto, porque sabemos que el
consumo de electricidad va a ser muy
variable entre estratos, y esperamos que sea
menor dentro de estos.
MUESTREO ESTRATIFICADO
ii.
MUESTREO ESTRATIFICADO
Por ejemplo,
ejemplo en encuesta de hogares se cuenta con
un buen marco para la zona urbana de construccin
antigua; pero las zonas rurales y las urbanas de
construccin reciente no tienen un marco
adecuado.
Entonces se utilizan planos catastrales para las
zonas urbanas antiguas (un estrato), se usan
fotografas areas para zonas rurales (otro estrato)
y las reas de posible nueva urbanizacin (otro
estrato) se delimitan como otro marco; se
muestrean reas y se investigan las nuevas
urbanizaciones (muestreo en etapas
o
conglomerados).
MUESTREO ESTRATIFICADO
iii. Otra razn ms para construir estratos
puede ser el costo de localizar y levantar la
informacin de las unidades, por ejemplo:
si en una encuesta de predios agrcolas
hay una regin cuyo acceso es difcil (por
avin o a caballo nicamente), esa regin
puede constituir un estrato, que ser
muestreado con un tamao de muestra
pequeo.
MUESTREO ESTRATIFICADO
Lo ms frecuente es que los tres criterios
para formacin de estratos coincidan,
coincidan de
modo que los estratos formen unidades
homogneas con un mismo tipo de marco y
con costos de localizacin y captacin de
informacin semejantes.
semejantes
MUESTREO ESTRATIFICADO
Se pueden utilizar diferentes formas de
muestreo en los diferentes estratos,
estratos sin
embargo, se considerar en este escrito
como una introduccin al tema, aquel en el
cual cada estrato se muestrea usando mas.
MUESTREO ESTRATIFICADO
Considrese la siguiente notacin:
Nh= nmero de unidades en estrato h-simo;
h=1,2,...,L;
L= nmero de estratos.
MUESTREO ESTRATIFICADO
Valores Poblacionales
Yhi
Yh
Y
i 1
Nh
hi
MUESTREO ESTRATIFICADO
Nh
Yh N hYh total
Yhi poblacional del estrato
i 1
h-simo.
Nh
S
2
h
Y Y
hi
N h h-simo.
1
estrato
MUESTREO ESTRATIFICADO
L
Nh
Y Yh Yhi
h 1
h 1 i 1
Y Nh Y h
h 1
Y
Y
Nh
MUESTREO ESTRATIFICADO
Nh
Wh
N
L
W
h 1
MUESTREO ESTRATIFICADO
Valores muestrales
En esta parte se considera cualquier estrategia
de muestreo probabilstico en cada estrado,
incluso pueden ser diferentes de un estrato a
otro.
MUESTREO ESTRATIFICADO
Supngase que de manera independiente se
toman muestras de cada estrato. Sea nh el
tamao de muestra en el estrato h-simo.
La muestra total es
n nh
h 1
MUESTREO ESTRATIFICADO
Supngase que se quiere estimar el total de la
poblacin, esto es
L
Nh
Y Yh Yhi
h 1
h 1 i 1
MUESTREO ESTRATIFICADO
El estimador del total es
L
Y Yh
h 1
MUESTREO ESTRATIFICADO
La varianza del estimador del total es
L
V (Y ) V (Y ) ,
h 1
MUESTREO ESTRATIFICADO
Adems el estimador de la varianza del
estimador del total es:
L
V (Y ) V (Yh )
h 1
MUESTREO ESTRATIFICADO
Suponiendo distribucin normal de Y se tiene:
P Y Y 1.96 V (Y ) .95
MUESTREO ESTRATIFICADO
Si no se puede suponer normalidad sese el
valor 4.4 en lugar de 1.96 (T. Tchebycheff).
Estas expresiones para Y son vlidas para
cualquier forma de muestrear estratos.
MUESTREO ESTRATIFICADO
La primera aproximacin al uso de estratos
es considerar que se usa mas en cada
estrato entonces: nh
Yh N h yh N h
y
i 1
nh
hi
N hYh
MUESTREO ESTRATIFICADO
El estimador del total poblacional es:
L
h 1
h 1
Y Yh N h yh
(6.1)
nh
yhi
Y Nh
h 1
i 1 nh
L
nh
Nh
yhi
h 1 i 1 nh
L
Nh
donde
corresponde al factor de expansin,
nh
de las
MUESTREO ESTRATIFICADO
Su varianza terica es:
L
h 1
h 1
2
2
V (Y ) V (Yh ) N h V ( yh )
2
nh S h
Nh 1
N h nh
h 1
(6.2)
MUESTREO ESTRATIFICADO
El estimador insesgado de S2h es
2
nh
i 1
yhi yh
nh 1
MUESTREO ESTRATIFICADO
Recurriendo al Teorema central del lmite,
lmite para
cada estrato
yh ~N [Yh, se
V (tendr
yh )] que
.Y ~N [Y , V (Y )]
Esto es mucho ms factible aunque cada
yh
6. MUESTREO ESTRATIFICADO
Y ) puede construir un intervalo
Si se estima V, (se
de confianza aproximado para el total de la
poblacin:
6. MUESTREO ESTRATIFICADO
Si se considera que la muestra es grande en
cada estrato, la muestra total ser mayor
an. Esto justifica el uso del valor 1.96 en
lugar del valor de las tablas de t. Ntese que:
n
S
V (Y ) N h 1 h h
N h nh
h 1
(6.4)
6. MUESTREO ESTRATIFICADO
Si lo que se quiere estimar es Y , se tendr que,
L
Y
N
N
h 1
Nh
donde Wh
N
h-simo.
yh
L
Nh
yh Wh yh
h 1 N
h 1
L
(6.5)
proporcin del tamao de estrato
6. MUESTREO ESTRATIFICADO
Ntese que (6.5) es un promedio ponderado de
los promedios muestrales y su varianza es:
nh S h
V Y Wh 1
N h nh
h 1
(6.6)
n
S
V (Y ) Wh 1 h h
N h nh
h 1
(6.6a)
6. MUESTREO ESTRATIFICADO
De manera semejante, el intervalo de confianza
aproximado para Y es el siguiente:
Y
puede tener normalidad para
, esto en
virtud de la compensacin de errores.
6. MUESTREO ESTRATIFICADO
Proporciones
Si lo que se requiere estimar es P, la
proporcin de elementos de la poblacin que
tienen una caracterstica determinada, se usan
las equivalencias dadas por
Yh Ph ,
yh ph ,
P Wh ph ,
h 1
nh ph 1 ph
V (Y ) V ( P ) Wh 1
N h
nh
h 1
6. MUESTREO ESTRATIFICADO
Estas equivalencias surgen al considerar que
De otro modo
Yhi=
6. MUESTREO ESTRATIFICADO
Slo si las Ph son muy diferentes de estrato
a estrato, vale la pena estratificar.
Si .2 Ph .8 h , no conviene usar los
estratos.
6.1.1.
Distribucin Proporcional
6.1.1.
Distribucin Proporcional
nh N h
Wh .
n
N
6.1.1.
Distribucin Proporcional
6.1.1.
Distribucin Proporcional
nh
6.1.1.
Distribucin Proporcional
Nh
Y Yh N h yh
h 1
h 1
h 1 nh
L
nh
y
i 1
hi
nh
k yhi
h 1 i 1
donde
Nh
Nh
N
k
.
nh n N h
n
N
h 1
C0 es costo administrativo,
administrativo
etctera, general.
de
instalacin,
(6.9)
Ch h 1 Ch
N h Sh
nh
Ch
Esto es para muestreo mas en todos los estratos.
Ah
V (Yh )
(cte. que no involucra nh )
nh
Entonces la distribucin ptima es:
es
nh n
Ah
Ch
h 1
Ah
Ch
, nh
Ah
Ch
N h Sh
C C0
Ch
h 1
L
N S
h 1
(6.10)
Ch
(6.11)
h 1
h 1 Ch
n
L
2
2
N
S
h h
2
1.96 h1
1.96 V Y
Nh
S Ch
2 h
h 1 N
n
2
1
2
2
(1.96)
N
L
N h S h
Ch
h 1
L
(6.11)
2
N
S
h h
h 1
n
h 1
Nh
n se tiene:
Si se sustituye nh
N
L
N
2
2
V (Y ) N h S h N h S h
n h 1
(6.12)
CV0
V (Y )
N Nh S
h 1
2
h
2
CV
N
S
0 h h
2
h 1
(6.13)
P | Y Y | 1 ,
z / 2
V (Y )
N N h S h2
h 1
2
N h Sh
2
z / 2 h 1
2
(6.14)
1
1
V (Y ) 2 V (Y )
N
nN
1
2
N h Sh 2
N
h 1
2
N
S
h h.
h 1
6.4 Conclusiones
Si se considera que el costo es importante,
importante esto
es, hay costos diferenciales en los estratos,
conviene usar la distribucin ptima (6.9) y
determinar el tamao de muestra con
expresiones (6.10), (6.11) o (6.11).
Si no hay costos diferenciales muy marcados y
se decide usar la distribucin proporcional (6.7)
para determinar el tamao de muestra total, se
usar (6.13), si se quiere fijar el coeficiente de
variacin, sin consideraciones sobre la
distribucin de los estimadores.
6.4 Conclusiones
Si se quiere fijar la precisin ( ) y la
confiabilidad (1-) considerando distribucin
normal para el estimador, se usar la
expresin (6.14).
6.4 Conclusiones
Si lo que se desea es estimar media o totales
en cada estrato, las expresiones anteriores
no se deben usar, lo que se debe emplear
son frmulas (5.3) y (5.4) para cada estrato
por separado y as determinar las nh a usarse
en cada uno de ellos. Por supuesto que en
este ltimo caso la muestra total n es mucho
ms grande. Esto es de esperarse, puesto
que ahora se estn haciendo inferencias por
separado para L poblaciones.