Está en la página 1de 62

MUESTREO ESTRATIFICADO

El muestreo estratificado consiste en dividir


la poblacin en L subconjuntos o estratos, y
de cada uno de ellos seleccionar una
muestra
probabilstica;
de
manera
independiente de un estrato a otro.
Existen tres razones importantes para
utilizar este tipo de muestreo:
i. estadsticas,
ii. marcos; y de
iii. costos.

MUESTREO ESTRATIFICADO
i.

La razn estadstica ocurre cuando la poblacin


est constituida por unidades heterogneas y
podemos tener una idea previa de los grupos de
unidades ms homogneas entre s, entonces es
conveniente formar estratos.
Los estratos son subconjuntos de la poblacin
que agrupan unidades homogneas,
homogneas aunque
sean heterogneas entre estratos.
estratos
Cada estrato se muestrea por separado y se
obtienen los estimadores de parmetros (totales,
medias, proporciones) para cada estrato.

MUESTREO ESTRATIFICADO
Se supone que se conoce el nmero de
unidades en cada estrato (Nh).
Aunque esto se ver despus, es importante
sealar que si se usan estimadores de razn o
de regresin o si el muestreo se hace con
probabilidad proporcional al tamao, los
estratos se forman con subconjuntos de
unidades
donde
sea
constante
la
proporcionalidad de Y a X, aunque esa
proporcionalidad cambie de estrato a estrato.

MUESTREO ESTRATIFICADO
Como ejemplos de la razn estadstica para usar
estratos, considrense:
(a) En un muestreo donde interesa conocer
alguna caracterstica de los hogares en la Ciudad
de Mxico (por ejemplo: gastos en alimentos,
ropa, ingresos, tipo de casa habitacin, aos de
escolaridad del padre, nmero de hijos, etctera).
Se sabe que esas caractersticas dependen
fuertemente del nivel socioeconmico de las
familias, por lo tanto conviene hacer estratos
considerando reas de la ciudad con niveles
socioeconmicos semejantes.

MUESTREO ESTRATIFICADO
As, las colonias se pueden clasificar a priori
con relacin al nivel socioeconmico como:
muy alto, alto, medio, medio bajo y bajo,
formando de esta manera cinco estratos.
La encuesta se planea para cada estrato por
separado. El efecto de formacin de estratos
es reducir la variabilidad de los
estimadores. La variabilidad de Y se puede
reducir mucho si los estratos son muy
homogneos dentro de cada uno de ellos y
heterogneos entre los mismos.

MUESTREO ESTRATIFICADO
(b) En un muestreo para estimar la cosecha
total de caf en Mxico, se conoca que el
estado fisiolgico, edad y estado de sanidad de
los rboles influye mucho en su produccin.
Entonces, se tomaron como estratos,
categoras de rboles bien definidas y
homogneas en lo que respecta a edad,
estados fisiolgicos y de sanidad. Adems, los
predios se agruparon en estratos de acuerdo a
la regin ecolgica donde estaban ubicados.
Esto es porque la productividad del caf vara
segn las condiciones ecolgicas como altura
sobre el nivel del mar, vientos, temperaturas
extremas, etctera.

MUESTREO ESTRATIFICADO
(c) En una encuesta para estimar el consumo
de energa elctrica es conveniente agrupar
las fbricas en estratos, as quedaran
agrupadas en: fbricas grandes, fbricas
pequeas, empresas de produccin familiar y
un estrato final constituido por casahabitacin. Esto, porque sabemos que el
consumo de electricidad va a ser muy
variable entre estratos, y esperamos que sea
menor dentro de estos.

MUESTREO ESTRATIFICADO
ii.

Otra razn poderosa para formar estratos es


la disponibilidad de marcos.
marcos
Si para una parte de la poblacin se tiene un
buen marco, ste se usa para el muestreo
de esa parte y la o las otras partes de la
poblacin se muestrean usando otros
marcos ms imprecisos y, posiblemente
distintos esquemas (diseos) de muestra.

MUESTREO ESTRATIFICADO
Por ejemplo,
ejemplo en encuesta de hogares se cuenta con
un buen marco para la zona urbana de construccin
antigua; pero las zonas rurales y las urbanas de
construccin reciente no tienen un marco
adecuado.
Entonces se utilizan planos catastrales para las
zonas urbanas antiguas (un estrato), se usan
fotografas areas para zonas rurales (otro estrato)
y las reas de posible nueva urbanizacin (otro
estrato) se delimitan como otro marco; se
muestrean reas y se investigan las nuevas
urbanizaciones (muestreo en etapas
o
conglomerados).

MUESTREO ESTRATIFICADO
iii. Otra razn ms para construir estratos
puede ser el costo de localizar y levantar la
informacin de las unidades, por ejemplo:
si en una encuesta de predios agrcolas
hay una regin cuyo acceso es difcil (por
avin o a caballo nicamente), esa regin
puede constituir un estrato, que ser
muestreado con un tamao de muestra
pequeo.

MUESTREO ESTRATIFICADO
Lo ms frecuente es que los tres criterios
para formacin de estratos coincidan,
coincidan de
modo que los estratos formen unidades
homogneas con un mismo tipo de marco y
con costos de localizacin y captacin de
informacin semejantes.
semejantes

MUESTREO ESTRATIFICADO
Se pueden utilizar diferentes formas de
muestreo en los diferentes estratos,
estratos sin
embargo, se considerar en este escrito
como una introduccin al tema, aquel en el
cual cada estrato se muestrea usando mas.

Ms adelante se consideran las muestras


complejas, donde se amplia el uso de
estratos.

MUESTREO ESTRATIFICADO
Considrese la siguiente notacin:
Nh= nmero de unidades en estrato h-simo;
h=1,2,...,L;
L= nmero de estratos.

MUESTREO ESTRATIFICADO
Valores Poblacionales

Yhi

valor de la medicin en el elemento


i-simo del estrato h-simo.
L

N N h total de unidades en la poblacin.


h 1
Nh

Yh

Y
i 1

Nh

hi

media poblacional del estrato h-simo.

MUESTREO ESTRATIFICADO
Nh

Yh N hYh total
Yhi poblacional del estrato
i 1

h-simo.

Nh

S
2
h

Y Y

varianzas poblacionales del


i 1

hi

N h h-simo.
1
estrato

MUESTREO ESTRATIFICADO
L

Nh

Y Yh Yhi
h 1

total de toda la poblacin.

h 1 i 1

Y Nh Y h
h 1

Y
Y
Nh

media de los valores Yhi


en toda la poblacin.

MUESTREO ESTRATIFICADO
Nh
Wh
N
L

W
h 1

proporcin del tamao


del estrato h-simo.

MUESTREO ESTRATIFICADO
Valores muestrales
En esta parte se considera cualquier estrategia
de muestreo probabilstico en cada estrado,
incluso pueden ser diferentes de un estrato a
otro.

MUESTREO ESTRATIFICADO
Supngase que de manera independiente se
toman muestras de cada estrato. Sea nh el
tamao de muestra en el estrato h-simo.
La muestra total es

n nh
h 1

MUESTREO ESTRATIFICADO
Supngase que se quiere estimar el total de la
poblacin, esto es
L

Nh

Y Yh Yhi
h 1

h 1 i 1

Para esto con la muestra de cada estrato se


estima el total, sea Yh el estimador insesgado o
con sesgo despreciable para el caso de
estimadores de razn o de regresin, su
varianza V (Yh ), adems, sea V (Yh ) un estimador
de esa varianza.

MUESTREO ESTRATIFICADO
El estimador del total es
L

Y Yh
h 1

la suma de los estimadores de los totales de


los estratos (es un estimador insesgado).
Esto es vlido con cualquier diseo de
muestra y estimadores por estrato, los que
pueden ser distintos en los diferentes estratos.

MUESTREO ESTRATIFICADO
La varianza del estimador del total es
L
V (Y ) V (Y ) ,

h 1

que es la suma de las varianzas de los


estimadores de los totales de estratos.
Esto es por tener muestras independientes
en los estratos.

MUESTREO ESTRATIFICADO
Adems el estimador de la varianza del
estimador del total es:
L

V (Y ) V (Yh )
h 1

MUESTREO ESTRATIFICADO
Suponiendo distribucin normal de Y se tiene:

P Y Y 1.96 V (Y ) .95

P Y 1.96 V (Y ) Y Y 1.96 V (Y ) &.95

MUESTREO ESTRATIFICADO
Si no se puede suponer normalidad sese el
valor 4.4 en lugar de 1.96 (T. Tchebycheff).
Estas expresiones para Y son vlidas para
cualquier forma de muestrear estratos.

MUESTREO ESTRATIFICADO
La primera aproximacin al uso de estratos
es considerar que se usa mas en cada
estrato entonces: nh

Yh N h yh N h

y
i 1

nh

hi

N hYh

donde yhi son los valores observados en la


unidad i-sima de la muestra (tamao nh) del
estrato h-simo.

MUESTREO ESTRATIFICADO
El estimador del total poblacional es:
L

h 1

h 1

Y Yh N h yh

(6.1)

nh

yhi

Y Nh
h 1
i 1 nh
L

nh

Nh

yhi
h 1 i 1 nh
L

Nh
donde
corresponde al factor de expansin,
nh

de las

unidades obtenidas en cada estrato.

MUESTREO ESTRATIFICADO
Su varianza terica es:
L

h 1

h 1

2
2

V (Y ) V (Yh ) N h V ( yh )
2

nh S h
Nh 1
N h nh
h 1

(6.2)

Esta varianza se estima al sustituir S2h por


su estimador en cada estrato.

MUESTREO ESTRATIFICADO
El estimador insesgado de S2h es
2

nh

i 1

yhi yh

nh 1

Ntese que S h es la misma expresin que


S2h, pero la primera es con valores de la

muestra y la segunda con los valores de todo


el estrato h-simo.

MUESTREO ESTRATIFICADO
Recurriendo al Teorema central del lmite,
lmite para
cada estrato
yh ~N [Yh, se
V (tendr
yh )] que
.Y ~N [Y , V (Y )]
Esto es mucho ms factible aunque cada

yh

no tenga distribucin normal, si se tienen


muchos estratos. Se puede decir que los errores
de estimacin tienden a cancelarse de un estrato
a otro.

6. MUESTREO ESTRATIFICADO
Y ) puede construir un intervalo
Si se estima V, (se
de confianza aproximado para el total de la
poblacin:

P Y 1.96 V (Y ) Y Y 1.96 V (Y ) &0.95


(6.3)

Al dividir cada trmino de (6.3) entre N N h ,


tenemos el intervalo de confianza para
,Yla media de la poblacin.

6. MUESTREO ESTRATIFICADO
Si se considera que la muestra es grande en
cada estrato, la muestra total ser mayor
an. Esto justifica el uso del valor 1.96 en
lugar del valor de las tablas de t. Ntese que:

n
S
V (Y ) N h 1 h h
N h nh
h 1

(6.4)

6. MUESTREO ESTRATIFICADO
Si lo que se quiere estimar es Y , se tendr que,
L

Y
N

N
h 1

Nh
donde Wh
N
h-simo.

yh

L
Nh

yh Wh yh
h 1 N
h 1
L

(6.5)
proporcin del tamao de estrato

6. MUESTREO ESTRATIFICADO
Ntese que (6.5) es un promedio ponderado de
los promedios muestrales y su varianza es:

nh S h

V Y Wh 1
N h nh
h 1

(6.6)

la que se estima con:


2

n
S
V (Y ) Wh 1 h h
N h nh
h 1

(6.6a)

6. MUESTREO ESTRATIFICADO
De manera semejante, el intervalo de confianza
aproximado para Y es el siguiente:

P Y 1.96 V (Y ) Y Y 1.96 V (Y ) &0.95

An con muestras chicas en cada estrato (nh =


2,3,4) si se tienen mas de 10 estratos se

Y
puede tener normalidad para
, esto en
virtud de la compensacin de errores.

6. MUESTREO ESTRATIFICADO
Proporciones
Si lo que se requiere estimar es P, la
proporcin de elementos de la poblacin que
tienen una caracterstica determinada, se usan
las equivalencias dadas por

Yh Ph ,

yh ph ,

P Wh ph ,
h 1

nh ph 1 ph

V (Y ) V ( P ) Wh 1
N h
nh
h 1

6. MUESTREO ESTRATIFICADO
Estas equivalencias surgen al considerar que

Si la unidad i-sima del estrato h


tiene la caracterstica

De otro modo

Yhi=

6. MUESTREO ESTRATIFICADO
Slo si las Ph son muy diferentes de estrato
a estrato, vale la pena estratificar.
Si .2 Ph .8 h , no conviene usar los
estratos.

6.1 Distribucin (afijacin) de la Muestra


a los Estratos
Antes de considerar el problema de la
determinacin del tamao de muestra, se
discute la forma de distribuir el tamao de
muestra total, n, a los diferentes estratos.

6.1.1.

Distribucin Proporcional

Un criterio es lo que se le llama distribucin


(afijacin) proporcional, donde la muestra se
divide de manera proporcional a los tamaos
de los estratos Nh.

6.1.1.

Distribucin Proporcional

Se busca que se cumpla la relacin:

nh N h

Wh .
n
N

De esta relacin se tiene:


(6.7) n n N h nW
h

6.1.1.

Distribucin Proporcional

Esta distribucin de la muestra total se usa


cuando no se tiene informacin sobre la
magnitud de las S2h, o que esas S2h sean
semejantes; se usa adems cuando los
costos de muestrear las unidades en los
diferentes estratos son semejantes.
semejantes

6.1.1.

Distribucin Proporcional

Tambin se emplea cuando el muestreo o


encuesta
va
a
determinar
varias
caractersticas (varias mediciones) en cada
unidad de la poblacin, incluso cuando se
quiere que sea autoponderado, es decir,
todos los elementos de la muestra tienen un
mismo factor de expansin N h N .

nh

6.1.1.

Distribucin Proporcional

Con esta distribucin proporcional se tiene:


L

Nh

Y Yh N h yh
h 1
h 1
h 1 nh
L

nh

y
i 1

hi

nh

k yhi
h 1 i 1

donde

Nh
Nh
N
k

.
nh n N h
n
N

6.1.2 Distribucin ptima


Cuando se tienen costos muy diferentes para el
muestreo de unidades en los diferentes estratos,
se usa la distribucin (afijacin) ptima.
ptima

Si el costo para obtener informacin de una


unidad en el estrato h-simo es Ch, el costo total
L
ser:
Ch nh
(6.8) C C0

h 1

C0 es costo administrativo,
administrativo
etctera, general.

de

instalacin,

6.1.2 Distribucin ptima


La minimizacin (variando las nh, sin cambiar otras
condiciones), de la varianza del estimador (6.2)
con costo fijo (6.8) o viceversa, produce la
distribucin ptima que es:
1
N h S h L N h S h
nh n

(6.9)
Ch h 1 Ch

N h Sh
nh
Ch
Esto es para muestreo mas en todos los estratos.

6.1.2 Distribucin ptima


Para cualquier diseo de muestreo en los
estratos, la varianza del estimador del total se
podr expresar como:

Ah

V (Yh )
(cte. que no involucra nh )
nh
Entonces la distribucin ptima es:
es

nh n

Ah
Ch

h 1

Ah

Ch

, nh

Ah
Ch

6.2 Tamao de Muestra Total


Si lo que se quiere es encontrar aquel valor
de n que produce la mnima varianza para un
costo total fijo C0, se deber usar la expresin
(6.9) y sustituir en (6.8).

6.2 Tamao de Muestra Total


Entonces tenemos:

N h Sh
C C0
Ch
h 1
L

N S
h 1

(6.10)

Ch

Esto es usando la distribucin ptima.


Los valores de Sh se debern obtener con base en
muestras piloto de cada estrato,
estrato o bien por
conocimiento previo de la forma de la distribucin
en cada estrato y el rango de variacin.

6.2 Tamao de Muestra Total


Si lo que se quiere es encontrar el valor de n
que produce el costo mnimo para un error de
estimacin determinado, entre el estimador
del total y el verdadero total, entonces se tiene
.
1.96 V (Y )
Si se sustituye la varianza de la expresin (6.2)
con distribucin ptima, se obtiene:
L
L N h S h
N h S h Ch

(6.11)
h 1
h 1 Ch
n
L
2
2

N
S

h h
2
1.96 h1

6.2 Tamao de Muestra Total


Las expresiones (6.10) y (6.11) se refieren a
la estimacin del total. Para estimar un
promedio, Y , la expresin (6.10) sigue siendo
vlida pero la (6.11) debe modificarse:

Y 1.96 V (Y ) Y Y 1.96 V (Y ) &.95


1 4 2 43

1.96 V Y

6.2 Tamao de Muestra Total


Sustituyendo la varianza por la expresin (6.6) y
con nh ptimo se tiene:

Nh
S Ch

2 h
h 1 N

n
2
1
2
2
(1.96)
N
L

N h S h

Ch
h 1
L

(6.11)

2
N
S
h h
h 1

Donde ahora es el error mximo permisible, con


confianza del 95%, entre el estimador del promedio

Y , y el promedio poblacional Y . Ntese que las


en expresiones (6.11) y (6.11) son muy diferentes.
diferentes

6.2 Tamao de Muestra Total


Las expresiones (6.10), (6.11) y (6.11) se
usan cuando se quiere optimizar algo que
involucra el costo.
costo
Si el costo no es determinante y si se usa la
distribucin ptima para Ch constante,
constante (6.10)
no deber usarse.
usarse
Es importante enfatizar que en (6.10), (6.11) y
(6.11) se usa la distribucin ptima.

6.3 Distribucin Proporcional


Si se va a usar la distribucin proporcional se
puede recurrir a la expresin de la varianza
que es:
2
L
N
h 2
V (Y )
S h N h S h2
(6.12)

n
h 1

Nh
n se tiene:
Si se sustituye nh
N
L
N
2
2

V (Y ) N h S h N h S h
n h 1

(6.12)

6.3 Distribucin Proporcional


Con este valor en lugar de las S2, se pueden usar
las expresiones (5.3) y (5.4) para obtener n.
Si se quiere tener un coeficiente de variacin fijo
(CVo), sin tomar en cuenta el tipo de distribucin
del estimador Y , se tendr :

CV0

V (Y )

6.3 Distribucin Proporcional


de donde:
L

N Nh S

h 1

2
h

2
CV

N
S
0 h h
2

h 1

(6.13)

6.3 Distribucin Proporcional

Si se considera que Y ~ Y , V (Y ) y se desea tener:

P | Y Y | 1 ,

de aqu se tiene que

z / 2

V (Y )

6.3 Distribucin Proporcional


de donde a partir de V (Y ) se obtiene que n
debe de ser:
L

N N h S h2
h 1

2
N h Sh
2
z / 2 h 1
2

(6.14)

6.3 Distribucin Proporcional


Es relativamente sencillo modificar las expresiones
(6.13) y (6.14) para considerar la estimacin de Y .
El cambio fundamental est en que se debe
sustituir Y por Y que es Y , entonces:

1
1

V (Y ) 2 V (Y )
N
nN

1
2
N h Sh 2

N
h 1

2
N
S
h h.
h 1

6.4 Conclusiones
Si se considera que el costo es importante,
importante esto
es, hay costos diferenciales en los estratos,
conviene usar la distribucin ptima (6.9) y
determinar el tamao de muestra con
expresiones (6.10), (6.11) o (6.11).
Si no hay costos diferenciales muy marcados y
se decide usar la distribucin proporcional (6.7)
para determinar el tamao de muestra total, se
usar (6.13), si se quiere fijar el coeficiente de
variacin, sin consideraciones sobre la
distribucin de los estimadores.

6.4 Conclusiones
Si se quiere fijar la precisin ( ) y la
confiabilidad (1-) considerando distribucin
normal para el estimador, se usar la
expresin (6.14).

Debe tenerse cuidado al sealar que todas las


expresiones anteriores determinan el tamao
de muestra para estimadores globales de toda
la poblacin. Las inferencias no son para
cada estrato con esas muestras.

6.4 Conclusiones
Si lo que se desea es estimar media o totales
en cada estrato, las expresiones anteriores
no se deben usar, lo que se debe emplear
son frmulas (5.3) y (5.4) para cada estrato
por separado y as determinar las nh a usarse
en cada uno de ellos. Por supuesto que en
este ltimo caso la muestra total n es mucho
ms grande. Esto es de esperarse, puesto
que ahora se estn haciendo inferencias por
separado para L poblaciones.

También podría gustarte