Está en la página 1de 9

Muestreo Estratificado.

1.- Introduccin:
Para aplicar este diseo, se precisa que la poblacin est dividida en subpoblaciones,
estratos, que no se solapen. Se selecciona una muestra probabilstica en cada estrato y se
trabaja de manera independiente entre estratos.
Razones de la popularidad de este mtodo:
Permite realizar estimaciones de precisin expecifica en cada estrato;
En un experimento, los aspectos prcticos relacionados con la respuesta, la medida o la
informacin auxiliar pueden diferir considerablemente de una subpoblacin a otra.
Existirn razones administrativas, divisin territorial, ... .
Cuestiones tcnicas que plantea este muestreo:
i) Construccin de Estratos: Los objetivos del estudio y los recursos disponibles
contestarn las siguientes cuestiones Qu caractersticas utilizar para dividir la
poblacin en estratos?; Cmo se identificarn los estratos?; Cuntos estratos debe
haber?.
En particular, los estratos deben estar constituidos por unidades lo ms homogeneas
posibles; En el caso lmite de estricta homogeneidad bastara seleccionar una sola
unidad en cada estrato
ii) Eleccin de una muestra y mtodos de estimacin en cada estrato; El proceso de
muestreo se realizar de manera independiente en cada estrato
Ventajas de este diseo:
i) Si las mediciones dentro de cada estrato son homognes, la estratificacin producir
un lmite ms pequeo para el error de estimacin que el m.a.
ii) Se puede reducir el costo por observacin al estratificar la poblacin en grupos
convenientes.
iii) Permite obtener estimaciones de parmetros poblacionales para subgrupos de la
poblacin.
Ejemplos:
Ciudades
i) El I.P.C. se obtiene a partir de encuestas a:

Familias urbanas
Empresas de bienes y sevicios

Bienes y servicios especficos


ii) Una empresa de publicidad desea determinar cunto debe emplear en publicidad
televisiva en un municipio, para lo que decide realizar una encuesta por muestreo para
estimar el nmero medio de horas semanales que se ve la televisin en los hogares del
municipio. ste comprende dos pueblos, A y B, y un rea rural. El pueblo A circunda
una fbrica y los hogares son de trabajadores con nios en edad escolar. El B es un
suburbio de una ciudad vecina con muchos jubilados y pocos nios. El A tiene 155
hogares, el B tiene 62 y el rea rural 93.

2.- Notacin y Definiciones:


Definicin:
Dada una poblacin U y 1 , . . . , y N , se entiende por estratificacin una particin
de U en L subpoblaciones llamadas estratos, U 1 y 11 , . . . , y 1N 1

y k / k U 1 , . . . , U L y 11 , . . . , y 1N L y k / k U L , verificndose que
N 1 . . . N L N.

Notacin:
Muestra total s s 1 . . . s L / s i muestra en el estrato i-simo.
L

Parmetros: y k y k N h y U h h

h1kU h

kU

h1

y U h W h y U h / W h

Nh
N

h1

h1
Nh
N

h1

tamao relativo del estrato.

Tamao relativo de la muestra en el estrato h: f h

nh
Nh

3.- Estimadores.
-estimador:
L

h ; Puesto que la seleccin en los distintos estratos se realiza de manera


h1

independiente 1 , . . . , L son independientes.


L

Var h

Var

h1
L

Var h

Var

h1

Nota:
Este mtodo teien gran aplicacin ya que no precisa que el diseo muestral sea el
mismo en cada estrato,

3.1 Muestreo Aleatorio Simple en los L estratos:


L

i) st

h1

yk
nh

Nh ;

ks h

Var st
h1
L

Var st

N 2h 1f h
nh

2
h ;

N 2h 1f h
nh

S 2
h .

h1

ii) P st W h P h ;
h1

VarP st W 2h
h1
L

VarP st W 2h

1f h
nh
1f h
nh

N h P1P
N h 1

P h 1P h n h
n h 1

h1

3.2 Muestreo Aleatorio Simple con reemplazamiento en los L


estratos:
L

st
h1ks h

yk
nh
L

Var st
h1
L

Var st
h1

Nh;
N 2h
nh

2h ;

N 2h
nh

S 2
h

4.- Afijaciones:
La obtencin del tamao muestral n se realiza en base a las condiciones del experimento o
a la fijacin de la precisin deseada.
La afijacin trata de repartir el tamao muestral n entre los estratos.
Factores generales a tener en cuenta:
Tamao del estrato;
Variabilidad entre estratos;
Costo que tiene medir una observacin en cada estrato.

4.1 Afijacin Uniforme:


i) Conocido n :
Se asigna el mismo nmero de unidades muestrales a cada estrato, n h Ln , por tanto
favorece la representacin de los estratos pequeos y perjudica la de los grandes.
ii) Consideracin de costes:
L

Fijado C C 0 C h n h n
h1

CC 0 L
L

C h
h1

4.2 Afijacin Proporcional.


Se precisa conocer N h h1,...,L ;
i) Conocido n :
nh
Nh
n N n h nW h . Por tanto, todos los elementos de la poblacin tienen la
misma probabilidad de aparecer en la muestra.
Nota: Esta afijacin es ptima siempre que la variabilidad de la respuesta en los
estratos sea casi la misma.
ii) Consideracin de costes:
L

Fijado C C 0 C h n h

Ejercicio

h1

CC 0
L

C h W h
h1

iii) Proporcional al total:

y k

Si la variable Y es positiva n h

Uh

y k

; Esta afijacin es ptima si CV U h es

constante en todos los estratos.

4.3 Afijacin de Mnima Varianza, suponiendo m.a.s. en todos los


estratos:
i) Conocido n :
Consiste en determinar los n h h1,...,L de forma que para un tamao de muestra fijo la
L

varianza del estimador sea mnima min Var n h n


;
nh
h1

N
Si n h n L h h ;

N h h
h1

Observaciones:
1- Los valores de n h son proporcionales a los productos N h h y cuando h h
n h nW h . Por esto se dice que es la afijacin de mnima varianza, si todos los estratos
tienen la misma variabilidad respecto de la caracterstica en estudio.

2- Esta afijacin tiene el inconveniente de que precisa estimar mayor nmero de


caractersticas poblacionales: h h1,...,L .
3- La utilidad de esta afijacin reside en los casos en los que hay gran diferencia en la
variabilidad de la respuesta entre estratos
ii) Consideracin de costes:
L

Fijado C C 0 C h n h :
h1

min
nh

Var C 0 C h n h C

h1


Si st n h

Wh
h

CC 0

Ch

W
h

Ch

h1

No fijado C :
L

min Var C 0 C h n h
nh
h1

W
Si st n h h h

Ch

Fijado B y K, el error de estimacin para una confianza dada), y no fijado C :

min
nh

C h n h Var V o
h1


Si st n h

; V o Bk

Wh
h

W
h

Ch

Ch

h1
L
B2
K2

1
N

.Cunto valdr n?. Qu pasa si C h cte.

W h 2
h

h1

h?.

4.4 Afijacin ptima correlada.


Sea X una v.a. altamente correlada con Y, la variable de inters. Supongamos que se
conoce X U h .
Se toma:

nh n

Nh X U

Ejercicio: Justificar por qu es razonable esta solucin

N h X U
h

h1

5.- Determinacin de n fijados B y K :


h
w h nnh , NNh 1
1

Supongamos m.a.s. en los L estratos :

st : n

Wwhh 2h
h1
L

B2
K2

2h WNhh
h1

Si Afijacin Proporcional: w h W h

Nwhh 2h
st : n

h1
B2
K2

2h N h

wh

Si Mnima Varianza:

h1
L

P st : n

N h h
L

N h h
h1

W2
h
wh

Nh
N h 1

P h 1P h

h1
l

B2
K2

P h 1P h WNh

Nh
N h 1

h1

Ejercicio:
Una empresa de publicidad desea determinar cunto debe emplear en publicidad televisiva
en un municipio, para lo que decide realizar una encuesta por muestreo para estimar el
nmero medio de horas semanales que se ve la televisin en los hogares del municipio. ste
comprende dos pueblos, A y B, y un rea rural. El pueblo A circunda una fbrica y los
hogares son de trabajadores con nios en edad escolar. El B es un suburbio de una ciudad
vecina con muchos jubilados y pocos nios. El A tiene 155 hogares, el B tiene 62 y el rea
rural 93. Una encuesta previa sugiere que las varianzas de los estratos son
2
2
2
1 25, 2 225, 3 100. Estimar la media poblacional seleccionando el tamao
de muestra en cada estrato para cometer un error de estimacin inferior a 2 horas con una
confianza del 95% y unas fracciones de tamaos muestrales w i 13 ; i 1, 2, 3.
Si ademas se sabe que el coste por observacin en cada pueblo es de 9 euros y en el rea
rural de 16 euros, encontrar los tamaos de muestra que permitan estimar a la empresa, con
un coste mnimo, el tiempo medio que se ve la televisin.

6.- Comparaciones en la precisin de los


estimadores.
i) Consideremos muestreo aleatorio con reemplazamiento en cada estrato:
L
2
Afijacin Proporcional

Var stcon
Whn h

Var con

2
n

h1
L
Afijacin Proporcional

W h 2h
n

h1

W h y h y 2
n

h1

ii) Consideremos m.a.s. en cada estrato:


L
Afijacin Proporcional 1f
Var st

W h 2
h
n
h1
2

Var 1 f n

Afijacin Proporcional

Var st

1f
nN1

N h y h y
h1

1
N

N
h1

Conclusiones:
a) Si las medias de los estratos son iguales o casi iguales, puede ocurrir que el diseo
estratificado con afijacin proporcional de resultados menos precisos que m.a.s. Qu
pasa si y h y h?.
b) La afijacin de mnima varianza siempre proporciona un estimador ms preciso que
la afijacin proporcional; si h h, coinciden los errores de muestreo.

7.- Ejercicios.
7.1 El servicio cultural de la Junta de Castilla y Len desea conocer qu servicio prestan las
bibliotecas existentes en la Comunidad y la utilizacin que de ellas hacen los ciudadanos.
Por ello, de las N217 bibliotecas existentes (N 1 131 pblicas y N 2 86 privadas) se
elige en cada estrato, cada semana y de forma aleatoria, a una de ellas y se anota el nmero
de libros prestados en dicha semana. Se observa que al final del ao se prestaron un total de
11.360 libros en las 52 bibliotecas pblicas seleccionadas y 14.413 libros en las respectivas
bibliotecas privadas. Las respectivas variabilidades muestrales fueron, en las bibliotecas
2
pblicas, s 2
1 1.415,2 y en las privadas s 2 12.978,5
a) Es el muestreo en cada estrato con o sin reposicin?.
b) Determinar el nmero promedio estimado de libros que presta una biblioteca
Castellano-Leonesa en una semana. Hallar un intervalo de confianza del 95%. ( ).
c) La Junta desea tambin conocer cul es la proporcin de bibliotecas que prestan en
promedio ms de 300 libros por semana. En las pblicas, slo 8 de las 52 bibliotecas
prestaron en la semana observada ms de 300 libros, mientras que 29 bibliotecas privadas
sobrepasaron esta cifra. Dar una estimacin del porcentaje de bibliotecas que en promedio
prestan ms de 300 libros por semana y hallar la varianza estimada correspondiente.
Solucin:
a) El muestreo debe ser con reposicin.
2

11360
86 14413
217
241. 7;
b) st W h y h 131
217
52
52
h1

Var st

W 2h
nh

S 2
h 49. 12

h1

Intervalo de confianza del 95% 241. 7 1. 96 49. 12 .


2

P st W h P h

c)

131 8
217 52

86 24
217 52

0. 314;

h1
2

VarP st

W 2h
n h 1

Ph

1 P h

0. 0017.

h1

Intervalo de confianza del 95% 0. 314 1. 96 0017 .


7.2 Una escuela desea estimar la calificacin promedio que puede ser obtenida en un
examen de comprensin de lectura por estudiantes de 6 de E.G.B. Los alumnos de la
escuela son agrupados en 3 estratos, los que aprenden rpido en el estrato I, los que
aprenden lento en el estrato III y el resto en el estrato II. La escuela decide esta
estratificacin porque de esta manera se reduce la variabilidad en las calificaciones del
examen. El 6 curso de E.G.B. contiene 55 alumnos en el estrato I, 80 en el estrato II y 65
en el estrato III. El examen se aplica a la muestra de 50 alumnos utilizando afijacin
proporcional, y se obtienen los siguientes resultados:
Estrato I Estrato II Estrato III
yi :

79.71

64.75

37.44

s 2
105.14
158.2
186.13
i :
a) Estimar la calificacin promedio para este curso.
b) Habra sido conveniente utilizar afijacin de mnima varianza?.
c) Encontrar el tamao de muestra requerido para estimar la calificacin promedio, con un
lmite de 3.92 puntos para el error de estimacin (con una confianza del 95%). Usar

asignacin proporcional.
d) Repetir el apartado c) usando ahora la asignacin de mnima varianza. Comparar los
resultados con los del apartado c).
Solucin:
n 1 13. 75 14
Ni
Afijacin proporcional n i 50 N
n 2 20 20
n 3 16. 25 16
3

h1
3

h1

a) Estimadores: st W h h ; Var st

W 2h 1f h
nh

S 2
h / Wh

Nh
N

Estimaciones: st W h y h 59. 98; Var st 2. 28; B 1. 96 2. 28 2. 96


h1

Intervalo de confianza del 95% 59. 98 2. 96


b) Para resolver esta cuestin lo que se debera hacer es un contraste de homogeneidad de
las varianzas entre estratos. Si no la respuesta se basa en la comparacin visual de
s 2
i :105.14, 158.2, 186.13.
c) Afijacin proporcional w h nnh NNh W h / h 1, 2, 3;
L

Wwhh 2h
Como el parmetro de inters es n

h1
L

B2
K2

W2
h
2
h N
h

Wh 2h

B2
K2

h1

n 1 33

55
200

estimacin

h1

W2
h
2
h N
h

32. 05 33

h1

n 2 13
n 3 11

d) Afijacin de mnima varianza implica estimar w h

nh
n

parmetro

de

inters

es

w 2 0. 41

N h h
L

el

h1

Como

w 1 0. 23

N h h

W2
h
wh

w 3 0. 36
2
h

h1
L

B2
K2

2h WNhh

31. 7 32

h1

n 1 33 w 1 7
n 2 13 w 2 13
n 3 11 w 3 12
7.3 Una empresa de publicidad desea determinar cunto debe emplear en publicidad
televisiva en un municipio, para lo que decide realizar una encuesta para estimar el nmero
medio de horas semanales que se ve la televisin en los hogares del municipio. ste
comprende dos pueblos, A y B, y un rea rural. El pueblo A circunda una fbrica y los
hogares son de trabajadores con nios en edad escolar. El B es un suburbio de una ciudad
vecina con muchos jubilados y pocos nios. El A tiene 155 hogares, B 62 y el rea rural 93.
Una encuesta previa sugiere que las varianzas de los estratos son
2
2
2
1 25, 2 225, 3 100. Estimar la media poblacional seleccionando el tamao
de muestra en cada estrato para cometer un error de estimacin inferior a 2 horas con una
confianza del 95% y unas fracciones de tamaos muestrales w i 13 ; i 1, 2, 3.

Solucin:
L

Nwhh 2h
Frmula

general

h1

L 3; w i 13
N 3 93 n

B2
K2

En

este

caso

2
h Nh

h1

; 2
2
2
N 1 155,
1 25,
2 225,
3 100,
i1,2,3
6991.275
56. 7, es decir n57n i n w i 19; i 1, 2, 3
123.225

. N 2 62,

8.- Programas.
Obtencin del tamao de muestra fijado un error de estimacin B
y una confianza k:
Programa estranp.m:
Permite obtener el tamao de muestra n fijado el error de estimacin, por ejemplo B 0. 05
y la confianza, por ejemplo k 1. 96. El diseo considerado es muestreo estratificado con
L estratos y m.a.s. en cada estrato. Se supone que la afijacin es proporcional. El objetivo
es estimar una proporcin poblacional P.
function [n, nh]estranp(B,k,Ni)
Lmax(size(Ni))
Ni2Ni-1
Ni3Ni./Ni2
Nsum(Ni)
WiNi/N
aux1Wi.*Ni3*0.25
n0.25*sum(aux1)/((B^2/k^2)0.25*(sum(aux1)/N))
nhn*Wi

Resolucin con MATLAB del ejercico 7.1:


Programa estra71.m:
%Datos:
%Tamaos de los estratos [Bibliotecas Pblicas, Privadas]
Ni[131 86]
%Tamaos de muestra [Bibliotecas Pblicas, Privadas]
ni[52 52]
%Total de libros prestados [Bibliotecas Pblicas, Privadas]
ti[11360 14413]
%Cuasiarianzas muestrales
si2[1415.2 12978.5]
%Solucion apartado b)
%Nmero medio de libros prestado por semana
muiti./ni
%Pesos relativos de los estratos
Nsum(Ni)
WiNi/N
%Estimacin de la media
muestsum(Wi.*mui)
%Estimacin del error de muestreo
Wi2Wi.^2
varmusum((Wi2.*si2)./ni)

errormusqrt(varmu)
%Intervalo de confianza del 95%
icmu[muest-1.96*errormu, muest1.96*errormu]
%Solucion apartado c)
%Numero de semanas que prestan mas de 300 libros [Bibliotecas Pblicas, Privadas]
Ai[8 29]
PiAi./ni
%Estimacin de la proporcion
Pestsum(Wi.*Pi)
%Estimacion del error de muestreo
sp2Pi.*(1-Pi)
varpsum((Wi2.*sp2)./(ni-1))
errorpsqrt(varp)
%Intervalo de confianza del 95%
icp[Pest-1.96*errorp, Pest1.96*errorp]

También podría gustarte