Unidad 4.

130
Unidad 4. Muestreo Estratificado.
UNIDAD 4
MUESTREO ESTRATIFICADO
4.1. Introducción.
Recordemos que uno de los principales problemas que se presentan en el muestreo y

estimación sobre poblaciones finitas es controlar el error de muestreo de forma
que no se sea muy elevada. Pero ¿Qué origina el error de muestreo?
Uno de los factores que más influyen en el error de muestreo es la variabilidad de la

variable de estudio sobre la población. Por ejemplo, para el muestreo aleatorio
simple sin reposición, recordemos que la varianza del estimador de la media
poblacional es:

2
V Y   1  f  Y
S
  n
Se ve claramente que a mayor variabilidad de la variable Y mayor varianza de la

estimación, es decir, más error de muestreo. Esto nos dice que, en términos
generales, cuanto más homogénea sea la población en relación a la variable de
estudio, menos error de muestreo presentarán las estimaciones.
El muestreo estratificado se basa en esta idea, es decir, intentar homogeneizar la

población dividiéndola en partes o estratos con poca variabilidad interna. Por
ejemplo, en una estimación de la estatura media de una población, podríamos dividir
está en tres estratos formados respectivamente por las personas más bajas, las de
estatura media, y las más altas. De esta forma, hemos conseguido tres grupos o
subpoblaciones con más homogeneidad interna que la población primitiva. La forma
en la que esto será usado adecuadamente, y sus ventajas reales son asuntos que se
verán en el desarrollo de esta unidad.
En general, la Estadística emplea la homogeneización por subconjuntos o bloques

para obtener mayor precisión en sus estudios. Esta técnica se puede aplicar al
muestreo de poblaciones finitas, pues si muestreamos en una población muy
heterogénea, se necesita un gran esfuerzo muestral para obtener cierta precisión,
mientras que si la población está dividida en subconjuntos, bloques o estratos,
internamente homogéneos, el esfuerzo en cada grupo será menor, pudiendo resultar
globalmente en un esfuerzo menor.
4.2. Concepto de muestreo estratificado.
Supongamos que la población objetivo de estudio, formada por N unidades

elementales, se divide en L subpoblaciones o estratos, los cuales constituyen una
partición, es decir, no se solapan y la unión de todos ellos es el total.
131
De forma más precisa podemos decir que en el muestreo estratificado, una población
heterogénea con N unidades  u i  i  1, 2, ,N se subdivide en L subpoblaciones lo más
homogéneas posibles no solapadas de tamaños N1, N2,…, NL . , denominadas estratos
u h i  hi 11,, 22,, ,, LNh .
La muestra estratificada de tamaño n se obtiene seleccionando n h elementos (h = 1, 2,

…, L) de cada uno de los L estratos en que se subdivide la población de forma
independiente. Si en cada estrato se selecciona una muestra aleatoria simple y de
forma independiente, el muestreo se denomina muestreo aleatorio estratificado,
pero en general nada impide utilizar diferentes tipos de selección en cada estrato. Si
el muestreo aleatorio en cada estrato es sin reposición, el muestreo estratificado es
sin reposición, y si el muestreo aleatorio en cada estrato es con reposición, el
muestreo estratificado es con reposición.
La figura 4.1 muestra la representación gráfica de la población dividida en h estratos

de tamaño N h , en cada uno de los cuales elegimos de modo independiente n h
unidades (mediante muestreo aleatorio simple si no se especifica otra cosa) para la
muestra estratificada de tamaño n.
Figura 4.1.
Podemos expresar de manera esquemática la formación de estratos en la población y

la formación de la muestra estratificada de la forma siguiente:
Figura 4.2.
132
El objetivo básico del muestreo estratificado es la obtención de estimaciones más

precisas que las que se obtendrían mediante muestreo no estratificado. Puesto que, en
términos generales, las estimaciones son más precisas conforme la población es más
homogénea en relación a la variable de estudio, como idea genérica podemos
conjeturar que para que el muestreo estratificado cumpla dicho objetivo básico, la
división en estrato debería llevarse a cabo de manera que estos sean, lo más
homogéneos posible entre sus elementos.
Al realizar el muestreo estratificado, obtendremos también, como resultados

colaterales, estimaciones en cada estrato lo cual siempre es interesante, pero
recuérdese que este NO es el objetivo de dicho tipo de muestreo.
4.3. Razones para el uso de muestreo estratificado.
Son diversos los motivos que aconsejan efectuar una partición de la población en L
estratos, no solapados, entre los que destacan los siguientes:
1. El muestreo estratificado puede aportar información más precisa de algunas

subpoblaciones que varían bastante en tamaño y propiedades entre sí, pero que
son homogéneas dentro de sí.
2. El uso adecuado del muestreo estratificado puede generar ganancia en

precisión, pues al dividir una población heterogénea en estratos homogéneos, el
muestreo en estos estratos tiene poco error debido precisamente a la
homogeneidad. El error total derivado del muestreo en todos los estratos se
observa que es menor que en el caso de no estratificar la población.
3. Conveniencia de tipo administrativo también puede ser razón suficiente para

utilizar muestreo estratificado. Por ejemplo, en el caso de la aplicación de una
encuesta a organismos que disponen de sucursales en distintos puntos del país,
cada una de las cuales supervisaría la encuesta en su correspondiente estrato
poblacional, con el consiguiente ahorro en costos de organización,
desplazamientos, etc.
4. En ciertos casos el simple orden en que aparecen las unidades ui en la

población marco implica una estratificación. Por ejemplo, la disponibilidad de
listas censales ordenadas por zonas censales lleva considerar como estratos
dichas zonas.
5. Hay casos en que la estratificación viene motivada por el requerimiento de

estimaciones para ciertas áreas o regiones geográficas. En esta situación cada
estrato será un área compacta, como por ejemplo un municipio, una provincia,
un distrito de una cuidad, etc.
6. Una razón para utilizar muestreo estratificado es cuando existe una variable
precisa para la estratificación cuyos valores permitirán dividir
convenientemente la población en estratos homogéneos. Las variables utilizadas
para la estratificación deberán estar correlacionadas con las variables objeto de
la investigación. La estratificación se realiza de acuerdo a ciertos criterios que
suelen venir definidos por los valores de determinadas variables llamadas
variables de estratificación. Por ejemplo, si se quiere estudiar el volumen de
133
negocio de los establecimientos de ventas al público de una cuidad se puede

utilizar como variable de estratificación su número de empleados, y clasificar
(estratificar) los establecimientos en grandes superficies, supermercados, tiendas
grandes, tiendas pequeñas, minimercardos y otros, según el número de
empleados, resultando así una división de los establecimientos en grupos
homogéneos. Si se quiere estudiar características de hospitales se puede utilizar
la variable de estratificación número de pacientes, para estratificarlos en grandes
hospitales, hospitales medios y hospitales pequeños, resultando así grupos de
hospitales con problemática similar. Para realizar estadísticas en el sector
educativo puede utilizarse la variable de estratificación nivel de enseñanza,
tomando como estratos los niveles de enseñanza inicial, enseñanza primaria,
enseñanza secundaria, enseñanza superior no universitaria y enseñanza
universitaria (cada estrato tiene así unas características muy peculiares que lo
hacen homogéneo). Para realizar estadísticas sobre los ingresos de las familias
en una cuidad puede estratificarse según los valores de la variable cualificación
profesional de los cabezas de sus componentes (a más cualificación
normalmente hay más ingresos, con lo que los estratos resultarán homogéneos).
7. Los criterios de estratificación, su número y el de estratos dependen de los

objetivos concretos de cada caso, de la información disponible y de la estructura
de la población. Un criterio obvio es formar un estrato con las unidades que por
su importancia deben figurar con certeza en la muestra. A estas unidades se les
denomina autorrepresentadas. Por otro lado, si nos conformamos con la
presencia en la muestra con certeza de alguna unidad perteneciente a un grupo,
llamaremos a éste correpresentado. En cuanto al número de estratos, un
número moderado de ellos y de criterios de estratificación puede ser suficiente
para obtener una ganancia en precisión adecuada. Ésta, en general, es
decreciente al aumentar el número de estratos.
4.4. Muestreo Estratificado sin reposición.
Vamos a considerar que seleccionamos o elegimos en cada estrato las unidades para
la muestra mediante muestreo aleatorio simple sin reposición y que la selección se
realiza de forma independiente en cada estrato.
4.4.1. Estimadores lineales insesgados en muestreo aleatorio estratificado sin

reposición.
En muestreo estratificado un parámetro poblacional puede escribirse como:
L Nh
θ   X hi (4.1)
h 1 i 1
El parámetro θ puede ser estimado mediante la suma extendida a todos los estratos de
los estimadores lineales insesgados de Horvitz y Thompson en cada estrato, es decir
mediante el estimador:
 L nh
Xh i
θ   (4.2)
h 1 i 1 π h i
134
~
donde π h i es la probabilidad de que la unidad u h i pertenezca a la muestra (Yh ) de
n h unidades, obtenida de entre las N h unidades del estrato h-ésimo.

La insesgadez del estimador θ se puede probar introduciendo la variable auxiliar e h i
definida como:
 ~ ) con probabilidad n
 1 si u h i  (Y πh i  h

h
Nh
eh i  
0 si u h i  (Y~ ) con probabilidad 1  π  1  n h


h hi
Nh
 L nh
Sea θ   w h i X h i un estimador lineal insesgado del parámetro poblacional:
h i
L Nh
θ   X hi
h 1 i 1
Se tiene:
  L nh   L Nh  L Nh
E(θ)  E  w h i X h i   E  w h i X h i e h i    w h i X h i E(e h i ) 
 h 1 i 1   h 1 i 1  h 1 i 1
L Nh L Nh
1
  w h i X h i π h i 
  X hi  w h i Xh i πh i  Xh i  w h i 
h 1 i 1
  h 1 i 1
 πh i

Por insegadez
θ
E (θ )
L Nh
Con lo que el estimador lineal insesgado para el parámetro θ   X hi es:
h 1 i 1
 L nh L nh
Xh i
θ   w h i X h i  
h 1 i 1 h 1 i 1 π h i
La aplicación de este estimador general de Horvitz y Thompson a las estimaciones

del total, media, proporción y total de clase es inmediata teniendo presente que
n
πh i  h .
Nh
Obtendremos:
 L nh
Yh i L nh
Y L
1 nh
Total θ  Y  X h i  Yh i  Y st     h i   N h Y hi
h 1 i 1 π h i h 1 i 1
n h h 1 nh i 1
Nh
L  L L 
  N h Y h  N h y h  Y h
h 1 h 1 h 1
135
El estimador del total poblacional en muestreo estratificado aleatorio es la suma de

los estimadores del total en cada estrato.
Yh i
 nh
Yh i L L
1 nh Y
Media θ  Y  Xh i   Y st   N    h i 
h 1 i 1 π h i
N h 1 N i 1
nh
Nh
L nh L nh L
N 1 1
 h  Yh i   Wh Y hi   Wh y h
h 1 N n h i 1 h 1 nh i 1 h 1
El estimador de la media poblacional es la media ponderada de los estimadores de la

media en cada estrato, siendo los coeficientes de ponderación Wh  N h / N que
cumplen:
L
L
N L N h
N

h 1
Wh   h 
h 1 N
h 1
N

N
1
 L nh
Ah i L nh
A
Total de clase θ  A  X h i  A h i  A st     h i
h 1 i 1 π h i h 1 i 1
nh
Nh
1L nh L  L 
  Nh A hi   N h P h  A h
h 1 nh i 1 h 1 h 1
El estimador del total de clase poblacional es la suma de los estimadores del total de
clase en cada estrato.
Ah i  L
1 nh A h i L
1 nh A h i
Proporción θ  P  Xh i   P st       nh
N h 1 N i 1 π h i h 1 N i 1
Nh
L
Nh 1 nh L
1 nh L 
  A h i   Wh  A h i   Wh p h
h 1 N n h i 1 h 1 nh i 1 h 1
El estimador de la proporción poblacional es la media ponderada de los estimadores

de la proporción en cada estrato, siendo los coeficientes de ponderación Wh  N h / N
de suma unitaria.
4.4.2. Varianza de los estimadores.


La varianza del estimador Y st es igual a la suma de las varianzas de las estimaciones
de los totales en cada estrato, ya que el muestreo sin reposición (que supondremos)
se realiza de forma independiente en los distintos estratos.
136
  L   L  L
S2
V( Y st )  V  Y h    V(Y h )  N 2h (1  f h ) h (4.3)
 h 1  h 1 h 1 nh
De manera similar se obtendrían las varianzas para los estimadores de la media, el

total de clase y la proporción.

 L  L L
S2
V( Y st )  V( y st )  V  Wh y h    Wh2 V( y h )  Wh2 (1  f h ) h (4.4)
 h 1  h 1 h 1 nh
  L   L  L
N h Ph Q h
V( A st )  V  A h    V(A h )  N 2h (1  f h ) (4.5)
 h 1  h 1 h 1 Nh  1 n h
  L   L  L
N h Ph Q h
V( P st )  V  Wh P h    Wh2 V(P h )   Wh2 (1  f h ) (4.6)
 h 1  h 1 h 1 Nh  1 n h
4.4.3. Estimación de Varianza de los estimadores.
De la unidad 3 sabemos que en el estrato h-ésimo la cuasivarianza muestral es:
nh  1 
2 nh nh
1 nh  2
Sh  
n h  1 i 1
(Yh i  y h ) 2  
n h  1  n h

i 1
(Yhi  y h ) 2
 
 n h  1
σh (4.7)
es un estimador insesgado de la cuasivarianza poblacional:
1 Nh Nh  1 Nh
 Nh
S 
2

N h  1 i 1
(Yh i  Y h ) 2  
Nh  1  Nh
 (Y  Yh )2   σ 2h (4.8)
 Nh  1
h hi
i 1
También sabemos de la unidad 3 que en el caso de proporciones las cuasivarianzas

muestrales y poblacionales para los estratos son respectivamente:
2 nh   Nh
Sh  Ph Qh , S2h  Ph Q h (4.9)
n h 1 Nh  1
2 nh   Nh
con lo que Sh  P h Q h es un estimador insesgado para S2h  Ph Q h
n h 1 Nh  1
Si Sustituimos en las expresiones de las varianzas de los estimadores cada término

por su estimador insesgado, se obtienen los siguientes estimadores insesgados para
las varianzas de los estimadores.
2
  L
Sh
V(Y st )   N 2h (1  f h ) (4.10)
h 1 nh
137
2
  L
Sh
V(Y st )   Wh2 (1  f h ) (4.11)
h 1 nh
   
  L
n Ph Qh L
Ph Qh
V(A st )   N (1  f h ) h
2
  N 2h (1  f h ) (4.12)
n h 1 n h n h 1
h
h 1 h 1
 
  L
P h Qh
V(P st )   W (1  f h ) 2
(4.13)
nh 1
h
h 1
4.4.4. Afijación de la muestra.
Se llama afijación de la muestra al reparto, asignación, adjudicación, adscripción o

distribución del tamaño muestral n entre los diferentes estratos. Esto es, a la
determinación de los valores de n h que verifiquen n1  n 2    n L  n . Pueden
establecerse muchas afijaciones o maneras de repartir la muestra entre los estratos,
pero lo más importantes son: la afijación uniforme, la afijación proporcional, la
afijación de varianza mínima y la afijación óptima.
4.4.4.1. Afijación uniforme.
Consiste en asignar el mismo número de unidades muestrales a cada estrato, con lo

que se tomarán todos los n h iguales de tamaño a n / L, aumentando o disminuyendo
este tamaño en una unidad si n no fuese múltiplo de L, esto es n h  E(n / L)  1 , donde
E denota la parte entera.
L L
nh k
n h  k  h  1, , L   n h   k  n  Lk  f h  
h 1 h 1 Nh Nh
Para este tipo de afijación, las varianzas de los estimadores serán:
 L
k S2h
V( Y st )   N 2h (1  ) (4.14)
h 1 Nh k
L
k S2h
V( y st )   Wh2 (1  ) (4.15)
h 1 Nh k
 L
k N h Ph Q h
V( A st )   N 2h (1  ) (4.16)
h 1 N h N h 1 k
 L
k N h Ph Q h
V( P st )   Wh2 (1  ) (4.17)
h 1 Nh Nh  1 k
Este tipo de afijación da la misma importancia a todos los estratos, en cuanto a

tamaño de la muestra, con lo cual favorecerá a los estratos de menor tamaño y
138
perjudicará a los grandes en cuanto a precisión. Sólo es conveniente en poblaciones

con estratos de tamaño similar.
4.4.4.2 Afijación proporcional.
Consiste en asignar a cada estrato un número de unidades muestrales

n h proporcional a su tamaño N h . Las n unidades de la muestra se distribuyen
proporcionalmente a los tamaños de los estratos, expresados en número de unidades.
L L L
n
n h  Nh k  n   N
h 1
h
h 1
h k  k N h  n  k N  k 
h 1 N
f
nh N k Nh n h / k n h
fh   h kf Wh   
Nh Nh N n/k n
La expresión para n h resulta: n h  n  Wh (4.18)
A la vista de los resultados anteriores podemos asegurar lo siguiente:
- Las fracciones de muestreo en los estratos son iguales y coinciden con la fracción
global de muestreo f, siendo su valor la constante de proporcionalidad.
- Los coeficientes de ponderación W h se obtienen también a partir de la muestra,

pues para su cálculo son necesarios valores muestrales n h y n.
- Todas las unidades de la población tienen la misma probabilidad de aparecer en la

muestra de n unidades, es decir, estamos en el caso de muestras autoponderadas
ya que:
n
πh i  h  k  f
Nh
 L
S2h L
S2 (1  k ) L
V( Y st )   N 2h (1  f h )   N 2h (1  k ) h   N h S2h (4.19)
h 1 n h h 1 k Nh k h 1
L
S2h L
n2 S2 (1  k ) L n h 2 (1  k ) L
V( y st )   Wh2 (1  f h )   h2 (1  k ) h   Sh  n  Wh S2h
h 1 n h h 1 n nh n h 1 n h 1
(4.20)
 L
N h Ph Q h L 2 N h Ph Q h (1  k ) L N 2h
V( A st )   N 2h (1  f h )   N h (1  k )   Ph Q h
h 1 Nh 1 n h h 1 Nh 1 k Nh k h 1 N h  1
(4.21)
 L
N h Ph Q h L 2 N h Ph Q h (1  k ) L 2 Ph Q h
V( P st )   Wh2 (1  f h )   Wh (1  k )   Wh N  1
h 1 Nh 1 n h h 1 Nh 1 k Nh k h 1 h
(4.22)
139
4.4.4.3. Afijación de mínima varianza o afijación de Neyman.
La afijación de mínima varianza o afijación de Neyman consiste en determinar los

valores de n h de forma que para un tamaño de muestra fijo igual a n la varianza de
los estimadores sea mínima.
En el caso de considerar el estimador de la media, el problema consiste en hacer

L
mínima la expresión V( yst ) bajo la condición n
h 1
h n.
La expresión para n h es:
Nh
Sh
N h Sh N WS
nh  n  L  n L  n L h h (4.23)
Nn

h 1
N n Sh 
h 1 N
Sh 
h 1
Wn Sh
Los valores de n h para la estimación de la media van a coinciden con los valores del
estimador del total en afijación de mínima varianza.
Vemos que los valores de n h son proporcionales a los productos N hSh y en el

supuesto de que Sh  S ,  h  1, 2, , L esta afijación de mínima varianza coincidirá
con la proporcional, tal y como se demuestra a continuación:
N hS Nh Nh n
Sh  S  n h  n  L
 n L
 n  Wh  n  k  N h , con k 
N S N
N N
n n
h 1 h 1
La utilidad de esta afijación es mayor si hay grandes diferencias en la variabilidad de

los estratos. En otro caso, la mayor sencillez y autoponderación de la afijación
proporcional hacen preferible el empleo de ésta.
Valor de la varianza mínima.
Una vez calculados los valores de n h para afijación de mínima varianza, vamos a ver
cuánto vale la varianza del estimador de la media y del total para este tipo de
afijación. Tenemos:
L
n h S2h L
2 Sh
2 L
S2h
V( y st )   W (1 
2
h )   Wh   Wh 
h 1 N h n h h 1 n h h 1 N
L
S2h L
S2h L
Wh Sh 1 L
  Wh2   Wh    Wh S2h
Wh Sh N h 1 1 N h 1
h 1
n L
h 1
n L
 WnSh
h 1
W S
h 1
n h
140
2
1 L  1 L
   Wh Sh    Wh S2h
n  h 1  N h 1
2
1 L  1 L
 V( y st )    Wh Sh    Wh S2h (4.24)
n  h 1  N h 1
 L
n h S2h L
S2 L
V( Y st )   N 2h (1  )   N 2h h   N h S2h 
h 1 N h n h h 1 n h h 1
L
S2h L L
N h Sh L
  N 2h   N h S2h    N h S2h
N h Sh 1
h 1
n L
h 1 h 1
n L
h 1
N S
h 1
n h N S
h 1
n h
2
 1 L  L
 V( Y st )    N h Sh    N h S2h (4.25)
n  h 1  h 1
Si se quiere afijación de mínima varianza y la expresión de la varianza mínima para

el estimador de la proporción y para el estimador del total de clase basta sustituir en
Nh
las formulas anteriores S2h por Ph Q h .
Nh  1
Nh Nh
Nh Ph Q h Wh Ph Q h
N h Sh N h 1 N h 1
nh  n  L
 n L
 n L
(4.26)
N S
Nh Nh
h 1
n h N
h 1
h
N h 1
Ph Q h W
h 1
h
N h 1
Ph Q h
2
 1 L Nh  L
  1  Wh N h Ph Q h
V( Pst )    Wh Ph Q  N h 1 (4.27)
n  h 1 Nh 1  Nh 1
2
 1 L Nh  1 L Nh
V( A st )    N h Ph Q    N h Ph Q h (4.28)
n  h 1 Nh  1  N h 1 Nh 1
4.4.4.4. Afijación óptima.
La afijación óptima consiste en determinar los valores de n h de forma que para un

costo fijo C la varianza de los estimadores sea mínima. El costo fijo C será la suma
de los costos derivados de la selección de las unidades muestrales de los estratos, es
decir, si c h es el costo por unidad de muestreo en el estrato h, el costo total de
selección de las n h unidades muestrales en ese estrato será c h n h . Sumando los
141
costos n h para los L estratos tenemos el costo total de selección de la muestra

estratificada.
Si consideramos en este caso el estimador de la media, el problema consiste en hacer
L
mínima la expresión V( yst ) bajo la condición c n
h 1
h n C.
Podemos escribir que:
N h Sh / c h Wh Sh / c h
nh  n  L
 n L
(4.29)
N S
h 1
n h / ch W S
h 1
n h / ch
Vemos que los valores de n h son proporcionales a los productos N h Sh / c h y en el

supuesto de que c h  c ,  h  1, 2, , L (costo constante en todos los estratos) la
afijación óptima coincide con la de mínima varianza, y si además Sh  S ,
 h  1, 2, , L la afijación óptima coincidirá con la de mínima varianza y con la
proporcional.
Los valores de n h para la estimación de la media coinciden con sus valores para la
estimador del total en afijación óptima. No olvidemos que esta coincidencia también
se daba en afijación de mínima varianza.
Valor de la varianza mínima.
Una vez calculados los valores de n h para afijación óptima, vamos a ver cuánto vale
la varianza del estimador de la media y del total para este tipo de afijación.
Tenemos:
1 L  L  1 L
V( y st )    Wh Sh / c h   Wh Sh c h    Wh S2h (4.30)
n  h 1  h  1  N h 1
 1 L  L  L
V( Y st )    N h Sh / c h   N h Sh c h    N h S2h (4.31)
n  h 1  h  1  h 1
Si se quiere la afijación óptima y la expresión de la varianza mínima para el

estimador de la proporción y para el estimador del total de clase, basta sustituir en
Nh
las formulas anteriores S2h por S2h  Ph Q h .
N h 1
Nh PQ Nh PQ
Nh  h h Wh  h h
N h Sh / c h N h 1 ch N h 1 ch
nh  n  L
 n L
 n L
N S
Nh PQ Nh PQ
h 1
n h / ch  Nh
h 1
 h h
N h 1 ch
W
h 1
h  h h
N h 1 ch
(4.32)
142
2
 1 L Nh  1 L Nh
V( P st )    Wh Ph Q    Wh Ph Q (4.33)
n  h 1 N h 1  N h 1 N h 1
2
 1 L Nh  L
Nh
V( A st )    N h Ph Q    N h Ph Q (4.34)
n  h 1 N h 1  h 1 N h 1
4.4.5. Comparación de eficiencias según los distintos tipos de afijación.
En esta sección veremos una comparación de la conveniencia de los distintos tipos de

afijación en términos de su eficiencia medida a través del error de muestreo, o lo que
es lo mismo, a través de la varianza. Por lo tanto será más eficiente aquel tipo de
afijación que presente menos varianza.
Iniciamos descomponiendo la cuasivarianza poblacional de la siguiente forma:
L N N
1 h
1 L h
S2    (Yhi  Y) 2   (Yhi  Y h  Y h  Y) 2 
N 1 h 1 i 1 N 1 h 1 i 1
 
 
1   L Nh L Nh L Nh 
  hi
N 1  h 1 i 1
( Y  Y h ) 2
   ( Y h  Y ) 2
 2  ( Y  Y h ) ( Y h  Y ) 
 
hi
h 1 i 1 h 1 i 1
 
 0 
 
N N
1 L h 1 L h 1 L
  h i
N 1 h 1 i 1
( Y  Y h ) 2
 
N 1 h 1 i 1
( Y h  Y ) 2
  (N h  1)S2h
N 1 h 1
1 L 1 L 1 L
 
N 1 h 1
N h (Y h  Y ) 2 

N 1  N

N h 1
N h Sh   N h ( Y h  Y ) 2 
2
N h 1
Nh  1  Nh
L
Nh 2 L Nh L L
 Sh   ( Y h  Y ) 2   Wh S2h   Wh ( Y h  Y ) 2
h 1 N h 1 N h 1 h 1
En la expresión anterior para S2 se ha utilizado que las sumas de los productos

L Nh
cruzados valen cero, es decir,  (Y

h 1 i 1
hi  Y h )( Y h  Y ) .
En efecto, tenemos:
L Nh L Nh
 (Yh i  Y h )(Y h  Y )   (Yh i Y h  Yh i Y  Y h  Y h Y ) 

2
h 1 i 1 h 1 i 1
143
 
L  Nh Nh 
   Y h  Yhi  Y Yhi  N h Y h  N h Y h Y 
2
h 1 i i 
     
 Nh Y h Nh Y h 
 
L
  Nh Yh  Nh Yh Y  Nh Yh  Nh Yh Y  0
2 2
h 1
Vamos a realizar las comparaciones de eficiencias a partir de expresión de la

cuasivarianza poblacional S2 recientemente obtenida. Tenemos:
L L
S2 1 L 1 L
S2   Wh S2h   Wh (Y h Y) 2    Wh S2h   Wh (Y h Y) 2
h 1 h 1 n n h 1 n h 1
S2 1  f L 1 f L
(1  f ) 
n n
 Wh S2h   Wh (Y h Y) 2  VMAS ( y) 
 VMEP ( y)
   h 1
  nh 1
 La igualdadse da
si Y h  Y h 1,..,L
VMAS ( y) VMEP ( y) 0
De la expresión anterior, se tiene que el muestreo estratificado con afijación

proporcional es más preciso que el muestreo aleatorio simple, produciéndose la
igualdad de precisiones cuando las medias de los estratos son todas iguales.
Por lo tanto, la ganancia en precisión del muestreo estratificado respecto del

muestreo aleatorio simple será mayor cuanto más distintas entre sí sean las medias de
los estratos; es decir, para que el muestreo estratificado sea preciso es conveniente
que los estratos sean heterogéneos entre sí en media y que constituye una de las
especificaciones clásicas en el muestreo estratificado.
A continuación vamos a comparar las precisiones de la afijación proporcional y la de

mínima varianza. En efecto, tenemos:
1 f L 1 L 2
2
1 L 
VMEP ( y)  VMEMV ( y) 
n
 Wh S    Wh Sh    Wh S2h 
2
h

 n  h 1  N h 1 
h 1
 
1 L 1 L 1 L 2
2
1 L 
  Wh S2h   Wh S2h    Wh Sh    Wh S2h 

n h 1 N h 1  n  h 1  N h 1 
 
2
1 L 1 L  1 L L
  Wh S2h    Wh S2h    Wh ( Sh  S) 
 0 con S   Wh S2h
n h 1 n  h 1  n h 1 La igualdadse da h 1
si Sh S h 1,..,L
Luego: VMEP ( y)  VMEMV ( y)  0  VMEP ( y)  VMEMV ( y)
El muestreo estratificado con afijación de mínima varianza es más preciso que el

muestreo estratificado con afijación proporcional, produciéndose la igualdad de
144
precisiones cuando las cuasidesviaciones típicas de los estratos son todas iguales. Por
tanto, la ganancia en precisión del muestreo estratificado con afijación de mínima
varianza respecto del muestreo estratificado con afijación proporcional será mayor
cuanto más distantes entre sí sean las cuasidesviaciones típicas de los estratos; es
decir, para que el muestreo estratificado sea más preciso es conveniente que los
estratos sean heterogéneos entre sí en desviación típica y que constituye una de las
especificaciones clásicas en el muestreo estratificado.
VMAS ( y )  V) MEP ( y )  VMEMV ( y ) (4.35)
En general el muestreo estratificado con afijación de mínima varianza es más preciso

que el muestreo estratificado con afijación proporcional y que el muestreo aleatorio
simple, siendo además el estratificado con afijación proporcional más preciso que el
aleatorio simple.
Además, cabe mencionar que se produce igualdad de eficiencias entre el muestreo

estratificado de mínima varianza y el muestreo aleatorio simple, cuando las
cuasivarianza y las medias de los estratos son constantes, y se produce la máxima
diferencia de eficiencias cuanto más distantes sean las cuasivarianzas y las medias de
los estratos, es decir, cuanto mayor sea la heterogeneidad entre los estratos, tal como
es lógico en muestreo estratificado.
4.4.6. Tamaño de la muestra.
Vamos a estudiar en esta sección el tamaño de muestra estratificada necesario para

cometer un determinado error de muestreo conocido de antemano. Distinguiremos
los casos de error de muestreo prefijado con y sin coeficiente de confianza adicional
y, además distinguiremos entre los diferentes tipos de afijación de la muestra.

1. Error de muestreo dado e  σ( θ) .
Con afijación proporcional
 Media.
(1  f) L 1
n
L W h S2h
e 2  V( y st )   h h n 
W S 2
 N W S2  n 
h h
1 L
h 1
(4.36)
e   Wh S2h
n h 1 h 1 2
N h 1
 Total.
L
1
n N  N h S2h
 (1  f ) L L
e 2  V( Y st )   N h S2h 
n
N
N h S2h  n  h 1
L
(4.37)
e   Nh S
f h 1 h 1 2 2
h
N h 1
145
 Proporción y total de clase.
Los tamaños de muestra en los casos de la estimación de la proporción y el total de

Nh
clase se calculan sustituyendo S2h por Ph Q h en las formulas (4.36) y (4.37)
Nh  1
respectivamente:
L L
Nh
 Wh S2h h 1
W
Nh  1
Ph Q h
h
n h 1
 (4.38)
1 L 1 L Nh
e   Wh Sh e 2   Wh
2 2
Ph Q h
N h 1 N h 1 Nh  1
L L
Nh
N  N h S2h N  Nh Ph Q h
h 1 N h 1
n h 1
L
 L
(4.39)
Nh
e   N h Sh e 2   N h
2 2
Ph Q h
h 1 h 1 N h 1
Con afijación de mínima varianza.
 Media.
2
 L 
2   Wh Sh 
1 
e 2  V( y st )    Wh Sh    Wh S2h  n   h  1 L 
L L
1
(4.40)
n  h 1  N h 1 1
e 2   Wh S2h
N h 1
 Total.
2
 L 
2   N h Sh 
 1 
e 2  V( Y st )    N h Sh    N h S2h  n   h  1 L 
L L
(4.41)
n  h 1  h 1 e 2   N h S2h
h 1
 Proporción y total de clase

Nh
clase se calculan sustituyendo Sh por Ph Q h en las formulas (4.40) y (4.41)
N h 1
respectivamente:
2
 L 
2
 L Nh 
  Wh Sh    Wh P Q 
 h 1 N  1
h h 
n   h 1 L   n  
h
L
(4.42)
1 1 N
e 2   Wh S2h e 2   Wh h
Ph Q h
N h 1 N h 1 N h 1
146
2
 L 
2
 L Nh 
  N h Sh    Nh P Q 
 h 1 N  1
h h 
n   h 1 L   n 
h
L
(4.43)
N
e 2   N h S2h e2   Nh h
Ph Q h
h 1 h 1 N h 1
Con afijación óptima
 Media.
1 L  L  1 L
e 2  V( y st )    Wh Sh / c h   Wh Sh c h    Wh S2h , despejando n:
n  h 1  h  1  N h 1
 L  L 
  Wh Sh / c h    Wh Sh c h 
n   h 1   h 1
L
 (4.44)
1
e 2   Wh S2h
N h 1
 Total.
 L  L 
  N h Sh / c h    N h Sh c h 
n   h 1 L
  h 1  (4.45)
e 2   N h S2h
h 1

Nh
clase se calculan sustituyendo Sh por Ph Q h en las formulas (4.44) y (4.45)
N h 1
respectivamente:
 L Nh  L Nh 
  Wh Ph Q h / c h    Wh Ph Q h c h 
 h 1 N h 1 N h 1
n L
  h 1  4.46)
1 N
e 2   Wh h
Ph Q h
N h 1 N h 1
 L Nh  L Nh 
  Nh Ph Q h / c h    N h Ph Q h c h 
 h 1 Nh  1 Nh  1
n L
  h 1  (4.47)
N
e2   Nh h
Ph Q h
h 1 Nh  1
147

 σ( θ)
2. Error relativo e r  CV(θ)  
Prefijado.
E(θ)
 Media.
W h S2h
n h 1
(4.48)
1 L
Y e r   Wh S2h
2 2
N h 1
 Total.
L
N  N h S2h
n h 1
L
(4.49)
N Y er   Nh S
2 2 2 2
h
h 1

Nh
clase se calculan sustituyendo S2h por Ph Q h y Y por P en las formulas (4.48)
Nh  1
y (4.49) respectivamente:
L
Nh
h 1
W Nh  1
Ph Q h
h
n (4.50)
1 L Nh
P 2 e r   Wh
2
Ph Q h
N h 1 Nh  1
L
Nh
N  Nh Ph Q h
h 1 N h 1
n L
(4.51)
Nh
N2P2 er   N h
2
Ph Q h
h 1 N h 1
 Media.
2
 L 
  Wh Sh 
n  h 1  (4.52)
1 L
2 2
N h 1
148
 Total.
2
 L 
  N h Sh 
n  h 1  (4.53)
L
N Y er   Nh S
2 2 2 2
h
h 1

Nh
clase se calculan sustituyendo S h por Ph Q h y Y por P en las formulas
Nh  1
(4.40) y (4.41) respectivamente:
2
 L Nh 
  Wh P Q 
 h 1 N  1
h h 
n  
h
L
(4.54)
1 N
P 2 e r   Wh
2 h
Ph Q h
N h 1 Nh  1
2
 L Nh 
  Nh Ph Q h 
 h 1 N h 1 
n   (4.55)
L
Nh
N P er   Nh
2 2 2
Ph Q h
h 1 N h 1
 Media.
 L  L 
  Wh Sh / c h    Wh Sh c h 
n   h 1   h 1  (4.56)
1 L
2 2
N h 1
 Total.
 L  L 
  N h Sh / c h    N h Sh c h 
n   h 1   h 1
L
 (4.57)
Y e   N h S2h
2 2
h 1
 Proporción.
 L Nh  L Nh 
  Wh Ph Q h / c h    Wh Ph Q h c h 
 h 1 N h 1 N h 1
n L
  h 1  (4.58)
1 N
P 2 e r   Wh
2 h
Ph Q h
N h 1 N h 1
149
 Total de clase.
 L Nh  L Nh 
  Nh Ph Q h / c h    N h Ph Q h c h 
 h 1 N h 1 N h 1
n L
  h 1  (4.59)
Nh
P2 er   Nh
2
Ph Q h
h 1 N h 1

3. Error de muestreo y coeficiente de confianza prefijados. e1  Z  / 2 σ( θ )
 Media.
n
1
2 (1  f )
L L
e1  Z  / 2 V( y st )  Z  / 2  Wh S2h  Z  / 2   h h
N W S2 
2 2 2
n h 1 n h 1
Despejando n, resulta:
W
2
Z /2 h S2h
n L
h 1
(4.60)
1
e1  Z  / 2  Wh S2h
2 2
N h 1
 Total.
n
1
 (1  f ) L L
e1  Z  / 2 V( Y st )  Z  / 2  N h Sh  Z  / 2  N
 N h S2h 
2 2 2 2 2
f h 1 n h 1
N
Despejando n, resulta:
L
Z  / 2 N  N h S2h
2
n h 1
L (4.61)
e1  Z  / 2 N
2 2 2
h S h
h 1

clase se calculan sustituyendo S2h por N h Ph Q h en las formulas (4.60) y (4.61)
N h 1
respectivamente:
150
 Proporción.
L
Nh
W
2
Z /2 Ph Q h
Nh  1
h
h 1
n L
(4.62)
1 Nh
e1  Z  / 2  Wh
2 2
Ph Q h
N h 1 Nh  1
 Total de clase.
L
Nh
Z  / 2 N  Nh
2
Ph Q h
h 1 Nh  1
n L
(4.63)
Nh
e1  Z  / 2  N h
2 2
Ph Q h
h 1 Nh  1
 Media.
1 L 2

   W S   1  W S2  
L
e1  Z  / 2 V( y st )  Z  / 2
2 2 2
 n  h 1 h h
 N h 1
h h

 
2
2  
L
Z  / 2   Wh Sh 
n  h 1  (4.64)
L
2 1
e1  Z  / 2 
2
Wh S2h
N h 1
 Total.
1 L 2

   N S    N S2  
 L
e1  Z  / 2 V( Y st )  Z  / 2
2 2 2
 n  h 1 h h  h 1 h h 
 
2
 L 
  N h Sh 
2
Z α/2
n  h 1  (4.65)
L
e1  Z α /2
2 2
N
h 1
h S 2
h
 Proporción
2
 L Nh 
Z  / 2   Wh Ph Q h 
2
 h 1 N h 1 
n L
(4.66)
2 1 Nh
e1  Z  / 2 
2
Wh Ph Q h
N h 1 N h 1
151
 Total de clases
2
 L Nh 
Z α/2
2
 h 1 N h 1 
n   (4.67)
L
Nh
e1  Z α /2 
2 2
Nh Ph Q h
h 1 N h 1
 Media.
2 1  L  1 L 
L
e1  Z  / 2 V( y st )  Z  / 2    Wh Sh / c h   Wh Sh c h    Wh S2h  
2 2
 n  h 1  h  1  N h 1 
2   L 
L
Z  / 2   Wh Sh / c h    Wh Sh c h 
n  h 1   h 1  (4.68)
L
1
e1  Z  / 2
2 2
 Wh S2h
N h 1
 Total.
2   L 
L
Z  / 2   N h Sh / c h    N h Sh c h 
n  h 1   h 1  (4.69)
L
e1  Z  / 2  N h S2h
2 2
h 1
 Proporción.
2   L 
L
Nh Nh
Z  / 2   Wh Ph Q h / c h    Wh Ph Q h c h 
 h 1 Nh  1   h 1 Nh  1 
n L
(4.70)
2 1 Nh
e1  Z  / 2 
2
Wh Ph Q
N h 1 Nh  1
 Total de clase.
2   L 
L
Nh Nh
Z  / 2   N h Ph Q h / c h    N h Ph Q h c h 
 h 1 Nh  1   h 1 Nh  1 
n L
(4.71)
N
e1  Z  / 2  N h
2 2 h
Ph Q
h 1 Nh  1
152
4. Error relativo de muestreo y coeficiente de confianza prefijados.


e r1  Z  / 2 CV( θ )
 Media.
W
2
Z α/2 h S2h
n h 1
(4.72)
1 L
Y e r1  Z α/2 
2 2 2
Wh S2h
N h 1
 Total.
L
Z α/2 N  N h S2h
2
n h 1
L
(4.73)
N Y e r1  Z α/2 N
2 2 2 2 2
h S h
h 1
 Proporción.
L
Nh
h 1
Z α/2
2
N h 1
W
Ph Q h h
n L
(4.74)
2 1 Nh
P 2 e r1  Z α/2 
2
Wh Ph Q h
N h 1 N h 1
 Total de clase.
L
Nh
Z α/2 N  N h
2
Ph Q h
h 1 N h 1
n L
(4.75)
Nh
N P e r1  Z α/2 
2 2 2 2
Nh Ph Q h
h 1 N h 1
 Media.
2
 L 
Z α/2   Wh Sh 
2
n  h 1  (4.76)
L
1
Y e r1  Z α/2 
2 2 2
Wh S2h
N h 1
153
 Total.
2
2  
L
Z α/2   N h Sh 
n  h 1  (4.77)
L
N Y e r1  Z α/2 N
2 2 2 2 2
h S h
h 1
 Proporción.
2
 L Nh 
Z α/2   Wh Ph Q h 
2
 h 1 Nh  1 
n L
(4.78)
2 1 Nh
P 2 e r1  Z α/2
2

N h 1
Wh
Nh  1
Ph Q h
 Total de clase
2
 L Nh 
Z α/2
2
 h 1 Nh  1 
n   (4.79)
L
Nh
N P e r1  Z α/2 
2 2 2 2
Nh Ph Q h
h 1 Nh  1
 Media.
2   L 
L
Z α/2   Wh Sh / c h    Wh Sh c h 
n  h 1   h 1  (4.80)
L
2 1
Y e r1  Z α/2 
2 2
Wh S2h
N h 1
 Total.
2   L 
L
Z α/2   N h Sh / c h    N h Sh c h 
n  h 1   h 1  (4.81)
L
Y e r1  Z α/2  N h S2h
2 2 2
h 1
 Proporción.
2   L 
L
Nh Nh
Z α/2   Wh Ph Q h / c h    Wh Ph Q h c h 
 h 1 N h 1   h 1 N h 1 
n L
(4.82)
1 N
P 2 e r1  Z α/2 
2 2 h
Wh Ph Q h
N h 1 N h 1
154
 Total de clase.
2   L 
L
Nh Nh
Z α/2   N h Ph Q h / c h    N h Ph Q h c h 
 h 1 N h 1   h 1 N h 1 
n L
(4.83)
Nh
P 2 e r1  Z α/2  N h
2 2
Ph Q h
h 1 N h 1
Ejemplo 4.1. Sea Y la variable salario anual en millones de unidades monetarias. Al

medir la variable Y sobre una población de 870 personas se obtiene la siguiente
distribución de frecuentas:
Valores de Y 2 3 4 7 10 12 16 20 25 30 35 50 60 100
Frecuencias (ni) 20 30 60 100 150 200 120 80 50 20 18 10 8 4
Con el objeto de establecer pautas para futuras encuestas de salarios se estratifica la

población en 3 estratos según los criterios dados por 2 ≤ Y ≤ 7, 10 ≤ Y ≤ 25, 30 ≤ Y
≤ 100. Se pide lo siguiente:
a) Suponiendo muestreo sin reposición y para un tamaño de muestra n = 100,
realizar las afijaciones uniformes, proporcional y de mínima varianza. Comentar.
b) Elegir el mejor tipo de afijación justificando la respuesta.
c) Cuantificar la ganancia utilizando el mejor tipo de afijación respecto del
muestreo aleatorio simple sin reposición.
d) Para la misma muestra de tamaño 100 realizar la afijación óptima, siendo los
costos por unidad en cada estrato los siguientes: c 1 = 1, c2 = 16 y c3 = 25.
e) En una encuesta de salarios posterior, ¿qué tamaño de muestra sería necesario
para conseguir un error de muestreo de 0.5 al estimar la media salarial sin
reposición y afijación de mínima varianza.
f) En una encuesta de salarios posterior, ¿qué tamaño de muestra sería necesario
para conseguir un error relativo de muestreo del 15% al 95% de coeficiente de
confianza al estimar el total salarial sin reposición y afijación proporcional.
Solución.
a) Comenzaremos calculando los totales, medias, cuasivarianzas y

cuasidesviaciones típicas (puesto se trata de muestreo sin reposición) de Y en los
estratos definidos.
Tenemos N = 870, N1 = 210, N2 = 600 y N3 = 60. Ahora las cuasivarianzas en los

estratos h = 1, 2, 3, se obtiene aplicando la expresión:
 Nh

1 Nh
1  Nh (  (Yh i n i ) 2 
S2h  
N h  1 i 1
(Yh i  Y h ) 2   Yh i 2 n i  i  1
N h  1  i 1 Nh


 
 
155
 N1

 N1 ( (Y1 i n i ) 2 
1  1  (1070) 2 
S12   1i i  i 1     3.63
2
 210  1  210 
Y n 6210
N1  1  i  1 N1
 
 
 N2

 N2 ( (Y2 i n i ) 2 
1  1  (8670) 2 
S22   2i i  i 1     20.85
2
 600  1  600 
Y n 137770
N 2  1  i 1 N2
 
 
 N3

1 
 N3 (  (Y3 i n i ) 2 
1  (2810) 2 
S32   3i i  i 1     344.32
2
 60  1  60 
Y n 133850
N3 1  i 1 N3
 
 
Luego las cuasidesviaciones típicas tienen los siguientes valores:
S1  1.9 , S2  4.57 y S1  18.56 .
Ahora vamos a realizar las afijaciones uniforme, proporcional y de mínima

varianza y calcular la precisión de la media en dichas afijaciones suponiendo
muestreo sin reposición.
La afijación uniforme consiste en seleccionar en cada estrato el mismo número

de unidades para la muestra. Como hay tres estratos y la muestra es de tamaño
100 elegiremos 33 unidades en dos estratos y 34 en el otro. La varianza del
estimador con afijación uniforme (n1 = 33, n2 = 33, n3 = 34) será:
L
k S2h 3
n S2
V( y st )   Wh2 (1  )   Wh2 (1  h ) h 
h 1 N h k h 1 Nh n h
210 2 33 3.63 600 2 33 20.85 60 2 34 344.32

( ) (1  ) ( ) (1  ) ( ) (1  ) 
870 210 33 870 600 33 870 60 33
= 0.00540 + 0.28398 + 0.02150 = 0.31
La afijación proporcional consiste en seleccionar de cada estrato un número de

elementos para la muestra proporcional al tamaño del estrato. Tenemos:
n h  n  Wh , h = 1, 2, 3 n = 100
210 600 60
n1  100   24 n 2  100   69 n 3  100  7
870 870 870
Se extraerán para la muestra 24 unidades del primer estrato, 69 del segundo y 7

del tercero.
156
(1  k ) L (1  n / N)
VP ( y st )  
n h 1
Wh S2h 
n
 
 W1S12  W2S22  W3S32 
100
(1  )
 870   210  3.63  600  20.85  120  344.32   0.555
100  870 870 870 
N h Sh
Para afijación de mínima varianza se utiliza la expresión n h  n  L
N S
h 1
n h
N1S1 210 1.9 399

n1  100   100   9
N1S1  N 2S2  N 3S3 210 1.9  600  4.57  60 18.56 4254.6
N 2S 2 600  4.57
n 2  100   100   65
N1S1  N 2S2  N 3S3 210 1.9  600  4.57  60 18.56
N 3S3 60 18.56
n 3  100   100   26
N1S1  N 2S2  N 3S3 210 1.9  600  4.57  60 18.56

del tercero. La varianza para afijación de mínima varianza será:
2 2
1 L  1 L 1  210 600 60 
VMV ( y st )    Wh Sh    Wh S2h   1.9   4.57  18.56 
n  h 1  N h 1 100  870 870 870 
1  210 600 60 
   3.63   20.85   344.32   0.2391  0.0448  0.194
870  870 870 870 
b) Recopilando resultados para el muestreo sin reposición se observa que la mejor

afijación es la de varianza mínima, ya que tiene el menor error de muestreo
(menor varianza  menor desviación típica = σ MV ( y st ) ).
c) Para cuantificar la ganancia en precisión de la afijación con mínima varianza

respecto del muestreo aleatorio simple sin reposición, calculamos la varianza de
la media para este último método como sigue:
S2
V( y)  (1  f)
n
2
 14

N 14
  Yi n i 
   Yi  i1  n
1 1
donde : S2  
N 1 i 1
(Yi  Y) 2 
870  1 i  1  870 
i
 
 
157
14
Yn i i
12350
Y i 1
  14.2
870 870
  Yi  Y   n i 
14
1 1
S2   102516.8  117.97
2
870  1 i  1 869
S2 100 117.97
Luego V( y)  (1  f )  (1  )  1.044
n 870 100
Ya podemos cuantificar la ganancia en precisión:
1.044  0.194
G 100  81.4%
1.044
Se observa que la ganancia en precisión es superior para muestreo estratificado

sin reposición.
d) Vamos a considerar afijación óptima en muestreo sin reposición. se utiliza la

expresión:
N h Sh / c h
nh  n  L
N S
h 1
n h / ch
N1S1 / c1 210 1.9 / 1

n1  100   100   31
N1S1 / c1  N 2S2 / c 2  N 3S3 / c h 1307.22
N1S1 / c1 600  4.57 / 16

n 2  100   100   52
N1S1 / c1  N 2S2 / c 2  N 3S3 / c h 1307.22
N1S1 / c1 60 18.56 / 25
n 3  100   100   17
N1S1 / c1  N 2S2 / c 2  N 3S3 / c h 1307.22

del tercero. La varianza para afijación de mínima varianza será:
La varianza de la media bajo esta afijación óptima será:
1 L  L  1 L
V( y st )    Wh Sh / c h   Wh Sh c h    Wh S2h 
n  h 1  h  1  N h 1
1  W1 S1 W2 S2 W3 S3 
100  c1

c2

c 3 

W1 S1 c1  W2 S2 c 2  W3 S3 c 3 
158

1
870

W1 S12  W2 S22  W3 S32  0.2925  0.0369  0.2556
e) En una encuesta de salarios posterior podemos considerar los resultados de la
encuesta actual como valores producidos por una muestra piloto, y podrán ser
utilizados en el cálculo de tamaños muestrales para cometer errores prefijados.
Vamos a hallar el tamaño de muestra necesario para conseguir estimar la media

salarial con un error de muestreo de 0.5 sin reposición y afijación de mínima
varianza.
La expresión (4.40) nos da el tamaño de muestra:

2
 L 
2
 210 
  Wh Sh 
600 60
 1.9   4.57  18.56 
n   h 1 L    870 
870 870
1 1  210 600 60 
e 2   Wh S2h 0.5 2    3.63   20.85   344.32 
N h 1 870  870 870 870 
23.91 23.91
n   81
1 0.2948
0.5 2   39.00
870
f) Vamos a calcular ahora el tamaño de muestra necesario para conseguir un error

relativo de muestreo del 15% al 95% de coeficiente de confianza al estimar el
total salarial sin reposición. Tenemos:
L
N

  (  1) N h S2h
V( Yst ) V( Yst ) n
e r1  Z α/2 CV( Y )  Z α/2  e r1  Z α/2  Z α/2 h 1
2 2 2
2
E(Yst ) Y Y2
donde:
n
(1  )
 (1  k ) L L
N L
V( Y st )   N h S2h 
k h 1 n
N
 N h S2h  (
h 1 n
 1) N h S2h
h 1
N
Luego de la expresión (4.73):
L
Z α/2 N N h S 2h
2
1.96 2  870  54590.7

n h 1
  50
L
12350 2  0.15 2  1.96 2  54590.7
N 2 Y e r1  Z α/2 N
2 2 2
h S 2h
h 1
159
Ejemplo 4.2. Supongamos conocidos los siguientes datos de una población dividida
en tres estratos: S12  9 , S12  225 , S12  1600 , N1 = 1000, N2 = 600, N3 = 200,
C1 = 1000, C2 = 1200 y C3 = 2000. Considerando muestreo sin reposición, se pide:
Determinar el costo de una muestra estratificada que proporciona un error relativo de

5% para estimar la media considerando afijaciones proporcional, de mínima varianza
y óptima respectivamente. Se sabe que Y  22 y que la función de costo es lineal.
Comentar los resultados obtenidos para cada tipo de afijación y justificarlos.
Solución.
Iniciamos recopilando los datos y realizando cálculos necesarios para el problema:
h Nh S2h ShWhch Wh S2h Wh Sh Wh Sh / c h Wh Sh c h

1 1000 0.55 9 3 1000 4.95 1.65 0.052 52.177
2 600 0.33 225 15 1200 74.25 4.95 0.143 171.473
3 200 0.11 1600 40 2000 176 4.4 0.098 196.774
∑ 1800 1.00 255.2 11 0.293 420.424
Vamos a considerar el muestreo sin reposición,
Afijación proporcional
Como el error relativo de muestreo es del 5% tenemos:

   
 
σ( Y)
V( Y) V( Y) V( Y)
e r  CV(Y)        )  1.21
2 2

e r 2
0.05 V( Y
Y Y 22 2
E( Y)
Conocida la varianza ya podemos hallar el tamaño de muestra necesario para

cometer el error de muestreo definido por la misma:
3

(1  f ) L W h S2h
255.2
e 2  V(Y)  V( y st )   Wh S2h  n  h 1
1 3

255.2
 189
 Wh S2h
n h 1 1.21 
e2 
N h 1 1800
Una vez hallado el tamaño de muestra realizamos la afijación como sigue:
n h  n  Wh , h = 1, 2, 3 n = 189
n1  n  W1  189  0.55  104

n 2  n  W2  189  0.33  63
n 3  n  W3  189  0.11  22
El costo de muestreo con afijación proporcional será:

3
C   c h n n = 104×1000 + 63×1200 + 22×2000 = 223600
h 1
160
Afijación de varianza mínima

2
 L 
2   Wh Sh 
1  112
e 2  V( y st )    Wh Sh    Wh S2h  n   h  1 L  
L L
1
n  h 1  N h 1 1 255.2
e 2   Wh S2h 1.21 
N h 1 1800
 n  90
Se observa que se necesita un tamaño de muestra menor que en el caso de la

afijación proporcional, resultando lógico, ya que la afijación de mínima varianza es
más precisa que la proporcional para el mismo error de muestreo. Una vez hallado el
tamaño de la muestra realizamos la afijación de mínima varianza como sigue:
Wh Sh
nh  n  L
W S
h 1
n h
1.65 4.95 4.4

n1  90   14 , n 2  90   40 , n 3  90   36
11 11 11
El costo total de muestreo será: C = 14×1000 + 40×1200 + 36×2000 = 134000, con

lo que tenemos un costo de muestreo inferior al caso de afijación proporcional.
Afijación óptima.
1 L  L  1 L
e 2  V( y st )    Wh Sh / c h   Wh Sh c h    Wh S2h 
n  h 1  h  1  N h 1
 3  3 
  Wh Sh / c h    Wh Sh c h 
n   h 1   h 1   0.293420.424  91
3
1 1
e 2   Wh S2h 1.21   255.2
N h 1 1800
Una vez hallado el tamaño de muestra realizamos la afijación óptima como sigue:
Wh Sh / c h
nh  n  3
W S
h 1
n h / ch
0.052 0.143 0.098

n1  91  16. n 2  91   44 n 3  91  31
0.293 0.293 0.293
El costo total de muestreo será: C = 16×1000 + 44×1200 + 31×2000 = 91200, con lo

que tenemos un costo de muestreo inferior al caso de afijación proporcional y de
afijación de mínima varianza.
161
Ejemplo 4.3. Consideramos un proceso de muestreo estratificado con afijación

óptima en el que se define la función de costo total C de la siguiente forma:
L
C  c0   ch n h
h 1
donde c 0 representa un costo fijo dado y los c h son también conocidos y representan
el costo unitario en el estrato h (h = 1, 2, …, L). Se pide:
a) Realizar la afijación de mínima varianza para un costo total C fijo al estimar la

media poblacional y hallar la expresión general que nos da la varianza mínima.
b) Responder a las preguntas del apartado anterior considerando la extracción de una
muestra estratificada de tamaño 1,000 de una población de tamaño 10, 000 con los
datos que se dan a continuación. Comparar los resultados con los que se
obtendrían para afijación óptima con función de costo lineal y cuantificar la
ganancia en precisión. Comentar los resultados:
Estrato Wh Sh ch
1 0.4 4 1
2 0.3 5 2
3 0.3 6 3
Solución.
a) Minimizaremos la varianza del estimador de la media, con la restricción dada por

el costo total según la función de costo especificada, mediante el problema de
optimización de Lagrange:
L n S2 L
S2 L S2 
mín  Wh2 (1  h ) h   Wh2 h   Wh h 
h  1 N h n h h 1 n h h 1 Nh 
L
c0   ch n h  C
h 1
Este problema se resuelve aplicando el método de los multiplicadores de

Lagrange, considerando la función lagrangiana siguiente:
L
S2h L S2  L

 (n h , λ)   Wh2   Wh h  λ  c 0   c h n h  C 
h 1 n h h 1 N  h 1 
El siguiente paso es derivar la función lagrangiana respecto a sus variables,

igualar a cero y eliminar el parámetro λ .
Tenemos:
 S2 c  L
  Wh2 h   h  0 ( h  1,2,..., L)  C0   c h n h  0
 nh nh 2 nh  h 1
162
2/3
Wh4S4h  Wh2S2h 
 
 c  
2 2 2 2/3
W 4S 4 c 2h  ch 
   h  h4 h        
 2  nh nh 2 n 3h 2
 nh
k
Aplicando las propiedades de las proporciones tenemos:
2/3 2/3 2/3

 Wh2 S2h   Wh2 S2h
L
  Wh2 S2h 
      
c h 
k h 
c h 1  ch  
 L
 nh  n  2/3
 Wh2 S2h 

nh L
h 1

nh

h 1 
 
c h 
n
b) Ahora realizamos la afijación para los datos de nuestro problema.

2/3 2/3 2/3 2/3
3
 Wh2 S2h   0.4 2  4 2   0.32  52   0.32  6 2 
 
c h 
     
2 
     1.87  1.08  1.03  3.98
h 1   1    3 
2/3
 0.4 2  4 2 
 
 n1  1000   1   1000 
1.87
 470
3.98 3.98
1.08 1.03
n 2  1000   271 n 3  1000   259
3.98 3.98
El valor de la varianza mínima resulta ser:

L
S2h n L
S2 L S2 42 52 62
Min V( y st )   Wh2 (1  h )   Wh2 h   Wh h  (0.4) 2   (0.3) 2   (0.3) 2  
h 1 nh N h h 1 n h h 1 N 470 271 259
42 52 62
0.4   0.3   0.3   0.026259  0.00139  0.024869
10000 10000 10000
 Para afijación óptima con función de costos lineales tenemos:
Wh Sh / c h
nh  n  L
W S
h 1
n h / ch
0.4  4 / 1 1.6
n1  1000   1000   432
0.4  4 / 1  0.3  5 / 2  0.3  6 / 3 3.7
1.06 1.04
n 2  1000   287 n 3  1000   281
3.7 3.7
163
El valor de la varianza mínima resulta ser:
L
S2h n L
S2 L S2 42 52 62
Min V( y st )   Wh2 (1  h )   Wh2 h   Wh h  (0.4) 2   (0.3) 2   (0.3) 2  
h 1 nh N h h 1 n h h 1 N 432 287 281
42 52 62
0.4   0.3   0.3   0.025296  0.00139  0.023906
10000 10000 10000
Resulta ligeramente más precisa la afijación óptima con función de costo lineal.
La ganancia en precisión se cuantifica de la siguiente forma:
GP = (0.024869 – 0.023906) / 0.024869 = 0.0387 (3.87%)
4.5. Muestreo Estratificado con reposición.
Se sabe que en el muestreo estratificado una población heterogénea con N unidades

 u i  i  1, 2, ,N se subdivide en L subpoblaciones lo más homogéneas posibles no
solapadas denominadas estratos u h i  hi 11,, 22,, 
, L de tamaños N , N ,…, N .
, Nh 1 2 L
La muestra estratificada de tamaño n se obtiene seleccionando n h elementos (h = 1,

2, …, L) de cada uno de los L estratos en que se subdivide la población de forma
independiente. Si la muestra estratificada se obtiene seleccionando una muestra
aleatoria simple con reposición en cada estrato de forma independiente, el muestreo
se denomina muestreo aleatorio estratificado con reposición. En esta unidad vamos
a considerar el caso de muestreo aleatorio simple con reposición en cada estrato, en
general nada impide utilizar diferentes tipos de selección con reposición en los
estratos, e incluso diferentes tipos de muestreo en cada estrato.
4.5.1. Estimadores lineales insesgados en muestreo aleatorio estratificado con

reposición.
Vamos a considerar que seleccionamos en cada estrato las unidades para la muestra
mediante muestreo aleatorio simple con reposición y que la selección se realiza de
manera independiente en cada estrato. Un estimador de un parámetro poblacional
puede expresarse como suma de las estimaciones para el parámetro en los diferentes
estratos mediante muestreo aleatorio simple con reposición. Cualquier parámetro
poblacional puede expresarse como suma de los valores de la variable en estudio (o
una función lineal suya) sobre las unidades de los estratos.
Consideraremos el parámetro poblacional:

L Nh
θ   X hi (4.84)
h 1 i 1
Que puede ser estimado mediante la suma extendida a todos los estratos de los
estimadores lineales insesgados de Hansen y Hurwitz en cada estrato, es decir
mediante el estimador:
164
 L nh
Xh i
θ   (4.85)
h  1 i  1 n h Ph i
donde Ph i  1/ N h es la probabilidad unitaria de selección de la unidad u h i para la

~
muestra (Yh ) de n h unidades, obtenida de entre las N h unidades del estrato h-
ésimo.
Se observa que la expresión del estimador es la misma con reposición que sin
reposición pues:
 L nh
Xh i L nh
Xh i L nh
X 
θ HH       h i  θ HT (4.86)
h  1 i  1 n h Ph i h 1 i 1
1 h 1 i 1
nh
nh
Nh Nh
Por otra parte, como en todos los estratos se realiza muestreo aleatorio simple con
reposición, el estimador de Hansen y Hurwitz en cada estrato coincide con el
estimador Horwitz y Thompson, con lo que los estimadores en muestreo aleatorio
estratificado con reposición coincidirán con los ya estudiados (en las secciones
anteriores) para el caso de sin reposición.

La insesgadez del estimador θ se puede probar introduciendo la variable auxiliar e h i
definida como el número de veces que la unidad u h i pertenece a la muestra de n h
unidades seleccionada en el estrato h-ésimo. Por su forma de definición la variable
e h i es una binomial de parámetros (n h , Ph i )  (n h ,1/ N h ) cuya valor esperado
(esperanza matemática) es n h Ph i  n h 1/N h  n h /N h .
 L nh
Sea θ   w h i X h i un estimador lineal insesgado del parámetro poblacional:
h i
L Nh
θ   X hi
h 1 i 1
Se tiene:
  L nh   L Nh  L Nh
E(θ)  E  w h i X h i   E  w h i X h i e h i    w h i X h i E(e h i ) 
 h 1 i 1   h 1 i 1  h 1 i 1
L Nh L Nh
1
  w h i X h i n h Ph i 
  X hi  w h i X h i n h Ph i  X h i  w h i 
h 1 i 1
   h 1 i 1
 n h Ph i

Por insegadez
θ
E (θ )
L Nh
Con lo que el estimador lineal insesgado para el parámetro θ   X hi es:
h 1 i 1
 L nh L nh
Xh i L nh
Xh i
θ   w h i X h i    
h 1 i 1 h  1 i  1 n h Ph i h  1 i  1 n h /N h
165
Concluimos que los estimadores lineales insesgados del total, media, total de clase y
proporción serán los mismos en los casos de con reposición y sin reposición.
 L   L  L   L 
Y st   Y h Y st   Wh y h P st   Wh p h A st   A h
h 1 h 1 h 1 h 1
4.5.2. Varianza de los estimadores.


La varianza del estimador Y st es igual a la suma de las varianzas de las estimaciones
de los totales en cada estrato, ya que el muestreo que supondremos con reposición se
realiza de forma independiente en los distintos estratos.
  L   L  L
σ2
V( Y st )  V  Y h    V(Y h )  N 2h h (4.87)
 h 1  h 1 h 1 nh
De manera similar se obtendrían las varianzas para los estimadores de la media, el

total de clase y la proporción.
 L  L L
σ2
V( y st )  V  Wh y h    Wh2 V( y h )  Wh2 h (4.88)
 h 1  h 1 h 1 nh
  L   L  L
PQ
V( A st )  V  A h    V(A h )  N 2h h h (4.89)
 h 1  h 1 h 1 nh
  L   L  L
PQ
V( P st )  V  Wh P h    Wh2 V(P h )   Wh2 h h (4.90)
 h 1  h 1 h 1 nh
4.5.3. Estimación de Varianza de los estimadores.
De la unidad 3 sabemos que en muestreo con reposición en el estrato h-ésimo la

cuasivarianza muestral es:
n 1 
2 nh nh
1 nh  2
Sh  
n h 1 i 1
(Yh i  y h ) 2  h 
n h  1  n h

i 1
(Yhi  y h ) 2
 
 n h  1
σh (4.91)
es un estimador insesgado de la varianza poblacional:
Nh
1
σ 2h 
Nh
 (Y
i 1
hi  Yh )2 (4.92)
También sabemos de la unidad 3 que en el caso de proporciones las cuasivarianzas

muestrales y poblacionales para los estratos son respectivamente:
2 nh   N 1 N 1 N h
Sh  P h Q h , σ 2h  h S2h  h Ph Q h  Ph Q h (4.93)
n h 1 Nh N h N h 1
166
2 nh  
con lo que Sh  P h Q h es un estimador insesgado para σ 2h  Ph Q h .
n h 1
Si Sustituimos en las expresiones de las varianzas de los estimadores cada término

por su estimador insesgado, se obtienen los siguientes estimadores insesgados para
las varianzas de los estimadores.
2
  Sh L
V(Y st )   N 2h (4.94)
h 1 nh
2
 Sh L
V( y st )   Wh2 (4.95)
h 1 nh
   
  L
n h P h Qh L
P h Qh
V(A st )   N 2h   N 2h (4.96)
h 1 nh 1 nh h 1 nh 1
 
  L
P h Qh
V(P st )   W 2
(4.97)
n h 1
h
h 1
4.5.4. Afijación de la muestra.
Dada la forma en que están definidos los cálculos de los n h para las afijaciones
uniformes y proporcional, dichas afijaciones no van a verse afectadas por el hecho de
que el muestreo sea con o sin reposición. Sin embargo sí cambiaran las varianzas de
los estimadores, las afijaciones de mínima varianza y óptima si van a verse afectadas
por la existencia de reposición o no, ya que el cálculo de n h depende de las varianzas
en los estratos.
4.5.4.1. Afijación uniforme.
Como este tipo de afijación consiste en asignar el mismo número de unidades

muestrales a cada estrato, no interviene para nada en el reparto de unidades
muestrales entre los estratos el hecho de haya o no reposición. Se tomarán todos los
n h iguales a n h  k  n / L , aumentando o disminuyendo este tamaño en una unidad
si n no fuese múltiplo de L, esto es n h  E(n / L)  1 , donde E denota la parte entera.
 L
σ 2h
V( Y st )   N 2h (4.98)
h 1 k
L
σ 2h
V( y st )   Wh2 (4.99)
h 1 k
167
 L
Ph Q h
V( A st )   N 2h (4.100)
h 1 k
 L
Ph Q h
V( P st )   Wh2 (4.101)
h 1 k
4.5.4.2 Afijación proporcional.
Este tipo de afijación que consiste en asignar a cada estrato un número de unidades
muestrales n h proporcional a su tamaño N h , no interviene para nada en el reparto
de unidades muestrales entre los estratos el hecho de que haya o no reposición. Las n
unidades de la muestra se distribuyen proporcionalmente a los tamaños de los
estratos, expresados en número de unidades.
Debemos tener en cuenta que:
n N n / k nh
n h  Nh k  n  k N  k  , Wh  h  h 
N N n/k n
Luego la expresión para n h resulta:
n h  n  Wh (4.102)
 L
σ 2h L
2 σh
2
1 L
V( Y st )   N   Nh
2
h   N h σ 2h (4.103)
h 1 n h h 1 k N h k h 1
L
σ 2h L
n 2h σ 2h 1 L n h 2 1 L
V( y st )   W  2
2
h   σ h   Wh σ 2h (4.104)
h 1 n h h 1 n n h n h 1 n n h 1
 L
Ph Q h L 2 Ph Q h 1 L
V( A st )   N 2h   Nh   N h Ph Q h (4.105)
h 1 nh h 1 k N h k h 1
 L
Ph Q h L n 2h Ph Q h 1 L n h 1 L
V( P st )   Wh2  2   Ph Q h   Wh Ph Q h (4.106)
h 1 nh h 1 n nh n h 1 n n h 1
4.5.4.3. Afijación de mínima varianza o afijación de Neyman.
En el caso de considerar el estimador de la media, el problema consiste en hacer

L
mínima la expresión V( yst ) bajo la condición n
h 1
h n.
La expresión para n h es:

168
Nh
σh
Wh σ h N N σ
nh  n  L  n L  n L h h (4.107)
Nn

h 1
Wn σ h 
h 1 N
σh 
h 1
Nnσh
Los valores de n h para la estimación de la media van a coinciden con los valores del
estimador del total en afijación de mínima varianza.
Vemos que los valores de n h son proporcionales a los productos N h σ h y en el

supuesto caso de que σ h  σ ,  h  1, 2, , L esta afijación de mínima varianza
coincidirá con la proporcional, tal y como se demuestra a continuación:
Nhσ Nh Nh n
σh  σ  n h  n  L
 n L
 n  Wh  n  k N h , con k 
N σ N
N N
n n
h 1 h 1
Una vez calculados los valores n h para afijación de mínima varianza en el caso de la
estimación de la media con reposición, vamos a ver cuánto vale la varianza del
estimador de la media y del total para este tipo de afijación.
Tenemos:
2
L
σ2 L
σ 2h L
Wh σ h 1 L 
V( y st )   W h   Wh2
2
    Wn σ h 
h
n h h 1 Wh σ h 1 n  h 1 
h 1
n L
h 1
n L
 Wn σ h
h 1
W σ
h 1
n h
2
1 L 
V( y st )    Wn σ h  (4.108)
n  h 1 
2
 L
σ 2h L
σ 2h L
Nh σh 1 L 
V( Y st )   N 2
  N 2h     Nh σh 
h
n h h 1 Nhσh 1 n  h 1 
h 1
n L
h 1
n L
 Nnσh
h 1
N σ
h 1
n h
2
 1 L 
V( Y st )    N h σ h  (4.109)
n  h 1 
Si se quiere afijación de mínima varianza y la expresión de la varianza mínima para

el estimador de la proporción y para el estimador del total de clase basta sustituir en
las formulas anteriores σ 2h por Ph Q h .
Nhσh N h Ph Q h Wh Ph Q h
nh  n  L
 n L
 n L
(4.110)
N σ
h 1
n h N
h 1
h Ph Q h W
h 1
h Ph Q h
169
2 2
 1 L  1 L 
V( P st )    Wh σ h     Wh Ph Q h  (4.111)
n  h 1  n  h 1 
2 2
 1 L  1 L 
V( A st )    N h σ h     N h Ph Q h  (4.112)
n  h 1  n  h 1 
4.5.4.4. Afijación óptima.
Si consideramos en este caso el estimador de la media, el problema consiste en hacer

L
mínima la expresión V( yst ) bajo la condición c n
h 1
h n C.
Podemos escribir que:
Wh σ h / c h Nh σh / ch
nh  n  L
 n L
(4.113)
W σ
h 1
n h / ch N σ
h 1
n h / ch
Vemos que los valores de n h son proporcionales a los productos N h σ h / c h y en el

supuesto de que c h  c ,  h  1, 2, , L (costo constante en todos los estratos) la
afijación óptima coincide con la de mínima varianza, y si además σ h  σ ,
 h  1, 2, , L la afijación óptima coincidirá con la proporcional.
Los valores de n h para la estimación de la media coinciden con sus valores para la
estimador del total en afijación óptima. No olvidemos que esta coincidencia también
se daba en afijación de mínima varianza.
Una vez calculados los valores de n h para afijación óptima en el caso de la

estimación de la media con reposición, vamos a ver cuánto vale la varianza del
estimador de la media y del total para este tipo de afijación.
Tenemos:
L
σ 2h L
σ 2h L
Wh σ h c h
V( y st )   Wh2   Wh2  
h 1 n h h 1 Wh σ h / c h h 1
n
1
n L
W σ
L
W σ
h 1
n h / ch
h 1
n h / ch
1 L  L 
 V( y st )    Wh σ h / c h    Wh σ h c h  (4.114)
n  h 1   h 1 
170
 σ 2h
L L
σ 2h L
Nh σh ch
V( Y st )   N   N 2h
2
h  
h 1 n h h 1 Nh σh / ch h 1
n
1
n L
N σ
L
N σ
h 1
n h / ch
h 1
n h / ch
 1 L  L 
 V( Y st )    N h σ h / c h   N h σ h c h  (4.115)
n  h 1  h  1 
Si se quiere la afijación óptima y la expresión de la varianza mínima para el

estimador de la proporción y para el estimador del total de clase, basta sustituir en
las formulas anteriores σ 2h por Ph Q h .
Wh σ h / c h Wh Ph Q h / c h N h Ph Q h / c h
nh  n  L
 n L
 n L
W σ
h 1
n h / ch W
h 1
n Ph Q h / c h N
h 1
n Ph Q h / c h
(4.116)
 L
Ph Q h 1 L  L 
V( P st )   Wh2    Wh Ph Q h / c h   Wh Ph Q h c h 
h 1 Wh Ph Q h / c h n  h 1  h  1 
n L
W h 1
n Ph Q h / c h
(4.117)
 L
Ph Q h 1 L  L 
V( A st )   N 2h    Nh Ph Q h / c h   N h Ph Q h c h 
h 1 N h Ph Q h / c h n  h 1  h  1 
n L
N
h 1
n Ph Q h / c h
(4.118)
4.5.5. Comparación de eficiencias según los distintos tipos de afijación.
En esta sección veremos una comparación de la conveniencia de los distintos tipos de

afijación con reposición en términos de su eficiencia medida a través del error de
muestreo, o lo que es lo mismo, a través de la varianza. Por lo tanto será más
eficiente aquel tipo de afijación que presente menos varianza.
Vamos a realizar las comparaciones de eficiencias a partir de la descomposición de la

varianza poblacional σ 2 .
Tenemos:
N N
1 L h 1 L h
σ2  
N h 1 i 1
( Yhi  Y ) 2
 
N h 1 i 1
( Yh i  Y h  Y h  Y ) 2 
171
 
 
1 L Nh L Nh L Nh 
   ( Yh i  Y h )  
N  h 1 i 1
2
 ( Y h  Y )  2  ( Yh i  Y h )( Y h  Y )  
2
h 1 i 1
 
h 1 i 1
 
 0 
 
N N
1 L h 1 L h 1 L 1 L
   ( Yh i  Y h ) 2   ( Y h  Y ) 2   N h σ 2h   N h ( Y h  Y ) 2
N h 1 i 1 N h 1 i 1 N h 1 N h 1
L
Nh 2 L Nh L L
 σh   ( Y h  Y ) 2   Wh σ 2h   Wh ( Y h  Y ) 2
h 1 N h 1 N h 1 h 1
Vamos ahora a realizar comparaciones de eficiencias a partir de la expresión de σ 2

recientemente obtenida. En efecto, tenemos:
L L
σ2 1 L 1 L
σ 2   Wh σ 2h   Wh ( Y h  Y ) 2    Wh σ 2h   Wh ( Y h  Y ) 2
h 1 h 1 n
 n h
 1
  n h
1
 
VMAS ( y) VMEP ( y) 0
 VMAS ( y ) 
 VMEP ( y )
La igualdadse da
si Y h  Y h 1,..,L
De la expresión anterior, acabamos de demostrar que el muestreo estratificado con

reposición y afijación proporcional es más preciso que el muestreo aleatorio
simple, produciéndose la igualdad de precisiones cuando las medias de los estratos
son todas iguales. Por lo tanto, la ganancia en precisión del muestreo estratificado
con reposición respecto del muestreo aleatorio simple con reposición será mayor
cuanto más distintas entre sí sean las medias de los estratos; es decir, para que el
muestreo estratificado con reposición sea preciso es conveniente que los estratos sean
heterogéneos entre sí en media (afirmación que ya conocíamos desde el inicio de la
unidad) y que constituye una de las especificaciones clásicas en el muestreo
estratificado.
A continuación vamos a comparar las precisiones de la afijación proporcional y la de

mínima varianza con reposición. En efecto, tenemos:
1  L  
2 2
1 L 1 L   L
VMEP ( y)  VMEMV ( y)   Wh σ h    Wh σ h    Wh σ h    Wh σ h 
2 2
n h 1 n  h 1  n  h  1  h 1  
172
  
2

  L  
1 L  1 L  1 L 
   Wh σ 2h   Wh σ h 

   Wh σ 2h  σ 2     Wh σ 2h  2 σ 2  σ 2  
n  h 1  h 1  n  h 1  n  h 1 
   
  σ  
 
 
 L 
1   1  W (σ 2  2 σ  σ 2)  
L L L
  h h
n  h 1
W σ 2
 2 σ 
h 1
Wh σ h  σ 2

h 1
Wh   h h
n  h 1 
        
 σ 1 
1 L L
 
n h 1
Wh (σ 2h  σ) 2 
 0 con σ   Wh σ h  VMEP ( y )  VMEMV ( y )
h 1
La igualdad se da
si σ h  σ h  1,..,L
Hemos demostrado que VMEP ( y)  VMEMV ( y)  0  VMEP ( y)  VMEMV ( y)
Luego el muestreo estratificado con reposición y afijación de mínima varianza es

más preciso que el muestreo estratificado con reposición y afijación proporcional,
produciéndose la igualdad de precisiones cuando las desviaciones típicas de los
estratos son todas iguales. Por tanto, la ganancia en precisión del muestreo
estratificado con reposición y afijación de mínima varianza respecto del muestreo
estratificado con reposición y afijación proporcional será mayor cuanto más distantes
entre sí sean las desviaciones típicas de los estratos; es decir, para que el muestreo
estratificado con reposición sea más preciso es conveniente que los estratos sean
heterogéneos entre sí en desviación típica (afirmación que ya conocíamos desde el
inicio de la unidad) y que constituye una de las especificaciones clásicas en el
muestreo estratificado.
En realidad ya se sabemos que:
VMAS ( y )  V) MEP ( y )  VMEMV ( y ) (4.119)
En general el muestreo estratificado con reposición y afijación de mínima varianza es

más preciso que el muestreo estratificado con reposición y afijación proporcional y
que el muestreo aleatorio simple con reposición, siendo además el estratificado con
reposición y afijación proporcional más preciso que el aleatorio simple con
reposición.
Se produce igualdad de eficiencias cuando las varianzas y las medias de los estratos
son constantes, y se produce la máxima diferencia de eficiencias cuanto más
distantes sean las varianzas y las medias de los estratos, es decir, cuanto mayor sea la
heterogeneidad entre los estratos, tal como es lógico en muestreo estratificado.
173
4.5.6. Tamaño de la muestra.
Vamos a estudiar el tamaño de muestra estratificada con reposición necesario para

cometer un determinado error de muestreo conocido de antemano. Distinguiremos
los casos de error de muestreo prefijado con y sin coeficiente de confianza adicional
y, además distinguiremos entre los diferentes tipos de afijación de la muestra.

1. Error de muestreo dado e  σ( θ) .
 Media.
L
1 L W h σ 2h
e 2  V( y st )  
n h 1
Wh σ 2h  n  h 1
e2
(4.120)
 Total.
L

N  N h σ 2h
N L
e 2  V( Y st )  
n h 1
N h σ 2h  n h 1
e2
(4.121)

clase con reposición se calculan sustituyendo σ 2h por Ph Q h en las formulas del
tamaño de la muestra para la estimación de la media y el total respectivamente:
L L
 Wh σ 2h W h Ph Q h
n h 1
 h 1
(4.122)
e2 e2
L L
N N h σ 2h N  N h Ph Q h
n h 1
 h 1
(4.123)
e2 e2
 Media.
2
 L 
2   Wh σ h 
1 
e 2  V( y st )    Wh σ h   n   h  1 2 
L
(4.124)
n  h 1  e
174
 Total.
2
 L 
2   Nh σh 
 1 
e 2  V( Y st )    N h σ h   n   h  1 2 
L
(4.125)
n  h 1  e

clase con reposición se calculan sustituyendo σ h por Ph Q h en las formulas del
tamaño de la muestra para la estimación de la media y el total respectivamente.
2 2
 L   L 
  Wh σ h    Wh Ph Q h 
n   h 1 2   n   h 1  (4.126)
e e2
2 2
 L   L 
  Nh σh    Nh Ph Q h 
n   h 1 2   n   h 1  (4.127)
e e2
 Media.
1 L  L 
e 2  V( y st )    Wh σ h / c h    Wh σ h c h  , despejando n resulta:
n  h 1   h 1 
 L  L 
  Wh σ h / c h    Wh σ h c h 
n   h 1   h 1
2
 (4.128)
e
 Total.
 L  L 
 h h N σ / c h    N h σ h ch 
n   h 1   h 1
2
 (4.129)
e

clase con reposición se calculan sustituyendo σ h por Ph Q h en las formulas del
tamaño de la muestra para la estimación de la media y el total respectivamente.
175
 L  L 
  Wh Ph Q h / c h    Wh Ph Q h c h 
n   h 1   h 1  (4.130)
e2
 L  L 
  Nh Ph Q h / c h    N h Ph Q h c h 
n   h 1   h 1  (4.131)
e2

 σ( θ)
2. Error relativo e r  CV(θ)  
Prefijado.
E(θ)
 Media.
L
W h σ 2h
n h 1
2
(4.132)
Y e2
 Total.
L
N h σ 2h
n h 1
2
(4.133)
N Y e2
2

clase con reposición se calculan sustituyendo σ 2h por Ph Q h y Y por P en las
formulas anteriores respectivamente:
L
W h Ph Q h
n h 1
(4.134)
P2 e2
L
N h Ph Q h
n h 1
(4.135)
N P2 e2
 Media.
2
 L 
  Wh σ h 
n   h 1 2 2  (4.136)
Y e
176
 Total.
2
 L 
  Nh σh 
n   h 1 2 2 2  (4.137)
N Y e
 Proporción.
2
 L 
  Wh Ph Q h 
n   h 1 2 2  (4.138)
P e
 Total de clase
2
 L 
  N h Ph Q h 
n   h 1 2 2 2  (4.139)
N P e
 Media.
 L  L 
  Wh σ h / c h    Wh σ h c h 
n   h 1   h 1
2 2
 (4.140)
Y e
 Total.
 L  L 
  Nh σh / ch    Nh σh ch 
n   h 1   h 1
2 2
 (4.141)
Y e
 Proporción.
 L  L 
  Wh Ph Q h / c h    Wh Ph Q h c h 
n   h 1   h 1  (4.142)
P2 e2
 Total de clase.
 L  L 
  Nh Ph Q h / c h    N h Ph Q h c h 
n   h 1   h 1
2 2
 (4.143)
P e
177

3. Error de muestreo y coeficiente de confianza prefijados. e1  Z  / 2 σ( θ )
 Media.
L
W
2
Z /2 h σ 2h
1 L
e1  Z  / 2 V( y st )  Z  / 2  Wh σ 2h  n  h 1
2 2 2
2
(4.144)
n h 1 e 1
 Total.
L
Z  / 2 N  N h σ 2h
2
 N L
e1  Z  / 2 V( Y st )  Z  / 2  N h σ 2h  n  h 1
2 2 2
2
(4.145)
n h 1 e1

clase con reposición se calculan sustituyendo σ 2h por Ph Q h en las formulas del
tamaño de la muestra para la estimación de la media y el total respectivamente:
 Proporción.
L
W
2
Z /2 h Ph Q h
n h 1
2
(4.146)
e1
 Total de clase.
L
Z  / 2 N  N h Ph Q h
2
n h 1
2
(4.147)
e 1
 Media.
2
 L 
  Wn σ h 
2
2 Z /2
1 L   h 1 
e1  Z  / 2 V( y st )  Z  / 2    Wn σ h   n 
2 2 2
2
n  h 1  e1
(4.148)
 Total.
2
 L 
  Nh σh 
2
2 Z /2
 1 L   h 1 
e1  Z  / 2 V( Y st )  Z  / 2   Nh σh  n
2 2 2
2
n  h 1  e1
(4.149)
178
 Proporción
2
 L 
2
Z /2
n  h 1  (4.150)
2
e1
 Total de clases
2
2  
L
Z α/2   N h Ph Q h 
n  h 1  (4.151)
2
e1
 Media.
1 L  L 
e1  Z  / 2 V( y st )  Z  / 2  h h h   Wh σ h c h  
2 2 2
W σ / c
n  h 1  h  1 
2   L 
L
Z  / 2   Wh σ h / c h    Wh σ h c h 
n  h 1   h 1  (4.152)
2
e1
 Total.
2   L 
L
Z  / 2   Nh σh / ch    N h σh ch 
n  h 1   h 1  (4.153)
2
e1
 Proporción.
2   L 
L
Z  / 2   Wh Ph Q h / c h    Wh Ph Q h c h 
n  h 1   h 1  (4.154)
2
e1
 Total de clase.
2   L 
L
Z  / 2   Nh Ph Q h / c h    N h Ph Q h c h 
n  h 1   h 1  (4.155)
2
e1
179
4. Error relativo de muestreo y coeficiente de confianza prefijados.


e r1  Z  / 2 CV( θ )
 Media.
L
Z /2
2
W h σ 2h
n h 1
2 2
(4.156)
Y e 1
 Total.
L
N
2
Z /2 h σ 2h
n h 1
2 2
(4.157)
N Y e1
 Proporción.
L
W
2
Z /2 h Ph Q h
n h 1
2 2
(4.158)
P e1
 Total de clase.
L
Nh
N
2
Z /2 Ph Q h
N h 1
h
h 1
n 2
(4.159)
N P 2 e1
 Media.
2
 L 
  Wh σ h 
2
Z /2
n  h 1  (4.160)
2 2
Y e1
 Total.
2
 L 
Z  / 2   Nh σh 
2
n  h 1  (4.161)
2 2 2
N Y e1
180
 Proporción.
2
 L 
2
Z /2
n  h 1  (4.162)
2 2
P e1
 Total de clase
2
 L 
  N h Ph Q h 
2
Z /2
n  h 1  (4.163)
2 2 2
N P e1
 Media.
2   L 
L
Z  / 2   Wh σ h / c h    Wh σ h c h 
n  h 1   h 1  (4.164)
2 2
Y e1
 Total.
2   L 
L
Z  / 2   N h σh / ch    N h σh ch 
n  h 1   h 1  (4.165)
2 2
Y e1
 Proporción.
2   L 
L
Z  / 2   Wh Ph Q h / c h    Wh Ph Q h c h 
n  h 1   h 1  (4.166)
2 2
P e1
 Total de clase.
2   L 
L
Z  / 2   Nh Ph Q h / c h    N h Ph Q h c h 
n  h 1   h 1  (4.167)
2 2
P e1
181
Ejemplo 4.4. Una empresa publicitaria está interesada en medir la influencia de la

publicidad televisiva en un municipio y decide realizar una encuesta por muestreo
para estimar el número promedio de horas por semana que se ve la televisión en los
hogares del municipio. Éste comprende dos pueblos A y B y un área rural, y se sabe
que existen 155 hogares en el pueblo A, 62 en el pueblo B y 93 en el área rural. La
empresa publicitaria tiene tiempo y dinero suficiente para entrevistar 40 hogares (20
del pueblo A, 8 del pueblo B y 12 del área rural) midiendo en cada uno el tiempo que
se ve la televisión en horas por semana. Se obtienen los datos siguientes:
Pueblo A 35 28 26 41 43 29 32 37 36 25 29 31 39 38 40 45 28 27 35 34
Pueblo B 27 4 49 10 15 41 25 30
Área rural 8 15 21 7 14 30 20 11 12 32 34 24
Estimar el tiempo promedio que se ve la televisión, en horas por semana, en cada uno
de los estratos y en todo el municipio fijando límites para el error de estimación a
través de intervalos de confianza al 95%. Suponer muestreo con reposición.
Solución
Para resolver este ejemplo, comenzamos introduciendo los datos en tres columnas,
una por cada estrato (en este caso serían los pueblos) en una hoja de cálculo de
Excel. A continuación para calcular los datos necesarios en cada estrato, en el menú
Datos elegimos Análisis de datos, seleccionamos Estadística descriptiva y
rellenamos la pantalla de entrada como se indica en la figura 4.3. Al pulsar Aceptar
se obtienen los estadísticos muestrales por estrato de la figura 4.4
Figura 4.3.
182
Figura 4.4.
Se observa que el tiempo promedio que se ve la televisión en el pueblo A es 33.9

horas por semana, en el pueblo B es 25.13 y en la zona rural es 19. Las
cuasivarianzas muestrales son 35.36, 232.41 y 87.63 horas por semana al cuadrado,
respectivamente, en cada estrato, y al dividirlos por el tamaño muestral seleccionado
en cada estrato obtenemos las varianzas de los estimadores de la media en cada
estrato, suponiendo muestreo con reposición:
2 2 2
S1 35.36 S2 232.41 S3 87.63
  1.768   29.051   7.302
n1 20 n2 8 n3 12
Como los coeficientes de asimetría y curtosis en cada estrato están en el intervalo

[-2, 2], puede suponerse normalidad de los datos, con lo que los límites para el error
de estimación en cada estrato (suponiendo muestreo con reposición) serán los radios
de los intervalos de confianza al 95%, es decir:

Z 0.025  ( y h )  1.96  1.768  2.6 , 1.96  29.051  10.56 , 1.96  7.302  5.29
- Para hallar la estimación del tiempo promedio que se ve la televisión en horas por
semana en todo el municipio y su error para muestreo con reposición, se tendrán
en cuenta las siguientes expresiones:
2
 L  L
Sh
Y st   Wh y h V( y st )   Wh2
h 1 h 1 nh
2 2 2 2
h Nh nh Wh Wh
yh Sh Wh y h Sh / n h Wh2 Sh / n h
1 155 20 0.5 33.9 35.36 16.95 0.25 1.768 0.442
2 62 8 0.2 25.13 232.41 5.026 0.04 29.051 1.162
3 93 12 0.3 19.0 87.63 5.7 0.09 7.302 0.657
∑ 310 40 1.0 27.676 2.261
183
En el cuadro anterior se presenta los resultados de los valores de la media estimada y

de la varianza estimada de la media.
 
Y st  27.676 horas y V( y st )  2.261
Por otro lado, el error de estimación a través de intervalos de confianza al 95% será:

Z 0.025  ( y st )  1.96  2.261  2.947
Ejemplo 4.5. Una población de tamaño 1000 está dividida en tres estratos para los
que se conocen los siguientes datos:  1  4 ,  2  12 ,  3  80 , W1 = 0.6, W2 = 0.3 y
W3 = 0.1. Se pide:
a) Determinar el tamaño de muestra que con afijación proporcional da una varianza
del estimador de la media igual a 5, considerando muestreo con reposición.
Realizar las respectivas afijaciones proporcionales.
b) ¿Qué resultados se obtendrían con afijación de mínima varianza? Realizar las
respectivas afijaciones de mínima varianza.
Solución.
a) Iniciamos recopilando los datos y realizando cálculos necesarios para el problema:
h Wh Nh h  h2 Wh  h Wh  h2
1 0.6 600 4 16 2.4 9.6
2 0.3 300 12 144 3.6 43.2
3 0.1 100 80 6400 8.0 640.0
∑ 1.0 1000 14.0 692.8
Afijación proporcional con reposición.

3
1 L  Wh σ 2h
692.8
e 2  V( y st )   Wh σ 2h  n  h  1 2   139
n h 1 e 5
Una vez hallado el tamaño de muestra realizamos la afijación proporcional como

sigue:
n h  n  Wh
n1  n  W1  139  0.6  83
n 2  n  W2  139  0.3  42
n 3  n  W3  139  0.1  14
184
b) Afijación de mínima varianza con reposición.

2
 L 
2   Wh σ h 
1  14 2
e 2  V( y st )    Wh σ h   n   h  1 2  
L
 39
n  h 1  e 5
Una vez hallado el tamaño de muestra realizamos la afijación de mínima varianza

como sigue:
Wh σ h
nh  n  L
W σ
h 1
n h
2.4 3.6 8.0

n1  39  7 n 2  39   10 n 3  39   22
14 14 14
Se observa que el muestreo con reposición la afijación que menos tamaño

muestral necesita para cometer un determinado error de muestreo (en este ejemplo
e  5 ) es la afijación de mínima varianza.
Ejemplo 4.6. Determinar el tamaño n de la muestra estratificada que con afijación de

mínima varianza produzca la misma precisión que una muestra aleatoria simple (no
estratificada) de tamaño n´, para estimar la proporción P de una cierta clase en la
población. Suponer en ambos casos muestreo con reposición y aplicar el resultado a
los datos de la tabla con n´= 1000.
Estratos
I II III
Wh 0.2 0.3 0.5
Ph 0.5 0.6 0.4
a) Realizar la afijación y calcular el valor de la varianza mínima.

b) Resolver el mismo problema para afijación proporcional y comparar resultados.
Solución.
a) Se trata de igualar la varianza del estimador de la proporción en muestreo

estratificado con afijación de mínima varianza a la varianza del estimador de la
proporción en el muestreo aleatorio simple en ambos casos con reposición.
Tenemos:
2
 P(1  P)  1 3 
VMAS (P)  y VSTMV (P)    Wh Ph Q h 
n n  h 1 
L
Teniendo presente que P   Wh Ph se tiene el siguiente cuadro de información:
h 1
185
Estrato Wh Ph 1  Ph Wh Ph Ph (1  Ph ) Wh Ph (1  Ph ) Wh Ph (1  Ph )
I 0.2 0.5 0.5 0.10 0.5 0.1 0.05
II 0.3 0.6 0.4 0.18 0.49 0.147 0.072
III 0.5 0.4 0.6 0.20 0.49 0.245 0.12
0.48 1.48 0.492 0.242
Igualando las precisiones resulta:

2
  P (1  P) 1  3 
VMAS (P)  VSTMV (P)     Wh Ph Q h  
n n  h 1 
2
 3 
n     Wh Ph Q h 
  1000  (0.492)  970
2
n  h 1
P (1  P) 0.48(1  0.48)
Se obtiene un tamaño de muestra n = 970 en el muestreo estratificado con afijación

de mínima varianza, que es ligeramente inferior al tamaño necesario en muestreo
aleatorio simple n´= 1000. Existe entonces una ganancia en precisión por utilizar
muestreo estratificado, pero es pequeña.
Una vez conocido el tamaño n = 970 de la muestra estratificada con afijación de

mínima varianza, vamos a realizar dicha afijación:
Wh Ph Q h
nh  n  3
W
h 1
h Ph Q h
W
h 1
h Ph Q h  0.2 0.5  0.5  0.3 0.6  0.4  0.5 0.4  0.6  0.1  0.147  0.245  0.492
0.1 0.47 0.245

n1  970   197 n 2  970   290 n 3  970   483
0.492 0.492 0.492
b) A continuación se iguala la varianza del estimador de la proporción en muestreo

estratificado con afijación proporcional a la varianza del estimador de la
proporción en el muestreo aleatorio simple en ambos casos con reposición. Se
tiene:
 P(1  P)  3
PQ 1 3
VMAS (P)  y VSTP (P)   Wh2 h h   Wh Ph (1  Ph )
n h 1 nh n h 1
Igualando las precisiones tenemos:
 P (1  P) 1 3

VMAS (P)  VSTMV (P)    Wh Ph (1  Ph ) 
n n h 1
186
3
n    Wh Ph (1  Ph )
1000  0.242
n h 1
  970
P (1  P) 0.48(1  0.48)
Se obtiene un tamaño de muestra n = 970 en el muestreo estratificado con afijación

proporcional, que es ligeramente inferior al tamaño necesario en muestreo
aleatorio simple n´= 1000. Existe entonces una ganancia en precisión por utilizar
muestreo estratificado, pero es pequeña. Observamos que este tamaño de muestra
con afijación proporcional coincide con el tamaño de muestra para afijación de
mínima varianza, con lo que en este caso la precisión de ambos tipos de afijación
es similar.
Una vez conocido el tamaño n = 970 de la muestra estratificada con afijación

proporcional, vamos a realizar dicha afijación:
n h  n  Wh
0.245
n1  970  0.2  194 n 2  970  0.3  291 n 3  970   483
0.492
4.6. Postestratificación.
Cuando se manejan determinadas variables de estratificación puede ocurrir que no se

conozca el estrato a que pertenece una unidad sino hasta después de recoger los
datos.
Ejemplos típicos son las características personales como edad, el sexo, la estatura, el
nivel de educación, etc.
Los tamaños de los estratos N h se pueden obtener de manera bastante exacta a partir
de las estadísticas oficiales, pero las unidades se pueden clasificar en estratos
solamente después de conocer los datos de la muestra. Por lo tanto, puede suponerse
que los Wh y los N h son conocidos.
Este método se utiliza cuando se desconocen a priori las unidades que pertenecen a
cada estrato. Obtenida la muestra, las unidades se asignan al estrato correspondiente.
Si los pesos de éstos son conocidos, se puede utilizar el estimador insesgado:
 L
Y ´  Wh y h
h 1
cuya precisión es similar a la obtenida con la afijación proporcional, siempre que

todos los n h sean grandes; por ejemplo, superiores a 20 unidades. Si de los W h se
conocen sólo las aproximaciones W´ , el estimador:
h
 L
Y post   W´h y h (4.168)
h 1
187
será sesgado y la cuantía del sesgo será:
 L L L
E( Y post )  Y   W´h Y h   Wh Y h   (W´h .Wh )Y h
h 1 h 1 h 1
La acuracidad vendrá dada por el error cuadrático medio
2
 2
S2 L
L 
ECM(Y post )   W´h h (1  f h )   (W´h .Wh )Y h 
h 1 nh h  1 
 L
 El estimador del total es: Y post   N´h y h (4.169)
h 1
El método de Postestratificación puede aplicarse también a una muestra ya

estratificada por otro factor, por ejemplo, en cinco regiones geográficas a condición
de que los Wh se conozcan separadamente en cada región. Las varianzas (los
errores) se calculan y estiman mediante:

Nn L ´ 2 Nn L 2
V( Y post )   N hS' h  N n 2 
N 2 n h 1 h 1
S' h (1  f ´h )
 
Nn L ´  2 Nn L  2
V(Y post )   N h S' h  N n 2 
N 2 n h 1 h 1
S' h (1  f ´h )
 
N  n L ´ 2 N(N  n) L 2
V( Y post )  N 2 V( Y post )   N hS' h  n 2 
n h 1 h 1
S' h (1  f ´h )
  
N  n L ´  2 N(N  n) L  2
V(Y post )  N 2 V( Y post )   N h S' h  n 2 
n h 1 h 1
S' h (1  f ´h )
Nh 
Para las proporciones y totales de clase cambiamos S' 2h por Ph (1  Ph ) y S' 2h
Nh  1
n h  
por P´h (1  P´h ) .
n h  1
Ejemplo 4.7. Un farmacéutico investiga el ingreso el ingreso en caja obtenido por

ventas a jubilados y al resto de sus clientes. Observa que el último mes ha vendido
productos a 750 jubilados y a 346 del resto de sus clientes. Como los jubilaos suelen
tener tratamientos particulares propios de enfermedades habituales en ellos, puede
considerarse como un estrato homogéneo respecto de los productos que consumen.
Lo mismo ocurre con el resto de los clientes. Como llevaría tiempo analizar cliente a
cliente, se toma una muestra de 24 clientes y se estratifica a posteriori en función de
si se trata de jubilados o no. El ingreso neto en dólares por cada cliente de la muestra
se presenta a continuación:
188
Cliente Ingreso ($) Cliente Ingreso ($) Cliente Ingreso ($)

Jubilado 271.3 No Jubilado 173.69 Jubilado 277.67
Jubilado 301.29 No Jubilado 133.24 No Jubilado 171.89
No jubilado 163.17 Jubilado 275.8 No Jubilado 165.22
No Jubilado 141.72 No Jubilado 246.48 Jubilado 23.5
Jubilado 367.94 No Jubilado 176.7 No Jubilado 181.2
Jubilado 328.63 Jubilado 292.09 No Jubilado 177.37
No Jubilado 179.7 No Jubilado 187.52 No Jubilado 161.37
Jubilado 337.77 Jubilado 349.79 No Jubilado 215.76
Realizar una estimación del ingreso neto del farmacéutico y de su error relativo de
muestreo.
Solución.
Como estamos ante un proceso de Postestratificación, el número de jubilados y

personas no jubiladas muestreadas (normales) son variables aleatorias con 24
valores.
Tenemos los siguientes datos:
N = 1096 clientes, N´1  750 jubilados, N´2  346 no jubilados, n  24 clientes,

 
n1  10 , n 2  14 , y1  303.728 , y 2  176.788 , S' 12  1711.03875 y S' 22  787.38643
La cantidad ingresada por el farmacéutico se estima mediante:
 2
Y post   N´h y h  750  303.728  346 176.788  288964.648 euros
h 1
La estimación de la varianza se calculará mediante:
  N  n 2 ´  2 N(N  n) 2  2
V(Y post )   N h S' h  n 2 
n h 1 h 1
S' h (1  f ´h )
1096  24
  (750 1711.03875  346  787.38643) 
24
1096(1096  24)  10 14 
 1711.03875  (1  )  787.38643  (1 
24 2
 750 346) 
= 69488592.94 + 4984710.542= 74473303.48
El error relativo de muestreo será:
 
  V(Y post ) 74473303.48
CV(Y post )  
  0.02986  0.03 (3%)
Y post 288964.648

Unidad 4.

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Unidad 4.

Cargado por

Copyright:

Formatos disponibles

130

Unidad 4. Muestreo Estratificado.

Recordemos que uno de los principales problemas que se presentan en el muestreo y

Uno de los factores que más influyen en el error de muestreo es la variabilidad de la

Se ve claramente que a mayor variabilidad de la variable Y mayor varianza de la

El muestreo estratificado se basa en esta idea, es decir, intentar homogeneizar la

En general, la Estadística emplea la homogeneización por subconjuntos o bloques

4.2. Concepto de muestreo estratificado.

Supongamos que la población objetivo de estudio, formada por N unidades

La muestra estratificada de tamaño n se obtiene seleccionando n h elementos (h = 1, 2,

La figura 4.1 muestra la representación gráfica de la población dividida en h estratos

Podemos expresar de manera esquemática la formación de estratos en la población y

El objetivo básico del muestreo estratificado es la obtención de estimaciones más

Al realizar el muestreo estratificado, obtendremos también, como resultados

4.3. Razones para el uso de muestreo estratificado.

1. El muestreo estratificado puede aportar información más precisa de algunas

2. El uso adecuado del muestreo estratificado puede generar ganancia en

3. Conveniencia de tipo administrativo también puede ser razón suficiente para

4. En ciertos casos el simple orden en que aparecen las unidades ui en la

5. Hay casos en que la estratificación viene motivada por el requerimiento de

negocio de los establecimientos de ventas al público de una cuidad se puede

7. Los criterios de estratificación, su número y el de estratos dependen de los

4.4. Muestreo Estratificado sin reposición.

4.4.1. Estimadores lineales insesgados en muestreo aleatorio estratificado sin

En muestreo estratificado un parámetro poblacional puede escribirse como:

La aplicación de este estimador general de Horvitz y Thompson a las estimaciones

El estimador del total poblacional en muestreo estratificado aleatorio es la suma de

El estimador de la media poblacional es la media ponderada de los estimadores de la

El estimador de la proporción poblacional es la media ponderada de los estimadores

4.4.2. Varianza de los estimadores.

De manera similar se obtendrían las varianzas para los estimadores de la media, el

4.4.3. Estimación de Varianza de los estimadores.

De la unidad 3 sabemos que en el estrato h-ésimo la cuasivarianza muestral es:

es un estimador insesgado de la cuasivarianza poblacional:

También sabemos de la unidad 3 que en el caso de proporciones las cuasivarianzas

Si Sustituimos en las expresiones de las varianzas de los estimadores cada término

4.4.4. Afijación de la muestra.

Se llama afijación de la muestra al reparto, asignación, adjudicación, adscripción o

4.4.4.1. Afijación uniforme.

Consiste en asignar el mismo número de unidades muestrales a cada estrato, con lo

Para este tipo de afijación, las varianzas de los estimadores serán:

Este tipo de afijación da la misma importancia a todos los estratos, en cuanto a

perjudicará a los grandes en cuanto a precisión. Sólo es conveniente en poblaciones

4.4.4.2 Afijación proporcional.

Consiste en asignar a cada estrato un número de unidades muestrales

La expresión para n h resulta: n h  n  Wh (4.18)

A la vista de los resultados anteriores podemos asegurar lo siguiente:

- Los coeficientes de ponderación W h se obtienen también a partir de la muestra,

- Todas las unidades de la población tienen la misma probabilidad de aparecer en la

Para este tipo de afijación, las varianzas de los estimadores serán:

4.4.4.3. Afijación de mínima varianza o afijación de Neyman.

La afijación de mínima varianza o afijación de Neyman consiste en determinar los

En el caso de considerar el estimador de la media, el problema consiste en hacer

La expresión para n h es:

Vemos que los valores de n h son proporcionales a los productos N hSh y en el

La utilidad de esta afijación es mayor si hay grandes diferencias en la variabilidad de

Valor de la varianza mínima.

Si se quiere afijación de mínima varianza y la expresión de la varianza mínima para

4.4.4.4. Afijación óptima.

La afijación óptima consiste en determinar los valores de n h de forma que para un

costos n h para los L estratos tenemos el costo total de selección de la muestra

Podemos escribir que:

Vemos que los valores de n h son proporcionales a los productos N h Sh / c h y en el

Valor de la varianza mínima.