Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Capitulo2 PDF
Capitulo2 PDF
TEORÍA DE MUESTREO
II.1 Muestreo
obtener hechos. Permite que se tomen decisiones que toman en cuenta factores de
recopilan y resumen.
Algunas de las ventajas que se presentan, si se piensa en realizar una muestra, son
mencionadas a continuación:
Costo reducido. Si los datos obtenidos provienen de una pequeña fracción de la población,
los gastos asociados a su recopilación serán mucho menores que si se intenta realizar un
censo. Cuando se trata con poblaciones grandes, resultados precisos pueden obtenerse de
resumirse rápidamente con una muestra, siendo esto de vital importancia cuando se
Mayor alcance. Para la realización de algunos tipos de encuestas se cuenta con personal y
llegar a obtener.
Mayor exactitud. Dado que se reduce el volumen de trabajo en gran medida, se puede
utilizar personal más capacitado y someterlo a entrenamiento intensivo, con el fin de tener
En el diseño de una muestra hay que considerar dos aspectos; inicialmente un proceso de
El diseño de una muestra considera las tareas de selección y estimación para realizar
inferencias que vayan del valor muestral al valor de la población. Un valor de la población
es una expresión numérica que sintetiza los valores de una o varias características de la
Una de las desventajas al utilizar el muestreo, es que dentro de los valores muestrales que
se pueden obtener, es posible llegar a toparse con algunas deficiencias resultado de una
designación de solo una fracción de la población total a ser observada en la muestra, sin
embargo, al realizar un buen diseño de muestra, se tiene como consecuencia que estos
y fueron marcados.
En los tipos de muestreo anteriores, se llevan a cabo varias suposiciones acerca de las
medio de métodos estadísticos, sin tener que hacer suposiciones acerca de ella. En este
último, cada uno de los elementos de la población tiene una probabilidad conocida además
diseño de la muestra.
Las muestras probabilísticas en general son diseñadas para ser medibles, es decir, la
1. Mesip, es un método de selección con igual probabilidad para todos los elementos
de la población.
2. Muestreo de elementos, en este tipo los elementos son también las únicas unidades
de muestreo.
5. Muestreo en dos fases, en este caso se subselecciona la muestra final a partir de una
muestreo. Esta es la base necesaria para que se pueda llevar a cabo inferencia
desconocido de la población.
c. Practicidad, que se refiere a los problemas que deben ser resueltos para poder llevar
d. Economía, que se refiere a cumplir los objetivos con un costo mínimo. Una muestra
será demasiado pequeña si los resultados que ofrece carecen de precisión suficiente
para contribuir a las decisiones. Por otro lado, una muestra será demasiado grande
si sus resultados son más precisos de lo que se requiere. Es necesario mediar estas
En general estos cuatro criterios suelen estar en conflicto, sin embargo, se deben equilibrar
son por sí mismos necesarios y suficientes para tener una buena muestra.
- Las muestras medibles son muestras probabilísticas, diseñadas para permitir estimar la
variabilidad de muestreo.
- Los muestreos mesip, que son clases especiales de muestreo probabilístico, requieren
- Las muestras insesgadas denotan a aquellos diseños en los que el valor esperado es igual
al valor de la población.
- Las muestras precisas son aquellas que tienen errores estándar bajos.
- Las muestras económicas tienen costos unitarios bajos para una varianza fija.
- Las muestras eficientes denotan una precisión alta, es decir, baja varianza por elemento.
II.2.1 Descripción.
poblaciones no deben contener ningún traslape, es decir, sus elementos deben ser
que:
N1 + N 2 +...+ N L = N
A cada una de estas subpoblaciones se le denominará estrato. Para lograr el beneficio total
derivado de la estratificación, los valores de las Nh deben ser conocidos. Cuando los
estratos han sido determinados, se selecciona una muestra de cada uno de ellos, siendo esta
selección independiente en cada uno de los diferentes estratos. El tamaño de las muestras
En caso de que se haya tomado una muestra aleatoria simple en cada uno de los estratos, a
obtener una estimación combinada del total de la población. Del mismo modo, se calculan
las varianzas dentro del estrato, son ponderadas adecuadamente y se suman para llegar a
partes de la población.
⇒ Presencia de problemas de muestreo que no son homogéneos para todas las partes
estratificación.
muy poco de una unidad a otra, se puede obtener un cálculo preciso de la media de
cualquier estrato de una pequeña muestra de éste. Estos cálculos pueden entonces
muestra; las cuales van disminuyendo de acuerdo al grado en que las medias de los
procedimientos.
a las partes.
población.
⇒ Los estratos pueden construirse por que las subpoblaciones dentro de ellos mismos
diseño de la muestra.
La teoría del muestreo estratificado se relaciona con las propiedades de las estimaciones de
una muestra estratificada y con la mejor opción del tamaño de la muestra nh para obtener la
II.2.2 Notación
Nh
_ ∑y hi
Yh = i =1
Media poblacional
Nh
nh
_ ∑y hi
yh = i =1
Media muestral
nh
Nh
∑ (y −Y h )
2
hi
s h2 = i =1
Varianza poblacional
Nh −1
(1 − f ) 2
V ( y) = S Varianza de la media en m.a.s.
n
donde:
L
∑N h yh L
y st = h =1
= ∑ Wh y h (2.1)
N h =1
donde N = N 1 + N 2 + ... + N L
∑n h yh
y= h =1
(2.2)
n
Es evidente que y coincide con y st , dado que en cualquier estrato se cumpla con lo
siguiente:
nh N h nh n
= ó = ó fh = f
n N Nh N
Lo cual implica que la fracción de muestreo sea la misma en cualquiera de los estratos.
nh.
teoremas:
Teorema 1. Si en cada estrato el estimador muestral y h es insesgado, entonces y st es un
_
estimador insesgado de la media poblacional Y .
Demostración:
⎛ L ⎞ L
E ( y st ) = E ⎜ ∑ Wh y h ⎟ = ∑ Wh Y h
⎝ h =1 ⎠ h =1
debido a que los estimadores son insesgados en los estratos individuales. La media
L Nh L
∑∑ y hi ∑N h Yh L
Y= h =1 i =1
= h =1
= ∑ Wh Y h
N N h =1
L
V ( y st ) = ∑ Wh2V ( y h ) (2.3)
h =1
Demostración:
L
y st = ∑ Wh y h (2.4)
h =1
y st es una función lineal de y h con sus respectivos pesos Wh . Por tanto es posible
L L L
V ( y st ) = ∑ Wh2V ( y h ) + 2∑∑ WhW j Cov ( y h y j ) (2.5)
h =1 h =1 j > h
Sin embargo, debido a que las muestras entre estratos se eligieron de manera
ecuación (2.3).
varianzas de los estimadores de las medias de los estratos individuales Y h . Si fuera posible
fraccionar una población altamente variable en estratos tales que todos los elementos
tengan el mismo valor dentro del estrato, sería posible estimar Y sin error alguno. La
ecuación (2.4) muestra que el uso del peso correcto del estrato Nh/N al estimar y st
1 L
S h2 L
S2
V ( y st ) =
N2
∑ N h ( N h − nh )
h =1
= ∑Wh2 h (1 − f h )
nh h=1 nh
(2.6)
S h2 N h − nh
V (yh ) =
nh Nh
1 L
1 L
S h2 2
2 Sh
V ( y st ) = 2
N
∑
h =1
N V (yh ) = 2
2
h
N
∑
h =1
N h ( N h − nh )
nh
= ∑ Wh
nh
(1 − f h )
Algunos casos particulares para esta fórmula se exponen en los siguientes corolarios.
Corolario 1. Si las fracciones de muestro nh/Nh son insignificantes para todos los estratos,
1 N h2 S h2 Wh2 S h2
V ( y st ) = 2
N
∑ n =∑ n (2.7)
h h
nN h
nh =
N
Reduciéndose la varianza a:
N h S h2 ⎛ N − n ⎞ 1 − f
V ( y st ) = ∑ ⎜ ⎟= ∑W S
h
2
h (2.8)
N n ⎝ N ⎠ n
S w2 ⎛ N −n⎞
V ( y st ) = ⎜ ⎟ (2.9)
n ⎝ N ⎠
S h2
V (Yˆst ) = ∑ N h ( N h − nh ) (2.10)
nh
Si en cada uno de los estratos se toma una muestra simple aleatoria, un estimador
insesgado de S h2 es:
1 nh
S h2 = ∑ ( y hi − y h )2 (2.11)
nh − 1 i =1
1 L
s h2
v( y st ) = s ( y st ) = 2
2
N
∑
h =1
N h ( N h − nh )
nh
(2.12)
L
Wh2 s h2 L
W s2
s 2 ( y st ) = ∑ −∑ h h (2.13)
h =1 nh h =1 N
puede llevarse a cabo para minimizar V ( y st ) con un costo específico ó para minimizar el
cos to = C = C 0 + ∑ c h n h (2.14)
Entre estratos el costo es proporcional al tamaño de la muestra, sin embargo, el costo por
unidad ch puede variar entre estratos. El término c0 representa un costo fijo. Esta función de
costo resulta apropiada en los casos en que los costos de observar cada unidad en el estrato
L
C = c0 + ∑ c h nh (2.15)
h =1
L
Wh2 S h2 L
Wh2 S h2 L
Wh2 S h2
V = V ( y st ) = ∑ (1 − f h ) = ∑ −∑ (2.16)
h =1 nh h =1 nh h =1 Nh
Los problemas a resolver son escoger nh para minimizar V con un determinado costo, y
⎛ W 2S 2 ⎞ ⎛ W 2S 2 ⎞
V ' C ' = ⎜⎜V + ∑ h h ⎟(C − c0 ) = ⎜ ∑ h h ⎟(∑ c h n h ) (2.17)
⎟ ⎜ ⎟
⎝ Nh ⎠ ⎝ nh ⎠
(∑ a )(∑ b ) − (∑ a b ) = ∑∑ (a b
2
h
2
h h h
2
i j − a j bi ) 2 (2.18)
i j >i
(∑ a )(∑ b ) ≥ (∑ a b )
2
h
2
h h h
2
(2.19)
considera
Wh S h
ah = , bh = c h nh , a h bh = Wh S h c h
nh
⎛ W 2S 2 ⎞
V ' C ' = ⎜⎜ ∑ h h ⎟⎟(∑ ch nh )) = (∑ a )(∑ b ) ≥ (∑W S
2
h
2
h h h ch )
2
⎝ nh ⎠
por lo tanto, el valor de nh que hace V’C’ mas pequeño es (∑W S h h )
2
ch . Ocurriendo un
mínimo cuando
bh nh ch
= =k (2.20)
a h Wh S h
nh Wh S h / c h N h S h / ch
= = (2.21)
n ∑ (W S h h / ch ) ∑ (N h S h / ch )
se escogerá la muestra para obtener un costo determinado total C ó para obtener una
(C − c o )∑ ( N h S h / ch )
n= (2.22)
∑ (N h S h ch )
n=
(∑W S h h ch )∑W S h h / ch
(2.23)
V + (1 / N )∑ Wh S 2
h
Wh S h Nh Sh
nh = n =n (2.24)
∑ Wh S h ∑ N h S h
El resultado anterior, en general es conocido como asignación de Neyman. Al sustituir el
(∑W S ) ∑W S 2 2
)= −
h h h h
Vmin ( y st (2.25)
n N
II.2.5 Precisión relativa de muestreo aleatorio estratificado y muestreo aleatorio
simple
Realizada de manera adecuada la estratificación puede traer como resultado una menor
varianza para la media estimada o total que la proporcionada con una muestra aleatoria
S2
Vmas = (1 − f ) (2.26)
n
(1 − f ) ∑W S 2
∑W S 2
= ∑Wh S h2 = −
h h h h
V prop (2.27)
n n N
( ∑ Wh S h ) 2 ∑W S 2
Vopt = −
h h
(2.28)
n N
estratificada, se tiene
( N − 1) S 2 = ∑∑ ( y hi − Y ) 2 =
h i
= ∑ ∑ ( y hi − Y h ) 2 + ∑∑ (Y h − Y ) 2
h i h i
= ∑∑ ( y hi − Y h ) + ∑ N h (Y h − Y ) 2
2
h i h
= ∑ ( N h − 1) S + ∑ N h (Y h − Y ) 2
2
h si 1 / N h → 0
h h
S 2 = ∑ Wh S h2 + ∑ Wh (Y h − Y ) 2 (2.29)
Por lo tanto
S 2 (1 − f ) (1 − f )
Vmas = (1 − f )
n
=
n
∑ Wh S h2 +
n
∑ Wh (Y h − Y ) 2
(2.30)
(1 − f )
= V prop +
n
∑ Wh (Y h − Y ) 2
Por definición de Vopt, se debe tener Vprop ≥ Vopt. De las expresiones (2.27) y (2.28)
V prop − Vopt =
1
n
(∑W Sh
2
h − (∑ Wh S h )
2
)
(2.31)
=
1
n
(∑W (S
h h − S) 2
)
∑W ( S h − S ) 2 = ∑ Wh ( S h2 − 2 S S h + S )
2
h
= ∑ Wh S h2 − 2 S ∑ Wh S h + S ∑W
2
h
= ∑ Wh S h2 − 2 S + S = ∑ Wh S h2 − S
2 2 2
1 (1 − f )
Vmas = Vopt +
n
∑ Wh ( S h − S ) 2 +
n
∑Wh (Y h − Y ) 2 (2.32)
Al analizar la ecuación anterior, se puede notar que hay dos componentes que reducen la
eliminación de las diferencias de las medias de los estratos; la segunda, es decir, el término
medio, proviene de la eliminación del efecto de las diferencias entre las desviaciones
(1 − f ) ⎡ 1 ⎤
Vmas = V prop + ⎢
n( N − 1) ⎣
∑ N h (Y h − Y ) 2 − ∑ ( N − N h ) S h2 ⎥
N ⎦
(2.33)
Lo cual induce a pensar que en algunos casos la estratificación puede proporcionar una
1
∑N h (Y h − Y ) 2 <
N
∑ (N − N h ) S h2
correspondiente. Si fuera posible hacer esto, no habría traslape entre estratos, y la varianza
2. Las variables que se intentan conocer estén altamente relacionadas con el tamaño
de tales conjuntos.
3. Se cuente con una buena medida de los tamaños de los distintos estratos.
incremento en la precisión por la existencia de muchos factores que hacen que las personas
vivan o se reúnan en un área común, mostrando similitudes en sus características
proporcional resulta ineficiente, ya que en una subpoblación grande la varianza será mucho
mayor que en una pequeña. Por lo que utilizar una asignación óptima, generará mejores
Para los casos en que se deseen reducciones grandes en la varianza, se buscar formar
estratos en los que las unidades de muestreo sean lo más homogéneas posibles respecto a
las variables que se desean conocer. Este objetivo se cumple cuando la variación entre
unidades de muestreo dentro del estrato sea menor que la variación de la población total.
Sean y0, yL el valor menor y valor mayor de y en la población que se encuentra en estudio.
El problema a resolver, es encontrar los límites entre estratos y1, y2,…, yL-1 tales que
2
1⎛ L ⎞ 1 L
V ( y st ) = ⎜ ∑ Wh S h ⎟ − ∑W S h
2
h (2.34)
n ⎝ h =1 ⎠ N h =1
que yh solo aparece en la suma en los términos WhSh y Wh+1Sh+1,se tiene lo siguiente
∂
(∑W S ) = ∂ (Wh S h ) +
∂
(Wh.+1 S h +1 ) (2.35)
∂y h ∂y ∂y h
h h
h
Wh = ∫ f (t )dt ,
y h −1
∂y h
= f ( yh ) (2.36)
Además
2
⎡ yh ⎤
yh
⎢
⎢
∫ tf (t ) dt ⎥
⎥⎦
Wh S h2 = ∫ t 2 f (t )dt − ⎣ hy−1
y
h
(2.37)
∫ f (t )dt
y h −1
y h −1
Al derivar lo anterior
∂Wh ∂S
S h2 + 2Wh S h h = y h2 f ( y h ) − 2 y h µ h f ( y h ) + µ h2 f ( y h )
∂y h ∂y h
∂ (Wh S h ) ∂Wh ∂S 1 ( y − µ h ) 2 + S h2
= Sh + Wh h = f ( y h ) h
∂y h ∂y h ∂y h 2 Sh
∂ (Wh +1 S h +1 ) 1 ( y h − µ h +1 ) 2 + S h2+1
= − f ( yh ) (2.38)
∂y h 2 S h +1
( y h − µ h ) 2 + S h2 ( y h − µ h +1 ) 2 + S h2+1
= h = 1,2,K, L − 1 (2.39)
Sh S h +1
de las fronteras. Por tanto, es necesario realizar una aproximación que permita conseguir
Z ( y) = ∫
y0
f (t ) dt (2.40)
Si se consideran estratos numerosos y estrechos, f(y) debería ser aproximadamente
Wh = ∫ f (t )dt =& f
y h −1
h ( y h − y h −1 )
1
S h =& ( y h − y h.−1 )
12
yh
Z h − Z h −1 = ∫
y h −1
f (t ) dt =& f h ( y h − y h −1 )
L L L
12 ∑ Wh S h =& ∑ f h ( y h − y h −1 ) 2 =& ∑ ( Z h − Z h −1 ) 2 (2.41)
h =1 h =1 h =1
Debido a que (ZL-Z0) es fija, resulta fácil verificar que la suma de la derecha se minimiza
al hacer (Zh-Zh-1) constante. Dado f(y), la regla consiste en computar el acumulado de √f(y)
y escoger yh de tal manera que se creen intervalos de amplitud similar en la escala del
acumulado de √f(y).
estratos, siempre será posible mejorar la situación llevando a cabo más subdivisiones a los
igual número de unidades que serán seleccionadas. Sin embargo, al sobrepasar un número
la varianza cuando la estratificación para cierta variable y se hace con respecto a otra
amplitud. Entonces
d2 Nh 1
S xh2 = Wh = =
12k 2 N k
k d2 S e2
n
∑ h yh 12nk n
W 2 2
S = +
Si el número de estratos aumentara a αk, la varianza relacionada con tal número será
1 d2 S e2
+
α 2 12nk 2 n
significativas en la varianza.
Dado que la mejor asignación para una variable puede no ser la mejor para otra, se debe
llegar a un arreglo para encuestas con más de una variable. El primer paso consiste en
donde se consideren las más importantes. En el caso de que existan buenos datos previos,
se puede calcular la asignación óptima de cada característica y ver en que punto existen