Capitulo2 PDF

CAPÍTULO II.
TEORÍA DE MUESTREO
II.1 Muestreo
Actualmente el muestreo puede ser considerado como un instrumento organizado para
obtener hechos. Permite que se tomen decisiones que toman en cuenta factores de
importancia de los problemas que se desean resolver, además de ocuparse de la adecuada
presentación de los hechos individuales registrados y de la manera en que éstos se
recopilan y resumen.
Algunas de las ventajas que se presentan, si se piensa en realizar una muestra, son
mencionadas a continuación:
Costo reducido. Si los datos obtenidos provienen de una pequeña fracción de la población,
los gastos asociados a su recopilación serán mucho menores que si se intenta realizar un
censo. Cuando se trata con poblaciones grandes, resultados precisos pueden obtenerse de
muestras que solamente representan una pequeña fracción de la población.
Mayor rapidez. Como consecuencia de lo anterior, los datos pueden recolectarse y
resumirse rápidamente con una muestra, siendo esto de vital importancia cuando se
requiere la información con urgencia.
Mayor alcance. Para la realización de algunos tipos de encuestas se cuenta con personal y
recursos limitados. Lo anterior conlleva a que la realización de un censo sea algo

impráctico, y por tanto se tiene mayor flexibilidad respecto a la información que se puede
llegar a obtener.
Mayor exactitud. Dado que se reduce el volumen de trabajo en gran medida, se puede
utilizar personal más capacitado y someterlo a entrenamiento intensivo, con el fin de tener
una supervisión cuidadosa del trabajo de campo y procesamiento de los resultados.
En el diseño de una muestra hay que considerar dos aspectos; inicialmente un proceso de
selección, en la que se incluyen en la muestra algunos elementos de la población; y
posteriormente un proceso de estimación, en el que se llevan a cabos los cálculos de las
estadísticas de la muestra, que son estimadores muestrales de valores de la población.
El diseño de una muestra considera las tareas de selección y estimación para realizar
inferencias que vayan del valor muestral al valor de la población. Un valor de la población
es una expresión numérica que sintetiza los valores de una o varias características de la
totalidad de la población; en otras palabras, una medida resumen de una cualidad de la
distribución de la variable o variables en la población definida.
El valor de la muestra, o estadística, es una estimación que se calcula a partir de los
elementos que conforman la muestra. Por el contrario, el valor de la población depende de
todos los elementos que forman parte de la población.
Una de las desventajas al utilizar el muestreo, es que dentro de los valores muestrales que
se pueden obtener, es posible llegar a toparse con algunas deficiencias resultado de una
designación de solo una fracción de la población total a ser observada en la muestra, sin
embargo, al realizar un buen diseño de muestra, se tiene como consecuencia que estos
errores tengan la menor presencia posible.
Dentro del muestreo se pueden distinguir varias formas.
1. Muestras casuales o fortuitas, en las cuales se sacan conclusiones solamente de
elementos que llegan por casualidad.
2. Selección experta, que se considera como un tipo de muestro no aleatorio, ya que
personas consideradas como expertas se encargan de escoger unidades que
consideran típicas o representativas.
3. Muestreo de cuota que es aquel en el que de acuerdo a algunas variables
demográficas, se construye una muestra relativamente proporcional a la población.
4. Muestreo de poblaciones móviles. En el que la población total es estimada de la
proporción de individuos en la recaptura, que han sido capturados de manera previa
y fueron marcados.
En los tipos de muestreo anteriores, se llevan a cabo varias suposiciones acerca de las
distribuciones de las variables de encuesta en la población. En un sentido contrario, en los
casos de muestreo probabilístico, se pueden llevar a cabo inferencias de la población por
medio de métodos estadísticos, sin tener que hacer suposiciones acerca de ella. En este
último, cada uno de los elementos de la población tiene una probabilidad conocida además
de no nula, de ser seleccionado. El valor de tal probabilidad se determina de acuerdo al
diseño de la muestra.
Las muestras probabilísticas en general son diseñadas para ser medibles, es decir, la
inferencia estadística de los valores de la población, resultado de la ejecución de un
muestreo en una población particular, pueda basarse en medidas de variabilidad.
El muestreo aleatorio simple es el proceso de selección básico y los demás procedimientos
de selección de muestras pueden considerarse como modificaciones de él.
1. Mesip, es un método de selección con igual probabilidad para todos los elementos
de la población.
2. Muestreo de elementos, en este tipo los elementos son también las únicas unidades
de muestreo.
3. La estratificación, se refiere a la selección de la muestra a partir de varias
subpoblaciones conocidas como estratos, en los que se ha divido la población.
4. La selección sistemática, se puede considerar como una alternativa de selección
aleatoria, en este caso se seleccionan las unidades de muestreo en secuencias
separadas en lista usando un intervalo de selección.
5. Muestreo en dos fases, en este caso se subselecciona la muestra final a partir de una
muestra preseleccionada más grande, que contiene información que permite
mejorar la selección final.
Un buen diseño de muestra, requiere se equilibren en la medida de lo posible 4 criterios:
a. Orientación hacía la meta. El diseño completo, tanto al momento de realizar la
selección como la estimación, debe estar orientado a los objetivos de la

investigación. Estas consideraciones deben figurar al momento de seleccionar y
definir a la población, en la medición y procedimientos de muestreo.
b. La medibilidad es una característica que permite calcular, a partir de la información
de la muestra, estimaciones válidas o aproximaciones de su variabilidad de
muestreo. Esta es la base necesaria para que se pueda llevar a cabo inferencia
estadística, y sirve como puente entre el resultado de la muestra, y el valor
desconocido de la población.
c. Practicidad, que se refiere a los problemas que deben ser resueltos para poder llevar
a cabo el diseño como se propuso de manera inicial. La simplicidad siempre debe
encontrarse entre los objetivos, ya que se reduce el riesgo de errores, y se compensa
en gran medida la pérdida de un poco de eficiencia teórica. El arte del muestreo
consiste en llevar a cabo un diseño práctico que se comporte de la mejor manera
posible, aún cuando no sea perfecto, y se adapte a un modelo.
d. Economía, que se refiere a cumplir los objetivos con un costo mínimo. Una muestra
será demasiado pequeña si los resultados que ofrece carecen de precisión suficiente
para contribuir a las decisiones. Por otro lado, una muestra será demasiado grande
si sus resultados son más precisos de lo que se requiere. Es necesario mediar estas
dos situaciones considerando el costo en el que se incurre al realizar el muestreo.
En general estos cuatro criterios suelen estar en conflicto, sin embargo, se deben equilibrar
y combinar para conseguir un buen diseño de muestreo.

A continuación se exponen características deseables de una muestra, que sin embargo no
son por sí mismos necesarios y suficientes para tener una buena muestra.
- Las muestras probabilísticas requieren de probabilidades no nulas y que sean conocidas.
- Las muestras medibles son muestras probabilísticas, diseñadas para permitir estimar la
variabilidad de muestreo.
- Los muestreos mesip, que son clases especiales de muestreo probabilístico, requieren
probabilidades iguales para cada uno de los elementos.
- Los muestreos de área usan segmentos de área como unidades de muestreo.
- Las muestras insesgadas denotan a aquellos diseños en los que el valor esperado es igual
al valor de la población.
- Las muestras precisas son aquellas que tienen errores estándar bajos.
- Las muestras económicas tienen costos unitarios bajos para una varianza fija.
- Las muestras eficientes denotan una precisión alta, es decir, baja varianza por elemento.
II.2 Muestreo Aleatorio Estratificado
II.2.1 Descripción.
En el muestreo estratificado a la población que consta de N unidades se le divide de
manera primaria en subpoblaciones con N1, N2,…, NL unidades respectivamente. Estas
poblaciones no deben contener ningún traslape, es decir, sus elementos deben ser
excluyentes, y al reunirlas deben comprender la totalidad de la población, de tal manera
que:
N1 + N 2 +...+ N L = N
A cada una de estas subpoblaciones se le denominará estrato. Para lograr el beneficio total
derivado de la estratificación, los valores de las Nh deben ser conocidos. Cuando los
estratos han sido determinados, se selecciona una muestra de cada uno de ellos, siendo esta
selección independiente en cada uno de los diferentes estratos. El tamaño de las muestras
en cada uno de los estratos se denota por n1, n2,…,nL, respectivamente.
En caso de que se haya tomado una muestra aleatoria simple en cada uno de los estratos, a
todo el procedimiento se le designará con el nombre de muestreo aleatorio estratificado.
De la muestra que se obtenga en cada uno de los estratos, se calcula la media
correspondiente, o cualquier otra estadística, y ésta se pondera apropiadamente para
obtener una estimación combinada del total de la población. Del mismo modo, se calculan
las varianzas dentro del estrato, son ponderadas adecuadamente y se suman para llegar a
una estimación combinada para la población.
La estratificación es una técnica empleada comúnmente, debido a razones diversas entre
las que encontramos:
⇒ Existencia de una gran conveniencia administrativa, ya que si se cuenta con
diversas oficinas de campo, se pueden supervisar varias encuestas en distintas
partes de la población.
⇒ Presencia de problemas de muestreo que no son homogéneos para todas las partes
de la población, por lo que al dividirla es posible conseguir estratos que compartan

características similares, lo cual es una característica deseable al realizar la
estratificación.
⇒ Se puede llegar a producir una ganancia en precisión para algunas características
que se quieran conocer de la población. Es posible llegar a dividir una población
heterogénea en subpoblaciones que sean homogéneas internamente. Si cada uno de
los estratos es homogéneo, en el hecho de que las medidas de la población varíen
muy poco de una unidad a otra, se puede obtener un cálculo preciso de la media de
cualquier estrato de una pequeña muestra de éste. Estos cálculos pueden entonces
combinarse para obtener una estimación precisa del total de la población.
⇒ La estratificación es utilizada para reducir las varianzas de las estimaciones de la
muestra; las cuales van disminuyendo de acuerdo al grado en que las medias de los
estratos difieran entre ellas y a la homogeneidad que exista dentro de ellos.
⇒ Dentro de los diferentes estratos, se pueden utilizar diferentes métodos y
procedimientos.
a. Si la distribución física de algunas porciones de la población difiere
radicalmente, puede resultar beneficioso realizar procedimientos diferentes
a las partes.
b. Puede existir contraste en las listas disponibles para diversos sectores de la
población.
c. La existencia de naturaleza diversa en los elementos en algunas partes de la
población podría requerir la utilización de procedimientos distintos.
⇒ Los estratos pueden construirse por que las subpoblaciones dentro de ellos mismos
también se consideran como dominios de estudio. Donde un dominio se define

como una parte de la población para la cual se planean estimaciones separadas en el
diseño de la muestra.
La teoría del muestreo estratificado se relaciona con las propiedades de las estimaciones de
una muestra estratificada y con la mejor opción del tamaño de la muestra nh para obtener la
máxima precisión posible.
II.2.2 Notación
El sufijo h denota el estrato e i la unidad dentro del estrato.
Nh Número total de unidades en el estrato h
nh Número de unidades en la muestra del estrato h
yhi Valor de la i-ésima unidad
Wh=Nh/N Peso del estrato h
fh=nh/Nh Fracción de muestreo en el estrato h
Nh
_ ∑y hi
Yh = i =1
Media poblacional
Nh
nh
_ ∑y hi
yh = i =1
Media muestral
nh
Nh
∑ (y −Y h )
2
hi
s h2 = i =1
Varianza poblacional
Nh −1
(1 − f ) 2
V ( y) = S Varianza de la media en m.a.s.
n
II.2.3 Propiedades de los estimadores
Para obtener la media global, el estimador utilizado en muestreo estratificado es y st ,
donde:
L
∑N h yh L
y st = h =1
= ∑ Wh y h (2.1)
N h =1
donde N = N 1 + N 2 + ... + N L
El estimador y st en general no es el mismo para la media muestral. Esta media
muestral, y , puede escribirse:
∑n h yh
y= h =1
(2.2)
n
Es evidente que y coincide con y st , dado que en cualquier estrato se cumpla con lo
siguiente:
nh N h nh n
= ó = ó fh = f
n N Nh N
Lo cual implica que la fracción de muestreo sea la misma en cualquiera de los estratos.
Este tipo de estratificación se conoce como estratificación con asignación proporcional de
nh.
A continuación se describen las propiedades principales del estimador y st en los siguientes
teoremas:
Teorema 1. Si en cada estrato el estimador muestral y h es insesgado, entonces y st es un
_
estimador insesgado de la media poblacional Y .
Demostración:
⎛ L ⎞ L
E ( y st ) = E ⎜ ∑ Wh y h ⎟ = ∑ Wh Y h
⎝ h =1 ⎠ h =1
debido a que los estimadores son insesgados en los estratos individuales. La media
poblacional puede escribirse:
L Nh L
∑∑ y hi ∑N h Yh L
Y= h =1 i =1
= h =1
= ∑ Wh Y h
N N h =1
Lo cual completa la demostración.
Teorema 2. Si las muestras se obtienen de manera independiente en los diferentes estratos:
L
V ( y st ) = ∑ Wh2V ( y h ) (2.3)
h =1
donde V ( y h ) es la varianza de y h sobre muestras repetidas del estrato h.
Demostración:
L
y st = ∑ Wh y h (2.4)
h =1
y st es una función lineal de y h con sus respectivos pesos Wh . Por tanto es posible
expresar el resultado estadístico para la varianza mediante la función lineal:
L L L
V ( y st ) = ∑ Wh2V ( y h ) + 2∑∑ WhW j Cov ( y h y j ) (2.5)
h =1 h =1 j > h
Sin embargo, debido a que las muestras entre estratos se eligieron de manera
independiente, los términos de covarianza desaparecen. Lo cual da como resultado la
ecuación (2.3).
Lo importante acerca de estos resultados es que la varianza de y st depende solo de las
varianzas de los estimadores de las medias de los estratos individuales Y h . Si fuera posible
fraccionar una población altamente variable en estratos tales que todos los elementos
tengan el mismo valor dentro del estrato, sería posible estimar Y sin error alguno. La
ecuación (2.4) muestra que el uso del peso correcto del estrato Nh/N al estimar y st
permite alcanzar este propósito.
Teorema 3. Para muestreo aleatorio estratificado, la varianza del estimador y st es:
1 L
S h2 L
S2
V ( y st ) =
N2
∑ N h ( N h − nh )
h =1
= ∑Wh2 h (1 − f h )
nh h=1 nh
(2.6)
Demostración. Debido a que y h es un estimador insesgado de Y h , el teorema (2.2) puede
aplicarse. Además aplicado a un estrato individual:
S h2 N h − nh
V (yh ) =
nh Nh
Por sustitución en el resultado del teorema 2, se obtiene:
1 L
1 L
S h2 2
2 Sh
V ( y st ) = 2
N
∑
h =1
N V (yh ) = 2
2
h
N
∑
h =1
N h ( N h − nh )
nh
= ∑ Wh
nh
(1 − f h )
Algunos casos particulares para esta fórmula se exponen en los siguientes corolarios.
Corolario 1. Si las fracciones de muestro nh/Nh son insignificantes para todos los estratos,
1 N h2 S h2 Wh2 S h2
V ( y st ) = 2
N
∑ n =∑ n (2.7)
h h
Corolario 2. En el caso de asignación proporcional, se hace la siguiente sustitución en 2.6:
nN h
nh =
N
Reduciéndose la varianza a:
N h S h2 ⎛ N − n ⎞ 1 − f
V ( y st ) = ∑ ⎜ ⎟= ∑W S
h
2
h (2.8)
N n ⎝ N ⎠ n
Corolario 3. Si el muestreo es proporcional y las varianzas en todos los estratos tienen el
mismo valor, Sw2, se obtiene el resultado siguiente:
S w2 ⎛ N −n⎞
V ( y st ) = ⎜ ⎟ (2.9)
n ⎝ N ⎠
Teorema 4. Si Yˆst = N y st es el estimador de la población total Y, entonces:
S h2
V (Yˆst ) = ∑ N h ( N h − nh ) (2.10)
nh
Lo cual se demuestra fácilmente utilizando el teorema 3.
Si en cada uno de los estratos se toma una muestra simple aleatoria, un estimador
insesgado de S h2 es:
1 nh
S h2 = ∑ ( y hi − y h )2 (2.11)
nh − 1 i =1
Lo que nos lleva al siguiente teorema.

Teorema 5. Con muestreo aleatorio estratificado, un estimador insesgado de la varianza es
1 L
s h2
v( y st ) = s ( y st ) = 2
2
N
∑
h =1
N h ( N h − nh )
nh
(2.12)
Con la siguiente alternativa para propósitos de cálculo:
L
Wh2 s h2 L
W s2
s 2 ( y st ) = ∑ −∑ h h (2.13)
h =1 nh h =1 N
II.2.4 Asignación óptima
En muestreo estratificado la selección de tamaños de muestra nh en el estrato respectivo h,
puede llevarse a cabo para minimizar V ( y st ) con un costo específico ó para minimizar el
costo con un valor específico de V ( y st ) .
Considerando la función de costo más simple
cos to = C = C 0 + ∑ c h n h (2.14)
Entre estratos el costo es proporcional al tamaño de la muestra, sin embargo, el costo por
unidad ch puede variar entre estratos. El término c0 representa un costo fijo. Esta función de
costo resulta apropiada en los casos en que los costos de observar cada unidad en el estrato
respectivo tienen el mayor peso.
Teorema 6. Si consideramos la función de costo anterior, la varianza de la media estimada
y st es mínima para un costo C, y el costo es mínimo para una varianza V( y st )
determinada, cuando nh es proporcional a Wh S h / c h .

Demostración. Teniendo lo siguiente:
L
C = c0 + ∑ c h nh (2.15)
h =1
L
Wh2 S h2 L
Wh2 S h2 L
Wh2 S h2
V = V ( y st ) = ∑ (1 − f h ) = ∑ −∑ (2.16)
h =1 nh h =1 nh h =1 Nh
Los problemas a resolver son escoger nh para minimizar V con un determinado costo, y
posteriormente escoger nh tal que se minimice el costo con un valor determinado de V.
Ambos problemas resultan equivalentes a minimizar el producto
⎛ W 2S 2 ⎞ ⎛ W 2S 2 ⎞
V ' C ' = ⎜⎜V + ∑ h h ⎟(C − c0 ) = ⎜ ∑ h h ⎟(∑ c h n h ) (2.17)
⎟ ⎜ ⎟
⎝ Nh ⎠ ⎝ nh ⎠
Lo anterior puede minimizarse usando la desigualdad de Cauchy-Schwarz. Si ah, bh son
conjuntos de números positivos:
(∑ a )(∑ b ) − (∑ a b ) = ∑∑ (a b
2
h
2
h h h
2
i j − a j bi ) 2 (2.18)
i j >i
Con la expresión anterior, la siguiente desigualdad es posible:
(∑ a )(∑ b ) ≥ (∑ a b )
2
h
2
h h h
2
(2.19)
sucediendo la igualdad si y solo si bh/ah es constante para toda h. En el caso presente se
considera
Wh S h
ah = , bh = c h nh , a h bh = Wh S h c h
nh
haciendo uso de la desigualdad (2.19)
⎛ W 2S 2 ⎞
V ' C ' = ⎜⎜ ∑ h h ⎟⎟(∑ ch nh )) = (∑ a )(∑ b ) ≥ (∑W S
2
h
2
h h h ch )
2
⎝ nh ⎠
por lo tanto, el valor de nh que hace V’C’ mas pequeño es (∑W S h h )
2
ch . Ocurriendo un
mínimo cuando
bh nh ch
= =k (2.20)
a h Wh S h
En términos del tamaño total de la muestra nh en el estrato, se tiene
nh Wh S h / c h N h S h / ch
= = (2.21)
n ∑ (W S h h / ch ) ∑ (N h S h / ch )
Para completar la asignación es necesario obtener el valor de n. La solución dependerá si
se escogerá la muestra para obtener un costo determinado total C ó para obtener una
varianza determinada V para y st . En el caso de un costo fijo, se sustituyen los valores
óptimos de nh en la función de costo y se obtiene n.
(C − c o )∑ ( N h S h / ch )
n= (2.22)
∑ (N h S h ch )
Para el caso de V fija, sustituimos el valor óptimo de nh en la fórmula para V ( y st ) .
n=
(∑W S h h ch )∑W S h h / ch
(2.23)
V + (1 / N )∑ Wh S 2
h
El caso especial en el que ch = c conlleva a lo siguiente
Wh S h Nh Sh
nh = n =n (2.24)
∑ Wh S h ∑ N h S h
El resultado anterior, en general es conocido como asignación de Neyman. Al sustituir el
valor de nh en la fórmula general para V ( y st )
(∑W S ) ∑W S 2 2
)= −
h h h h
Vmin ( y st (2.25)
n N
II.2.5 Precisión relativa de muestreo aleatorio estratificado y muestreo aleatorio
simple
Realizada de manera adecuada la estratificación puede traer como resultado una menor
varianza para la media estimada o total que la proporcionada con una muestra aleatoria
simple. Sin embargo si los valores de nh se encuentran lejos de los óptimos, la
estratificación puede tener como resultado una varianza mayor.
A continuación se describe la manera en que se obtiene ganancia por medio de la
estratificación, en comparación con el muestreo aleatorio simple.
S2
Vmas = (1 − f ) (2.26)
n
(1 − f ) ∑W S 2
∑W S 2
= ∑Wh S h2 = −
h h h h
V prop (2.27)
n n N
( ∑ Wh S h ) 2 ∑W S 2
Vopt = −
h h
(2.28)
n N
De la identidad algebraica estándar para el análisis de varianza de una población
estratificada, se tiene
( N − 1) S 2 = ∑∑ ( y hi − Y ) 2 =
h i
= ∑ ∑ ( y hi − Y h ) 2 + ∑∑ (Y h − Y ) 2
h i h i
= ∑∑ ( y hi − Y h ) + ∑ N h (Y h − Y ) 2
2
h i h
= ∑ ( N h − 1) S + ∑ N h (Y h − Y ) 2
2
h si 1 / N h → 0
h h
S 2 = ∑ Wh S h2 + ∑ Wh (Y h − Y ) 2 (2.29)
Por lo tanto
S 2 (1 − f ) (1 − f )
Vmas = (1 − f )
n
=
n
∑ Wh S h2 +
n
∑ Wh (Y h − Y ) 2
(2.30)
(1 − f )
= V prop +
n
∑ Wh (Y h − Y ) 2
Por definición de Vopt, se debe tener Vprop ≥ Vopt. De las expresiones (2.27) y (2.28)
tenemos el siguiente resultado
V prop − Vopt =
1
n
(∑W Sh
2
h − (∑ Wh S h )
2
)
(2.31)
=
1
n
(∑W (S
h h − S) 2
)
donde S = ∑ Wh S h es una media ponderada de las Sh.
Lo anterior se puede ver en el desarrollo siguiente
∑W ( S h − S ) 2 = ∑ Wh ( S h2 − 2 S S h + S )
2
h
= ∑ Wh S h2 − 2 S ∑ Wh S h + S ∑W
2
h
= ∑ Wh S h2 − 2 S + S = ∑ Wh S h2 − S
2 2 2
Al realizar algunas sustituciones
1 (1 − f )
Vmas = Vopt +
n
∑ Wh ( S h − S ) 2 +
n
∑Wh (Y h − Y ) 2 (2.32)
Al analizar la ecuación anterior, se puede notar que hay dos componentes que reducen la
varianza cuando se cambia de muestreo aleatorio simple a asignación óptima. El primer
componente que la reduce, que es el término en la extrema derecha, se debe a la
eliminación de las diferencias de las medias de los estratos; la segunda, es decir, el término
medio, proviene de la eliminación del efecto de las diferencias entre las desviaciones
estándar de los estratos.

El desarrollo anterior lleva a lo siguiente cuando 1/Nh es despreciable
Vopt ≤ V prop ≤ Vmas
En caso que tal término no fuera despreciable, se obtendría
(1 − f ) ⎡ 1 ⎤
Vmas = V prop + ⎢
n( N − 1) ⎣
∑ N h (Y h − Y ) 2 − ∑ ( N − N h ) S h2 ⎥
N ⎦
(2.33)
Lo cual induce a pensar que en algunos casos la estratificación puede proporcionar una
varianza mayor que el muestro aleatorio simple cuando
1
∑N h (Y h − Y ) 2 <
N
∑ (N − N h ) S h2
II.2.6 Ganancias en precisión gracias al uso de la estratificación
La variable ideal para realizar estratificación, es aquella que se va a medir en la encuesta
correspondiente. Si fuera posible hacer esto, no habría traslape entre estratos, y la varianza
dentro del estrato sería menor que la varianza global.
Prácticamente lo anterior no es posible, sin embargo, cumpliéndose las condiciones
siguientes, se puede tratar de conseguir tal situación
1. La población conste de conjuntos que varíen considerablemente en tamaño.
2. Las variables que se intentan conocer estén altamente relacionadas con el tamaño
de tales conjuntos.
3. Se cuente con una buena medida de los tamaños de los distintos estratos.
La estratificación geográfica es muy común y generalmente va acompañada por un
incremento en la precisión por la existencia de muchos factores que hacen que las personas
vivan o se reúnan en un área común, mostrando similitudes en sus características
principales. Lo cual genera estratos con mayor uniformidad.
En lo que concierne a la estratificación proporcional respecto a la óptima, cuando se tienen
subpoblaciones con tamaños grandes y pequeños estratificadas por tamaño, el muestreo
proporcional resulta ineficiente, ya que en una subpoblación grande la varianza será mucho
mayor que en una pequeña. Por lo que utilizar una asignación óptima, generará mejores
estimaciones de los valores que se quieran conocer.
II.2.7 Construcción de estratos
Para los casos en que se deseen reducciones grandes en la varianza, se buscar formar
estratos en los que las unidades de muestreo sean lo más homogéneas posibles respecto a
las variables que se desean conocer. Este objetivo se cumple cuando la variación entre
unidades de muestreo dentro del estrato sea menor que la variación de la población total.
Sean y0, yL el valor menor y valor mayor de y en la población que se encuentra en estudio.
El problema a resolver, es encontrar los límites entre estratos y1, y2,…, yL-1 tales que
2
1⎛ L ⎞ 1 L
V ( y st ) = ⎜ ∑ Wh S h ⎟ − ∑W S h
2
h (2.34)
n ⎝ h =1 ⎠ N h =1
se minimice. Si se ignora el segundo término, resulta suficiente minimizar ΣWhSh. Debido a
que yh solo aparece en la suma en los términos WhSh y Wh+1Sh+1,se tiene lo siguiente
∂
(∑W S ) = ∂ (Wh S h ) +
∂
(Wh.+1 S h +1 ) (2.35)
∂y h ∂y ∂y h
h h
h
Si se tiene que f(y) es la función de frecuencia de y,

∂Wh
yh
Wh = ∫ f (t )dt ,
y h −1
∂y h
= f ( yh ) (2.36)
Además
2
⎡ yh ⎤
yh
⎢
⎢
∫ tf (t ) dt ⎥
⎥⎦
Wh S h2 = ∫ t 2 f (t )dt − ⎣ hy−1
y
h
(2.37)
∫ f (t )dt
y h −1
y h −1
Al derivar lo anterior
∂Wh ∂S
S h2 + 2Wh S h h = y h2 f ( y h ) − 2 y h µ h f ( y h ) + µ h2 f ( y h )
∂y h ∂y h
donde µ h es la media de y en el estrato h. Sumándose a ambos lados S h2 f(yh) y
posteriormente al dividir entre 2Sh
∂ (Wh S h ) ∂Wh ∂S 1 ( y − µ h ) 2 + S h2
= Sh + Wh h = f ( y h ) h
∂y h ∂y h ∂y h 2 Sh
∂ (Wh +1 S h +1 ) 1 ( y h − µ h +1 ) 2 + S h2+1
= − f ( yh ) (2.38)
∂y h 2 S h +1
Lo que deriva en las ecuaciones de cálculo para yh
( y h − µ h ) 2 + S h2 ( y h − µ h +1 ) 2 + S h2+1
= h = 1,2,K, L − 1 (2.39)
Sh S h +1
No obstante, estas ecuaciones no son aplicables en la práctica, ya que µ h y S h2 dependen
de las fronteras. Por tanto, es necesario realizar una aproximación que permita conseguir
los resultados deseados. Sea
Z ( y) = ∫
y0
f (t ) dt (2.40)
Si se consideran estratos numerosos y estrechos, f(y) debería ser aproximadamente
uniforme dentro de un estrato dado. Por lo que

yh
Wh = ∫ f (t )dt =& f
y h −1
h ( y h − y h −1 )
1
S h =& ( y h − y h.−1 )
12
yh
Z h − Z h −1 = ∫
y h −1
f (t ) dt =& f h ( y h − y h −1 )
Al sustituir las aproximaciones anteriores
L L L
12 ∑ Wh S h =& ∑ f h ( y h − y h −1 ) 2 =& ∑ ( Z h − Z h −1 ) 2 (2.41)
h =1 h =1 h =1
Debido a que (ZL-Z0) es fija, resulta fácil verificar que la suma de la derecha se minimiza
al hacer (Zh-Zh-1) constante. Dado f(y), la regla consiste en computar el acumulado de √f(y)
y escoger yh de tal manera que se creen intervalos de amplitud similar en la escala del
acumulado de √f(y).
II.2.8 Cantidad de estratos
El concepto general de estratificación lleva a pensar que de una población dividida en k
estratos, siempre será posible mejorar la situación llevando a cabo más subdivisiones a los
estratos. De hecho, la estratificación puede llevarse al grado de tener un número de estratos
igual número de unidades que serán seleccionadas. Sin embargo, al sobrepasar un número
prudente de estratos, el aumentar su cantidad no resulta en una reducción considerable de
la varianza cuando la estratificación para cierta variable y se hace con respecto a otra
llamada x, como se demuestra a continuación de manera sencilla. Sea x una variable
uniforme de 0 a d, además y = x + e, donde e y x no tienen correlación alguna. Entonces

V ( y ) = V ( x) + V (e) . Supóngase el caso en el que se tienen k estratos con la misma
amplitud. Entonces
d2 Nh 1
S xh2 = Wh = =
12k 2 N k
Si la asignación de la muestra es la misma, la varianza estimada de la media poblacional es
k d2 S e2
n
∑ h yh 12nk n
W 2 2
S = +
Si el número de estratos aumentara a αk, la varianza relacionada con tal número será
1 d2 S e2
+
α 2 12nk 2 n
En este caso el primer componente disminuye al realizar un incremento en el número de
estratos, pero el segundo componente se mantiene constante. Debido a lo anterior, se
llegará a un punto en el que el segundo componente se convierte en parte importante de la
varianza y aunque haya incrementos en el número de estratos, no habrá ganancias
significativas en la varianza.
II.3 Estratificación con más de una Variable
Dado que la mejor asignación para una variable puede no ser la mejor para otra, se debe
llegar a un arreglo para encuestas con más de una variable. El primer paso consiste en
reducir las variables consideradas en la asignación a un número relativamente pequeño
donde se consideren las más importantes. En el caso de que existan buenos datos previos,
se puede calcular la asignación óptima de cada característica y ver en que punto existen
desviaciones grandes. Puede darse el caso de variables que se encuentren tan
correlacionadas, que las asignaciones no difieran en gran medida.

Capitulo2 PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Capitulo2 PDF

Cargado por

Copyright:

Formatos disponibles

CAPÍTULO II.

Actualmente el muestreo puede ser considerado como un instrumento organizado para

importancia de los problemas que se desean resolver, además de ocuparse de la adecuada

presentación de los hechos individuales registrados y de la manera en que éstos se

muestras que solamente representan una pequeña fracción de la población.

Mayor rapidez. Como consecuencia de lo anterior, los datos pueden recolectarse y

requiere la información con urgencia.

recursos limitados. Lo anterior conlleva a que la realización de un censo sea algo

una supervisión cuidadosa del trabajo de campo y procesamiento de los resultados.

selección, en la que se incluyen en la muestra algunos elementos de la población; y

posteriormente un proceso de estimación, en el que se llevan a cabos los cálculos de las

estadísticas de la muestra, que son estimadores muestrales de valores de la población.

totalidad de la población; en otras palabras, una medida resumen de una cualidad de la

distribución de la variable o variables en la población definida.

El valor de la muestra, o estadística, es una estimación que se calcula a partir de los

elementos que conforman la muestra. Por el contrario, el valor de la población depende de

todos los elementos que forman parte de la población.

errores tengan la menor presencia posible.

Dentro del muestreo se pueden distinguir varias formas.

1. Muestras casuales o fortuitas, en las cuales se sacan conclusiones solamente de

elementos que llegan por casualidad.

2. Selección experta, que se considera como un tipo de muestro no aleatorio, ya que

personas consideradas como expertas se encargan de escoger unidades que

consideran típicas o representativas.

3. Muestreo de cuota que es aquel en el que de acuerdo a algunas variables

demográficas, se construye una muestra relativamente proporcional a la población.

4. Muestreo de poblaciones móviles. En el que la población total es estimada de la

proporción de individuos en la recaptura, que han sido capturados de manera previa

distribuciones de las variables de encuesta en la población. En un sentido contrario, en los

casos de muestreo probabilístico, se pueden llevar a cabo inferencias de la población por

de no nula, de ser seleccionado. El valor de tal probabilidad se determina de acuerdo al

inferencia estadística de los valores de la población, resultado de la ejecución de un

muestreo en una población particular, pueda basarse en medidas de variabilidad.

El muestreo aleatorio simple es el proceso de selección básico y los demás procedimientos

de selección de muestras pueden considerarse como modificaciones de él.

3. La estratificación, se refiere a la selección de la muestra a partir de varias

subpoblaciones conocidas como estratos, en los que se ha divido la población.

4. La selección sistemática, se puede considerar como una alternativa de selección

aleatoria, en este caso se seleccionan las unidades de muestreo en secuencias

separadas en lista usando un intervalo de selección.

muestra preseleccionada más grande, que contiene información que permite

mejorar la selección final.

Un buen diseño de muestra, requiere se equilibren en la medida de lo posible 4 criterios:

a. Orientación hacía la meta. El diseño completo, tanto al momento de realizar la

selección como la estimación, debe estar orientado a los objetivos de la

definir a la población, en la medición y procedimientos de muestreo.

b. La medibilidad es una característica que permite calcular, a partir de la información

de la muestra, estimaciones válidas o aproximaciones de su variabilidad de

estadística, y sirve como puente entre el resultado de la muestra, y el valor

a cabo el diseño como se propuso de manera inicial. La simplicidad siempre debe

encontrarse entre los objetivos, ya que se reduce el riesgo de errores, y se compensa

en gran medida la pérdida de un poco de eficiencia teórica. El arte del muestreo

consiste en llevar a cabo un diseño práctico que se comporte de la mejor manera

posible, aún cuando no sea perfecto, y se adapte a un modelo.

dos situaciones considerando el costo en el que se incurre al realizar el muestreo.

y combinar para conseguir un buen diseño de muestreo.

- Las muestras probabilísticas requieren de probabilidades no nulas y que sean conocidas.

probabilidades iguales para cada uno de los elementos.

- Los muestreos de área usan segmentos de área como unidades de muestreo.

II.2 Muestreo Aleatorio Estratificado

En el muestreo estratificado a la población que consta de N unidades se le divide de

manera primaria en subpoblaciones con N1, N2,…, NL unidades respectivamente. Estas

excluyentes, y al reunirlas deben comprender la totalidad de la población, de tal manera