Está en la página 1de 48

UNIVERSIDAD DE LOS ANDES

FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES


ESCUELA DE ESTADÍSTICA

LABORATORIO DE ESTADÍSTICA
LUIS NAVA PUENTE
ENERO 2018
MUESTREO POR CONGLOMERADOS
Las unidades de muestreo contienen dos o más
unidades elementales.
La población se subdivide en subpoblaciones
(conglomerados), luego algunos de ellos serán
seleccionados.
La varianza de sus estimadores es por lo general
mayor a la de los estimadores en el MAS y MAE
MUESTREO POR CONGLOMERADOS

Cuando se justifica:

1. Altos costos de movilización o traslado


2. No existe lista de unidades elementales
3. Consideraciones administrativas
MUESTREO POR CONGLOMERADOS

Los conglomerados:
1. Deben construirse de forma tal que sean lo
más semejantes entre si.
2. Deben ser tanto como sea posible,
representativos de la diversidad de la
población.
3. Deben estar bien definidos. Todo elemento
de la población pertenece a sólo un
conglomerado.
MUESTREO POR CONGLOMERADOS

Los conglomerados:
4. Debe existir una estimación razonable del
número de elementos en cada
conglomerado.
5. Deben ser lo suficientemente pequeños para
minimizar costos.
6. Deben escogerse de forma tal que se
minimice el incremento en el error de
muestreo por el agrupamiento.
MUESTREO POR CONGLOMERADOS

Como seleccionar una muestra por


conglomerados:
1. Definir el conglomerado tipo
2. Construir el marco muestral
3. Seleccionar los conglomerados que van a la
muestra mediante un MAS
MUESTREO POR CONGLOMERADOS
MUESTREO POR CONGLOMERADOS
Estimaciones

Casos en el muestreo en una etapa.


1. Todos los conglomerados son de igual
tamaño.
2. Los conglomerados son de diferentes
tamaños.
MUESTREO POR CONGLOMERADOS

Muestreo por Conglomerados en una etapa.


1. Mediante un MAS se seleccionan 𝒏 de los 𝑵
conglomerados que conforman a la
población.
2. Dentro de cada conglomerado seleccionado,
se miden o encuestan todas las unidades
elementales que lo componen.
MUESTREO POR CONGLOMERADOS

Muestreo por Conglomerados en dos etapas.


1. Mediante un MAS se seleccionan 𝒏 de los 𝑵
conglomerados que conforman a la
población.
2. Dentro de cada uno de los 𝒏 conglomerado
de la muestra, se mide o encuesta una
muestra de las unidades elementales que lo
conforman.
MUESTREO POR CONGLOMERADOS

Estimaciones en el muestreo por Conglomerados


en una etapa (tamaños iguales):
𝒎𝒊 = 𝒎 = Número de unidades elementales en el
conglomerado 𝑖
𝑴 = σ𝑵 𝒊=𝟏 𝒎𝒊 = 𝑵𝒎Total de elementos en la población
𝑴

𝑴 = = 𝒎 = Tamaño promedio del conglomerado en la
𝑵
población
σ𝒏
𝒊=𝟏 𝒎𝒊 𝒏𝒎
𝒎ഥ = = = 𝒎Tamaño promedio del conglomerado en
𝒏 𝒏
la muestra
𝒎𝒊
𝒚𝒄𝒊 = 𝒋=𝟏 𝒚𝒊𝒋 = σ𝒎
σ 𝒋=𝟏 𝒚𝒊𝒋 Total del conglomerado 𝑖
MUESTREO POR CONGLOMERADOS
Estimaciones

Estimación de la media poblacional, 𝝁.

σ𝑵
𝒊=𝟏 𝒚𝒄𝒊
𝑻 𝑻 𝑻
𝝁= 𝑵 = = ; 𝝁𝒄 =
σ𝒊=𝟏 𝒎𝒊 𝑴 𝑵𝒎 𝑵

σ𝒏𝒊=𝟏 𝒚𝒄𝒊 σ𝒏𝒊=𝟏 𝒚𝒄𝒊 σ𝒏𝒊=𝟏 𝒚𝒄𝒊


𝝁 ഥ𝒄 = 𝒏
ෝ=𝒚 = ෝ𝒄 =
; 𝝁
σ𝒊=𝟏 𝒎𝒊 𝒏𝒎 𝒏
MUESTREO POR CONGLOMERADOS
Estimaciones

𝟐
𝟐
𝑵−𝒏 σ𝒏𝒊=𝟏 ഥ 𝒄 𝒎𝒊
𝒚𝒄𝒊 − 𝒚
ഥ𝒄
𝑺 𝒚 =

𝑵𝒏𝑴 𝒏−𝟏

𝟐
𝟐
𝑵−𝒏 σ𝒏𝒊=𝟏 ഥ 𝒄 𝒎𝒊
𝒚𝒄𝒊 − 𝒚
ഥ𝒄
𝑺 𝒚 =
𝑵𝒏𝒎 𝒏−𝟏
MUESTREO POR CONGLOMERADOS
Estimaciones

Error de estimación

𝒆 = 𝒛𝜶Τ𝟐 𝑺𝟐 𝒚
ഥ𝒄
MUESTREO POR CONGLOMERADOS
Estimaciones

Estimación del total poblacional, 𝑻 = 𝝉.

෡ 𝒄 = 𝝉ො 𝒄 = 𝑴ഥ
𝑻 𝒚𝒄 = 𝑵ෝ
𝝁𝒄

𝑺𝟐 𝝉ො 𝒄 = 𝑴𝟐 𝑺𝟐 𝒚
ഥ𝒄 = 𝑵𝟐 𝑺𝟐 𝝁
ෝ𝒄

𝒏 𝟐
𝑵−𝒏 ഥ𝒄 𝒎𝒊
𝒚𝒄𝒊 − 𝒚
𝑺𝟐 𝝉ො 𝒄 =𝑵 ෍
𝒏 𝒏−𝟏
𝒊=𝟏
MUESTREO POR CONGLOMERADOS
Estimaciones

Tamaño de la muestra para estimar 𝝁.

𝑵𝑺𝟐𝒄
𝒏=
𝑵𝑫 + 𝑺𝟐𝒄

𝒏 𝟐
ഥ𝒄 𝒎𝒊
𝒚𝒄𝒊 − 𝒚 𝒆𝟐
𝟐
𝑺𝒄 = ෍ ; 𝑫= ഥ𝟐
𝑴
𝒏−𝟏 𝒛𝟐𝜶Τ𝟐
𝒊=𝟏
MUESTREO POR CONGLOMERADOS
Estimaciones

Tamaño de la muestra para estimar 𝑻.


𝑵𝑺𝟐𝒄
𝒏=
𝑵𝑫 + 𝑺𝟐𝒄

𝒆𝟐
𝑫=
𝑵𝟐 𝒛𝟐𝜶Τ𝟐
MUESTREO POR CONGLOMERADOS
Estimaciones

𝑵𝑺𝟐𝝁ෝ𝒄
𝒏=
𝑵𝑫 + 𝑺𝟐𝝁ෝ𝒄

𝒏 𝟐
ෝ𝒄
𝒚𝒄𝒊 − 𝝁 𝒆𝟐
𝑺𝟐𝝁ෝ𝒄 =෍ ; 𝑫=
𝒏−𝟏 𝑵𝟐 𝒛𝟐𝜶Τ𝟐
𝒊=𝟏
MUESTREO POR CONGLOMERADOS
Estimaciones

Estimación de 𝝅.
σ𝒏𝒊=𝟏 𝒂𝒊
ෝ= 𝒏
𝝅
σ𝒊=𝟏 𝒎𝒊

𝟐
𝑵−𝒏 𝟐
ෝ =
𝑺 𝝅 𝑺𝒄

𝑵𝒏𝑴 𝟐

σ𝒏 𝟐
𝟐
ෝ 𝒎𝒊
𝒊=𝟏 𝒂𝒊 − 𝝅
𝑺𝒄 =
𝒏−𝟏
MUESTREO POR CONGLOMERADOS
Estimaciones


𝒆 = 𝒛𝜶Τ𝟐 𝑽 𝝅

𝑵−𝒏 𝟐
ෝ =
𝑽 𝝅 𝝈𝒄

𝑵𝒏𝑴

𝑵𝝈𝟐𝒄
𝒏= 𝟐
𝒆 ഥ 𝟐 + 𝝈𝟐𝒄
𝑵𝑴
𝒛𝜶Τ𝟐
ESTIMADORES INDIRECTOS
En muchas ocasiones se dispone de información
adicional (mediciones asociadas con otras
variables) que puede ser usada para mejorar la
precisión de las estimaciones, proponiendo
otros estimadores indirectos.
1. Estimadores de Razón
2. Estimadores de Regresión y
3. Estimadores de Diferencia
4. Otros (Producto)
ESTIMADORES INSDIRECTOS

• Los métodos indirectos requieren la


observación de una variable auxiliar 𝑋
conjuntamente con 𝑌 . Además se debe
conocer el total para 𝑋.
• La correlación existente entre 𝑋 e 𝑋 es la que
permite incrementar la precisión en las
estimaciones.
ESTIMADORES INSDIRECTOS

Los estimadores indirectos se usan para estimar


el total, la media y la razón propiamente.
ESTIMADORES DE RAZÓN
Es frecuente expresar la relación entre dos variables
mediante su cociente.

A la estimación de la razón, está estrechamente


relacionada la estimación de los parámetros de una de las
dos variables en función de la otra, siempre y cuando la
información sobre esta última sea confiable.

Así se definen los estimadores de razón, los cuales


resultan en muchos casos más eficientes que los
estimadores tradicionales.
ESTIMADORES DE RAZÓN

Estimación de la razón poblacional.

𝑌 ⟶ 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟é𝑠
𝑋 ⟶ 𝑣𝑎𝑟𝑖𝑏𝑎𝑙𝑒 𝑎𝑥𝑖𝑙𝑖𝑎𝑟

Se supone el total de 𝑋, 𝑇𝑋 , conocido.


ESTIMADORES DE RAZÓN

La razón poblacional se define como:

𝑇𝑌 𝜇𝑌
𝑅= =
𝑇𝑋 𝜇𝑋

Su estimador:

𝑇෠𝑌 𝑦ത
𝑟= =
𝑇෠𝑋 𝑥ҧ
ESTIMADORES DE RAZÓN

En el caso óptimo se debe cumplir:


1. Existe una relación entre 𝑌 y 𝑋 expresada por
𝑦 = 𝑏𝑥
2. La varianza de 𝑌 alrededor de la línea recta
es proporcional a 𝑋𝑖
2
𝜎𝑌|𝑋 = 𝑥𝑖 𝜎 2
ESTIMADORES DE RAZÓN

La mayoría de los resultados son aproximados.


• El estimador es consistente en el sentido de
Cochran. El estimador es sesgado aunque es
despreciable si 𝑛 es grande.
• Para 𝑛 grande 𝑟~𝑁𝑜𝑟𝑚𝑎𝑙. Para 𝑛 pequeño su
distribución es asimétrica positiva.
• La formula de la varianza es valida para 𝑛
grande.
ESTIMADORES DE RAZÓN

Una correlación alta (significativa) entre 𝑿 y 𝒀


garantiza obtener estimaciones más eficientes
al considerar la variable auxiliar
ESTIMADORES DE RAZÓN

𝑛 1 σ𝑁 𝑖=1 𝑖 𝑦 − 𝑅𝑥𝑖
2
𝑉 𝑟 ≈ 1−
𝑁 𝑛𝜇𝑋 2 𝑁−1
𝑛 1 2 2 𝜎 2 − 2𝑅𝐶𝑜𝑣 𝑋, 𝑌
𝑉 𝑟 ≈ 1− 𝜎 + 𝑅
𝑁 𝑛𝜇𝑋 2 𝑌 𝑋

𝑛 2
2
𝑛 1 σ𝑖=1 𝑦𝑖 − 𝑟𝑥𝑖
𝑆 𝑟 = 1−
𝑁 𝑛𝜇𝑋 2 𝑛−1

𝑛 1 2 2 𝑆 2 − 2𝑟𝑆
𝑆2 𝑟 = 1− 𝑆𝑌 + 𝑟 𝑋 𝑋,𝑌
𝑁 𝑛𝜇𝑋 2
ESTIMADORES DE RAZÓN

𝐶𝑜𝑣(𝑋, 𝑌)
𝜌𝑋𝑌 =
𝜎𝑋 𝜎𝑌

σ 2 2σ 2
2
𝑛 1 𝑦𝑖 + 𝑟 𝑥𝑖 − 2𝑟 σ 𝑥𝑖 𝑦𝑖
𝑆 𝑟 = 1−
𝑁 𝑛𝜇𝑋 2 𝑛−1

𝑛 1 2 2 𝑆 2 − 2𝑟𝜌
𝑆2 𝑟 = 1− 2
𝑆𝑌 + 𝑟 𝑋 ො𝑋𝑌 𝑆𝑋 𝑆𝑌
𝑁 𝑛𝜇𝑋
ESTIMADORES DE RAZÓN

Error de estimación y limites de confianza para


𝑅.
𝐸𝐸 𝑟 = 𝑉(𝑟)

𝑒 = 𝑧𝛼Τ2 𝑆 2 (𝑟)

𝑟∓𝑒
ESTIMADORES DE RAZÓN

Un ejemplo: Encuesta de hogares

𝑌 ⟶ 𝐼𝑛𝑔𝑟𝑒𝑠𝑜 𝑚𝑒𝑛𝑠𝑢𝑎𝑙
𝑋 ⟶ 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒𝑙 ℎ𝑜𝑔𝑎𝑟
ESTIMADORES DE RAZÓN

Estimador de razón del Total poblacional

෡ 𝒀 = 𝒓𝑻𝑿
𝑻

෡ 𝒀 = 𝑻𝟐𝑿 𝑽(𝒓)
𝑽 𝑻

෡ 𝒀 = 𝑻𝟐𝑿 𝑺𝟐 (𝒓)
𝑺𝟐 𝑻
ESTIMADORES DE RAZÓN

Ejemplo: 𝑋 = 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑓𝑎𝑚𝑖𝑙𝑖𝑎 , 𝑌 =


Ingreso familiar. 𝑁 = 2500. 𝑇𝑋 = 10.500. ¿𝑇𝑌 ?
HOGAR 1 2 3 4 5 6 7 8 9 10
X 4 5 6 4 5 5 7 3 4 4
Y 4.2 4.8 6.9 5.4 3.7 4.6 6.2 3.4 4.8 6.7
HOGAR 11 12 13 14 15 16 17 18 19 20
X 6 5 4 4 3 6 2 5 5 4
Y 8.2 7.2 5.2 6 5.5 5.8 4.4 7.7 6.4 5.4
HOGAR 21 22 23 24 25 26 27 28 29 30
X 4 3 3 5 4 4 6 7 4 5
Y 6 5.5 3.3 3 5.6 6.2 5.4 8.8 4.9 5.2
ESTIMADORES DE RAZÓN

Recordemos que en el MAS

2
𝑆
𝑆 2 𝑇෠ = 𝑁 2 𝑓𝑐
𝑛

𝑇෠ ∓ 𝑧𝛼Τ2 𝑆(𝑇)

ESTIMADORES DE RAZÓN

Estimador de razón de la Media poblacional

𝜇ො𝑌 = 𝑟𝜇𝑋

𝑉 𝜇ො𝑌 = 𝜇𝑋2 𝑉(𝑟)

𝑁−𝑛 σ 𝑦𝑖2 + 𝑟 2 σ 𝑥𝑖2 − 2𝑟 σ 𝑥𝑖 𝑦𝑖


𝑆 2 𝜇ො𝑌 =
𝑁𝑛 𝑛−1
ESTIMADORES DE RAZÓN

Ejemplo: En el ejemplo anterior estimar 𝜇𝑌 . 𝑋 =


𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑓𝑎𝑚𝑖𝑙𝑖𝑎, 𝑌 = Ingreso familiar.
𝑁 = 2500. 𝑇𝑋 = 10.500. Obtener estimaciones
por intervalos del 95%, usando:
1. Los estimadores tradicionales del MAS
2. Los estimadores de razón
ESTIMADORES DE RAZÓN

Tamaño de muestra para estimar 𝑅.


𝑒 = 𝑧𝛼Τ2 𝑆 2 (𝑟)
𝑛 2
2
𝑛 1 σ𝑖=1 𝑦𝑖 − 𝑟𝑥𝑖
𝑆 𝑟 = 1−
𝑁 𝑛𝜇𝑋 2 𝑛−1
𝑁−𝑛 𝑒 2 𝜇𝑋 2
= 2
𝑛𝑁 𝑧𝛼Τ2 𝑆𝑑2
ESTIMADORES DE RAZÓN

2
𝑁𝑆𝑑
𝑛=
𝑒2
𝑁 2 𝜇𝑋 2 + 𝑆𝑑2
𝑧𝛼Τ2
ESTIMADORES DE RAZÓN

Estimadores de razón en el muestreo


Estratificado:

Tarea
ESTIMADORES DE REGRESIÓN
Estimadores que al igual que los estimadores de
razón, son diseñados para incrementar la
precisión
Debe cumplirse que:
𝑺𝒊 𝒙𝒊 = 𝟎 ⇒ 𝒚𝒊 ≠ 𝟎
ESTIMADORES DE REGRESIÓN

Estos estimadores son de la forma:

ෝ 𝒀𝑳 = 𝒚
𝝁 ഥ
ഥ + 𝒃 𝝁𝑿 − 𝑿

donde,

σ 𝒙𝒊 − 𝒙
ഥ σ 𝒚𝒊 − 𝒚
ഥ 𝑺𝒙𝒚
𝒃= 𝟐
=
σ 𝒙𝒊 − 𝒙
ഥ 𝑺𝒙𝒙
ESTIMADORES DE REGRESIÓN

El estimador de regresión es sesgado, pero este


sesgo se vuelve pequeño cuando 𝑛 es grande.
La fórmula de la varianza es válida sólo cuando 𝑛
es grande.
ESTE ESTIMADOR ES ACONSEJABLE PARA
MUESTRAS GRANDES
ESTIMADORES DE REGRESIÓN

Casos:
1. 𝑏 conocido
2. 𝑏 estimado mediante los resultados
muestrales
ESTIMADORES DE REGRESIÓN

Cuando 𝑏 se conoce:
ෝ 𝒀𝑳 = 𝒚
𝝁 ഥ
ഥ + 𝒃𝟎 𝝁𝑿 − 𝑿

ෝ𝑿𝒀
𝝈
𝒃𝟎 = 𝟐
𝝈𝑿

ഥ 𝟐 − 𝒃𝟐𝟎 σ 𝒙𝒊 − 𝒙
𝑵 − 𝒏 σ 𝒚𝒊 − 𝒚 ഥ 𝟐
𝑺𝟐 𝝁
ෝ 𝒀𝑳 =
𝑵𝒏 𝒏−𝟏
ESTIMADORES DE REGRESIÓN

Cuando 𝑏 es estimado:
ෝ 𝒀𝑳 = 𝒚
𝝁 ഥ
ഥ + 𝒃 𝝁𝑿 − 𝑿

σ 𝒙𝒊 − 𝒙
ഥ σ 𝒚𝒊 − 𝒚
ഥ 𝑺𝒙𝒚
𝒃= 𝟐
=
σ 𝒙𝒊 − 𝒙
ഥ 𝑺𝒙𝒙

ഥ 𝟐 − 𝒃𝟐 σ 𝒙𝒊 − 𝒙
𝑵 − 𝒏 σ 𝒚𝒊 − 𝒚 ഥ 𝟐
𝑺𝟐 𝝁
ෝ 𝒀𝑳 =
𝑵𝒏 𝒏−𝟐
ESTIMADORES DE REGRESIÓN

Estimadores de regresión en el muestreo


Estratificado:

Tarea