Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Miguel Diseños de Muestreo
Miguel Diseños de Muestreo
Diseños de Muestreo
PRIMERA PARTE
Diseño de muestreo y diseño de
la encuesta
Diseño de muestreo de una encuesta: conjunto
de técnicas para seleccionar una muestra
probabilística y los métodos de estimación
empleados para inferir los valores de los
parámetros de interés a partir de la muestra.
Diseño de la encuesta: definiciones, métodos y
procedimientos concernientes a todas las fases
necesarias para conducir la operación.
Conceptos previos
Poblaciones: Una población (U) es un conjunto
de (N) elementos. Un elemento se denotará
por i.
Variables: Cada elemento tiene asociados
valores de variables de interés. Sea yi el valor
de la variable y en el i-ésimo elemento.
Parámetros: Son valores desconocidos de la
población que nos interesa estimar.
Muestra: Una parte (de tamaño n) de la
población. Una muestra se denotará por M.
Conceptos previos (cont.)
• Conjunto de observaciones: A cada elemento
seleccionado en la muestra la “observamos” y
tendremos al conjunto de observaciones: O :
{yi: i Є M}.
• Estimador: Función (T) de las observaciones
(T=t(O)), que usamos para estimar los
parámetros.
• Error de muestreo: Error proveniente de
observar M y no U. (“Error intrínseco”)
• Errores no de muestreo: Los otros errores.
Conceptos previos (cont.)
¿Cómo se mide el error de muestreo?
Como veremos más adelante la varianza estimada del
estimador juega un papel clave porque ella es una
medida de la variabilidad entre las estimaciones que
esperaríamos si se tomaran muchas muestras. El
problema es que la varianza depende de la unidad
de medida, por ello es conveniente utilizar el
Coeficiente de Variación que es libre de unidad de
medida:
CV
var muestral o usar intervalos de
estimación del parámetro
confianza
Diseños de muestreo más comunes
n 1 iεM
n
Muestreo Aleatorio Simple (4)
• Intervalos de confianza:
Un intervalo de confianza (IC) al (1-α)% es un
intervalo que contiene al verdadero valor del
parámetro poblacional con probabilidad igual
a 1-α.
• IC para la media (n>50): y z1α va ˆ r( y )
siendo z1α el valor de la distribución Normal
Estándar que acumula 1-α/2 de probabilidad:
α = 0.1 z1-α = 1.645
α = 0.05 z1-α = 1.96
α = 0.01 z1-α = 2.576
Muestreo Aleatorio Simple (5)
Determinación del tamaño de la muestra:
Sea e el error máximo permitido (en la
unidad original), entonces el n que
garantiza ese error máximo para la
estimación de μ al nivel de confianza 1-α
N(z1-α ) σ 2 2
en el MAS es: n
Ne (z 1- )
2 2 2
Problema: ¿σ?
Muestreo Aleatorio Simple (6)
• Caso particular: Estimación de proporciones (o
porcentajes).
Si el objetivo es estimar una proporción, las cosas se
simplifican porque la proporción no es más que la media de
una variable “y” que sólo toma los valores 0 ó 1. Los
estimadores insesgados son:
-Para la proporción poblacional: la proporción observada en la
muestra
-La estimación de la varianza se simplifica porque en este
caso s2=(n/n-1)(p(1-p))
-Para los intervalos de confianza hay que tener cuidado con la
aproximación Normal (ver tabla en las Notas)
-En la determinación del n, σ2 puede acotarse por 0.25
Muestreo Aleatorio Simple (7)
Estimación de una razón (o cociente): Dos casos:
a) La razón es el parámetro a estimar
b) La razón la estimamos para estimar otro parámetro.
Caso a): Se quiere estimar el cociente y/x (por ejemplo:
rendimiento=producción/área) y se estima la media de “y” y
la media de “x” y se usa como estimador a: y
ˆ
r
x
Caso b): Se tiene información auxiliar sobre “x” sea “X”, se usa
esa información para estimar el total (o la media de Y)
mediante: ˆ X y Xrˆ
Y
x
• Intervalos de confianza:
Lo ya desarrollado para el M.A.S. vale aquí
sustituyendo y por y est (cuidado con la
aproximación Normal)
• Determinación del tamaño de muestra:
Ahora debemos determinar tantos tamaños
de muestra como estratos (L). Se
determina el tamaño n de la muestra total
y se distribuye entre los estratos, ¿cómo?
Muestreo Aleatorio Estratificado (5)
• Asignaciones usuales:
• Distribución proporcional: asignamos a cada
estrato una proporción de n, igual a la
proporción de N del estrato: nh = n(Nh /N) ;
• Distribución óptima: además de Nh considera la
dispersión de los valores de y en el estrato:
N hσ h
nh n
N hσ h
h
Muestreo Aleatorio Estratificado (6)
• Determinación del n:
1) En el caso de “asignación proporcional”:
Nz12α
n 2 2 2
N e z1α Nhσ h2
h
• Problemas a resolver:
1) ¿Cómo aproximar los L valores σh ?
2) ¿L?
3) ¿Puntos de corte de los estratos?
4) ¿Qué variable de estratificación usar?
5) ¿Cómo controlar el error de estimación
de varios parámetros a la vez? (este
problema vale para todos los diseños)
Muchas gracias
Sesión Técnica 5
Diseños de Muestreo
SEGUNDA PARTE
Post estratificación
• Concepto: Se desea clasificar las unidades de una
población en grupos a partir de la muestra y luego
de haber realizado la encuesta, pero el diseño no
fue estratificado.
• Supongamos que extrajimos n unidades mediante
M.A.S. y luego se desea post-estratificar la
población en L estratos. La diferencia con el M.A.E.
es que los nh pasan a ser variables aleatorias
(cambian de muestra a muestra). Lo interesante ( e
intuitivo) es que el valor esperado de esa variable
aleatoria es: n n NN es decir “en promedio” la
h
h
j1 k 1
jk j1
j
M
y
j 1
j
M
yr rˆ n
M
N N
j
j 1
Vˆ ˆ ˆ ˆ
k
estimador de la varianza es: 1
k (k 1) 1