Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Diseño de encuestas y
estimación de parámetros
Estrategias de muestreo
Diseño de encuestas y
estimación de parámetros
Facultad de Estadı́stica
Universidad Santo Tomás
Bogotá
Estrategias de muestreo. Diseño de encuestas y estimación de parámetros
Hugo
c Andrés Gutiérrez
Facultad de Estadı́stica
Universidad Santo Tomás
Universidad
c Santo Tomás
Facultad de Estadı́stica
ISBN 978-958-701-XXX-X
Impresión:
Universidad Santo Tomás
usta.edu.co
Diagramación en LATEX: Hugo Andrés Gutiérrez
ISBN : 978-958-701-XXX-X
CDD-21 530.0711
A mi padre,
Hugo Gutiérrez Moreno,
en medio de la esperanza bienaventurada.
Contenido
Prologo XIII
Prefacio XIV
vi
3.1.1. Algoritmo de selección . . . . . . . . . . . . . . . . . 62
3.1.2. El estimador de Horvitz-Thompson . . . . . . . . . . 65
3.1.3. Marco y Lucy . . . . . . . . . . . . . . . . . . . . . . 66
3.2. Muestreo aleatorio simple sin reemplazo . . . . . . . . . . . 68
3.2.1. Algoritmos de selección . . . . . . . . . . . . . . . . 70
3.2.2. El estimador de Horvitz-Thompson . . . . . . . . . . 72
3.2.3. Estimación de la media poblacional . . . . . . . . . . 75
3.2.4. Estimación en dominios . . . . . . . . . . . . . . . . 79
3.2.5. El efecto de diseño . . . . . . . . . . . . . . . . . . . 83
3.2.6. Marco y Lucy . . . . . . . . . . . . . . . . . . . . . . 84
3.2.7. Probabilidades de inclusión en unidades de muestreo 91
3.3. Muestreo aleatorio simple con reemplazo . . . . . . . . . . . 92
3.3.1. Algoritmo de selección . . . . . . . . . . . . . . . . . 94
3.3.2. El estimador de Hansen-Hurwitz . . . . . . . . . . . 96
3.3.3. Marco y Lucy . . . . . . . . . . . . . . . . . . . . . . 98
3.4. Diseño de muestreo sistemático . . . . . . . . . . . . . . . . 102
3.4.1. Algoritmo de selección . . . . . . . . . . . . . . . . . 103
3.4.2. El estimador de Horvitz-Thompson . . . . . . . . . . 104
3.4.3. Optimalidad de la estrategia . . . . . . . . . . . . . 106
3.4.4. Diseño de muestreo q-sistemático . . . . . . . . . . . 112
3.4.5. Marco y Lucy . . . . . . . . . . . . . . . . . . . . . . 113
xiv
ángulos y no, como sucede en algunos textos de muestreo, proponer ejem-
plos resueltos en donde el lector no tiene la oportunidad de cuestionarse
acerca del desarrollo de la estrategia. En esta parte expongo tres concep-
tos totalmente determinantes al momento de plantear una estrategia de
muestreo. El primero y más importante de ellos es el soporte que define la
realización de una muestra probabilı́stica y por consiguiente la validez en
la inferencia. El lector puede darse cuenta del marcado interés que tengo
en este concepto al diferenciarlo de la muestra aleatoria, que no es más
que un vector aleatorio. En segundo lugar he hecho énfasis en el concepto
de diseño de muestreo tratándolo como una distribución de probabilidad
multivariante sobre el soporte. En la mayorı́a de estrategias planteadas en
esta primera parte se demuestra que efectivamente el diseño de muestreo
propuesto verifica las propiedades de una distribución de probabilidad. Por
supuesto, el último concepto es el de estimador cuya definición y uso es
más difundido entre los usuarios. Cada capı́tulo y cada sección adjunta
un pequeño ejemplo léxico-gráfico y una aplicación de la estrategia prop-
uesta con Marco y Lucy mediante el desarrollo computacional del paquete
TeachingSampling (Gutierrez 2009) creado en el ambiente del software de
uso libre R de la manera más amigable posible.
La segunda parte de este texto corresponde a la utilización y aprovechamien-
to de la información auxiliar disponible en el marco de muestreo. No sólo se
revisan estimadores que mejoran la eficiencia de la estrategia, sino que tam-
bién se adjunta al proceso de estimación el uso de un modelo que permite
describir el comportamiento de la caracterı́stica de interés en la población
dando un paso muy importante en el desarrollo de la inferencia al tratar,
aunque de manera aislada, a la caracterı́stica de interés como una vari-
able aleatoria en el modelo propuesto. En esta parte he querido seguir el
hermoso enfoque de Bethelehem & Keller (1987) en donde no se hacen
supuestos acerca de la validez del modelo de superpoblación. En esta lı́nea
de pensamiento la única aseveración que se realiza es que los residuales del
modelo sı́ tienen una menor varianza que la caracterı́stica de interés. Al final
de esta parte se da una muy breve introducción a la inferencia en pobla-
ciones finitas bajo un enfoque basado en el modelo supuesto. Es interesante
observar que, con el pasar de los dı́as, el uso de estas técnicas es más y más
común, sobre todo en la estimación de dominios raros, más conocidos co-
mo áreas pequeñas. Ese apartado empieza con la famosa discusión de Basu
(1971) que aún hoy sigue siendo la piedra de tropiezo entre las corrientes
de la estadı́stica. Este tipo de inferencia no considera el diseño de muestreo
ni la forma en la que la información fue recolectada, sino que se basa en
el modelo poblacional propuesto para realizar la inferencia. Sin embargo,
cuando el modelo poblacional es errado también lo serán las estimaciones.
La tercera parte, apta para un curso de posgrado, intenta acceder a
los mayores avances metodológicos que, con el paso del tiempo, dejan de
ser innovaciones para convertirse en técnicas obligatorias en la mejora de
la eficiencia de la estrategia. Entre otros selectos temas, se consideran los
estimadores de calibración, el muestreo balanceado y el muestreo indirecto.
Estos contenidos están supeditados a un gran sesgo personal inducido por
los años de asistencia al seminario de muestreo de la Universidad Nacional
de Colombia.
Por supuesto, este libro no hubiera podido ser escrito sin la enorme in-
fluencia del maestro Leonardo Bautista, quién me enseñó que lo importante
no es la memorización de fórmulas sino darles sentido y traerlas a la vida
mediante el uso de la mejor estrategia. Lo anterior tiene sentido, no sólo en
el desarrollo práctico de la ciencia estadı́stica, sino en el diario vivir.
Por último, deseo expresar mis agradecimientos a mi Dios, el Dios de
mi padre, que me ha dado todo lo que tengo y me ha seleccionado para
pertenecer en la muestra; de no ser ası́, no estarı́a escribiendo estas lı́neas.
Agradezco el infinito apoyo que encontré en Hanwen Zhang en la correc-
ción de las demostraciones ası́ como en la invaluable motivación que me
ha brindado desde el dı́a que la conocı́. De la misma manera, agradezco
enormemente el continuo ánimo de mi tı́o y amigo Oscar Ortega, por sus
valiosos consejos desde mi juventud y porque gran parte de este material se
gestó en su residencia de los Estados Unidos. A mi abuela Lola porque sus
oraciones nunca han cesado y a mis tı́as Martha, Myriam, Pilar y Clara.
A mi hermanita Tatiana Torres. A mis amigos, Yesid Rodrı́guez, Ronne
Tamayo y Daniel Rodrı́guez.
Este texto es un producto del grupo de investigación en Muestreo y
Marketing, adscrito al Centro de Investigaciones y Estudios Estadı́sticos
(CIEES) de la Facultad de Estadı́stica de la Universidad Santo Tomás.
Parte I
Inferencia basada en el
diseño de muestreo
1
Capı́tulo 1
2
Bibliografı́a
507
508 BIBLIOGRAFÍA
Chen, J. & Qin, J. (1993), ‘Empirical likelihood estimation for finite popu-
lations and the efectivene usage of auxiliary information.’, Biometrika
80, 107–116.
Deville, J.-C. (1999), ‘Variance estimation for complex statistics and es-
timators: linearizaion and residual techniques’, Survey Methodology
25, 193–204.
Deville, J.-C., Särndal, C.-E. & Sautory, O. (1993), ‘General raking proce-
dures in survey sampling.’, Journal of the American Statistical Asso-
ciation 88, 1013–1020.
Estevao, V. M. & Särndal, C.-E. (2001), ‘The ten cases of auxiliary infor-
mation for calibration estimators in two-phase sampling.’, Journal of
Official Statistics 18, 233–255.
Gelman, A., Carlin, B. C., Stern, H. S. & Rubin, D. (2004), Bayesian Data
Analysis, 2 edn, Chapman & Hall / CRC.
Groves, R., Fowler, F., Couper, M., Lepkowski, J., Singer, E. & R., T.
(2004), Survey Methodology, Wiley.
Hubback, J. A. (1927), ‘Sampling for rice yield in bihar and orissa’, Imperial
Aggricultural Research Institute 166.
Isaki, C. & Fuller, W. A. (1982a), ‘Survey design under the regression su-
perpopulation model.’, Journal of the American Statistical Association
767, 89–96.
Isaki, C. T. & Fuller, W. A. (1982b), ‘Survey design under the regression su-
perpoluation model.’, Journal of the American Statistical Association
77, 89–96.
Lahiri, D. B. (1968), ‘On the unique sample, the surveyed one’, Foundations
of Survey Sampling .
Lehtonen, R. & Pahkinen, E. (2003), Practial methods for design and anal-
ysis of complex surveys., New York: Wiley.
516
ÍNDICE DE FIGURAS 517
518
ÍNDICE DE TABLAS 519
520
ÍNDICE ALFABÉTICO 521