Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ajuste Factores Expansion Post Estratificacion
Ajuste Factores Expansion Post Estratificacion
GUATEMALA
254 Ajuste de los factores de expansión...
ÍNDICE
Página
Presentación.................................................................................................................................... 255
Antecedentes................................................................................................................................... 256
Conceptos Básicos de la Teoría de Muestreo ................................................................................. 257
¿En qué consiste la estratificación? ...................................................................................... 257
Características de los estratos ............................................................................................... 257
Beneficios de una estratificación .......................................................................................... 257
Errores comunes en la estratificación ................................................................................... 257
Desventajas de la estratificación........................................................................................... 257
Conceptos Generales sobre la Post-Estratificación ........................................................................ 258
¿Qué es la post-estratificación? ............................................................................................ 258
Aplicaciones y ventajas de la post-estratificación ................................................................ 258
Desventajas de la post-estratificación................................................................................... 258
Ajustes de los Factores de Expansión por Post-Estratificación ...................................................... 259
¿En qué consiste el ajuste a los factores de expansión?........................................................ 259
Primera Post-Estratificación ........................................................................................................... 259
Uso de las proyecciones de población .................................................................................. 260
Cálculo del componente de ajuste ........................................................................................ 260
Deficiencias encontradas en la primera post-estratificación................................................. 261
Segunda Post-Estratificación .......................................................................................................... 262
Cambios Observados en la Primera Post-Estratificación................................................................ 267
Conclusiones................................................................................................................................... 267
Recomendaciones ........................................................................................................................... 267
Ajuste de los factores de expansión... 255
Presentación
En el contexto del Gobierno de Guatemala y el INE en el marco del Programa para el Mejoramiento de
las Encuestas sobre Condiciones de Vida -MECOVI-, realizaron en el año 2000 la primera Encuesta
Nacional sobre Condiciones de Vida ENCOVI y en el 2002 y 2003, la primera ronda de cuatro encuestas
trimestrales sobre empleo e Ingresos -ENEI- que han permitido generar información socioeconómica
integral y detallada sobre los niveles de empleo, subempleo, desempleo e ingresos de los hogares y
personas, según áreas y etnias del país.
El esfuerzo de realizar ENCOVI y ENEI, como parte principal del Sistema Nacional Integrado de
Encuestas de Hogares, vino a llenar un vacío manifiesto en la producción de información sobre el tema
del mercado laboral en Guatemala y posibilitar el estudio de las tendencias, mecanismos y dinámicas
relacionadas con los procesos de producción y empleo, analizar las causas y factores que determinan el
desempleo y subempleo y establecer los alcances e impactos de los programas de generación de puestos
de trabajo y monitorear los avances y logros de las acciones sociales del estado.
En el caso específico de la ENEI está diseñada como respuesta a la necesidad de garantizar la
caracterización y análisis integral de las variables relacionadas con los temas de actividad económica e
ingresos de la población de Guatemala.
Se espera que este documento sirva de insumo principal para mantener debidamente informado a los
colegas reunidos en el 14º Taller Regional sobre Imputación de Datos en las Encuestas de Hogares: Los
Procedimientos Metodológicos y sus Implicaciones.
256 Ajuste de los factores de expansión...
Antecedentes
Debido a un vacío existente en Guatemala en cuanto a información del mercado laboral, el programa
MECOVI se embarca en la realización de una encuesta a nivel nacional para estudiar a fondo la situación
laboral y de los ingresos en Guatemala. Así nace en el año 2001 la Encuesta Nacional de Empleo e
Ingresos ENEI, y se inicia su planificación para ser ejecutada en el año 2002.
La realización de las encuestas ENEI, fue un proyecto innovador en Guatemala, incorporando una
metodología nunca trabajada en este país como lo son las encuestas tipo Panel. En este sentido se diseñó
el proyecto para ser realizado trimestralmente a una muestra de más de 3000 viviendas a nivel nacional
con una rotación del 20% entre rondas, lo cual permitió obtener información del mercado laboral por un
período de un año, pudiéndose hacer comparaciones entre rondas y medir tendencias de las tasas
publicadas.
Durante la etapa de planificación de las encuestas de Empleo ENEI, fue definido el diseño muestral, que
entre sus principales características, planteaba la utilización de 3 Dominios de inferencia y 48 estratos
para la selección. El marco muestral fue definido por los sectores cartográficos utilizados para el Censo
de Población y Habitación realizado en el año de 1994. Por razones de costo de una nueva actualización
cartográfica, se utilizó parte de la muestra de la Encuesta Nacional de Condiciones de Vida 2000 y otra
parte utilizó los sectores de Marco Censal, esto dio lugar a 2 tipos o variantes en los factores de
expansión.
De esta manera es realizada la primera encuesta denominada ENEI en el mes de mayo y las subsecuentes
ENEI-2, ENEI-3 y ENEI-4 en los meses de agosto, noviembre del año 2002 y la última realizada en el
mes de febrero del año 2003.
Por ser el primer estudio tipo panel realizado en Guatemala para una encuesta de empleo, se detectaron
ciertos inconvenientes para el análisis de los datos y la obtención de resultados, ya que estos no podían ser
tratados de forma independiente sino en conjunto con las demás ENEI´s. A esto debe sumarse que debido
a presiones externas fue modificado el diseño original de selección de la muestra, donde no se tomó en
cuenta la afijación proporcional en estratos establecidos en un principio.
Los primeros indicios de que algo no estaba funcionando adecuadamente, se hicieron notar al comparar
los resultados de la segunda ENEI con los ya publicados de la primera. Situación que obligó a los
muestristas a investigar los casos y plantear una solución al problema presentado. Teniendo en cuenta las
modificaciones hechas al diseño muestral original fue propuesto el ajuste de los factores de expansión por
medio de una post-estratificación de los datos, a fin de minimizar los efectos provocados por una
selección de muestra diferente a la propuesta, y por tratarse de un estudio panel.
Es así como se inicia el proceso de post-estratificación y ajuste de los factores de expansión en las 4
ENEI´s y que en esta oportunidad Guatemala, se digna en compartir sus experiencias con los demás
participantes en este taller y a todas las personas involucradas en las actividades estadísticas a fin de que
sobre la base de esta experiencia, se puedan apreciar los resultados obtenidos y deliberar alrededor de este
tema.
Ajuste de los factores de expansión... 257
• Desventajas de la estratificación
Una de las desventajas de la utilización de la estratificación como método para la selección de muestras,
consiste en que el cálculo de las estimaciones y precisiones es más compleja y sofisticada comparado con
otros métodos de muestreo. Esto ha dejado de ser un fuerte inconveniente ya que debido al acceso que
tenemos hoy en día a la tecnología y a software estadístico muy completo, facilitan enormemente esta
etapa.
258 Ajuste de los factores de expansión...
Para las personas que no están familiarizadas con el tema de la Estratificación u otros métodos de
muestreo se recomienda que se consulte bibliografía relacionada con el tema y en especial se
recomiendan los libros de texto Cochran, Kish y Lhor, para poder tener una mejor comprensión de la
Post-estratificación.
• Desventajas de la post-estratificación
La post-estratificación puede ser peligrosa si no se aplica correctamente, se pueden obtener varianzas
arbitrariamente pequeñas o se puede inferir erróneamente sobre los datos, por tal razón deberá discutirse
ampliamente su aplicación. Hoy día, los usos de la post-estratificación son de diversa índole, en algunos
casos en aplicaciones más complejas.
Como una ampliación al tema de la post-estratificación se puede consultar el documento Ajuste de
Muestras Con Información Auxiliar publicado por el EUSTAT, donde se abordan diferentes métodos para
el ajuste de muestras. www.eustat.es
Ajuste de los factores de expansión... 259
Este componente “delta” permitirá el ajuste de los factores de expansión a fin de que la Población
expandida en el estudio coincida con el dato real, que en este caso es una proyección de la población a la
fecha de ejecución de la encuesta, en base a datos censales.
Primera Post-Estratificación
Como no se contaba con información censal reciente, se utilizaron en su lugar las proyecciones de
población de CELADE, tomando en cuenta que estas proyecciones se refieren solamente a personas y no
a sectores, los nuevos estratos formados deben contener personas y no sectores, es decir que la
estratificación posterior agrupará a personas individuales de diferentes sectores cartográficos.
Por otro lado, las proyecciones del CELADE solo consideran el área, (urbano y rural), el sexo y la edad
de las personas, se emplearon solamente estas características para la construcción de los nuevos estratos
(post-estratos).
En esta primera post-estratificación con la información proveniente de la ENEI, se construyeron los
nuevo post-estratos utilizando las variables Área, Sexo y la conformación de 4 grupos de edad. En la
Tabla 2 se puede observar los criterios de post-estratificación con más detalle.
Donde:
P(encuesta)= Población Total al momento de la encuesta.
P(julio00)=Población Total a la mitad del año 2000.
P(julio05)=Población Total a la mitad del año 2005.
1
P( julio05) 5
TasaAnual =
P( julio00)
Con los valores obtenidos para los correspondientes componentes de ajuste (δ) para cada uno de los post-
estratos, se proceda a multiplicar el factor originalmente calculado por el componente de ajuste y
resultado obtenido es en nuevo factor de expansión ajustado o calibrado.
Utilizando los factores de expansión ya ajustados para el cálculo de las estimaciones, éstas son coherentes
a las cifras publicadas de las proyecciones de población elaboradas por CELADE y proyectadas al
momento de la encuesta.
Segunda Post-Estratificacion
Para la construcción de los nuevos post-estratos incluyendo los 3 dominios de inferencia, hubo necesidad
de proyectar nuevamente la población para los 3 dominios con los datos de CELADE, pero esta
información no se encuentra publicada por lo que para realizarla se asumió la misma estructura porcentual
que presentan los diferentes dominios dentro de la encuesta para el cálculo de la proyección.
Otros de los cambios importantes de esta segunda post-estratificación fue la ampliación en el número de
los grupos de edad formándose en total 12. Asimismo se tomó en cuenta que debido a la poca frecuencia
de personas entre los grupos altos de edades (55-59), (60-64), etc., observados en la encuesta fueron
integrados en solo 2 grupos de edad.
La estructura para los nuevos post-estratos creados se muestran en detalle en la Tabla 4.
De igual manera que en la primera post-estratificación, teniendo la proyección de personas según
CELADE para cada uno de los 72 post-estratos creados, así como de la población expandida determinada
por medio de la encuesta se procedió al cálculo del componente de ajuste utilizando la misma fórmula que
en el primer ensayo. Se puede apreciar en la Tabla 5, parte del cálculo del componente de ajuste δ.
Aplicando el componente de ajuste para los factores de expansión por post-estrato se obtuvo los nuevos
factores de expansión ajustados y con éstos se procedió al cálculo de las estimaciones las cuales
mostraban un comportamiento más coherente. Es indudable pensar que con la inclusión de los 3
dominios de inferencia para el cálculo de los componentes de ajuste para los factores de expansión, y la
ampliación en el número de los grupos de edad para la construcción de los post-estratos se lograron
corregir las deficiencias encontradas en la primera post-estratificación.
En las siguientes tablas se presenta un ejercicio a modo de ejemplo, que fue realizado utilizando la
primera base de datos de la ENEI, en donde se comparan los resultados obtenidos antes de la aplicación
de la post-estratificación y después de la misma. Es fácil notar como se logra una reducción tanto en los
errores estándar de estimación como en los intervalos de confianza, en los errores relativos y en la
mayoría de los valores DEFF correspondientes a la estimación de las tasas del mercado laboral de la
primera Encuesta Nacional de empleo e ingresos, ENEI 2002.
264 Ajuste de los factores de expansión...
Intervalo de confianza
Tasa Error Límite Límite
TASAS estimada Estándar inferior Superior Precisión DEFF
TOTAL DEL PAIS
Tasa Específica de Ocupación 0.00% -0.01% 0.02% -0.02% -0.0002 -0.25
Tasa Bruta de Ocupación 0.00% -0.37% 0.73% -0.73% -0.0123 -2.63
Tasa de Participación 0.00% -0.36% 0.71% -0.71% -0.0116 -2.66
Tasa de Desempleo Abierto Total 0.00% -0.01% 0.02% -0.02% -0.0063 -0.25
Tasa de Desempleo Oculto 0.00% -0.22% 0.43% -0.43% -0.0367 -1.85
Tasa de Desempleo Abierto Activo 0.00% 0.01% -0.02% 0.02% 0.0107 -0.02
Tasa de Desempleo Abierto Pasivo 0.00% -0.04% 0.08% -0.08% -0.0608 -1.06
Tasa de Subempleo Visible 0.00% -0.08% 0.16% -0.16% -0.0105 -0.68
DOMINIO 1: URBANO
METROPOLITANO
Tasa Específica de Ocupación 0.00% 0.06% -0.12% 0.12% 0.0013 0.16
Tasa Bruta de Ocupación 0.00% 0.01% -0.02% 0.02% 0.0003 0.04
Tasa de Participación 0.00% -0.03% 0.06% -0.06% -0.0009 -0.02
Tasa de Desempleo Abierto Total 0.00% 0.06% -0.12% 0.12% 0.0177 0.16
Tasa de Desempleo Oculto 0.00% -0.06% 0.12% -0.12% -0.0087 -0.10
Tasa de Desempleo Abierto Activo 0.00% 0.03% -0.06% 0.06% 0.0117 0.06
Tasa de Desempleo Abierto Inactivo 0.00% 0.04% -0.08% 0.08% 0.0481 0.20
Tasa de Subempleo Visible 0.00% -0.06% 0.12% -0.12% -0.0064 -0.08
DOMINIO 2: URBANO RESTO DEL PAIS
Tasa Específica de Ocupación 0.00% 0.04% -0.08% 0.08% 0.0008 0.10
Tasa Bruta de Ocupación 0.00% -0.10% 0.20% -0.20% -0.0034 -0.15
Tasa de Participación 0.00% -0.13% 0.25% -0.25% -0.0042 -0.17
Tasa de Desempleo Abierto Total 0.00% 0.04% -0.08% 0.08% 0.0220 0.10
Tasa de Desempleo Oculto 0.00% -0.16% 0.31% -0.31% -0.0245 -0.35
Tasa de Desempleo Abierto Activo 0.00% 0.01% -0.02% 0.02% 0.0088 -0.03
Tasa de Desempleo Abierto Inactivo 0.00% 0.02% -0.04% 0.04% 0.0290 0.17
Tasa de Subempleo Visible 0.00% -0.54% 1.06% -1.06% -0.0616 -1.23
DOMINIO 3: RURAL PAIS
Tasa Específica de Ocupación 0.00% -0.01% 0.02% -0.02% -0.0002 -0.55
Tasa Bruta de Ocupación 0.00% -0.58% 1.14% -1.14% -0.0192 -4.14
Tasa de Participación 0.00% -0.59% 1.16% -1.16% -0.0192 -4.14
Tasa de Desempleo Abierto Total 0.00% -0.01% 0.02% -0.02% -0.0109 -0.56
Tasa de Desempleo Oculto 0.00% -0.34% 0.67% -0.67% -0.0619 -2.81
Tasa de Desempleo Abierto Activo 0.00% 0.05% -0.10% 0.10% 0.1531 0.82
Tasa de Desempleo Abierto Inactivo 0.00% -0.06% 0.12% -0.12% -0.1014 -1.87
Tasa de Subempleo Visible 0.00% -0.03% 0.06% -0.06% -0.0045 -0.43
1
Diferencias entre las estimaciones utilizando post-estratificación y no utilizándola
Ajuste de los factores de expansión... 267
Conclusiones
1. En el caso de las encuestas de Empleo, en Guatemala, el ejercicio de post-estratificación, logró
sus objetivos que se esperaban que en este caso era reducir los errores de estimación, estrechar los
intervalos de confianza y mejorar las precisiones esperadas.
2. Se comprobó que al aumentar el número de post-estratos el efecto de reducción en las varianzas y
desviaciones estándar (errores de estimación) es más efectivo, lo que pudiera llegar a establecer
como norma “que el incremento del número de post estratos es inversamente proporcional al
tamaño de los errores de estimación y a la amplitud de los intervalos de confianza de las
estimaciones y otros parámetros vinculados al proceso inferencial”
3. La post estratificación según se pudo observar es más efectiva cuanto mejor se realice el ejercicio
de extrapolación o interpolación de las proyecciones de población.
4. De la calidad de las proyecciones de población, dependerá la calidad de la interpolación a un
punto intermedio de la unidad cronológica asumida, y por ende de la construcción de post-
estratos adecuados.
5. Los niveles de desagregación de las proyecciones de población, tales como área o ámbito,
intervalos de edad, etnia etc., no siempre están disponibles, por lo que en muchos casos deben
realizarse imputaciones en base a razones o proporciones conocidas; de la calidad de éstos
cálculos depende la efectividad de la post estratificación y el logro de sus propósitos al afinar los
factores de expansión.
Recomendaciones
1. Es importante considerar la posibilidad de la post estratificación, al momento de estratificar el
marco de muestreo.
2. El ejercicio de post-estratificación deberá hacerse únicamente cuando se justifique su aplicación.
Deben tenerse los elementos necesarios para ello.
3. Se recomienda al momento de pos-estratificar, realizar ejercicios y simulaciones de ensayo con
diferentes alternativas (número de post- estratos, variables, atributos y características a
considerar) y observar sus efectos en las varianzas y precisiones esperadas, a manera de
seleccionar aquella con la que más se logran los propósitos deseados.
4. Es importante la documentación y conocimiento de los avances logrados en este tipo de
ejercicios, especialmente en el uso y aplicación que hoy día se da a la post-estratificación como
un recurso para mejorar la calidad y precisión de resultados en el proceso inferencial de muestras.
5. Se recomienda realizar, difundir y compartir las experiencias logradas en este tipo de ejercicios y
sus aplicaciones.