Documentos de Académico
Documentos de Profesional
Documentos de Cultura
com
inverso. Se estimaron así los parámetros poblacionales necesarios para alcanzar los objetivos del estudio. Las
correspondencia
G. Kac
ponderaciones del diseño muestral básico se calcularon como las probabilidades inversas de inclusión de los
Departamento de Nutrición Social y Aplicada, Instituto
hogares en el estudio. La imputación se utilizó para compensar la falta de respuesta a los elementos de las de Nutrición Josué de Castro, Universidad Federal de Río
variables objetivo, excepto para los datos sobre los biomarcadores sanguíneos. Finalmente, la calibración utilizó de Janeiro.
totales de población de niños en 60 poststrata, definidos por clasificación cruzada de las siguientes variables: Av. Brigadeiro Trompowsky s / n, Bloque J, 2O piso,
Río de Janeiro, RJ 21941-590, Brasil.
región geográfica principal, sexo y edad. La muestra final incluyó a 14.558 niños residentes en 12.524 hogares,
gilberto.kac@gmail.com
distribuidos en 1.382 CEA en los 26 estados de Brasil y el Distrito Federal. Los datos de la encuesta ENANI-2019
apoyarán estrategias para la promoción e implementación de políticas públicas para niños menores de cinco
años. y actúa. La muestra final incluyó a 14.558 niños residentes en 12.524 hogares, distribuidos en 1.382 CEA en
los 26 estados de Brasil y el Distrito Federal. Los datos de la encuesta ENANI-2019 apoyarán estrategias para la
promoción e implementación de políticas públicas para niños menores de cinco años. y actúa. La muestra final
incluyó a 14.558 niños residentes en 12.524 hogares, distribuidos en 1.382 CEA en los 26 estados de Brasil y el
Distrito Federal. Los datos de la encuesta ENANI-2019 apoyarán estrategias para la promoción e implementación
Introducción
El Ministerio de Salud financió el Encuesta Nacional Brasileña de Nutrición Infantil (ENANI-2019) (convocatoria
de proyectos CNPq / MS / SCTIE / DECIT / SAS / DAB / CGAN n. 11/2017). ENANI-2019 se estructura en tres
dominios: evaluación de la lactancia materna y la ingesta alimentaria; evaluación antropométrica del estado
nutricional; y evaluación de las deficiencias de micronutrientes en niños menores de cinco años, por región
geográfica principal, sexo y grupo de edad.
Los datos se obtuvieron con una encuesta probabilística por muestreo de hogares, con estratificación
geográfica y agrupamiento por áreas de empadronamiento censal (CEA), realizada con métodos de muestreo
como los adoptados por los institutos oficiales de estadística en sus encuestas de población humana. 1. Esto
permitió a la ENANI-2019 estimar de manera reproducible y científica los parámetros poblacionales requeridos
para alcanzar sus objetivos. La idea básica a la hora de muestrear poblaciones humanas consiste en
muestrearlas a través de los hogares, agrupados a su vez en CEA, que se agrupan a su vez según la situación
(urbana versus rural) en subdistritos, distritos, municipios, etc. La base es el concepto de hogar y residente (este
último para garantizar que las personas con más de una dirección residencial no tengan más probabilidades de
ingresar a la muestra) y la selección de áreas.
ENANI-2019 brinda una oportunidad única para dilucidar los diversos aspectos de la evaluación nutricional
de los niños y para apoyar las políticas de salud pública para este grupo de edad vulnerable. Así, el manuscrito
tiene como objetivo describir aspectos metodológicos en la definición de la población de estudio, plan de
muestreo, ponderación muestral y muestra efectiva de la ENANI-2019.
Población de estudio
La población de estudio para ENANI-2019 se definió como el conjunto de niños menores de cinco años
que residen en hogares privados permanentes en todo Brasil con al menos un niño menor de cinco años
en la fecha de la entrevista de la encuesta. Por lo tanto, la población de estudio no incluyó: (1) niños que
residen en hogares colectivos (hoteles, pensiones, orfanatos, albergues, centros de detención, cuarteles,
hospitales, etc.), hogares privados improvisados y hogares privados permanentes sin niños; (2) niños
indígenas que viven en aldeas; (3) niños extranjeros que viven en hogares donde no se habla portugués;
y (4) niños con condiciones que les impedían realizar mediciones antropométricas.
Aspectos éticos
La Junta de Revisión Institucional del Hospital Universitario Clementino Fraga Filho de la Universidad Federal de
Río de Janeiro (UFRJ) aprobó el estudio con el número CAAE 89798718.7.0000.5257. Los datos se recopilaron
después de que los padres o tutores del niño firmaran dos copias del formulario de consentimiento libre e
informado. Los métodos utilizados en el desarrollo de ENANI-2019 se han descrito en detalle en publicaciones
específicas2,3,4,5.
plan de muestreo
El plan de muestreo de ENANI-2019 utilizó estratificación y agrupamiento, incorporando dos o tres etapas de
selección. La estratificación de la población con fines de muestreo se guió por los objetivos del estudio y la
definición de las cinco principales regiones geográficas del territorio brasileño como dominios objetivo para la
publicación de resultados.
Las unidades primarias de muestreo (UPM) fueron los municipios o las CEA, y las unidades elementales de
muestreo fueron siempre los hogares. En cada hogar seleccionado, se inscribieron todos los residentes y se
registraron los datos objetivo del estudio para todos los niños residentes menores de cinco años.
Estratificación
Los estratos se formaron mediante la asignación de municipios brasileños (según la base territorial utilizada por
el Instituto Brasileño de Geografía y Estadística - IBGE, en las estimaciones de población del 1 de julio de 2016) 6
en dos bloques: (1) cada una de las capitales de estado más el Distrito Federal (27 estratos) y cada uno de los 20
municipios con más de 500.000 habitantes (20 estratos) y (2) los demás municipios de cada región geográfica
mayor (5 estratos ) (Tabla 1). Por tanto, todas las capitales de estado y municipios con gran población (> 500.000
habitantes) definidos como estratos en el bloque 1 fueron incluidos en la muestra con certeza y no son unidades
primarias de muestreo sino estratos de selección.
Los datos para la población total y la población de niños menores de cinco años fueron estimados para el 1
de julio de 2016, para cada uno de los 5.570 municipios brasileños utilizando el método de tendencia lineal.
7, el mismo utilizado por el IBGE en la elaboración de las estimaciones de población que utiliza el Tribunal Federal de
Cuentas para determinar su participación en el fondo participativo de los municipios 6. La Tabla 1 muestra las
estimaciones obtenidas por estrato de selección.
En los 47 estratos formados por cada uno de los municipios incluidos con certeza en la muestra (bloque
1), la UPM fue el CEA (IBGE), y la unidad de muestreo secundaria (SSU) fue el hogar elegible (con niños de
la población de estudio). En los otros estratos (bloque 2), la UPM fue el municipio, la SSU fue la CEA y la
unidad terciaria de muestreo (TSU) fue la elegible.
El cálculo del tamaño de la muestra se basó en los parámetros presupuestarios del proyecto, la logística de recolección
de muestras de sangre y la experiencia con encuestas similares realizadas por la Sociedad para el Desarrollo de la
Investigación Científica (Ciencia).
Considerando el dominio objetivo (región geográfica principal), la proporción mínima se especificó
como Pmin = 2%. El margen de error relativo estimado debe ser un máximo de dR = 35%, con un
coeficiente de confianza de (1-α) = 95%. Según Cochran8 y asumiendo un muestreo aleatorio simple sin
reemplazo (SRS), el tamaño de muestra necesario para estimar proporciones iguales o mayores que Pmin
con un error relativo no mayor que dR con un nivel de confianza 1-α se calcula mediante:
z∝dos
/2 1-Pmin
no
SRS = × (1)
Drdos PORmin
z∝dos
/2 1-Pmin 1,96dos 1-0.02
n = deff × nSRS = deff × × = 1,95 × × = 2.998 (dos)
Dado que hay cinco dominios de estimación, el tamaño total de la muestra se calculó en 14.990 (= 5 x 2.998)
hogares.
También se determinó que diez hogares elegibles serían entrevistados para cada CEA seleccionado, lo que
llevó a una muestra de m = 1,500 CEA, 300 en cada región geográfica principal. Esta definición también resultó
de la experiencia acumulada con muestras de encuestas realizadas por el equipo de Science y de la evidencia de
los efectos del tamaño de la muestra de CEA sobre la precisión de las estimaciones y los costos de recopilación
de datos. El número diez podría considerarse pequeño en comparación con el adoptado en otras encuestas de
hogares, como laEncuesta Nacional Continua por Muestra de Hogares de Brasil (PNAD continuo), que selecciona
14 hogares (elegibles o no) por CEA 10. Sin embargo, en ENANI-2019, sería difícil llegar a 14 hogares elegibles
por CEA. Con base en un tamaño promedio de CEA de 300 hogares, considerando que la proporción de niños
menores de cinco años en 2016 se estimó en 7.2%, además de asumir que cada hogar tendría un máximo de un
niño menor de cinco años, habría un número esperado de 21,6 hogares elegibles por CEA. Dado que los
tamaños de CEA varían considerablemente (por encima y por debajo del número promedio de 300 hogares), y
dado que la estimación anterior es optimista y depende de la hipótesis de un niño elegible por hogar, el tamaño
de muestra objetivo de diez hogares elegibles por CEA parecía razonable y fue adoptado.
Hay varias formas de asignar el tamaño de la muestra de CEA entre los estratos de selección. En un
extremo está la asignación proporcional, que asegura que el tamaño de la muestra en cada estrato sea
proporcional a su población, con la desventaja de concentrar la muestra en los estratos con mayor
población. El otro extremo es la asignación equitativa, que asegura que el margen de error (o precisión
de muestreo) sea similar entre los estratos, pero solo recomendable cuando los estratos son dominios de
estimación. Finalmente, entre estos extremos se encuentra la asignación de poder, que asegura una
cierta proporcionalidad entre el tamaño de la muestra en el estrato y una potencia p (0 <p <1) de su
población. Cuanto mayor es la potencia p, más se aproxima la asignación de potencia a la asignación
proporcional, y menor es la potencia p,
La expresión 3 presenta la forma de asignación de poder 11 utilizado para definir el tamaño de la muestra de CEA para cada
estrato de selección h dentro de cada región geográfica principal:
(3)
donde popH representa la población menor de cinco años en el estrato h, estimada para el 1 de julio de 2016, como se
indicó anteriormente en la Tabla 1.
La experiencia de Science en las encuestas por muestreo de hogares llevó al uso de una asignación
de poder con p = 1/3, que muestra cierta proporcionalidad con la población del estrato, sin permitir una
concentración excesiva en los estratos más poblados.
Para los estratos de “otros municipios” en las cinco regiones geográficas principales, la definición del
número de CEA a seleccionar en cada municipio determinó el número de municipios a seleccionar en cada uno
de estos estratos. La decisión fue seleccionar cinco CEA por municipio en todas las principales regiones
geográficas, excepto en el Norte, donde se seleccionaron ocho CEA por municipio. Este mayor número de CEA
por municipio en el estrato “otros municipios” en el norte de Brasil permitió reducir el número de municipios
seleccionados. El norte de Brasil tiene enormes dificultades de acceso y tiempo de viaje desde los municipios a
sus respectivas capitales de estado. En la mayoría de los municipios, el tiempo de viaje podría evitar la toma de
muestras de sangre y aumentar los costos del estudio. La Tabla 2 muestra el tamaño de muestra planificado
para CEA y hogares.
tabla 1
Proyección de la población brasileña menor de cinco años de actos según las principales regiones geográficas y estratos de selección de la muestra. Encuesta Nacional Brasileña de
Principales regiones geográficas y estratos de población total música popH menores de cinco raíz cúbica de popH Tamaño de muestra de
(Seguir)
Tabla 1 (continuación)
Principales regiones geográficas y estratos de población total música popH menores de cinco raíz cúbica de popH Tamaño de muestra de
CEA: áreas de empadronamiento censal; música popH: población menor de cinco años en el estrato h.
Fuente:Encuesta Nacional Brasileña de Nutrición Infantil (ENANI-2019).
* Otros municipios del Norte: Ariquemes y Ji-Paraná (Estado de Rondônia); Itacoatiara y Manacapuru (estados de Amazonas); Abaetetuba, Bragança, Castanhal y
Marituba (Estado de Pará); Araguaina (Estado de Tocantins). En Barcarena (Estado de Pará) se seleccionaron 8 CEA y 80 hogares, pero no hubo recolección de
datos debido a la interrupción de la recolección;
* * Otros municipios del Nordeste: Caxias e Imperatriz (Estado de Maranhão); Parnaíba (Estado de Piauí); Caucaia y Maracanaú (Estado de Ceará); Parnamirim
(estado de Rio Grande do Norte); Campina Grande (Estado de Paraíba); Olinda y Paulista (estado de Pernambuco); Arapiraca (Estado de Alagoas); Nossa Senhora do
Socorro (Estado de Sergipe); Camaçari, Juazeiro, Lauro de Freitas y Simões Filho (Estado de Bahía);
* * * Otros municipios del Sureste: Betim, Montes Claros y Ribeirão das Neves (Estado de Minas Gerais), Serra (Estado de Espírito Santo); Niteroi (Río de Janeiro);
Araraquara, Diadema, Itaquaquecetuba, Pindamonhangaba y São Vicente (Estado de São Paulo);
# Otros municipios del Sur: Araucaria, Colombo, Foz do Iguaçu, Guarapuava, Maringá, Pinhais, Ponta Grossa y São José dos Pinhais (Estado de Paraná);
Blumenau, Camboriú, Criciúma, Jaraguá do Sul, Palhoça y São José (Estado de Santa Catarina); Alvorada, Canoas, Caxias do Sul, Gravataí, Novo Hamburgo, Rio
Grande, São Leopoldo, Sapucaia do Sul y Viamão (estado de Rio Grande do Sul);
# # Otros municipios del Centro Oeste: Corumbá, Dourados, Nova Andradina y Três Lagoas (estado de Mato Grosso do Sul); Cáceres, Lucas do Rio Verde,
Primavera do Leste, Rondonópolis y Várzea Grande (Estado de Mato Grosso); Águas Lindas de Goiás, Anápolis, Ciudad del Oeste, Formosa, Jataí (reemplazada
por Luziânia), Novo Gama, Planaltina, Santo Antônio do Descoberto y Valparaíso de Goiás (Estado de Goiás).
Cuando el municipio era la UPM (bloque 2, estrato “otros municipios” de las principales regiones geográficas),
su selección se realizó con un muestreo sistemático con probabilidades proporcionales al tamaño (PPS),
utilizado como medida del tamaño de la población menor de cinco años. años de edad en el municipio,
estimado para el 1 de julio de 2016.
Dado que se esperaba que los CEA de menores ingresos tuvieran más niños elegibles que los CEA de
mayores ingresos, se tuvo cuidado de que la muestra cubriera el rango de ingresos de la población en los
municipios seleccionados, garantizando diferentes patrones de alimentación infantil en la población de estudio.
Así, antes de la selección de los CEA, se realizó una estratificación adicional, con base en los cuartiles de la
distribución del ingreso promedio del jefe de hogar en cada CEA, según elCenso de población 2010. A
continuación, se asignó el número de CEA a seleccionar en cada estrato de ingresos. Finalmente, dentro de cada
municipio y estrato de ingresos, los CEA fueron seleccionados mediante el muestreo PPS de Pareto.12.13. La
medida de tamaño para el muestreo de la CEA fue el número de niños menores de cinco años en la CEA, con
base en laCenso de población 2010, la fuente de información más reciente disponible por CEA en el momento
de la encuesta.
Tabla 2
Tamaño de la muestra de las áreas de empadronamiento del censo y los hogares para Brasil y según las principales regiones geográficas, estratos de selección y municipios.Encuesta
(Seguir)
Tabla 2 (continuación)
El esquema de selección adoptado priorizó la estratificación de las CEA por ingresos y no consideró la
estratificación por la situación urbana versus rural. En este sentido, la participación de los CEA rurales en
la muestra sería aproximadamente proporcional a la observada en los municipios. Sin embargo, debido a
la dificultad logística de la recolección de muestras de sangre en el hogar y el transporte de las muestras
al laboratorio local para su procesamiento, 46 CEA rurales que estaban a más de dos horas de tiempo
de viaje desde el centro municipal (intervalo de tiempo mayor al permitido por el estudio). protocolo para
la recolección y transporte de muestras de sangre) fueron reemplazados por CEA más cercanos.
Posteriormente, en función de la logística de las muestras de sangre, también se reemplazaron otros 11
CEA rurales durante la recolección de datos.
La selección de hogares elegibles dentro de cada CEA seleccionado utilizó muestreo inverso 14.15.16 durante la
operación de recolección de datos.
La recopilación se inició con la identificación de las CEA seleccionadas (mapas, descripciones, límites y áreas de
exclusión, y el listado de direcciones en el Registro Nacional de Direcciones con Fines Estadísticos - CNEFE, todos
disponibles en el sitio web del IBGE). A esto le siguió la actualización del registro de direcciones por CEA a través del
Sistema de actualización de direcciones de zonas censales (SAES), una aplicación desarrollada por Science y
operado a través del dispositivo de recolección de datos móviles (MDC). En este momento, los entrevistadores
sondearon cada CEA seleccionado, realizando las confirmaciones, correcciones, inclusiones y exclusiones de
direcciones para los edificios encontrados en el camino. Cada edificio identificado se clasificó como un hogar
(privado o colectivo) o un establecimiento.
En cada CEA seleccionado, habiendo concluido la actualización del registro de direcciones, el SAES numeró las
direcciones clasificadas como domicilios particulares (PH) de forma secuencial, comenzando por uno, según el orden de
la ruta recorrida por el entrevistador en el CEA. Luego, se utilizaron tablas de selección para generar una permutación
aleatoria del PH por bloques de diez para las direcciones del CEA (en cada bloque, los diez PH se colocaron en el orden
de la ruta para facilitar el movimiento del entrevistador). El MDC del entrevistador mostró las primeras 20 direcciones
(en orden aleatorio) que se visitarán para definir la elegibilidad del hogar y obtener (si es elegible) el consentimiento de
la familia para realizar la entrevista.
Para cada hogar seleccionado en el que la visita y el contacto no resultaron en una entrevista (PH no
elegible, PH vacante, rechazo, etc.), la aplicación de control de datos instalada en el MDC agregó una nueva
dirección a la lista de direcciones PH a visitar. . Este procedimiento finalizó cuando se obtuvieron diez entrevistas
completas en el CEA o cuando se visitaron todos los PH en el CEA. Así, en cada hogar entrevistado elegible, se
recopiló información sobre todos los niños residentes menores de cinco años.
La probabilidad de inclusión en la muestra del municipio i en el estrato h, representada por P (MHola), depende
de que esté incluido con certeza en la muestra (convirtiéndolo en un estrato de selección) o de haber sido UPM
en uno de los estratos de “otros municipios”, como se indica en la Expresión 4:
Hola
música pop
tH × TH si el municipio es una PSU
∑ popHola
PMHola) = (4)
i=1
1 si se incluyó con certeza en la muestra
donde popHola representa la población menor de cinco años del municipio MHola, estimado para el 1 de julio de
2016, por el método de tendencia lineal 7; TH representa el número total de municipios en el estrato h; y TH
representa el tamaño de la muestra de municipios en el estrato h.
La probabilidad condicional de inclusión en la muestra de CEA j en el municipio i en el estrato h,
condicionada por la selección o inclusión del municipio MHola, representado por P (Shola| MHola), está indicado
por la Expresión 5:
sol hola
PDhola METROHola = tHola × THola
solhola (5)
∑
j=1
donde domhola representa el número de hogares en CEA Shola de acuerdo con la Censo de población 2010; THola
representa el número total de CEA en el estrato de ingresos g, al cual CEA j del municipio MHola pertenece; y T
Hola representa el tamaño de la muestra de CEA en el estrato de ingresos g, al cual CEA j del municipio MHola
pertenece.
La suma de los hogares de las CEA se calculó en el conjunto de las CEA pertenecientes a cada estrato
de ingresos g del municipio.
Así, la probabilidad de inclusión en la muestra de CEA Shola se expresa por:
vhola yhola - 1
PDhijk shola = × (7)
sol* hola vhola - 1
Onde sol* hola representa el número de hogares privados en CEA Shola obtenido después de actualizar el
Registro de direcciones de CEA, realizado en el momento del estudio; vhola es el número total de hogares
privados elegibles seleccionados y visitados en CEA Shola; y yhola representa el número total de hogares
entrevistados en CEA Shola.
Por tanto, la probabilidad de inclusión en la muestra del hogar Dhijk se expresa por:
Ponderación de la muestra
El objetivo de esta etapa fue calcular y asignar pesos muestrales a los niños para permitir la estimación de los parámetros
objetivo en la población de estudio en su conjunto y para análisis de objetivos específicos. Las buenas ponderaciones muestrales
permiten una estimación no sesgada de los parámetros de la población objetivo, compensando los efectos de la falta de
respuesta (de las unidades) y estimando con eficiencia (pequeño margen de error). La guía propuesta por Valliant & Dever17 se
siguió en la elaboración de las ponderaciones muestrales finales del estudio.
Dado que la muestra del estudio fue estratificada y agrupada con probabilidades de selección desiguales, fue necesario
calcular y usar ponderaciones muestrales para cada uno de los hogares entrevistados para permitir una estimación no sesgada
de los parámetros objetivo en la población. Las ponderaciones muestrales se calcularon en tres o cuatro etapas, según el
conjunto de información objetivo. Todas las ponderaciones muestrales se calibraron con los totales de población conocidos, con
el fin de corregir los sesgos típicos en las muestras de hogares y los sesgos resultantes de una posible falta de respuesta
diferencial o debido a otras dificultades enfrentadas durante la realización del estudio.
En la primera etapa se obtuvieron ponderaciones muestrales básicas, correspondientes a las probabilidades
inversas de inclusión de los hogares entrevistados. Los pesos básicos de los hogares se calcularon con la
Expresión (9):
Para controlar mejor la variabilidad, los pesos básicos recibieron un truncamiento superior a 10.000 (es
decir, los pesos superiores a 10.000 se recortaron a este valor). Este tipo de tratamiento se utiliza con frecuencia
cuando los pesos básicos varían mucho.18.
Se aplica el peso básico del hogar a todos los datos obtenidos ya que no se hace selección entre los
hijos residentes. Por lo tanto, el peso básico para todos los niños se estableció igual al peso básico de su
hogar. El peso básico calculado con la expresión 9 tomó dos o tres etapas de ajuste, dependiendo del
conjunto de variables objetivo para el análisis.
La recolección de datos del estudio se interrumpió el 17 de marzo de 2020, debido a la adopción de medidas de
distanciamiento social en respuesta a la pandemia de COVID-19. Debido a la interrupción de la recolección de datos, la
muestra de CEA no fue recolectada en su totalidad. La recolección se concluyó en la mayoría de los estratos y UPM, pero
en algunos no ocurrió (Cuadro 2). En estos estratos y PSU, los pesos calculados en la Expresión 9 se ajustaron mediante
la multiplicación por un factor dado como se indica en la Expresión 10:
donde unHola es el conjunto de CEA muestreados en PSU i en el estrato h; y CHola es el conjunto de CEA recogidos en la
PSU i en el estrato h.
Para facilitar la presentación de las siguientes etapas en el ajuste de ponderaciones, cambiaremos la
notación, omitiendo los índices de estrato, municipio y CEA, que son innecesarios para facilitar la
comprensión de las expresiones y cálculos de los factores de ajuste en las etapas posteriores.
En ausencia de no respuesta, la población total para una variable y, denotada Y = yk,
kuu
podría estimarse sin sesgo utilizando el estimador de Horvitz-Thompson 19, como lo da la Expresión 11:
donde wk es el peso básico ajustado de la unidad k, obtenido por la expresión 10 al final de la etapa 1, y es el
conjunto de unidades de la muestra.
(12)
Como en cualquier estudio, la muestra de ENANI-2019 presentó ítems tanto de unidad como de no respuesta que
deben compensarse en los análisis. Por lo tanto, se utilizó la imputación para compensar la falta de respuesta del ítem
para la mayoría de las variables.
Los análisis de laboratorio de muestras de sangre mostraron falta de respuesta de la unidad y de ítem (falta
de medidas para algún subconjunto de biomarcadores), como se observó en Castro et al. 5. Teniendo en cuenta
la naturaleza de estas mediciones, decidimos que no era posible compensar una falta de respuesta en este
conjunto de variables mediante la imputación. Para compensar esta falta de respuesta, se realizaron ajustes en
los pesos básicos de los niños mediante los siguientes pasos.
Paso 1: Se crearon 25 grupos de niños con respuestas disponibles para diferentes subconjuntos de variables en los datos de
biomarcadores sanguíneos (Tabla 3). Estos grupos fueron identificados por variables ficticias gkr tomando un valor de 1 para las
respuestas disponibles en el grupo r para el niño k, y 0 en caso contrario, con r variando de 1 a 25.
Paso 2: para cada variable ficticia con una respuesta disponible en el grupo r, se ajustó el modelo de
regresión logística para la probabilidad de respuesta, definida en la Expresión 13:
donde xk es un vector con variables predictivas seleccionadas para explicar la propensión a responder, y
es un vector de parámetros a estimar.
El modelo ajustado se utilizó para obtener estimaciones de las probabilidades de respuesta en el grupo r, como se muestra
en la Expresión 14:
Las variables predictivas consideradas en los modelos ajustados en todos los grupos de respuesta fueron las mismas y se
enumeran en el Cuadro 1. La selección de variables para su inclusión en estos modelos se basó en un conjunto de predictores
potencialmente relevantes para explicar el patrón de respuestas a grupos de agrupa los biomarcadores sanguíneos, incluidas las
características de la región, los hogares y los niños. A continuación, se ajustaron los modelos iniciales a los datos, seguido de la
inclusión paso a paso de nuevos predictores hasta llegar al conjunto de variables con efectos principales significativos y
relevantes. No se probaron modelos para las interacciones entre predictores.
Paso 3: para cada grupo de registros con respuesta disponible, se utilizó la probabilidad inversa de
respuesta estimada en el grupo como factor para corregir el peso básico del niño, obteniendo
ponderaciones ajustadas según la Expresión 15:
Dado que se formaron 25 grupos de niños con diferentes conjuntos de variables disponibles en la sección de
biomarcadores sanguíneos, hay 25 conjuntos de pesos ajustados para la falta de respuesta. Además del peso básico
recomendado para todos los demás análisis, cada niño tendrá un peso específico para cada uno de estos 25 conjuntos.
Para cada conjunto de variables en las que el niño presenta una respuesta completa en todas las variables, el peso
correspondiente es positivo. Es nulo en caso de falta de respuesta en al menos una variable del conjunto de variables
objetivo. Los analistas de datos serán los encargados de seleccionar los pesos adecuados para los análisis que incluyan
biomarcadores sanguíneos.
La etapa final en el ajuste de los pesos básicos fue la calibración. La idea básica de la calibración es estimar
los factores fk (llamados factores de calibración) que multiplican los pesos básicos para generar los pesos
calibrados. Estos factores tienen la propiedad de eliminar las diferencias entre las estimaciones obtenidas con
los pesos calibrados y los totales poblacionales correspondientes (conocidos de otras
Tabla 3
Número de niños de 6 a 59 meses con resultados de biomarcadores sanguíneos, según grupo de edad. Encuesta Nacional Brasileña de Nutrición Infantil
(ENANI-2019).
1er Hemoglobina + PCR + ferritina * 7.473 59,2 2,312 52,9 5.161 62,6
1b Hemoglobina + PCR + ferritina ** 7.293 57,8 2,254 51,6 5,039 61,1
1c PCR + ferritina * 7,931 62,9 2.473 56,6 5.458 66,2
dos Hemoglobina + vitamina A Hemoglobina 7.716 61,2 2.435 55,7 5.281 64,0
3 + vitamina A + D + zinc CRP + zinc 7.037 55,8 2.153 49,3 4.884 59,2
4 7,659 60,7 2,369 54,2 5.290 64,1
5 CRP + vitamina A 7,944 63,0 2.509 57,4 5.435 65,9
6 CRP + selenio 7.660 60,7 2,369 54,2 5.291 64,1
7 Ácido fólico + vitamina B12 7.419 58,8 2,267 51,9 5.151 62,4
8 CRP + zinc + selenio + vitaminas A y E 7,506 59,5 2,322 53,1 5.184 62,8
Noveno Ácido fólico, hemoglobina, ferritina, PCR, vitaminas B12, D, A, B1 y B6, zinc y 6.023 47,7 1,779 40,7 4.244 51,4
selenio *
9b Ácido fólico, hemoglobina, ferritina, PCR, vitaminas B12, D, A, B1 y B6, zinc y 6.532 51,8 1.956 44,8 4.576 55,5
selenio ***
10 Hemoglobina, ácido fólico, vitamina B12, ferritina y PCR * 6.526 51,7 1950 44,6 4.576 55,5
11 Hemoglobina, ácido fólico, vitamina B12, ferritina y PCR # 6.556 52,0 1.965 45,0 4.591 55,7
12 Hemoglobina 8.187 64,9 2.626 60,1 5.561 67,4
13 ácido fólico 7.436 58,9 2.273 52,0 5.162 62,6
14 Ferritina 8.156 64,6 2.570 58,8 5.586 67,7
15 Vitamina B12 7.441 59,0 2,277 52,1 5.164 62,6
dieciséis Vitamina D 8.217 65,1 2.608 59,7 5.609 68,0
17 Vitamina 8.393 66,5 2.686 61,5 5.707 69,2
18 Vitamina B1 8.328 66,0 2,665 61,0 5.663 68,7
19 Vitamina B6 8.329 66,0 2,666 61,0 5.663 68,7
20 Vitamina e 8.388 66,5 2.686 61,5 5.702 69,1
21 Zinc 8.052 63,8 2.513 57,5 5.539 67,1
22 selenio 8.054 63,8 2.513 57,5 5.541 67,2
fuentes) para un conjunto de variables auxiliares de calibración o post-estratos 21.22. La calibración ayuda a compensar
la falta de respuesta total de los niños, buscando mitigar los efectos de la falta de respuesta diferencial que pueden
afectar las estimaciones derivadas de la muestra.
La calibración en ENANI-2019 empleó poblaciones totales de niños para 60 post-estratos definidos mediante
la clasificación cruzada de las siguientes variables: región geográfica principal (5 clases), sexo (2 clases) y edad (6
clases - 0 a 5 meses; 6 a 11 meses; 1 año; 2 años; 3 años; 4 años).
La subdivisión de los niños menores de un año en dos clases de edad para propósitos de calibración fue necesaria
dadas las reglas para aplicar parte del cuestionario y recolectar muestras de sangre: solo se extrajeron muestras de
sangre a niños de seis meses o más. Por lo tanto, para evitar la necesidad de utilizar diferentes totales de población
para la calibración de los pesos principales y los pesos para grupos de bio- sangre sanguínea.
Caja 1
Variables predictivas utilizadas para modelar la probabilidad de respuesta para cada grupo de biomarcadores sanguíneos. Encuesta Nacional Brasileña de Nutrición Infantil (ENANI-2019).
No, sí, diarrea; sí, vómitos, sí fiebre y diarrea; sí, fiebre y vómitos;
sí, diarrea y vómitos
NA = no aplica
Elemento de la Escala de seguridad alimentaria brasileña (EBIA) sí
En el; no sabe o no quiere contestar
Raza / color del niño marrón
Blanco; Negro, descendiente de asiáticos; Indígena; no sabe o no quiere
respuesta
variables de marcador, las calibraciones de todos los pesos a las dos clases de edad para niños menores de un año se
consideraron por separado. Los totales utilizados para la calibración son proyecciones de población del IBGE para el 1
de enero de 2020, desglosadas por región geográfica principal, sexo y cinco grupos de edades individuales en años.
Para obtener los totales para los dos grupos de edad menores de un año, las proyecciones del IBGE para niños menores
de un año se dividieron por dos.
En la calibración de pesos, el objetivo es minimizar la distancia (Expresión 16):
= (Fkwk-wk)dosAyk (dieciséis)
k∈C
entre los pesos calibrados (fkwk) y las pesas que se desean calibrar (wk), cumpliendo simultáneamente
con dos conjuntos de restricciones:
XC = Fkwk Xk = Xk
k∈C kuu
Fkwk = fjwj ∀ k ≠ j ∈ H, ∀ H
(17)
Los pesos calibrados deben utilizarse en todos los análisis, no solo con los datos de los niños sino también
con otros datos, como los de los hogares, los padres o tutores de los niños. La calibración de pesos de la forma
descrita aquí se denomina "ponderación familiar integrada”, Asegurando que todas las unidades (niños, etc.) del
mismo hogar tengan el mismo peso 23.
Esta afirmación se aplica a los pesos básicos pero no a los pesos de los grupos de variables de
biomarcadores sanguíneos. En este caso, si el hogar tiene hijos menores de seis meses y mayores de seis
meses, los primeros tendrán ponderaciones nulas ya que no participaron en esta parte de la encuesta. Como se
mencionó, para grupos de variables de biomarcadores sanguíneos, siempre dependerá del analista de datos
seleccionar el peso adecuado para cada análisis.
Para estimar las varianzas, se recomienda utilizar una combinación del último clúster y métodos de
linealización. 9, tal como se implementa, por ejemplo, en el paquete de encuestas 24 del software R (http://
www.r-project.org).
Muestra efectiva
Incluso las muestras con una planificación óptima pueden sufrir ajustes durante la recopilación de datos por diversas
razones. Aunque son posibles fuentes de sesgo, en la práctica, estos ajustes son inevitables. En el caso específico de la
muestra ENANI-2019, el principal problema durante la recolección de datos fue la interrupción del 17 de marzo de 2020,
debido a la pandemia COVID-19. Antes de la interrupción, era necesario realizar sustituciones e inclusiones de CEA en la
muestra, como se describe a continuación. Incluso un municipio entero, Jataí (Estado de Goiás), tuvo que ser
reemplazado por el municipio de Luziânia (Estado de Goiás), ya que no fue posible encontrar un laboratorio clínico que
pudiera realizar la toma de muestras de sangre en Jataí (Cuadro 2).
Como se presenta en la Tabla 2, de un total de 1,500 CEA seleccionados, la recolección de datos se realizó en
1.382, para una pérdida total del 7,9%. Las pérdidas resultantes de la interrupción prematura de la recolección
de datos fueron las más altas en las regiones Norte y Noreste (22,3% y 13,7% de los 300 CEA seleccionados en
estas regiones, respectivamente). Por el contrario, no hubo pérdidas en el Sur, y las pérdidas fueron menores en
el Centro Oeste y Sudeste (3% y 0,3% de los CEA, respectivamente; Cuadro 2).
En la muestra total de CEA, 37 tuvieron que ser reemplazados por dificultades en la recolección de datos,
por la distancia al centro municipal (impidiendo la recolección de la muestra de sangre), o dificultades en el
acceso al CEA, producto de disturbios civiles (narcotráfico, disputas territoriales, etc.), lo que representa el 2,5%
de la muestra total planificada de CEA. Además de estos reemplazos, hubo que agregar CEA a la muestra del
estudio para resolver 18 casos. La recolección de datos no produjo entrevistas con hogares elegibles, habiendo
agotado todas las direcciones de PH. Se agregaron dieciocho CEA a la muestra para compensar estos casos.
En cuanto a la muestra de hogares, se obtuvieron 12.524 (83,5%) hogares, frente al total esperado de
15.000 hogares elegibles. Además, se obtuvieron datos de 14.558 niños, con una pérdida de solo el 3%
en relación al total esperado de 15.000.
Una técnica utilizada en la encuesta fue el muestreo inverso de hogares, que funciona como
“selección de muestras”. En un proceso de muestreo que busca ubicar hogares con miembros de una
población específica, como en la encuesta actual (niños menores de cinco años), el procedimiento
alternativo estándar sería utilizar un “cribado censal” completo, visitando todos los hogares en los CEA
seleccionados intentando determinar si contenían miembros de la población objetivo. Esta alternativa
implicaría un mayor costo en la actualización del registro de direcciones en los CEA. Además,
representaría una etapa de creación de un registro completo de hogares elegibles en cada CEA. Esta
etapa implicaría un aumento no solo de los costos sino también de los tiempos.
Al adoptar el muestreo inverso, la selección de los hogares elegibles se llevó a cabo mediante muestreo y permitió
que la selección de la muestra y el enfoque para la entrevista ocurriera durante el mismo proceso de visita a la CEA para
ubicar y visitar los hogares seleccionados. El costo y el tiempo necesarios para la recopilación de datos fueron, por lo
tanto, mucho menores. Un efecto de este enfoque es la selección de un gran número de direcciones que carecen de un
hogar elegible. Aún así, este costo es mucho menor que con el enfoque alternativo de registrar a todos los hogares en
cada CEA con una visita para verificar la elegibilidad.
En general, fue necesario seleccionar y visitar 193,212 direcciones en los CEA seleccionados, lo que resultó
en un promedio de 140 hogares visitados por CEA, con un promedio de 9 hogares elegibles entrevistados por
CEA seleccionado. De todas las direcciones seleccionadas, el 75,1% finalmente no fue elegible por varias
razones, en su mayoría hogares sin niños menores de cinco años (Tabla 4).
Además de los hogares no elegibles, el 14,2% de todos los hogares seleccionados y visitados se clasificaron
como cerrados al final de la operación (Tabla 4). Se cerró la clasificación de hogares para quienes habían vivido
en el momento de la encuesta, pero donde no fue posible contactar a los residentes para aplicar el protocolo
para intentar realizar la recolección de datos para la encuesta (al menos cuatro visitas en días diferentes y En
Diferentes Momentos).
ENANI-2019 experimentó una tasa de rechazo del 35,8%, considerando solo los hogares elegibles seleccionados
que fueron contactados con éxito (Tabla 4). Considerando todos los hogares seleccionados y visitados como
denominador, la tasa de rechazo fue del 3,7%. La mayor pérdida entre los hogares seleccionados y visitados se debió a
la negativa inicial a participar en la encuesta (33,2% de los hogares elegibles, como se muestra en la Tabla 4), lo que no
sorprende en una encuesta con el tipo de demanda que la ENANI-2019 ejerce sobre las familias. (obtención de datos
sobre sus hijos, incluida la recogida de muestras de sangre).
Cuadro 4
Número de direcciones visitadas, según el resultado de la visita. Encuesta Nacional Brasileña de Nutrición Infantil (ENANI-2019).
Observaciones finales
ENANI-2019 es la primera encuesta de hogares a nivel nacional en Brasil que investiga la lactancia materna y las
prácticas de alimentación complementaria, la ingesta dietética individual, el estado nutricional antropométrico y las
deficiencias de micronutrientes en niños menores de cinco años. La determinación del tamaño de la muestra y la
metodología utilizada en la asignación de CEA en los estratos de selección permitió la representación de la población
objetivo en cada región geográfica importante. El trabajo de campo del estudio presentó buenos resultados en
comparación con otras encuestas de hogares que utilizan los más altos estándares de muestreo en Brasil. Los
resultados permitirán realizar comparaciones con estudios previos y apoyar decisiones estratégicas sobre la
implementación de políticas públicas para menores de cinco años.
Colaboradores Referencias
6. Instituto Brasileño de Geografía y Estadística. 16. Vasconcellos MTL, Silva PLN, Anjos LA. Diseño
Estimaciones de la población residente en los muestral para la Encuesta de Nutrición, Actividad
municipios brasileños y Unidades de la Federación Física y Salud (PNAFS), Niterói, Rio de Janeiro,
con fecha de referencia de 1O de julio de 2016 Brasil. Estadísticas 2013; 65: 47-61.
(notas metodológicas). Río de Janeiro: Instituto 17. Valliant R, Duty JA. Pesos de la encuesta: una guía paso
Brasileño de Geografía y Estadística; 2016. a paso para el cálculo. College Station: Stata Press;
2018.
7. Wood JL, Simões CCS. Estimaciones preliminares de 18. Potter FJ. Relevamiento de procedimientos para el control
la población urbana y rural según las unidades de de pesos muestrales extremos. En: Actas de la Sección de
la federación, desde 1960/1980 por una nueva Métodos de Investigación de Encuestas. Alejandría:
metodología. Revista Brasileña de Estadística Asociación Estadounidense de Estadística; 1988. p. 453-8.
1972; 33: 3-11.
8. Cochran WG. Técnicas de muestreo. 3rd Ed. De 19. Horvitz DG, Thompson DJ. Una generalización del
Nueva York: John Wiley & Sons; 1977. muestreo sin reemplazo de un universo finito. J
9. Persona DG, Silva PLN. Análisis de datos de Am Stat Assoc 1952; 47: 663-85.
muestras complejas. São Paulo: Asociación 20. Hàjek J. Comentario sobre un artículo de D Basu. En:
Brasileña de Estadística; 1998. Godambe VP, Sprott DA, editores. Fundamentos de la
10. Instituto Brasileño de Geografía y Estadística. inferencia estadística. Toronto: Holt, Rinehart y
Encuesta nacional continua por muestreo de Winston; 1971. p. 236.
hogares. Notas metodológicas, versión 1.8. Río de 21. Silva PLN. Estimación de la calibración: cuándo y
Janeiro: Instituto Brasileño de Geografía y por qué, cuánto y cómo. Río de Janeiro: Instituto
Estadística; 2020. Brasileño de Geografía y Estadística; 2004. (Textos
11. Bankier MD. Asignaciones de poder: determinación del para discusión del Comité de Investigación, 14).
tamaño de la muestra para áreas subnacionales. Am Stat
1988; 42: 174-7. 22. Deville JC, Särndal CE. Estimadores de calibración en
12. Rosén BA. Una guía del usuario para el muestreo de muestreo de encuestas. J Am Stat Assoc 1992; 87:
Pareto πps. Estocolmo: Statistiska Centralbyrån; 2000. 376-82.
23. Lemaitre GE, Dufour J. Un método integrado para
13. Freitas MPS, Antonaci GA. Sistema Integrado de ponderar personas y familias. Surv Methodol
Encuestas de Hogares: muestra maestra de 2010 1987; 13: 199-207.
y muestra continua de la PNAD. Río de Janeiro: 24. Encuestas Lumley T. Complex: una guía para el
Instituto Brasileño de Geografía y Estadística; análisis utilizando R. Hoboken: John Wiley & Sons;
2014. 2010. (Serie Wiley en Metodología de encuestas).
14. Haldane JBS. Sobre un método de estimación de
frecuencias. Biometrika 1945; 33: 222-5.
15. Vasconcellos MTL, Silva PLN, Szwarcwald CL.
Diseño de muestreo para elEncuesta mundial de
salud en Brasil. Cad de salud pública 2005; 21
Supl .: S89-99.
Resumen abstracto
El propósito de este artículo es describir aspectos metodológicos relacionados El propósito de este artículo es describir aspectos metodológicos relacionados con la definición de la población de
con la definición de la población de investigación, plan de muestreo, ponderación investigación, el plan del museo, la ponderación de la muestra y la muestra efectiva de laEstudio Nacional de
y calibración de la muestra efectiva de laEstudio Nacional de Alimentación y Alimentación y Nutrición Infantil (ENANI-2019). Se trata de una encuesta de población domiciliaria, que realizó una
Nutrición Infantil (ENANI-2019). Se trata de una encuesta de población evaluación de la lactancia materna y el consumo de alimentos, así como una evaluación antropométrica del estado
domiciliaria que realizó una evaluación de la lactancia materna y el consumo de nutricional y deficiencias de micronutrientes, mediante el análisis de biomarcadores sanguíneos en niños menores
alimentos, una evaluación antropométrica del estado nutricional y una de cinco años. Sus datos se obtuvieron mediante una muestra probabilística de hogares, con estratificación
evaluación de las deficiencias de micronutrientes mediante el análisis de geográfica por macrorregión y conglomerados por sectores censales. La muestra se limitó a 15.000 hogares,
biomarcadores sanguíneos en niños menores de 5 años. Los datos se obtuvieron distribuidos en 1.500 sectores censales, encontrándose 300 en cada macrorregión, junto con 10 hogares elegibles
mediante una muestra probabilística de hogares, con estratificación geográfica por sector, utilizando una muestra inversa. De esta forma se estimaron los parámetros poblacionales necesarios
por macrorregión y agrupamiento por secciones censales. La muestra se para alcanzar los objetivos del estudio. Los pesos básicos de las muestras de diseño se calcularán como inversos a
dimensionó en 15.000 hogares, distribuidos en 1.500 secciones censales, con 300 las probabilidades de inclusión de los hogares en la investigación. Para compensar la falta de respuesta de los ítems
en cada macrorregión y 10 hogares elegibles por sector, mediante muestreo de las variables investigadas, utilizamos la imputación, a excepción de los datos con biomarcadores sanguíneos. La
inverso. Así, se estimaron los parámetros poblacionales necesarios para alcanzar calibración empleó el total de poblacionales de niños para los 60 post estratos, definidos por el cruce de las
los objetivos del estudio. Las ponderaciones muestrales básicas del diseño se variables macrorregión, sexo y edad. La muestra final estuvo compuesta por 14,558 niños, residentes en 12,524
calcularon como la inversa de la probabilidad de inclusión de hogares en la hogares, distribuidos en 1,382 sectores censales dentro de las 27 Unidades de la Federación. Los datos de
encuesta. Para compensar la falta de respuesta de los ítems de las variables ENANI-2019 pueden apoyar estrategias para la promoción e implementación de políticas públicas para niños
estudiadas se utilizó la imputación, a excepción de los datos de biomarcadores menores de cinco años. Para compensar la falta de respuesta de los ítems de las variables investigadas, utilizamos
sanguíneos. La calibración utilizó poblaciones totales de niños para 60 post- la imputación, a excepción de los datos con biomarcadores sanguíneos. La calibración empleó el total de
estratos definidos mediante el cruce de variables de macrorregión, sexo y edad. poblacionales de niños para los 60 post estratos, definidos por el cruce de las variables macrorregión, sexo y edad.
La muestra final fue de 14,558 niños, residentes en 12,524 hogares, distribuidos La muestra final estuvo compuesta por 14,558 niños, residentes en 12,524 hogares, distribuidos en 1,382 sectores
en 1,382 secciones censales en las 27 Unidades de la Federación. Los datos de censales dentro de las 27 Unidades de la Federación. Los datos de ENANI-2019 pueden apoyar estrategias para la
ENANI-2019 pueden apoyar estrategias para la promoción e implementación de promoción e implementación de políticas públicas para niños menores de cinco años. Para compensar la falta de
políticas públicas para niños menores de 5 años. a excepción de los datos de respuesta de los ítems de las variables investigadas, utilizamos la imputación, a excepción de los datos con
biomarcadores sanguíneos. La calibración utilizó poblaciones totales de niños biomarcadores sanguíneos. La calibración empleó el total de poblacionales de niños para los 60 post estratos,
para 60 post-estratos definidos mediante el cruce de variables de macrorregión, definidos por el cruce de las variables macrorregión, sexo y edad. La muestra final estuvo compuesta por 14,558
sexo y edad. La muestra final fue de 14,558 niños, residentes en 12,524 hogares, niños, residentes en 12,524 hogares, distribuidos en 1,382 sectores censales dentro de las 27 Unidades de la
distribuidos en 1,382 secciones censales en las 27 Unidades de la Federación. Los Federación. Los datos de ENANI-2019 pueden apoyar estrategias para la promoción e implementación de políticas
datos de ENANI-2019 pueden apoyar estrategias para la promoción e públicas para niños menores de cinco años. definida por el cruce de las variables macrorregión, sexo y edad. La
implementación de políticas públicas para niños menores de 5 años. a excepción muestra final estuvo compuesta por 14,558 niños, residentes en 12,524 hogares, distribuidos en 1,382 sectores
de los datos de biomarcadores sanguíneos. La calibración utilizó poblaciones censales dentro de las 27 Unidades de la Federación. Los datos de ENANI-2019 pueden apoyar estrategias para la
totales de niños para 60 post-estratos definidos mediante el cruce de variables promoción e implementación de políticas públicas para niños menores de cinco años. definida por el cruce de las
de macrorregión, sexo y edad. La muestra final fue de 14,558 niños, residentes variables macrorregión, sexo y edad. La muestra final estuvo compuesta por 14,558 niños, residentes en 12,524
en 12,524 hogares, distribuidos en 1,382 secciones censales en las 27 Unidades hogares, distribuidos en 1,382 sectores censales dentro de las 27 Unidades de la Federación. Los datos de
de la Federación. Los datos de ENANI-2019 pueden apoyar estrategias para la ENANI-2019 pueden apoyar estrategias para la promoción e implementación de políticas públicas para niños
promoción e implementación de políticas públicas para niños menores de 5 menores de cinco años.
años.