Está en la página 1de 35

Machine Translated by Google

Ministerio de Planificación, Presupuesto y Gestión


Instituto Brasileño de Geografía y Estadística - IBGE
Dirección de Investigación
Coordinación de Métodos y Calidad

Textos para debatir


Dirección de Investigación
numero 15

Estimación de calibración: cuándo y por qué,


cuanto y como

Pedro Luis do Nascimento Silva

Rio de Janeiro

2004
Machine Translated by Google

Instituto Brasileño de Geografía y Estadística - IBGE Av.


Franklin Roosevelt, 166 - Centro - 20021-120 - Río de Janeiro, RJ - Brasil

ISSN 1518-675X Textos de discusión. Dirección de Investigación


Publica estudios y otros trabajos técnicos desarrollados por el IBGE o en conjunto con otras
instituciones, así como los resultantes de consultorías técnicas y traducciones consideradas
relevantes para la difusión del Instituto. La serie está subdividida por unidad organizativa y los
textos son responsabilidad de cada área específica.

ISBN 85-240-3714-8

© IBGE. 2004

Impresión
Gráfica Digital /Centro de Difusión de Información y Documentación - CDDI/IBGE, en 2000.

Capa

Gestión de Creación/CDDI

Silva, Pedro Luis do Nascimento


Estimación de calibración: cuándo y por qué, cuánto y cómo /
Pedro Luis do Nascimento Silva. - Rio de Janeiro : IBGE, Coordinación
de Métodos y Calidad, 2004. 35p. - (Textos para discusión. Dirección
de Investigación, ISSN 1518-675X; n. 15)

Incluye bibliografía.
ISBN 85-240-3714-8

1. Calibración. 2. Muestreo (Estadística). 3. Teoría de la estimación. I.IBGE.


Coordinación de Métodos y Calidad. II. Título. tercero Serie.

Gestión de Bibliotecas y Colecciones Especiales CDU 519.24


RJ/2004-09 ESTE

Impresso no Brasil / Impreso en Brasil


Machine Translated by Google

resumen

Presentación .................................................. .... ............................................... .................. .........5


1. Introducción ............................................... .................................................... ..........7
2. Estimación de la calibración: un marco ........................................... .......................7
3. Razones para la calibración ............................................. ..........................................12

4. Problemas prácticos con la estimación de la calibración ........................................... .......15


4.1 Tamaños de muestra pequeños ........................................... .................................................... ......dieciséis

4.2 Gran número de “grupos modelo” y/ o variables de encuesta .................................. .....17

4.3 Pesos negativos, pequeños o extremos ........................................... ..........................18

4.4 Gran número de variables auxiliares ............................................... ...............................24

4.5 Calibración y falta de respuesta ............................................... ..........................................28

5. Criterios para evaluar el éxito de la calibración ........................................... ..............31

6. Observaciones finales .............................................. .............................................33


7. Referencias ............................................... .................................................... ........34
Machine Translated by Google
Machine Translated by Google

Presentación

Estimación con Calibración: Cuándo y Por qué, Cuánto y Cómo.

Este tema fue objeto de un estudio realizado por el autor durante el Programa de Posgrado
Doctorado realizado en la Universidad de Southampton, Inglaterra, en 4 meses
entre noviembre de 2002 y febrero de 2003. El informe que ahora se está
disponible se produjo originalmente en inglés. Sin embargo, la importancia de
contenido, que está fuertemente relacionado con las prácticas que se han adoptado en la
proceso de ampliación de las muestras de encuestas realizadas por muestreo en el IBGE,
no solo justifica esta divulgación, sino que también alienta la preparación de una versión en portugués.

El documento presenta una revisión de la literatura sobre métodos de calibración.


se utiliza para ponderar y estimar encuestas por muestreo, señala referencias bibliográficas pertinentes,
analiza cuestiones importantes que surgen cuando los métodos de
calibración se utilizan en situaciones reales de investigación y señala los criterios que se pueden
para evaluar si su uso fue exitoso o si ocurrieron dificultades que
requieren la revisión de los resultados.

Sonia Albieri

Coordinador de la Coordinación de Métodos y Calidad


Machine Translated by Google
Machine Translated by Google

1. Introducción

El objetivo principal de este informe es proporcionar una revisión de la literatura sobre los métodos de calibración.

utilizado para la ponderación y estimación de encuestas por muestreo, señalando las referencias más relevantes,

así como para discutir los problemas clave que surgen cuando los métodos de calibración se aplican a levantamientos reales.

situaciones

El informe está estructurado de la siguiente manera. La sección 2 presenta el marco básico y una

definición de calibración que adoptaremos a lo largo. La Sección 3 discute las razones para

calibración y situaciones en las que la calibración vale la pena. La Sección 4 discute prácticas

problemas que uno puede enfrentar al realizar la estimación de la calibración. También incluye un

revisión de varios métodos alternativos para la calibración, desarrollados en respuesta a la

retos que plantean los problemas prácticos. En el capítulo 5 se analizan algunos criterios que se pueden utilizar

para evaluar el éxito de la calibración en cualquier aplicación topográfica en particular. El capítulo 6 proporciona

algunas observaciones finales.

2. ESTIMACIÓN DE LA CALIBRACIÓN: UN MARCO

Sea {1, … ,k,...,N} sea el conjunto de etiquetas que identifican unívocamente los N elementos distintos de un

población objetivo finita U. Sin pérdida de generalidad, sea U = {1, … ,k,...,N}. Se lleva a cabo una encuesta
= ÿ

para medir los valores de J variables de la encuesta. Denotamos por yk ( y ,a 1K kJ , y ) el J×1

vector de valores de las variables de encuesta para el k-ésimo elemento de población.

Suponemos que el propósito principal de la encuesta es estimar la población


ÿ
vector de totales T y = ÿ = y kYU1 norte donde YU denota la matriz de población N×J de valores y
k ÿ EN

YU y ,y[ , 1,y
dada por = 2
L

norte ]ÿ , y 1 denota el vector N×1 de unos.


norte

7
Machine Translated by Google

Aunque a veces se realizan censos para recopilar datos sobre determinados

poblaciones, la gran mayoría de las encuestas son encuestas por muestreo, en las que solo una muestra de los

se investigan los elementos de la población (generalmente una pequeña porción). Suponemos que n distintos

elementos en U están incluidos en una muestra s, s = {k1,K,kn} ÿ U , que se selecciona para

observación en la encuesta.

Por lo tanto, el propósito de la encuesta es estimar Ty sobre la base de la encuesta disponible.

datos {yk ; k s}.ÿ El estimador “estándar” para totales cuando estos son los únicos datos disponibles

de la muestra es el estimador de Horvitz-Thompson definido como

ˆ
T dk yk (2.1)
y
ÿÿ =
Kansas

donde dk = 1/ ÿk es el peso de diseño para la unidad k, y Pik es la probabilidad de inclusión muestral para

unidad k. Denotando por ÿki la probabilidad de inclusión muestral conjunta para los elementos k e i, aquí tenemos

suponga que todas las probabilidades de inclusión de primer y segundo orden son estrictamente positivas, es decir

ÿk > 0 y ÿki > 0 ÿ k, yo ÿ U. Los diseños satisfacen el supuesto de ÿki positivo

considerado en este informe, y se adopta en su totalidad porque simplifica la presentación de

expresiones para las varianzas de diseño y sus estimadores. Sin embargo, no es crucial

supuesto, ya que para muchos de los diseños para los que no se cumple razonablemente

aproximaciones y estimadores para la varianza de diseño de estimadores de totales (medias) son

fácilmente disponible (véase, por ejemplo, Berger, 2002).

Sin embargo, en la mayoría de las aplicaciones de encuestas, los datos de la encuesta también pueden incluir información
= ÿ

en algunas variables auxiliares xk ( x , ,1x k k kp ) , que a menudo puede ser útil para estimar

los totales desconocidos de la población de las variables de la encuesta Ty. Suponiendo por ahora una respuesta completa a

la muestra seleccionada, existen dos escenarios de disponibilidad de información sobre los auxiliares

variables que se pueden considerar.

[ a) La “matriz de datos auxiliares de población” completa


= L está
, X disponible
] en
Xu x 1, x2 , _ norte

el marco de la encuesta, en cuyo caso la población finita totaliza T de estos p


X ÿ = ÿ = xXU1
k norte

kÿ EN

también se conocerán las variables auxiliares, junto con la “matriz de datos auxiliares de muestra”

X x =skk[ 1
,X
2
,
L

, x
k n ]ÿ , a saber, la submatriz de XU obtenida manteniendo solo las filas

correspondientes a las unidades seleccionadas para la muestra (k s).ÿ

8
Machine Translated by Google

b) Sólo está disponible la “matriz de datos auxiliares de la muestra” Xs , junto con el vector de

población auxiliar totales Tx . Por ahora supondremos que Tx se conoce exactamente.

En ambos escenarios donde hay información de población auxiliar disponible para algún x

variables, podemos preguntarnos si esta información puede ser utilizada para mejorar la

estimación del parámetro objetivo Ty. La respuesta a esta pregunta es sí: muy a menudo podemos

hacerlo mejor al estimar Ty teniendo en cuenta la información disponible sobre la x

variables que utilizando el estimador estándar de Horvitz-Thompson (2.1).

Una forma de hacerlo es mediante calibración. La idea clave detrás de la estimación de la calibración es como

sigue. Aunque conocemos los totales de la población para las variables x , supongamos que intentaríamos

estimarlos a partir de la muestra, utilizando el estimador de Horvitz-Thompson (2.1). esto conduciría


ˆ ˆ
a la estimación de Tx por T X dk k X
. Sin embargo, estas estimaciones Tx
a menudo no coincidiría
ÿÿ = Kansas

la población correspondiente totaliza Tx exactamente, lo que lleva al llamado “error de calibración”


ˆ
Tx -Tx . Para evitar este “error”, podemos probar y modificar el estimador de tal manera que no

no habría error de calibración. Esto se puede lograr mediante el uso de un estimador "calibrado"

donde se modifican los pesos de diseño dk , dando paso a nuevos pesos wk para ser utilizados en la
estimador calibrado

ˆ
TxC Xk
semana (2.2)
ÿÿ = Kansas

donde {wk, k s}ÿ son pesos de casos tales que no hay error de calibración, es decir, satisfacen

ˆ
(2.3)
TxCÿ T = ÿ x ÿ Tsemana
X
= 0k X
ÿ
Kansas

Las condiciones (2.3) se denominan "restricciones de calibración". La idea es que si el

Los pesos “calibrados” {wk, k s}ÿ logran reducir o evitar el error al “estimar” la x

totales, también pueden reducir el error al estimar los totales y , usando la calibración
estimador:

ˆ
T
yC y k
semana (2.4)
ÿÿ = Kansas

Los pesos de caja “calibrados” {wk, k s} pueden


ÿ depender de toda la información disponible

sobre las variables auxiliares x, pero no sobre las variables de la encuesta y. Si este es el caso, entonces (2.4)

es un estimador lineal de Ty.

9
Machine Translated by Google

En este informe, nos concentramos en estimadores de “calibración al total” de la forma (2.4), es decir,

ÿ
estimadores lineales definidos por conjuntos de pesos {wk, k s} que satisfacen la "calibración a totales

restricciones” (2.3). Se pueden considerar otras formas de restricciones de calibración, tales como

calibración a momentos de orden superior o incluso a la función de distribución de población finita de

las variables auxiliares (ver la discusión en la sección 10 de Chambers, 1997). Sin embargo, estos

aquí no se considerarán otras formas de estimadores de calibración y, por simplicidad,

siguen la denominación simple prevaleciente de los estimadores definidos por (2.4) con pesos

satisfaciendo (2.3) como "estimadores de calibración".

ÿ satisfacer las restricciones de calibración


Un gran número de conjuntos de pesos {wk, k s} pueden

dados los datos muestrales Xs, las ponderaciones de diseño {dk, kÿ s} y los totales poblacionales Tx. De una sola mano

de seleccionar aquellos que conducen a conjuntos de ponderaciones "razonables" que se utilizarán para estimar los totales de

las variables y es pensar en los pesos de calibración wk como modificaciones a los pesos de diseño dk

que los cambia lo mínimo. Esto se justifica porque el uso de los pesos de diseño dk proporciona

el correspondiente estimador de Horvitz-Thompson (2.1) con propiedades deseables tales como

diseño-imparcialidad y consistencia (en el sentido de que a medida que aumenta el tamaño de la muestra, la

estimador converge en probabilidad hacia el objetivo correcto Ty).

Deville y Särndal (1992) definieron una familia de estimadores de calibración para Ty donde el

Los pesos wk se eligen de tal manera que las funciones de distancia especificadas miden qué tan lejos están las wk .

de la dk se minimizan. Su idea es minimizar

ÿ ,d ÿkkk(
EGÿw
PAGS ÿ
ÿ )ÿ
(2.5)
kÿs
ÿ

o de manera equivalente minimizar, para cada muestra s,

ÿ (Gw,d
kkk ) (2.6)
kÿs

sujeto a (2.3), donde ( )


G kw ,d kes una medida de la distancia entre wk y dk que satisface

algunas condiciones de regularidad que se especificarán más adelante, y EP denota la expectativa con respecto

a la distribución de probabilidad inducida por el diseño muestral utilizado para seleccionar la muestra s.

Una opción popular para la función de distancia es tomar

(wdk )2
( )=
ÿ

k
Gw,d
kkk Kansas
ÿ (2.7)
qd
k

10
Machine Translated by Google

para algunas constantes conocidas qk > 0, k s,ÿ por especificar. En este caso, la solución viene dada por

k = rek× gramok
ancho (2.8)

dónde

ÿ
ÿ

1
ˆ
gramo k ( qd
= +1 qkxTT ÿ ÿxxx
ÿ
X ÿ)ÿ iii
ÿ
ÿ
ÿ k
. (2.9)
es
ÿ
ÿ

Con los pesos (2.8), el estimador de calibración resultante para el total de una encuesta

la variable yj se puede escribir como

TˆyCj
_ = + ÿ wykjk
( Bˆÿ
Tˆy j T Tˆ X =X ÿ) j (2.10)
ÿ
Kansas

ˆ ˆ
dónde Ty j túa kj es el estimador de Horvitz-Thompson para Ty j ykj _
y Bj _ se define
ÿÿ =Kansas ÿÿ =k tu

en (2.13) a continuación. Tenga en cuenta que (2.10) es un estimador de regresión generalizada (GREG) (ver Särndal,

Swensson & Wretman, 1992), motivado por el modelo de población activa

ykj _
= xÿB + Y
kj kj
(2.11)
()
VE ÿkj q =
2
j
/ k

con los coeficientes de regresión poblacional Bj definidos por

1
ÿ ÿ ÿ ÿ
B
j = ÿ ÿ ÿq
ÿ xx_ _ ÿ ÿ qykkXkj ÿ (2.12)
kÿU kÿÿ EN
ÿ ÿ ÿ

y los estimadores de muestra correspondientes dados por

1
ˆ
Bj ÿ
ÿ qd xx
jajajaja
ÿ
ÿ
ÿ
ÿ qd
kkkx
kj y
ÿ
ÿ
. (2.13)
= ÿÿ ÿ ÿÿ ÿ
Kansas
ÿ ÿ Kansas
ÿ

Si se va a utilizar un solo conjunto de pesos calibrados wk para todas las variables de la encuesta (y) , entonces

(2.9) significa que también se utilizará el mismo conjunto de constantes qk para todas las variables de la encuesta. En

muchas aplicaciones, esto no sería un problema, ya que una opción común es hacer todas estas

constantes iguales, es decir, qk = 1 ÿ k ÿ s.

Sin embargo, en algunos casos diferentes variables y pueden tener residuos de la población

regresión lineal sobre las variables auxiliares que presentan diferentes patrones de heteroscedasticidad.

11
Machine Translated by Google

En tales casos, los diferentes conjuntos de valores necesarios para que las constantes qk representen tal

patrones adecuadamente podría conducir a diferentes conjuntos de pesas calibradas, cada conjunto específico para

una o más variables de la encuesta. Por un lado, esto podría estar justificado sobre la base de

mejora de la eficiencia para estimar el total de cada variable y . Por otro lado esto sería

conducir a posibles problemas de coherencia. Por ejemplo, estimaciones ponderadas de partes de una suma

podría no coincidir con la estimación ponderada del total para la suma de las partes. Por lo tanto, la idea de usar

diferentes conjuntos de pesos para diferentes variables y no es atractiva en la práctica.

Aunque esto de hecho no es un requisito de calibración, asumimos de ahora en adelante que la derivación

de los pesos de calibración se realiza con el objetivo de utilizar un solo conjunto de

pesos calibrados {wk, k s} paraÿ estimación con todas las variables de la encuesta.

3. RAZONES PARA LA CALIBRACIÓN

Los estimadores de calibración tienen algunas buenas propiedades. En primer lugar, pesas de calibración que satisfagan

(2.3) proporcione "estimaciones" de muestra para los totales de las variables auxiliares que coincidan exactamente

los totales de población conocidos para estas variables. Por lo tanto, si la población total de los auxiliares

las variables se han publicado antes de que se produzcan los resultados de la encuesta, luego la calibración

garantizaría que las estimaciones de la encuesta sean coherentes con las que ya están en el público

dominio. Esta propiedad, aunque no es esencial, es una de las principales razones por las que la calibración

se utiliza con mucha frecuencia en la práctica de las encuestas. Atrae a los practicantes de encuestas en muchos

casos como una forma de hacer cumplir el acuerdo entre su encuesta y algunos totales de dominio público para claves.
variables

La segunda propiedad es su simplicidad, es decir, el hecho de que las estimaciones de calibración son

lineal. Esto significa que cada registro de la encuesta puede tener un peso único que se utilizará para

estimación para todas las variables de la encuesta. Cálculo de las estimaciones para totales, medias, razones y

muchos otros parámetros es sencillo utilizando software estadístico estándar. En el caso de

las funciones de distancia definidas por (2.6) y (2.7), los pesos calibrados se dan en forma cerrada

expresión de forma y son fáciles de calcular usando software estadístico estándar.

La tercera propiedad de tales estimadores de calibración es su flexibilidad para incorporar

información auxiliar que puede incluir variables continuas, discretas o ambos tipos de

Mismo tiempo. Si los totales auxiliares representan recuentos del número de unidades de población en

ciertas clases de variables categóricas (discretas), entonces los valores de las variables x correspondientes son

simplemente indicadores de que las unidades son miembros de las clases correspondientes.

La clasificación cruzada de dos o más variables categóricas también se puede acomodar fácilmente definiendo

variables indicadoras para las combinaciones de categorías correspondientes.

12
Machine Translated by Google

Los estimadores de calibración también producen cierto grado de integración en el sentido de que algunos

Los estimadores ampliamente utilizados son casos especiales, por ejemplo, razón, regresión y posestratificación.

estimadores (ver capítulo 7 de Särndal, Swensson & Wretman, 1992), así como estimaciones incompletas

posestratificación multidireccional (ver Bethlehem & Keller, 1987).

Los estimadores de calibración también pueden ofrecer cierta protección contra el sesgo de falta de respuesta.

La estimación posterior a la estratificación y la regresión se utilizan ampliamente para intentar reducir

sesgo de falta de respuesta en las encuestas por muestreo. El estimador de regresión (calibración) será

aproximadamente imparcial cuando se cumple el modelo de regresión (2.11) y el muestreo combinado

y el mecanismo de respuesta es ignorable dado el conjunto de x variables para las que auxiliar

se dispone de información sobre la población (p. ej., véase Bethlehem, 1988, Lundström & Särndal, 1999,

y también el capítulo 15 de Särndal, Swensson & Wretman, 1992).

Todas estas razones son argumentos poderosos para usar la calibración. Sin embargo, al hacer

por lo tanto, los usuarios también deben ser conscientes de algunos problemas o dificultades que pueden encontrarse.

En primer lugar, observamos que los estimadores de calibración no son exactamente imparciales desde el punto de vista del diseño. De hecho, el diseño

el sesgo del estimador de calibración viene dado por

ˆ ˆ
Sesgo de diseño
yC () (
=T E TT E wd y ÿ ÿ )
PyC y ) ( ÿ = ÿ ÿ PAGS

ÿ kÿs
k k k
ÿ

ÿ
ÿ
(3.1)

Si los pesos calibrados están "cerca" de los pesos de diseño para todas las muestras, entonces el

el sesgo de diseño será insignificante o cercano a cero. Esto apoya el criterio utilizado para definir la

pesos de calibración wk, lo que requiere que se minimice su distancia al dk . Sin embargo, por

tamaños de muestra pequeños o moderados hay que ser consciente de la posibilidad de enfrentarse a algunos

cantidad de sesgo de diseño.

Para muestras grandes, el estimador de calibración definido por los pesos de regresión (2.8)

y (2.9) no tiene sesgo de diseño asintótico y tiene una varianza de diseño aproximada (ver Särndal,

Swensson & Wretman, 1992, p. 235) pueblo dado

(ˆ )=
AVP Tipoj C ( re
( ÿki
mi ÿkÿ re i mi
ÿ
) a kj )( i yo
) (3.2)
ÿ ÿÿ
ley yo ÿ

donde Ekj es el residuo del modelo de regresión poblacional (2.11) para la variable de encuesta yj.

Si el sesgo es insignificante, podemos comparar esta varianza aproximada con la del

estimador estándar de Horvitz-Thompson para ˆ


Ty j , dada por:

13
Machine Translated by Google

ˆ
Vermont ()
Pyj_ _
= (dydy
(aÿ ÿ ÿk i )
ÿ

a kj
)(
yo
). (3.3)
ÿ ÿÿ
ley yo ÿ

Bajo muestreo aleatorio simple sin reemplazo y suponiendo que qk = 1, la


las expresiones anteriores se simplifican a

ˆ 1 1
(
POR TN
SRS y jC
)= 2ÿ
ÿ
ÿ
ÿ
pags
2
(3.4)
yN hola j

ÿ ÿÿ

ˆ 1 1
VTN( )= 2ÿ
ÿ
ÿ
ÿ
pags
2
(3.5)
SRS añosj yN yj
ÿ ÿÿ

2 2
respectivamente, donde pags
es la varianza de los residuos Ej y pags es la varianza de la
hola j yj

variable de encuesta yj.

Entonces podemos observar que se espera que el estimador de regresión (calibración)


funcionan bien en términos de precisión cuando la varianza de los residuos del modelo de regresión
definida por (2.11) es pequeña comparada con la de la variable y original. Este será el caso
cuando la relación lineal es una buena aproximación para la regresión de y sobre x y la x
Las variables en el estimador de regresión tienen un buen poder predictivo para y. Las dos parcelas en
La figura 1 ilustra esta idea. En este ejemplo, los residuos del estimador de regresión para el
modelo y = Bx tienen una varianza más pequeña que la variable y original (modelo y = B), lo que lleva a
el estimador de regresión tiene una varianza aproximada más pequeña que la varianza del
Estimador de Horvitz-Thompson para muestras del mismo tamaño.

Figura 1 - Residuos de población para estimadores de Horvitz-Thompson (izquierda) y regresión (derecha)

14
Machine Translated by Google

Además, dos estimadores de varianza relativamente sencillos están disponibles para su uso

con el estimador de regresión. Särndal, Swensson & Wretman (1992, p. 235) recomiendan

usando

(
ˆˆ

ÿ (1ÿ
= Pi a )( donde )( ) (3.6)
Vermont
gy c ) j ÿÿÿ
k ssi
ppk
yo kk kj i yo

ÿ
dónde ey
kj
x Bˆ
=ÿ

kj kj . Un estimador de varianza aún más simple que no requiere los pesos g es

dada por

( ) j =ÿÿÿ ÿ(1ÿ ÿ ÿ yo
ˆˆ

Vermont k Pi a )(normal)( ) . (3.7)


yC a kj yo
k ssi

Ambos estimadores de varianza son de diseño asintótico de primer orden sin sesgo para el

varianza aproximada del estimador de regresión, pero (3.6) también es aproximadamente modelo

imparcial (Särndal, Swensson & Wretman, 1989). Además, Silva (1996, p. 48)

demostró que bajo muestreo aleatorio simple sin reemplazo y asumiendo que

el modelo de regresión (2.11) se cumple, el sesgo de (3.6) es O(n-5/2), mientras que el sesgo de (3.7) es

En 2). Por lo tanto (3.6) debería preferirse a (3.7). Holmes y Skinner (2000) apoyan esto

vista basada en los resultados de un estudio empírico llevado a cabo para comparar la varianza alternativa

estimadores para la Encuesta de población activa del Reino Unido (UK-LFS).

4. PROBLEMAS PRÁCTICOS CON LA ESTIMACIÓN DE LA CALIBRACIÓN

Si bien los estimadores de calibración poseen una serie de propiedades atractivas, no son

sin problemas cuando se trata de aplicaciones prácticas. En esta sección, revisamos algunos de los

problemas que afectan a los estimadores de calibración y algunos de los enfoques que se han

desarrollado para hacerles frente. Sin embargo, antes de una discusión detallada, puede ser útil tener una

lista rápida de los problemas que deben ser motivo de preocupación al realizar la estimación de calibración en

práctica:

A. Las muestras son finitas, a menudo pequeñas en ciertos estratos;

B. Gran número de “grupos modelo” y/o variables de encuesta ;

C. Pesos negativos, pequeños (menos de 1) o extremos (grandes);

D. Gran número de variables auxiliares ;

E. Falta de respuesta;

15
Machine Translated by Google

F. Error de medición.

El último tema de esta lista (los errores de medición y su efecto en la calibración), a pesar de

su importancia, no se discutirá aquí. Los lectores pueden encontrar alguna discusión en

Desollador (1999). Todas las demás cuestiones se tratarán en las siguientes secciones.

4.1 - Tamaños de muestra pequeños

El problema con los estimadores de calibración cuando los tamaños de muestra son pequeños proviene de la

hecho de que su sesgo de diseño puede llegar a ser importante, en relación con su varianza. Es bien sabido, por ejemplo, que

los estimadores de razón tienen sesgo de diseño y que el sesgo es O(n-1) (ver

Cochran, 1977, pág. 160-162). El estimador de razón es un caso especial del estimador de calibración

cuando el vector x incluye una sola variable continua x, no se incluye ningún término de intersección, y

las constantes qk se establecen en qk = 1/ xk (asumiendo que xk > 0 ÿ k). Se recomienda esa relación

Los estimadores se pueden usar solo para muestras de tamaños lo suficientemente grandes como para que el sesgo sea insignificante.

Särndal, Swensson & Wretman (1992, p. 251) sugieren que las muestras de tamaño 20 o más

debería ser suficiente para que esto suceda. Cochran (1977, p. 162) sugiere que el coeficiente

de variación del estimador de Horvitz-Thompson del total de la variable x ( ( ) CVˆTx ) debería

ser inferior a 0,1 (10 %) antes de que el sesgo del estimador de razón pueda ignorarse o considerarse pequeño en comparación

con su error estándar.

A pesar de estas conocidas “reglas generales” o limitaciones que deberían evitar que los estimadores de razón se

usen con muestras muy pequeñas, el software moderno facilita la estimación de razones.

y otros estimadores de calibración que se calcularán para muestras de cualquier tamaño, a menudo sin ningún

advertencias de que los tamaños de muestra pueden ser insuficientes para garantizar una utilización segura. Esto deja espacio

para aplicaciones en las que no se toman las mínimas precauciones, como esta de comprobar

si el tamaño de la muestra es adecuado. En los casos en que los tamaños de muestra son demasiado pequeños, la calibración

las estimaciones pueden estar sujetas no solo a una gran variación (como se esperaba debido a la pequeña muestra

tamaño) sino también a un sesgo notable. Se insta a los usuarios de estimadores de calibración a evitar aplicar

la técnica cuando los tamaños de muestra son demasiado pequeños. Hasta el momento, no existen reglas simples de seguridad con respecto a

Se desarrollaron tamaños de muestra mínimos para la familia general de estimadores de calibración.

Sin embargo, al menos se podría sugerir que las mismas reglas aplicables a la estimación de razón simple

debe cumplirse antes de aplicar alguna otra forma de estimación de calibración.

dieciséis
Machine Translated by Google

4.2 - Gran número de “grupos modelo” y/o variables de encuesta

Otra fuente de dificultades para usar estimadores de regresión (o calibración) es la

hecho de que estos se aplican a menudo por separado para una serie de "grupos modelo", definidos como

grupos de unidades para los que tanto la pertenencia a la muestra como la información de la población auxiliar son

disponible. Estos grupos modelo pueden coincidir con estratos de muestreo predefinidos, o pueden

formarse después de la selección de la muestra, en cuyo caso desempeñarán el papel de posestratos.

Cuando tales grupos de modelos son numerosos, los tamaños de muestra pequeños pueden resultar para algunos (o de hecho

muchos de ellos.

El problema a menudo se ve agravado por el hecho de que el número de variables de la encuesta también puede ser

grande. En este caso, aunque el cálculo de los pesos de calibración se realiza una sola vez (los pesos no dependen de las

variables y ), la idoneidad de los valores subyacentes

modelos que proporcionan las condiciones para que los estimadores de calibración funcionen bien (en el sentido de

proporcionando residuos con una pequeña variación) deben ser verificados. En algunos casos, esta tarea puede

volverse demasiado grande para ser factible dentro de los estrictos programas de producción que las encuestas típicas

hay que adherirse. Por este motivo, se advierte a los usuarios que no intenten realizar

calibración a niveles que son demasiado detallados en el sentido de involucrar demasiados grupos de modelos.

Cuantos más grupos de modelos se consideren para la calibración, más recursos se deben

dedicado a la validación del modelo y al análisis de las estimaciones de calibración resultantes.

Esta discusión se parece a la de comparar proporciones separadas y combinadas.

estimadores. Los estimadores de razón separados son estimadores de calibración donde la calibración es

realizado a los totales conocidos en el nivel de estrato (grupo modelo). Los estimadores de razón combinada involucran la

calibración solo a nivel agregado (para la muestra como un todo o para algunos grupos más amplios formados a partir de

conjuntos de estratos agrupados). Cochran (1977, p. 167) argumenta que “el uso de un

Es probable que la estimación de la razón por separado en cada estrato sea más precisa si la muestra en cada estrato

estrato es lo suficientemente grande como para que la fórmula aproximada para la varianza de los

el estimador de razón es válido, y el sesgo acumulativo que puede afectar al estimador de razón separado es

despreciable. Con solo una pequeña muestra en cada estrato, la estimación de la razón combinada debe ser

recomendado a menos que haya buena evidencia empírica de lo contrario.” no pude encontrar

mejores palabras para decirlo yo mismo, y sugeriría que este consejo también debería aplicarse a

estimadores de calibración en general.

4.3 - Pesos negativos, pequeños o extremos

El tercer grupo de problemas comprende aquellas situaciones que surgen cuando los pesos de calibración se

consideran en algún sentido extremos o poco representativos. Un caso importante

17
Machine Translated by Google

ocurre cuando la calibración resulta en pesos negativos, es decir, en tener algunos pesos wk < 0

(o gk < 0). Esta situación no representa ningún problema desde un punto de vista estrictamente teórico, pero

conduce a dos dificultades desde una perspectiva práctica. En primer lugar, la interpretación habitual del caso

pesos como el número de unidades de población representadas por la unidad de muestra correspondiente es

perdidos para estos casos, y la liberación de tales pesos sería una decisión muy incómoda para

muchos organismos de estadística. El segundo problema es que los pesos negativos eventualmente podrían

producir estimaciones negativas para algunos dominios con tamaños de muestra pequeños, lo cual no es un

resultado aceptable para la mayoría de las aplicaciones de encuestas prácticas cuando las variables de la encuesta son

intrínsecamente no negativo. También notamos que los pesos negativos pueden proporcionar una indicación de

algún problema con el intento de calibración que necesita la atención del estadístico en

cobrar.

Para abordar este problema de la posibilidad de pesos negativos, una serie de enfoques

ha sido desarrollado. Un enfoque que se implementa en los paquetes de software desarrollados

por algunas agencias estadísticas es calcular los pesos de ajuste de calibración gk que
minimizar

2
( ÿ

) =
( ÿ wk dk qkdk ÿ dgdqd ÿd (g k
ÿ

k )2 k
=
k
ÿ
2
1) / q k
(4.1)
ÿ
Kansas ÿ
Kansas ÿ
Kansas

sujeto a las restricciones de calibración

ˆ (4.2)
xC kkk
X X
T ÿ T = ÿ X ÿ T = 0 gramo
ÿ
Kansas

y también a las restricciones de contorno adicionales

ÿ ks
LgU ÿ para ÿ (4.3)
k

donde 0 < L < 1 < U.

Este es el enfoque adoptado en el desarrollo de GES (Generalized Estimation

System) de Statistics Canada (Estevao et al., 1995). Este problema corresponde a

minimización de una función cuadrática (4.1) bajo límite lineal (4.2) y (no lineal) (4.3)

restricciones GES intenta resolver este problema usando un algoritmo eficiente, pero la solución es

no siempre se garantiza que exista. GES incluye, además de la determinación de la calibración

pesos, estimación eficiente de totales, medias y razones para poblaciones y por dominios,

junto con las varianzas correspondientes para el elemento estratificado o el muestreo por conglomerados de una sola etapa

diseños Los estadísticos que buscan una herramienta computacional para implementar la calibración deben dar

este paquete debida consideración. Un inconveniente es su dependencia de las estadísticas de SAS.

18
Machine Translated by Google

software, lo que hace que esta sea una opción razonablemente costosa. Si SAS ya está disponible, sitio

la concesión de licencias de GES de Statistics Canada no es prohibitiva para la mayoría de las estadísticas a gran escala.

agencias, y costaría mucho menos que desarrollar un software equivalente.

Otra implementación del enfoque anterior está disponible en BASCULA (ver

Nieuwenbroek y Boonstra, 2002). La principal diferencia entre GES y BASCULA es la

algoritmo utilizado para calcular los pesos de calibración. BASCULA adopta un algoritmo propuesto

por Huang & Fuller (1978) para calcular pesos calibrados que satisfacen las restricciones de contorno.

Como es el caso de GES, BASCULA tampoco siempre garantiza encontrar una solución

satisfaciendo todas las restricciones especificadas. BASCULA es un programa independiente y, por lo tanto, puede ser

más económico de obtener que GES si la organización aún no es usuaria de SAS.

Otro enfoque que se propuso para resolver el problema de los pesos negativos se debe

a Deville & Särndal (1992), quienes definieron la familia de estimadores de calibración. En el anterior

enfoque, la función de distancia estándar que conduce a los pesos de regresión se mantuvo y

se impusieron condiciones de contorno como restricciones adicionales. El enfoque propuesto por

Deville & Särndal consiste en modificar la función de distancia a utilizar al calcular la

pesas calibradas, de tal manera que se evite la posibilidad de pesos negativos del

comienzo. Por lo tanto, la idea es definir pesas de calibración que minimicen

ÿ (Gw,d
k k ) (4.4)
kÿs

para cada muestra s, sujeto a las restricciones de calibración (4.2), donde las funciones de distancia

Gk puede ser una de las opciones en la Tabla 1. Tenga en cuenta que la función de distancia estándar (caso 1) es

también se incluye para completar, porque es un miembro de la familia, pero puede producir

pesos negativos. Todas las funciones de distancia consideradas satisfacen algunas condiciones de regularidad,

es decir, para cada d>0 fijo :

a) G (k () w,d) ÿ 0 y G d,d = k0 ;

b) G ( )w,d k se define en un intervalo Dk que contiene d;

c) G ( )w,d k es estrictamente convexa y diferenciable dos veces en w;

d) ÿGk ( ) w,d ÿw es continua y asigna Dk a un intervalo Imk(d) en un uno a uno

Moda.

19
Machine Translated by Google

Tabla 1 – Funciones de distancia para estimación de calibración propuestas en Deville & Särndal (1992)
jajajaja ( ,d )
Caso Funciones de distancia q ×G w

2
1 ( d) ksemana
2dk
ÿ

2 sesión
k wd [
( )ÿ1
]k wÿIniciar
rek k

3
(
2 semanas ÿ ns )2

4 wdk ÿ [ registro(
k
wdk k )+1 ]

2
5 ÿ

( )semana
semana2dsemanas

6 ÿ g kL
ÿ

ÿ tu g
ÿ

k
en
k
g kL
()ÿ
ÿ

Iniciar sesión U ÿg ÿ k
ÿ( ÿ + ) ÿregistro ÿ ÿ = kÿ
gramo , 0 1< <
LU<
ÿ 1 L EN 1 dk
ÿ ÿ

La solución para el problema de minimización se puede obtener usando el método de

Multiplicadores de Lagrange. Usando este método, las wk que minimizan (4.4) sujetas a (2.3) son
obtenido como solución de

ÿG
ÿ kkk
( ) w ,d / w k ÿ Xÿ kÿ = 0 ÿ ÿKansas
. (4.5)

Si existe una solución, considerando los supuestos de regularidad adoptados, será única,

y dado por

)w ( xÿ
k = rek F q k ÿ = re k (4.6)

donde F(·) es el mapeo recíproco de ÿGk ( ) w,d ÿw (ver Tabla 2), ( g = F q k k) xl y ÿ es

el vector de multiplicadores de Lagrange, que resuelve

)ÿ1 =] ÿ k
ÿ

ÿ [ ( dk
xk Fÿ qk
x T Tˆ X X (4.7)
ÿ
Kansas

El estimador de calibración resultante viene dado por

ˆ
T
yC gk dk k y (4.8)
ÿÿ =Kansas

20
Machine Translated by Google

con los factores de ajuste de calibración gk definidos por una de las funciones de calibración F(·) en
Tabla 2.

Tabla 2 – Funciones de calibración correspondientes a varias funciones de distancia


propuesto por Deville & Särndal (1992)
Caso Funciones de “Calibración” F( ) q uk

1 1q +k

2
( ) q exp Reino Unido

3
( )2
ÿ

1 / 2 ÿ q reino unido

4
( )1
ÿ

1
- q reino unido

5 1/ 2
(1 2unido
ÿ

ÿ q reino )

6 ÿ +1)
PERLA ÿ (1 ) exp(
Leelo UL ÿ

,A =
k
, 0 L< 1< U
<
( (EN ÿ +)ÿ1) (1 L ) exp( Aquí (1 LU)( 1)
k )
ÿ ÿ

7 L si en < (1)
L-/ q k

1 + qu k si (1)L-
ÿ ÿ/ quk U- / q (1) k

EN si en > (1) U-/ q k

(1) Tenga en cuenta que la función de calibración 7 corresponde a la función de distancia número 1 de la tabla 1, pero
con límites especificados para los pesos de calibración.

Por lo tanto, un algoritmo para calcular los pesos de calibración se puede especificar como el
siguiente secuencia de pasos.

Paso 1: Calcule el error de calibración para el estimador de Horvitz-Thompson de los totales de los
ˆ
variables auxiliares: Tx Tx ÿ .

Paso 2: Para la función de calibración elegida F(·), resuelva las ecuaciones de calibración necesarias para

determinar ÿ, a saber

[ ]
ÿ

rekF q (
x ÿk x T Tˆ)ÿ1
ÿ = ÿk X X
(4.9)
ÿ
Kansas

21
Machine Translated by Google

Esto se puede lograr usando el método de Newton. Primero, defina

H sÿ ÿd F q X ÿ [
k ) (() k=
ÿ1 . X ] k (4.10)
ÿ
Kansas

Luego, el paso 2 del algoritmo requiere encontrar el valor ÿ que resuelve


ˆ
H ÿs =
( )ÿ Tx Tx . Primero calculamos un valor inicial para ÿ como

1
yo = ÿ ÿ qd xx T Tˆ ÿ
[ ÿ

]
1
ÿ
ÿ ÿ ÿ jajajaja X X
(4.11)
ÿ
Kansas ÿ

Luego realice iteraciones del cálculo del método de Newton, en cada iteración r=1,2,…,

el valor actualizado

ˆ ÿ

[Tx ÿTx )ÿ] Hs


1
[ ÿ=+
ÿ

yo
r +1 ÿ ÿ( r Hs ( )]r (4.12)

dónde

ÿ
H ÿs (H) ÿ= ÿ
r ÿ ( ) / ÿ s yo=yo
. (4.13)
r

Las iteraciones proceden hasta la convergencia (dados los límites de tolerancia especificados) o hasta que el

se alcanza el número máximo de iteraciones permitidas sin lograr la convergencia, en la que


en caso de que se emita una alerta de que no se encontró una solución.

Paso 3: Una vez obtenida la solución para ÿ, calcule los pesos de calibración

( wk = re Fk q ) xl . (4.14)
k

Los pesos de calibración y estimadores correspondientes obtenidos como resultado de este

algoritmo conserva todas las propiedades deseables que discutimos en relación con la regresión

estimadores (secciones 2 y 3). Además, los estimadores de razón de clasificación, como los que se utilizan para ponderar

personas en el UK-LFS también pueden verse como casos especiales de la clase general de calibración

estimadores. Deville y Särndal (1992) demostraron que los miembros de esta clase tienen

propiedades asintóticas idénticas a las de los estimadores GREG basados en el mismo conjunto de

variables auxiliares. Por lo tanto, los estimadores de calibración generales definidos por uno de los anteriores

Las funciones de distancia son asintóticamente no sesgadas por diseño, con una varianza aproximada dada por

(3.2). Además, su varianza también se puede estimar mediante (3.6) o (3.7).

22
Machine Translated by Google

Se implementaron estimadores de calibración de este tipo en el SAS Macro CALMAR

(Sautory, 1993). Este programa solo realiza cálculos de peso, pero existe una variante denominada

CALJACK fue desarrollado en Statistics Canada (Bernier & Lavallée, 1994) que incluye

Estimación de varianza Jackknife para totales, medias, razones y diferencias de estos. CALMAR

también requiere SAS, pero está disponible una implementación más reciente (pero limitada) del método:

g-CALIB-S, desarrollado en Statistics Belgium, se ejecuta bajo SPSS (Vanderhoeft, 2001).

La estimación de la calibración, como ahora se ha ampliado, proporciona las herramientas para tratar de

resolver el problema de los pesos negativos, que se pueden evitar eligiendo las funciones de calibración 2 a 7 en la

Tabla 2. También brinda cierto control sobre el problema de los pesos extremos o pesos menores.

que 1, lo que se puede evitar eligiendo las funciones de calibración 6 o 7 y haciendo

=
L 1/min{d , k especificando
s} k ÿ y alguna U adecuada. Sin embargo, varios de los problemas
discutidos antes quedan sin resolver.

Primero, para muestras pequeñas y moderadas, el sesgo puede ser un problema y ahora, la elección de

La función de distancia puede volverse importante a este respecto. En segundo lugar, aunque el método es

orientada a evitar pesos negativos o extremos, no se garantiza una solución. Deville & Särndal (1992) demostraron que

la probabilidad de encontrar una solución para ÿ en el paso 2 del algoritmo

tiende a uno a medida que n aumenta. Sin embargo, no es uno con muestras finitas. De ahí que en algunos

aplicaciones, el método puede fallar en la convergencia dependiendo de las elecciones de F(·), L y U.

Cuando este sea el caso, los usuarios del método deben tratar de investigar las causas detrás de la

fracaso en encontrar una solución. Puede deberse a muestras pequeñas o “extremas”, en el sentido de que la

los pesos de calibración resultantes pueden necesitar ser más extremos de lo que estamos preparados para permitir

cuando especificamos las restricciones de contorno L y U. También puede suceder porque grandes

número de x variables se consideran para la calibración, lo que puede conducir a problemas de

colinealidad, un tema que discutiremos en la siguiente sección.

4. 4 - Gran número de variables auxiliares

Un problema que los enfoques discutidos anteriormente no abordan es qué hacer cuando

una gran cantidad de variables x potenciales están disponibles para ser consideradas para la calibración. Una opción

simplista es considerar cada una de las posibles variables x en la calibración. Esto puede parecer deseable desde un

punto de vista práctico, porque el error de calibración sería cero

para todos los totales de población conocidos. Sin embargo, esta opción también puede causar una serie de problemas.

Primero, puede ser más difícil resolver el sistema de ecuaciones de calibración requerido para

determinando ÿ en el paso 2 del algoritmo, porque su tamaño aumenta con el número de x

variables, y el cálculo puede ser exigente. En segundo lugar, un mayor número de x variables puede

23
Machine Translated by Google

conducen a problemas de colinealidad que afectan la solución de las ecuaciones de calibración. Banquero (1990)

y Sautory (1993) propusieron descartar variables auxiliares linealmente dependientes antes de

intentando la solución de las ecuaciones de calibración en el paso 2 del algoritmo. Esta solución es

bastante fácil de implementar y no conduce a la pérdida de calibración para cualquier variable x , ya que
las variables descartadas son combinaciones lineales exactas de variables retenidas en la calibración

problema, y los estimadores de calibración resultantes son lineales. Una solución alternativa usando

inversas generalizadas de matrices se implementó en el programa g-CALIB-S (Vanderhoeft,

2001).

Bankier (1990) y Bankier, Rathwell & Majkowski (1992) también propusieron descartar

variables auxiliares para controlar la variación de peso manteniendo la función de distancia estándar

1. Esta solución conduce a la pérdida de calibración de las variables x descartadas , así como a la pérdida de

control sobre qué x variables se calibrarán.

Un problema adicional encontrado cuando se consideran muchas variables x en el

la calibración es la del aumento potencial en el error cuadrático medio (MSE) de la resultante

estimador de calibración. Silva (1996, capítulo 4) y Silva y Skinner (1997) demostraron que

a veces, un gran número de variables auxiliares puede reducir la eficiencia del

estimador de calibración (regresión) para tamaños de muestra pequeños a moderados. Por ejemplo, bajo

Muestreo Aleatorio Simple sin reemplazo (SRS) y asumiendo el modelo (2.11) para

con qk = 1 para cada k, Silva (1996, p. 45) demostró que

2
ˆ
1
(1 n/ n )
pags

(1 On/+p+) ( /
ÿ ÿ

MSE SRS
(NT) y
=ÿ
norte
)52 (4.15)
norte

donde ÿ2 es la varianza de los residuos de la regresión de y sobre x, y p es el número de x

variables consideradas. Esta expresión revela que el MSE de un estimador de regresión puede

en realidad aumentan a medida que aumenta el número de variables x , si el aumento en el segundo orden

el término p/ n compensa la disminución en la varianza de los residuos ÿ2 . Por supuesto, esto no es un

problema si la muestra es grande, pero para muestras pequeñas a moderadas, el número de auxiliares

las variables pueden tener algún efecto notable en el MSE del estimador de regresión.

Como ilustración del problema, la Figura 2 traza el MSE del estimador de regresión

para conjuntos crecientes de variables auxiliares, asumiendo un muestreo aleatorio simple con n=100 de

una población de jefes de hogar para los cuales se recopilaron datos como parte de la prueba

censo de población de Limeira, estado de São Paulo, Brasil, 1988.

24
Machine Translated by Google

400

300

200

100

0
1 2 3 4 5 6 7 8 9 10 11 12
Número de x variables

Figura 2 – MSE del estimador de regresión versus número de x variables

Silva y Skinner (1997) demostraron, en un ejercicio de simulación limitado, que la regresión

la estimación después de la selección de subconjuntos puede ser más eficiente que la estimación de regresión saturada,

para tamaños de muestra moderados (n = 100; J = 5; 10). Clark (2002) informa resultados similares.

para n = 100; 250 y J = 24; 40. Ambas fuentes informaron también que la incidencia de

los pesos fueron menores después de la selección del subconjunto que cuando la calibración utilizó el conjunto saturado de x

variables. Esto sugiere que parte del problema con los pesos negativos proviene de

Calibración “excesiva”.

Aunque la idea de aplicar algún tipo de procedimiento de selección de variables para seleccionar x

variables para la calibración puede conducir a estimadores más eficientes para algunas variables y especificadas,

este enfoque no está libre de problemas. Primero, conduce a la pérdida de calibración para x descartados

variables En segundo lugar, el enfoque es intrínsecamente univariante, en el sentido de que la selección de subconjuntos

es específico de la variable y, lo que implicaría diferentes conjuntos de ponderaciones para diferentes variables y .

Además, la estimación de la varianza se vuelve más difícil después de la selección de subconjuntos, como se señaló en Silva y

Desollador (1997). Sin embargo, el mensaje que surge de estos estudios es que realizar

calibración o estimación de regresión “automáticamente” con todas las variables auxiliares disponibles

puede no ser una estrategia eficiente, particularmente para muestras con tamaños pequeños a moderados o

cuando el número de variables auxiliares es grande en relación con el tamaño de la muestra. En tales casos, se recomienda

prestar cierta atención a la selección de subconjuntos adecuados de las variables disponibles, incluso si uno no está preparado

para utilizar procedimientos formales de selección de modelos como los descritos por Silva y Skinner (1997). En encuestas

repetidas, por ejemplo, uno puede

dedicar esfuerzos en las primeras rondas de la encuesta para establecer un conjunto adecuado de variables para

25
Machine Translated by Google

calibrar y luego usar el subconjunto fijo para la calibración en rondas posteriores del

encuesta.

Se han propuesto algunos otros enfoques para manejar el caso de resultados negativos o

pesos extremos. Chambers (1997) propuso los llamados estimadores de "calibración de cresta",
donde la idea básica es minimizar la función de distancia modificada

ÿ ÿwddq
( )k / k
2
k
1+k
C
(T Tˆ ÿxCT Tˆ
X
ÿ

)( X
ÿ

xC ) (4.16)
ÿ
Kansas

donde ÿ es una matriz diagonal de costos de error de calibración, y ÿ es un parámetro de cresta escalar para

se especifico. En este enfoque, no hay restricciones que satisfacer. Los pesos resultantes

son dados por

ÿ ˆ
ÿ ÿ

1 ÿ
ÿ

wdq
k
=
TT ÿk ÿ 1+ÿ
kx
( ÿ

X
) ÿ
ÿ C -1 + ÿ ÿ ÿqdiii xxx k
ÿ (4.17)
ÿ ÿ es
ÿ ÿ ÿ
ÿ

Tenga en cuenta que en este enfoque una medida de la cantidad de error de calibración es

incorporado como el segundo término de la función de distancia. Sin embargo, dado que no existen

limitaciones de calibración vinculantes, los pesos resultantes y el estimador ya no están garantizados

para evitar errores de calibración por completo. Alguna elección de ÿ tal que todos los pesos “calibrados por crestas”

(4.17) son positivos siempre es posible. Una idea puede ser elegir el ÿ más pequeño que satisfaga

esta condición. Chambers (1997) analiza otros enfoques para elegir ÿ. Cuidadoso

especificación de la “matriz de costos de error de calibración” ÿ permite una selección flexible de subconjuntos de

variables auxiliares para las que se debe eliminar el error de calibración. Para ello basta con

use elementos diagonales muy grandes en esta matriz correspondientes a las variables auxiliares para

cuyo error de calibración debe ser cero. El enfoque es una mejora sobre los procedimientos que

descartar las variables auxiliares por completo, en el sentido de que algún control sobre la cantidad de

el error de calibración se puede mantener para todas las variables x . Chambers (1997) consideró otros

Versiones de calibración de crestas que tienen como punto de partida pesos derivados bajo un

enfoque basado en modelos o basado en modelos no paramétricos. También consideró atípicos robustos

modificaciones de este enfoque que pueden ser de ayuda en los casos en que los valores atípicos en las variables y

son motivo de preocupación. Sin embargo, estos son específicos de la variable y y, por lo tanto, no se considerarán
más aquí.

Rao y Singh (1997) propusieron otro enfoque en líneas similares, que es

llamada estimación de "calibración de contracción de cresta". Una vez más, la idea se basa en minimizar un modificado

función de distancia, pero esta vez, bajo restricciones de rango (restricciones de límite). los

26
Machine Translated by Google

El procedimiento es similar a la calibración de cresta de Chambers (1997) si la solución inicial satisface

las restricciones de contorno. Si no, estas restricciones de contorno se relajan y el procedimiento

itera entre la modificación adaptativa de la matriz de costos del error de calibración y el rango deseado

restricciones hasta la convergencia.

Hedlin et al (2001) también discutieron el problema de los pesos de calibración extremos. Este

El artículo exploró el comportamiento de los estimadores de calibración (GREG) cuando los modelos subyacentes

estaban mal especificados y propuso algunas medidas de diagnóstico para evaluar la idoneidad del modelo para una

situación de encuesta determinada. Parte del diagnóstico consideró la idea de que los pesos g definidos por (2.9) son

funciones de medidas de influencia conocidas de una unidad muestral

en el ajuste de modelos de regresión lineal. Los diagnósticos sirvieron para localizar los más

pesos g extremos, y proponer remedios que involucraran, por ejemplo, posestratificar el

muestra y usando estimación de regresión o calibración solo para aquellas unidades de muestra para las cuales

los pesos g no son extremos, y usando el estimador de expansión simple para los postestratos

formado con las unidades con pesos g extremos.

El mensaje, de nuevo, es que el mero cálculo automático de los pesos de calibración es

no es una buena práctica, y se debe dedicar cierta atención a analizar los pesos resultantes para

evaluar si el uso de la estimación de calibración o regresión es "seguro" y eficiente. Una

Una forma sencilla de hacerlo es realizar un análisis de datos de los pesos g y tratar de marcar

aquellos que son extremos en algún sentido. Los casos más obvios son los pesos g negativos o pequeños (aquellos

que conducen a pesos calibrados finales menores que 1) o los pesos g muy grandes (digamos, con gk > U). El punto

de corte U puede determinarse arbitrariamente (digamos, hacer U = 5 o 10), o por métodos dependientes de datos (U

> Q3+1.5(Q3-Q1)), donde Q1 y Q3 denotan la muestra

cuartiles del gk, k ÿ s.

4.5 - Calibración y falta de respuesta

Hasta ahora discutimos la estimación de calibración bajo el supuesto de completa

observación de la muestra seleccionada. Sin embargo, la falta de respuesta es un problema generalizado. La mayoría

encuestas de la vida real experimentarán una cierta cantidad de falta de respuesta, a pesar de incorporar bien

métodos y procedimientos diseñados para prevenir la falta de respuesta. Un nuevo tema importante trajo

Pi
acerca de la falta de respuesta es la del sesgo. Estándar Horvitz-Thompson (-inverso ponderado)

estimadores estarán sesgados a menos que la falta de respuesta sea completamente al azar, e incluso en este

situación poco probable, la estimación de los totales requiere al menos algún ajuste simple para compensar la pérdida

de unidades de muestra debido a la falta de respuesta.

27
Machine Translated by Google

La calibración es un enfoque útil para tratar de reducir el sesgo debido a la falta de respuesta.

Lundström (1997) y Lundström & Särndal (1999) incluso sugieren "la calibración como estándar

método para el tratamiento de la falta de respuesta”. Los estimadores de calibración tienen un diseño aproximado

imparcial si hay una respuesta completa, para cualquier elección fija de variables auxiliares. Por debajo

sin respuesta, sin embargo, los estimadores de calibración pueden estar sesgados incluso en muestras grandes. Desollador

(1999) examinó el impacto de la falta de respuesta en los estimadores de calibración. algunos de sus

Las conclusiones incluyeron lo siguiente:

• “Se puede esperar que la presencia de falta de respuesta conduzca a ponderaciones negativas mucho

más frecuentemente";

• “los pesos wk no convergerán a los pesos originales dk como el tamaño de la muestra

aumenta”;

• “la varianza del estimador de calibración dependerá de las funciones Gk


y es necesario considerar métodos revisados de estimación de la varianza”.

Sin embargo, la reducción del sesgo prevista mediante la calibración solo se logrará si el

Los mecanismos combinados de no respuesta y muestreo son ignorables dadas las variables x

considerado para la calibración. Esto sugiere que la elección de las x variables a considerar

para la calibración debe tener en cuenta los efectos probables de la falta de respuesta y, en particular,

debe apuntar a incorporar todas las variables x para las cuales se dispone de datos auxiliares de población que

llevar información sobre las probabilidades desconocidas de responder a la encuesta. Debajo de

modelo simplificado donde d k denota la probabilidad de que una unidad responda a la encuesta dada

que se selecciona en la muestra, y la respuesta es independiente para distintas unidades, una condición

para que el estimador de calibración sea aproximadamente imparcial bajo el muestreo conjunto y
1 ÿ
d k 1 = + qk x ÿ para todo k y algún vector de constantes ÿ (Ver
ÿ

distribución de respuesta es que

Lundström, 1997, pág. 46). Sin embargo, debido a que los pesos de calibración wk son siempre de la forma
ÿ

(w
k = rek F q k ) x ÿ (ver 4.14), es fácil ver que la calibración conducirá a aproximadamente

estimaciones imparciales cuando wd = d


ÿ1
, una condición que depende tanto de la elección de x
k k

variables y en la forma de la función de distancia (o calibración) utilizada para obtener la

pesos de calibración.

Un ejemplo en el que esta pregunta puede ilustrarse bien proviene de la ponderación

realizado para UK-LFS (ver ONS, 2001, sección 9). En esta encuesta, la ponderación tiene en cuenta

distribución regional de la cuenta (17 Regiones o 454 Autoridades Locales), edad (11 o 17 años)

grupos) y el sexo de los individuos muestreados. Estas son variables para las cuales auxiliares

28
Machine Translated by Google

la información está disponible a nivel de población de fuentes externas. el numero de x

variables utilizadas para la calibración es bastante grande (1.002) y la función de distancia elegida es

tipo 2 en la Tabla 1, correspondiente a los pesos implícitos en el estimador de razón de raking.

Sin embargo, un estudio de la incidencia de falta de respuesta en esta encuesta mostró que la falta de respuesta es

no completamente al azar, como se indica en la tabla de la página 43 de la Guía del usuario de UK-LFS

(ONS, 2001). Parece que la probabilidad de responder depende de características como


como:

• Composición del hogar;

• Estado de Empleo;

• Estado del alquiler y tipo de alojamiento;

• Estatus socioeconómico;

• Región de residencia;

• Región de origen; mi

• Estado civil, edad y educación del jefe.

Claramente, entonces, uno puede ver que la calibración solo en edad, sexo y región como es actualmente

el caso no puede aspirar a eliminar todo sesgo debido a la falta de respuesta. no es el numero de x

variable que importa, ¡sino tener las x variables correctas! Por supuesto, esto es más fácil dicho

que hecho, y en el caso de UK-LFS, claramente hay dificultades. Por ejemplo, si la falta de respuesta depende del

estado laboral, uno podría verse tentado a intentar calibrar con información externa proporcionada por fuentes basadas

en registros, como el recuento de solicitantes. Sin embargo, para muchas de las otras variables, la información auxiliar

confiable de la población puede

no estar disponible, o ser difícil o costoso de obtener.

El mensaje aquí es que no es suficiente calibrar en "todo lo que está disponible" para ser

libre de prejuicios. Aún más, Gambino (1999) sugiere que en algunos casos la calibración puede

incluso empeorar las cosas, y argumenta que “es bien sabido que en muchas encuestas, los jóvenes

los hombres tienden a perderse de manera desproporcionada. Dado que las estimaciones demográficas por edad-sexo son

normalmente utilizado en la calibración, el efecto es aumentar el peso de los machos jóvenes que

por casualidad respondiendo a la encuesta. Si, para algunas variables de interés, los machos jóvenes que

tienden a convertirse en encuestados difieren sustancialmente de los hombres jóvenes que tienden a ser extrañados

de la muestra..., entonces el efecto de la calibración es dar más peso a un no-

29
Machine Translated by Google

componente representativo de la muestra”. Supongamos que supiéramos que los machos jóvenes que entonces

Los que se pueden perder con más frecuencia son los que viven solos y los que tienen más probabilidades de

responden son los que están viviendo con sus padres o familiares. Por lo tanto, la ponderación debe apuntar

aumentar el peso de los del primer grupo (varones jóvenes que viven solos) pero no de los

en el segundo grupo (viviendo con la familia). La parte crucial de información que tendríamos que hacer

que serían los totales de población por edad y sexo y composición del hogar (hogares de una sola persona frente a

otros hogares). Si esta información no está disponible, todavía hay algún remedio limitado para probar. La ponderación

podría realizarse a nivel de hogar y no a nivel de

nivel individual. Por lo tanto, los machos jóvenes que viven solos tendrían pesos que dependen de qué

tipo de hogar en el que viven, pero esta no sería la corrección de sesgo que estaríamos

buscando, simplemente, el siguiente mejor sustituto dados los datos disponibles.

El ejemplo anterior ilustra los problemas que uno tiene que abordar en relación con el uso de

calibración para compensar la falta de respuesta. Si el mecanismo de respuesta depende de

características del hogar (aparte de la ubicación regional), como su tamaño y composición, así como

así como las del cabeza de familia, entonces tal vez el hogar debería ser la unidad para la cual los pesos

se calculan, y los miembros individuales del mismo hogar reciben luego el hogar

peso.

Gambino (1999) advierte que para el ajuste por falta de respuesta, “la mala elección del ajuste

variables o clases pueden empeorar las cosas”, y concluye que “es nuestro deber como estadísticos trabajar con los

usuarios para garantizar que las herramientas de calibración se utilicen con prudencia”. Una de las razones por las

que la calibración puede empeorar las cosas es porque puede enmascarar los efectos de

falta de respuesta Por ejemplo, usar pesos de muestreo no ajustados para estimar la población

conteos por edad y sexo, uno podría ubicar las celdas para las cuales las estimaciones están bajo el

nivel esperado por una cantidad que es demasiado grande para ser debido a un error de muestreo. Estos son los

celdas para las cuales es más probable que la encuesta pase por alto elementos. Tales estimaciones podrían

luego se puede usar para detectar las celdas para las cuales los efectos probables de la falta de respuesta son mayores. Pero si

las estimaciones se calculan solo con pesos calibrados, tales desviaciones de lo esperado o

los recuentos conocidos no aparecerán. Los usuarios necesitarían un esfuerzo adicional para calcular la precalibración

estimaciones requeridas para analizar los efectos probables de la falta de respuesta, si el pi-inverso pondera dk

se ponen a disposición junto con los datos de la encuesta.

5. CRITERIOS PARA EVALUAR EL ÉXITO DE LA CALIBRACIÓN

Un componente importante de cualquier trabajo de estimación o análisis estadístico es la

evaluación de qué tan bien se desempeñaron los procedimientos adoptados en la aplicación en cuestión. Con

aplicaciones de estimación de calibración, además de la habitual estimación de varianza que debe

30
Machine Translated by Google

ser realizado de forma rutinaria, sugerimos que también es importante evaluar una serie de otros

aspectos del resultado. Esto es importante para verificar que algunas de las metas previstas de

se ha alcanzado la calibración y para verificar los problemas potenciales que pueden afectar el
Salir.

Como primera medida, sugerimos examinar la cantidad de error de calibración restante

para el conjunto completo de x variables que se seleccionaron inicialmente para la calibración. Esto debería

idealmente ser cero, si el error de calibración se eliminó por completo, pero puede ser distinto de cero si algunos de los

x variables fueron descartadas durante el proceso de determinación de los pesos de calibración, o si

se adoptan algunos de los enfoques que no conducen a una calibración exacta. La media
el error de calibración absoluto relativo para los totales de población estimados de las variables x es

dada por

1
pags

ˆ
M1 Tx j C ÿ
j
TxT _/ X
j . (5.1)
ÿ= = j 1
pags

Una segunda medida, que es importante para permitir comprobar si necesitamos ser

preocupado por el sesgo con el estimador de calibración, es el coeficiente de variación promedio de

las estimaciones de Horvitz-Thompson de los totales de las x variables, a saber

1/ 2
pags

1
()j] /T
ˆˆ

M2 V Tx X
j (5.2)
[ ÿ= = j 1
pags

ˆˆ

donde ( )j V Tx es una estimación de la varianza del estimador de Horvitz-Thompson del total de

la j-ésima variable auxiliar, dada por

ˆˆ

(
VermontX = ( a )(
/ ÿk ÿ ÿi dxdx 1ÿ a kj
)( yo
). (5.3)
) j ÿÿÿ kÿ ssi

Algunas otras medidas que pueden ser de interés se refieren a la distribución de la g

pesos Dos de estos son las proporciones de pesos g extremos (pequeños o grandes) , donde algunos

definición de cuál es el rango aceptable que se necesita:

1
M3 = ÿ (Yo) gk<L (5.4)
norte ÿ
Kansas

1
M4 = ÿ (te)pido> _ . (5.5)
norte ÿ
Kansas

31
Machine Translated by Google

El coeficiente de variación es otra medida con respecto a la distribución de la g

Pesos que pueden ser útiles:

1 2
M5 = ( ) kggg / (5.6)
n ks 1 ÿÿ ÿ
ÿ

1
donde g kg _ es el peso g promedio.
ÿÿ =
norte
Kansas

La distancia entre los pesos g y los pesos d también es una medida importante,

que sugerimos deben ser considerados:

1 2 1 2
M6 = ÿ
= ÿ

1 ) /q (5.7)
ÿ ( ) wdqd
k k k ÿ re (gk k
norte norte
ÿ
Kansas ÿ
Kansas

Tenga en cuenta que normalizamos esta distancia dividiendo la función de distancia de calibración por

el tamaño de la muestra, para que sea más fácil comparar entre muestras de diferentes tamaños. Aún

otra posibilidad sería dividir por el tamaño de la muestra menos el número de x variables

considerado, lo que permitiría conjuntos de variables auxiliares de diferentes tamaños. Te sugerimos

que la función de distancia chi-cuadrado se use incluso cuando la función de distancia real que

se minimizó para obtener los pesos de calibración es una de las otras funciones en la Tabla 1.

Por último, pero no menos importante, los usuarios deben probar y acceder a las ganancias de la calibración en

comparación con los estimadores estándar de Horvitz-Thompson. Esto se puede lograr por

comparando la eficiencia promedio para un conjunto específico de y variables, dado por:

j
1
( )()/
ˆˆ ˆˆ

M7 Vermont (5.8)
Vg Ty C
ÿ= j= j 1
j yo allí

donde las varianzas en los numeradores se estiman utilizando (3.6) y las de

los denominadores se estiman usando (5.3) con los valores de x reemplazados por los valores de y .

Usando este conjunto de siete medidas y cualquier otra que pueda estar proporcionando información

sobre los mismos aspectos se recomienda enfáticamente para los usuarios de estimación de calibración.

6. OBSERVACIONES FINALES

En este informe, revisamos la literatura sobre la estimación de la calibración y tratamos de transmitir

el mensaje de que es un enfoque flexible, poderoso y conveniente para la ponderación de encuestas y

Estimacion. Al mismo tiempo, señalamos algunas de las dificultades que los usuarios de la

32
Machine Translated by Google

técnica puede enfrentar en aplicaciones prácticas, así como también proporcionó alguna orientación sobre cómo

estos pueden ser detectados y eludidos.

El valor de la estimación de la calibración para situaciones prácticas de levantamiento es claramente

demostrado por el creciente número de paquetes de software desarrollados para su aplicación

así como el número de encuestas importantes en varios países que dependen de la calibración para su

ponderación y estimación. En países como Canadá, Estados Unidos, Reino Unido y Francia, se utiliza la estimación de

calibración para las encuestas de población activa. En Brasil y Canadá, también se utiliza para las muestras recolectadas

como parte de los Censos de Población.

Si bien se reconoce este valor, animamos a los usuarios a ser críticos con el

resultado de la ponderación de calibración, y subrayar la importancia de una verificación cuidadosa de la

pesos y estimaciones resultantes, para ver que cumplan con los criterios de desempeño y altos

estándares de calidad y confiabilidad que se espera de las principales estadísticas de encuestas.

La calibración no debe usarse para “disfrazar” resultados de encuestas sesgados, donde la cobertura y

el sesgo de falta de respuesta se “cubre” mediante una simple calibración con los totales de población conocidos.

Los usuarios de la técnica deben, ante todo, buscar ser transparentes sobre la metodología.

aplicación y de la evaluación de su éxito, con el fin de proporcionar a los usuarios de la encuesta

resultados con la posibilidad de ejercer una evaluación crítica de la adecuación al propósito de la

estadísticas resultantes producidas con estimadores de calibración.

Finalmente, alentaríamos a los productores de datos que opten por adoptar la ponderación de calibración en

encuestas en las que se publicarán archivos de microdatos, a proporcionar a los usuarios secundarios la información

necesaria para que puedan hacer un uso adecuado de los datos, en el sentido de ser

capaz de calcular estimaciones puntuales y de varianza correctamente. Esto es mucho más desafiante que

cuando se utilizan los estimadores habituales de Horvitz-Thompson, porque la información sobre el conjunto completo de x

Las variables utilizadas para la calibración también deben publicarse junto con los pesos d originales y

los pesos w finales para cada registro de encuesta. Todavía se necesita investigación sobre la mejor manera de

lograr este objetivo sin sacrificar las restricciones necesarias requeridas para la protección

de confidencialidad.

7. REFERENCIAS

BANQUERO, MD (1990). Estimación por mínimos cuadrados generalizados bajo posestratificación.


Procedimientos de la Sección de Métodos de Investigación de Encuestas, Asociación Estadounidense de Estadística,
730-755.

BANKIER, MD, Rathwell, S. & Majkowski, M. (1992, Statistics Canada, Methodology Branch Working Paper Series SSMD
92-007E) – Estimación de mínimos cuadrados generalizados en dos pasos en el censo canadiense de 1991.

33
Machine Translated by Google

BERGER, YG (2002). Un estimador de varianza simple para muestreo de probabilidad desigual sin reemplazo.
Manuscrito no publicado.

BERNIER, N. y Lavallée, P. (1994). La macro SAS: CALJACK. Ottawa: Estadísticas de Canadá, División de
Métodos de Encuestas Sociales.

BETHLEHEM, JG (1988) Reducción del sesgo de falta de respuesta a través de la estimación de regresión.
Diario de Estadísticas Oficiales, 4, 251-260.

BELÉN, JG y Keller, WJ (1987). Ponderación lineal de los datos de la encuesta por muestreo.
Diario de Estadísticas Oficiales 3, 141-153.

CÁMARAS, RL (1997). Ponderación y calibración en la estimación de encuestas por muestreo. En Conferencia


sobre ciencia estadística en honor al bicentenario del nacimiento de Stefano Franscini, Birkhäuser Verlag Basel.

CLARK, RG (2002). Diseño y estimación de muestras para encuestas de hogares. Wollongong: Universidad de
Wollongong, Escuela de Matemáticas y Estadística Aplicada, Ph.D. inédito. disertación.

COCHRAN, WG (1977). Técnicas de muestreo, 3ª edición. Nueva York: John Wiley & Sons.

DEVILLE, JC & Särndal, CE (1992). Estimadores de calibración en el muestreo de encuestas. Revista de la


Asociación Estadounidense de Estadística, 87, 376-382.

ESTEVAO, V., Hidiroglou, MA & Särndal, CE (1995). Principios metodológicos para un sistema de estimación
generalizado en Statistics Canada. Diario de Estadísticas Oficiales, 11, 181-204.

GAMBINO, J. (1999). Problemas en la ponderación de las encuestas de hogares y empresas: comentarios de los
comentaristas. Actas del Instituto Internacional de Estadística.

HEDLIN, D. et al. (2001). ¿Importa el modelo para la estimación de GREG? Un ejemplo de encuesta empresarial.
Diario de Estadísticas Oficiales, 17, 527-544.

HOLMES, DJ y Skinner, CJ (2000). Estimación de varianza para las estimaciones de nivel y cambio de la
Encuesta de población activa. Serie Metodología GSS no. 21

HUANG, ET y Fuller, WA (1978). Estimación de regresión no negativa para datos de encuestas por muestreo.
Actas de la Sección de Estadísticas Sociales, Asociación Estadounidense de Estadística, 300-305.

LUNDSTRÖM, S. (1997). La calibración como método estándar para el tratamiento de la falta de respuesta. Tesis
doctoral, Departamento de Estadística, Universidad de Estocolmo.

LUNDSTRÖM, S. & Särndal, CE (1999). La calibración como método estándar para el tratamiento de la falta de
respuesta. Diario de Estadísticas Oficiales, 15, 305-327.

NIEUWENBROEK, N. & Boonstra, HJ (2002) – Bascula 4.0 para ponderar datos de encuestas por muestreo con
estimación de varianzas. Survey Statistician, julio de 2002.

ONS (2001). Encuesta de población activa – Guía del usuario – Volumen 1 – LFS Antecedentes y metodología
2001. Londres: Oficina Nacional de Estadística.

RAO, JNK & Singh, AC (1997) – Calibración de peso de rango restringido para datos de encuestas.
Manuscrito no publicado.

34
Machine Translated by Google

SÄRNDAL, CE, Swensson, B. y Wretman, JH (1989). La técnica de residuos ponderados para


estimar la varianza del estimador de regresión general del total de la población finita.
Biometría, 76, 527-537.

SÄRNDAL, CE, Swensson, B. y Wretman, JH (1992). Muestreo de encuesta asistido por modelo.
Nueva York: Springer-Verlag.

SAUTORY, O. (1993) – La macro CALMAR: ajuste de una muestra por calibración en los márgenes,
INSEE.

SILVA, PL D. N. (1996). Utilizar información auxiliar en la estimación y análisis de encuestas por


muestreo. Southampton: Universidad. de Southampton, Departamento de Estadísticas Sociales,
Ph.D. inédito. disertación.

SILVA, PL D. N. y Skinner, CJ (1997). Selección de variables para estimación de regresión en


poblaciones finitas. Metodología de la encuesta, 23, 23-32.

SKINNER, CJ (1999). Peso de calibración y errores no muestrales. Investigación en Estadísticas


Oficiales, No. 1, 33-43.

VANDERHOEFT, C. (2001) – Calibración generalizada en Statistics Belgium – SPSS módulo g-


CALIB-S y prácticas actuales, Statistics Belgium Working Paper N. 3.

35

También podría gustarte