T - Cnicas de Dise - o de Encuestas

Universidad Nacional de Colombia
Facultad de Ciencias
Departamento de Estadística
SIMPOSIO DE ESTADÍSTICA
SAN ANDRÉS, 2000
TÉCNICAS DE DISEÑO DE ENCUESTAS
Leonardo Bautista Sierra

Profesor Asociado
Universidad Nacional de Colombia
San Andrés, Colombia, julio de 2000

Simposio de Estadística 2000 3
1. EL PLAN MUESTRAL
Tres son los componentes que pueden ser considerados como partes fundamentales
de lo que constituye un plan muestral para un estudio o encuesta. Ellos son las
definiciones básicas, los estimadores a utilizar y el propiamente llamado diseño
muestral o procedimiento de selección aleatoria. Las definiciones básicas
indispensables en la conformación del plan muestral son el UNIVERSO de estudio,
las VARIABLES de interés y los PARÁMETROS a estimar. Estas definiciones, así
como la información, los recursos y el tiempo disponible son los condicionantes del
plan. La estrategia muestral se construye luego, sobre la base de los condicionantes
particulares del estudio, mediante la combinación de estimadores y diseños
muestrales a utilizar. Finalmente, el resultado de un proyecto de muestra para
encuesta se plasma en el informe o propuesta técnica de plan muestral. Estos son
los temas a considerar en los próximos cinco numerales.
1.1 Definiciones básicas
1.1.1 Universo de estudio
El primer aspecto a tratar es el relativo al denominado UNIVERSO DE ESTUDIO, en

este sentido se tienen que diferenciar al menos cuatro conceptos que aunque tienen
nombres similares deben ser claramente diferenciados al momento de interpretar los
resultados de una encuesta. El primer término se puede denominar el universo
ideal y se trata del conjunto sobre el cual el investigador y no propiamente el
muestrista, pretende obtener alguna información y sobre el cual recaerán,
posiblemente las consecuencias de las decisiones basadas en los resultados de la
encuesta. La segunda expresión recibe con frecuencia el título de población
objetivo y constituye el conjunto de elementos que partiendo del universo ideal
puede ser realmente alcanzado por el investigador. Una vez definido el universo ideal
del investigador, los ajustes recortes, bien por operatividad, razones políticas,
Técnicas de diseño de encuestas

económicas, o sociales conducen a lo que se denomina población objetivo. Por

ejemplo la diferencia entre el concepto general de caficultor y la precisión posterior
basada en una cantidad mínima de área sembrada en café. Otro ejemplo es aquel
en el que el universo ideal lo constituye el grupo de conductores de servicio público
pero la población objetivo se limita a aquellos conductores de servicio público con
una antigüedad no menor a seis meses y una dedicación no inferior a 30 horas
semanales en la actividad en el último semestre. Otro ejemplo, con un sentido algo
diferente puesto que no se trata de recortar el universo ideal, sino por el contrario, de
ajustarlo, es el caso de un estudio sobre los propietarios de vehículo. La definición
jurídica, es decir tomada a partir de la tarjeta de propiedad adjudica el vehículo a la
entidad financiera, por ejemplo a la compañía de Leasing sin embargo el
investigador está interesado en la opinión de quien lo usa como propietario. Las
definiciones del investigador tienen todavía que pasar por un tamiz adicional. Para
conseguir información a partir de una encuesta se necesita un plan de muestreo
probabilístico y este se basa en un marco muestral. El tercer término relacionado con
el universo es el marco de muestreo.
El marco de muestreo es el dispositivo que permite identificar y ubicar los sujetos que
toman parte en los diferentes procesos de selección al azar. En muchos estudios,
una gran parte de los recursos se invierten en la construcción, la corrección y la
complementación de los marcos. De hecho el marco constituye el primer instrumento
indispensable de todo plan muestral y muchos investigadores ven recortadas sus
aspiraciones por la ausencia de un marco muestral adecuado. En algunos casos la
imposibilidad de financiar la construcción o consecución del marco muestral conduce
a la renuncia del método estadístico de encuesta como metodología de investigación.
En tales casos se hacen estudios no probabilísticos sin posibilidad de inferencia
estadística y que son tomados como estudios de caso o sondeos sin pretensiones de
generalización. En muchos casos no se dispone de un marco de elementos pero si
se dispone del marco de conglomerados o conjuntos de elementos. Por ejemplo no
se dispone del marco de alumnos de octavo grado escolar, pero si se dispone del

listado en el que es posible identificar y ubicar cada uno de los colegios de la ciudad.
En estos casos se aplica un diseño de conglomerados o en varias etapas.
El marco de muestreo se ve finalmente afectado por lo que se podría denominar la

población susceptible de encuesta que viene a ser el cuarto y último término
relativo al universo de estudio. La población susceptible de estudio se refiere al
conjunto de elementos del marco muestral con probabilidad mayor a cero de ser
incluidos en la muestra. Respecto a esta diferencia entre marco y población
susceptible de encuesta es importante resaltar la imposibilidad cada día más alta de
acceso a los sectores sociales de más alto nivel socioeconómico. Las condiciones
nacionales marcadas por la inseguridad de personas y familias hace que los sectores
más pudientes establezcan sistemas de seguridad que impiden el acercamiento el
acceso y que hacen prácticamente imposible la consecución de información. El
hecho de tener la identificación y la ubicación de los principales productores en una
rama económica no garantiza que se pueda acceder a ellos y menos que se pueda
conseguir la información.
La meta del muestrista es encontrar mecanismos que cierren la brecha entre el

universo ideal del investigador y la población susceptible de encuesta. Para ello es
primordial la consideración de diferentes marcos de muestreo y el planteamiento de
formas de acceso adecuadas para diversos subconjuntos del universo; lo que de
hecho conduce a diseños muestrales estratificados por razones operativas y de
acceso.
1.1.2 Variables de interés
La segunda definición importante es la referente a las variables de interés. Un

razonamiento similar al del universo de estudio se plantea en muchos casos para
remarcar la diferencia entre variable ideal del investigador y la variable operacional,
es decir aquella que está en condiciones de ser observada y ser objeto de medición.
La tarea del muestrista es encontrar la forma de que la variable operacional que él

6 Simposio de Estadística 2000
propone refleje lo más cercanamente posible el concepto que el investigador

pretende estudiar. Es por este tipo de trabajo que en algunas partes del mundo al
estadístico y en particular al muestrista se le conoce con el título de metodólogo o
experto en metodología de medición. Sin embargo, en muchos casos la forma de
medición de un fenómeno hace parte inherente a la disciplina del investigador y el
papel del muestrista se limita entonces a determinar y controlar las fuentes de
variación de los procesos de medición, como por ejemplo calibración de equipos,
instrumentos y operarios, memoria de los fenómenos, ruido, etc. Dentro del resto de
este escrito se denominará con el nombre de ELEMENTO al objeto de medición u
observación. El universo es el conjunto de elementos. Para el k-ésimo elemento del
universo las medidas de las variables X, Y, Z serán notadas con la nomenclatura x k,
yk, zk. El universo se dirá compuesto por N elementos, N cantidad finita aunque no
necesariamente conocida, como en el caso del muestreo en varias etapas.
1.1.3 Parámetros a investigar
Finalmente como última componente previa y necesaria para poder iniciar la

elaboración de una estrategia muestral es la respuesta al QUË se quiere medir. Es la
determinación de los PARÁMETROS objeto de estudio, es decir las características
poblacionales de interés. Estadísticamente, el valor de la característica en un
elemento es útil sólo en la medida que él se integra con los valores de otros
elementos para conformar una medida poblacional. Así por ejemplo desde la
perspectiva de encuesta el objetivo no es saber la producción de un productor
particular sino estimar la producción nacional. La meta no es saber cuanto gasta un
determinado hogar en educación sino estimar el porcentaje regional de gasto de los
hogares en educación. Obviamente para alcanzar la meta propuesta, y debido a la
metodología estadística, es necesario realizar las observaciones de los elementos,
pero ellas no constituyen un objetivo en sí. El objetivo de la encuesta es el
conocimiento de características poblacionales, por ello sus instrumentos de
observación son muy diferentes a los utilizados en los exámenes o estudios en los
que el objetivo es el conocimiento a fondo del elemento observado. Cómo se verá

más adelante esta diferencia de objetivos conduce a la diferencia entre el

cuestionario de encuesta y la ficha de expediente. Las características poblacionales
de interés, desde la perspectiva muestral son de tres tipos TOTALES, RAZONES o
INDICADORES especiales.
Los totales son la suma sobre el universo de la variable en estudio. Se notará en este
escrito como ty y se define como: t y  U yk
La variable y puede ser de tipo cuantitativo y el total de interés es entonces el

acumulado en el universo. Ejemplos de este caso son:
La producción total de arroz en una región, en cuyo caso el elemento es la
unidad de producción agropecuaria UPA.
La cantidad total de accidentes de tráfico en un departamento en un año,
con el municipio como elemento.
El monto total de ventas en una determinada rama del comercio, con la
empresa de comercio como elemento.
La cantidad de niños de una ciudad que en edad escolar no visitan un
centro educativo, tomando como elemento el hogar.
Un caso particular de repetida aplicación es cuando la variable y cuenta si un

elemento posee o no una determinada característica, en tal caso se dice que el total
es sencillamente la frecuencia absoluta con que se presenta la característica en
estudio.
Sea Ud el conjunto de elementos del universo que poseen la característica d en

c
estudio, su complemento se nota como U d . El parámetro de interés es entonces N d
la cantidad de elementos que constituyen el subconjunto Ud. Se define para este

1 si k  Ud
caso la variable ydk   en forma tal que el parámetro de interés se convierte
0 si k  Ucd
en el total Nd  t yd   U
ydk . Ejemplos de este total son:
La cantidad de hogares de la ciudad que consumen un determinado

producto.
La cantidad de personas económicamente activas que buscan empleo.
La cantidad de casos de una determinada enfermedad que llegaron a
los hospitales de la ciudad en el semestre anterior.
La cantidad de niños de una ciudad que en edad escolar no visitan un
centro educativo, tomando como elemento el niño.
Un caso particular y frecuente que aunque parece trivial, es de mucha importancia es
el caso del tamaño total del universo, muchas veces desconocido. Para este caso
particular se utiliza en este escrito la notación zk = 1 para todo k  U ; así
t z  U zk  U 1  N
Desde el punto de vista práctico el parámetro que se estudia en la gran mayoría de

los casos es del tipo de RAZON. Una razón la define el muestrista como el cociente
de dos totales. Es decir, para un estudio en el que para cada elemento se estudian
dos características y, z, y se tienen los totales ty, tz una razón está definida como:
R
ty


U
yk
. Ejemplo cuando las dos variables son de tipo cuantitativo son:
tz 
U
zk
El rendimiento en toneladas por hectárea sembrada en una región de la

producción de maíz, como el cociente de la producción total de maíz en
la cosecha sobre el total de área sembrada.

La productividad en una empresa en términos de unidades producidas

por hora de maquina, como el cociente del total de unidades producidas
sobre el total de horas trabajadas por las máquinas.
El consumo de combustible en términos de kilómetros recorridos por
galón de combustible en una empresa de transporte. Es tal caso la
razón deseada es el cociente entre el total de kilómetros recorridos por
los vehículos de la empresa, sobre el total de combustible consumido
en el mismo período de tiempo.
Muchas veces la razón de interés es el cociente entre dos frecuencias, por ejemplo:
La proporción de personas que favorecerán con su voto a un candidato
sobre el conjunto de quienes piensan participar en la consulta. Es
entonces el cociente entre la cantidad de quienes apoyan al candidato
sobre la cantidad de quienes tienen intención de participar en la
elección. En este caso se exige casi siempre que los pertenecientes al
grupo de favorecedores del candidato sea subconjunto del grupo con
intención de voto.
La proporción de hogares que prefieren una determinada marca en el
conjunto de los hogares consumidores de un determinado producto. Es
decir el cociente de la cantidad de los que han consumido la marca en
el último mes sobre la cantidad de hogares consumidores de ese
producto. Particularmente sea el ejemplo de la proporción de hogares
que vieron un determinado programa de T.V en el conjunto de hogares
que vieron T.V en ese horario.
La denominada tasa de analfabetismo expresada como el cociente de
la cantidad de personas mayores de trece años que no saben leer y
escribir sobre la cantidad de personas mayores de trece años. En forma
similar se definen tasas de fecundidad, natalidad, migración, desempleo
y muchas más.

Algunas veces la razón de estudio recibe un nombre particular.

Demanda insatisfecha por ejemplo como el cociente entre la cantidad
de usuarios que solicitaron y no recibieron servicio sobra la cantidad
total de usuarios que solicitaron servicio. Cobertura como el cociente
entre la cantidad de usuarios que recibieron el servicio sobre la cantidad
total de usuarios con derecho a recibirlo.
Un caso especial de RAZÓN es cuando se pregunta por los promedios, sea ya el

promedio poblacional y los promedios de dominio.
En el primer caso se trata de la razón YU 

ty

 y 
U k U
yk

ty
. Para los
N 1 
U U
zk tz
 y
tyd 0 si k U
Y   con y   U dk d
N z
promedios de dominio se trata de la razón
Ud dk
d y si k U
U dk k d
0 si k Ud
zdk  
1 si k Ud
En ocasiones se busca información sobre parámetros diferentes a totales y razones.
Es el caso de estimar los coeficientes de un modelo de regresión, los percentiles de
una distribución, o la covarianza entre variables. De acuerdo con la teoría muestral el
mecanismo utilizado para estimar cualquier parámetro consiste en expresarlo como
función de totales.
1.2 Definiciones estadísticas

Aunque existen varias metodologías para alcanzar algún nivel de conocimiento sobre
características de una población, se trata en este texto de un único método y es el
basado en modelos de probabilidad y conocido generalmente como métodos de
inferencia estadística y llamado por los especialistas con el nombre de muestreo
estadístico. El muestreo parte de las definiciones básicas de universo de estudio,
variables de interés y parámetros a investigar y utiliza conceptos propios de la
estadística, los cuales se presentan a continuación.
1.2.1 Muestra probabilística
En teoría de muestreo se parte de un universo finito. Una muestra es el conjunto de

elementos extraídos del universo ya sea mediante un método sin reposición, en el
cual las muestras son de tamaño menor o igual al universo, o mediante métodos con
reposición en los que es posible que las muestras sean mayores al universo.
El método de inferencia estadística tiene su sustento teórico en modelos de

probabilidad aplicables solamente a muestras probabilísticas. Una muestra es
probabilística si cumple:
1. Se dispone de un marco de muestreo para los objetos a ser seleccionados.

Estos objetos son los ELEMENTOS constitutivos del universo o agrupaciones
de elementos, denominadas UNIDADES de MUESTREO.
2. Todos los objetos de selección tienen una probabilidad conocida de antemano
y mayor a cero de ser incluidos en una muestra.
3. El mecanismo de selección de la muestra corresponde a las probabilidades
asignadas con anterioridad a cada objeto.
Respecto al marco de muestreo vale la pena hacer los siguientes comentarios: El

marco debe permitir IDENTIFICAR y UBICAR a todos y cada uno de los objetos

posibles de selección. Disponer de la cantidad total de objetos del universo o sólo de

la identificación de ellos no es suficiente para obtener una muestra probabilística por
cuanto una vez seleccionado un determinado individuo no es posible localizarlo. Los
frecuentes defectos de los marcos son la subcobertura, es decir no están todos los
que deberían, la sobrecobertura, es decir el marco contiene a muchos que ya no son
integrantes del universo y la repetición, es decir varios objetos aparecen en el marco
más de una vez.
La inferencia estadística planteada por la teoría muestral parte del conocimiento de

las probabilidades de selección o inclusión de cada uno de los objetos susceptibles
de hacer parte de la muestra. El colocar un entrevistador en un cruce a preguntar a
quien se detiene ante el semáforo en rojo, es un mecanismo que aunque pretende
ser al azar no parte del conocimiento previo de las probabilidades de inclusión en la
muestra, por lo que se trata de un método no válido para realizar inferencia
estadística. Pero si se puede realizar la inferencia cuando en un marco de muestreo
constituido por los minutos del período de atención de una unidad de servicio se
escogen con probabilidad conocida algunos minutos y en ellos se aplica un
cuestionario a todos los clientes que en ese minuto abandonan la unidad de servicio.
La probabilidad de selección o de inclusión de un objeto es lo que permite el paso de

lo observado en la muestra a la inferencia de lo buscado en la población. La
inferencia que se realice con base en probabilidades no ciertas conducirá a
decisiones equivocadas. El hecho de conocer las probabilidades de selección de los
objetos, debe ir acompañado del proceso de selección aleatoria que le corresponda.
Para ilustrar lo que debe y lo que no debe ser en el sentido de hacer corresponder
las probabilidades conocidas y las realmente aplicadas sea el ejemplo en el que se
planea un estudio acerca de las preferencias entre los consumidores de detergente.
El muestrista establece que al llegar a un hogar se debe seleccionar una única
persona, la ama de casa debe tener probabilidad de selección igual a 0.5 y los
demás adultos deben tener cada uno de ellos igual probabilidad de selección. A cada

entrevistador se le entrega una pequeña calculadora de bolsillo se le enseña a

obtener un número aleatorio de tres cifras y se le instruye así:
Realice el enlistamiento de personas adultas en el hogar, respetando el

número cero para la ama de casa y del uno en adelante para las personas
mayores de 18 años. Registre el número total de personas en la casilla
respectiva.
Obtenga un número aleatorio de su calculadora de bolsillo.
Si el número aleatorio termina en número impar entreviste el ama de casa.
Si el número aleatorio termina en número par seleccione la persona de
acuerdo a la tabla de selección.
Si la persona está ausente vuelva en otra oportunidad a realizar la entrevista.
Si luego de seis visitas en días y horas distintas no logra la entrevista avise a
su supervisor.

TABLA DE SELECCIÓN
Entreviste la persona número ___ dependiendo del número aleatorio obtenido
Si el número aleatorio
Cantidad de personas Seleccione la persona
obtenido está en el
adultas en el hogar número
intervalo
Una Cualquiera 0
Dos De 0.002 a 0.998 1
De 0.002 a 0.500 1
Tres
De 0.502 a 0.998 2
De 0.002 a 0.332 1
Cuatro De 0.334 a 0.666 2
De 0.666 a 0998 3
De 0.002 a 0.250 1
De 0.252 a 0.500 2
Cinco
De 0.502 a 0.750 3
De 0.752 a 0.998 4
etc.
Pero si el instructivo señala que la entrevista se aplica a quien abra la puerta, o a una
de las personas presentes en el hogar, entonces la probabilidad de selección no es
conocida, infringiendo así el punto dos. Si luego del enlistamiento se vuelve a la
oficina y se realiza una selección sistemática no se consigue la correspondencia
entre la probabilidad preestablecida y la realmente aplicada. La correspondencia
entre las probabilidades explicitadas y las aplicadas mediante la forma de selección,
se evidencia en las fórmulas matemáticas aplicadas luego de la selección de la
muestra a fin de obtener los valores poblacionales que se buscan con el estudio.
Cuando se cumple la correspondencia entre lo planteado y lo realizado las fórmulas
aplicadas son las correctas, cuando esta correspondencia no existe, las fórmulas
aplicadas no son correctas y los errores pueden ser inmensos, errores en términos
de las dos principales medidas de calidad el insesgamiento y la varianza.
1.2.2 Estimador estadístico
Una vez obtenidos los valores muestrales y 1, y2, ... , yns se deben expandir en forma
tal que conduzcan al valor que será tomado como posible valor poblacional.

La fórmula utilizada para expandir se denominará ESTIMADOR.

La teoría del muestreo presenta tres estimadores principales para estimar el total de
un universo. Ellos son el π-estimador o estimador de Horvitz-Thompson, el MCR-
estimador o estimador de Hansen y Hurwitz y el r-estimador.
El π-estimador utiliza las probabilidades de inclusión, es decir la probabilidad de que

el elemento pueda ser incluido en una muestra para realizar la expansión. En este
yk
caso el estimador está dado por la fórmula tˆy  m  m ak . yk donde la suma
k
sobre m significa la suma sobre los elementos de la muestra. π k simboliza la
probabilidad de inclusión del k-ésimo elemento, y k es el valor medido para ese mismo
elemento. En este caso el factor de expansión ak es el inverso de la probabilidad de
inclusión πk.
El MCR-estimador, llamado así por las siglas de Muestreo Sin Reposición, utiliza las
probabilidades de selección de los elementos para construir el factor de expansión.
1 yk
El MCR estimador está dado por tˆy   m   m ak . yk . En esta fórmula m es el
m pk
tamaño de la muestra pk es la probabilidad de selección del k-ésimo elemento, y k su
valor observado y el factor de expansión es el promedio de los inversos de las
probabilidades de selección.
Los dos estimadores conducen a resultados diferentes para una misma muestra pero
son en principio de calidad comparable en términos de insesgamiento y varianza
como se verá más adelante. La diferencia de utilización de estos dos estimadores
radica en la relativa facilidad o dificultad de establecer las probabilidades de inclusión
o de selección de los objetos a escoger. En general para los diseños de muestreo o
maneras de selección sin reposición las probabilidades de inclusión son fáciles de
determinar y de ahí la utilización del π-estimador. En diseños con reposición las

probabilidades de inclusión son difíciles de obtener, pero en cambio las de selección

son directas por lo que se prefiere el MCR-estimador.
El tercer estimador principal, pues existen muchos otros de menor uso, es el r

estimador que tiene como principio de construcción la disponibilidad de información
auxiliar completa y de alta calidad. Se supone que para el estudio de la variable y se
dispone de información para todo el universo de la variable auxiliar x. El r-estimador
se construye entonces aplicando un modelo de regresión entre x, y con los valores
de la muestra y utilizando ese resultado para estimar el total ty. De una manera
sencilla se puede expresar el r-estimador del total mediante la fórmula:
  xj
. ak . yk   ak . U j
  x 
tˆyr   U . yk   ak .g ks . yk
  al .xl  m m   al .xl  m
 m   m 
donde ak es el factor de expansión correspondiente a un π-estimador ó MCR-
estimador y gks es el factor de ajuste entre la “verdad” del total de x y su estimación
mediante la muestra. Obviamente se trata aquí de una expresión sencilla que ilustra
la concepción del r-estimador y que toma esta forma en un caso particular 1, frecuente
pero no de validez general.
El r-estimador se puede aplicar si se dispone de la información auxiliar necesaria. Su

calidad en comparación con los otros dos estimadores puede llegar a ser muchas
veces superior, dependiendo de la calidad de la información auxiliar. Se trata de un
estimador que aunque con algo de sesgo puede conducir a resultados con muy poca
varianza, lo que quiere decir que para alcanzar un determinado resultado de calidad,
la aplicación de este estimador necesitará muestras mucho más pequeñas que las
requeridas para alcanzar igual calidad con el π-estimador o el MCR-estimador.
1.2.3 La calidad del estimador
Para entender los conceptos de calidad de un estimador hay que tener presente que
cada muestra que se obtenga arrojará, al aplicar la fórmula de estimación, un
1
Modelo univariado, heterocedástico sin intercepto

resultado diferente. Puesto que se trata de un muestreo probabilístico es posible

determinar el valor numérico de la probabilidad de cada muestra. Hipotéticamente se
podría entonces establecer el valor estimado por cada una de las posibles muestras
y calcular su esperanza y su varianza. Así por ejemplo suponga el universo de cinco
elementos u1, u2, u3, u4, u5 con los valores y1 = 25, y2 = 48, y3 = 70, y4 = 18, y5 = 44, lo
que quiere decir que en la población el total es igual a 25 + 48 + 70 + 18 + 44 = 205.
Para este universo con total desconocido por supuesto, se quiere estimar su total con
base en una muestra de tamaño igual a dos. Suponga entonces que se plantea una
muestra de diseño MAS (Muestreo Aleatorio Simple). Es decir la probabilidad de
1
cada muestra es igual a
N y la probabilidad de inclusión de cada elemento es
n 

n
constante e igual a . En este caso se tienen diez muestras posibles y al utilizar el
N
π-estimador se obtienen las siguientes estimaciones:
Elementos Probabilidad Valores Total estimado
Muestra
seleccionados de la muestra observados tˆy
1 u1 u2 u3 1/10 25 48 70 238.33
2 u1 u2 u4 1/10 25 48 18 151.67
3 u1 u2 u5 1/10 25 48 44 195.00
4 u1 u3 u4 1/10 25 70 18 183.33
5 u1 u3 u5 1/10 25 70 44 231.67
6 u1 u4 u5 1/10 25 18 44 145.00

7 u2 u3 u4 1/10 48 70 18 226.67
8 u2 u3 u5 1/10 48 70 44 270.00
9 u2 u4 u5 1/10 48 18 44 183.33
10 u3 u4 u5 1/10 70 18 44 220.00
10
La esperanza dada por  p(m).tˆ
m ]1
ym = 205. Valor que no por coincidencia es igual al
valor poblacional desconocido. La varianza del estimador es igual a 1403.33.
Si de otro lado se tuviera disponible la información x 1 =5, x2 =10, x3 =12, x4 =5, x5 = 8,

se podría aplicar el r-estimador propuesto
Total estimado Total estimado

Muestra gks
de x tˆx tˆyr
1 45.0 0.88 211.9
2 33.3 1.2 182.0
3 38.3 1.04 203.5
4 36.67 1.09 205.5
5 41.67 0.96 222.4
6 30.0 1.33 193.3
7 45.0 0.88 201.5
8 50.0 0.8 216.0
9 38.3 1.04 191.3
10 41.67 0.96 211.2
La esperanza es 203.85 y la varianza es 136.4. En la práctica cotidiana la esperanza

y la varianza de un estimador no se pueden calcular, puesto que para ello sería
necesario conocer todos los valores del universo, la esperanza y la varianza son
expresiones que se pueden comparar como tales y no como números.
Cuando se extrae una muestra para realizar inferencia estadística se acostumbra a

utilizar la muestra para hacer dos estimaciones diferentes, la primera es la
estimación del parámetro de interés y la segunda es la estimación de la varianza del
estimador. En el ejemplo se trata de estimar un total desconocido para el muestrista
pero cuyo valor conocen Dios y el Diablo y que es igual a 205. También la muestra

debe servir para estimar la varianza del estimador, que en el primer caso es igual a
1403 y en el segundo es igual a 136.4.
La estimación de la varianza es uno de los principales temas del muestreo y se

conocen fórmulas y métodos que van desde los estimadores de Yates y Grundy
pasando por los métodos de linealización de Taylor hasta llegar a métodos de
Jackknife, Bootstrap o Medias Muestras Balanceadas. Para los dos estimadores del
total propuestos en el ejemplo anterior, los dos estimadores de la varianza del
estimador son:
N2 
Vˆ  tˆy  
n 1
Para el π-estimador
n 
1     yk  ym  2
N  n 1 m
2 2
 x  N2   
Vˆ  tˆyr    U  .
n 1 y
Para el r-estimador .1  .
N  n 1
  y  m .xk 
m k
 xm  n   xm 
Lo que para la muestra número seis, por ejemplo, establece que:
Vˆ  tˆy  
52 
3 
3 1
1   
5  3 1

 25  29 2  18  29 2   44  29  2  603.3 para el π-estimador y
3  1  29  
2 2 2 2 2
Vˆ  tˆyr     . .1  .
8 5  29   29  
 25  .5   18  .5    44  .8    199.0
6 3  5  3  1  6   6   6  
Cuando se efectúa una estimación muestral se suele entregar un intervalo de

estimación o se señala una medida que conduce directamente al intervalo y que en
muchas ocasiones recibe el nombre, algo ambiguo de error de muestreo. El intervalo
en sí es conocido como intervalo de confianza. La propuesta más común de intervalo
de confianza es: tˆy  1.96. Vˆ  tˆy  en el que necesariamente existe correspondencia

entre los dos estimadores, el del total y el de la varianza del estimador del total. En
forma equivalente la propuesta de medida de calidad es bien el error estándar dado

100. Vˆ  tˆy 
por Vˆ  tˆy  o un poco más práctico el c.v.e. dado por . En el ejemplo y
tˆy
para los dos estimadores dados los intervalos de confianza y sus respectivos c.v.e
son:
π-estimador r-estimador
Estimación Intervalo c.v.e Estimación Intervalo c.v.e
Muestra Vˆ  tˆy  IC  tˆy  % Vˆ  tˆy  IC  tˆy  %
1 1687.7 157.8 - 318.9 17.2 90.0 193.3 – 230.4 4.5
2 821.1 95.5 - 207.8 18.9 81.3 164.3 – 199.7 5.0
3 503.3 151.0 - 239.0 11.5 35.1 191.9 – 215.1 2.9
4 2654.4 87.4 - 289.3 27.4 256.7 174.1 – 236.9 7.8
5 1701.1 150.8 - 312.5 17.8 28.92 211.9 – 232.9 2.4
6 603.3 96.9 - 193.1 16.9 199.0 165.7 – 221.0 7.3
7 2271.1 133.3 - 320.1 21.0 195.6 174.1 – 228.9 6.9
8 653.3 219.9 - 320.1 9.5 67.9 199.8 – 232.2 3.8
9 884.4 125.0 - 241.6 16.2 123.3 169.5 –213.1 5.8
10 2253.3 127.0 - 313.0 21.6 180.7 184.8 – 237.6 6.4
Nótese que para el caso del π-estimador las muestras seis y ocho, el respectivo
intervalo de confianza no cubre al parámetro, es decir no contiene el valor 205. Como
son ocho de las diez muestras las que cumplen que el IC cubre al parámetro se dice
que el π-estimador en este caso tiene una cobertura del 80%. En el caso del r-
estimador sucede lo mismo pero con las muestras número dos y cinco, lo que
conduce a igual cobertura.
Puesto que en poblaciones grandes la cantidad de muestras posibles es inmensa se

puede hablar entonces de la confiabilidad del IC y se define como la suma de las
probabilidades de las muestras cuyo intervalo de confianza cubre al parámetro. Si el
estimador es insesgado la confiabilidad del estimador es del 95% (correspondiente al
valor 1.96 de la fórmula dada). Cuando el estimador es sesgado la confiabilidad se
reduce de acuerdo a la magnitud del sesgo.

E (tˆy )  t y
Se utiliza el término sesgo relativo para denominar a: Br  tˆy   entonces,
V (tˆy )
para muestras grandes se cumple:
Valor absoluto
0 0.05 0.1 0.3 0.5 1 1.5 2 2.8
del sesgo relativo
Confiabilidad 0.95 0.949 0.948 0.94 0.92 0.83 0.63 0.48 0.20
En el ejemplo y puesto que se trata de un universo muy pequeño la cobertura es tan

sólo del 80% aunque el sesgo relativo del π-estimador es cero y del r-estimador es
203.85  205
igual a  0.098 .
136.4
La primera propiedad deseada de los estimadores es que sean insesgados o mejor,

que sean de sesgo relativo bajo. Un estimador se dice insesgado para el parámetro
si se cumple que su esperanza es igual al parámetro. En el caso anterior el
estimador propuesto en el primer caso es insesgado. La teoría de muestreo muestra
que el π-estimador así como el MCR-estimador son insesgados para la estimación
de totales. En el ejemplo el r-estimador se verifica que es sesgado, lo cual
corresponde con lo que se plantea en la teoría.
Se desea que el estimador sea INSESGADO o tenga SESGO RELATIVO pequeño

para que el intervalo de confianza que se entregue tenga la mejor confiabilidad. A
medida que aumenta el sesgo se pierde confiabilidad hasta llegar al extremo de
inutilizar los resultados. La tarea del investigador es tener presente las fuentes de
sesgo, controlar y corregir a tiempo. Son fuentes de sesgo los marcos defectuosos,
los instrumentos mal diseñados, la deficiente capacitación de entrevistadores, los
errores sistemáticos de selección, la utilización de fórmulas equivocadas para la
determinación de factores de expansión, la imputación, la codificación, entre otros.
La segunda característica de los estimadores es que sean de poca varianza. En el
ejemplo dado las dos varianzas obtenidas son radicalmente diferentes. Para el π-

estimador la varianza fue igual a 1403, para el r-estimador la varianza fue menos de
su décima parte (136.4). Aunque la confiabilidad sea buena, el tamaño o la amplitud
de los intervalos de confianza puede ser tan alta que hace inútil la información
entregada al usuario. Señalar por ejemplo que un candidato para las próximas
elecciones tiene hoy día un porcentaje de favoritismo entre el cero y el cien por
ciento, más que una tontería es una caricatura que pretende reflejar lo que sucede
en algunos resultados de encuesta. El instituto oficial de estadística de Canadá
establece entre sus normas que cifras con un c.v.e. superior al 15% no pueden ser
entregadas al público. Para el caso del favoritismo por un candidato, en el que el
estimador puntual es 20%, el c.v.e. del 15% significa que el real favoritismo por el
candidato está cubierto (con 95% de probabilidad) por el intervalo (20 ± 6)% 2. Es
decir el intervalo de confianza es de 14% a 26% lo cual no constituye precisamente
una ganancia de conocimiento. Pero estimaciones con c.v.e del 10% tampoco son de
muy buena calidad. En general se puede decir que los intervalos de confianza que
conducen a resultados útiles tiene c.v.e inferiores al 3%, pero entre el 3% y el 6%
todavía se pueden tomar decisiones. Valores del c.v.e superiores al 6% conducen a
obtener una idea general del fenómeno en estudio pero puede suceder que la
información con nivel tan bajo de precisión se pueda adquirir por métodos mas
baratos a la encuesta.
En el ejemplo dado y por el tamaño tan pequeño del universo se presenta una muy
amplia variabilidad entre los c.v.e de las diferentes muestras, y sin embargo la
diferencia entre los dos estimadores es abismal a favor del r-estimador. En general,
los universos son mucho mayores y la variabilidad entre los c.v.e no es tan grande,
pero naturalmente existe variabilidad.
Es importante resaltar que los términos de calidad, es decir confiabilidad y amplitud

del intervalo de confianza se refieren al estimador utilizado, es decir al procedimiento
de estimación y no al valor particular que se obtiene de una muestra. Es decir al
realizar un estudio de calidad de una investigación de encuesta estadística se
2
El 15% de 20 es 3, se aproxima el valor 1.96 a dos y se realiza el producto 3 x 2 =6

analizan los métodos utilizados y no los resultados obtenidos. Puede suceder que
dos investigadores estimen la producción total a obtener. El investigador A estima el
total en 425000 toneladas (c.v.e = 2.3%), el investigador B estima 580000 toneladas
(c.v.e = 7.4%). Luego de recogida la cosecha la producción obtenida fue de 467.520
toneladas. Un estudio de calidad de la encuesta revisa las fuentes de sesgo y de
varianza y no se basa en la distancia entre el valor estimado y el valor real obtenido.
Bien podría ser que los métodos del investigador A tengan sesgos tan altos que
invaliden sus resultados a pesar de la varianza pequeña que presentan. En el caso
del ejemplo dado con el pequeño universo de tamaño cinco es evidente que el r-
estimador aunque levemente sesgado es mucho mejor que el π-estimador, sin
embargo si un investigador A utiliza el π-estimador y obtiene la muestra número tres
su estimación es 195 (c.v.e = 11.5%) mientras que el investigador B con el r-
estimador y la muestra número seis estima el total en 193.3 (c.v.e = 7.3%)
1.3 Los diseños de muestreo
Se entiende por diseño de muestreo el método de selección aleatoria de objetos a

incluir en la muestra. Para un diseño dado se pueden encontrar varios algoritmos de
selección que cumplen las reglas establecidas por su método particular. Dado el
método y el algoritmo de selección, la teoría del muestreo se ha encargado de
realizar los cálculos de probabilidad y establecer las probabilidades de inclusión o de
selección y con ellas se tiene en forma directa las tres fórmulas básicas: El estimador
del total para los casos del π-estimador o el MCR-estimador, la fórmula de la
varianza del estimador y un estimador de la varianza del estimador. Para el caso de
un r-estimador se deben hacer adicionalmente supuestos sobre el modelo de
regresión que relaciona la variable en estudio y con la variable auxiliar x.
1.3.1 Diseños no proporcionales de elementos

DISEÑO BERNOULLI. En este diseño se fija un valor entre cero y uno denominado
por la letra π. Para cada elemento k del universo se realiza un evento aleatorio  k de
distribución uniforme entre cero y uno y se decide si  k < π entonces elemento k
será incluido en la muestra, de lo contrario no.
El algoritmo es una copia directa del método y es aplicado en los controles de

aduana. Con este diseño se tiene que el tamaño de muestra es variable, la
probabilidad de inclusión es constante e igual a π para todos los elementos del
universo y las tres fórmulas de trabajo son:
1
tˆy 

 m
yk ,
1 
VBER (tˆy )    1U yk .
 
VˆBER  tˆy   .  1. m yk

1 1 
  
El tamaño de muestra tiene un valor esperado igual a N.π, con lo que se puede
E  ns 
escoger el valor π tal que,   .
N
Este diseño tiene el inconveniente de la aleatoriedad de la muestra lo que se

considera inconveniente para la planeación del trabajo operativo. De otro lado, la
misma aleatoriedad del tamaño muestral hace que sus estimadores tengan una
varianza superior a otros diseños. Sin embargo el diseño es de muy fácil aplicación y
en un muy reciente artículo3 se mostró cómo la combinación entre un diseño
estratificado de Bernoulli y un r-estimador produce resultados altamente eficientes.
DISEÑO MUESTREO ALEATORIO SIMPLE (MAS). El más popular y el más tratado

de todos los diseños es el conocido M.A.S, el cual consiste en seleccionar sin
reposición y en forma equiprobable, al interior de cada extracción, un elemento hasta
3
Särndal C-E, (1996)

completar un total de n, valor establecido de antemano. Nótese que cuando se

selecciona el primer elemento de la muestra todos tienen igual probabilidad, lo
mismo sucede cuando se selecciona el segundo elemento, pero las probabilidades
de selección entre la primera y la segunda extracción han cambiado. En la primera
1
extracción todos tienen probabilidad de selección igual a , en la segunda los que
N
1
restan tienen probabilidad de selección igual a . se presentan aquí dos
N 1
algoritmos para seleccionar muestra MAS.
El primer algoritmo, conocido con el nombre de Coordinado negativo, consiste en

generar para todo k en el universo un número aleatorio  k de distribución uniforme
entre cero y uno, ordenar las parejas (k ,  k ) de menor a mayor respecto al número
aleatorio k. Los primeros n elementos de este nuevo orden constituyen la muestra
MAS deseada.
El segundo algoritmo conocido con el nombre de sus inventores Fan-Muller lo que

hace es para cada elemento k del universo genera un número aleatorio  k de
distribución uniforme entre cero y uno y decide que k pertenece a la muestra si:
n  nk
k  donde nk es la cantidad de elementos seleccionados para la muestra
N  k 1
antes del k-ésimo intento. La selección de la muestra termina cuando n k = n.
En el muestreo aleatorio simple la probabilidad de inclusión es constante e igual a
n
con lo que las tres fórmulas de trabajo son:
N
N
tˆy  . m yk
n

N .( N  n) 2 1
VMAS (tˆy )  .U  yk  yU 
2
.S yU con
2
S yU  y
n N 1
1
yU  .U yk
N
N .( N  n) 2 1 1
VˆMAS (tˆy )  . m  yk  ym  . m yk
2
.S ym con
2
S ym  y ym 
n n 1 n
DISEÑO SISTEMATICO. El método sistemático consiste en dividir el universo en

grupos de igual tamaño (amplitud = a), en el primer grupo, mediante un diseño MAS
se seleccionan r elementos denominados arranques aleatorios y notados aquí como
los elementos v1, v2, ..., vr. Los demás integrantes de la muestra son los elementos
que se obtienen “brincando” la cantidad a a partir de los arranques aleatorios. El
valor r se conoce con el nombre de réplicas. Este diseño tiene tamaño de muestra
n.a
aleatorio cuando para N   c el residuo c < a es diferente de cero. Diseño
r
aplicado con frecuencia en las últimas etapas de los diseños multietápicos, por su
versatilidad y las posibilidades de control y supervisión tiene como inconvenientes,
primero que si r es igual a uno, no se cuenta con un estimador insesgado de la
varianza del estimador y segundo que si existe un orden sistemático en el mismo
sentido en que se está seleccionando la muestra la varianza del estimador crece
considerablemente. Estas razones recomiendan evitar a este diseño para la
unidades primarias de muestreo, como se verá más adelante.
Puesto que se trata en un principio de un muestreo aleatorio simple de r elementos

entre los primeras a no sorprende que la probabilidad de inclusión sea constante e
r
igual a . Las fórmulas de trabajo en este diseño son:
a
a
tˆy  . m yk
r
a.(a  r ) 2 1 1
VSIS (tˆy )  .Ua  ti  ta  .Ua ti
2
.StUa con
2
StUa  y ta 
r a 1 a

donde ti es la suma de los y k en la i-ésima muestra, es decir la compuesta por los

elementos {vi, vi+ a, vi+ 2a, ... , vi+ (n/r –1) a }
El estimador de la varianza es:
a.( a  r ) 2 1 1
VˆSIS (tˆy )  . ma  ti  tma  . ma ti
2
.Stma con
2
Stma  y tma 
r r 1 r
1.3.2 Diseños proporcionales de elementos
DISEÑO CON REPOSICIÓN Y PROBABILIDAD DE SELECCION PROPORCIONAL

AL TAMAÑO -PPT. Este muy popular diseño se basa en la disponibilidad de
información auxiliar cuantitativa altamente correlacionada con la variable en estudio y
la aplicación del MCR-estimador del total.
El sustento teórico de este diseño parte de que la varianza del MCR-estimador es de
2
y 
VPPT  tˆ   U pk  k  t y 
1
la forma lo que quiere decir que si para todo k se
m  pk 
yk y
 ty es decir que pk  t la varianza del estimador sería igual a
k
cumple que
pk y
cero. Puesto que la probabilidad de selección, necesaria antes de la selección misma

está en función de valor desconocido yk este se reemplaza por el valor xk
disponible y altamente correlacionado con y . De esta forma las probabilidades de
xk
selección son iguales a pk  .
tx
El algoritmo más conocido para obtener muestras PPT es el denominado método

acumulativo total, el cual acumula las probabilidades de selección, crea intervalos de
selección a partir de los acumulados, genera m números aleatorios de distribución
uniforme entre cero y uno y selecciona los elementos en cuyos intervalos de

selección se ubiquen los números aleatorios generados. Para ilustrar se da el

siguiente ejemplo:
Ejemplo del método Acumulativo total para selección de tres elementos mediante
diseño PPT.
Intervalos de
k xk pk Acumulado
selección
1 15 0.075 0.075 0.0001 a 0.0750
2 50 0.250 0.325 0.0751 a 0.3250
3 60 0.300 0.625 0.3251 a 0.6250
4 20 0.100 0.725 0.6251 a 0.7250
5 35 0.175 0.900 0.7251 a 0.9000
6 15 0.075 0.975 0.9001 a 0.9750
7 5 0.025 1 0.9751 a 0.9999
Si los tres aleatorios generados son 1 = 0.2541, 2 = 0.6819, 3 = 0.8057, los

elementos seleccionados son {2, 4, 5}.
En este diseño el cálculo de las probabilidades de inclusión no es nada sencillo, y las

probabilidades de selección están dadas por el método mismo. El estimador más
utilizado para el total es el MCR-estimador con sus respectivas fórmulas para la
varianza y el estimador de la varianza del estimados. Las tres fórmulas son:
m m m
1 y y t
tˆy  , m ki   ki   x . yk   ak . yk
m pk i 1 m. xk i 1 m.xk i 1
tx
2
y 
VPPT  tˆ  1  pk  k  t y 
m U
 pk 
2
 yki 
VˆPPT  tˆ   .
1 1
m m 1
 
m
 tˆy 
 pk 
Este diseño se caracteriza por la simplicidad. Son sencillos los métodos de selección,
son sencillas las fórmulas para cálculo y estimación de la varianza y si la correlación
entre las variables de interés y auxiliar es alta este diseño es mucho más eficiente
que los tratados anteriormente. Obviamente la comparación no es correcta, puesto

que este diseño utiliza información auxiliar. El mayor inconveniente de este diseño lo
constituye el manejo operativo de los elementos que salen en la muestra más de una
vez, por cuanto se trata de un diseño con reposición.
DISEÑO SIN REPOSICIÓN Y PROBABILIDAD DE INCLUSIÓN PROPORCIONAL AL

TAMAÑO –π.P.T. Este diseño será mencionado sin mayor detenimiento por cuanto
sus métodos y fórmulas son demasiado complicadas, aunque constituye el diseño
con mejores niveles de eficiencia. El método consiste en establecer probabilidades
de inclusión proporcionales al tamaño en forma similar al caso del diseño PPT. En
n. yk
este caso se trata que  k  con lo que se llegaría a una varianza nula del
ty
estimador. Nótese que se tiene un nuevo término en la proporcionalidad, el tamaño

fijo y establecido de antemano de muestra n. De nuevo y puesto que los valores y k
son desconocidos se toma x la variable auxiliar disponible y bien correlacionada con
n.xk
y y se fija  k  . El problema principal radica entonces en encontrar un método
tx
de selección de elementos tal que la probabilidad final de inclusión sea igual a la
dada de antemano. Son conocidos los métodos de Sunter, Brewer, Madow y otros,
todos ellos muy complicados y con algunos defectos. Son muchos los trabajos que
se siguen realizando tratando de encontrar métodos fáciles que cumplan los
requisitos de este diseño. El π-estimador del total está dado por:
y y t
tˆy   m k  m k   m x . yk   m ak . yk
k n.xk n.xk
tx
Las fórmulas de la varianza del estimador y del estimador de la varianza del
estimador se omiten por cuanto son muy complicadas.
El diseño π.P.T tiene similitud con el diseño P.P.T, sin embargo hay aspectos
cruciales que diferencian estos dos diseños. El primero es el carácter con reposición
del PPT y sin reposición del π.P.T. El segundo aspecto de diferencia es que en el

primer diseño se trata de la proporcionalidad de las probabilidades de selección

mientras que en el otro es la proporcionalidad de las probabilidades de inclusión.
Estas diferencias se van a notar drásticamente en las fórmulas a utilizar.
La comparación entre estos dos diseños, posible puesto que ambos parten del
supuesto de utilizar información auxiliar, establece que el PPT es menos eficiente
que el π.P.T, es decir que sus estimadores tienen una mayor varianza pero eso lo
compensan con simplicidad. Planteado desde la perspectiva contraria se puede
entonces afirmar que se puede preferir el diseño π.P.T sobre el P.P.T porque produce
mejores resultados pero se tiene que pagar un costo alto en complicaciones de
escritorio por el manejo de procedimientos y fórmulas de trabajo.
1.3.3 Diseño de conglomerados
Un diseño de conglomerados se caracteriza porque los objetos a ser seleccionados

no son, como en los diseños anteriores, elementos sino agrupaciones de elementos
llamados conglomerados. Una vez obtenida la muestra de conglomerados en cada
uno de ellos se estudian todos los elementos que lo conforman. La definición es la
siguiente:
1. Se tiene una partición del universo U en subconjuntos U 1, U2, ..., UNI
denominados conglomerados. Una partición significa que se cumplen tres
propiedades:
a.- Ninguno de los conglomerados es vacío
b.- Todos son disjuntos dos a dos
c.- La unión de todos los conglomerados reconstruye el universo
2. Del conjunto total de conglomerados se escoge mediante diseño d I una
muestra de conglomerados. (Puede ser cualquiera de los diseños ya
planteados, por ejemplo Bernoulli, MAS, PPT etc.).
3. En los conglomerados de la muestra se observan y se miden todos los
elementos que los componen.

Para este diseño se denomina con t yi  Ui yk al total del i-ésimo conglomerado.
El algoritmo de selección corresponde al diseño que se haya planteado, Fan-Muller
si es MAS, acumulativo total si es un diseño PPT de conglomerados. En principio no
tiene mayor diferencia con el diseño de elementos, la diferencia radica en que en
este caso la selección es de conglomerados y no de elementos. Así por ejemplo para
un estudio entre alumnos de octavo y noveno grado escolar se puede planear la
selección, por ejemplo PPT, de cursos.
Las fórmulas de trabajo son prácticamente las mismas que las encontradas para los
diseños de elementos, la diferencia radica en que se utilizarán los totales t yi en lugar
de los yk. Así por ejemplo cuando se trata de un diseño Muestreo Aleatorio Simple de
Conglomerados (MASC) la estimación se hace mediante:
N
tˆy  I . mI t yi donde NI es el total de conglomerados en el universo y n I la
nI
cantidad de conglomerados en la muestra. Su varianza y el estimador de la varianza
son:
N I .( N I  nI ) 2
VMASC (tˆy )  .StiU I con
2
StiU 
1
NI  1

.U t yi  tU I  2
y
nI I I
1
tU I  .U t yi
NI I
N .( N I  nI ) 2
. mI  t yi  tmI 
1
VˆMASC (tˆy )  I .Stim con
2
Stim 
2
y
nI nI  1
1
tmI  . mI t yi
nI
El muy frecuente diseño PPT de conglomerados tiene las fórmulas

1 t yi m
tx
tˆy 
mI
 , mI
pIi

i 1 mI .xi
.t yi

2
t 
VPPTC  tˆ  
1
mI

U
pI i . yi  t y 
 pIi 
Nótese que en este último caso se evidencia que la varianza del estimador será
menor, es decir el diseño será más eficiente en la medida que la probabilidad de
selección del conglomerado sea proporcional al total del mismo y no propiamente
proporcional a la cantidad de elementos del mismo.
El diseño de conglomerados se utiliza básicamente por dos razones principales. La

primera es que cuando se carece de un marco de elementos es posible construir o
disponer de un marco de conglomerados. Si bien no se tienen los nombres y la
dirección de todas las personas de una ciudad si se cuenta con el mapa en el que
registran con precisión las manzanas de la ciudad. Cuando no se cuenta con el
listado de los empleados de un banco se puede disponer del listado de sucursales y
dependencias. La segunda razón es que aunque se cuente con el marco de
elementos conviene trabajar con conglomerados por razones operativas y de costos.
Es por ejemplo el caso del estudio sobre el consumo de combustible en una empresa
de transporte. Por razones administrativas puede llegar a ser más fácil conseguir la
información de consumo de una flotilla que la de un vehículo en particular.
El diseño de conglomerados es un diseño eficiente desde el punto de vista de los

costos pero puede llegar a ser ineficiente desde el punto de vista de la varianza del
estimador en aquellos casos en los que la similitud entre los elementos del
conglomerado sea muy alta. Tomando el caso extremo de que todos los elementos
de un conglomerado tuvieran el mismo valor yk para la característica en estudio, se
entiende entonces que hay una pérdida de eficiencia al estudiarlos a todos. Por el
contrario se gana mucha eficiencia estadística en la medida que al interior de cada
conglomerado se presente toda la variabilidad que se da en el universo. Para
considerar este aspecto de la variabilidad al interior del conglomerado se ha creado
la llamada medida de correlación intraclásica que asume el valor uno cuando todos

los elementos de cada conglomerado asumen un mismo valor, es decir en el caso

más desfavorable, y que toma el valor cero cuando la variabilidad al interior de los
conglomerados es igual a la variabilidad en el universo. La decisión sobre la
conveniencia de aplicar un diseño de conglomerados tiene en cuenta el grado de
correlación intraclásica. En encuestas de favoritismo electoral se da el caso de que
algunos candidatos, no todos, generan favoritismo que se puede llamar de alta
correlación intraclásica, es decir que concentran sus partidarios en determinadas
zonas geográficas, niveles socioeconómicos, grupos de edad, etc. En estos casos
bien vale la pena detenerse un momento antes de aplicar un diseño de
conglomerados.
1.3.4 Diseño multietápico
Una variante al diseño de conglomerados es el diseño en dos etapas. Cuando la

correlación intraclásica es muy alta, es decir cuando al interior del conglomerado la
semejanza entre los elementos es muy alta, entonces en lugar de estudiar a todos
los elementos se puede aplicar un diseño de muestreo probabilístico, particular para
cada conglomerado y llegar así a un tˆyi en lugar del anterior t yi . De esta manera se
reducen los costos sin incrementar la varianza del estimador. La definición de un
muestreo en dos etapas es la siguiente:
1. Se tiene una partición del universo U en subconjuntos U 1, U2, ..., UNI

denominados Unidades Primarias de Muestreo UPMs. Una partición significa
que se cumplen tres propiedades:
a.- Ninguna de las UPM’s es vacía
b.- Todas son disjuntas dos a dos
c.- La unión de todas las UPM’s reconstruye el universo
2. Del conjunto total de UPM’s se escoge mediante diseño d I una muestra de
UPM’s. (Puede ser mediante cualquiera de los diseños ya planteados, por
ejemplo Bernoulli, MAS, PPT, etc.).

3. En las UPM’s de la muestra se construye el marco de elementos,

procedimiento conocido con el nombre de enlistamiento,
4. En cada UPM de la muestra se extrae, con independencia e invarianza una
muestra probabilística con diseño particular d i. Se estudian entonces los
elementos seleccionados en esta segunda etapa.
Los principios de independencia e invarianza significan:

Para diseño en dos etapas se entenderá que dos diseños para la segunda etapa son
independientes cuando las probabilidades de selección de elementos al interior de
una UPM no dependen ni de las probabilidades de la primera etapa, ni de las
probabilidades asignadas en otras UPM’s.
Se dirá que se cumple el principio de invarianza cuando en el caso de que una UPM
sea seleccionada varias veces (en diseños con reposición, por ejemplo PPT) el
diseño aplicado a su interior sea siempre el mismo y con iguales parámetros. Así por
ejemplo si una determinada UPM de tamaño 450 fue seleccionada tres veces y a su
interior se aplicará un diseño MAS de parámetro n = 25, entonces se deberán
generar tres muestras independientes de tamaño 25 de 450, entonces algunos
elementos pueden aparecer más de una vez y hasta tres veces en la muestra final.
Queda entonces claro que los diseños al interior de cada UPM no necesariamente
deben ser los mismos. Este aspecto genera flexibilidad y le permite al muestrista
ajustar el diseño a las características particulares de las UPMs consideradas.
Las fórmulas de trabajo no difieren mucho de las establecidas para el diseño de

conglomerados. En la estimación se reemplaza el anterior t yi por el nuevo tˆyi . Así
por ejemplo si se plantea un diseño en dos etapas en el que en la primera etapa se
aplica un diseño PPT y en la segunda se aplica siempre un diseño MAS (ni) la
estimación del total se hará mediante la fórmula:

1 mI ˆ 1 mI N i mI
1 Ni
tˆy  . t yi  .  mi
yk    m . . yk  m ak . yk
mI i 1 mI i 1 ni i 1
i
mI ni
La fórmula de la varianza cambia radicalmente frente a las de los casos anteriores

por cuanto se tiene ahora dos fuentes de variación una por cada etapa. En principio
se puede decir que la varianza está constituida por la varianza entre UPMs y la
varianza dentro de las UPMs.
La varianza entre UPMs corresponde al diseño de la primera etapa y como en el

caso de conglomerados se reemplazan los yk por los tyi . la varianza dentro de la
UPMs es la suma expandida, como se expanden las estimaciones, de las varianzas
de los estimadores en los diseños de la segunda etapa.
Para el caso del ejemplo anterior del diseño PPT-MAS la varianza está dada por la
suma de la varianza entre UPMs y varianza dentro de UPMs de la siguiente manera:
N i .( N i  ni ) 2
2
1  t  1 V
VPPT  MAS (tˆy )  .U pIi . i  t   .U i donde Vi  .S yU i
mI I
 pIi  mI I
pIi ni
Para la estimación de la varianza del estimador se procede en forma similar aunque

hay que tener en cuenta algunos casos especiales. Cuando en la primera etapa el
diseño aplicado es PPT se tiene un estimador insesgado de la varianza utilizando la
2
1 1  tî 
fórmula VˆPPT  di (tˆy )  .  
mI mI  1 m I  pIi
 ˆ
t  que no requiere la estimación de la

varianza en la segunda etapa. Este aspecto se cumple sólo para diseño PPT en la
primera etapa y contrasta de gran manera con la multiplicidad de cálculos necesarios
para estimar la varianza en diseños sin reposición en la primera etapa. Por esta
razón se ha generalizado el uso del diseño PPT para selección de unidades
primarias de muestreo.

El diseño en tres etapas puede ser visto como un diseño en dos etapas en el que el
diseño aplicado en la segunda etapa es a su vez un diseño en dos etapas. En tal
caso se tiene un diseño para escoger unidades primarias de Muestreo (UPM’s), al
inte-rior de las UPM’s seleccionadas se construye el marco de Unidades Secundarias
de Muestreo (USM’s), se aplica, en cada caso un diseño d i y en la USM’s
seleccionadas se construye el marco de elementos. Se aplica finalmente un diseño
diq y se observan los elementos escogidos. Sea por ejemplo el caso de un estudio
sobre gastos en salud entre desempleados en una ciudad. Las UPM’s pueden ser las
secciones cartográficas del mapa DANE de la ciudad. En cada una de las secciones
escogidas se establece el marco de manzanas, se seleccionan mediante diseño di
algunas de ellas, dentro de las manzanas seleccionadas se levanta mediante censo
el marco de desempleados. Con la lista que permite identificar y ubicar, personal o
telefónicamente, a cada desempleado se aplica un último diseño diq para aplicar la
entrevista a alguno de ellos. Si en este ejemplo se utilizara un diseño PPT-PPT-MAS,
la estimación del total de dinero gastado en salud por los desempleados de la ciudad
estaría dado por:
1 tî 1 1  1 tˆ  1 1 1 1 N 
tˆy 
mI
 pIi

mI
 pIi
. .m iq     . . . iq . miq yk  
n 
 mi pIIi  mI pIi mi pIIi
mI mI mI mi
 iq 
i
1 1 1 1 N iq
  mI mi miq
. . . .
mI pIi mi pIIi niq
. yk   m ak . yk y puesto que en la primera etapa
se aplica un diseño PPT, la estimación de la varianza del estimador se consigue con:

2
1 1  tî 
VˆPPT  di (tˆy )  .
mI mI  1
 
mI 
 tˆ 
 pIi 
En el diseño multietápico por ser una extensión del diseño de conglomerados se

cumple también la relación inversa entre coeficiente de correlación intraclásica y
eficiencia de la estimación. En el ejemplo que se viene tratando, se puede decir que
si por razones epidemiológicas es de esperar que las personas que residen cerca
están expuestas a riesgos similares, que además tienen niveles socio-culturales

semejantes y que por lo tanto el gasto en salud puede ser muy parecido entre ellos,
entonces no tiene sentido entrevistar a muchos desempleados por manzana.
1.3.5 Diseño estratificado
Aunque no constituye un diseño propiamente dicho como los anteriores, se

denomina como tal dada su muy alta importancia y aplicación cotidiana. Un diseño
estratificado se define así:
1. Se tiene una partición del universo U en subconjuntos U 1, U2, ..., UH
denominados estratos. Una partición significa que se cumplen tres
propiedades de los estratos, ellas son:
a.- Ninguno de ellos es vacío
b.- Son todos disjuntos dos a dos
c.- La unión de todos reconstruye el universo
2. En cada estrato Uh se escoge en forma INDEPENDIENTE una muestra m h

mediante el diseño dh que se prefiera.
El estimador del total será entonces la suma de las estimaciones de los estratos,
cada cual obtenido con su respectivo diseño, y puesto que la selección de muestra
es independiente en los estratos la varianza de la suma es igual a la suma de las
varianzas, tanto para la varianza del estimador como para la estimación de la
varianza del estimador.
Es entonces evidente que la razón para estratificar es la conveniencia de aplicar

diseños diferentes para grupos de elementos. Se puede entonces aplicar diseños
proporcionales en donde hay información auxiliar, conglomerados donde es
conveniente, multietápicos en otros estratos y diseños no proporcionales de

elementos en otros grupos. Aplicando el diseño pertinente a cada estrato se logra

reducir considerablemente la varianza de la estimación. Un diseño muy común en
estudios de variables económicas con altos grados de asimetría, es decir en los que
unos pocos producen o venden muy grandes cantidades y una cantidad cada vez
más grande produce o vende cada vez menos hasta llegar a una cantidad inmensa
de pequeños productores, es el diseño estratificado con tres estratos. El primero
denominado de Inclusión Forzosa (IF), es decir aquel estrato en el que todos los
elementos que lo componen son observados. Este estrato está conformado por los
más grandes productores. El segundo estrato para diseño proporcional,
generalmente PPT, por cuanto se trata de los negocios o empresas de nivel
intermedio, con información registrada en cámaras de industria o comercio,
información útil para el diseño proporcional. Por último, el estrato de los
establecimientos económicos más pequeños, que constituyen una inmensa cantidad
pero sobre los cuales no se tiene mayor información. Este estrato es estudiado
mediante un diseño MAS.
Este mismo concepto se aplica en estudios de consumo en muestreo de varias

etapas. Las primeras cuatro ciudades están en el estrato de inclusión forzosa, es
decir son UPM’s de hecho seleccionadas. Para las siguientes ciento cincuenta
ciudades se aplica un diseño PPT y para el resto de municipios, es decir los menores
de 25000 habitantes se hace un diseño MAS.
Una razón también poderosa para crear estratos es la forma de acceso a las
unidades o elementos de la muestra. En este caso los estratos se crean de acuerdo
al grado de dificultad o de facilidad de acceso. Los estratos más fáciles tendrán
operativos normales mientras que para los estratos de acceso difícil se deberán
diseñar operativos especiales y costosos.
En general la estratificación es un mecanismo que permite ajustar los diseños de

muestreo a las condiciones particulares de grupos de elementos y aún a las
necesidades de los investigadores. En algunos casos la estratificación responde a

criterios de tipo administrativo, en otros a la necesidad de producir estimaciones

separadas para cada estrato y en otros casos la estratificación se realiza de acuerdo
a las tasas históricas de no respuesta.
La estratificación es un procedimiento que puede utilizarse en un diseño multietápico

en cualquiera de las etapas e independientemente en cualquiera de las unidades de
muestreo.
El diseño estratificado sigue siendo objeto de estudio, puesto que son muchas las
preguntas que todavía no tienen respuesta, por ejemplo la asignación de muestra o
cantidad de elementos por estrato cuando el diseño a su interior no es MAS, el
establecimiento de la frontera entre estratos cuando hay diferencia de diseños entre
estratos fronterizos o la cantidad óptima de estratos cuando la estratificación puede
ser manejada por el muestrista.
1.4 La estrategia muestral
La estrategia para conformar el plan muestral tiene como meta conseguir la mejor
estimación, o las mejores estimaciones, en términos de sesgo y de varianza,
consumiendo para ello la menor cantidad posible de recursos y sujeto a un
cronograma establecido. Son muchos los elementos con los que cuenta el muestrista
para tratar de conseguir el objetivo y desde el punto de vista matemático es
imposible formular un modelo que tenga en cuenta la multiplicidad de factores y
circunstancias que entran en juego al tratar de establecer un plan muestral.
En principio se pueden señalar las siguientes fuentes de sesgo que el investigador

debe tener en cuenta dentro de la planificación y la distribución de recursos y de
tiempo más para evitar defectos que para mejorar su plan muestral.

En el proceso de selección de las muestras los sesgos son producidos por defectos
graves en los marcos muestrales, tales como subcobertura, sobrecobertura y
repetición.
En el proceso de recolección de información se puede pensar en tres fuentes de

error que generan sesgos importantes en los resultados, esas fuentes son el
entrevistador, el proceso de medición, y el objeto observado. Los sujetos que realizan
la observación o medición son también encargados de realizar los enlistamientos de
los diseños multietápicos. Los graves errores que se pueden cometer en estas tareas
están ligadas a:
 Una deficiente capacitación en los procesos y pasos a seguir.
 Un proceso impropio de selección.
 Formas de pago inadecuadas.
 Procesos insuficientes de control, supervisión y corrección de errores.
Los errores en el proceso de medición están ligados tanto a los procedimientos como
a los instrumentos utilizados. Los procedimientos se invalidan cuando se pierde la
independencia y cuando se genera autocorrelación. Estos defectos apuntan
directamente a la generación de sesgo. Sucede por ejemplo debido al cansancio del
observador o del objeto observado, el agotamiento del instrumento de medida, por
ejemplo cuando se utilizan filtros, al efecto de memoria de los objetos medidos, a la
ambigüedad del dato observado, por ejemplo en preguntas mal diseñadas. Es papel
del estadístico no sólo vigilar que estos errores no se cometan sino estar despierto a
detectar toda fuente de variación que se introduce en el proceso de medición y evitar
que se generen variaciones sistemáticas.
El objeto observado puede generar un grave error de sesgo básicamente por la no

respuesta. El procedimiento para evitarlo tanto como se pueda es acudiendo a
procesos de información, persuasión, convencimiento y generación de confianza. El
método de acceso a los objetos observados debe ser tal que para él se produzca la

menos incomodidad posible, que no le genere traumatismos y que no represente una

carga de trabajo excesiva. El investigador debe ajustarse a las condiciones del sujeto
observado y no esperar que la realidad se ajuste a sus caprichos. Una encuesta a
personas debe ser respondida cuando los entrevistados tengan el tiempo y la
disposición de hacerlo no necesariamente cuando el investigador lo pretenda. Una
empresa responderá un cuestionario tan sólo cuando los resultados contables estén
disponible y no cuando la agencia encuestadora lo requiera. La ética impide aplicar
un cuestionario por ejemplo a los dolientes de una persona fallecida en una clínica u
hospital.
Durante el procesamiento de la información también se pueden cometer errores que

van a originar sesgos a veces mayores a los ocurridos durante las labores de
selección o de recolección. Los sesgos pueden originarse en los procesos de
codificación, grabación, crítica, imputación y estimación. La codificación tiene que ver
con el proceso de asignar un código a una respuesta generalmente abierta. Es el
caso por ejemplo de las unidades de medida para la producción agropecuaria
(bultos, cajas, racimos, cargas, arrobas, sacos, etc). Para este tipo de tareas se
tienen que diseñar mecanismos de revisión y corrección de errores. Para garantizar
que la grabación no generará sesgos difíciles de detectar basta con diseñar un
excelente plan de prueba de programación, además de un proceso especial de
verificación. La verificación apunta a detectar errores de las personas encargadas de
trasladar información en papel a medio magnético. El plan de prueba de programa
apunta a detectar errores en el programa mismo de grabación o de verificación. No
es extraño que la información de una pregunta quede grabada encima de la
información de la pregunta anterior. En ocasiones el error es evidente, en otras
ocasiones el error puede pasar inadvertido ocasionando decisiones equivocadas. La
estrategia de crítica e imputación genera sesgos, no muy altos si la cantidad de
inconsistencias o ausencias no es muy grande. Los sesgos pueden llegar a niveles
preocupantes si la cantidad de respuestas consideradas inconsistentes o sin
respuesta es muy alta. Finalmente un cuidadoso trabajo de selección, recolección y

procesamiento puede concluir en un desastre si el estadístico se equivoca al

momento de establecer los factores de expansión correspondientes al diseño y al
estimador utilizado en el estudio.
La varianza del estimador se reduce mediante la combinación de siguientes tres

factores: El tamaño de muestra, el diseño muestral y el estimador a utilizar. Entre
mayor sea el tamaño de muestra menor será la varianza del estimador, sin embargo
a iguales tamaños de muestra corresponden diferentes varianzas si no hay similitud
entre los diseños y mucho mayor puede ser la diferencia en varianza si además de la
incompatibilidad entre diseños se trabaja con distintos estimadores. Un aspecto
adicional a tener en cuenta es el relativo a las posibilidades operativas y a los costos
asociados a una u otra elección estratégica. Aún cuando estos cuatro aspectos se
conjugan para conformar una estrategia de plan muestral, serán tratados a
continuación en forma separada.
1.4.1 El diseño muestral
Para la elección del diseño muestral se debe partir en primer lugar de la información
disponible o posible de conseguir. Cuando se carece de toda información, cuando la
información disponible es ninguna, no se puede elaborar un plan muestral. El trabajo
comienza entonces por la consecución de un marco muestral sin defectos de
subcobertura, sobrecobertura y repetición. Los recursos destinados a una
investigación pueden invertirse en la obtención de información auxiliar a utilizar en el
diseño o en el estimador. Como principios generales para determinar el diseño más
apropiado se pueden sugerir los siguientes:
1. Un diseño muestral de elementos sólo es posible si se dispone de un marco

de elementos, de lo contrario se está en la obligación de acudir a un diseño
de unidades (conglomerados o multietápico).
2. Los diseños proporcionales sin reposición son más eficientes que los diseños
con reposición pero son mucho más engorrosos y difíciles de manejar

3. Los diseños de probabilidad proporcional son mucho más eficientes que los
diseños no proporcionales.
4. Los diseños con tamaño fijo de muestra fijo son más eficientes que los
diseños de tamaño aleatorio de muestra.
5. La varianza asociada a un diseño multietápico aumenta a medida que
aumenta la cantidad de etapas.
6. Un diseño proporcional de UPM’s o de conglomerados es mucho más
eficiente que un diseño no proporcional de UPM’s.
7. En un diseño proporcional de UPM’s o de conglomerados la proporcionalidad
de las probabilidades debe ser a los totales de las UPM’s o de los
conglomerados.
8. La varianza del estimador asociada a un diseño multietápico tiene su mayor
peso en la componente de varianza entre las UPM’s y decrece hasta el
punto de que la varianza entre elementos puede llegar a ser despreciable.
9. En diseño en dos etapas es estadísticamente preferible, más UPM’s y menos
elementos por UPM que a la inversa. Esto, sin embargo esto implica un
aumento en los costos. Este principio se puede generalizar a diseños en
varias etapas.
10. En un diseño en dos etapas o de conglomerados la varianza del estimador
crece a medida que aumenta la correlación intraclásica, es decir la
semejanza desde el punto de vista de la variable en estudio, de los
elementos. Este principio se deja generalizar para el diseño multietápico.
11. Mediante una adecuada estratificación se puede asignar el diseño más
apropiado a las circunstancias particulares de grupos de unidades o de
elementos.
12. La tarea de estimar la varianza de los estimadores puede determinar el diseño
a utilizar. El método de Medias Muestras Balanceadas necesita muchos
estratos y dos UPM’s por estrato, el método de Jackknife es difícilmente
aplicable para diseños estratificados de UPM’s.

13. Una alternativa metodológica es aplicar diseños proporcionales sin reposición

en las UPM’s y utilizar las fórmulas de estimación de varianza de los
diseños con reposición.
1.4.2 El estimador a escoger
Como en el caso del diseño muestral la primera consideración es respecto a la

información auxiliar disponible. Si se dispone de información auxiliar es
recomendable intentar un r-estimador. Se dispone de esta información auxiliar por
ejemplo, cuando se trata de estimaciones económicas anteriores a la recolección
censal de los registros contables, por ejemplo antes de la llegada de las
declaraciones de impuestos, o antes del establecimiento del balance anual. También
se dispone de esta información inmediatamente después de la primera vuelta de un
proceso electoral, después de la recolección de cosecha en una región, luego de
concluir un período académico o al concluir una feria comercial. Si por ejemplo se
trata de estimar la producción de un determinado cereal en una región y se cuenta
con la producción alcanzada un año atrás por todos quienes cosecharon ese
producto, se podría pensar en un diseño con dos estratos, el primero conformado por
quienes cosecharon al año anterior y se prestan a cosechar en el presente y el otro
estrato conformado por los productores que sin haber cosechado el año anterior lo
harán ahora. Para el primer estrato se puede proponer un r-estimador y para el
segundo un π-estimador.
Sin embargo la utilización de un r-estimador implica un conocimiento especializado

que va más allá de los alcances de este documento, pero que hace parte del dominio
del experto en muestreo.
La decisión entre un π-estimador o un MCR estimador del total depende del tipo de
diseño que se esté aplicando. Si se trata de un diseño con reposición y como se

mencionó anteriormente, es muy difícil establecer las probabilidades de inclusión,

particularmente en el diseño PPT. Por esta razón es entonces preferible utilizar el
MCR estimador para todos los objetos seleccionados, incluidas las repeticiones de
un mismo elemento o unidad. Si por el contrario el diseño es sin reposición es
siempre preferible utilizar el π-estimador para estimar totales.
Especial mención merece el caso de la estimación de razones y en particular la

estimación del promedio. En una gran cantidad de casos, en diseños de
conglomerados o de varias etapas no se conoce el tamaño total del universo. Pero
aún en los casos en que el tamaño del universo es conocido la teoría de muestreo da
~ tˆy
a conocer que el estimador de razón ys  ˆ 
 a .y
m k k
aunque sesgado es de
N  a m k
menor varianza al estimador yÛ 

 m
ak . y k
.
N
Sin embargo se debe tener cuidado con la magnitud del sesgo. Se ha llegado a
establecer que para la razón R 

ty
el estimador Rˆ 
tˆy

m
ak .yk
tiene un sesgo
tz tˆz  m
a k .z k
acotado por  B  Rˆ 
r
2

E ( Rˆ )  R V (tˆz )

t z2 .
V ( Rˆ )
Como se mencionó anteriormente, la magnitud del sesgo relativo incide directamente

en la confiabilidad de la estimación. Si el sesgo relativo supera la unidad se está ya
en una situación de poca confiabilidad. Para que el sesgo relativo sea menor que uno
se tiene que cumplir que V  tˆz   t z2 , lo que, aunque no es una gran exigencia, debe
ser tenido en cuenta.

1.4.3 El tamaño muestral
La discusión acerca el tamaño muestral puede hacerse desde dos perspectivas

diferentes, en algo complementarias pero ambas necesarias. La primera desde el
punto de vista teórico, que si bien, en la mayoría de los casos, no conduce
directamente a resultados concretos, constituye la base sobre la cual se construye la
segunda posibilidad: la simulación.
Desde el punto de vista teórico se trabaja con dos conceptos importantes, el primero
el tamaño de muestra en un diseño MAS y el segundo el denominado efecto de
diseño deff.
La estimación de un total mediante un diseño MAS utilizando el π-estimador y una
N .( N  n) 2
muestra de tamaño n de N tiene la varianza VMAS (tˆy )  .S yU . En este
n
caso, si se pretende que CV (tˆy )   se tiene que cumplir que
n
no
con no 
 CV  yU
2
.
1  no 2
Para la estimación de una razón en este mismo esquema y si se desea que la

estimación sea tal que CV (Rˆ )   , entonces se necesita que
n
no 1   ( yk  yU ).( zk  zU )  .
con no  2   CV  yU   CV  zU  2. U
2 2
1  no   ( N  1). yU .zU 


1 si Uk d 1 si Uk e
En el caso particular en el que
yk  zk  Ud Ue
0 si Uk d 0 si Uk e
1 N  Pe  Pd  N N
no  . .  con Pd  d  e  Pe
 N  1  Pd .Pe
2
 N N
N
Cuando el tamaño del universo es tan grande que el cociente se vuelve muy
N 1
cercano a uno, el comportamiento de no para α = 2.5% oscila entre 100 y los varios
miles dependiendo de la configuración de Pe y Pd como lo muestra la siguiente tabla.

Nd
Tamaño de muestra para estimar la razón mediante M.A.S con CV  Rˆ   2,5%
Ne
Pe
Pd 1 0,90 0,85 0,80 0,70 0,60 0,50 0,40 0,30 0,25 0,20
0,05 30400 30222 30118 30000 29714 29333 28800 28000 26667 25600 24000
0,10 14400 14222 14118 14000 13714 13333 12800 12000 10667 9600 8000
0,15 9067 8889 8784 8667 8381 8000 7467 6667 5333 4267 2667
0,20 6400 6222 6118 6000 5714 5333 4800 4000 2667 1600
0,25 4800 4622 4518 4400 4114 3733 3200 2400 1067
0,30 3733 3556 3451 3333 3048 2667 2133 1333
0,35 2971 2794 2689 2571 2286 1905 1371 571
0,40 2400 2222 2118 2000 1714 1333 800
0,45 1956 1778 1673 1556 1270 889 356
0,50 1600 1422 1318 1200 914 533
0,55 1309 1131 1027 909 623 242
0,60 1067 889 784 667 381
0,65 862 684 579 462 176
0,70 686 508 403 286
0,75 533 356 251 133
0,80 400 222 118
0,85 282 105
0,90 178
0,95 84
Para una estimación de mediana calidad es decir CV  Rˆ   5,0% los tamaños de
1
muestra se reducen exactamente en una cuarta parte puesto que el factor pasa
2
1 1
de ser  1600 a ser  400 .
0.025 0.05
De tal manera que si por experiencia se intuye que el porcentaje de votantes es

cercano al 70% y la proporción de votos favorables es del 40%, es decir
Nd P
 0.4  d entonces Pe = 0.28 y así se llega a que en MAS se necesita un
Ne Pe
tamaño de muestra de 3429 personas para conseguir que el intervalo de confianza
sea de la forma (40  2)% (2 = 2 x 2.5 % de 40%). Si para similares condiciones, el
2 x CV x 40
intervalo deseado fuera de la forma (40  1)%, se tendría que 1  % con lo
100

que el CV sería igual a 1.25% y el tamaño de muestra crecería a 13.714 personas. Si

por el contrario un intervalo de la forma (40  4)% satisface las necesidades del
usuario entonces el CV sería igual a 5% y el tamaño de muestra necesario sería
igual 857 personas.
Para pasar de un diseño MAS, con el π-estimador y un tamaño de muestra n a un

diseño cualquiera d con el estimador tˆy también arbitrario y tamaño de muestra
comparable, es decir E(ns) = n se utiliza el denominado efecto de diseño deff,
definido como el cociente de las varianzas de los dos estimadores:
Vd (tˆy )
deff ( d , tˆy )  con Ed (ns )  n
VMAS (tˆy )
de esta manera se llega a que si para un diseño cualquiera d con estimador tˆy
arbitrario se desea una estimación con CVd (tˆy )   entonces
Vd (tˆy )
  y así Vd (tˆy )   2 .E 2  tˆy  es decir deff ( d , tˆy ).VMAS (tˆy )   2 .E 2  tˆy 
E  tˆy 
deff .no
n
con lo que 1 con no como se ha definido en los casos anteriores.
1  .deff .no
N
Nótese que tanto en el caso de la determinación del tamaño de muestra para un
diseño MAS como en el caso general en que se utiliza el coeficiente deff, se hace
necesario disponer de información acerca del coeficiente de variación CV de la o las
variables en estudio. Si no se cuenta con esta información, aún en forma aproximada
es imposible abordar la discusión acerca del tamaño de muestra. En casos de
completo desconocimiento sobre estos aspectos se suele recabar esta información a
partir de una muestra piloto.
La situación se hace más difícil pero también más frecuente cuando no se dispone
de un marco muestral de elementos y se debe acudir a los diseños multietápicos. En
este caso es prácticamente imposible acercarse a un estimativo del coeficiente deff.
Nótese que para poder establecer este factor se debe disponer de la información
censal de las variables en estudio. De otra parte, cuando se tiene una muestra con

un diseño particular di diferente al MAS no se puede intentar una estimación del deff.
Para poderlo hacer, se necesitaría de al menos dos muestras, una MAS y otra di. En
diseños multietápicos se suele comenzar con un diseño proporcional, entonces el
deff no sólo depende de la combinación de diseños en las diferentes etapas sino
también y en gran medida de la escogencia de los valores pi
Desde esta perspectiva teórica es muy difícil llegar a una determinación

regularmente satisfactoria de un tamaño de muestra para un diseño no muy complejo
en varias etapas, como los que suelen necesitarse en la cotidianidad.
Guiándose por los criterios teóricos expuestos se puede entonces proceder a

simulaciones, ojalá a partir de datos censales para variables de distribución
presumiblemente similar a las variables de estudio.
Para la simulación es conveniente dejar fijo un esquema de selección muestral para

jugar únicamente con los tamaños en las diferentes etapas y en las distintas UPM’s.
Para reducir un poco la complejidad del modelo de simulación vale la pena dejar fijos
algunos de los parámetros y mover sólo otros. Se puede fijar de antemano la
decisión acerca de la definición de las diferentes unidades de muestreo. Por ejemplo
para un estudio entre amas de casa, la definición de unidades es:
UPM’s – Municipios
USM’s – Secciones
UTM’s – Manzanas
Elemento – Ama de casa
Este esquema podría cambiarse teniendo en cuenta los sectores cartográficos,

segmentos, las caras de manzana, las viviendas, los hogares y muchas otras
unidades más, todas ellas conducentes al elemento de estudio: el ama de casa. Sin
embargo es conveniente fijar un esquema para luego jugar con otros factores. Aquí
es importante recordar que si por un lado el establecer más etapas implica mayor
varianza y por ende mayor tamaño de muestra, de otro lado el enlistamiento en

unidades grandes implica un alto costo y poco aprovechamiento muestral del listado
conseguido.
El segundo factor a dejar relativamente fijo para la simulación es el tipo de selección

en cada una de las unidades muestrales a seleccionar. El plan de simulación es más
fácil, si al interior de todas o casi todas las Unidades Primarias de Muestreo se
proyecta un mismo diseño o método de selección, de igual manera en la siguiente
etapa y así hasta llegar al elemento. Por ejemplo con el esquema del ejemplo
anterior de unidades se podría pensar en un plan EST(IF-PPT-MAS)-PPT-MAS-SIS,
es decir estratificar los municipios como se señaló en un ejemplo anterior, las
principales ciudades en el estrato de inclusión forzosa (π k = 1), los municipios de más
de 25000 habitantes en estrato para diseño PPT y los municipios de menos de 25000
habitantes en un estrato en el que aplicará un diseño MAS de municipios. Para las
principales ciudades y para los municipios del segundo estrato seleccionados se
aplicará un diseño PPT de secciones cartográficas. En los municipios pequeños son
tan pocas las secciones cartográficas y tan cortas las distancias, se puede obviar
esta etapa y pasar directamente a una selección MAS de manzanas. También en las
grandes ciudades y municipios de estrato dos se llega a una selección MAS de
manzanas. La razón para utilizar una etapa más, es decir incluir la sección, aún
cuando a partir de los archivos es posible seleccionar directamente manzanas, es
por concentrar los operativos y reducir los tiempos de desplazamiento. Valdría la
pena estudiar, en el caso particular, la diferencia de costos entre el tamaño muestral
que se aumenta por ampliación de la varianza y el aumento de costo por esparcir la
muestra a nivel de manzana en la ciudad. Finalmente en todas las manzanas
seleccionadas se levanta el marco muestral de amas de casa y se procede a una
selección sistemática.
El tercer aspecto con el cual se puede jugar un poco dependiendo de la

disponibilidad de información es la variable auxiliar sobre la cual se ha de construir la

proporcionalidad, sobre todo de las primeras etapas, cuya varianza tanto pesa en la
varianza final.
El primer factor de juego en la simulación es el tamaño de muestra en cada etapa y

unidad de muestreo. Buscando de nuevo la simplicidad, el modelo se deja analizar
mejor si para los diseños MAS o SIS se establecen porcentajes fijos a lo largo de las
unidades de muestreo sobre el tamaño total de la unidad. Así por ejemplo, se juega
con la cantidad de municipios a seleccionar y también con el de secciones y luego se
varían porcentajes de muestra. En el ejemplo, varía el porcentaje de manzanas a ser
estudiadas en las secciones escogidas. Si por ejemplo se fija que se escoge el 10%
de las manzanas de la sección, esta proporción será fija para todas las secciones; de
igual manera con la proporción de amas de casa por manzana.
De esta manera se generan tablas en las que un mismo valor de tamaño muestral se
consigue con diferentes configuraciones. En un ejemplo sencillo se pueden
entrevistar 400 hogares seleccionando 40 manzanas y 10 hogares por manzana,
pero también con 25 manzanas y 16 hogares por manzana, ó 10 manzanas y
cuarenta hogares por manzana bajo el supuesto de que todas las manzanas son de
tamaño tan grande. Desde la perspectiva de la varianza del estimador la mejor
configuración es aquella que tiene la mayor cantidad de UPM’s y la menor de
elementos al interior de cada UPM. Sin embargo los costos y tiempos de
enlistamiento son completamente diferentes. Se llega entonces al último aspecto a
tener en cuenta en la simulación: La operatividad y los costos. No necesariamente
una muestra más grande implica mayores costos. Los costos crecen en función de
los procesos de construcción de los marcos en las unidades posteriores.
1.4.4 Operatividad y costos
Dentro del proceso de diseño del plan muestral se debe tener especial atención a los
costos y recursos asociados a la operatividad, es decir a la identificación correcta de
unidades de estudio o de variables de interés. Este aspecto está ligado a la definición

de elemento pero también de unidades de muestreo. Si se propone una etapa

muestral en la que se identifica al hogar, se hace necesaria una indagación metódica
acerca de los gastos, cómo se comparten alimentos, etc. Averiguación costosa frente
a la identificación de la vivienda. Cuando se propone una etapa en la que es
necesario delimitar la finca productora se incurre en un elevado costo en
comparación al proceso en el que la unidad intermedia muestral es el productor
como persona.
El costo de un proceso muestral tiene, desde la perspectiva operativa las siguientes

fuentes de costo:
1. La adquisición, corrección y complementación del marco de UPM’s.

2. El levantamiento o construcción del marco de unidades posteriores de
muestreo
3. Los procesos de seguimiento, control y corrección al desarrollo de las
diferentes etapas muestrales.
4. El proceso de observación o entrevista.
5. La supervisión y control del proceso de medición.
Como complemento al modelo de simulación que genera un resultado de CV de

estimación para unos tamaños de muestra dados, se establecen entonces los costos
asociados a las decisiones con las que se alimenta el modelo. De esta forma es
posible configurar unos escenarios en los que la calidad está en función del costo y
sobre el que es posible encontrar el mejor resultado para un costo dado o el mínimo
costo con el que se puede conseguir una especificación de calidad preestablecida.
1.5 El informe del plan muestral
Una vez conseguido un diseño medianamente satisfactorio, discutido y de acuerdo

con los requerimientos del usuario, se hace indispensable redactar y entregar un

informe de plan muestral. Este informe es el documento oficial con el que el

muestrista asume las responsabilidades de su producto. En él se registran los
elementos de muestreo que serán posteriormente utilizados en la recolección,
producción e interpretación de resultados.
El informe debe contener más o menos las siguientes partes:
Título (Es conveniente incluir fechas y restricciones geográficas)

Introducción Resumen del diseño muestral, tamaño final de muestra,
costo total, fórmulas de los factores de expansión, de la
varianza del estimador y método de estimación de la
varianza y comentarios importantes.
Marco conceptual Objetivos generales y específicos del estudio, concreción
de objetivos en los principales cuadros de salida
esperados.
Diseño Definición de las diferentes unidades de muestreo,
definición de las formas de selección, variables auxiliares
a utilizar.
Características Se trata en este capítulo de entregar las cifras concretas
de probabilidades de selección, tamaños planeados de
muestra, costos asociados a las etapas y duración de las
mismas.
Factores de expansión Tabla final de factores de expansión para todos los
elementos a observar. Métodos aplicados para el ajuste
por no respuesta.
Imputación Criterio de mínima respuesta aceptable. Criterios para los
procesos crítica de campo, de oficina y análisis de
consistencia y de respuesta válida. Estrategia de
imputación.
Estimación Procedimientos específicos a aplicar. Fórmulas para la

estimación de totales, razones y otros parámetros.

Fórmulas o mecanismos propuestos para la estimación de

la varianza del estimador.
ANEXOS
Definiciones utilizadas conceptual y operativamente.
Cuestionario a aplicar
Manual de recolección, crítica y mínima respuesta aceptable
Especificaciones de consistencia
Especificaciones de imputación
2. EL DISEÑO DEL CUESTIONARIO
Un cuestionario es un grupo o secuencia de preguntas diseñadas para obtener

información acerca de un sujeto o un tópico a través de un informante o
entrevistado. Un cuestionario es un conjunto estructurado de preguntas con

respuestas precodificadas de acuerdo con categorías. Un cuestionario puede ser

administrado por el entrevistador o ser diligenciado directamente por el entrevistado.
Los cuestionarios cumplen un papel fundamental en el proceso de recolección de la

información. Ellos inciden decisivamente en la calidad de la información y en la
imagen que la organización encuestadora proyecta ante el público. Un cuestionario
debe permitir la recolección de información en forma eficiente con un mínimo de
errores, debe facilitar la codificación y captura de los datos y reducir la cantidad de
crítica y de imputación necesarias. La redacción de las preguntas debe ser clara y
éstas deben seguir una secuencia lógica. Las preguntas deben ser comprendidas
fácilmente y planteadas de forma que la respuesta sea siempre precisa, un
cuestionario debe ser amigable tanto para el entrevistador como para el
entrevistado.
2.1 Criterios de diseño
Los aspectos a tener en cuenta en el diseño del cuestionario son:
 Objetivos de la encuesta traducidos en cuadros de salida esperados

 Características del Universo de estudio
 Métodos de recolección de la información
 Tiempo disponible para la entrevista
 Presupuesto y Cronograma de trabajo
Como pasos a seguir para el diseño del cuestionario se sugiere el siguiente plan de
acción:
1. Prepare un documento donde se enuncien claramente los
objetivos, las necesidades de información y el plan de análisis.

2. Establezca las variables a medir, las preguntas en orden de

importancia y las alternativas de respuesta necesarias para
cumplir los objetivos.
3. Prepare un listado de preguntas y asegúrese de la pertinencia
de ellas en relación con los objetivos y necesidades de
información. En este punto revise preguntas que se hayan
utilizado en anteriores encuestas sobre un tema igual o similar.
4. Analice la racionalidad de cada pregunta y haga el ejercicio de
usar sus respuestas para cumplir los objetivos planteados,
recuerde que el criterio no debe ser lo interesante de la
pregunta o de la respuesta sino su correspondencia con un
cuadro de salida preestablecido y acorde con los objetivos del
estudio.
5. Ponga el listado de preguntas a consideración de los expertos
en la temática de la encuesta y luego de sus ajustes discútalo
con el usuario.
6. Revise la gramática, el lenguaje y la pertinencia de conceptos,
palabras o giros idiomáticos.
7. Con el listado final de preguntas estructure un cuestionario
fluido, sin saltos bruscos en la temática, sin repeticiones,
ameno y en general que no constituya una carga de trabajo
intelectual tanto para el entrevistado como para el
entrevistador.
8. Realice pruebas de cuestionario, en las que Usted mismo
juegue varias veces el papel del entrevistador. Válgase para
estas pruebas de personas del universo de estudio, ojalá no
vinculadas al grupo de trabajo de la encuesta. De esta manera
podrá identificar preocupaciones y asuntos propios del universo
en estudio.

2.2 La prueba del cuestionario
La prueba de cuestionarios permite detectar errores de organización en los flujos de

preguntas condicionales, sugerir categorías adicionales a las posibles respuestas,
obtener un indicador preliminar de la duración de la entrevista y de las posibilidades
de rechazo. Si la entrevista es grabada al tiempo de la prueba, posteriormente se
puede analizar la interacción entre entrevistador y entrevistado. Estos registros de
comportamiento ayudan a identificar problemas tales como fallas del encuestador en
leer la pregunta o la forma como ésta aparece redactada. El entrevistado puede
pedir explicación sobre una pregunta o sobre el procedimiento de respuesta. El
tamaño para estas pruebas puede ser entre 20 y 100 entrevistados. Los
entrevistados se seleccionan generalmente de acuerdo con el propósito que se
persigue y no al azar.
La prueba puede realizarse mediante la técnica de un grupo focal, mediante

entrevistas particulares o mediante entrevistas observadas.
El grupo focal es la reunión de personas pertenecientes a la población objetivo,

convocada con el fin de adelantar una discusión informal sobre un tema previamente
seleccionado. El grupo focal es liderado por un moderador quien debe conocer
acerca de técnicas de entrevista en grupo y del propósito de la discusión. El grupo
focal proporciona información sobre las actitudes, opiniones, intereses, experiencias
y sugerencias de los participantes. Los grupos focales son útiles en la prueba y
evaluación de los cuestionarios, ellos permiten evaluar la comprensión por parte de
los encuestados del lenguaje y la redacción utilizados en las preguntas y las
instrucciones y para evaluar alternativas de redacción y formato de preguntas. Los
grupos focales varían de tamaño entre seis y doce personas, el tamaño ideal es de 7
a 9 personas. Las reuniones de los grupos focales son, por lo general, grabadas (en
algunos casos filmadas). Pueden ser observados por personas desde un salón
adjunto o a través de un falso espejo. Para el desarrollo de una sesión de grupo focal

conviene analizar con detenimiento los siguientes aspectos que atañen con quienes
deben responder las preguntas.
 Comprensión, qué fue lo que realmente entendió de la pregunta ?

 Recordación, que tanto se recuerda o se sabe lo que se está indagando ?
 Reflexión y juicio sobre las consecuencias de las respuestas, es decir la
tendencia a asociar la pregunta a alguna intención oculta de la entrevista, y
por ende a emitir respuestas poco sinceras.
Otra manera de probar cuestionarios es mediante entrevistas individuales en las que

se utilizan algunas de las siguientes posibilidades:
Observar los sujetos mientras responden el cuestionario. La observación suministra

información acerca del comportamiento del respondiente. El observador toma nota
acerca de la forma como se lee, la secuencia en la cual las preguntas son
respondidas, los comentarios respecto a las instrucciones, tipos de registros o
personas consultadas, el tiempo requerido para diligenciar las diferentes secciones y
las correcciones o cambios hechos a las respuestas.
Realizar discusiones de seguimiento con los entrevistados para determinar sus

reacciones al cuestionario, a las instrucciones y a las preguntas individuales.
Desarrollar entrevistas pensando en voz alta: A los entrevistados se les solicita

pensar en voz alta mientras responden las preguntas, comentando cada una y
explicando cómo fue escogida la respuesta final. Un entrevistador puede probar las
respuestas obteniendo más información acerca de una afirmación en particular o
clarificando el proceso a través del cual fue escogida una respuesta. Las entrevistas
pensadas en voz alta ayudan a identificar las áreas en las cuales los encuestados
tienen problemas y a entender el proceso a través del cual el cuestionario es
diligenciado.

También se prueba el cuestionario mediante la técnica de la entrevista observada

para procesos de interrogación presencial o telefónica. Los observadores son de
gran ayuda ya que ellos pueden presenciar o escuchar el diálogo entre el
entrevistador y el entrevistado. Los observadores verifican si el entrevistador hace las
preguntas exactamente como están redactadas y en la secuencia correcta, si omite
alguna pregunta, si el entrevistado requiere alguna explicación adicional, si responde
adecuadamente, etc. Diferentes entrevistadores y observadores deben ser usados
para evitar sesgos en el resultado. Un método alternativo consiste entonces en
grabar las entrevistas: esto permite un análisis posterior más detallado. El
cuestionario debe ser administrado en forma apropiada. Tanto las personas
encargadas de realizar las pruebas de la encuesta como los observadores deben
entender los objetivos de ésta y la importancia de no cambiar arbitrariamente la
redacción del cuestionario ni la forma de administrarlo. Sin embargo, ellos pueden
redactar nuevamente las preguntas o formular otras adicionales, cuando se
sospeche que la respuesta es inexacta, inapropiada o insuficiente. Esto deberá
formar parte del sistema de retroalimentación para detectar problemas adicionales en
el cuestionario.
Sea de una u otra manera como se realiza la prueba del cuestionario, ella puede
aplicarse a todo o a una parte del cuestionario, pero es recomendable utilizar todo el
cuestionario, aun cuando algunas de las preguntas hayan sido adaptadas de otras
investigaciones. Puede ser conveniente probar dos o más versiones de una misma
pregunta o versiones en las que se varía el orden de las preguntas en la estructura
del cuestionario.
Si solamente se puede practicar una prueba, el cuestionario deberá ser administrado

de la misma manera como se hará en la encuesta definitiva por ejemplo en entrevista
presencial o telefónica.

La prueba de un cuestionario a diligenciar por correo es más efectiva si para la

prueban se utiliza una técnica semi-presencial. Los entrevistadores tendrían la
función de observar el diligenciamiento del cuestionario y aclararle dudas al
entrevistado, pero no de plantearle las preguntas y diligenciar el cuestionario.
Conviene seleccionar encuestadores con entrenamiento y experiencia para las

pruebas. Así es más probable que las deficiencias detectadas se deban más al
diseño del cuestionario que a los encuestadores. Ellos pueden igualmente hacer
importantes recomendaciones para mejorar el cuestionario basados en su
experiencia con otras encuestas. En general la opinión de los entrevistadores puede
ser de gran utilidad en el diseño del cuestionario. También hay que anotar que los
encuestadores experimentados pueden tener también desventajas para las pruebas
de cuestionario, pues ellos pueden estar en capacidad de resolver situaciones que
los encuestadores menos experimentados no sepan abordar. Ellos pueden también
ser más eficientes, lo cual conduce a subestimar el tiempo que demanda la
entrevista. Lo apropiado es entonces, escoger encuestadores con diferentes grados
de entrenamiento y experiencia para una prueba.
Los encuestadores de prueba deberán ser entrenados en cómo obtener información

que sea útil para refinar el cuestionario. Se les deberá instruir detalladamente en los
conceptos y definiciones usados en el cuestionario y en la forma de administrarlo.
Los entrevistadores deben determinar si hay ciertas palabras, frases o situaciones
que sean entendidas por diferentes interrogados de manera distinta a como fueron
concebidas por quienes diseñaron el cuestionario.
Gran parte de la evaluación en una prueba consiste simplemente en aplicar el

sentido común para resolver los problemas identificados mediante la
retroalimentación. La tabulación del número de respuestas :“No sabe”, “Rechazo” o
“ No aplica” sumado a las inconsistencias y preguntas en blanco, usualmente
identifica diversos problemas en el cuestionario. La prueba usualmente identifica que

hay un problema, pero no brinda la solución “correcta”. Por ejemplo, si con frecuencia
una pregunta no es respondida durante la prueba, posiblemente haya un problema
en su redacción. A menos que los entrevistadores u observadores identifiquen la
pregunta no respondida, los diseñadores del cuestionario no tendrán la suficiente
información para replantear la pregunta en una forma que facilite su respuesta.
La cantidad de tiempo necesario para realizar una prueba varía en función de varios
factores, entre los cuales cabe mencionar:
 El numero de casos y de entrevistadores;

 La duración de la entrevista;
 La distancia media entre los diferentes informantes, en el caso de entrevistas
realizadas personalmente;
 La necesidad de enviar materiales a una empresa para imprimirlos;
 La necesidad de escribir las instrucciones, el material de capacitación, las
guías para los interrogatorios y los formatos para los observadores;
 La necesidad de enviar por correo el material al lugar de la entrevista.
Para el costo de la prueba del cuestionario se tiene que pensar en
 Salarios de los entrevistadores y del personal de campo;

 Salarios de otro personal como diseñadores, observadores, etc.;
 Viáticos y gastos de transporte de los entrevistadores y observadores;
 Diseño de los formatos y reproducción de los cuestionarios;
 Gastos de correo para el material enviado al sitio o gastos de teléfono en el
caso de entrevistas telefónicas.
2.3 El contenido del cuestionario

Un cuestionario consta básicamente de cuatro partes, el encabezamiento, la

información operativa, la información estadística y el cuerpo de preguntas.
El encabezamiento está conformado por el título del estudio, la presentación de la

entidad y del entrevistador, y el saludo a los entrevistados, en el que se le mencionan
los objetivos y alcances del estudio, se le motiva a responder con sinceridad y se le
dan las garantías sobre el la confidencialidad de la información que suministre.
La información operativa es aquella que se registra en el cuestionario sobre los
intentos fallidos, las entrevistas por completar, las citas acordadas y por cumplir. Es
decir es la información que sobre la cubierta del cuestionario permite decidir el
destino que se le ha de dar al mismo, al final de cada jornada. Si el cuestionario fue
respondido a satisfacción debe señalarlo en alguna parte para así enviarlo al proceso
de crítica de oficina. Si se planeó una cita, el cuestionario así lo debe registrar a fin
de que el encargado de darles rumbo lo coloque donde debe ser. La información
operativa contiene una parte final en la que se registra el resultado final de la
operación con ese cuestionario en particular. O bien se trata de una entrevista a
satisfacción, es una entrevista rechazada, no se encontró el elemento muestral
correspondiente, o es una entrevista realizada completamente pero respondida
parcialmente. Con esta información el responsable de cuestionarios sabrá el destino
final que debe darle a cada cuestionario.
La información estadística comprende el número de identificación del cuestionario,

que ha de ser único, el estrato o estratos a los que pertenece el elemento que se
corresponde con el cuestionario, la identificación de las unidades primarias,
secundarias , etc. de muestreo del elemento a entrevistar con ese cuestionario. En
términos generales se debe consignar allí la información que permita identificar la
procedencia estadística del cuestionario y asignarle el correcto factor de expansión.
Luego viene el cuerpo de preguntas y finalmente debe existir un espacio para

observaciones o comentarios del entrevistador o del entrevistado.

Las preguntas se denominan abiertas cuando el entrevistado puede redactar y

entregar libremente su respuesta.
Ejemplo 1.
Cuáles son las razones principales por las que usted decidió escogió esta empresa
de aviación?
1.__________________________________________________________________
2.__________________________________________________________________
3.__________________________________________________________________
Ejemplo 2.
Qué clase de trabajo realizó la semana pasada? (Describa en forma detallada)
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
Ejemplo 3.
Cuántas piezas tiene esta vivienda? |_|_|

(Incluya cocina, habitaciones, sala,
cuarto de estar, etc. No incluya baños,
vestíbulos y cuartos utilizados con
fines de negocio)

Las preguntas abiertas recogen mucha información, contiene matices, es más

próxima a la respuesta del interrogado y suministra datos numéricos exactos. Sin
embargo es mucho más consumidor de tiempo y más exigente para el entrevistado.
En las entrevistas no autodiligenciadas la respuesta pasa por el filtro del
entrevistador que diligencia el cuestionario. Él interpreta, analiza y registra lo que
considera más importante de acuerdo a su criterio. Finalmente el tratamiento
estadístico de las preguntas abiertas es mucho más dispendioso que con otros tipos
de preguntas. Por ejemplo la grabación es mucho más complicada en preguntas
abiertas que en preguntas cerradas.
Se denominan preguntas cerradas aquellas en que las respuestas están pre-

establecidas y el entrevistado debe escoger entre una o varias de las opciones
señaladas.
Ejemplos
Ha vivido usted alguna vez en una ciudad con más de 10.000 habitantes?
1 Si
2 No
Usted trabaja para una entidad:

1 Privada
2 Pública
Con las preguntas cerradas se puede obtener una respuesta sin que exista
conocimiento u opinión al respecto, se puede llegar a una exagerada simplificación
de algún aspecto, y se puede forzar una respuesta de modo artificial. Pero de otro
lado son fáciles de responder, codificar, procesar y analizar.
Entre las preguntas cerradas destacan dos tipos especiales, las de selección
excluyente y las de selección múltiple. En la primera, el entrevistado sólo puede
tomar una alternativa, por ejemplo:

Cuál es su antigüedad en ese cargo?

1 Menos de 4 años
2 Entre 4 y 10 años
3 Más de 10 años
En las preguntas de selección múltiple conviene eliminar la ambigüedad entre la no
respuesta y la respuesta negativa.
Ejemplo:
Qué deportes práctico en los dos últimos meses ?
Si No
Natación 1 2
Ciclismo 1 2
Tenis 1 2
Fútbol 1 2
Se llamará aquí campo al nombre de la variable de grabación. Cada pregunta puede

tener uno o varios campos de acuerdo con las opciones de respuesta. El cuestionario
estructurado indica el nombre del campo en las alternativas de las respuestas.
Ejemplos
1. Cuál es su antigüedad en ese cargo?
1 Menos de 4 años
C01 2 Entre 4 y 10 años
3 Más de 10 años
2. Qué deportes ha practicado en los dos últimos meses ?

Si No
Natación 1 2 C02
Ciclismo 1 2 C03
Tenis 1 2 C04
Fútbol 1 2 C05

3. LA CRITICA Y LA IMPUTACIÓN
3.1 La crítica estadística
La crítica estadística es el proceso por el cual se garantiza que la información de una

encuesta es aceptable en términos de completitud, consistencia y corrección. Desde
la perspectiva operativa, la aceptabilidad de la información se determina por la
integridad total de los datos en términos de:
Qué tan completos están,

Qué tan correctos son, y
Qué tanto grado de consistencia interna presentan.
Se entiende como crítica estadística el proceso encaminado a determinar el grado

de integridad de la información en referencia a estos tres términos.
Para estudiar la integridad de los datos se plantean dos tipos diferentes de crítica
denominados generalmente como crítica interna y macro-crítica. La crítica interna es
el proceso de determinar las inconsistencias, las ausencias importantes, e
incorrecciones internas y el proceso encaminado a su corrección. La macro-crítica
coteja los datos de la encuesta con otros conjuntos de datos (Encuestas anteriores,
registros administrativos, versiones anteriores de la misma investigación) a fin de
asegurar la comparabilidad. La crítica estadística es el proceso que implica la
aplicación de ciertas reglas al conjunto de datos. Si un registro no cumple con alguna
de las reglas establecidas debe ser señalado para ser corregido o cambiado.
Ejemplos de este tipo de reglas son :

La pregunta X DEBE TENER una y sólo una respuesta,
Las respuestas válidas para la pregunta X son 1y 2,

La suma de las partes de la pregunta X no puede ser menor que la respuesta a la

pregunta Y,
Máximo el 5% del área puede ser dedicada a labores de beneficio, etc.,
Las reglas de crítica se refieren generalmente a :
Los valores que en forma individual pueden asumir las variables,

Las relaciones que deberían existir entre unas respuestas y otras,
La estructura global que se espera del conjunto de datos.
La definición de las reglas de crítica se basa en el conocimiento experto de los

especialistas en el tema, en la estructura del cuestionario y en otros datos
relacionados con el tema de la encuesta. Los individuos con una amplia experiencia
en el manejo de las variables que quieren ser criticadas tienen un buen conocimiento
de las relaciones que existen entre esas variables y pueden distinguir las respuestas
que tienen sentido. Ellos son importantes para definir el tipo de reglas de crítica. Por
ejemplo un analista de estadísticas económicas del sector forestal puede saber de la
relación entre ingreso bruto y gasto para las unidades del sector. Un experto en
transporte puede señalar el rango aceptable de valores para la tasa de consumo de
combustible para diferentes modelos de vehículos.
El proceso de crítica puede ser manual o automático, dependiendo del volumen de

crítica en términos de a) datos a criticar y b) cantidad de reglas a verificar ;
dependiendo de la naturaleza y complejidad de las reglas de crítica y dependiendo
de la etapa de procesamiento en la que se aplicarán las reglas de crítica.
Obviamente entre más compleja sean las reglas de crítica, más difícil y susceptible a
error serán los procesos manuales. Por el contrario para algunas encuestas, durante
el proceso de recolección de datos será difícil, sino imposible incorporar
procedimientos de crítica automática. Si se trata de una crítica manual y si se está
interesado en un trabajo correcto se requiere:
Escribir el conjunto de reglas de crítica,

Escribir el conjunto de decisiones a tomar cuando un dato no se ajusta a la regla,

Entrenar a quienes van a realizar la crítica,
Establecer un mecanismo de supervisión y control de los criticadores,
Establecer la medida de impacto que la crítica ha tenido sobre los datos originales, y
Finalmente el trabajo propio de crítica puede ser bastante laborioso.
En un ambiente de crítica automática se debe:
Escribir las reglas de crítica

Contar un sistema de computo en el que se pueda realizar la crítica,
Escribir los programas que realizarán la crítica, con base en especificaciones,
Verificar y probar los programas,
Aplicar los programas al conjunto de datos.
La magnitud de los recursos, el tiempo y los costos de este proceso de principio a fin
puede llegar a ser muy alto.
En cualquier caso se debe estar seguro que la inversión de los recursos valen la
pena. De una parte se debe estar seguro que no se trata de institucionalizar un
operativo de crítica costoso, que consume mucho tiempo pero que tan sólo
encontrará alguno pocos datos “equivocados” y con un impacto insignificante sobre
los resultados finales de la encuesta. De otra parte, por el contrario, no se trata
tampoco de correr el riesgo de entregar resultados poco confiables como producto de
un diseño muy grueso de crítica, útil sólo para encontrar los mayores errores. A fin
de diseñar una estrategia de crítica que responda a las necesidades y las
restricciones de recursos se deben responder preguntas como :
Qué cantidad de registros no cumplen las reglas de crítica ?

Cuál es el impacto de esas inconsistencias en los resultados de la encuesta ?

Deben considerarse con igual criterio todos los registros ?, Hay registros más
importantes que otros ?
Tienen todas las variables igual importancia ?
Estas preguntas son muy fácil de formular pero no siempre de responder. La
respuesta acerca de la cantidad de datos “equivocados” depende en gran medida de
qué tan bien diseñado está el cuestionario, qué grado de escolaridad o de
conocimiento sobre el tema tienen los respondientes, qué tan bien entrenados están
los entrevistadores, qué tan eficientes son los procesos de supervisión y control.
Con relación a la importancia que tienen los registros se debe señalar que no
siempre ellos tienen la misma importancia. Tratándose por ejemplo de una encuesta
a empresarios sobre las condiciones laborales de sus empleados, la importancia de
una empresa con diez mil empleados es evidente sobre una empresa con cuatro
empleados. Mientras que para la empresa grande es necesario realizar un proceso
completo de crítica, conducente a una revisión y corrección completa, para la
segunda la crítica puede ser reducida a enviar un mensaje de advertencia sin que
implique corrección alguna. Este tipo de crítica conocido como crítica selectiva es
muy utilizado en encuestas de tipo económico y de empresas.
El diseño de una estrategia de crítica está relacionada también con las posibilidades
de corrección de la información. Una de las consecuencias de realizar crítica a
cuestionarios de una encuesta es el relacionado con la posibilidad de regresar a una
fuente a verificar o corregir uno o varios datos. En las encuestas de hogares parece
muy difícil hace revisitas por segunda o tercera vez a fin de verificar alguna
información sobretodo si se trata de una encuesta larga, pesada o con aspectos muy
sensibles. En las encuestas económicas, por el contrario, dada la importancia que
para los resultados finales tiene cada fuente es necesario y frecuente volver a la
fuente a realizar revisiones de la información entregada.
El diseño de una estrategia de crítica conducente a identificar registros que no se

ajustan a las reglas establecidas no tiene valor práctico si no está seguido del

proceso de corrección correspondiente. La acción de corrección es comúnmente

llamada imputación estadística. Es importante tener en cuenta que las acciones de
crítica e imputación están tan estrechamente ligadas, que se debe tener en cuenta el
tipo de imputación a realizar al momento de escribir las especificaciones de crítica.
Frecuentemente la imputación se realiza como un paso separado después que todos

los datos han pasado por los procesos de crítica. Durante este último proceso se han
detectado las inconsistencias y se han marcado los registros a ser corregidos. En un
proceso separado, el de imputación, se efectúan las correcciones del conjunto de
datos.
La crítica estadística es un proceso que tiene lugar durante las etapas de recolección
y procesamiento de información.
Durante la entrevista: Durante la recolección existe una crítica que realiza el

entrevistador, quien revisa y corrige a medida que realiza la entrevista. En estos
casos el entrevistador se basa en reglas preestablecidas pero también en su sentido
común y su juicio acerca de lo que son respuestas aceptables o combinaciones de
respuestas. Ejemplos de este tipo de crítica, pueden ser reconocer errores de
registro como por ejemplo entrar el número 8 cuando existen dos campos numéricos
para registrar el mes y se ha debido registrar 08. Otro ejemplo es la detección de
palabras mal escritas. Una situación más compleja es el caso en el que el
entrevistador reporta ingresos por la producción de un cultivo para el cual no se han
reportado áreas de siembra.
Inmediatamente después de la entrevista: Frecuentemente existe una crítica en

forma inmediata a la finalización de la entrevista. Los entrevistadores son entrenados
para realizar una revisión de las respuestas registradas inmediatamente después de
abandonar el hogar o el establecimiento encuestado. De esta manera se tiene la
oportunidad de detectar y corregir errores cuando la información está aún fresca en

la memoria del encuestador con la posibilidad adicional de realizar una nuevo

contacto fácil y poco costoso.
La crítica del supervisor: La siguiente forma de crítica es la efectuada por el

supervisor. Entre sus tareas está la de controlar el trabajo de los encuestadores para
encontrar errores a fin de aplicar las acciones remediales necesarias. En general se
trata del mismo tipo de errores que el entrevistador hubiera podido detectar
inmediatamente después de la entrevista, y usualmente tiene la posibilidad de volver
a contactar al respondiente para determinar el valor correcto.
La crítica de oficina: Los formularios una vez completos son enviados o entregados
por los supervisores a una oficina en la que se lleva a cabo el proceso de
alistamiento previo al operativo de oficina. Dicho alistamiento consiste entre otras
actividades, en la codificación, la colocación de etiquetas, la construcción de
paquetes, el registro de formularios completos, incompletos, etc. dentro de este
proceso se realiza generalmente un proceso adicional de crítica, en el que por
ejemplo se revisan los identificadores, los códigos, los criterios mínimos para
considerar un formulario “completo”, etc. La magnitud de la crítica a realizar en este
momento depende del presupuesto disponible y de las posibilidades que tiene el
grupo de oficina de corregir los errores encontrados. En esta etapa es todavía
posible intentar, como última oportunidad, un nuevo contacto con la fuente a fin de
corregir algún dato. Una vez los cuestionarios son enviados a grabación las
correcciones se realizarán (en la mayoría de los casos) por medios automáticos.
La crítica más compleja y general se produce usualmente durante la etapa de

procesamiento de datos. La crítica automática, como se denomina, se realiza cuando
la información ha pasado de cuestionarios físicos a un medio magnético y se aplican
programas de computador diseñados para verificar las reglas de crítica. Esta crítica
permite mayor complejidad en el tipo de reglas a ser manejadas.

Durante la captura: La crítica puede ser realizada durante la captura de datos bien
por los grabadores o por el mismo programa de grabación. Puesto que se trata de la
etapa durante la cual los datos del cuestionario son convertidos en un archivo
magnético o una base de datos, resulta económico aprovechar la oportunidad para
aplicar ciertas reglas de crítica que dejarán los datos suficientemente ‘depurados’
para continuar en forma eficiente con los siguientes pasos del procesamiento.
En un proceso separado de crítica e imputación: La crítica que se lleva a cabo

durante la captura está generalmente relacionada a las reglas específicas para cada
variable, como por ejemplo los valores posibles. Para el análisis de las relaciones
entre variables, relaciones entre registros o entre conjuntos de datos, se acostumbra
un proceso independiente, posterior a la grabación, denominado proceso de crítica e
imputación.
Un principio universalmente aceptado respecto al proceso de critica automática

después de la captura de datos, es que la etapa de crítica y su correspondiente
“corrección” o imputación no requiere volver a las copias en papel de los
cuestionarios, a menos que sea absolutamente necesario. Es decir, se parte del
concepto de que la base de datos en medio magnético, producto de la captura,
contiene todo lo necesario a fin de poder realizar las tareas posteriores de crítica e
imputación. En los casos en los que el regreso al cuestionario físico sea inevitable,
el proceso de crítica e imputación deberá ser tal que toda la información a obtener
del cuestionario físico debe ser conseguida en una única consulta. Se debe evitar la
situación en que los cuestionarios son consultados una y otra vez a fin de resolver
errores de crítica, por cuanto es un procedimiento demasiado costoso y consumidor
de tiempo, máxime si se trata de un volumen elevado de cuestionarios.
Otro principio incluido en el proceso de crítica señala que durante las diferentes
etapas de crítica, una regla de crítica no puede contradecir reglas de crítica de otras
etapas. Por ejemplo una relación lógica aplicada por los entrevistadores durante la

crítica manual no puede ser controvertida por la crítica automática durante la etapa
de procesamiento. Igualmente el grado de rigurosidad en la crítica de una etapa
deberá ser al menos tan riguroso como en las etapas anteriores.
Un primer propósito de la crítica de campo es la de corregir los errores ocurridos

durante el proceso de entrevista, errores que provienen bien del entrevistador o del
entrevistado. Por ejemplo los encuestadores o el supervisor no notan que se está
llevando una falsa secuencia debido a un error de salto en el formulario. En otros
casos los entrevistadores o el personal de oficina pueden notar un error sistemático
originado en una forma incorrecta de ajustar cantidades o de rellenar con ceros. En
ocasiones el error puede derivarse de estar utilizando una tabla equivocada de
códigos o de equivalencias.
Un segundo propósito de la crítica de campo es la de controlar que ciertas preguntas

cruciales dentro del cuestionario hayan sido contestadas. En general se establece
que si una determinada cantidad de preguntas cruciales no ha sido respondida el
cuestionario puede considerarse inútil y puede ser removido de los paquetes para
entrar a procesamiento. Considérese por ejemplo una encuesta sobre el mercado
laboral que recoge información sobre los trabajos que ha desempeñado la persona
en el último año. Para la información acerca del trabajo es absolutamente necesario
contar con respuestas a las preguntas sobre el tipo de trabajo, el tipo de
responsabilidades que él implicaba y la compañía en la que trabajó. No hay manera
de imputar esta información si no ha sido registrada por el encuestador. Esto significa
que el cuestionario deberá ser rechazado como una total no respuesta aún en el
caso que muchas otras respuestas hayan sido respondidas correctamente.
Generalmente estas variables que deben estar respondidas constituyen lo que se
denomina el criterio de mínima respuesta para no rechazo y se insiste sobre ellas en
el manual del encuestador y durante la capacitación.
Una tercera razón para realizar la crítica de campo es la posibilidad de “limpiar” la

encuesta. Algunos encuestadores, generalmente novatos, adoptan la modalidad de

escribir cortas notas o palabras claves al borde del cuestionario, acerca de las
respuestas señaladas por el encuestado. La razón de proceder de esta manera es
que ellos o bien no conocen bien los códigos, o no creen conveniente comenzar a
buscarlos en su manual de campo en medio de la entrevista. La crítica de campo le
permitirá al encuestador poner en limpio la codificación de esas notas, que olvidará
muy pronto, y entregar un cuestionario limpio y sin notas al margen. En la oficina las
notas aclaratorias al margen del cuestionario pueden ayudar al proceso de crítica.
Pero nunca más allá, por cuanto esas notas no llegarán a ser grabadas.
El resultado de la crítica de campo puede ser muy diverso. En primer lugar se puede
originar una corrección en el lugar por cuanto la acción de corregir era obvia. De otra
parte se puede volver a la fuente que se tiene cerca tanto en tiempo como en
espacio y recoger de ella la información correcta o faltante. Finalmente, si ninguna de
las dos alternativas anteriores es posible, la crítica de campo deja la respuesta en
blanco para que sea marcada para imputación en un proceso posterior.
Las razones para realizar la crítica automática son corregir los datos faltantes,
detectar los datos erróneos, encontrar inconsistencias y eventualmente señalar los
llamados “outliers” o datos extraños. La crítica automática es la última oportunidad de
“corregir” datos antes de iniciar el proceso de producción de cuadros de salida. El
objetivo de la crítica automática es la de aplicar y verificar el cumplimiento de las
reglas de crítica que no fueron verificadas anteriormente, así como la aplicación de
reglas muy complejas y que abarcan en forma simultánea un amplio espectro del
cuestionario.
El resultado de la crítica automática puede también conducir a varias salidas. en

algunos casos el registro que se critica presenta tal cantidad de infracciones a las
reglas de crítica o infringe sólo algunas pero las más cruciales reglas que su
posterior utilización se hace prácticamente imposible. En estos casos se debe retirar

el registro de la base de datos y darle el tratamiento de caso absoluto de no

respuesta.
Otra salida posible es la imputación llamada determinística en la que si es posible, se

establece un único valor el cual será asumido por la variable en forma automática en
el momento en el que se detecte un error. De esta manera se puede evitar tener que
volver sobre el mismo registro para hacer la corrección, haciendo así más eficiente
los pasos posteriores de procesamiento.
La salida más frecuente es en la que no es posible señalar un valor para la

imputación determinística, y será necesario realizar un proceso posterior de
imputación probabilística, en este caso la salida de la crítica es la de marcar el
registro, colocar una bandera, a ser tenida en cuenta en el siguiente paso de
imputación.
En encuestas de opinión es frecuente que el investigador opte por crear un código

nuevo y asignarle a este código los casos en que no se tiene respuesta o se tiene
una respuesta inicialmente no aceptada.
Finalmente el resultado de la crítica automática puede ser sencillamente dejar el

espacio en blanco a fin de que el problema se solucione en el proceso posterior de
imputación, obviamente si las especificaciones de imputación aclaran que el espacio
en blanco es sinónimo de bandera para imputación.
3.1.1 Verificación y validación
Antes de iniciar este numeral es importante establecer la diferencia entre dos

términos que se utilizan frecuentemente en este contexto y que son muy diferentes.
La verificación y la validación.

La verificación es el proceso que generalmente acompaña a la grabación y que

consiste en garantizar que lo grabado es un fiel reflejo de lo contenido en los
cuestionarios. Este proceso se realiza casi siempre a través de una segunda
grabación en la que cada uno de los datos capturados va siendo comparado con la
anterior captura. Las diferencias se concilian inmediatamente. En muchos casos y
por razones de tiempo y costo este procedimiento se limita a las variables más
importantes del cuestionario como los campos de identificación, los códigos, las
variables claves y las que deben estar respondidas.
La validación es el proceso por el cual en forma manual o automática se determina si

los datos cumplen ciertas reglas preestablecidas de aceptabilidad. Estas reglas
constituyen la crítica de validación. La verificación de la regla la puede realizar el
grabador cuando al momento de grabar determina si la variable cumple o no la regla
establecida. En muchos casos el programa de grabación acepta sólo valores
aceptables o respuestas válidas. Esta verificación puede también ser efectuada
como un proceso aparte después de la grabación y verificación. La crítica de
validación controla una variable y solo una en cada momento, no permite revisar
relaciones entre variables o entre individuos. Para valores numéricos especifica los
rangos de respuesta válida. Para preguntas cerradas de selección única se valida el
cumplimiento de una de las posibles alternativas.
La crítica de validación puede establecer que son valores aceptables el uno y el dos.
En algunos casos la no respuesta también puede ser aceptable, es decir los valores
válidos serían 1, 2 y 3. Obviamente si las dos respuestas, el 1 y el 2, están marcadas
sobre el formulario la respuesta es claramente inválida y debe ser criticada, es decir
se debe decidir qué hacer en ese caso.
La crítica de validación también se aplica para verificar la sintaxis numérica o

alfanumérica de una determinada respuesta. Es decir cuando se espera un
determinado nombre, por ejemplo de un departamento, la crítica verificará que quede

correctamente escrito o lo rechazará por inválido, lo mismo podría hacerse para

aspectos relacionados a direcciones, marcas, jerarquías, etc.
A la crítica de validación le corresponde siempre una acción en caso de encontrar

casos inválidos. Las acciones a tomar pueden ser: la corrección inmediata, la
imputación determinística, la señalización con banderas o códigos especiales o
simplemente, dejar los espacios en blanco.
En el caso por ejemplo en el que se tienen dos campos para colocar el dígito
correspondiente al mes, el valor inválido 8 blanco, puede ser inmediatamente
corregido a 08. Así mismo, pequeños errores de ortografía pueden conducir al
nombre correcto de la compañía en cuestión.
Puesto que la crítica de validación se hace generalmente durante la captura de la

información, se instruye a los grabadores para que todo caso no válido sea dejado en
blanco. Una consideración muy importante en este punto es que el software utilizado
pueda distinguir entre el cero y el blanco. Los blancos señalan ausencia de
información e implica que son datos no tenidos en cuenta para las estimaciones de
promedios, aspecto muy diferente con el cero.
En otros casos se utiliza un valor especial, por ejemplo el “9” para indicar que un
valor no válido fue respondido. La razón de utilizar el 8 y el 9 para estos efectos
radica en que generalmente ellos no pertenecen a los rangos aceptados. Sin
embargo la aplicación de este procedimiento a valores cuantitativos como el ingreso,
la cantidad de empleados, etc, puede conducir a grandes catástrofes.
Existen muchas formas de presentar las especificaciones de la crítica de validación,

sin embargo la simple lista de cada una de las variables en forma ordenada, seguida
de sus valores válidos y un campo para observaciones especiales es suficiente para
completar la especificación. Generalmente al lado de las observaciones individuales
por variable se acostumbra a tener un conjunto, de instrucciones generales que se

aplican para todo el cuestionario. Estas son particularmente importantes cuando la

crítica se esta realizando durante la captura. Ejemplo de este tipo de reglas
generales son:
Los campos numéricos se ajustan a la derecha y se completan con ceros,

Los campos sin entrada posible se dejan en blanco,
Todos los campos deben ser verificados.
3.1.2 Especificaciones de consistencia
Mientras que la crítica de validación examina una variable en un momento, la crítica

de consistencia analiza la relación entre dos o más variables. Esa relación puede ser
simplemente la obediencia al flujo establecido en el formulario, por ejemplo si la
respuesta a la pregunta 22 es ‘No’ las preguntas 23, 24 y 25 no debieron ser
formuladas ni respondidas.
Otra aplicación de este tipo de crítica verifica la relación ‘lógica’ entre dos o más
respuestas de un mismo cuestionario. Una persona menor de diez años no puede
responder estado civil diferente de soltero, o una mujer muy joven no puede
responder que ha tenido más de determinada cantidad de hijos vivos.
La crítica de consistencia, al contrario de la crítica de validación tiene a su

disposición la información completa de todo el cuestionario al momento de criticar
una determinada variable.
Para la crítica de consistencia se manejan dos planteamientos básicos importantes.

El primero parte del principio de realizar el mínimo cambio posible de datos hasta
obtener una base de datos completa y corregida. Aunque este planteamiento
preserva la cualidad de mantener la mayor cantidad posible de información para la
producción de cuadros, requiere muchas reglas de crítica y sofisticados programas

de computo capaces de determinar los puntos de cambio mínimo. El segundo

planteamiento parte del principio muy práctico de realizar la crítica de consistencia
únicamente basándose en la información previamente criticada, es decir de las
preguntas anteriores. Este procedimiento denominado crítica descendente conlleva
a establecer reglas muy sencillas, se implementa de manera relativamente fácil y
rápida, aunque puede conducir a una elevada cantidad de cambios en la base de
datos.
La operación de crítica de consistencia termina en retirar datos de la base, realizar

una imputación determinística o marcar registros a fin de realizar la imputación
probabilística en un paso posterior.
En términos generales el primer paso de la crítica de consistencia es crear la regla

de validación que controla las condiciones de mínimo respuesta para rechazo y las
de utilidad del cuestionario. Por ejemplo si cierta cantidad de preguntas claves no se
han respondido o una buena proporción de las preguntas iniciales están en blanco,
quizá sea conveniente considerar el cuestionario como no respuesta absoluta en su
totalidad y dejar para un paso posterior los ajustes necesarios en los factores de
expansión a utilizar.
La crítica de consistencia en principio identifica datos que no cumplen las reglas y los
señala para ser reemplazados por datos de individuos similares. Este método se
conoce como imputación probabilística. Durante el proceso de crítica lo único a tener
en cuenta es definir los registros que en caso de fallas, serán objeto de imputación
determinística y los que son objeto de imputación probabilística.
3.1.3 Macrocrítica
Esta forma de crítica se utiliza para detectar valores de variables o cuestionarios que
parecen diferentes a valores o resultados de encuestas anteriores y que tienen la
apariencia de estar incorrectos. Este tipo de situaciones pueden no ser detectadas a

través de la crítica de consistencia por cuanto se trata de valores que no violan las
reglas. Un ejemplo de este tipo de casos se tiene cuando los ingresos netos son muy
altos, en relación a los ingresos brutos para un subsector económico en o una región
geográfica en particular.
Este tipo de crítica puede realizarse antes o después de la verificación de

consistencia. Si se hace previamente se puede entonces identificar registros que no
deberían hacer parte del conjunto de “donantes” para el proceso de imputación. En
ocasiones este tipo de crítica se realiza después de la prueba de consistencia como
proceso para llegar a una versión final de datos depurados.
Se puede afirmar que así como la crítica de validación observa una única variable, la
crítica de consistencia examina un cuestionario, la macro-crítica estudia el conjunto
completo de datos, para lo cual se vale de datos históricos, datos de la misma
encuesta en meses o años anteriores, o encuestas sobre el mismo tema.
En general la manera de realizar este tipo de crítica es a través de tablas univariadas

que permitan determinar lo que se pueden denominar regiones “outliers” o extrañas.
Una manera de hacerlo es revisando cuidadosamente el comportamiento de los 5%
más altos o más bajos a fin de establecer si se trata de datos plausibles o no. En
algunos casos las puntas de las distribuciones se manejan de manera diferente pero
sistemática, así por ejemplo se imputan los datos más allá del 5%, y a los de la franja
entre el 5% y el 15% no se les permite entrar en el grupo de donantes. Para esto,
naturalmente, se debe contar con tamaños de muestra relativamente grandes.
Las decisiones a tomar en los casos que la macro-crítica detecte errores, van desde
el intento de hacer un nuevo contacto con la fuente, en los casos en los que el
impacto en la información es muy importante, pasando por la necesidad de realizar
ajustes a los factores de expansión, hasta la señalización de variables para ser
imputadas.

Finalmente se debe resaltar el hecho de que al cliente o al público se le debe

informar, dentro de los comentarios de calidad de la información producida, acerca
de los mecanismos de crítica realizados y sobre el impacto de ésta en los resultados
presentados.
ESPECIFICACIONES DE VALIDACIÓN
Encuesta : Escritas por:
Fecha: Hora: 17:00 Pág. 1 de 1
CAMPO TAMAÑO VALORES VÁLIDOS OBSERVACIONES
Número 3 001 - 999 Debe estar

Estrato 1 1, 2 Debe estar
UPM 2 01, 03, 04, 08, 13, 17, 21, Debe estar
27, 33, 39, 45, 56, 64, 70
Hogar 3 001 - 300 Debe estar
Réplica 2 01 - 17 Debe estar
Múltiple 1 1-9 Debe estar
C01 2 01 - 18, b
C02 1 1, 2 Debe estar
C03 2 18 - 98 Debe estar
C04 3 50 - 150, b
C05 3 120 - 200, b
C06 1 1, 2, b
C07 1 1 - 4, b
C08 1 1, 2, b

ESPECIFICACIONES DE CONSISTENCIA
Encuesta : Escritas por: Fecha:

Pág. 1 de 11 Bloque Nro. Tabla nro. Hora:
Condiciones 1 2 3 4 5 6 7 8 9
1 C04 = b S N
2
3
Acciones
1 Marque C04 para imputar X
2
3
No hacer nada X
3.2 La imputación estadística
Durante el diseño y el desarrollo de una encuesta se hacen muchos esfuerzos con el

fin de contar al final con datos completos, correctos y consistentes de parte de cada
uno de los entrevistados. Sin embargo aún cuando una gran parte de recursos y del
tiempo se invierte diseñando, revisando y probando el cuestionario, capacitando
entrevistadores, y realizando actividades de seguimiento y control, no todas las
respuestas son contestadas, no todas son correctas y se presentan casos de
inconsistencias.
Parece natural que la “mejor” (mejor entre comillas) solución ante datos faltantes o
incorrectos es el retornar a la fuente primaria para resolver y realizar la depuración.
Esta solución es muchas veces imposible, cara, e impráctica, pero además el
respondiente puede no conocer la respuesta o no desea suministrarla. Con

frecuencia el problema en los datos se detecta una vez se han realizado múltiples
pasos en el procesamiento y es sencillamente muy tarde para detener el proceso y
volver a la fuente. Y por supuesto siempre se debe estar atento acerca de la cantidad
de molestias que se pueden recargar a un entrevistado.
El hecho es que de todas maneras la base de datos presenta datos faltantes o

inconsistentes al final del proceso de recolección a pesar de todos los esfuerzos y
recursos gastados en seguimiento y control. Ante este hecho quedan dos posibles
caminos, el primero eliminar de la base los cuestionarios con al menos un dato
erróneo o faltante, con la consecuente pérdida de información que si estaba presente
en el cuestionario y que tuvo un costo asociado a la recolección, la supervisión y el
control. La otra posibilidad es la de asignar un valor “plausible” en el lugar de los
datos faltantes o incorrectos, es decir realizar la imputación con la consecuente
pérdida de precisión en los resultados entregados. Se trata entonces de determinar
en cuál de las dos opciones se pierde menos. Si se establece que las pérdidas en
precisión pueden ser mayores a lo que el investigador esta dispuesto a permitir,
entonces se eliminan los cuestionarios en cuestión y se realizan los ajustes a los
factores de expansión. En este caso el error muestral se amplía. Si por el contrario la
magnitud de la imputación no implica grandes pérdidas de precisión, entonces la
imputación se convierte en el procedimiento final antes de llegar a contar con
archivos completos y depurados. Sin embargo los métodos particulares de
imputación tienen mucho que ver con el nivel de pérdida de precisión. Así por
ejemplo se han diseñado formas de imputación para que los promedios estimados no
se alteren substancialmente.
Mientras que la crítica es el proceso de identificar valores erróneos o faltantes la

imputación es el proceso de “corregirlos” es decir de cambiarlos. La relación entre
estos dos procesos es muy estrecha, tanto que generalmente se asocia a un único
proceso denominado critica e imputación. El proceso de crítica e imputación tiene
tres pasos básicos:

Identificar que algo está equivocado

Establecer la causa de ese problema, es decir determinar la variable
equivocada
Corregir esos valores (es decir cambiar esos valores por otros que conduzcan
a un conjunto consistente de datos).
Los dos primeros pasos pertenecen a la crítica propiamente dicha, el último es lo que
se denomina imputación. Naturalmente se debe tener cuidado que en este último
paso no se vuelva a cometer un error que la crítica tendría que volver a detectar. Un
dato imputado no pasará de nuevo por el proceso de crítica, por tal razón la
imputación debe conducir a datos correctos y consistentes. Es por esta razón que el
proceso de imputación al tener en cuenta las reglas de crítica puede llegar a ser un
procedimiento por lo demás bastante complejo. El siguiente ejemplo ilustra el nivel de
complejidad que se puede alcanzar: Considere las tres preguntas de selección:
P1 Cuál es su actual estado civil ?

1
Soltero (a)
2
Casado (a) o unión libre
3
Separado(a), divorciado(a), viudo(a)
P2 En qué grupo de edad se ubica?

1
Menos de 15 años ---> Entonces termine la encuesta
2
15 a 34
3
35 a 54
4
55 ó más
P3 Trabajó la semana pasada como empleado?

1
Si
2
No

Las especificaciones de crítica de consistencia escritas para este cuestionario fueron

las siguientes:
Regla 1. Si P1 es 2 o 3 entonces P2 no puede ser 1
Que traducido a términos de la encuesta señala que si el estado civil es casado, en

unión libre, separado, divorciado o viudo, la edad no puede ser menor de quince
años.
Regla 2. Si P2 es 1 entonces P3 debe ser blanco
Que significa que si en la pregunta dos, se contestó que la persona era menor de
quince años la encuesta debe terminar y no debe haber respuesta para la pregunta
tres.
Regla 3. Si P2 es 2, 3 ó 4 entonces P3 no puede ser blanco.

Que significa que si la edad es mayor de quince años debe haber alguna respuesta a
la actividad laboral de la semana anterior.
Considérese entonces un primer cuestionario con las siguientes respuestas:

P1= 2 P2= 1 P3 = 1
Es decir una persona casada, menor de quince años que trabajó la semana anterior.
Al aplicar las reglas de crítica a estos datos se infringen las reglas uno y dos.
El siguiente paso es identificar la causa de ese error. Al menos uno de los tres
valores está equivocado. Si el proceso de crítica establece que el dato errado es la
segunda variable, la marcaría para imputación y este proceso debería escoger un
valor entre el 2, 3 o el 4, porque de lo contrario el error persistiría.
Considere ahora un segundo formulario en el que las respuestas son:

P1= 1 P2= 1 P3 = 2
Es decir una persona soltera, menor de quince años que no trabajó la semana
anterior.

Según las reglas de crítica se infringe la segunda regla.

Suponga que quien escribió las especificaciones de crítica estableció que en casos
como este el problema esté en P3, que debe ser marcada e imputada en un proceso
posterior.
La imputación de P3 debe ser blanco, por cuanto, cualquier otra posibilidad haría
mantener el error.
Con este ejemplo se muestra que la imputación es un proceso de asignar valores
plausibles a las variables erróneas sin que se infrinjan de nuevo las reglas de crítica.
Al lector curioso e interesado le queda como ejercicio el estudiar la misma situación
si hace un pequeño cambio en el orden de las preguntas, e ilustrarse así de la
estrecha relación entre diseño del cuestionario, crítica e imputación.
Básicamente hay dos casos en los que amerita aplicar un procedimiento de

imputación, en los casos de datos sin respuesta o para valores inconsistentes. El
caso de la no respuesta también se puede considerar desde dos ángulos la no
respuesta total y la no respuesta parcial.
Se dice que un caso de no respuesta es total cuando ha sido respondida una muy
pequeña parte del cuestionario o casi nada de él. La razón puede estar en que el
respondiente después de la segunda o tercera respuesta decide no colaborar más y
no responde el resto de preguntas. Sin embargo este caso debería haber sido
detectado en la crítica de oficina, o a más tardar en el proceso de crítica de
validación. Si el cuestionario tiene muy poca información la imputación será muy
difícil de realizar. En estos casos vale la pena examinar la cantidad y el tipo de
cuestionarios en similar situación para medir el impacto y así establecer si vale la
pena invertir en desarrollar un costoso proceso de imputación. Si la cantidad de
casos en esta situación es relativamente pequeño y además se puede asumir que
se trata de un subgrupo aleatorio de individuos será entonces más eficiente y simple
descartar esos casos y proceder a ajustar los factores de expansión. Una situación
diferente se presenta cuando es evidente que la no respuesta total responde a un

subgrupo de individuos con similares características y de importancia en el estudio

que se realiza.
Se dice que la no respuesta es parcial, cuando ciertos bloques de preguntas del

cuestionario han sido dejados sin responder. Esto resulta cuando el respondiente no
pudo dar una respuesta concreta a una o más preguntas, cuando el entrevistador
realizó un salto que no debía o equivocadamente dejó una página sin leer.
Se dice que un dato específico es inconsistente o inválido cuando infringe una ley de
crítica de consistencia o de validación, entonces se marca para imputación y debe
ser imputado. Así por ejemplo si un menor de quince años tiene estado civil casado y
se determina que el dato errado es el estado civil, entonces se marca esta variable
para imputación.
Una pregunta obvia a esta altura es por qué se debe imputar, por qué no dejar los
datos faltantes, inválidos o inconsistentes como están y proceder a trabajar con el
resto de la información correcta. También se podría marcar todos los datos faltantes
e incorrectos con un código especial que signifique dato no disponible. Además una
base de datos a la que se le ha realizado una gran cantidad de imputación puede
dar la impresión de que se trata de una base de “datos cocinados” y si además la
imputación no ha sido correctamente dirigida se puede llegar de hecho a una base
completamente falsa.
En el caso de la no respuesta total es generalmente preferible no imputar y realizar

los ajustes a los factores de expansión. En los casos de no respuesta parcial o de
valores inconsistentes o inválidos, el ignorar los registros con información no
disponible puede llegar a ser una gran pérdida por la información no tenida en
cuenta. El establecer una categoría nueva de información no disponible para cada
una de las variables con datos faltantes puede por un lado conducir a proporciones y
valores muy bajos y de poco interés. En encuestas con datos demográficos no se
acostumbra a presentar la categoría no disponible cuando se trata de grupos de

edad, género, por cuanto se trata de variables fundamentales a tener en cuenta. Es

más, la presentación de tablas en las que en la categoría de género, por ejemplo
aparece la nota no disponible, es considerado en algunos círculos como señal de
poco profesionalismo. Por otro lado, presentar la categoría no disponible es ignorar
que la información faltante, a lo mejor puede ser accesible a través de otros datos
existentes en el cuestionario. Considérese por ejemplo el caso del encuestado que
rehusa dar datos acerca de su ingreso, pero señala que es médico, tiene 20 años de
experiencia, es empleado y ejerce todavía la profesión. Al señalar que la información
no es disponible se ignora que en tales condiciones aunque no se conozca un
ingreso exacto si se sabe que debe ser relativamente alto. Algunos investigadores se
toman el tiempo y el trabajo de presentar los datos en dos versiones, la primera en la
que se tiene la categoría ‘no disponible’ y otra en la que no se cuenta con ella. En
tal caso se debe revisar cuidadosamente si las diferencias encontradas ameritan el
esfuerzo y los recursos invertidos en ello.
3.2.1 Imputación determinista
Se dice que la imputación es determinística cuando un dato señalado para

imputación recibe un único valor posible que se le puede asignar a fin de que
cumplan las reglas de crítica planteadas. Supóngase por ejemplo el caso de tener un
cuestionario en el que se reseñan las ventas mes a mes y falta el dato anual. Si la
regla de crítica establece que el total anual debe ser igual a la suma de los meses,
no hay otra posibilidad más que realizar la suma y asignarle ese valor al dato
faltante.
Otro ejemplo se vio anteriormente cuando la respuesta a la pregunta 2 era que se

trataba de un menor de quince años, y la respuesta a la pregunta 3 tenía respuesta
dos, lo cual era inconsistente, fue marcada para imputación, pero el único valor
asignable es el blanco.

La imputación determinística utiliza únicamente información del mismo registro y por

esa razón se puede realizar dentro del proceso mismo de crítica. Es decir que al
escribir las especificaciones de crítica y encontrar un caso de este tipo no se marca
el dato para una posterior imputación sino que de una vez se asume la acción de
reemplazar el dato por el que debe ser.
3.2.2. Imputación por substitución
La imputación por substitución se puede realizar cuando se cuenta con una base de
datos externa en la que se encuentran los mismos individuos de la encuesta y a la
cual se pueda recurrir cada vez que se tiene un dato faltante o erróneo. La base
externa de datos puede ser un archivo de registros administrativos, una base de
datos de una encuesta anterior en el tiempo. Este método es muy común para
encuestas continuas, por ejemplo mensuales, en las que se indaga sobre el mismo
tópico siempre.
Sea por ejemplo el caso de una encuesta de empleo en hogares en la que durante
seis meses se llega a un mismo hogar a realizar la encuesta. En un mes determinado
y para una persona del hogar la respuesta a la cantidad de horas trabajadas la
semana anterior está sin responder y por lo tanto marcada para imputación. Esta
cantidad de horas puede ser obtenida de la cantidad de horas trabajadas reportadas
el mes anterior por el mismo individuo, máxime si además reporta que no ha
cambiado de empleo; entonces se procede a copiar de la base antigua a la nueva
base.
En una encuesta de opinión al interior de una gran empresa un individuo dejó de

responder la edad, la variable está marcada para imputación. La substitución se
produce cuando a partir del archivo administrativo de personal se extrae el dato
faltante y se copia sobre el archivo de la encuesta.

La dificultad de este tipo de procedimiento radica en encontrar variables e

identificadores que coincidan en los dos archivos y que permitan el traslado de
información de uno a otro lado. No sobra mencionar que se debe poner especial
cuidado en que aunque los nombres de las variables pueden ser el mismo en los dos
archivos, la definición utilizada también lo sea. Recuerde por ejemplo que la variable
salario no tiene igual definición para todos los investigadores.
3.2.3. Imputación basada en estimaciones
Este método implica procesamiento y manipulación de los datos antes de realizar la

imputación. Dicha manipulación se puede realizar sólo con los datos correctos, o con
datos históricos externos. El método puede variar desde lo más simple como por
ejemplo estimar algunos promedios hasta tratar de establecer el grado de relación
entre variables, como por ejemplo la estimación de regresión, todo orientado a
estimar valores a imputar.
Una primera versión de este método puede ser la imputación de acuerdo al promedio
actual. Sea por ejemplo que se extraña el dato sobre el monto del arriendo pagado
en una vivienda. Se calcula entonces el arriendo promedio de las viviendas del
mismo sector y similar tamaño y se asigna este valor promedio al dato por imputar.
En forma similar se puede imputar de acuerdo a la razón existente. Sea por ejemplo
el caso de una encuesta económica en la que se extraña el dato de retención en la
fuente por pagos en salarios, sin embargo se tiene el dato de valor de la nómina se
conoce el subgrupo económico en que se clasifica la empresa, entonces se puede
calcular la relación entre retención y valor de la nómina para las industrias de ese
subgrupo y aplicar esa razón al dato de nomina de la empresa con el dato por
imputar.
Otra manera de hacer imputación es a partir de la estimación de la tendencia.
Suponga en el caso anterior que se cuenta con registros históricos que permiten a
partir de los datos completos de la encuesta determinar la tendencia del monto de la

retención, es decir establecer el comportamiento del dato actual en comparación con

los meses anteriores. Entonces si la empresa con el dato faltante ha reportado
correctamente los meses anteriores basta con aplicar la tendencia encontrada para
estimar el dato a imputar.
La precisión de los valores imputados dependen en gran medida de los niveles de

correlación entre las variables a imputar y las utilizadas para estimar, del grado de
sofisticación de los cálculos matemáticos y a la utilización de toda o de una parte de
los datos de la base. En términos generales las razones y los estimadores de
regresión suelen ser más estables que las estimaciones de simples promedios.
La imputación basada en la estimación es muy frecuente en investigaciones de tipo

económico, particularmente aquellas que se repiten periódicamente. Una desventaja
de este método es que aún después de la imputación pueden persistir situaciones de
inconsistencia, sobre todo si en las reglas de crítica se pide que ciertos valores,
sumas o razones deban presentar relaciones de igualdad. Por tal razón es
recomendable aplicar de nuevo procedimientos de crítica después de realizada la
imputación.
3.2.4 El paquete caliente
La imputación llamada en frío consiste en usar valores o reglas predeterminadas en

los casos de ser necesario imputar el valor de una variable. El valor se obtiene de
una encuesta anterior, de un experto en la temática, de un dato histórico y se trata
simplemente de encontrar el mejor valor adivinado.

En la encuesta de hábitos de fumar no se encuentra la cantidad de cigarros fumados

al día, pero una encuesta de un par de años antes arrojó que en promedio esa
cantidad era igual a quince. Entonces esa cantidad puede ser utilizada para imputar
los datos faltantes o inconsistentes.
En una encuesta de salud a personas se trata de imputar la estatura. Estudios

demográficos recientes señalan que para esa región la estatura promedio de
hombres es 175 cm. y para mujeres 167cm., estos datos pueden ser utilizados para
imputar sin mayores complicaciones.
Con este tipo de imputación no se respetan las distribuciones y las relaciones entre
variables, la magnitud del sesgo es incierta pero se puede aplicar cuando los datos a
imputar son muy pocos y los otros procedimientos de imputación no arrojan
resultados satisfactorios.
3.2.5. Imputaciones en paquete caliente
En la actualidad se conoce como paquete caliente a una serie de métodos que

comparten el mismo principio básico el cual señala que un dato por imputar se
reemplaza por un dato obtenido de los registros de la misma encuesta. Para este tipo
de imputación la base de datos de la encuesta se divide en dos partes, la primera la
que contiene los registros con al menos un dato faltante, inválido o inconsistente y
que se llamará el conjunto de datos errados o de receptores. La segunda parte
contiene todos los registros con datos absolutamente “limpios” y se denomina el
conjunto de donantes. Un registro con un dato faltante pero al que se le hizo
imputación determinística, se le hace la imputación, se considera correcto y
pertenece al conjunto de los donantes.
La idea básica del paquete caliente es que para cada registro del conjunto de los
receptores se encuentre un donante muy similar en el otro conjunto a fin de que el

dato faltante pueda ser reemplazado por el mismo valor que tiene el donante para
esa variable.
Algunos aspectos importantes a considerar al momento de hacer la imputación por

paquete caliente son:
1. Cómo entender la similitud entre donante y receptor?
La similaridad se define en el sentido de que algunas variables muy

relacionadas con la variable a imputar coinciden para los dos individuos. El
proceso comienza por definir las variables que tienen alta correlación con la
variable a imputar, se toman los datos del receptor para esas variables y se
busca un donante con esas mismas características.
2. Se pueden imputar todas las variables necesarias en un receptor a partir de un

mismo donante?
En algún sentido se trata de una situación deseable pues de esta manera se

preservan las relaciones entre variables. En una encuesta de empleo es obvio
que si la ocupación y el ingreso personal deben ser imputados, hay ventajas
al imputarlos de un mismo donante debido al estrecha relación entre esas dos
variables. Sin embargo si se tienen varias variables a ser imputadas se tiene
que buscar donantes similares de acuerdo a variables relacionadas con la
variable a imputar y es muy extraño que las variables que se relacionan con
una, también lo hagan con otra variable. Sin embargo como método de
imputación se aplica a veces el hacer la imputación por grupos de variables a
modo de aprovechar los mismos donantes aunque en forma parcial.
3. Puede un donante ser utilizado para varios receptores ?

Si muchos receptores son imputados a partir de los datos de un mismo donante el

impacto en los estimativos puede ser importante. Vale la pena entonces limitar la
cantidad de veces que un mismo donante es utilizado para imputar y se evita así el
abuso de un mismo dato. Si esta es una ventaja o no, es un debate aún no
concluido. Si la cantidad de respuestas correctas de una determinada región es muy
baja es probable que no se encuentren donantes para determinados tipos de
receptores y entonces se deba relajar un poco las condiciones de similitud.
Si no se establece un límite para la cantidad de veces que un donante sirve para

imputación, el investigador podría al menos contabilizar esta cantidad y cuando
supere una cierta barrera observar detenidamente las características del donante. El
problema se presenta si el donante presenta características de outlier o dato fuera de
serie, caso en el cual los resultados finales pueden ser seriamente distorsionados.
4. Qué hacer cuando no se encuentra un donante idóneo?
Casi siempre sucede que al menos unos pocos receptores no encuentren un donante
idóneo. De hecho sería extraño que en una encuesta compleja un único
procedimiento de imputación fuera suficiente para completar toda la depuración. Para
los casos sin donante se debe entonces especificar otro método de imputación, el
cual se incluye dentro del paquete caliente a fin de tener respuestas completas, por
ejemplo la imputación en frío.
Para datos de tipo categórico es frecuente utilizar o bien un método secuencial de

paquete caliente o uno de selección aleatoria. Para datos de tipo cuantitativo el
método más utilizado es el del vecino más próximo.
Para ilustrar este método, aplicado en el censo de los Estados Unidos, sea por
ejemplo la pregunta sobre el hábito de fumar, la cual tiene tres posibles respuestas:

y se ha decidido que la imputación en caliente se haría basándose en las variables

grupo de edad y sexo, la primera con tres categorías, la segunda con dos:
Grupo de edad
2
15 a 24
3
25 a 44
4
45 ó más
Sexo
1
Masculino
2
Femenino
La imputación secuencial seguiría el siguiente procedimiento:
1. Se crea una matriz de imputación en la que se establecen todas las posibles

combinaciones de las variables de similitud. En el ejemplo se tienen tres categorías
de edad por dos categorías de sexo lo que origina seis combinaciones que
conforman la parte inicial de la matriz de imputación, de la siguiente manera:
Grupo de edad Sexo Valor de imputación

1 1
1 2
2 1
2 2
3 1
3 2
2. Se leen uno a uno los datos del archivo de la encuesta y la matriz de

imputación se va actualizando con datos correctos así por ejemplo si después de
veinte datos la matriz aparece:

Grupo de edad Sexo Valor de imputación

1 1 2
1 2 2
2 1 1
2 2 3
3 1 1
3 2 3
y el 21-avo dato corresponde a una mujer del grupo dos de edad y que es no
fumadora, el dato de la cuarta fila (3) será actualizado por 2 (no ha fumado nunca).
La matriz se ira actualizando consecutivamente a medida que vayan apareciendo
datos correctos.
3. Cuando aparece un valor a ser imputado se toma el valor correspondiente de

la matriz de imputación. De esta manera el receptor tiene el mismo valor que el
donante para todos los campos de similitud e imputación.
4. El procedimiento continua hasta terminar de leer toda la base de datos y

haber realizado el proceso en el que cada dato correcto originó una actualización en
la matriz de imputación y cada dato incorrecto fue imputado a partir de la matriz.
Este método presenta algunas características que vale la pena mencionar:
Si dos registros consecutivos tienen el mismo valor para imputar y tienen las mismas
características de similitud tendrán el mismo donante. Esto puede ser
particularmente peligroso si se considera que los datos errados tienden a estar juntos
por cuanto provienen de una misma región, se deben al pobre trabajo de un
supervisor o simplemente son los últimos datos de la encuesta, los cuales se
recogieron cuando ya el equipo de supervisores y controladores debió ser trasladado
a otra investigación. Como se mencionó anteriormente la reiterada utilización de un
mismo donante puede generar fuertes sesgos en los estimativos del estudio.

En general el orden en el que se encuentran los datos en la base no es propiamente

aleatoria, por el contrario corresponden a un orden geográfico, en forma tal que datos
de una determinada área tiene mucha probabilidad de ser imputados con donantes
de esa área, lo cual significa un mejoramiento de la imputación.
En las encuestas con muchas variables y muchos casos para imputar la cantidad de
matrices de imputación puede ser relativamente alta, lo mismo que el espacio en
memoria del computador. El investigador debe cuidar que sus recursos de hardware
resistan el proceso que se propone iniciar.
Cada matriz de imputación debe inicializarse utilizando valores ad-hoc a fin de evitar
que los primeros registros sean imputados con blanco.
Con este método no es necesario mantener una matriz de imputación, el método

consiste en construir un subgrupo de donantes, los que cumplen con tener los
mismos valores en las variables de similitud y seleccionar entre ellos uno al azar
como donante. Así por ejemplo en el caso anterior si se encuentra una bandera para
imputar los hábitos de fumar, el grupo de edad es 1 (entre 15 y 24 años) y el sexo 1
(masculino) se separan todos los hombres de ese grupo de edad en el grupo de
donantes y se elige uno al azar que será el donante. El valor del hábito de fumar
imputado será entonces el mismo del donante elegido. Este método es utilizado para
las imputaciones del censo y la encuesta mensual de desempleo de Canadá.
En los dos casos anteriores la decisión acerca de las variables de similitud es muy
importante, y ellas deben estar muy relacionadas con la variable a imputar. Es
conveniente evitar la utilización de un campo numérico como variable de similitud,
para evitar el crecimiento desbordado de la matriz de imputación. Normalmente se
codifican las variables numéricas previamente a su utilización como variables de
similitud, de esta manera la matriz vuelve a tamaños normales y la probabilidad de

encontrar una similitud, que con valores continuos era muy pequeña se vuelve
relativamente grande.
Si se utilizan muchas variables como similitud, la cantidad de combinaciones crece

rápidamente y la cantidad de donantes por celda es muy baja en forma tal que se
corre el riesgo de utilizar repetidas veces un donante y de no encontrar donantes
para ciertas imputaciones. En este sentido se puede caminar hacia un compromiso
entre la cantidad de variables de similitud y de ser necesario establecer un criterio de
jerarquía entre ellas. Sea el caso por ejemplo en que se debe imputar el ingreso
personal. Las variables de similitud son:
Escolaridad (Cinco niveles)

Grupo de edad (Cinco niveles)
Sexo (Dos niveles)
Ocupación (25 categorías)
Así se llega a 1250 combinaciones y muy probablemente no habrá donantes para

algunos casos aunque el investigador considera que las cuatro variables son
necesarias. Si luego de un primer intento no se encontró donante para un caso
particular, se podría intentar con las tres últimas variables para las que se tienen 250
= 5 x 2 x 25 combinaciones. Si aún así tampoco se encuentra donante se recurriría a
las 50 combinaciones resultantes de sexo y ocupación, incrementando así la
probabilidad de encontrar donante.
Para las encuestas en las que predominan las variables de tipo cuantitativo no son
aplicables los procedimientos anteriores, por cuanto no es posible definir estas
variables como variables de similitud, de otra parte la categorización de todas las
variables es bastante dispendiosa amen de que sin un estudio detenido no es fácil
establecer por adelantado, rangos de valor útiles y apropiados. La solución es
entonces no buscar el dato que tiene exactamente el mismo valor pero si aquel que

100 Simposio de Estadística
2000
más se le aproxima y que además pertenece a una clase similar en otra variable
importante, por ejemplo el mismo grupo de código industrial. El problema de este
procedimiento radica en establecer lo que se puede denominar la distancia para
determinar cercanía o lejanía, con los subsecuentes problemas derivados de las
unidades de medida que se utilizan en las diferentes variables.
En estos casos se presenta con mucha frecuencia que una vez realizada la
imputación se vuelven a presentar problemas de crítica. Los programas intentan con
el primer donante y revisan si de esta manera se cumplen las reglas de crítica, si no
es el caso se trata con el segundo donante y así sucesivamente hasta llegar a un
punto en el que la imputación no infringe las reglas de crítica o se considera que la
imputación por paquete caliente no es aplicable.
En general un investigador responsable debería hacer llamados de atención en sus

resultados, señalando el impacto y la magnitud de la imputación realizada antes de
producir los cuadros que se entregan. Naturalmente el tamaño de la encuesta y su
presupuesto determinan cuanto se puede hacer en términos de evaluar el impacto de
la imputación. Sin embargo los usuarios deben tener al menos como información
básica al respecto, la proporción de información que proviene de datos originales y la
proporción que proviene de datos modelados o estimados dentro de un proceso de
imputación.
Los puntos más importantes a evaluar acerca de un proceso de imputación son el

sesgo y la varianza en las estimaciones. Si el presupuesto lo permite el investigador
puede detenerse a examinar las diferencias de estimación cuando se incluye y no se
incluyen los valores imputados. Las grandes diferencias deberán entonces ser
analizadas a fin de descartar o encontrar sesgos importantes debidos a la
imputación. Si este procedimiento no es posible, entonces se espera que al menos
se le informe al usuario:
1. La cantidad de registros que fueron objeto de imputación

Simposio de Estadística 2000
101
2. La cantidad de registros donantes

3. La cantidad de veces que cada variable fue imputada y el método utilizado
4. La cantidad de donantes específicos y la cantidad de imputaciones realizadas
con ese grupo
5. La cantidad de intentos hasta lograr una imputación exitosa para cada
receptor
6. La lista de registros utilizados como donantes para cada receptor
7. La lista de receptores en los que los métodos de imputación fallaron
Respecto a la varianza es común tratar a los datos imputados como datos correctos
provenientes de los informantes y aplicar las fórmulas tradicionales de estimación de
la varianza del estimador, este procedimiento conlleva a serías subestimaciones de
la varianza, especialmente si la cantidad de imputaciones es alta.
Bibliografía
Bautista, L. (1998). Diseños de muestreo estadístico. Universidad Nacional de

Colombia Bogotá – Colombia.

102 Simposio de Estadística
2000
Biermer. P.P., Groves. R.M., Lyberg. L.E., Mathiowetz. N., Sudman. S., (1991).
Measurement errors in surveys. John Wiley, New York.
Brick, J.M., Broene, P., James. P., Severynse. J. (1997). A USER’S guide to
WesVarPC. Westat, Inc. Maryland.
Cassel. C-M., Särndal. C-E., Wretman. J. (1993). Foundations of Inference in Survey

Sampling. Krieger Publ. Co. Malabar, Florida.
Chaudhuri, A., Mukerjee, R. (1984). Unbiased estimation of domain parameters in

sampling without replacement. Survey Methodology V. 10 pp 181-185.
Cochran. W., (1977). Sampling Techniques. John Wiley, New York.
Couper, M.P. , Groves, R.M. (1992). The role of the interviewer in survey
participation. Survey Methodology V.18 pp 163-277.
Cox. B., Binder. D., Chinnappa. B.N., Christianson. A., Colledge. M., Kott. P. (1195).
Business Survey Methods John Wiley, New York.
Dey, A., Srivastava, A.K. (1987). A sampling procedure with inclusion probabilities
proportional to size. Survey Methodology V 13 pp 85-92.
Dillman. D. (1978). Mail and Telephone surveys. John Wiley, New York.
Gower, A.R. (1194). Questionnaire Design for Business Surveys. Survey Methodology
V. 20 pp 125-136.
Gray, G.B., Platek, R. (1976). Analysis of design effects and variance components in
multi-stage sample surveys. V. 2 pp 1-30.
Groves. R.M. (1989). Survey errors and survey costs. John Wiley, New Tork.
Groves, R.M., Biemer, P., Lyberg,. L., Massey. J.T., Nicholls II. W., Waksberg. J.,
(1988). Telephone survey methodology. John Wiley, New York
Hidiroglou, M.A. (1986). The construction of a self-Representing Stratum of large

Units in survey Design. JASA, Vol 40 No. 1 pp 27-31
Kish. L., (1967). Survey Sampling. John Wiley, New York.

Labaw. P.J., (1980). Advanced Questionnaire Design. Abt Books, Cambridge,
Massachusetts.
Lavrakas. P.J. (1993). Telephone Survey Methods. SAGE Publications, Newbury

Park.

Simposio de Estadística 2000
103
Särndal, C-E., Swensson, B., Wretman, J. (1992). Model Assisted Survey Sampling.
Springer Verlag, New York.
Särndal, C-E. (1996). Efficient Estimators with simple variance in unequal probability
Sampling. JASA. V. 91 pp 1289-1300
Shao, J., Dongsheng, T. (1995). The Jackknife and Bootstrap. Springer Verlag, New
York.
Skinner. C.J., Holt. D., Smuth. T.M.F. (1989). Analysis of Complex Surveys. John
Wiley , New York.
Swain, L. (1985). Basic principles of questionnaire design. Survey Methodology. V 11

pp 161-170.

T - Cnicas de Dise - o de Encuestas

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

T - Cnicas de Dise - o de Encuestas

Cargado por

Copyright:

Formatos disponibles

Universidad Nacional de Colombia

TÉCNICAS DE DISEÑO DE ENCUESTAS

Leonardo Bautista Sierra

Universidad Nacional de Colombia

San Andrés, Colombia, julio de 2000

1.1 Definiciones básicas

1.1.1 Universo de estudio

El primer aspecto a tratar es el relativo al denominado UNIVERSO DE ESTUDIO, en

Técnicas de diseño de encuestas

económicas, o sociales conducen a lo que se denomina población objetivo. Por

Técnicas de diseño de encuestas

El marco de muestreo se ve finalmente afectado por lo que se podría denominar la

La meta del muestrista es encontrar mecanismos que cierren la brecha entre el

1.1.2 Variables de interés

La segunda definición importante es la referente a las variables de interés. Un

Técnicas de diseño de encuestas

propone refleje lo más cercanamente posible el concepto que el investigador

1.1.3 Parámetros a investigar

Finalmente como última componente previa y necesaria para poder iniciar la

Técnicas de diseño de encuestas

más adelante esta diferencia de objetivos conduce a la diferencia entre el

escrito como ty y se define como: t y  U yk

La variable y puede ser de tipo cuantitativo y el total de interés es entonces el

Un caso particular de repetida aplicación es cuando la variable y cuenta si un

Sea Ud el conjunto de elementos del universo que poseen la característica d en

Técnicas de diseño de encuestas

La cantidad de hogares de la ciudad que consumen un determinado

Desde el punto de vista práctico el parámetro que se estudia en la gran mayoría de

El rendimiento en toneladas por hectárea sembrada en una región de la

Técnicas de diseño de encuestas

La productividad en una empresa en términos de unidades producidas

Técnicas de diseño de encuestas

Algunas veces la razón de estudio recibe un nombre particular.

Un caso especial de RAZÓN es cuando se pregunta por los promedios, sea ya el

En el primer caso se trata de la razón YU 

1.2 Definiciones estadísticas

Técnicas de diseño de encuestas

1.2.1 Muestra probabilística

En teoría de muestreo se parte de un universo finito. Una muestra es el conjunto de

El método de inferencia estadística tiene su sustento teórico en modelos de

1. Se dispone de un marco de muestreo para los objetos a ser seleccionados.

Respecto al marco de muestreo vale la pena hacer los siguientes comentarios: El

Técnicas de diseño de encuestas

posibles de selección. Disponer de la cantidad total de objetos del universo o sólo de

La inferencia estadística planteada por la teoría muestral parte del conocimiento de

La probabilidad de selección o de inclusión de un objeto es lo que permite el paso de

Técnicas de diseño de encuestas

entrevistador se le entrega una pequeña calculadora de bolsillo se le enseña a

Realice el enlistamiento de personas adultas en el hogar, respetando el

Técnicas de diseño de encuestas

1.2.2 Estimador estadístico

Técnicas de diseño de encuestas

La fórmula utilizada para expandir se denominará ESTIMADOR.

El π-estimador utiliza las probabilidades de inclusión, es decir la probabilidad de que

Técnicas de diseño de encuestas

probabilidades de inclusión son difíciles de obtener, pero en cambio las de selección

El tercer estimador principal, pues existen muchos otros de menor uso, es el r

El r-estimador se puede aplicar si se dispone de la información auxiliar necesaria. Su

1.2.3 La calidad del estimador

Técnicas de diseño de encuestas

resultado diferente. Puesto que se trata de un muestreo probabilístico es posible

Técnicas de diseño de encuestas

valor poblacional desconocido. La varianza del estimador es igual a 1403.33.