Está en la página 1de 80

Diseo de Cuestionario 1

Diseo de Cuestionario 2

CONTENIDO

CAPITULO I...........................................................................................................3

PRESENTACION Y OBJETIVOS DEL MDULO.................................................2


1 INTRODUCCIN AL DISEO DE CUESTIONARIOS.........3
2 DISEO DEL CUESTIONARIO............................................7
3 DISEO DE PREGUNTAS.................................................10
4 . PRUEBA DE LOS CUESTIONARIOS..............................23
5 . METODOS FORMALES DE PRUEBA.............................27
6 . DELIMITACIN DE BLOQUES........................................33

CAPITULO II........................................................................................................38
1. PRESENTACION Y OBJETIVOS DEL MDULO...........................................39
2. INTRODUCCIN A LA CRTICA ESTADSTICA.............................................40
3. LA CRTICA ESTADSTICA EN LAS ETAPAS DE LA ENCUESTA................46
4. TIPOS DE CRTICA AUTOMTICA................................................................50
5. INTRODUCCIN A LA IMPUTACIN ESTADSTICA...................................59
6. MTODOS DE IMPUTACIN ESTADSTICA.................................................65
7. MTODOS DE PAQUETE CALIENTE............................................................71
8. EVALUACIN DE LOS PROCEDIMIENTOS DE IMPUTACIN....................77
Diseo de Cuestionario 3

CAPITULO I

DISEO DE CUESTIONARIOS
Diseo de Cuestionario 4

PRESENTACION Y OBJETIVOS DEL MDULO

Los cuestionarios o formularios se han convertido, para muchos investigadores, en


una de las herramientas ms utilizadas para la recoleccin de la informacin sobre un
fenmeno que se quiere estudiar. Existe una gran variedad de cuestionarios
dependiendo del propsito, forma de aplicacin o diseo que se utilice en la Encuesta
o Investigacin. El diseo del formulario incide decisivamente en la calidad de la
informacin y en la imagen que la organizacin encuestadora proyecta ante el
pblico.

A lo largo de este mdulo se har nfasis en las definiciones, principios y


recomendaciones para disear un cuestionario as como las pruebas que se deben
realizar antes de salir a ejecucin.

OBJETIVO GENERAL

Al finalizar este mdulo, el participante estar en capacidad de disear un


cuestionario utilizando los fundamentos adecuados y de acuerdo a los requerimientos
del cliente y objetivos de la investigacin.

OBJETIVOS ESPECIFICOS

Que el participante:

Adquiera los conocimientos bsicos para el diseo de cuestionarios


Conozca los nuevos desarrollos en diseo de cuestionarios
Identifique las pautas para la redaccin de preguntas
Diseo de Cuestionario 5

1 INTRODUCCIN AL DISEO DE CUESTIONARIOS

Antes de puntualizar el tema del diseo de cuestionarios, es determinante manejar


las definiciones bsicas que permitirn un manejo adecuado de la temtica. En este
captulo se describen las definiciones relacionadas con el diseo de cuestionarios.

1.1 DEFINICIN DE CUESTIONARIO


Un cuestionario o formulario es, por definicin, un instrumento de
recopilacin de datos, adecuadamente estandarizado, que traduce de
manera concreta los objetivos de la investigacin.
Usualmente est conformado por una serie de preguntas diseadas y
organizadas para obtener informacin acerca de un sujeto o un tpico a
travs de un informante o entrevistado.

1.2 TIPOS DE CUESTIONARIO


Los cuestionarios se pueden clasificar de acuerdo con la naturaleza del contenido.
De esta forma se pueden encontrar cuestionarios de:

Caractersticas, hechos o acontecimientos: hacen referencia a caractersticas o


acontecimientos relacionados con las personas y los hogares. Ej. Tipo de
vivienda, edad, sexo, nivel educativo, cantidad de miembros del hogar, ingresos del
hogar etc.

Carcter empresarial o institucional: estn relacionados con actividades o


acontecimientos de las empresas o instituciones. Ej. Antigedad, produccin,
ventas, costos, etc.

De opinin: se refieren a la opinin del entrevistador en temas: polticos,


religiosos, personal, institucional, etc.; o sobre actitudes que las personas asumen
Diseo de Cuestionario 6

o asumiran ante una situacin determinada. Ej. encuestas de hbitos, manejo del
tiempo, preferencias electorales, etc.

De conocimientos: busca medir el nivel de conocimiento en determinados temas.


Ej. En qu ao se realizaron los olmpicos en Los ngeles?
Aunque es comn encontrar diferentes tipos de contenidos en un mismo cuestionario,
en general no es recomendable mezclar, es preferible hacer cuestionarios
especializados.

1.3 CARACTERSTICAS BASICAS DE LOS CUESTIONARIOS


Sin importar la metodologa utilizada en el diseo de un cuestionario, se deben tener
en cuenta algunos aspectos generales como:

Utilizar un vocabulario adecuado (sencillo, claro, coherente), entendible


para la mayora de los usuarios
Evitar preguntas innecesarias, estableciendo flujos adecuados
Plantear preguntas centradas tanto en el tema principal como en los
secundarios
Evitar preguntas muy largas, con las cuales se pierda su objetivo principal.
Elaborar captulos relacionados diferencindolos unos de otros, con
objetivos claros y precisos
Evitar un cuestionario tan largo que ocasione cansancio en los
encuestados

Es importante reconocer que no existe un nico diseo ptimo de un


cuestionario, pero se puede concertar un instrumento que satisfaga los
requerimientos de informacin y que vincule pautas para una Encuesta exitosa.

Cuando se disea un cuestionario es importante tener en mente los objetivos de


la encuesta, las necesidades de informacin y la forma como sta va a ser
recogida y procesada. Las preguntas deben estar relacionadas con la informacin
requerida y plantearse al informante idneo en el tiempo y el lugar adecuados.
Diseo de Cuestionario 7

El mtodo de recoleccin de informacin, por ejemplo, si el cuestionario va a ser


contestado directamente por el entrevistado, o por telfono o con dispositivos mviles
de captura, va a determinar aspectos como: forma de ser abordada la pregunta, el
rendimiento relativo y el costo.

Sin importar el tipo de cuestionario que se desee implementar, es necesario cumplir


unos pasos previos que llevan organizadamente al desarrollo del instrumento.

1.4 PASOS PREVIOS AL DESARROLLO DEL CUESTIONARIO


Antes de disear el cuestionario el grupo de investigadores debe tomar una serie de
decisiones, que van a afectar el plan de desarrollo de la encuesta. Dicho plan debe
contener los siguientes aspectos:

Objetivos de la encuesta y requerimientos de informacin.


Plan de anlisis.
Poblacin de la encuesta.
Mtodo de recoleccin de la informacin.
Tamao de la encuesta.
Plan para el procesamiento de la informacin.
Presupuesto.
Cronograma de Trabajo.
Ensayos del cuestionario.

Un cuestionario bien diseado permitir la recoleccin de informacin en forma


eficiente y con el mnimo de errores. Adicionalmente facilita la codificacin y captura
de los datos. Un buen diseo deber reducir la cantidad de crtica y de
imputacin requeridas.
Diseo de Cuestionario 8

1.5 DESARROLLO DEL CUESTIONARIO


El desarrollo del cuestionario comprende los siguientes aspectos:

Definicin de los objetivos y las necesidades de informacin.


Consulta con los usuarios de la informacin.
Revisin de cuestionarios precedentes que traten el mismo tema.
Grupos focales (objetivos, temtica, conceptos)
Borrador de preguntas.
Aplicacin de tcnicas cognoscitivas.
Revisin del cuestionario y de las preguntas.
Prueba del cuestionario.
Formato y edicin del cuestionario.

1.6 CONSIDERACIONES RELACIONADAS CON EL DISEO DE LAS


PREGUNTAS

Objetivos, necesidades de informacin y plan de anlisis


Mtodos de recoleccin de informacin
Disponibilidad de la informacin
Complejidad de la informacin a ser recolectada
Confidencialidad de la informacin
Comparabilidad de los datos con otras encuestas
Confiabilidad de los datos
No respuesta
Procesamiento de la informacin
Diseo de Cuestionario 9

2 DISEO DEL CUESTIONARIO

El diseo del cuestionario es parte fundamental en el desarrollo de una Encuesta, y


se relaciona directamente con el desarrollo de las diferentes etapas de la
investigacin.

Un cuestionario bien diseado y una prueba del mismo, permitirn la recoleccin de


informacin eficiente y con el mnimo de errores.

Es importante considerar que el diseo depender del tipo de cuestionarios que se


decida utilizar. Pueden ser diseados en papel, medio magntico o en Dispositivos
Mviles de Captura (DMC), dependiendo de los objetivos y recursos de la
investigacin. Si bien los DMC acortan el tiempo en validacin, se hace
indispensable considerar un tiempo prudente para desarrollar pruebas que aseguren
el funcionamiento adecuado del dispositivo en campo.

2.1 DESARROLLO DEL CUESTIONARIO

El desarrollo del cuestionario comprende los siguientes aspectos:

Defina la especificacin de las necesidades de informacin (objetivos) y plan


de anlisis. Se debe contar con un documento donde estn enunciados
claramente los objetivos 1 de la encuesta y las variables a medir. Es necesario
establecer la pertinencia de cada pregunta, determinando si estn diseadas para
cumplir con las necesidades de informacin.

Consulta con el usuario final de la informacin. Un apoyo fundamental en la


sincronizacin de objetivos y diseo de cuestionario es la asesora de los expertos
en la temtica de la encuesta que se va a implementar. Esta retroalimentacin
garantiza que se tenga una plataforma clara para el diseo del cuestionario.
Revisin de cuestionarios precedentes. Un punto de partida para la formulacin
de preguntas es la revisin de cuestionarios que se hayan utilizado en anteriores
encuestas sobre un tema igual o similar.

1
Estos requerimientos se encuentran plasmados en los cuadros de salida de la Encuesta
Diseo de Cuestionario 10

Utilizacin de Grupos Focales. En etapas iniciales del diseo del cuestionario,


los grupos focales 2 permiten: precisar los objetivos de la encuesta y las
necesidades de informacin, identificando los principales tpicos de la
investigacin y aclarando definiciones y conceptos. En cuestionarios preliminares,
estos grupos son tiles para probar y evaluar el diseo, estableciendo si el
lenguaje y la redaccin son adecuados, as como las instrucciones del formulario.

El cuestionario debe ser amigable tanto para el entrevistador


como para el entrevistado

2.1 ESTRUCTURA DEL CUESTIONARIO


El contenido de un cuestionario variar de acuerdo con la temtica de la investigacin
y con la poblacin objetivo. Una estructuracin adecuada del cuestionario facilita la
generacin de controles de calidad sobre el mismo. Es importante que corresponda a
la temtica propuesta y que estructuralmente facilite la recoleccin.

La estructura general de un cuestionario se presenta a continuacin.


Seccin Contenido
Encabezamiento Nombre de la entidad Nombre de la encuesta
Fecha de realizacin

Identificacin Nmero de Formulario


Control de calidad del cuestionario
Departamento, municipio
No. Unidades geogrficas de muestreo: estrato, sector, UPM, etc.
No. Unidad Entrevistada: hogar, vivienda, empresa, etc.
Direccin y telfono. (de ser necesario)
Presentacin Objetivos de la encuesta
Confidencialidad
2
Grupo focal es una reunin de personas pertenecientes a la poblacin objetivo, que con la orientacin de un moderador
discute
sobre un tema especfico para obtener informacin sobre: actitudes, opiniones, intereses, experiencias y sugerencias
de los participantes.
Diseo de Cuestionario 11

Quin la realiza y para quin

Temas Secciones numeradas correspondientes a los diferentes temas


Preguntas de cada tema numeradas
Definiciones (de ser necesario)
Instrucciones de diligenciamiento
Flujos
Respuestas precodificadas con sus respectivas celdas de captura.
Campos para las diferentes opciones de respuesta

Terminaciones Agradecimientos
Informacin sobre resultados

A continuacin se muestran algunas alternativas para terminacin de cuestionario:

Gracias por Gracias por su


Atendernos Cooperacin

Gracias por su cooperacin


por favor devuelva este cuestionario hoy

Por favor doble este cuestionario y envelo en un sobre estampillado por correo,
a la direccin indicada tan pronto como le sea posible.

Si quiere un resumen de los resultados del estudio indquelo en la tarjeta.


Antes de enviar este cuestionario, asegrese que todas las preguntas hayan sido
respondidas

Gracias por su cooperacin!!


Diseo de Cuestionario 12

3 DISEO DE PREGUNTAS

La redaccin de las preguntas debe ser clara y stas deben seguir una secuencia
lgica. Las preguntas deben ser diseadas para facilitar su comprensin y permitir
una respuesta precisa por parte de los entrevistados. La informacin obtenida debe
ser til para el anlisis.

3.1 TIPOS DE PREGUNTAS EN LOS CUESTIONARIOS


El tipo de preguntas a incluir debe tener en cuenta los objetivos de la investigacin .
De manera genrica las preguntas pueden ser Abiertas o Cerradas.

Preguntas Abiertas: en este tipo de preguntas, el entrevistado puede


responder libremente. No existen categoras de respuesta
predeterminadas.
Ejemplos:
Cules son las principales razones por las que Qu hace en este trabajo? (Describa en
usted decidi seguir un programa de gimnasia? forma detallada)

1._________________________________ ___________________________________
2._________________________________ ___________________________________

Incluyendo sala comedor, de cuntos cuartos dispone este hogar? |_|_|

En general se pueden presentar tres versiones de respuesta para las


preguntas abiertas:
La proporcionada por el encuestado
Lo que entiende y registra el entrevistador
Lo que interpreta el investigador
Diseo de Cuestionario 13

Preguntas Cerradas: son aquellas en las que las respuestas estn


precodificadas. El entrevistado debe escoger entre una o varias de
las opciones sealadas.

Ejemplos:
1. Usted ha vivido alguna vez en una ciudad 6. Con cuales de los siguientes
con ms de 10.000 habitantes? servicios cuenta su vivienda:

TIPOS DE PREGUNTAS CERRADAS:


Dos Opciones: Las ms comunes son las preguntas cuya respuesta es: S o No. En
este tipo se incluyen las que contienen una tercera opcin: No sabe o no responde, ya
que sta puede ser explcita o implcita.

Preguntas de Eleccin Mltiple. Dentro de estas preguntas se incluyen todas


aquellas que contienen tres o ms opciones de respuesta y se clasifican de acuerdo
con su categorizacin.

Lista de Opciones. En este tipo de Ejemplo:


preguntas no hay opciones En los ltimos tres aos, Usted piensa que ha
excluyentes ni prioritarias. Se da una perdido una promocin por cualquiera de las
lista de opciones posibles para que siguientes razones? (Marque todas las que
el entrevistado escoja todas apliquen)
aquellas que apliquen.
Diseo de Cuestionario 14

Rangos de Prioridad. En este tipo Ejemplo:


de preguntas, el entrevistado debe Esta es una lista de medios que las personas
hacer un ordenamiento o utilizan para encontrar trabajo. Por favor
priorizacin de las diferentes ordnelas de acuerdo con su efectividad,
opciones dadas. escribiendo 1 al lado de la que Usted
considere la ms til, 2 al lado de la
segunda ms til y as sucesivamente.

Preguntas con Formatos de Ejemplo:


clasificacin. Incluyen escalas de Qu tan satisfecho est usted con su actual
clasificacin o calificacin. El trabajo?
entrevistado debe calificar una Muy satisfecho 4
Satisfecho 3
opcin de acuerdo con una escala Insatisfecho 2
Muy insatisfecho 1
dada.

Ejemplos del uso inapropiado de preguntas con escala:

56. El accidente ocurri o no ocurri en Colombia?

Definitivamente no ocurri Definitivamente ocurri en


en Colombia 1 2 3 4 5 Colombia

Este tipo de pregunta no aplica para preguntas en escala


Diseo de Cuestionario 15

Preguntas Cerradas con Opcin Ejemplo:


Otro, especifique Adems del espaol qu otro(s) idioma(s) habla?
Para estas preguntas se deja la (Marque las opciones que apliquen)

posibilidad de especificar OTRO,


Ingls 1
obteniendo un componente de Francs 1

pregunta abierta. Otro 1


Cul?

Generalmente de acuerdo con la frecuencia de respuestas se codifica esta pregunta.

Preguntas Semi-Abiertas Se Ejemplo:


diferencian de las preguntas Las siguientes preguntas estn relacionadas con la
cerradas con OTRO porque no se salud del corazn. En su opinin, cules son las

leen las diferentes opciones, sino principales causas de enfermedad del corazn?
(Marque todas las que apliquen).
que se permite al entrevistado
responder libremente.

Este tipo de preguntas requiere


encuestadores experimentados que
orienten apropiadamente al
entrevistado para que la pregunta
no se vuelva totalmente abierta
pero al mismo tiempo no se sesgue
la respuesta.
Diseo de Cuestionario 16

VENTAJAS Y DESVENTAJAS POR TIPO DE PREGUNTA

Preguntas Abiertas:
Para Ventajas Retos
Entrevistad - Permiten realizar investigacin - Son ms exigentes
o cualitativa, obteniendo respuestas - Consumen mayor tiempo.
- Dificultan el registro de la totalidad
espontneas.
Investigador de la respuesta.
- Dan la oportunidad para expresarse
- El entrevistador registra lo que,
libremente o elaborar la respuesta.
segn su criterio, es importante.
- Permiten obtener datos numricos
- Requieren que el investigador
exactos.
interprete, analice y codifique el texto
escrito por el entrevistador.

NOTA: En DMC existe un lmite de


caracteres para relacionar las
respuestas.

Preguntas Cerradas:
Para Ventajas Retos
Entrevistad - Fciles de contestar Se puede obtener una respuesta
o - Rpidas de contestar sin que exista conocimiento u
- Fciles de codificar y analizar
opinin al respecto.
Investigador - Ms econmicas en recursos
Se puede simplificar demasiado
- Consistentes con las categoras de
un aspecto.
respuesta.
Puede forzar una respuesta.

Se pueden volver montonas


para el entrevistado

3.2. CONSIDERACIONES PARA LA REDACCIN DE LAS PREGUNTAS


Como se anot anteriormente para el diseo del cuestionario es importante tener
claramente identificados: (i) Los objetivos (necesidades de informacin); (ii) La forma
como se va a recoger y procesar la informacin. La metodologa seleccionada
impacta en aspectos como, la complejidad, confidencialidad de la temtica y en la
capacitacin al personal involucrado en la investigacin.
Diseo de Cuestionario 17

Los anteriores aspectos permiten que el diseo de las preguntas est relacionado con
la informacin requerida y orientadas a la poblacin objetivo en el tiempo y lugar
correctos.

Sin embargo la redaccin de las preguntas tiene un papel fundamental en el xito


de la aplicacin del cuestionario. Entonces es importante entender el proceso de
respuesta, ya que permite ampliar el panorama en la determinacin de las preguntas
del cuestionario.

El proceso de respuesta comprende cuatro procesos diferentes: Comprensin,


Recordacin, Reflexin/juicio y Comunicacin de la respuesta. En ese orden de
ideas los entrevistados deben, primero entender la pregunta, recordarla para
buscar la respuesta y una vez han recordado la informacin deben pensar acerca
de cul es la respuesta correcta y qu tanta informacin estn dispuestos a
suministrar. Slo despus de esto el entrevistado se comunica y responde la
pregunta.

Teniendo claro el proceso de respuesta, es necesario asegurar que los cuatro


subprocesos, antes mencionados, se den de manera adecuada. En las encuestas de
negocios o de instituciones, se involucra la consulta de archivos o registros; en este
caso los entrevistados normalmente deben buscar una o ms fuentes de informacin
externa, como registros financieros o administrativos. El entrevistador debe tener en
cuenta que estas consultas externas hacen ms compleja la tarea de entrevista.

Luego de las consideraciones preliminares, existen algunos lineamientos generales


que pueden tenerse en cuenta cuando se empiezan a redactar las preguntas del
cuestionario:

La redaccin debe ser clara y concisa. Las palabras deben ser de


uso comn, para que sean fcilmente entendibles.

Evitar el uso de siglas o palabras poco usadas cuyo significado no es


conocido comnmente.
Diseo de Cuestionario 18

Se debe hacer UNA SOLA pregunta a la vez.

En el prembulo de la pregunta, se debe evitar la inclusin de


afirmaciones o negaciones generales con las que la mayora de la gente est
de acuerdo o en desacuerdo, ya que esto sesgar la respuesta.

Para evitar sesgos, es recomendable evitar la inclusin de respuestas


o parte de ellas dentro de una pregunta.

Las opciones de respuesta de las preguntas deben ser excluyentes y


exhaustivas, de tal forma que contemplen todas las posibilidades.

Para las preguntas que incluyen unidades de medida que pueden


variar de una regin a otra o de un entrevistado a otro, es necesario contar
con las equivalencias e identificar a cul medida corresponde la respuesta.

Al terminar el cuestionario preliminar, el grupo temtico debe hacerse algunas


preguntas que le permitan establecer la validez del diseo:

Las palabras utilizadas son simples, directas y con trminos familiares


para todos los entrevistados?

Las preguntas son claras y especficas?

Las preguntas se pueden aplicar a todos los encuestados?

Alguna de las preguntas tienen doble sentido o abarcan dos tpicos


simultneamente?

Algunas de las preguntas estn dirigidas o sesgadas?

Son las categoras de respuesta, mutuamente excluyentes y


contemplan todas las posibilidades?

Cuando se utilizan cifras numricas, se permite a los encuestados


responder de una manera natural y cmoda?

Al leer las preguntas estn formuladas claramente?


Diseo de Cuestionario 19

Ejemplos: Las siguientes preguntas estn bien o mal formuladas?


Hay personas que dedican parte de su tiempo y habilidades a varios grupos y
organizaciones. Es difcil recordar todas las cosas que uno puede haber hecho
durante un ao. Dgame especficamente....

SI N
O
A. El ao pasado (desde el 1 de enero de 2007 hasta el 31 de diciembre de 2007) 01 02

realiz usted alguna campaa, o solicitud de fondos como trabajador voluntario?


B. El ao pasado fue usted miembro de alguna junta o comit, sin 01 02

remuneracin?
C. El ao pasado usted dio informacin o ayuda para educar o influenciar la 01 02

opinin pblica a nombre de una organizacin?


D. Usted ayud a organizar o supervisar actividades o eventos en nombre de 01 02

una organizacin?
E. El ao pasado realiz usted alguna consulta, trabajo ejecutivo, de oficina o 01 02

administrativo como voluntario?


F. Trabaj usted como profesor o instructor voluntario en una organizacin? 01 02

Unidades de Medida
Cunto mide su finca? ____________________
120 Hectreas
121 Fanegadas

Factores de conversin: 1 hectrea = 1,56 fanegadas


1 fanegada = 0.64 hectreas

Proteccin cuando se toma el sol


Las siguientes preguntas hacen referencia a los ltimos 12 meses. Nos gustara conocer
acerca de las ocasiones en las que estuvo en el sol por ms de 20 minutos.

Con qu frecuencia usted.......


(a) ...us un sombrero para protegerse del sol?
O Rara vez o nunca
O Algunas veces
O Usualmente o siempre
(b) ...us prendas como blusas de manga larga o pantalones,
O Rara vez o nunca
especficamente para protegerse del sol?
O Algunas veces
O Usualmente o siempre
Diseo de Cuestionario 20

(c) ...us cremas con factor de proteccin solar (SPF) de 15 o


O Rara vez o nunca
ms?
O Algunas veces
O Usualmente o siempre

Tiene esta vivienda un sistema de pozo sptico?


1 O Si
2 O No Pase a la seccin D

Cuando fue la ltima vez que el sistema de pozo sptico fue limpiado?
1 O Hace menos de 3 aos
2 O De 3 a 5 aos
3 O Hace ms de 5 aos
4 O Nunca
5 O No sabe

El cuestionario debe ser redactado en la forma ms amigable posible, de


modo que sea fcil de leer y entender.

A continuacin se presentan algunos de los errores ms frecuentes en la


formulacin de preguntas:

Error Ejemplo
Falta de claridad Est usted afiliado a una EPS?
Falta de precisin Sabe usted de la encuesta que se realiz recientemente?
o especificidad
Redaccin Cmo califica usted la utilidad de suministrar informacin acerca de
confusa y extensa aspectos psicolgicos y sociolgicos de la transicin tales como el acceso
a programas interactivos computarizados de consejera vocacional
ofrecidos por la oficina departamental regional para empleados retirados
seleccionados por el personal de la oficina regional?
Preguntas dobles Planea usted dejar su carro en su casa y tomar el bus para ir a su trabajo
el ao que viene?
Cul fue el lenguaje que usted primero aprendi en su niez y todava
entiende?
Preguntas que Me gustara conocer su opinin sobre el turismo en el municipio de Piedra Alta. Por favor indique
si est usted de acuerdo, en desacuerdo o no tiene ninguna opinin acerca de la siguiente
originan sesgos
afirmacin: El turismo favorece al municipio de Piedra Alta y por lo tanto debe ser promovido.
Diseo de Cuestionario 21

No lea las categoras de respuesta al entrevistado.


Marque slo una opcin. Si ms de una razn es dada, pregunte por la principal
Preguntas que no Cul de las siguientes opciones describe mejor su oficio o labor?
son mutuamente (Marque una sola opcin)
excluyentes ni Profesional
1
exhaustivas. Maestro 2
Hombre o mujer de negocios 3
Empleado departamental 4
Estudiante 5
Diseo de Cuestionario 22

3.3. CONSIDERACIONES PARA LA SECUENCIA Y DISTRIBUCIN DE LAS


PREGUNTAS
La distribucin y secuencia de las preguntas es de gran importancia para el diseo de
cuestionarios, ya que se ha comprobado que inciden directamente en la claridad y en
la agilidad de la entrevista.

Un cuestionario debe tener una organizacin temtica y las preguntas


presentarse dentro de una secuencia lgica

En primer lugar se deben ordenar los temas a tratar, partiendo de los ms generales,
hasta llegar a los ms especficos. Estos temas generan menos resistencia en las
personas y sirven para romper el hielo.

Las preguntas que generan prevenciones o resistencias en la gente por


considerarlas demasiado personales, deben estar ubicadas despus de
preguntas o tpicos de carcter general que hayan permitido romper el hielo.
Las respuestas pre-codificadas deben tener un orden secuencial lgico que
facilite tanto la lectura como la comprensin.
La lectura de las preguntas debe ser fluida, tener un orden lgico e ir de lo
general a lo particular.
Los saltos o flujos en las preguntas deben tener un orden secuencial de tal
forma que una vez realizado un salto, el entrevistador no se tenga que
devolver a hacer preguntas adicionales. Los pases deben estar claramente
especificados para evitar confusiones.
Los temas de una encuesta deben tener una secuencia lgica por captulos.

En algunos casos las encuestas incluyen grficos o reproducciones fotogrficas a


manera de instrucciones o respuestas pre-codificadas, cuando se trata de temas
especializados muy difciles de describir verbalmente. Se debe incluir un final amable
donde se agradezca la colaboracin prestada y si es de inters de los entrevistados
informacin referente acerca de donde pueden consultar los resultados del estudio.
Diseo de Cuestionario 23

Ejemplo: Mala distribucin temtica.


Diseo de Cuestionario 24

,
Diseo de Cuestionario 25

Qu errores tiene el siguiente cuestionario?

Encuesta sobre caractersticas de los hogares

Nombre_________________________________ Telfono no.________________

1. Cul es su ingreso? 2. En qu tipo de vivienda vive usted?

_____ $ 5.000 - $ 9.999 _____ $ 30.500 - $ 40.000 Unifamiliar Apartamento


_____ $ 10.000 - $ 19.999 _____ $ 40.000 - $ 50.000
_____ $ 20.000 - $ 30.000 _____ $ 50.000 y ms Bifamiliar Casa mvil

3. Cuntos cuartos tiene esta vivienda? 4. Cundo fue construida su vivienda?

1 _____ 2 _____ 3_____ 4 _____ 5 _____ 6 o ms


_____

5. Qu fuente de energa usa usted para 6. Cul es el rea de su vivienda?


cocinar? Menos de 30 metros _____
31 a 40 metros _____
41 a 50 metros _____
51 a 70 metros _____
Petrleo Gas
71 a 90 metros _____
Electricidad Lea 91 a 110 metros _____
110 a 140 metros _____
Ms de 140 metros _____
7. Cuntas personas viven en esta vivienda? 8. Usted piensa renovar su casa y cambiar a otro
medio de cocinar?

_____ Si _____ No
9. Usted tiene alguno de los siguientes aparatos?
_____ televisin _____ VHS
_____ equipo de sonido _____ computador personal
_____ aire acondicionado _____ lavadora de platos
Diseo de Cuestionario 26

4 . PRUEBA DE LOS CUESTIONARIOS3


Las pruebas representan un paso fundamental en el diseo del formulario, permiten
detectar y corregir problemas en la versin preliminar, llevando a optimizar el
instrumento de recoleccin. La metodologa usada para la prueba debe ser sencilla
hacindola prctica y econmica, permitiendo estar al alcance de toda investigacin.

4.1. OBJETIVOS DE LAS PRUEBAS

Identificar preguntas mal redactadas u ordenadas errneamente


Establecer errores en la organizacin del cuestionario o en las instrucciones
Establecer correctamente los flujos por secciones
Determinar problemas causados por el tamao (extensin) del cuestionario
Identificar adecuadamente problemas generados por la falta de informacin de
los entrevistados para responder o en su falta de voluntad para hacerlo
Evaluar la posibilidad de utilizar un concepto especfico en el cuestionario.
Determinar si las preguntas formuladas conducen a respuestas
correspondientes con los objetivos.
Sugerir preguntas adicionales o categoras de respuestas que pueden ser pre-
codificadas en el cuestionario.
Las pruebas pueden suministrar informacin pertinente para el diseo final del
cuestionario, por ejemplo una indicacin aproximada de la duracin de la
entrevista y las causas de rechazo.

4.2. MTODOS COGNOSCITIVOS EN LA PRUEBA DE CUESTIONARIOS


Los mtodos cognoscitivos permiten comprobar si los entrevistados entendieron o no
el significado de las preguntas; validndolas e identificando potenciales fuentes de
errores de medicin.

Esta prueba es esencial para desarrollar cuestionarios que recolecten informacin til.
El siguiente cuadro muestra los aspectos incluidos en los Mtodos Cognoscitivos.

3
Basado en el documento Informal Testing as a Means of Questionnaire Development de Dawn D. Nelson (U.S. Bureau
of Census, Demographic Surveys Division) en el Journal of Official Statistics de Suecia (Vol.1, No2, 1985, pp 179-188)
Diseo de Cuestionario 27

Observacin de los Se observan aspectos como:


entrevistados La forma como se lee, la secuencia en la cual las
La observacin suministra preguntas son respondidas, referencias hechas a las
informacin acerca del instrucciones, tipos de registros o personas consultadas,
comportamiento de los el tiempo requerido para diligenciar las diferentes
entrevistados frente al secciones y las correcciones o cambios hechos a las
cuestionario. respuestas.

Entrevistas pensando en
voz alta Este tipo de entrevistas ayudan a identificar las reas en
A los entrevistados se les las cuales los encuestados tienen problemas y a
solicita comentar cada una de entender el proceso a travs del cual el cuestionario es
las preguntas mientras las diligenciado.
responden. Adicionalmente se
pide que se explique cmo fue
escogida la respuesta final.

Grupos focales
Se utilizan para evaluar la El moderador revisa el cuestionario con los participantes
comprensin del lenguaje y la y discute cualquier dificultad en el diligenciamiento del
redaccin empleada en el formulario. Los grupos focales sirven especialmente
cuestionario y en las para obtener recomendaciones y sugerencias acerca de
instrucciones. cmo puede ser mejorado el cuestionario.

Parfrasis
Se les solicita a los Ayuda a determinar si los entrevistados han ledo y
encuestados que repitan las entendido las preguntas e instrucciones correctamente.
instrucciones o preguntas
usando sus propias palabras, o
que expliquen el significado de
trminos y conceptos.

Medida de Confianza
Los entrevistados califican el Esta tcnica indica en qu medida los entrevistados han
grado de confianza que ellos tenido dificultad en formular una respuesta a una
tienen en la precisin de sus pregunta y si estuvieron adivinando o no.
respuestas.

Sesiones de informacin por


Diseo de Cuestionario 28

parte de los encuestadores Los entrevistadores pueden identificar importantes


Por lo general estas sesiones problemas en reas en las cuales se puede mejorar el
se realizan conjuntamente con cuestionario.
una prueba preliminar.

Registros de Ayudan a detectar problemas como:


comportamiento Fallas del encuestador en leer la pregunta o la forma
Si la entrevista es grabada al como ha sido redactada.
tiempo con la prueba,
posteriormente se analiza la
interaccin entre entrevistador
y entrevistado.

4.3. SELECCIN DE LA MUESTRA PARA LA PRUEBA


El tamao de la muestra para la prueba preliminar del cuestionario puede variar de
acuerdo con las caractersticas particulares de la Encuesta.

Si el principal propsito de la prueba es detectar problemas de redaccin o de


orden secuencial, slo se requerir un nmero pequeo de entrevistas.
Si lo que se quiere es determinar categoras de respuesta pre-codificadas a
preguntas abiertas contenidas en la prueba, se requerir un nmero mayor de
entrevistas (de 50 a 100).
Un mayor nmero de entrevistas se necesitar si los resultados van a ser usados
para seleccionar tems para incluir en escalas de actitudes.

Nota.
Los entrevistados generalmente se seleccionan de acuerdo con el propsito que se
persigue y no al azar.
La conveniencia y el bajo costo son usualmente los factores que determinan el sitio
de realizacin de la prueba preliminar.
El cuestionario deber ser administrado de la misma forma como se planea hacer
la encuesta real, es decir, personalmente, con DMC, por telfono, etc.

La prueba preliminar slo indica si hay algn problema. Sin investigacin


adicional, no identifica el porqu del problema ni el procedimiento de
correccin
Diseo de Cuestionario 29

5 . METODOS FORMALES DE PRUEBA

Estn diseados para realizar una evaluacin estadstica de la funcionalidad del


cuestionario. Dentro de estos mtodos se encuentran: los Estudios Piloto y las
Pruebas Muestrales divididas.

Estudios piloto: permiten Replica el diseo definitivo de La Encuesta en pequea


observar el funcionamiento escala, incluyendo el plan para el procesamiento y anlisis de
conjunto de todas las la informacin.
operaciones, incluyendo la
administracin del Permite al investigador ver cmo funciona el formulario en
cuestionario. relacin con las dems fases de la encuesta. Normalmente el
cuestionario es minuciosamente probado antes que se lleve a
Un estudio piloto es un cabo un ensayo piloto.
"ensayo general".

Muestra dividida: busca Incluye un diseo de muestra experimental, el cual es


determinar "la mejor" de incorporado en el proceso de recoleccin de informacin.
dos o ms versiones
alternativas del En un diseo de muestra dividida, las versiones del
cuestionario. cuestionario se aplican cada uno en la mitad de la muestra;
de esta manera se determina cul es la opcin ms adecuada
para el estudio.

5.1 REVISIN DEL CUESTIONARIO


Es conveniente que el cuestionario elaborado sea revisado por personas que no
estn directamente involucradas en el proyecto. Los revisores pueden ser expertos
en la temtica de la encuesta o personas con experiencia en diseo de cuestionarios.

La revisin se puede realizar en cualquiera de las etapas del


desarrollo del cuestionario o en todas ellas
Diseo de Cuestionario 30

A travs de todo el proceso de desarrollo y prueba del cuestionario, se hace un


mejoramiento continuo del instrumento de recoleccin, atendiendo los requerimientos
de informacin, todos los actores son consultados y permiten concretar una propuesta
de preguntas que son probadas y revisadas, conduciendo al diseo final del
cuestionario.

5.2. PRUEBA EN ASPECTOS DEL DISEO


Se prueban aspectos como:

La composicin del cuestionario: esta prueba puede aplicarse a todo el


cuestionario o a una parte. Sin embargo es recomendable utilizar todo el
cuestionario, aun cuando algunas de las preguntas hayan sido adaptadas
de otras encuestas, de esta forma se observa cmo funcionan las
secciones dentro de otro contexto.

Puede ser conveniente probar dos o ms versiones de preguntas redactadas y


ordenadas en forma diferente.

Los mtodos de entrevista: para garantizar el xito de esta prueba, el


cuestionario deber ser administrado de la misma manera como se har en
la encuesta definitiva. Los entrevistadores y observadores pueden ser
fuente de crticas tiles.

Seleccin y capacitacin de los encuestadores: Cmo seleccionar y


capacitar a los entrevistadores?: resulta conveniente seleccionar
entrevistadores con experiencia para las pruebas; de esta forma es ms
probable que las deficiencias detectadas se deban ms al diseo del
cuestionario que a los encuestadores. Ellos pueden igualmente hacer
importantes recomendaciones para mejorar el cuestionario basados en su
experiencia con otras encuestas.
Diseo de Cuestionario 31

Los entrevistadores experimentados pueden ser ms eficientes, lo cual


lleva a subestimar el tiempo requerido para la entrevista. Es
recomendable armar grupos con experiencia mixta.

Los entrevistadores debern estar en capacidad de obtener informacin til para


mejorar el cuestionario. Se les deber instruir detalladamente en los conceptos y
definiciones usados en el cuestionario y en la forma de administrarlo.

5.3. RETROALIMENTACIN A TRAVS DE LA OBSERVACIN.


Los diseadores del cuestionario debern observar el mayor nmero posible de
entrevistas para obtener retroalimentacin en la evaluacin del mismo. Otras formas
de realizar esta evaluacin son:
Prueba Mtodo
Prueba del marco de referencia En - Se incluyen preguntas adicionales
esta prueba se determina si hay estructuradas o no, con el fin de corroborar el
palabras, frases o situaciones que sean significado de las respuestas iniciales.
entendidas de manera distinta a como
fueron concebidas por quienes - Normalmente un entrevistado slo aceptar
disearon el cuestionario. atender sondeos adicionales para unas pocas
preguntas. El nmero de pruebas por
preguntas debe ser tambin limitado.
Observacin de los - Se verifica si el entrevistador hace las
entrevistadores preguntas exactamente como estn redactadas
Los observadores estarn presentes y en la secuencia correcta, si omite alguna
en el desarrollo de la entrevista. pregunta, si el entrevistado requiere alguna
explicacin adicional, si responde
Un mtodo alternativo consiste en adecuadamente, etc.
grabar las entrevistas: esto permite
un anlisis ms detallado. - Diferentes entrevistadores y observadores
deben ser usados para evitar sesgos en el
resultado.
Reportes de los entrevistadores - Las reuniones de reporte pueden ser
Consiste en una discusin organizada individuales con cada encuestador; aunque es
acerca del cuestionario con la ms habitual efectuar reuniones con todo el
participacin de los entrevistadores, grupo.
Diseo de Cuestionario 32

los diseadores, observadores e


investigadores. - Estos reportes pueden efectuarse diariamente
durante la realizacin de la prueba, o
establecer la frecuencia de acuerdo a los
requerimientos.

5.4. ASPECTOS OPERATIVOS


Partiendo de la premisa que el cuestionario debe ser administrado en forma
apropiada, se deben tener en cuenta los siguientes aspectos:

Tanto las personas encargadas de realizar las pruebas de la encuesta como los
observadores deben tener claros los objetivos y la importancia de no cambiar
arbitrariamente la redaccin del cuestionario, ni la forma de administrarlo.

Sin embargo, ellos pueden redactar nuevamente las preguntas o formular otras
adicionales, cuando se sospeche que la respuesta es inexacta, inapropiada o
insuficiente. Esto deber formar parte del sistema de retroalimentacin para detectar
problemas adicionales en el cuestionario.

Los canales de comunicacin entre diseadores, entrevistadores,


observadores y otros miembros del proyecto debern ser claramente
establecidos para incentivar la permanente retroalimentacin
durante la prueba.

Revisiones del cuestionario en el campo de operaciones. Debido al reducido


nmero de personas y de cuestionarios, cualquier problema descubierto se debe
discutir al final de un da de entrevistas y debe ser corregido antes de reanudar las
entrevistas al da siguiente. Estos cambios y las razones para hacerlos debern
quedar documentados para la evaluacin del funcionamiento del cuestionario.

5.5. EVALUACIN DE LOS RESULTADOS


Diseo de Cuestionario 33

Gran parte de la evaluacin de una prueba consiste en aplicar el sentido comn para
resolver los problemas identificados mediante la retroalimentacin.

Una tabulacin general de las preguntas lleva a la identificacin de problemas as:

La cantidad de respuestas: No sabe, Rechazo o No aplica, sumado a las


inconsistencias y preguntas en blanco, usualmente identifica diversos problemas
en el cuestionario.
La NO RESPUESTA frecuente en alguna pregunta puede establecer problemas en
su redaccin. En este caso, es vital la retroalimentacin de los entrevistadores u
observadores para replantear la pregunta en una forma que facilite su respuesta.

La documentacin detallada del proceso de evaluacin y los cambios


realizados en el cuestionario sern de gran utilidad en futuras
investigaciones

5.6. CONSIDERACIONES ACERCA DEL TIEMPO Y EL COSTO.

El tiempo necesario para realizar una prueba vara en funcin de factores como:

El nmero de casos y de entrevistadores


La duracin de la entrevista
La necesidad de enviar materiales a una empresa para imprimirlos
La necesidad de escribir las instrucciones, el material de capacitacin, las guas
para los entrevistadores y los formatos para los observadores
La necesidad de enviar el material al lugar de la entrevista.

Los siguientes factores determinan el costo de una prueba piloto:

Salarios de los entrevistadores y del personal de campo


Salarios de otro personal como diseadores, observadores, etc.
Diseo de Cuestionario 34

Viticos y gastos de transporte de los entrevistadores y observadores


Diseo de los formatos y/o reproduccin de los cuestionarios
Gastos de correo para el material enviado al sitio o gastos de telfono en el caso
de entrevistas telefnicas.

Como se mencion en los primeros captulos, la consideracin de implementar el


cuestionario a travs de Dispositivos Mviles de Captura (DMC) afecta tiempos y
costos en las fases de diseo del instrumento. Sin embargo es claro que deben
hacerse pruebas exhaustivas que permitan garantizar una sincrona entre el
procesamiento de la mquina y la transmisin de datos. Cualquier error puede
entorpecer y retrasar significativamente el proceso de recoleccin y procesamiento.

Aunque contar con DMC en recoleccin resulta una ventaja en oportunidad de la


informacin, se deben tener en cuenta aspectos de funcionamiento y transmisin
que soporten adecuadamente el proceso

Objetivos de la Diseo
Encuesta y Preliminar Diseo Final
Requerimientos de Prueba Delimitacin
Informacin Del De
Cuestionario Bloques
Plan de anlisis
Diseo de Cuestionario 35

6 . DELIMITACIN DE BLOQUES

Una vez se tiene definido el cuestionario definitivo, se realiza la delimitacin de


bloques, o ablocamiento; este es un procedimiento mecnico que facilita la
definicin de las especificaciones de crtica e imputacin y la creacin de los
programas de cmputo en forma modular.

Bloque

Es un conjunto de campos secuenciales. Siempre que esta secuencia


se rompe por un pase a o vaya a (explcito) o una flecha que
indica un pase a (implcito), indica el final de un bloque y el inicio de
otro bloque.

Cabe aclarar que un otro (especifique) no se considera un pase a


implcito.

El proceso de bloqueo se hace con base en los campos. Un campo es el nombre de


la variable de grabacin. Cada pregunta puede tener uno o varios campos de acuerdo
con las opciones de respuesta.

Cada campo en el cuestionario debe ser parte de un bloque y dos bloques


no pueden interceptarse entre s.
Diseo de Cuestionario 36

Ejemplos de campos:
1. Sexo:
A esta pregunta le corresponde un
campo llamado C01.

2. Qu actividades acostumbra realizar el fin de


semana? (Marque todas las que apliquen)

En la pregunta 2 se encuentran 5
campos del C02 al C06.

3. Qu religin practica Usted?


A la pregunta 3 le corresponde un slo
campo el C07, puesto que tiene una sola
opcin de respuesta.
Diseo de Cuestionario 37

Reglas para DELIMITAR BLOQUES

1. Marque el inicio del primer bloque al comienzo del cuestionario.

2. Encerrar el bloque entre lneas y escribir al lado el nmero del


bloque.

3. Se debe asegurar que todos los bloques tengan un principio y un


fin.

4. Cada captulo temtico es un bloque natural

Para identificar un bloque:


5. Los pases explcitos o implcitos marcan el final de un bloque. Ej.
pase a pregunta 9 o termine, solo para personas mayores de
12 aos

6. Marcar el inicio de un bloque en el primer campo de la pregunta a


la que hace referencia el pase a o vaya a.

7. Regresar al campo desde donde se inici el pase a y repetir el


proceso desde la regla No. 5

A continuacin se muestran algunos ejemplos de ablocamiento:


Diseo de Cuestionario 38

DEPARTAMENTO ADMINISTRATIVO NACIONAL DE ESTADISTICA

ENCUESTA DE SALUD PARA ADULTOS

AGOSTO DE 1996

NUMERO ESTRATO UPM

HOGAR REPLICA MULTIPLE

1. Cuntas personas habitan con C01 8. Durante el mes de agosto Usted consult por
usted en esta vivienda? cualquier motivo de salud...

A un mdico? 1 Si C08
2. Sexo: 1 Masculino 2 Femenino C02 2 No (pase a
preg. 9 )
Cuntas veces? 1 Una vez C09
3. Cuntos aos cumplidos tiene? C03 2 Dos o ms

4. Cunto pesa Usted actualmente? C04 9. Durante el mes de agosto Usted consult por
kilos cualquier motivo de salud...

A una enfermera? 1 Si C10


5. Cunto mide Usted 2 No (pase a
actualmente (sin zapatos)? C05 preg. 10)
centmetros Cuntas veces? 1 Una vez C11
2 Dos o ms

10. Durante el mes de agosto Usted consult por


6. Usted sabe leer y escribir? 1 Si C06 cualquier motivo de salud...
2 No
A un sobandero, 1 Si C12
curandero u 2 No (pase a
7. Cul fu el mximo 1 Primaria otra persona? preg. 11)
nivel educativo 2 Secundaria C07
alcanzado por 3 Tcnica/Universitaria Cuntas veces? 1 Una vez C13
Usted? 4 Ninguno 2 Dos o ms
Diseo de Cuestionario 39

11. Durante le mes de agosto tuvo Usted alguna 15. Durante el mes de agosto tuvo alguna lesin
enfermedad diarreica? como consecuencia de un accidente?

1 Si C14
2 No (pase a preg. 13) 1 Si C22
2 No (pase a preg. 17

12. La ltima vez que tuvo una enfermedad diarreica


a quin consult?
Si No
Mdico 1 2 C15 16. La ltima vez que tuvo una lesin como
Enfermero(a) 1 2 C16 consecuencia de un accidente lo atendi
Sobandero,curandero, 1 2 C17 alguna persona diferente a un miembro de
otro su hogar?

1 Si C23
2 No
13. Durante el mes de agosto tuvo alguna enfermedad
respiratoria como gripa, laringitis, bronconeumo-
na, etc.
1 Si C18
2 No (pase a preg. 15)
17. Est Usted amparado por algn Plan Obligatorio
de Salud prestado por una Empresa Promotora
de Salud (EPS) como el Instituto de Seguros
14. La ltima vez que Usted tuvo una enfermedad Sociales (ISS) , Cajas de Previsin o similares?
respiratoria a quin consult?
Si No
Mdico 1 2 C19 1 Si
Enfermero(a) 1 2 C20 2 No C24
Sobandero,curandero, 1 2 C21 3 NS / NR
otro

GRACIAS POR SU COLABORACION


Diseo de Cuestionario 40

CAPITULO II

CRTICA E IMPUTACIN
Diseo de Cuestionario 41

1. PRESENTACION Y OBJETIVOS DEL MDULO

Tan relevante es el diseo de los cuestionarios en el cumplimiento de de las metas de


la Encuesta como el procesamiento y la bsqueda de integridad de los datos
recolectados. Sin embargo an cuando una gran parte de los recursos y tiempo se
invierten diseando, revisando y probando el cuestionario, capacitando y realizando
actividades de seguimiento y control, no todas las preguntas son diligenciadas, no
todas son correctas y se presentan casos de inconsistencia.

En este mdulo se desarrollan los procesos de crtica e imputacin, que permiten


establecer reglas claras alrededor del manejo de los datos que no se ajustan a los
parmetros determinados en la Encuesta.

1.1 OBJETIVO GENERAL

Establecer los procesos de crtica e imputacin estadstica enmarcados en el


procesamiento de informacin recogida en una Encuesta.

1.2 OBJETIVOS ESPECIFICOS

Al finalizar este mdulo los participantes podrn:

Reconocer los principales mtodos utilizados en la crtica estadstica


Usar las reglas y estrategias de crtica
Identificar la incidencia de la crtica estadstica en las etapas de una
encuesta.
Conocer los mtodos de imputacin estadstica ms comunes
Establecer la incidencia de la imputacin estadstica en los resultados de la
encuesta
Diseo de Cuestionario 42

2. INTRODUCCIN A LA CRTICA ESTADSTICA

2.1 DEFINICIN
La crtica estadstica es un proceso que implica la aplicacin de ciertas reglas al
conjunto de datos. Si un registro no cumple con alguna de las reglas debe ser
sealado para ser corregido o cambiado.

La Crtica estadstica es el proceso encaminado a determinar el


grado de integridad de la informacin en referencia a tres
criterios: completitud, correccin y consistencia interna.

La evaluacin de si los datos de una encuesta son o no aceptables depende


bsicamente de la utilidad que ellos generen. Algunos factores contribuyen en esta
decisin. Desde un punto de vista amplio, la calidad de la informacin producida est
asociada a:

El grado del error muestral asociado a los resultados


La magnitud del sesgo debido a la no respuesta
La conveniencia de las preguntas planteadas en la entrevista, etc.

Sin embargo desde una perspectiva ms operativa, la aceptabilidad se determina por


la integridad de los datos en trminos de:

Qu tan completos estn


Qu tan correctos son, y
Qu tanto grado de consistencia interna presentan.

Para estudiar la integridad de los datos se plantean dos tipos diferentes de crtica
denominados generalmente como: (i) crtica interna y (ii) macro-crtica.
Diseo de Cuestionario 43

La crtica interna es el proceso de determinar: las inconsistencias, ausencias o


errores internos y correccin de registros individuales, hasta asegurar la
integrabilidad.
La macro-crtica coteja los datos de la encuesta con otros conjuntos de datos
(encuestas anteriores, registros administrativos, versiones anteriores de la misma
investigacin), a fin de asegurar la comparabilidad.

2.2 DETERMINACIN DE LAS REGLAS DE CRTICA

Esta definicin se basa en:


(i) Conocimiento experto de los especialistas en el tema
(ii) La estructura del cuestionario
(iii) Otros datos relacionados con el tema de la encuesta.

o Personas con amplia experiencia en el manejo temtico de las variables que


requieren ser criticadas, pueden identificar las respuestas que tienen sentido.
Es importante incluir este aporte en la determinacin de las reglas de crtica.

Por ejemplo la experiencia de un analista de estadsticas econmicas del sector


forestal conoce la relacin entre ingreso bruto y gasto para las unidades del sector;
mientras que un experto en transporte puede sealar el rango aceptable de valores
para la tasa de consumo de gasolina para diferentes modelos de vehculos.

o De igual manera el diseo y la organizacin fsica y lgica del cuestionario


tiene impacto en la formulacin de las reglas de crtica, en particular las
instrucciones del tipo Pase a..., lo que conlleva que ciertas preguntas no
aplican a ciertos entrevistados.

La estructura del cuestionario y la metodologa debe


ser respetada
por las reglas de crtica
Diseo de Cuestionario 44

o La revisin de otros estudios o encuestas relacionadas con las variables que


se pretenden editar, pueden ser tiles para establecer algunas reglas de
crtica.

En general las reglas de crtica se refieren a:

Los valores que en forma individual pueden asumir las variables


Las relaciones que deberan existir entre unas respuestas y
otras
La estructura global que se espera del conjunto de datos.

Si un registro no cumple con alguna de las reglas establecidas debe ser sealado
para ser corregido.

Ejemplos de reglas:
La pregunta 52 DEBE TENER una y slo una respuesta
La suma de las partes de la pregunta 15 no puede ser menor que la respuesta a la
pregunta 20
Mximo el 5% del rea puede ser dedicada a labores de beneficio, etc.

2.3 DISEO DE UNA ESTRATEGIA DE CRTICA ESTADSTICA

Como es natural, todo proceso o decisin tiene un costo relacionado. Si se trata de


una crtica manual y si se est interesado en optimizar el trabajo se requiere:

Escribir el conjunto de reglas de crtica


Escribir el conjunto de decisiones cuando un dato no se ajusta a la regla
Entrenar a las personas que van a realizar la crtica
Establecer un mecanismo de supervisin y control a las personas que hacen la
critica
Establecer la medida de impacto que la crtica tiene sobre los datos originales
Diseo de Cuestionario 45

En un ambiente de crtica automtica se debe:

Escribir las reglas de crtica


Contar con un sistema de cmputo en el que se pueda realizar la crtica. En el
caso de las DMC, est incluido dentro del procesamiento.
Escribir los programas que realizarn la crtica, con base en especificaciones
Verificar y probar los programas,
Aplicar los programas al conjunto de datos.

La magnitud de los recursos, el tiempo y los costos de este proceso


puede llegar a ser muy alto

En cualquier caso se debe estar seguro que la inversin de los recursos vale la pena.
No se trata de institucionalizar un operativo de crtica costoso, que consuma mucho
tiempo y que slo encuentre algunos datos equivocados, con un bajo impacto sobre
los resultados finales de la encuesta. Tampoco se trata de correr el riesgo de entregar
resultados poco confiables como producto de un diseo muy grueso de crtica, til
slo para encontrar los mayores errores.

Para disear una estrategia de crtica que responda a las necesidades y las
restricciones de recursos se deben responder preguntas como:

Deben considerarse con igual criterio todos los registros?


Hay registros ms importantes que otros?
Qu cantidad de registros no cumpliran las reglas de crtica?
Cul sera el impacto de esas inconsistencias en los
resultados de la encuesta?
Tienen todas las variables igual importancia?

Las anteriores preguntas son muy fciles de formular pero no siempre de responder.

o La respuesta acerca de la cantidad de datos equivocados depende en gran


medida de aspectos como: qu tan bien diseado est el cuestionario, qu
Diseo de Cuestionario 46

conocimiento tienen los entrevistados sobre el tema, qu tan bien entrenados


estn los entrevistadores, qu tan eficientes son los procesos de supervisin y
control.

Con relacin a la importancia que tienen los registros se debe sealar que no siempre
tienen la misma importancia dentro del proceso de crtica. Por ejemplo, si se trata de
una encuesta a empresarios sobre las condiciones laborales de sus empleados, la
importancia de una empresa con diez mil empleados es evidente sobre una empresa
con cuatro empleados. Mientras que para la empresa grande es necesario realizar un
proceso completo de crtica, que conduce a una revisin y correccin completa; para
la segunda empresa, la crtica puede ser reducida a enviar un mensaje de advertencia
sin que implique correccin alguna. Este tipo de crtica conocido como crtica
selectiva es muy utilizado en encuestas de tipo econmico y de empresas.

El diseo de una estrategia de crtica est tambin relacionado con las posibilidades
de correccin de la informacin. Al realizar crtica a cuestionarios de una encuesta es
posible que se tenga que regresar a la fuente para verificar o corregir uno o varios
datos. Sin embargo en las encuestas de hogares resulta difcil hacer revisitas a fin de
verificar alguna informacin, sobretodo si se trata de un cuestionario largo, pesado o
con aspectos muy sensibles. En las encuestas econmicas, por el contrario, dada la
importancia que para los resultados finales tiene cada fuente, es necesario y
frecuente regresar a ella para realizar revisiones de la informacin entregada.

El diseo de una estrategia de crtica conduce a identificar registros que no se ajustan


a las reglas establecidas, no tiene valor prctico si no est seguido del proceso de
correccin correspondiente. La accin de correccin es comnmente llamada
Diseo de Cuestionario 47

imputacin estadstica.

Es importante tener en cuenta que las acciones de crtica e imputacin estn tan
estrechamente ligadas, que se debe tener en cuenta el tipo de imputacin a realizar al
momento de escribir las especificaciones de crtica.

Frecuentemente la imputacin se realiza como un paso independiente una vez los


datos han pasado por los procesos de crtica. Durante este ltimo proceso se han
detectado las inconsistencias y se han marcado los registros a ser corregidos. En un
proceso separado, el de imputacin, se efectan las correcciones del conjunto de
datos.

Casos DMC: cuando en las investigaciones se dispone de un Dispositivo Mvil de


Captura, el trabajo de crtica se determina desde el diseo del cuestionario, ya que se
incluyen las validaciones predeterminadas en el programa de captura permitiendo
desarrollar la crtica de validacin directamente en campo. La determinacin de las
especificaciones toma mayor relevancia ya que ser un punto de partida para
desarrollar los aplicativos dentro del DMC.
Diseo de Cuestionario 48

3. LA CRTICA ESTADSTICA EN LAS ETAPAS DE LA


ENCUESTA

3.1 CRTICA ESTADSTICA EN CAMPO

o Durante la recoleccin / entrevista. Un primer propsito de la crtica en esta


parte es la de corregir los errores ocurridos durante el proceso de entrevista,
errores que provienen bien del entrevistador o del entrevistado. Por ejemplo
los entrevistadores o el supervisor no notan que se est llevando una falsa
secuencia debido a un error de salto en el formulario.

En estos casos el entrevistador se basa en reglas preestablecidas pero tambin en su


sentido comn y su juicio acerca de lo que son respuestas aceptables o
combinaciones de respuestas.

En esta etapa se puede:


- Identificar errores sistemticos originados en una forma incorrecta de ajustar
cantidades o de rellenar con ceros. En el caso de formularios en papel, se
presenta que en ocasiones el error puede derivarse de utilizar una tabla
equivocada de cdigos o de equivalencias. Para la captura inteligente este
paso esta incluido en la programacin inicial del dispositivo.

- Controlar que ciertas preguntas bsicas dentro del cuestionario hayan sido
contestadas. En general se establece que si una determinada cantidad de
preguntas cruciales no ha sido respondida el cuestionario puede considerarse
incompleto y no ser procesado. Ej. considrese una encuesta sobre mercado
laboral que recoge informacin de los trabajos que ha desempeado la
persona en el ltimo ao. Para la informacin del trabajo es absolutamente
necesario contar con respuestas a las preguntas relacionadas con el tipo de
trabajo, el tipo de responsabilidades que l implicaba y la compaa en la que
trabaj. No hay manera de imputar esta informacin si no ha sido registrada
por el encuestador. Esto significa que el cuestionario deber ser rechazado
como una total no respuesta an cuando muchas otras respuestas hayan sido
Diseo de Cuestionario 49

respondidas correctamente. En la captura inteligente no se podr


continuar con la entrevista si no se cuenta con esta informacin.

-
Las variables que deben estar diligenciadas constituyen lo que se
denomina el criterio de mnimo completamiento y se insiste sobre
ellas en el manual del encuestador y durante la capacitacin.

o Inmediatamente despus de la entrevista. Frecuentemente existe una crtica


en forma inmediata a la finalizacin de la entrevista. Los entrevistadores son
entrenados para realizar una revisin de las respuestas registradas,
inmediatamente despus de abandonar el hogar o el establecimiento
encuestado. De esta manera se tiene la oportunidad de detectar y corregir
errores cuando la informacin est an en la memoria del entrevistador con la
posibilidad de realizar un nuevo contacto fcil y poco costoso.

La crtica de campo le permitir al entrevistador organizar las notas que recogi en


campo, que olvidar muy pronto, y entregar un cuestionario limpio y sin notas al
margen. En la oficina las notas aclaratorias al margen del cuestionario pueden ayudar
al proceso de crtica. Pero nunca ms all, por cuanto esas notas no llegarn a ser
grabadas.

o La crtica de oficina. Los formularios diligenciados son enviados o


entregados por los supervisores en la oficina que lleva a cabo el proceso de
consolidacin, previo al operativo de oficina.

Este proceso de consolidacin consiste, entre otras actividades: codificacin, loteo


(paquetes de formularios), registro de formularios completos, incompletos, etc. dentro
de este proceso se incluye un proceso adicional de crtica, en el que por ejemplo se
revisa la identificacin, los cdigos, los criterios mnimos para considerar un formulario
completo, etc.
Diseo de Cuestionario 50

La magnitud de la crtica en ese momento depende del presupuesto disponible y de


las posibilidades que tiene el grupo de oficina de corregir los errores encontrados. En
esta etapa todava es posible intentar, como ltima oportunidad, un nuevo contacto
con la fuente a fin de corregir algn dato.

Nuevamente se debe aclarar que si se cuenta con el apoyo del DMC, se ver
reflejado en ahorro de tiempo y esfuerzos para controlar la calidad de la informacin,
ya que estas validaciones se realizan directamente en la entrevista.

Con las DMC, los supervisores tendrn la posibilidad de realizar la crtica directamente
en campo sobre una muestra de los entrevistados, con preguntas claves. Estas
preguntas se registran directamente en el dispositivo permitiendo realizar
comparaciones y correcciones oportunamente.

3.2 CRTICA ESTADSTICA EN PROCESAMIENTO CRTICA AUTOMTICA.


Una vez los cuestionarios son enviados a grabacin o son consolidados en medio
magntico, se realiza una crtica ms compleja llamada la crtica automtica, que
pretende corregir los datos faltantes, detectar los datos errneos, encontrar
inconsistencias y eventualmente sealar los llamados outliers o datos extraos.

La crtica automtica aplica programas de computador diseados


especficamente para verificar las reglas de crtica. La crtica ms
completa se produce usualmente durante la etapa de procesamiento de
datos.

o Durante la captura. La crtica puede ser realizada durante la captura


aplicando reglas que permitan contar con datos correctamente depurados
para continuar en forma eficiente con el procesamiento. De igual forma
sucede con la DMC, que incorpora estas reglas desde el proceso mismo de
captura en campo.

La crtica automtica es la ltima oportunidad de corregir datos antes


de iniciar el proceso de produccin de cuadros de salida.
Diseo de Cuestionario 51

o En un proceso separado de crtica e imputacin. La crtica que se lleva a


cabo durante la captura est generalmente relacionada con las reglas
especficas para cada variable, como por ejemplo los valores posibles. Para el
anlisis de las relaciones entre variables, relaciones entre registros o entre
conjuntos de datos, se acostumbra un proceso independiente, posterior a la
grabacin, denominado proceso de crtica e imputacin.

Un principio universalmente aceptado respecto al proceso de crtica automtica


despus de la captura de datos, es que la etapa de crtica y su correspondiente
correccin o imputacin no requieren volver a las copias en papel de los
cuestionarios, o base capturada en Dispositivos Mviles de Captura, a menos que sea
absolutamente necesario.

Se debe procurar que los procesos de crtica e imputacin partan de una base de
datos en medio magntico y evitar al mximo la consulta de cuestionarios para
resolver errores, ya que estos procedimientos resultan costosos y consumen tiempo,
mxime si se trata de un volumen considerable de cuestionarios.

Es claro que en el proceso de crtica una regla no puede contradecir reglas de crtica
de otras etapas de la investigacin. Es decir una relacin lgica aplicada por los
entrevistadores durante la crtica manual no puede ser controvertida por la crtica
automtica durante la etapa de procesamiento. Igualmente el grado de rigurosidad
en la crtica de una etapa deber ser al menos tan riguroso como en las etapas
anteriores.

Otra salida posible es la imputacin determinstica en la que, de ser posible, se


establece un nico valor que ser asumido por la variable que presenta error. De esta
manera se puede evitar volver sobre el mismo registro para hacer la correccin,
haciendo as ms eficientes los pasos posteriores de procesamiento.

Si no es posible sealar un valor para la imputacin determinstica, ser necesario


realizar un proceso posterior de imputacin probabilstica. En este caso la salida de
Diseo de Cuestionario 52

la crtica ser marcar el registro (colocar una bandera) o blanquearlo, para tenerlo en
cuenta en el siguiente paso de imputacin probabilstica.

4. TIPOS DE CRTICA AUTOMTICA

Antes de iniciar este numeral es importante establecer la diferencia entre dos trminos
que se utilizan frecuentemente en este contexto y que son considerablemente
diferentes: la verificacin y la validacin.

La verificacin es el proceso que acompaa a la grabacin y que consiste en


garantizar que lo grabado es un fiel reflejo de lo contenido en los cuestionarios.

Este proceso de verificacin se realiza generalmente a travs de una segunda


grabacin en la que cada uno de los datos capturados se compara con la anterior
captura. Las diferencias se concilian inmediatamente. En muchos casos y por
razones de tiempo y costo este procedimiento se limita a las variables ms
importantes del cuestionario como los campos de identificacin, los cdigos, las
variables claves y las que deben estar respondidas.

La validacin es el proceso que, en forma manual o automtica, determina si los


datos cumplen ciertas reglas preestablecidas de aceptabilidad.

En muchos casos el programa de grabacin acepta slo datos o respuestas vlidas.


Este proceso de validacin puede realizarse tambin como un proceso separado de
los de grabacin y verificacin.

4.1. CRTICA DE VALIDACIN


Se aplica para corroborar la sintaxis numrica o alfanumrica de una determinada
respuesta.
La crtica de validacin controla una variable y solo una en cada
momento, no permite revisar relaciones entre variables o entre
individuos.
Diseo de Cuestionario 53

o En el campo donde se espera un determinado nombre, por ejemplo de una


profesin, la crtica de validacin, corroborar que est escrito correctamente o
lo rechazar por invlido, de igual forma podra hacerse para aspectos
relacionados a direcciones, marcas, jerarquas, etc.
o Para valores numricos se especifican los rangos de respuesta vlida. En
preguntas cerradas de seleccin nica se valida el cumplimiento de una de las
posibles alternativas.

Ejemplos:
Usted vive en: La crtica de validacin establece que
son valores aceptables el 1, 2, 3 y el
4. En algunos casos la no respuesta
tambin puede ser aceptable.

Cuntos aos cumplidos tiene?

Para este ejemplo, la persona


Actualmente es: (solamente para mayores de 10 aos)
diligencia en pregunta edad, que tiene
a. No esta casado(a)
9 aos, y para la pregunta
y vive en pareja
hace menos de dos aos 1 Actualmente: debe estar en blanco,
b. No esta casado (a) porque la metodologa indica que esta
y vive en pareja
pregunta solo se diligencia para las
hace dos aos o ms 2
personas de 10 aos y ms.
c. Esta casado (a) 3

d. Esta separado (a)


o divorciado (a) 4
e. Esta viudo (a) 5
f. Esta soltero (a) 6

Si hay ms de una marcacin, la respuesta es claramente invlida y debe ser


criticada, es decir se debe decidir qu hacer en ese caso.

o A la crtica de validacin le corresponde siempre una accin en cuando se


encuentran casos invlidos. Las acciones a tomar pueden ser: la correccin
inmediata, la imputacin determinstica, la sealizacin con banderas o
cdigos especiales o simplemente dejar los espacios en blanco.
Diseo de Cuestionario 54

Ejemplo: Si la variable hace referencia al mes y est relacionada con dos campos, el
valor invlido 8 blanco, puede ser inmediatamente corregido a 08. As mismo
pequeos errores de ortografa pueden conducir al nombre correcto de la compaa
en cuestin.

o Puesto que la crtica de validacin se hace generalmente durante la captura,


se instruye a los grabadores para que todo caso no vlido sea dejado en
blanco. Una consideracin muy importante en este punto es que el software
utilizado pueda distinguir entre el cero y el blanco. Cuando los blancos
sealan ausencia de informacin (excepto en los casos en que la temtica
acepta preguntas en blanco), implica que son datos no tenidos en cuenta para
las estimaciones de promedios, aspecto muy diferente con el cero.

En otros casos se utiliza un valor especial, por ejemplo el 9 para indicar que un valor
no vlido fue respondido. La razn de utilizar el 8 y el 9 para estos efectos radica en
que generalmente ellos no pertenecen a los rangos aceptados. Sin embargo no es
recomendable la aplicacin de este procedimiento a valores cuantitativos como el
ingreso, la cantidad de empleados, etc.

4.2 ESPECIFICACIONES DE CRTICA DE VALIDACIN


La simple lista de cada una de las variables en forma ordenada, seguida de sus
valores vlidos y un campo para observaciones especiales es suficiente para realizar
la especificacin.

Generalmente al lado de las observaciones individuales por variable se tiene un


conjunto de instrucciones generales que se aplican para todo el cuestionario. Estas
son particularmente importantes cuando la crtica se est realizando durante la
captura.

Ejemplo:
Los campos numricos se ajustan a la derecha y se completan con ceros
Los campos sin entrada posible se dejan en blanco
Diseo de Cuestionario 55

Todos los campos deben ser verificados.

ESPECIFICACIONES DE VALIDACIN

Encuesta : TDDE-03 Escritas por:


Fecha: 25-09-96 Hora: 17:00 Pg. 1 de 1
CAMPO TAMAO VALORES VLIDOS OBSERVACIONES

Nmero 3 001 - 999 Debe estar


Estrato 1 1, 2 Debe estar
UPM 2 01, 03, 04, 08, 13, 17, 21, Debe estar
27, 33, 39, 45, 56, 64, 70
Hogar 3 001 - 300 Debe estar
Rplica 2 01 - 17 Debe estar
Mltiple 1 1-9 Debe estar
C01 2 01 - 18, b
C02 1 1, 2 Debe estar
C03 2 18 - 98 Debe estar
C04 3 50 - 150, b
C05 3 120 - 200, b
C06 1 1, 2, b
C07 1 1 - 4, b
C08 1 1, 2, b
C09 1 1, 2, b
C10 1 1, 2, b
Diseo de Cuestionario 56

4.3. CRTICA DE CONSISTENCIA


Mientras que la crtica de validacin examina una variable en un momento, la crtica
de consistencia analiza la relacin entre dos o ms variables. Esa relacin puede ser
simplemente el seguimiento de un flujo establecido en el formulario; por ejemplo: si la
respuesta a la pregunta A, es No las preguntas X, Y y Z no debieron ser formuladas
ni respondidas.

Otra aplicacin de este tipo de crtica verifica la relacin lgica entre dos o ms
respuestas de un mismo cuestionario. Ej. Una persona menor de diez aos no puede
responder estado civil diferente de soltero, o una mujer menor de 15 aos no puede
responder que ha tenido ms de determinada cantidad de hijos vivos.

La crtica de consistencia analiza la relacin entre dos o ms


variables. Puede considerar toda la informacin del cuestionario
para criticar una determinada variable

Para la crtica de consistencia se manejan dos planteamientos bsicos importantes:

o Se debe realizar el mnimo cambio posible de datos hasta obtener una base
completa y corregida. Aunque este planteamiento garantiza preservar la
mayor cantidad posible de informacin para la produccin de cuadros, requiere
muchas reglas de crtica y sofisticados programas de cmputo capaces de
determinar los puntos de cambio mnimo.

o La crtica de consistencia se debe realizar basndose nicamente en la


informacin previamente criticada, es decir de las preguntas anteriores. Este
procedimiento denominado crtica descendente conlleva a establecer reglas
muy sencillas, se implementa de manera relativamente fcil y rpida, aunque
puede conducir a una elevada cantidad de cambios en la base de datos.
Diseo de Cuestionario 57

La operacin de crtica de consistencia determina retirar datos de la base, realizar una


imputacin determinstica o marcar registros a fin de realizar la imputacin
probabilstica en un paso posterior.

o La crtica de consistencia crea, inicialmente, la regla que controla las


condiciones de mnimo completamiento y las de utilidad del cuestionario.
Por ejemplo si cierta cantidad de preguntas claves no se han respondido o
una buena proporcin de las preguntas iniciales estn en blanco, quiz sea
conveniente considerar el cuestionario como no respuesta absoluta en su
totalidad y dejar para un paso posterior los ajustes necesarios en los factores
de expansin a utilizar.

o La crtica de consistencia en principio identifica datos que no cumplen las


reglas y los seala para ser reemplazados por datos de individuos similares.
Durante el proceso de crtica se definen los registros que en caso de fallas,
sern objeto de imputacin determinstica o de imputacin probabilstica.

ESPECIFICACIONES DE CONSISTENCIA

Encuesta : TDDE - 03 Escritas por: Fecha: 14/04/97


Pg. 1 de 11 Bloque Nro. 1 Tabla nro. 1 Hora:
Condiciones 1 2 3 4 5 6 7 8 9
1 C01 = b S N
2
3
Acciones
1 Marque C01 para imputar X
2
3
4
No hacer nada X

ESPECIFICACIONES DE CONSISTENCIA

Encuesta : TDDE - 03 Escritas por: Fecha: 14/04/97


Pg. 1 de 11 Bloque Nro. 1 Tabla nro. 2 Hora:
Condiciones 1 2 3 4 5 6 7 8 9
Diseo de Cuestionario 58

1 C04 = b S N
2
3
Acciones
1 Marque C04 para imputar X
2
3
No hacer nada X

ESPECIFICACIONES DE CONSISTENCIA

Encuesta : TDDE - 03 Escritas por: Fecha: 14/04/97


Pg. 2 de 11 Bloque Nro. 1 Tabla nro. 4 Hora:
Condiciones 1 2 3 4 5 6 7 8 9
1 C06 1 1 1 2 2 2 b b b
2 C07 1, 4 2, 3 b 1, 4 2, 3 b 1, 4 2, 3 b
3
4
Acciones
1 C06 1 X
2 C06 2 X
3 C07 b X
4 C07 4 X
5 Marque C06 para imputar X
6 Marque C07 para imputar X X X
7
No hacer nada X X X

ESPECIFICACIONES DE CONSISTENCIA

Encuesta : TDDE - 03 Escritas por: Fecha: 14/04/97


Pg. 3 de 11 Bloque Nro. 1 Tabla nro. 5 Hora:
Condiciones 1 2 3 4 5 6 7 8 9
1 C08 1 2 b
2
Acciones
1 C08 X
2
2 C09 X X
b
3 Pase a bloque 2 X
4 Pase a bloque 3 X X
5
No hacer nada
Diseo de Cuestionario 59

ESPECIFICACIONES DE CONSISTENCIA

Encuesta : TDDE - 03 Escritas por: Fecha: 14/04/97

Pg. 7 de 11 Bloque Nro. 8 Tabla nro. 14 Hora:

Condiciones 1 2 3 4 5 6 7 8 9
1 C17 = b S N
2

3
4

Acciones
1 Marque C17 para imputar X
*
2 Pase a bloque 9 X X

3
No hacer nada

* C17 para imputar con C14

4.4. MACROCRTICA
Permite establecer si los resultados de una variable o conjunto de variables de una
encuesta tienen una tendencia correcta, basados en informacin de investigaciones
con temticas similares. Las diferencias que se presentan no provienen
necesariamente de registros individuales sino que se pueden derivar de ajustes a los
estimadores, o ajustes a los factores de expansin.

Este tipo de situaciones pueden no ser detectadas a travs de la crtica de


consistencia por cuanto se trata de valores que no quebrantan las reglas

As como la crtica de validacin observa una nica variable y la crtica de


consistencia examina un cuestionario, la macro-crtica estudia el
conjunto completo de datos, referidos a datos histricos,
informacin de la misma encuesta en meses o aos anteriores, o
encuestas sobre el mismo tema.
Diseo de Cuestionario 60

La Macrocrtica puede realizarse antes o despus de la crtica de consistencia. Este


tipo de crtica puede desarrollarse a travs de tablas univariadas que permitan
determinar las que se pueden denominar regiones outliers o extraas. Una manera
de hacerlo es revisando el comportamiento de los 5% ms altos o ms bajos para
establecer si son datos viables o no.

Las decisiones a tomar en los casos que la macro-crtica detecte errores, van desde el
intento de hacer un nuevo contacto con la fuente, cuando el impacto de su
informacin es muy importante, pasando por la necesidad de realizar ajustes a los
factores de expansin, hasta la sealizacin de variables para ser imputadas.

Finalmente se debe resaltar el hecho de que al cliente o al pblico se le debe


informar, dentro de los comentarios la calidad de la informacin producida, acerca de
los mecanismos de crtica realizados y sobre el impacto de sta en los resultados
presentados.
Diseo de Cuestionario 61

7 5. INTRODUCCIN A LA IMPUTACIN ESTADSTICA

Cuando los esfuerzos realizados en diseo, revisin y prueba de cuestionario, en


campo, en actividades de capacitacin, recoleccin y en procesamiento, tendientes a
garantizar la calidad de la informacin no son suficientes, se hace necesario realizar
actividades tendientes a rescatar informacin.

Las alternativas para enfrentar estos inconvenientes pueden ser:

- Retornar a la fuente primaria para resolver y realizar la depuracin. Sin


embargo, esta solucin es muchas veces, costosa e imprctica, incluso el
entrevistado puede no conocer la respuesta o no desea suministrarla.

- Eliminar de la base los cuestionarios con al menos un dato errneo o faltante,


con la consecuente prdida de informacin recolectada en el cuestionario y
que tuvo un costo asociado a la recoleccin, la supervisin y el control.

- La otra posibilidad es la de asignar un valor plausible en el lugar de los datos


faltantes o incorrectos, es decir realizar la imputacin con la consecuente
prdida de precisin en los resultados entregados.

Se trata, entonces, de determinar en cul de las dos opciones se pierde menos.

Si se establece que las prdidas en precisin pueden ser mayores a lo que el


investigador esta dispuesto a permitir, entonces, se eliminan los cuestionarios y
se realizan los ajustes a los factores de expansin. En este caso el error
muestral se ampla.

Si por el contrario la magnitud de la imputacin no implica grandes prdidas de


precisin, la imputacin se convierte en el procedimiento final antes de llegar a
contar con archivos completos y depurados.
Los mtodos particulares de imputacin tienen mucho que ver con el nivel de prdida
de precisin. As por ejemplo se han diseado formas de imputacin para que los
Diseo de Cuestionario 62

promedios estimados no se alteren sustancialmente. La imputacin es un proceso


que casi siempre se aplica a travs de mtodos computarizados y es en este contexto
que se tratarn los siguientes puntos.

5.1. RELACIN ENTRE CRTICA E IMPUTACIN


La relacin entre estos dos procesos es muy estrecha, tanto, que generalmente se
asocia a un nico proceso denominado crtica e imputacin. La relacin entre crtica
e imputacin no se limita a esta secuencia temporal.

Mientras que la crtica es el proceso de identificar valores errneos o


faltantes,
la imputacin es el proceso de corregirlos, es decir
cambiarlos pero bajo ciertos parmetros ya establecidos

El proceso de crtica e imputacin tiene tres pasos bsicos:

1. Identificar los errores u omisiones (critica)


2. Establecer la causa del problema, es decir determinar la variable
errada. (critica)
3. Corregir esos valores, utilizando normas claramente establecidas
y de esta manera obtener un conjunto consistente de datos.
(imputacin)

Es necesario tener mucho cuidado con el paso 3, ya que se puede volver a cometer
un error que la crtica tendra que detectar nuevamente.

Un dato imputado no pasar de nuevo por el proceso de crtica, por tal motivo la
imputacin debe conducir a datos correctos y consistentes. Por esta razn el
proceso de imputacin debe tener en cuenta las reglas de crtica.
Diseo de Cuestionario 63

Ejemplo: Considere las tres preguntas de seleccin:

P1. Cul es su estado civil actual? P2. En qu grupo de edad P3. Trabaj la semana
se ubica? pasada?

Las especificaciones de crtica de consistencia escritas para este cuestionario fueron:

Regl En trminos de variables En trminos de la temtica


a
1 Si P1 es 2 3 entonces P2 no puede Si el estado civil es: casado(a), en unin
ser 1 libre, separado(a), divorciado o viudo, la
edad no puede ser menor de 10 aos.
2 Si P2 es 1 entonces P3 debe ser Si en la pregunta 2 se contest que la
blanco persona era menor de 10 aos, la entrevista
debe terminar y no debe aparecer respuesta
para la pregunta 3.
3 Si P2 es 2, 3 4 entonces P3 no Si la edad registra un dato mayor de 10
puede ser blanco aos, debe aparecer alguna respuesta a la
actividad laboral de la semana anterior.

Ahora, supngase que las respuestas de dos cuestionarios cuestionario fueron:

Cuestionario 1 2
P1 2 (casado) 1(soltero)
P2 1(menor de 10 aos) 1(menor de 10 aos)
P3 1(trabaja) 1(trabaja)
Diseo de Cuestionario 64

Cuestionario 1. En este caso se trata de una persona casada, menor de diez aos
que trabaj la semana anterior.

En el proceso de crtica e imputacin, el cuestionario se trabajara as:

1. En la revisin de las reglas se encuentra que: Se infringen las reglas uno y


dos.

2. Se debe identificar la causa de ese error. Al menos uno de los tres valores
est equivocado.

3. Si el proceso de crtica establece que el dato errado es la segunda variable


(edad), la marcara para imputacin. En ese caso, en el proceso de
imputacin se deber escoger un valor entre el 2, 3 4, para que el error no
persista.

Cuestionario 2. Se trata de una persona soltera, menor de diez aos que trabaj la
semana anterior.

El proceso de crtica e imputacin:

1. En la revisin de las reglas se encuentra que: Se infringe la tercera regla


2. Si se supone que en las especificaciones de crtica se estableci que en casos
como este el problema est en P3, debe ser marcado e imputado en un
proceso posterior.
3. La imputacin de P3 debe ser blanco por cuanto cualquier otra posibilidad
hara permanecer el error.

Con este ejemplo se muestra que la imputacin es un proceso de asignar valores


lgicos a las variables errneas sin que se infrinjan de nuevo las reglas de crtica.
Diseo de Cuestionario 65

5.2. CUNDO IMPUTAR DATOS?


Bsicamente hay dos casos en los que amerita aplicar un procedimiento de
imputacin: (i) en datos sin respuesta, (ii) para valores inconsistentes. El caso de no
respuesta puede ser: no respuesta total y no respuesta parcial.

(i) Datos sin respuesta

La no respuesta total, se presenta cuando se ha diligenciado una parte muy


pequea del cuestionario. Puede darse por la no colaboracin del informante,
luego de haber iniciado la entrevista. Este caso debi detectarse en la Crtica
de Oficina o en el proceso de Crtica de Validacin.

Si el cuestionario tiene muy poca informacin, la imputacin ser muy difcil de


realizar. En este caso se debe examinar la cantidad y el tipo de cuestionarios en
esta situacin, permitiendo medir el impacto y as establecer si vale la pena invertir
tiempo y esfuerzo en el desarrollo de un proceso costoso de imputacin.

Si la cantidad de casos en esta situacin es mnima y adems se puede asumir que


se trata de un subgrupo aleatorio de individuos ser entonces ms eficiente y simple
descartar esos casos y proceder a ajustar los factores de expansin.

Una situacin diferente se presenta cuando es evidente que la no respuesta total


responde a un subgrupo de individuos con similares caractersticas y de importancia
en el estudio que se realiza.

Se dice que la no respuesta es parcial, cuando ciertos bloques de preguntas


del cuestionario no han sido diligenciados. Esto se presenta cuando el
entrevistado no pudo dar una respuesta concreta a una o ms preguntas,
cuando el entrevistador realiz un salto que no deba o equivocadamente dej
una pgina sin leer.
Diseo de Cuestionario 66

(ii) Valores Inconsistentes: Un dato especfico es inconsistente o invlido cuando


infringe una ley de crtica de consistencia o de validacin, entonces se marca para
imputacin y debe ser imputado.

As por ejemplo si un menor de diez aos tiene estado civil casado y se determina
que el dato errado es el estado civil, entonces se marca esta variable para
imputacin.

Surgen muchas inquietudes alrededor del proceso de imputacin como:


- Por qu se debe imputar?
- Por qu no dejar los datos faltantes, invlidos o inconsistentes como estn y
proceder a trabajar con el resto de la informacin correcta?
- Por qu no marcar todos los datos faltantes e incorrectos con un cdigo
especial que signifique dato no disponible?
- Una base de datos con gran volumen de registros imputados puede dar la
impresin de que se trata de una base de datos cocinados
- Adicionalmente una imputacin que no ha sido correctamente dirigida puede
llevar a una base completamente falsa.

Para resolver esas inquietudes, se realizan unas sugerencias puntuales que ayudan a
orientar un proceso de imputacin adecuado:

En el caso de la no respuesta total es recomendable no imputar y realizar los


ajustes a los factores de expansin.
Para los casos de no respuesta parcial o de valores inconsistentes o invlidos,
el ignorar los registros con informacin no disponible puede llegar a ser una
gran prdida por la informacin no tenida en cuenta.
El establecer una categora nueva de informacin no disponible para cada una
de las variables con datos faltantes puede por un lado conducir a proporciones
y valores muy bajos y de poco inters.

En encuestas con datos demogrficos no se acostumbra presentar la categora no


disponible cuando se trata de grupos de edad, sexo (gnero), por cuanto se trata de
variables fundamentales a tener en cuenta. Es ms, la presentacin de tablas cuando
Diseo de Cuestionario 67

en la categora de sexo, por ejemplo, aparece la nota no disponible, es considerado


en algunos crculos como seal de poco profesionalismo.

Presentar la categora no disponible es ignorar que la informacin faltante puede ser


accesible a travs de otros datos existentes en el cuestionario.

Considrese por ejemplo, el caso del encuestado que rehsa dar datos acerca de su
ingreso, pero seala que es mdico, tiene 20 aos de experiencia, es empleado y
ejerce todava la profesin. Al sealar que la informacin no es disponible se ignora
que en tales condiciones aunque no se conozca el ingreso exacto si se sabe que
debe ser relativamente alto. Algunos investigadores se toman el tiempo y el trabajo de
presentar los datos en dos versiones, la primera en la que se tiene la categora no
disponible y otra en la que no se cuenta con ella. En tal caso se debe revisar
cuidadosamente si las diferencias encontradas ameritan el esfuerzo y los recursos
invertidos en ello.

Sin embargo es bueno recordar que en investigaciones de opinin es comn


presentar los datos con la categora, no disponible, no responde o indeciso. De
hecho, muchos investigadores han sealado que es muy difcil tratar de inferir la
opinin.

6. MTODOS DE IMPUTACIN ESTADSTICA

6.1. IMPUTACIN DETERMINSTICA


Se realiza cuando un dato sealado para imputacin recibe un nico valor posible que
se le puede asignar a fin de que cumplan las reglas de crtica planteadas.

Ejemplos:
Ej.1 Para un cuestionario en el que se resean las ventas mes a mes, pero le falta el
dato anual. Si la regla de crtica establece que el total anual debe ser igual a la suma
de los meses, solo se tiene la posibilidad de realizar la suma y asignar ese valor al
dato faltante.
Diseo de Cuestionario 68

Ej. 2 Referido a un ejemplo anterior, la respuesta a la pregunta 2 era que se trataba


de un menor de diez aos, y la respuesta a la pregunta 3 tena respuesta uno, lo
cual era inconsistente, este campo fue marcado para imputacin y el nico valor
asignable es el blanco.

La imputacin determinstica utiliza nicamente informacin del mismo


registro;
por esta razn se puede realizar dentro del proceso mismo de crtica

Al escribir las especificaciones de crtica se puede encontrar un caso en el que no se


marca el dato para una imputacin, sino que de una vez se asume la accin de
reemplazar el dato por el que se asume debe ser.

6.2. IMPUTACIN POR SUSTITUCIN


Se puede realizar cuando se cuenta con una base de datos externa en la que se
encuentran los mismos individuos de la encuesta y a la cual se pueda recurrir cada
vez que se tiene un dato faltante o errneo. La base externa puede ser una base de
datos de una encuesta anterior.

El mtodo de sustitucin es muy comn para encuestas continuas, por ejemplo


mensuales, en las que se indaga sobre el mismo tpico siempre.
Ejemplos:

Ej. 1 Si en una encuesta de empleo en hogares, se visita al mismo hogar durante seis
meses. En un mes determinado y para una persona del hogar, la respuesta a la
cantidad de horas trabajadas la semana anterior est sin responder y por lo tanto
marcada para imputacin. Esta cantidad de horas puede ser obtenida con la cantidad
de horas trabajadas reportadas el mes anterior por el mismo individuo.

Ej. 2 En una encuesta de opinin al interior de una gran empresa, un individuo dej
de responder la edad, la variable est marcada para imputacin. La sustitucin se
Diseo de Cuestionario 69

produce a partir del archivo administrativo de personal, de donde se extrae el dato


faltante para el archivo de la encuesta.

La dificultad de este tipo de procedimiento radica en encontrar variables e


identificadores que coincidan plenamente en los dos archivos y que permitan el
traslado de informacin.

6.3. IMPUTACIN BASADA EN ESTIMADORES


Este mtodo implica procesamiento y manipulacin de los datos antes de realizar la
imputacin. Este manejo se puede realizar slo con los datos correctos, o con datos
histricos externos.

El mtodo puede variar por Ej., estimar algunos promedios; hasta tratar de establecer
el grado de relacin entre variables. Se puede utilizar mtodos orientados a estimar
valores para imputar como: Estimacin de regresin, correlaciones, etc.

Una primera versin de este mtodo puede ser la imputacin utilizando el promedio
actualizado. Ej. No se registra el dato sobre el monto del arriendo pagado en una
vivienda. Se calcula entonces el arriendo promedio de las viviendas del mismo sector
con similar tamao y se asigna este valor promedio al dato por imputar.

En forma similar se puede imputar de acuerdo con la razn existente en la base de


datos. Ej. Para el caso de una encuesta econmica en la que se omiti el dato de
retencin en la fuente por pagos en salarios, se tiene el valor de la nmina, se conoce
el subgrupo econmico en que se clasifica la empresa, luego se puede calcular la
relacin entre retencin y valor de la nmina para las industrias de ese subgrupo y
aplicar esa razn al dato de nomina de la empresa con el dato por imputar.

Otra manera de hacer imputacin es a partir de la estimacin de la tendencia. Ej.


Para el caso anterior en el que se cuenta con registros histricos que permiten a partir
de los datos completos de la encuesta determinar la tendencia del monto de
retencin, es decir establecer el comportamiento del dato actual en relacin con los
Diseo de Cuestionario 70

meses anteriores. Si la empresa con el dato faltante ha reportado correctamente los


meses anteriores basta con aplicar la tendencia encontrada para estimar el dato a
imputar.

La precisin de los valores imputados depende, en gran medida,


de:
- Los niveles de correlacin entre las variables a imputar y las
utilizadas para estimar
- El grado de complejidad de los clculos matemticos y
- La utilizacin de toda o de una parte de los datos de la base.

En trminos generales las razones y los estimadores de regresin suelen ser


ms estables que las estimaciones de simples promedios.

La imputacin basada en la estimacin es muy frecuente en investigaciones de tipo


econmico, particularmente aquellas que se repiten peridicamente. Una desventaja
de este mtodo es que an despus de la imputacin pueden persistir
inconsistencias, sobre todo si se determinan valores en las reglas de crtica que
deban presentar relaciones de igualdad. Por tal razn es recomendable aplicar de
nuevo procedimientos de crtica despus de realizada la imputacin.

6.4. IMPUTACIN EN FRO


Consiste en usar valores o reglas predeterminadas en caso de ser necesario imputar
el valor de una variable. El valor se puede obtener de una encuesta anterior, de un
experto en la temtica, de un dato histrico, etc. se trata simplemente de encontrar el
mejor valor.

Ejemplos:
- En una Encuesta de hbitos de fumar no se relaciona la cantidad de cigarros
fumados al da, pero una encuesta de un par de aos antes arroj que en
promedio esa cantidad era igual a quince; esa cantidad puede ser utilizada
para imputar los datos faltantes o inconsistentes.
Diseo de Cuestionario 71

- En una Encuesta de salud a personas se trata de imputar la estatura.


Estudios demogrficos sealan que para esa regin la estatura promedio de
hombres es 1.75 cm. y para mujeres 1.67cm, estos datos pueden ser
utilizados para imputar sin mayores complicaciones.
Con este tipo de imputacin no se respetan las distribuciones y las relaciones entre
variables, la magnitud del sesgo es incierta pero se puede aplicar cuando los datos a
imputar son muy pocos y los otros procedimientos de imputacin no arrojan resultados
satisfactorios.

6.5. IMPUTACIN CON PAQUETE CALIENTE


Corresponde a una serie de mtodos que se basan en que un dato por imputar puede
ser reemplazado por uno obtenido de los registros de la misma encuesta.

El punto de partida para esta metodologa es dividir la base de datos de la Encuesta


en dos partes: (i) Conjunto de datos errados o receptores: contiene los registros
con al menos un dato faltante, invlido o inconsistente y (ii) Conjunto de donantes:
contiene todos los registros absolutamente limpios.
Nota.
Un registro con un dato faltante pero al que se le hizo imputacin determinstica, se
considera correcto y pertenece al conjunto de los donantes.

Para el paquete caliente cada registro del conjunto de los receptores


encuentra un donante muy similar en el conjunto de donantes, de tal forma
que el dato faltante puede ser reemplazado por el valor que tiene el donante
para esa variable.

Algunos aspectos a considerar al momento de hacer la imputacin por paquete


caliente son:
Cmo definir la similitud entre donante y receptor? La similitud se define en
trminos de la relacin de coincidencia de algunas variables con la variable a imputar,
para los dos registros de respuesta. El proceso comienza por definir las variables que
tienen alta correlacin con la variable a imputar, se toman los datos del receptor para
esas variables y se busca un donante con esas mismas caractersticas
Diseo de Cuestionario 72

o Se pueden imputar todas las variables necesarias en un receptor, a partir


de un mismo donante? En algn sentido se trata de una situacin deseable
pues de esta manera se preservan las relaciones entre variables.

Ejemplo: En una encuesta de empleo, es obvio que si la ocupacin y el ingreso


personal deben ser imputados, hay ventajas al imputarlos de un mismo donante
debido a la estrecha relacin entre esas dos variables. Sin embargo, si se tienen
varias variables para ser imputadas, se tienen que buscar donantes similares de
acuerdo con variables relacionadas con la variable a imputar y es muy extrao que las
variables que se relacionan con una, tambin lo hagan con otra variable.

Como mtodo de imputacin, se aplica a veces hacer imputacin por grupos de


variables aprovechando los mismos donantes aunque en forma parcial.

o Puede un donante ser utilizado para varios receptores? Si gran


cantidad de receptores son imputados a partir de los datos de un mismo
donante, el impacto en los estimativos puede ser importante. Vale la pena
entonces, limitar la cantidad de veces que un mismo donante es utilizado para
imputar y se evita as el abuso de un mismo dato. Si esta es una ventaja o no,
es un debate an no concluido.

Si la cantidad de respuestas correctas de una determinada regin es muy baja, es


probable que no se encuentren donantes para determinados tipos de receptores y
entonces se deba suavizar un poco las condiciones de similitud.

Si no se establece un lmite para la cantidad de veces que un donante sirve para


imputacin, el investigador podra contabilizar esta cantidad y cuando supere una
cierta barrera, observar detenidamente las caractersticas del donante. El problema
se presenta si el donante presenta caractersticas de outlier o dato fuera de serie,
caso en el cual los resultados finales pueden ser seriamente distorsionados.

o Qu hacer cuando no se encuentra un donante idneo? Sucede con


frecuencia que al menos algunos receptores no encuentren un donante
idneo. De hecho sera extrao que en una encuesta compleja, un nico
Diseo de Cuestionario 73

procedimiento de imputacin fuera suficiente para completar toda la


depuracin. Para los casos sin donante se debe entonces especificar otro
mtodo de imputacin, el cual se incluye dentro del paquete caliente a fin de
tener respuestas completas, por ejemplo la imputacin en fro.

7. MTODOS DE PAQUETE CALIENTE

Para datos de tipo categrico es frecuente utilizar o bien un mtodo secuencial de


paquete caliente o uno de seleccin aleatoria. Para datos de tipo cuantitativo el
mtodo ms utilizado es el del vecino ms prximo.

7.1. MTODO IMPUTACIN SECUENCIAL


Para ilustrar este mtodo se utiliza como ejemplo el Censo de los Estados Unidos,
sea por ejemplo la pregunta sobre el hbito de fumar, la cual tiene tres posibles
respuestas:

1 Fumador actual
2 Nunca ha fumado
3 Ex fumador

Se ha decidido que la imputacin en caliente se hara basndose en las variables


grupo de edad y gnero, la primera con tres categoras, la segunda con dos:

Grupo de edad Gnero


15 a 24 1 Masculin
25 a 44 2 o 1
45 y Ms 3 Femenino 2

La imputacin secuencial seguira el siguiente procedimiento:

1. Se crea una matriz de imputacin en la que se establecen todas las posibles


combinaciones de las variables de similitud.
Diseo de Cuestionario 74

En el ejemplo se tienen tres categoras de edad y dos categoras de gnero, lo que


origina seis combinaciones que conforman la parte inicial de la matriz de imputacin,
esquemticamente sera:

Grupo de edad Sexo Valor de imputacin


1 1
1 2
2 1
2 2
3 1
3 2

2. Se leen uno a uno los datos del archivo de la encuesta y la matriz de


imputacin, y se va actualizando con datos correctos. As por ejemplo
despus de veinte datos la matriz aparece as:

Grupo de edad Sexo Valor de imputacin


1 1 2
1 2 2
2 1 1
2 2 3
3 1 1
3 2 3

Y adicionalmente, dato del cuestionario 21 corresponde a una mujer del grupo 2 de


Edad (25 a 44 aos) que es no fumadora.

El dato de la cuarta fila (3) ser actualizado por 2 (no ha fumado nunca). La matriz se
ira actualizando de manera consecutiva a medida que vayan apareciendo datos
correctos.
3. De esta forma cuando aparece un valor a ser imputado se toma el valor
correspondiente de la matriz de imputacin. Luego el receptor tiene el mismo
valor que el donante para todos los campos de similitud e imputacin.
Diseo de Cuestionario 75

4. El procedimiento contina hasta recorrer la totalidad de la base de datos y


haber realizado el proceso en el que cada dato correcto origin una
actualizacin en la matriz de imputacin y cada dato incorrecto fue imputado a
partir de la matriz.

Caractersticas relevantes de la Imputacin Secuencial:

o Caso 1. Si dos registros consecutivos tienen el mismo valor para imputar y


tienen las mismas caractersticas de similitud tendrn el mismo donante.

Esto puede ser particularmente peligroso si se considera que los datos errados
tienden a estar juntos por cuanto provienen de una misma regin y se deben al
trabajo deficiente de un supervisor. Como se mencion anteriormente la reiterada
utilizacin de un mismo donante puede generar fuertes sesgos en los estimativos del
estudio.

En general el orden en el que se encuentran los datos en la base no es propiamente


aleatoria, por el contrario corresponden a un orden geogrfico, en forma tal que datos
de una determinada rea tienen mucha probabilidad de ser imputados con donantes
de esa rea, lo cual significa un mejoramiento de la imputacin.

En cuestionarios con gran volumen de variables y muchos casos para imputar, la


cantidad de matrices de imputacin puede ser relativamente alta. El investigador
debe cuidar que sus recursos de hardware resistan el proceso que se propone iniciar.

Cada matriz de imputacin debe inicializarse utilizando valores ad-hoc a fin de evitar
que los primeros registros sean imputados con blanco.

7.2. MTODO DE SELECCIN ALEATORIA

Con este mtodo no es necesario contar con una matriz de imputacin, el mtodo
consiste en construir un subgrupo de donantes, los que cumplen con tener los mismos
valores en las variables de similitud y seleccionar entre ellos uno al azar como
donante.
As por ejemplo en el caso anterior si se encuentra una bandera para imputar los
hbitos de fumar, el grupo de edad es 1 (entre 15 y 24 aos) y el sexo 1 (masculino)
Diseo de Cuestionario 76

se separan todos los hombres de ese grupo de edad en el grupo de donantes y se


elige uno al azar que ser el donante. El valor del hbito de fumar imputado ser
entonces el mismo del donante elegido. Este mtodo es utilizado para las
imputaciones del censo y la encuesta mensual de desempleo de Canad.

En los dos casos anteriores la decisin acerca de las variables de similitud es muy
importante, y ellas deben estar muy relacionadas con la variable a imputar. Es
conveniente evitar la utilizacin de un campo numrico como variable de similitud,
para evitar el crecimiento desbordado de la matriz de imputacin. Normalmente se
codifican las variables numricas previamente a su utilizacin como variables de
similitud, de esta manera la matriz vuelve a tamaos normales y la probabilidad de
encontrar una similitud, que con valores continuos era muy pequea se vuelve
relativamente grande.

Si se utilizan muchas variables como similitud, la cantidad de combinaciones crece


rpidamente y la cantidad de donantes por celda es muy baja en forma tal que se
corre el riesgo de utilizar repetidas veces un donante y de no encontrar donantes para
ciertas imputaciones. En este sentido se debe establecer un criterio de jerarqua
entre ellas.

Ejemplo: Si se debe imputar el ingreso personal. Las variables de similitud son:

Escolaridad (Cinco niveles)


Grupo de edad (Cinco niveles)
Sexo (Dos niveles)
Ocupacin (25 categoras)

As se llega a 1250 combinaciones y muy probablemente no habr donantes para


algunos casos aunque el investigador considera que las cuatro variables son
necesarias. Si luego de un primer intento no se encontr donante para un caso
particular, se podra intentar con las tres ltimas variables para las que se tienen 250 =
5 x 2 x 25 combinaciones. Si an as tampoco se encuentra donante se recurrira a
las 50 combinaciones resultantes de sexo y ocupacin, incrementando as la
probabilidad de encontrar donante.

7.3. MTODO DEL VECINO MS PRXIMO


Diseo de Cuestionario 77

Para las encuestas en las que predominan las variables de tipo cuantitativo no son
aplicables los procedimientos anteriores, por cuanto no es posible definir estas
variables como variables de similitud. De otro lado, la categorizacin de todas las
variables es bastante dispendiosa amn de que sin un estudio completo no es fcil
establecer por adelantado, rangos de valores tiles y apropiados.

La solucin es entonces no buscar el dato que tiene exactamente el mismo valor pero
si aquel que ms se le aproxima y que adems pertenece a una clase similar en otra
variable importante. El problema de este procedimiento radica en establecer lo que
se puede denominar la distancia para determinar cercana o lejana, con los
subsecuentes problemas derivados de las unidades de medida que se utilizan en las
diferentes variables.

En estos casos se presenta con mucha frecuencia que una vez realizada la
imputacin se vuelven a presentar problemas de crtica. Los programas intentan con
el primer donante y revisan si de esta manera se cumplen las reglas de crtica, si no

es el caso se trata con el segundo donante y as sucesivamente hasta llegar a un


punto en el que la imputacin no infringe las reglas de crtica o se considera que la
imputacin por paquete caliente no es aplicable.

Finalmente vale la pena mencionar que las necesidades computacionales para


realizar este procedimiento son inmensas. Este procedimiento fue utilizado en
Canad en el Censo Agrcola de 1991.
Diseo de Cuestionario 78

8. EVALUACIN DE LOS PROCEDIMIENTOS DE


IMPUTACIN

En general un investigador responsable debera hacer llamados de atencin en sus


resultados, sealando el impacto y la magnitud de la imputacin realizada antes de
producir los cuadros que se entregan.

Naturalmente el tamao de la encuesta y su presupuesto determinan qu se puede


hacer en trminos de evaluar el impacto de la imputacin. Sin embargo los usuarios
deben contar con informacin bsica al respecto de la proporcin de informacin que
proviene de datos originales y la que proviene de datos modelados o estimados
dentro de un proceso de imputacin.

Los puntos ms importantes a evaluar acerca de un proceso de imputacin son : el


sesgo y la varianza en las estimaciones. Si el presupuesto lo permite el investigador
puede detenerse a examinar las diferencias de estimacin cuando se incluyen y no se
incluyen los valores imputados. Las grandes diferencias debern ser analizadas para
descartar o encontrar sesgos importantes debidos a la imputacin.

Si este procedimiento no es posible, entonces se espera que al menos se le informe


al usuario:

- La cantidad de registros que fueron objeto de imputacin


- La cantidad de registros donantes
- Cantidad de veces que cada variable fue imputada y mtodo utilizado
- Cantidad de donantes especficos y cantidad de imputaciones realizadas
con ese grupo
- Cantidad de intentos hasta lograr una imputacin exitosa para cada
receptor
- La lista de registros utilizados como donantes para cada receptor.
- La lista de receptores en los que los mtodos de imputacin fallaron.
Diseo de Cuestionario 79

Respecto a la varianza es comn tratar a los datos imputados como datos correctos
provenientes de los informantes y aplicar tranquilamente las frmulas tradicionales de
estimacin de la varianza del estimador, este procedimiento conlleva a serias
subestimaciones de la varianza, especialmente si la cantidad de imputaciones es alta.

La informacin reseada anteriormente sobre las caractersticas de la imputacin


constituye una fuente importante de memoria a ser utilizada al momento de disear y
desarrollar una encuesta similar.

Parece ser que una variable con alta tasa de imputacin puede deberse a una pobre
redaccin, a un diseo deficiente del cuestionario, a problemas en la capacitacin y
control de los encuestadores u otros aspectos que pueden ser mejorados en la nueva
versin.
Diseo de Cuestionario 80

También podría gustarte