Está en la página 1de 31

Capìtulo catorce

Preparaciòn de los datos

© 2007 Prentice Hall


14-1
Esquema del capìtulo

1) Objetivos
2) El proceso de preparaciòn de los datos
3) Revisiòn del cuestionario
4) Ediciòn
i. Tratamiento de las respuestas
insatisfactorios
5) Codificaciòn
i. Codificaciòn de las preguntas
ii. Libro de còdigos
iii. Codificaciòn de cuestionarios
© 2007 Prentice Hall 14-2
Esquema del capìtulo
6) Transcripciòn
7) Depuraciòn de datos
i. Comprobaciòn de la congruencia
ii. Tratamiento de respuestas Ajuste

faltantes de los
datos

8) Ajuste estadistico de los datos


i. Ponderaciòn
ii. Redefiniciòn de las variables
iii. Transformaciòn de la escala
9) Elecciòn de una estrategia de anàlisis
de datos
© 2007 Prentice Hall 14-3
Esquema del capìtulo
10) Clasificaciòn de las tècnicas estadisticas
11) Ètica en las investigaciones de mercado
12) Resùmen

© 2007 Prentice Hall 14-4


Preparaciòn de los datos
Fig. 14.1 Preparaciòn preliminar del plan de anàlisis

Revisiòn del cuestionario

Ediciòn

Codificaciòn

Transcripciòn

Depuraciòn de datos

Ajuste estadistico de los datos

Elecciòn de una estrategia de anàlisis


© 2007 Prentice Hall De datos 14-5
Revisiòn del cuestionario
Un cuestionario que regresa del campo podrìa ser
inaceptable por varias razones.
 Algunas partes del cuestionario estan incompletas.

 El patròn de respuesta indica que el encuestado

no entendiò o siguiò las instrucciones.


 Las repuestas muestran poca varianza.

 Los cuestionarios entregados estàn fisicamente

incompletos.
 El cuestionario se recibiò despuès de la fecha

establecida.
 El cuestionario fue contestado por alguien que no

estaba calificado para participar.


© 2007 Prentice Hall 14-6
Ediciòn

Tratando de incrementar su exactitud y precisiòn.


 Devoluciòn al campo – los cuestionarios con
respuestas insatisfactorias pueden devolverse al
campo, donde los entrevistadores vuelven a hacer
contacto con los encuestados.
 Asignaciòn de valores faltantes – si no es
posible regresar los cuestionarios al campo, el
editor puede asignar valores faltantes a las
respuestas insatisfactorias.
 Descartar a los encuestados insatisfactorios –
en este enfoque simplemente se descartan a los
encuestados con respuestas insatisfactorias.

© 2007 Prentice Hall 14-7


Codificaciòn
Codificar significa asignar un còdigo, por lo general un
nùmero, a cada respuesta posible de cada pregunta. El còdigo
incluye una indicaciòn de la posiciòn en la columna(campo) y el
registro que ocuparà el dato.

Codificaciòn de las preguntas

 Còdigos de campo fijo, lo cual significa que el nùmero de


registros para cada encuestado es el mismo y que para todos
los encuestados aparecen los mismos datos en las mismas
columnas.

 De ser posible, deben usarse còdigos estandar para los datos


faltantes.

 En las preguntas que permiten un gran número de respuestas,


cada opción de respuesta posible se debe asignar una columna
por separado.

© 2007 Prentice Hall 14-8


Codificaciòn
Directrices para la codificación de las preguntas no estructuradas:

 Los códigos de categoría que debe ser mutuamente excluyentes


y colectivamente exhaustivos.

 Sólo unos pocos (10% o menos) de las respuestas debe caer en


la categoría "otros".

 Los códigos de categoría que debe asignarse para cuestiones


críticas, incluso si nadie ha mencionado.

 Los datos deben codificarse con el fin de retener tantos detalles


como sea posible.

© 2007 Prentice Hall 14-9


Libro de còdigos
Un libro de còdigo contiene las
instrucciones para la codificaciòn y la
informaciòn necesaria sobre las variables
en el conjunto de los datos:
 nùmero de columna
 nùmero de registro
 nùmero de variable
 nombre de la variable
 nùmero de la pregunta
 instrucciones para la codificaciòn
© 2007 Prentice Hall 14-10
Codificaciòn de un cuestionario

 El código del encuestado y el numero de registro deben


aparecer en cada registro de los datos.

 Para cada encuestado tienen que incluirse los siguientes códigos


adicionales: còdigo de proyecto, còdigo del entrevistador,
códigos de fecha y hora y códigos de validación.

 Es una buena práctica para insertar espacios en blanco entre las


partes.

© 2007 Prentice Hall 14-11


Ejemplo de un archivo de còmputo
Table 14.1

campos
Nùmero de columnas
Registro 1-3 4 5-6 7-8 ... 26 ... 35 77

Registro 1 001 1 31 01 6544234553 5


Registro 11 002 1 31 01 5564435433 4
Registro 21 003 1 31 01 4655243324 4
Registro 31 004 1 31 01 5463244645 6
Registro 2701 271 1 31 55 6652354435 5

© 2007 Prentice Hall 14-12


Transcripciòn de datos
Fig. 14.4
Datos en bruto

CATI/ Tecleo con Formas para


Lector Anàlisis
capturarse con
CAPI terminal CRT lector òptico optico sensorial
computarizado
Verificaciòn: correcciòn
de errores de tecleo

Cintas
Memoria de la
discos
computadora magneticas

Datos transcritos
© 2007 Prentice Hall 14-13
Depuraciòn de datos
comprobaciòn de la congruencia
comprobaciòn de la congruencia identifica los
datos que estan fuera de rango, que son logicamente
incongruentes o que tienen valores extremos.

 Es posible programar paquetes de còmputo como


SPSS, SAS, EXCEL and MINITAB para identificar
los valores fuera de rango para cada variable, e
imprimir el còdigo del encuestado, el còdigo de la
variable, el nombre de la variable, el nùmero de
registro, el nùmero de columna y el valor fuera de
rango.

 Los valores extremos deben revisarse de manera


minuciosa.
© 2007 Prentice Hall 14-14
Depuraciòn de datos
Tratamiento de preguntas faltantes
 Sustituir con un valor neutro – un valor neutro, por lo
regular la respuesta promedio a la variable, sustituye las
respuestas faltantes.
 Sustituir con una respuesta atribuida – se usa el
patron de respuestas de los encuestados a otras
preguntas, para atribuir o calcular una respuesta
adecuada para las preguntas faltantes.
 En la eliminaciòn por casos, se descartan del anàlisis
los casos o encuestados con alguna respuesta faltante.
 En la eliminaciòn por pares, en vez de descartar todos
los casos con algùn valor faltante, el investigador sòlo usa
los casos o encuestados con respuestas completas para
cada càlculo.

© 2007 Prentice Hall 14-15


Ajuste estadistico de los datos
 En la ponderaciòn, a cada caso o encuestado de
la base de datos se le asigna un peso que refleje su
importancia en relaciòn con otros casos o
encuestados.

 La ponderaciòn se usa sobre todo para hacer que


los datos de la muestra sean màs representativos de
una poblaciòn meta en caracterìsticas especìficas.

 Sin embargo, otro uso de la ponderaciòn consiste en


ajustar la muestra para dar mayor importancia a
encuestados con ciertas caracteristicas.

© 2007 Prentice Hall 14-16


Ajuste estadistico de los datos
Uso de la ponderaciòn para mejorar la representatividad

Años de porcentaje de porcentaje de


Educacion la muestra la poblaciòn peso

Educaciòn primaria
0 a 7 años 2.49 4.23 1.70
8 años 1.26 2.19 1.74

Preparatoria
1a 3 años 6.39 8.65 1.35
4 años 25.39 29.24 1.15

Universidad
1 a 3 años 22.33 29.42 1.32
4 años 15.02 12.01 0.80
5 a 6 años 14.94 7.36 0.49
7 años ò màs 12.18 6.90 0.57

Totales 100.00 100.00

© 2007 Prentice Hall 14-17


Ajuste estadistico de los datos–
Redefiniciòn de las variables

 La redefiniciòn de las variables implica


transformar los datos para crear variables
nuevas o modificar las existentes. El
propòsito de la redefiniciòn es crear variables
que sean congruentes con los objetivos del
estudio.

 El investigador puede crear nuevas variables


que sean combinaciones de muchas otras.

© 2007 Prentice Hall 14-18


Ajuste estadistico de los datos–
Redefiniciòn de las variables
Uso del producto Variable original còdigo de la variable ficticia
Categoria
còdigo X1 X2 X3
Uso nulo 1 1 0 0
Uso esporadico 2 0 1 0
Uso moderado 3 0 0 1
Uso habitual 4 0 0 0

Advierta que X1 = 1 para el uso nulo y 0 para todos los demàs.


De igual manera, X2 = 1 para el uso esporadico y 0 para el resto,
y X3 = 1 para uso moderado y 0 para el resto. Al analizar los
datos, X1, X2, and X3 para representar a todos los grupos de
usuarios y no usuarios.

© 2007 Prentice Hall 14-19


Ajuste estadistico de los datos––
Escala de transformaciòn y estandarizaciòn

La transformaciòn de la escala implica manipular


los valores de la escala para asegurar que sea
comparable con otras escalas o adecuar de otra
manera los datos para el anàlisis.

La estandarizaciòn permite al investigador comparar


variables que han sido medidas con diferentes tipos
de escalas, Zi, pueden obtenerse de la siguiente
manera:

Zi = (Xi -X )/sx

© 2007 Prentice Hall 14-20


Elecciòn de la estrategia de anàlisis de datos
Fig. 14.5

Etapas iniciales (1, 2, Y 3) del proceso de inv. de mercados

Caracteristicas conocidas de los datos

Propiedades de las tècnicas estadisticas

Experiencia y filosofia del investigador

Estrategia de anàlisis de los datos

© 2007 Prentice Hall 14-21


Clasificaciòn de tècnicas multivariadas
Fig. 14.7
Tècnicas multivariadas

Tècnicas de Tècnicas de
dependencia independencia

Una variable Màs de una Independencia de Semejanza


dependiente variable variables entre objetos
dependiente
* Tabulaciòn * Ànàlisis * Anàlisis * Anàlisis de
cruzada multivariado factorial conglormerados
* Anàlisis de de varianza y * Escalamiento
varianza y covarianza multidimensional
covarianza * Correlaciòn
* Regresiòn canònica
mùltiple * Anàlisis
* Anàlisis discriminante
conjunto multiple
© 2007 Prentice Hall 14-22
Preferencia de un restaurante
Table 14.2
Ingreso
ID preferencia calidad cantidad valor servicio ingresos general real
1 2 2 3 1 3 6 9 4
2 6 5 6 5 7 2 23 1
3 4 4 3 4 5 3 16 2
4 1 2 1 1 2 5 6 4
5 7 6 6 5 4 1 21 1
6 5 4 4 5 4 3 17 2
7 2 2 3 2 3 5 10 4
8 3 3 4 2 3 4 12 3
9 7 6 7 6 5 2 24 1
10 2 3 2 2 2 5 9 4
11 2 3 2 1 3 6 9 4
12 6 6 6 6 7 2 25 1
13 4 4 3 3 4 3 14 2
14 1 1 3 1 2 4 7 3
15 7 7 5 5 4 2 21 1
16 5 5 4 5 5 3 19 2
17 2 3 1 2 3 4 9 3
18 4 4 3 3 3 3 13 2
19 7 5 5 7 5 5 22 4
20 3 2 2 3 3 3 10 2

© 2007 Prentice Hall 14-23


Nielsen’s Internet Survey:
Tiene alguna importancia?
La compañìa de investigaciòn de medios “Nielsen”.
Tiene ya una larga trayectoria, que investiga el
mercado de la televisiòn por medio de encuestas y
otras tècnicas.
Asi mismo acaba de iniciar otro negocio en lo que
respecta a Internet. Ahora se enfocan a
determinar el impacto que tiene el comercio
electrònico, en el negocio mundial, puesto que los
anunciantes necesitan saber ¿cùanto gente utiliza
Internet para hacer negocios? Ya que de esto
depende que los anunciantes se decidan a optar
por Intenet como una nueva vìa de publicidad y
comience a obtener ganancias por estos anuncios
via Internet.
© 2007 Prentice Hall 14-24
Nielsen’s Internet Survey:
Tiene alguna importancia?
Sin embargo estadisticas en el tema, consideran que
algunas de las variables que Nielsen utiliza para este
estudio son incorrectas, ya que no hubo una
segmentaciòn adecuada. (Demogràfica).
Las variables que utilizò fue el gènero, pero no la
educaciòn. Esto deja ver que existe una amplia
posibilidad entre la gente educada y la que no lo es.

© 2007 Prentice Hall 14-25


Nielsen’s Internet Survey:
Tiene alguna importancia?
Posteriormente Nielsen toma en cuenta variables
como: la edad y sus ingresos, despuès de haber
tomado en cuenta el gènero.
Aùn asi las estadisticas mencionan que esto es
incorrecto ya que estas variables no ocurren
simultaneamente sino por separado.
A pesar de esto Nielsen no se preocupò demasiado,
sobre la legitimidad de su estudio. De hecho màs de
dos terceras partes utilizan este mètodo para validar
otras investigaciones.
Nielsen reportò 204 millones de usuarios globales en
medios digitales (utilizando una diferente
metodologìa). Y en el 2006 144 millones.

© 2007 Prentice Hall 14-26


SPSS Windows
 Using the Base module, out-of-range values can be selected using the
SELECT IF command. These cases, with the identifying information
(subject ID, record number, variable name, and variable value) can
then be printed using the LIST or PRINT commands. The Print
command will save active cases to an external file. If a formatted list
is required, the SUMMARIZE command can be used.
 SPSS Data Entry can facilitate data preparation. You can verify
respondents have answered completely by setting rules. These rules
can be used on existing datasets to validate and check the data,
whether or not the questionnaire used to collect the data was
constructed in Data Entry. Data Entry allows you to control and check
the entry of data through three types of rules: validation, checking,
and skip and fill rules.
 While the missing values can be treated within the context of the Base
module, SPSS Missing Values Analysis can assist in diagnosing missing
values and replacing missing values with estimates.
 TextSmart by SPSS can help in the coding and analysis of open-ended
responses.
© 2007 Prentice Hall 14-27
SPSS Windows: Creating Overall
Evaluation
1. Select TRANSFORM

2. Click on COMPUTE

3. Type “overall” in the TARGET VARIABLE box.

4. Click on “quality” and move it to the NUMERIC


EXPRESSIONS box.

5. Click on the “+” sign.

6. Click on “quantity” and move it to the NUMERIC


EXPRESSIONS box.

7. Click on the “+” sign


© 2007 Prentice Hall 14-28
Creating Overall Evaluation
8. Click on “value” and move it to the NUMERIC
EXPRESSIONS box.

9. Click on the “+” sign

10. Click on “service” and move it to the


NUMERIC EXPRESSIONS box.

11. Click on TYPE & LABEL under the TARGET


VARIABLE box and type “Overall Evaluation.”
Click on CONTINUE.

12. Click OK.


© 2007 Prentice Hall 14-29
SPSS Windows: Recoding Income
1. Select TRANSFORM
2. Click on RECODE and select INTO DIFFERENT
VARIABLES…
3. Click on income and move it to NUMERIC VARIABLE
OUTPUT VARIABLE box.
4. Type “rincome” in OUTPUT VARIABLE NAME box.
5. Type “Recode Income” in OUTPUT VARIABLE LABEL
box.
6. Click OLD AND NEW VAULES box.
7. Under OLD VALUES on the left click RANGE. Type 1 and
2 in the range boxes. Under NEW VALUES on the right
click VALUE and type 1 in the value box. Click ADD.
© 2007 Prentice Hall 14-30
Recoding Income
8. Under OLD VALUES on the left click VALUE. Type 3 in the
value box. Under NEW VALUES on the right click VALUE
and type 2 in the value box. Click ADD.
9. Under OLD VALUES on the left click VALUE. Type 4 in the
value box. Under NEW VALUES on the right click VALUE
and type 3 in the value box. Click ADD.
10. Under OLD VALUES on the left click RANGE. Type 5 and 6
in the range boxes. Under NEW VALUES on the right click
VALUE and type 4 in the value box. Click ADD.
11. Click CONTINUE.
12. Click CHANGE.
13. Click OK.
© 2007 Prentice Hall 14-31