Está en la página 1de 8

CAPITULO 14: PREPARACION DE LOS DATOS

Este captulo describe el proceso de recoleccin de los datos, el cual comienza con
la revisin de los cuestionarios para verificar que estn completos. Enseguida, se
analiza la depuracin de los datos y se ofrecen lineamientos para manejar las
respuestas ilegibles, incompletas, incongruentes, ambiguas o insatisfactorias.
Tambin se describe la codificacin, trascripcin y limpieza de los datos, y se hace
nfasis en el tratamiento de las respuestas faltantes y en el ajuste estadstico de
los datos. Se analiza la eleccin de una estrategia de anlisis de los datos y se
clasifican

las

tcnicas

estadsticas.

Se

explican

los

enfoques

intracultural,

pancultural y transcultural para el anlisis de datos en la investigacin de mercados


internacionales.

Se

identifican

los

problemas

ticos

relacionados

con

el

procesamiento de los datos, destacando la eliminacin de las respuestas


insatisfactorias, el incumplimiento de las suposiciones que subyacen a las tcnicas
de anlisis de datos, y la evaluacin e interpretacin de los resultados. Por ltimo,
se analiza el uso de programas estadsticos para la preparacin y anlisis de los
datos.
El

proceso

para

la

muestra en la diagrama de

preparacin de datos se
flujo siguiente:

El primer paso consiste en verificar que los cuestionarios sean aceptables, seguido
por la verifi cacin, codificacin y trascripcin de los datos. Se depuran los datos y
se recomienda un tratamiento para las respuestas faltantes. Con frecuencia resulta
necesario un ajuste estadstico de los datos para que sean representativos de la
poblacin de inters. El investigador debe entonces elegir la estrategia apropiada
para el anlisis de los datos. La estrategia final de anlisis de los datos difiere del
plan preliminar de anlisis, debido a la informacin y los conocimientos obtenidos
desde que se formul el plan original. La preparacin de los datos debe empezar
tan pronto como se reciba el primer grupo de cuestionarios del campo, mientras el
trabajo de campo contina. De este modo, si se detecta algn problema, es factible
modificar el trabajo de campo para incorporar alguna accin correctiva.
Revisin del Cuestionario.
La preparacin de los datos comienza con una revisin preliminar de todos los
cuestionarios para verificar que estn completos y la calidad de las entrevistas.
Luego se hace una edicin ms minuciosa.
Edicin
La edicin consiste en revisar los cuestionarios para identificar las respuestas
ilegibles, incompletas, incongruentes o ambiguas. Para manejar esas respuestas
pueden regresarse los cuestionaros al campo, asignarles valores faltantes o
descartar a los encuestados insatisfactorios.
Codificacin
El siguiente paso es la codificacin. Se asigna un cdigo numrico o alfanumrico,
para representar una respuesta especfica a una pregunta en particular, junto con la
posicin en la columna que ocupar dicho cdigo. A menudo es til preparar un
libro de cdigos que contenga las instrucciones para la codificacin y la informacin
necesaria sobre las variables en el conjunto de datos.
Transcripcin
Los datos codificados se trascriben en discos o cintas magnticas, o se capturan en
computadoras por medio del teclado. Tambin pueden usarse las formas de
marcado sensorial, lector ptico o anlisis sensorial computarizado.

Depuracin de Datos
La depuracin de los datos requiere revisiones de la congruencia y el tratamiento
de las respuestas faltantes. Las opciones disponibles para el tratamiento de las
respuestas faltantes incluyen la sustitucin con un valor neutro como la media,
sustitucin por una respuesta atribuida, eliminacin por casos y eliminacin por
pares.

Ajuste estadstico de los datos


Los ajustes estadsticos como la ponderacin, la redefinicin de las variables y las
transformaciones de la escala suelen mejorar la calidad del anlisis de los datos.
Eleccin de una estrategia de anlisis de datos
La eleccin de la estrategia de anlisis de datos debe basarse en los primeros pasos
del proceso de investigacin de mercados, las caractersticas conocidas de los
datos, las propiedades de las tcnicas estadsticas, y la experiencia y filosofa del
investigador.
Las tcnicas estadsticas se clasifican como univariadas o multivariadas. Antes de
analizar los datos en la investigacin de mercados internacionales, el investigador
debe asegurarse de que las unidades de medicin son comparables entre pases o
unidades culturales. El anlisis de datos se realiza en tres niveles:
1) individual,
2) dentro de un pas o una unidad cultural (anlisis intracultural)y
3) entre pases o unidades culturales (anlisis pancultural, transcultural).
Varios aspectos ticos estn relacionados con el procesamiento de datos, en
particular el hecho de descartar respuestas insatisfactorias, el incumplimiento de
las suposiciones que subyacen a las tcnicas de anlisis de datos, y la evaluacin e
interpretacin de los resultados. Internet y las computadoras desempean un papel
importante en la preparacin y anlisis de los datos.

CAPITULO 15: DISTTRIBUCION DE FRECUENCIAS, TABULACION


CRUZADA Y VERIFICACION DE HIPOTESIS
Una vez que los datos estn preparados para su anlisis , el investigador debe
realizar ciertos anlisis bsicos. En este captulo se describe el anlisis bsico de
datos, incluyendo la distribucin de frecuencias, la tabulacin cruzada y la prueba
de hiptesis. En primer lugar, se describe la distribucin de frecuencias y se explica
la manera en que proporciona indicadores del nmero de valores que se ubican
fuera de rango, faltantes o extremos, as como informacin sobre la tendencia
central, la variacin y la forma de la distribucin subyacente. Luego, se examina la
prueba de hiptesis al describir el procedimiento general.
Los procedimientos de prueba de hiptesis se clasifican en pruebas de asociaciones
o pruebas de diferencias. Se escribe el uso de la tabulacin cruzada para entender
las relaciones entre variables, considerando dos o tres de ellas a la vez. Aunque la
naturaleza de la asociacin se puede observar en tablas, existen estadsticos para
examinar la significancia y la fuerza de la asociacin. Por ltimo, se presentan
pruebas para estudiar hiptesis relacionadas con diferencias basadas en una o dos
muestras.
DISTRIBUCION DE FRECUENCIAS
El anlisis bsico de datos brinda conocimientos valiosos y gua el resto del anlisis,
as como la interpretacin de los resultados. Es necesario tener una distribucin de
frecuencias para cada variable de los datos. Este anlisis produce una tabla de
frecuencias, porcentajes y porcentajes acumulativos para todos los valores
asociados con esa variable. Adems, indica el grado de valores faltantes, extremos
o que caen fuera del rango. La media, moda y mediana de una distribucin de

frecuencias son medidas de tendencia central. La variacin de la distribucin se


describe mediante el rango, la varianza o desviacin estndar, el coeficiente de
variacin y el rango intercuartlico. La asimetra y la curtosis dan informacin sobre
la forma de la distribucin.
TABULACION CRUZADA
Las tabulaciones cruzadas son tablas que reflejan la distribucin conjunta de dos o
ms variables. En la tabulacin cruzada, los porcentajes se pueden calcular por
columna, a partir de los totales de columna, o por rengln, a partir de los totales de
rengln. La regla general consiste en calcular los porcentajes en la direccin de la
variable independiente, por la variable dependiente. A menudo la introduccin de
una tercera variable brinda informacin adicional. El estadstico chi cuadrada ofrece
una prueba de la significancia estadstica de la asociacin observada en una
tabulacin cruzada. El coeficiente fi , el coeficiente de contingencia, la V de Cramer
y el coeficiente lambda miden la fuerza de la asociacin entre las variables.
PRUEBA DE HIPOTESIS
Existen pruebas paramtricas y no paramtricas para hiptesis de diferencias. Con
respecto a las paramtricas, la prueba t se utiliza para examinar hiptesis
relacionadas con la media de la poblacin. Hay distintas formas de la prueba t para
probar hiptesis basadas en una muestra, dos muestras independientes o muestras
pareadas. Con respecto a las no paramtricas, las pruebas de una muestra ms
populares son la de Kolmogorov-Smirnov, la chi cuadrada, la prueba de rachas y la
prueba binomial. Para dos muestras no paramtricas independientes se puede
utilizar la prueba U de Mann-Whitney, la prueba de la mediana y la prueba de
Kolmogorov-Smirnov. Para muestras pareadas, la prueba de rangos con signo de
Wilcoxon para muestras pareadas y la prueba del signo sirven para examinar
hiptesis relacionadas con medidas de localizacin.
Procedimiento general para la prueba de Hiptesis
La prueba de hiptesis incluye los siguientes pasos:
1. Formular la hiptesis nula H0 y la hiptesis alternativa H1.
2.

Elegir

una

tcnica

estadstica

correspondiente.
3. Seleccionar el nivel de significancia.

adecuada

su

estadstico

de

prueba

4. Determinar el tamao de la muestra y reunir los datos. Calcular el valor del


estadstico de prueba.
5. Determinar la probabilidad asociada con el estadstico de prueba con respecto a
la hiptesis nula, utilizando la distribucin de la muestra del estadstico de prueba.
Como alternativa, determinar los valores crticos asociados con el estadstico de
prueba, que dividen las regiones de rechazo y no rechazo.
6. Comparar la probabilidad asociada con el estadstico de prueba, al nivel de
significancia especificado. Como alternativa, determinar si el estadstico de prueba
cae en la regin de rechazo o de no rechazo.
7. Tomar la decisin estadstica de rechazar o no rechazar la hiptesis nula.
8. Expresar la decisin estadstica en trminos del problema de investigacin de
mercados.

CAPITULO 16: ANALISIS DE VARIANZA Y COVARIANZA

En este captulo se analizaron procedimientos para examinar las diferencias entre


ms de dos medias o medianas. A estos procedimientos se les denomina anlisis de
varianza y anlisis de covarianza, los cuales tradicionalmente se utilizan para
analizar datos experimentales, aunque tambin se emplean para analizar datos de
encuesta o de observaciones.
Aqu se describe el anlisis de varianza y el anlisis de covarianza, y se estudia su
relacin con otras tcnicas. Luego, se revisa el anlisis de varianza de un factor,
que es el procedimiento ms sencillo, seguido por el anlisis de varianza de n
factores y el anlisis de covarianza. Se da especial atencin a aspectos de la
interpretacin de los resultados con respecto a las interacciones, la importancia
relativa

de

los

factores

las

comparaciones

mltiples.

Algunos

temas

especializados, como el anlisis de varianza de medidas repetidas, el anlisis de


varianza no mtrico y el anlisis de varianza multivariado, se estudian brevemente.
ANALISIS DE VARIANZA METRICO
En el ANOVA y en el ANCOVA la variable dependiente es mtrica y todas las
variables independientes son categricas, o una combinacin de variables
categricas y mtricas.
ANOVA
El ANOVA de un factor incluye slo una variable independiente categrica. El inters
reside en poner a prueba la hiptesis nula que plantea que las medias de las
categoras son iguales en la poblacin. La variacin total en la variable dependiente
se separa en dos componentes: la variacin relacionada con la variable
independiente y la variacin relacionada con el error.
La variacin se mide en trminos de la suma de cuadrados corregida para la media
(SC). El cuadrado medio se obtiene al dividir la SC entre los grados de libertad
correspondientes (gl).
La hiptesis nula de medias iguales se prueba por medio del estadstico F, que es la
razn del cuadrado medio con respecto a la variable independiente y el cuadrado
medio relacionado con el error.
El anlisis de varianza de N factores implica el examen simultneo de dos o ms
variables independientes categricas. Una de sus principales ventajas es que se
pueden estudiar las interacciones entre las variables independientes.

La significancia del efecto general, los trminos de interaccin y los efectos


principales de factores individuales se examinan a travs de pruebas F adecuadas.
Slo tiene sentido poner a prueba la significancia de los efectos principales si los
trminos de interaccin correspondientes no son significativos.
ANCOVA
El ANCOVA incluye por lo menos una variable independiente categrica y por lo
menos

una

variable

independiente

de

intervalo

mtrica.

La

variable

independiente mtrica, o covariable, generalmente se utiliza para eliminar


variacin extraa de la variable dependiente.
Cuando se realiza un anlisis de varianza de dos o ms factores, pueden surgir
interacciones.

Una

interaccin

ocurre

cuando

el

efecto

de

una

variable

independiente sobre una variable dependiente difiere en distintas categoras o


niveles de otra variable independiente. Si la interaccin es significativa, sta puede
ser ordinal o disordinal. La interaccin disordinal se clasifica como cruzada o sin
cruce. En los diseos equilibrados, la importancia relativa de los factores al explicar
la variacin de la variable dependiente se mide con la omega cuadrada . Las
comparaciones mltiples en forma de contrastes a priori o a posteriori se pueden
utilizar para examinar las diferencias entre medias especficas.
En el anlisis de varianza de medidas repetidas, se obtienen observaciones sobre
cada sujeto en cada condicin de tratamiento. Este diseo sirve para controlar las
diferencias entre los sujetos antes del experimento.
El anlisis de varianza no mtrico implica el estudio de las diferencias de las
tendencias centrales de dos o ms grupos, cuando la variable dependiente se mide
en una escala ordinal.
El anlisis de varianza multivariado (MANOVA) incluye dos o ms variables
dependientes mtricas.