Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Los encuestados que usan una escala no comparativa emplean cualquier estándar de
clasificación que les parezca más apropiado. No comparan el objeto que deben calificar con
otro objeto ni con algún estándar especificado, como su marca ideal. Sólo evalúan un objeto a
la vez, por lo que las escalas no comparativas se conocen también como escalas monódicas. Las
técnicas no comparativas constan de las escalas de clasificación continua y por ítem, las cuales
analizaremos en los siguientes apartados.
En una escala de clasificación continua, conocida también como escala de clasificación gráfica,
los encuestados califican los objetos poniendo una marca en la posición apropiada sobre una
línea que corre de un extremo al otro de la variable criterio. De esta forma, los encuestados no
se limitan a seleccionar entre las marcas previamente establecidas por el investigador. La forma
de una escala continua puede variar considerablemente. Por ejemplo, la línea puede ser
vertical u horizontal, los puntos de la escala pueden aparecer en forma de números o
descripciones breves y, en tal caso, los puntos de la escala pueden ser muchos o pocos.
Una vez que el encuestado ha otorgado las calificaciones, el investigador divide la línea en
tantas categorías como desee y asigna las puntuaciones con base en las categorías en las que
cae la clasificación. Esas puntuaciones por lo regular se tratan como datos de intervalo. La
ventaja de las escalas continuas es que son fáciles de construir. Sin embargo, su clasificación es
engorrosa y poco confiable; además, las escalas continuas ofrecen poca información nueva. Por
eso, su uso en investigación de mercados es restringido. Sin embargo, en los últimos tiempos
se está utilizando con mayor frecuencia en virtud del incremento en el número de entrevistas
personales asistidas por computadora y gracias al uso de otras tecnologías.
En una escala de clasificación por ítem se presenta a los encuestados una escala que asocia un
número o una breve descripción con cada categoría. Las categorías se ordenan en términos de
la posición de la escala y se pide a los encuestados que seleccionen la categoría específica que
describa mejor al objeto que se está evaluando. Las escalas de clasificación por ítem se utilizan
mucho en la investigación de mercados y son los componentes básicos de escalas más
complicadas, como la escala de clasificación por reactivos múltiples. Se describirán primero las
escalas de clasificación por ítem de uso más frecuente (las escalas de Likert, de diferencial
semántico y de Stapel).
Escala de Likert
La escala de Likert es una escala de clasificación de uso muy difundido que requiere que los
encuestados indiquen el grado de acuerdo o desacuerdo con cada una de las afirmaciones de
una serie acerca del objeto estímulo. Por lo general, cada reactivo tiene cinco categorías de
respuestas, que van de “totalmente en desacuerdo” a “totalmente de acuerdo”.
La escala de Likert tiene varias ventajas. Es fácil de construir y de aplicar. A los encuestados les
resulta sencillo entender su uso, lo que la hace adecuada para aplicarse por correo, por
teléfono o en entrevistas personales. La principal desventaja de la escala de Likert es que
requiere más tiempo para completarse que otras escalas de clasificación por ítem, porque los
encuestados tienen que leer cada afirmación.
Escala de Stapel
La escala de Stapel, es una escala de clasificación unipolar con 10 categorías numeradas del sin
un punto neutral .Esta escala por lo general se presenta de manera vertical. Se pide a los
encuestados que indiquen qué tan precisa o imprecisa es la descripción que hace cada término
del objeto, seleccionando una respuesta numérica apropiada para la categoría. Cuanto mayor
sea el número, más precisa es la descripción que hace el término del objeto.
Los datos obtenidos con una escala de Stapel pueden analizarse de la misma forma que los
datos del diferencial semántico, ya que ambas producen resultados similares. La escala de
Stapel tiene las ventajas de que no requiere una prueba previa de los adjetivos o frases para
asegurar su bipolaridad y de que puede aplicarse por teléfono. Sin embargo, algunos
investigadores creen que es confusa y difícil de aplicar. Aunque la escala de Stapel es la que
menos se utiliza de las tres escalas de clasificación por ítem que se consideraron, merece más
atención de la que se le ha dado.
Como indica la revisión hecha hasta ahora, las escalas no comparativas de clasificación por
ítem no tienen que usarse tal como se propuso originalmente, sino que pueden adoptar
diversas formas. El investigador debe tomar seis decisiones importantes al elaborar cualquiera
de estas escalas en relación con los siguientes factores:
Si los encuestados están interesados en la tarea de escalamiento y conocen los objetos, puede
emplearse un mayor número de categorías. Por otro lado, si los encuestados no conocen bien
la tarea o no están familiarizados con ella, el número de categorías debe ser menor. También es
relevante la naturaleza de los objetos. Algunos objetos no se prestan a una discriminación fina,
por lo que un menor número de categorías es suficiente. Otro factor importante es el modo de
recolección de datos. Si se usan entrevistas telefónicas, muchas categorías podrían confundir a
los encuestados. De igual forma, las limitaciones de espacio restringen el número de categorías
en los cuestionarios enviados por correo.
Con un número non de categorías, el punto central de la escala por lo general se designa como
neutral o imparcial. La presencia, posición o etiquetamiento de una categoría neutral puede
tener una influencia significativa en la respuesta. La escala de Likert es una escala de
clasificación balanceada con un número non de categorías y un punto neutral. La decisión de
usar un número par o non de categorías depende de si algunos de los encuestados pueden ser
neutrales respecto a la respuesta medida. Si hay la posibilidad de que al menos algunos
encuestados den una respuesta neutral o indiferente, debe usarse un número non de
categorías.
En las escalas de clasificación forzada, los encuestados son obligados a expresar una opinión
porque no se les da la opción de “sin opinión”. En tal caso, los encuestados que no tienen
opinión pueden marcar la posición central de la escala. Si una proporción suficiente de los
encuestados no tienen opinión sobre el tema, marcar la posición central podría distorsionar las
medidas de tendencia central y la varianza. En situaciones donde se espera que los
encuestados no tengan opinión, en vez de estar simplemente renuentes a revelarla, una escala
no forzada que incluya una categoría de “sin opinión” mejora la precisión de los datos.
La naturaleza y el grado de la descripción verbal asociada con las categorías de la escala varían
considerablemente y tienen efecto en las respuestas. Las categorías de la escala pueden tener
descripciones verbales, numéricas y hasta pictóricas. Además, el investigador debe decidir si
etiqueta todas, algunas o sólo las categorías extremas de la escala. De manera sorprendente,
ofrecer descripciones verbales para cada categoría no siempre incrementa la precisión o
confiabilidad de los datos. Sin embargo, etiquetar todas o muchas de las categorías permite
reducir la ambigüedad de la escala. Las descripciones de las categorías deben localizarse tan
cerca como sea posible de las categorías de respuesta.
La escala del termómetro y la de la cara sonriente son dos configuraciones únicas de las escalas
de clasificación que se utilizan en la investigación de mercados. En la escala del termómetro,
cuanto más alta sea la temperatura, más favorable es la evaluación. De igual forma, las caras
felices indican evaluaciones más favorables.
Mediante un pretest aplicado a una muestra grande de encuestados se obtienen los datos
sobre el conjunto reducido de reactivos potenciales. Los datos son analizados usando técnicas
como correlaciones, análisis factorial, análisis de conglomerados, análisis discriminante y otras
pruebas estadísticas.
EVALUACIÓN DE LA ESCALA
Exactitud de la medición
Confiabilidad
Confiabilidad test-retest
Validez
La validez de una escala se define como el grado en que las diferencias en las puntuaciones
obtenidas con la escala reflejan diferencias verdaderas entre los objetos en la característica
medida, en lugar del error sistemático o aleatorio. La validez perfecta requiere que no haya
error de medición. Los investigadores pueden evaluar la validez del contenido, la validez del
criterio o la validez del constructo.
La validez del contenido, que en ocasiones se conoce como validez aparente, es una evaluación
subjetiva pero sistemática de qué tan bien representa el contenido de la escala la tarea de
medición en cuestión. El investigador o alguien más examina si los reactivos de la escala cubren
adecuadamente todo el dominio del constructo que se está midiendo. Así, una escala diseñada
para medir la imagen de una tienda se consideraría inadecuada si omite cualquiera de las
dimensiones principales (como calidad, variedad y surtido de la mercancía).
La validez del criterio refleja si una escala se comporta como se esperaba en relación con otras
variables seleccionadas como criterios significativos (variables de criterio). Las variables de
criterio pueden incluir características demográficas y psicográficas, medidas actitudinales y
conductuales, o puntuaciones obtenidas a partir de otras escalas. Según el periodo implicado,
la validez del criterio adopta una de dos formas: validez concurrente y predictiva.
Capacidad de generalización
La capacidad de generalización se refiere al grado en que las observaciones con que se cuenta
son aplicables a un universo. El conjunto de todas las condiciones de medición sobre las cuales
el investigador desea generalizar constituye el universo de generalización. Estas condiciones
incluyen reactivos, entrevistadores, situaciones de observación, etcétera. Un investigador quizá
desee generalizar una escala desarrollada para usarse en entrevistas personales a otros modos
de recolección de datos, como las entrevistas telefónicas o por correo. Asimismo, tal vez
alguien quiera generalizar de una muestra de reactivos al universo de reactivos, de la muestra
de momentos de medición al universo de momentos de medición, de una muestra de
observadores a un universo de observadores y así sucesivamente.
Como regla general, el uso de la técnica de escalamiento que produzca el más alto nivel de
información posible en una situación dada permitirá el uso de la mayor variedad de análisis
estadísticos. Además, sin importar el tipo de escala usada, siempre que sea posible, la
característica de interés debe medirse mediante una escala con varios reactivos.
Todas las técnicas de escalamiento analizadas en este capítulo requieren que los encuestados
hagan una evaluación directa de varias características de los objetos estímulo. En contraste, las
técnicas matemáticas de escalamiento permiten a los investigadores inferir las evaluaciones
que hacen los encuestados de las características de los objetos estímulo. Estas evaluaciones se
infieren de los juicios generales de los encuestados sobre los objetos. Entre las técnicas de
escalamiento derivadas matemáticamente destacan el escalamiento multidimensional y el
análisis conjunto.