Está en la página 1de 12

1

Investigación de mercados – medición y escalonamiento

Cristhian Samuel Tripul Cordova1 cristhiantripul@gmail.com

Escuela de Postgrado de la Universidad San Pedro

En el presente trabajo se analizará la medición y escalonamiento, donde se revisará las escalas


básicas de medición: nominal, ordinal, de intervalo y de razón, seguido de ello las técnicas
comparativas y no comparativas de escalonamiento.

Medición y escalonamiento
De acuerdo a ello se procede a definir los principales conceptos para poder determinar la base de
la presente revisión. Medición: La asignación de números u otros símbolos a características de
objetos de acuerdo con ciertas reglas preestablecidas, el aspecto más importante de la medición es
la especificación de las reglas para la asignación de números a determinadas características.
Escalonamiento: Generación de un continuo sobre el que se localizan los objetos medidos, El
escalamiento es el proceso de colocar a los encuestados en un continuo con respecto a su actitud.

Escala nominal
Una escala cuyos números sirven sólo como etiquetas o rótulos para identificar y clasificar objetos
con una estricta correspondencia de uno a uno entre los números y los objetos, Cuando se utiliza
una escala nominal con propósitos de identificación, hay una estricta correspondencia uno a uno
entre los números y los objetos. Sólo se acepta un número limitado de estadísticas, todas las cuales
se basan en conteos de frecuencia. Éstas incluyen porcentajes, moda, chi cuadrada, y pruebas
binomiales.

Escala ordinal
Escala de clasificación en la cual se asignan números a los objetos para indicar la medida relativa
en que se posee una característica. Esto permite determinar si un objeto tiene más o menos de una
característica que otros objetos. En la investigación de mercados, las escalas ordinales se utilizan
para medir actitudes, opiniones, percepciones y preferencias relativas.
2

En una escala ordinal, como en la escala nominal, los objetos equivalentes reciben el
mismo rango. Puede asignarse cualquier serie de números que preserve las relaciones ordenadas
entre los objetos.

Escala de intervalo
Una escala donde se utilizan los números para calificar objetos, de tal forma que las distancias
numéricamente equivalentes en la escala representan distancias equivalentes en la característica
medida. las técnicas estadísticas que pueden utilizarse en los datos de la escala de intervalo
incluyen todas aquellas que se aplican a los datos nominales y ordinales. Además, pueden
calcularse la media aritmética, la desviación estándar, correlaciones producto-momento y otras
estadísticas de uso común en la investigación de mercados. Sin embargo, ciertas estadísticas
especializadas como media geométrica, media armónica y coeficiente de variación no son útiles
para los datos de una escala de intervalo.

Escala de razón
La escala más alta. Permite al investigador identificar o clasificar objetos, jerarquizarlos, Y
comparar los intervalos o las diferencias. También es significativo calcular razones de los valores
de la escala. Todas las técnicas estadísticas son aplicables a los datos de razón. Ello incluye
estadísticas especializadas como la media geométrica, la media armónica y el coeficiente de
variación.

Escalas comparativas
Una de dos tipos de técnicas de escalamiento en donde hay una comparación directa de los objetos
estímulo entre sí. Los datos de la escala comparativa deben interpretarse en términos relativos y
sólo tienen propiedades ordinales o de rangos ordenados. Por tal razón, al escalamiento
comparativo también se le conoce como escalamiento no métrico.

Escalas no comparativas
Una de dos tipos de técnicas de escalamiento en la cual cada objeto estímulo de escala se
forma independiente del resto de los objetos del conjunto de estímulos.
3

las escalas no comparativas pueden ser de calificación continua o de calificación por


reactivos. Las escalas de calificación por reactivos además incluyen las escalas Likert, de
diferencial semántico o Stapel. El escalamiento no comparativo es la técnica más utilizada en la
investigación de mercados.

Escalamiento de comparación pareada


Una técnica de escalamiento comparativo donde se muestran al encuestado dos objetos al mismo
tiempo, y se le pide que elija uno de acuerdo a ciertos criterios. Los datos obtenidos son de
naturaleza ordinal.

Transitividad de la preferencia
Suposición que se hace para convertir los datos de la comparación pareada en datos de rangos
ordenados. Ello implica que, si la marca A se prefiere a la marca B y ésta se prefiere a la marca
C, entonces la marca A se prefiere sobre la marca C. Se han sugerido diversas modificaciones a
la técnica de comparación pareada. Una implica la inclusión de una opción de respuesta neutral
no hay diferencia sin opinión. Otra extensión es la comparación pareada gradual.

Escalamiento por rangos ordenados


Técnica comparativa de escalamiento en la cual se presentan simultáneamente varios objetos a los
encuestados, y se les pide que los ordenen o clasifiquen de acuerdo con ciertos criterios. Es común
que se utilice el escalamiento por rangos ordenados para medir las preferencias por marcas y
atributos. Los datos de rangos ordenados se obtienen con frecuencia de los encuestados mediante
un análisis conjunto, ya que el escalamiento por rangos ordenados obliga al encuestado a
discriminar entre los objetos estímulo.

Escalamiento de suma constante


Técnica de escalamiento comparativo en que se requiere que los encuestados distribuyan una suma
constante de unidades como puntos, dólares, vales, engomados o fichas, entre un conjunto de
objetos estímulo con respecto a un criterio.
4

Los datos de la escala de suma constante en ocasiones se tratan como métricos. Aunque
esto resulte adecuado en el contexto limitado de los estímulos escalados, esos resultados no pueden
generalizarse a otros estímulos no incluidos en el estudio.
La principal ventaja de la escala de suma constante es que permite una discriminación fina
entre los objetos estímulo sin consumir mucho tiempo. Sin embargo, tiene dos desventajas
importantes. Los encuestados pueden asignar más o menos unidades de las especificadas. El
investigador debe modificar esos datos de alguna manera o eliminar al encuestado del análisis.
Otra dificultad potencial es el error por redondeo si se usan muy pocas unidades.

Clasificación Q y otros procedimientos


Técnica de escalamiento comparativo que utiliza el procedimiento de rangos ordenados, para
clasificar objetos en función de su similitud con respecto a cierto criterio. Otra técnica de
escalamiento comparativo es la estimación de magnitud. En esta técnica se asignan números a los
objetos, de forma tal que las razones entre los números asignados reflejen razones en el criterio
establecido. Por ejemplo, cuando se solicita a los encuestados que indiquen si están de acuerdo o
en desacuerdo con cada una de una serie de afirmaciones que miden la actitud.
También debe advertirse que las escalas comparativas, a excepción de las comparaciones
pareadas, requieren la comparación de múltiples objetos estímulo, lo cual las vuelve complicadas
para los encuestados. En contraste, en las escalas no comparativas, cada objeto se escala de manera
independiente a los otros en el conjunto de estímulos, es decir, se escala un objeto a la vez.

Escala no comparativa
Una de las dos técnicas de escalamiento, en donde cada objeto estímulo se escala
independientemente de los otros objetos del conjunto de estímulos.

Escala de clasificación continua


En una escala de clasificación continua, también conocida como escala de clasificación gráfica,
los encuestados clasifican los objetos poniendo una marca en la posición apropiada sobre una línea
que va de un extremo al otro de la variable criterio. La ventaja de las escalas continuas es que son
fáciles de construir. Sin embargo, su clasificación es engorrosa y poco confiable; además, las
escalas continuas ofrecen poca información nueva.
5

Escala de clasificación por ítem


Escala de medición que asocia números y/o descripciones breves con cada categoría. Las
categorías están ordenadas en términos de la posición de la escala. Las escalas de clasificación por
ítem se utilizan mucho en la investigación de mercados y son los componentes básicos de escalas
más complicadas, como la escala de clasificación por reactivos múltiples.

Escala de Likert
Escala de medición con cinco categorías de respuesta que van de “totalmente en desacuerdo” a
“totalmente de acuerdo”, lo cual requiere que los encuestados indiquen el grado de acuerdo o
desacuerdo con cada una de las afirmaciones relacionadas con los objetos estímulo.
La escala de Likert tiene varias ventajas. Es fácil de construir y de aplicar. A los
encuestados les resulta sencillo entender su uso, lo que la hace adecuada para aplicarse por correo,
por teléfono o en entrevistas personales. La principal desventaja de la escala de Likert es que
requiere más tiempo para completarse que otras escalas de clasificación por ítem, porque los
encuestados tienen que leer cada afirmación.

Escala de diferencial semántico


Escala de clasificación de 7 puntos cuyos extremos están asociados con etiquetas bipolares que
tienen carácter semántico. La versatilidad del diferencial semántico lo hace de gran aceptación en
la investigación de mercados. Se utiliza mucho en la comparación de marcas, productos e imagen
de las compañías. También se utiliza para desarrollar estrategias de publicidad y promoción, así
como en estudios de desarrollo de nuevos productos.

Escala de Stapel
Escala para medir actitudes que consiste en un solo adjetivo en el centro de un rango de valores de
números pares, de -5 a +5, sin un punto neutral (cero). Los datos obtenidos con una escala de
Stapel pueden analizarse de la misma forma que los datos del diferencial semántico, ya que ambas
producen resultados similares. La escala de Stapel tiene las ventajas de que no requiere una prueba
previa de los adjetivos o frases para asegurar su bipolaridad y de que puede aplicarse por teléfono.
Sin embargo, algunos investigadores creen que es confusa y difícil de aplicar.
6

Decisiones sobre escalas no comparativas de clasificación por ítem


Como indica la revisión hecha hasta ahora, las escalas no comparativas de clasificación por ítem
no tienen que usarse tal como se propuso originalmente, sino que pueden adoptar diversas formas.

Número de categorías de la escala


La decisión sobre el número de categorías de la escala implica dos consideraciones fundamentales.
Cuanto mayor sea el número de categorías, más fina será la discriminación entre los objetos
estímulo. Por otro lado, la mayoría de los encuestados no pueden manejar más de unas cuantas
categorías. Las directrices tradicionales sugieren que el número apropiado de categorías debe ser
de siete más o menos dos, es decir, entre cinco y nueve.
El modo en que se van a analizar y utilizar los datos también influye en el número de
categorías. En situaciones en las que se suman varios reactivos de la escala con el fin de producir
una sola clasificación para cada encuestado, cinco categorías son suficientes.

Escalas balanceadas frente a no balanceadas


En una escala balanceada, el número de categorías favorables y desfavorables es igual; en una
escala no balanceada es diferente. Si se usa una escala no balanceada, en el análisis de los datos
debe tenerse en consideración la naturaleza y el grado de desequilibrio.

Número par o non de categorías


Con un número non de categorías, el punto central de la escala por lo general se designa como
neutral o imparcial. La presencia, posición o etiquetamiento de una categoría neutral puede tener
una influencia significativa en la respuesta. La escala de Likert es una escala de clasificación
balanceada con un número non de categorías y un punto neutral.

Escalas forzadas frente a las no forzadas


En las escalas de clasificación forzada, los encuestados son obligados a expresar una opinión
porque no se les da la opción de “sin opinión”. En tal caso, los encuestados que no tienen opinión
pueden marcar la posición central de la escala.
7

Naturaleza y grado de las descripciones verbales


La naturaleza y el grado de la descripción verbal asociada con las categorías de la escala varían
considerablemente y tienen efecto en las respuestas. Las categorías de la escala pueden tener
descripciones verbales, numéricas y hasta pictóricas. Además, el investigador debe decidir si
etiqueta todas, algunas o sólo las categorías extremas de la escala.

Forma física o configuración


Se dispone de diversas opciones con respecto a la forma o configuración de la escala. Las escalas
se pueden presentar de manera horizontal o vertical. Las categorías pueden expresarse en cajas,
líneas discretas o unidades sobre un continuo, y pueden o no tener números asignados.
La escala del termómetro y la de la cara sonriente son dos configuraciones únicas de las
escalas de clasificación que se utilizan en la investigación de mercados. En la escala del
termómetro, cuanto más alta sea la temperatura, más favorable es la evaluación. De igual forma,
las caras felices indican evaluaciones más favorables.

Escalas de reactivos múltiples


El desarrollo de las escalas de clasificación de reactivos múltiples requiere de considerable
experiencia técnica. Por lo regular, esto se basa en la teoría, el análisis de los datos secundarios y
en la investigación cualitativa. A partir de este conjunto se genera un conjunto reducido de
reactivos potenciales de acuerdo con el criterio del investigador y de otros expertos, quienes
adoptan algunos criterios cualitativos para ayudarse en su juicio.
Mediante un pretest aplicado a una muestra grande de encuestados se obtienen los datos
sobre el conjunto reducido de reactivos potenciales. Los datos son analizados usando técnicas
como correlaciones, análisis factorial, análisis de conglomerados, análisis discriminante y otras
pruebas estadísticas. Para evaluar la confiabilidad y validez de esta escala depurada se recaban más
datos de una muestra diferente.

Evaluación de la escala
Los métodos para evaluar la confiabilidad incluyen la confiabilidad test-retest, la confiabilidad de
formas alternativas y la confiabilidad de consistencia interna. La validez se evalúa
examinando la validez de contenido, validez de criterio y validez del constructo.
8

Exactitud de la medición
La medición no es el valor real de la característica de interés, sino una observación de la misma.
Error de medición es la variación en la información buscada por el investigador y la información
generada por el proceso de medición empleado. Modelo de clasificación verdadera es el modelo
matemático que ofrece un marco para entender la exactitud de la medición. Advierta que el error
total de medición incluye el error sistemático. El error sistemático afecta la medición de manera
constante y representa factores estables que afectan la clasificación observada de la misma manera
cada vez que se hace la medición. error aleatorio no es constante. Representa factores transitorios
que afectan de diferentes maneras la clasificación observada cada vez que se hace la medición,
como los factores personales o situacionales transitorios. La distinción entre error sistemático y
aleatorio es crucial para la comprensión de la confiabilidad y validez. Confiabilidad es el grado en
que la escala produce resultados consistentes si se realizan mediciones repetidas de la
característica. La confiabilidad se evalúa determinando la proporción de la variación sistemática
en la escala. Esto se hace al establecer la asociación entre las puntuaciones obtenidas a partir de
diferentes aplicaciones de la escala.
confiabilidad test-retest es el método para evaluar la confiabilidad en que se aplica a los
encuestados conjuntos idénticos de reactivos en dos momentos diferentes en condiciones tan
equivalentes como sea posible. hay muchos problemas asociados con el método de test-retest para
determinar la confiabilidad. Primero, es sensible al intervalo entre las pruebas. Si las demás
condiciones permanecen iguales, cuanto mayor sea el intervalo, menor será la confiabilidad.
Segundo, la medición inicial podría alterar la característica medida.
confiabilidad de formas alternativas es el enfoque para evaluar la confiabilidad que
requiere que se construyan dos formas equivalentes de la escala y que los mismos encuestados
sean medidos en dos momentos diferentes. confiabilidad de consistencia interna, Método para
evaluar la consistencia interna del conjunto de reactivos cuando varios reactivos son sumados para
obtener una clasificación total de la escala. Los reactivos de la escala pueden dividirse en mitades
con base en la numeración par o non de los reactivos, o bien, de manera aleatoria. El problema es
que los resultados dependerán de cómo se dividan los reactivos de la escala. Para solucionar este
problema suele emplearse el coeficiente alfa. Coeficiente alfa es la medida de confiabilidad de
consistencia interna que es el promedio de todos los coeficientes posibles de división por mitades
que resultan de las diferentes divisiones de los reactivos de la escala. no satisfactoria de
9

consistencia interna. Una propiedad importante del coeficiente alfa es que su valor tiende a
aumentar con el incremento del número de reactivos de la escala. Por lo tanto, el coeficiente alfa
puede resultar inflado artificial e inadecuadamente por la inclusión de varios reactivos redundantes
en la escala. junto con el coeficiente alfa puede emplearse el coeficiente beta, que ayuda a
determinar si el proceso de obtención de promedios usado para calcular el coeficiente alfa está
enmascarando algunos reactivos inconsistentes.
Validez es el grado en que las diferencias en las puntuaciones obtenidas en la escala
reflejan diferencias verdaderas entre los objetos en las características medidas más que errores
sistemáticos o aleatorios. validez del contenido Tipo de validez, llamado en ocasiones validez
aparente, que consiste en una evaluación subjetiva pero sistemática de la representatividad del
contenido de una escala para la tarea de medición actual. Validez del criterio tipo de validez que
examina si la escala de medición se desempeña según lo esperado en relación con las otras
variables seleccionadas como criterios significativos.
Validez del constructo es el tipo de validez que se refiere a la cuestión de qué constructo
o característica mide la escala. Se intenta responder preguntas teóricas de por qué funciona una
escala y qué deducciones pueden hacerse respecto a la teoría subyacente. validez convergente es
la medida de validez del constructo que mide el grado en que la escala se correlaciona
positivamente con otras medidas del mismo constructo. La validez discriminante es el grado en
que una medida no se correlaciona con otros constructos de los que se supone debe diferir. Implica
la demostración de la falta de correlación entre los diferentes constructos. La validez nomológica
es el grado en que la escala se correlaciona del modo pronosticado por la teoría con medidas de
constructos diferentes, pero relacionados. Se formula un modelo teórico que lleva a otras
deducciones, pruebas e inferencias.

Resumen
Medición es la asignación de números u otros símbolos a características de objetos de acuerdo con
un conjunto de reglas. El escalamiento implica la generación de un continuo sobre el cual se
localizan los objetos medidos. Las cuatro escalas básicas de medición son nominal, ordinal, de
intervalo y de razón. De éstas, la escala nominal es la más elemental, ya que los números se usan
sólo para identificación o clasificación de los objetos. En la escala ordinal, la escala del siguiente
nivel, los números indican la posición relativa de los objetos, pero no la magnitud de la diferencia
10

entre ellos. La escala de intervalo permite la comparación de las diferencias entre los objetos. Sin
embargo, como este tipo de escala tiene un punto cero arbitrario, no tiene sentido calcular las
razones de los valores de la escala. El nivel de medición más alto está representado por la escala
de razón donde el punto cero es fijo. Con esta escala el investigador puede calcular razones de los
valores de la escala. La escala de razón incorpora todas las propiedades de las escalas de menor
nivel.
Dado el mayor nivel académico y de esnobismo del consumidor, en muchos países
desarrollados los encuestados están habituados a responder a escalas de intervalo y de razón. Sin
embargo, en los países en vías de desarrollo, las preferencias pueden medirse mejor mediante el
uso de escalas ordinales. Las consideraciones éticas requieren el uso del tipo adecuado de escala
con la finalidad de obtener los datos necesarios para responder las preguntas de investigación
y probar las hipótesis.
1) Número de categorías: Aunque no existe un solo número óptimo, las directrices
tradicionales sugieren que debe haber entre cinco y nueve categorías
2) Balanceada o no balanceada: En general, la escala debe ser balanceada para obtener datos
objetivos
3) Número par o non de categorías: Si es posible obtener una respuesta neutral o indiferente
al menos de parte de algunos de los encuestados, debe usarse un número non de categorías
4) Forzada o no forzada: En situaciones donde se espera que el encuestado no tenga opinión,
una escala no forzada mejora la precisión de los datos.
5) Descripción verbal: Hay argumentos a favor de etiquetar todas o muchas de las categorías
de la escala. Las descripciones de las categorías deben localizarse tan cerca como sea
posible de las categorías de respuesta.
6) Forma física: Deben probarse varias opciones y seleccionar la mejor

En el escalamiento no comparativo, cada objeto es escalado de manera independiente a los otros


objetos en el conjunto de estímulos. Por lo general se supone que los datos resultantes fueron
escalados como datos de intervalo o de razón. Las escalas no comparativas de clasificación pueden
ser continuas o por ítem. Estas últimas se clasifican a su vez en escalas de Likert, diferencial
semántico o de Stapel. Cuando se usan escalas no comparativas de clasificación por ítem, el
investigador debe decidir respecto al número de categorías de la escala, si la escala será balanceada
11

o no balanceada, si el número de categorías será par o non, si las escalas serán forzadas o no
forzadas, sobre la naturaleza y el grado de la descripción verbal y sobre la configuración o forma
física.
Las escalas de reactivos múltiples constan de un número de reactivos de la escala de
clasificación. Debe evaluarse la confiabilidad y validez de estas escalas. La confiabilidad se refiere
al grado en que la escala produce resultados consistentes si se hacen mediciones repetidas. Los
enfoques para evaluar la confiabilidad incluyen test-retest, formas alternativas y consistencia
interna. La validez, o exactitud de la medición, se calcula evaluando la validez del contenido,
validez del criterio y validez del constructo.
La elección de una técnica particular de escalamiento en una situación determinada debe
basarse en consideraciones teóricas y prácticas. Como regla general, la técnica de escalamiento
usada debe ser la que ofrezca el mayor nivel de información posible. También deben obtenerse
medidas múltiples.

Conclusiones
✓ El presente trabajo pretende ayudar al lector a mejorar sus conocimientos, así como las
habilidades respectivas, cabe resaltar la importancia de la medición y escalonamiento, así
también, se habla del escalonamiento comparativo y no comparativo.

✓ De acuerdo a los párrafos antes revisados se puede determinar que el investigador debe
revisar y manejar los conceptos respecto a las cuatro escalas básicas de medición, sobre
todo la escala nominal siendo elemental.

✓ Otro aspecto, es que en los países desarrollados los encuestados están habituados a
responder escala de intervalo y de razón. Sin embargo, en países en vías de desarrollo se
utilizan las escalas ordinales. La importancia de las consideraciones éticas requiere que el
investigador haga un uso adecuado de escala, así como, obtener argumentos válidos para
poder responder las preguntas de la investigación e hipótesis.

✓ Las escalas no comparativas de clasificación pueden ser continuas o por ítems. Las escalas
pueden ser de Likert, diferencial semántico o de Staped. Cuando se usan las escalas no
12

comparativas, el investigador decidir el número de categorías de escala a usar. la escala


Likert es fácil de construir y aplicar, sim embargo su desventaja es que requiere de más
tiempo que las otras escalas. Diferencial semántico cuenta con versatilidad del diferencial
semántico lo hace de gran aceptación en la investigación de mercados. Se utiliza mucho en
la comparación de marcas, productos e imagen de las compañías. Sim embargo, existe
controversia si los datos son de intervalo. Escala de Staped la cual es fácil de construir y
se puede aplicar por teléfono, aunque es confusa y difícil de aplicar.

✓ Finamente dicha revisión reforzara los conocimientos adecuados para la aplicación de la


medición y escalonamiento, ello nos permite poder formular y asesor respecto a las escalas
a usar en los instrumentos de recolección de datos, así como, su validación y confiabilidad
estadística.

Referencias

NARESH K. MALHOTRA (2008). “Investigación de mercados”. Edit. Prentice Hall

Hispano Americana S.A. México. Quinta edición. pp. 250 -296.

También podría gustarte