Universidad de Viña del Mar Escuela de Ciencias Sociales Carrera de Sociología

TECNICAS CUANTITATIVAS ESCALA LIKERT

La escala Likert, creada en 1932 por el psicólogo norteamericano Rensis Likert (1903-1981), es el instrumento más usado para medir actitudes. La escala Likert es un conjunto de aseveraciones (items) ante las cuales la persona expresa su grado de acuerdo o desacuerdo o indecisión. Cada ítem tiene habitualmente cinco opciones de respuesta: Muy de acuerdo (MA), De acuerdo (A), Indeciso (I), En desacuerdo (D) y Muy en desacuerdo (MD). No hay respuestas correctas o incorrectas. Hay items positivos, que expresan actitud positiva hacia el objeto, e items negativos, que expresan actitud negativa hacia el objeto. Si estamos midiendo actitud hacia la televisión, un ítem positivo sería “la televisión sirve para estar al día en muchos temas” y uno negativo sería “ver televisión es perder el tiempo”. Es conveniente que la escala tenga ambos tipos de items para controlar la tendencia a estar de acuerdo con las aseveraciones o a contestar mecánicamente. Los puntajes van de 1 a 5, dando mayor puntaje a la opción de respuesta que indica actitud positiva hacia el objeto. Si el ítem es positivo, la opción MA recibe 5 puntos; si es negativo, la opción MD recibe 5 puntos. En el ejemplo del párrafo anterior, recibe puntajes máximos quien está muy de acuerdo con que la televisión sirve para estar al día, y muy en desacuerdo con que ver televisión es perder el tiempo. El puntaje de una persona en la escala es la suma de los puntajes que ha obtenido en los items. A mayor puntaje en la escala, más positiva es su actitud. La escala Likert se aplica habitualmente como parte de un cuestionario, que puede contener varias escalas y otros instrumentos. La escala Likert es una escala sumatoria: sus puntajes son la suma de los puntajes de los items. Otras escalas sumatorias son las de items con opciones de respuesta de 0 a 10, y las de items dicotómicos (1=sí, 0=no). La escala Likert fue diseñada para medir actitudes pero, por lo fácil que es construirla, contestarla y analizarla, y porque sus propiedades psicométricas (validez, confiabilidad) son relativamente fáciles de evaluar, es usada para medir opiniones, percepciones, valores, aspectos de personalidad y otras variables. Por ejemplo, la ----------------------------------------------------------------------------------------------------------J. Rodríguez Cano, U.de Viña del Mar, julianrc@uvm.cl

no equivalente a la respuesta escrita. Las diferencias en los extremos de la escala no se detectan con items extremos sino con el uso de las opciones de respuesta de los items. “bien”. ‘nadie’. También se supone que una escala mide una sola dimensión y esto es menos sostenible al haber más items. con palabras simples. es problemático aplicarla a niños o a personas de muy bajo nivel educacional o con grados de analfabetismo. entendibles y familiares para el que contesta. Evitar aseveraciones de hechos objetivos o de conocimientos. Aquí hay unas cuantas: • • • • Evitar aseveraciones que se refieran a hechos del pasado. Por otra parte. en un contexto con muchos otros elementos. suelen idealizar el pasado o inventarlo.cl . La conducta se da en una situación concreta. en que todos o nadie estarán de acuerdo. cuantos más items haya. Son la respuesta verbal a una situación simbólica. ‘siempre’. Las palabras aíslan la conducta. Un problema de esta escala radica en el elemento conductual de las actitudes: es la distancia que hay entre la respuesta a palabras escritas en un papel y la conducta real. No usar. ‘nunca’. porque el error sistemático tenderá a compensarse. En vez de un ítem con dos aseveraciones. Esto depende de las características de las personas a las que se les va a aplicar y del lugar donde se hará. salvo que se justifique. Las personas suelen contestar tratando de ser consistentes con su actitud actual. Una escala larga puede aburrir y hacer que las respuestas al resto de la escala no sean contestadas o lo sean mecánicamente. no entregan información. Evitar palabras como ‘sólo’. Evitar items que contengan dos o más aseveraciones. Rodríguez Cano. mayor será la confiabilidad. por lo tanto. U. Pero no tenemos mejor alternativa: una buena medición debe contextualizar lo más posible el estímulo que aparece en el papel.de Viña del Mar. con puntajes 5 a 1 respectivamente. “regular”. el aumento va disminuyendo al agregar (ver más adelante el coeficiente Spearman-Brown). julianrc@uvm. Revelan en parte el deber ser. etc. ----------------------------------------------------------------------------------------------------------J. Los items deben ser cortos. y similares. ‘principalmente’. Una limitación de toda medición en papel es que exige un grado mínimo de comprensión de lectura.pregunta “¿Qué le pareció la selección de fútbol en el último partido?” puede tener las opciones de respuesta “muy bien”. la sacan de contexto real. palabras como ‘todos’. estar escritos en forma directa. Si simplemente no recuerdan. Los items extremos no discriminan y. Aunque la confiabilidad de una escala aumenta al tener más items. En general. Evitar items extremos. “mal” y “muy mal”. • • • ¿Cuántos items debe tener una escala? No se recomienda más de quince o veinte items. ‘solamente’. ‘ninguno’. Hay varias recetas para escribir items. es preferible dos items con una cada uno.

Definir el concepto nominal y operacionalmente. U. Esto se hace porque. (Crear más de los necesarios. la validez y confiabilidad de la escala y. Para evaluarlo se pueden tomar los grupos de los cuartiles extremos (4° y 1°) en el puntaje total y comparar sus promedios en el ítem mediante un Anova. Likert indica algunas posibles causas de que un ítem no discrimine: • Es poco entendible. de características similares a los que se les va a aplicar la escala definitiva. Se analizan los items. Se aplica la escala. Los sujetos del pretest.) 3. cuantitativa. Esto se justifica además. Rodríguez Cano. en que la actitud que la subyace es continua. aunque las opciones de respuesta de los items son variables ordinales.cl . ANALISIS DE LOS ITEMS El análisis de los items sirve para determinar cuáles se mantendrán en la escala y cuáles se han de eliminar. Para cada persona se suman los puntajes que obtuvo en los items. Aplicar un pretest. se modifican. Otra forma de hacerlo es correlacionar los puntajes del ítem y la escala. se les considera cuantitativas porque tienen más de tres categorías de respuesta. La suma es su puntaje en la escala.de Viña del Mar. contestan los items e indican qué problemas han tenido al hacerlo. para posibles reemplazos. 2. Un ítem discrimina si separa a los sujetos en el ítem en forma similar a como los separa en la actitud. julianrc@uvm. si corresponde. Construcción de items. 5. 4. expresada en el puntaje de la escala. teóricamente.Las etapas en la construcción de la escala son: 1. Se espera que los items discriminen y que se correlacionen positivamente entre sí. Escribir items positivos y negativos. ----------------------------------------------------------------------------------------------------------J.

conviene eliminar uno porque está midiendo lo mismo que el otro. el mismo concepto. Esto se da habitualmente en items muy extremos. Se verá aquí otra forma de confiabilidad. Si miden lo mismo. Cuanto más alta es la correlación. especialmente aplicable a escalas y tests. mayor es la medición común del concepto. U. además. da doble ponderación al aspecto medido. es extremadamente alta. deben estar también correlacionados con la escala. la consistencia interna. que correlaciona los puntajes de las dos mitades del test. Se deben eliminar los items que están poco correlacionados con los demás y con la escala. CONFIABILIDAD: CONSISTENCIA INTERNA Se han analizado antes dos formas de confiabilidad: la estabilidad del instrumento y el grado de acuerdo entre jueces. Los items deben estar correlacionados entre sí. julianrc@uvm. Si la correlación es negativa hay que considerar invertir su codificación. La consistencia interna de un instrumento consiste en que cada parte de la escala mida lo mismo. Los primeros métodos usados fueron los de equivalencia. Además de alargar inútilmente la escala. probablemente su correlación con la escala será baja. Un ítem que discrimina adecuadamente está también correlacionado con los demás items y con la escala. Los items que están poco correlacionados miden cosas diferentes.de Viña del Mar. Rodríguez Cano. Si dos items están correlacionados. Un peligro al eliminar muchos items es que algunas dimensiones pueden quedar con muy pocos items o con ninguno. quiere decir que miden lo mismo. personas en diferentes posiciones de la escala tienen igual probabilidad de estar de acuerdo). Cuando hay pocos items conviene correlacionar cada ítem con la escala sin el ítem. y de cada uno con los demás. Esta atenuación también ocurre cuando se disminuye el número de opciones de respuesta de los items. Un ítem debe ser también eliminado si está correlacionado positivamente con algunos items y negativamente con otros. Sin embargo. como el ‘split-half’.• • Se refiere a algo diferente del resto de los items (por lo tanto. su correlación con la escala no será 0 porque el ítem es parte de la escala. de manera que sea indiferente cuál parte del instrumento usamos en nuestra medición. Por lo tanto. produzca resultados similares. Hay que tener presente que aunque un ítem no esté correlacionado con ninguno otro. La correlación disminuye si los items tienen poca varianza. Es respondido igual (o casi igual) por todo el grupo. si la correlación entre dos items.cl . que es la suma de los items. Un ítem poco correlacionado no aporta a la escala y disminuye su validez y su confiabilidad. si son ----------------------------------------------------------------------------------------------------------J.

k = 2. la confiabilidad estimada del nuevo test será: 2 (.85) 1+ 3 ( ) ( ) en que k = 20/30 = 2/3. la correlación será alta. Por ejemplo. la fórmula del coeficiente de Spearman-Brown se simplifica a: r= 2r ' 1+ r ' Por ejemplo. como cuando sabemos la confiabilidad de las mitades y queremos conocer la del test entero.60) Se puede también usar la fórmula de Spearman-Brown para estimar cuántos items se necesitan para conseguir una determinada confiabilidad: k= r (1 − r ') r '(1 − r ) Por ejemplo. Está atenuada porque cada parte tiene la mitad de los items del test.75 1 + (.de Viña del Mar. al aumentar o disminuir el número de items: r= kr ' 1 + (k − 1)r ' en que r’ es la confiabilidad de la escala inicial. si la correlación de las mitades ( r ' ) es . k=2 si se aumenta al doble. k=. la confiabilidad del test 2(. ----------------------------------------------------------------------------------------------------------J. julianrc@uvm. k es el tamaño de la nueva escala con respecto a la escala inicial (por ejemplo. si un escala de quince items tiene confiabilidad .cl . Si se duplica el tamaño del test.79.85) 3 r= = . El nuevo test tendrá una confiabilidad de . Rodríguez Cano.60.equivalentes. se quiere acortar un test de treinta a veinte items. y r es la confiabilidad de la nueva escala.5 si se acorta a la mitad).60) entero será r = = . eligiéndolos al azar.80? La respuesta es 26 items. ¿cuántos items se estima debería tener para que la confiabilidad fuera .) La fórmula de Spearman-Brown sirve para estimar la confiabilidad al alargar o acortar un instrumento. Se puede ver que en este caso.70. (Se sabe que la confiabilidad aumenta al alargar un test. Si la confiabilidad del test de treinta items es .79 2 − 1 (.85. Ésta no indica la confiabilidad del instrumento sino la de cada una de las mitades. U.

y es aun menor al continuar aumentando k. se puede decir que es varianza ‘mala’. Pero. Si una escala Likert tiene dos items. sino de una manera más fácil. la varianza es la suma de las varianzas de los k items más dos veces la suma de las covarianzas de todos los pares de items. Las covarianzas indican consistencia de los items. julianrc@uvm. El cálculo de α no se realiza correlacionando todos los pares de mitades. su varianza es: s = ∑ s + 2∑ 2 x i =1 2 i i =1 k k ∑ Cov j=1 k ij . Rodríguez Cano. las varianzas indican variación no compartida por los items. Mide el grado en que los items son consistentes. El coeficiente α es la medida más usada para medir confiabilidad de escalas y tests. Es una matriz simétrica porque los dos triángulos son iguales. Si se parte un test en todos las posibles pares de mitades y se calcula una correlación para cada par. La suma de todos los elementos de la matriz es igual a la varianza de la escala. que van en la misma dirección. pueden haber muchas correlaciones. su varianza es la suma de las varianzas de cada ítem más dos veces su covarianza. Esto se puede superar correlacionando los puntajes de los items pares e impares.de Viña del Mar. el promedio de estas correlaciones es numéricamente igual al coeficiente α creado por Lee Cronbach en los años 50. Si x es la suma de k elementos. Ésta crece en menor proporción.No hay una relación proporcional entre el aumento del largo del test y el aumento de la confiabilidad. la varianza de x es igual a la suma de la varianza de x1 más la de x2 más dos veces la covarianza de x1 y x2 . Las covarianzas indican variación compartida por los items. las varianzas indican inconsistencia. Si hay k items. U.cl . ----------------------------------------------------------------------------------------------------------J. usando la matriz de covarianza de los items. En la diagonal principal. se puede decir que es varianza ‘buena’. Es sabido que si x = x1 + x2 . La objeción que se hace al método de ‘split-half’ es que el cansancio o la reactividad pueden hacer diferentes las respuestas de cada mitad. y también menor cuanto mayor sea r. dado que la ubicación de los items en la escala es arbitraria. Esto se debe al factor ‘techo’: r no puede ser mayor de 1. en que i<j. en que miden lo mismo. Los elementos de la matriz de covarianzas son las varianzas en la diagonal principal y las covarianzas en los dos triángulos (arriba y abajo de la diagonal principal). Los items pueden variar conjuntamente con otros items (covarianzas) o separadamente (varianzas).

En la tabla de datos siguiente.Cuanto mayores son los valores de las covarianzas y menores los de las varianzas. Se considera que un valor superior a . pueden desecharse los items que menos aportan a la confiabilidad de la escala (la salida de Spss indica qué pasaría si se eliminara cada ítem). más consistente es la escala. Muestra el análisis de la consistencia interna de una escala Likert.80 es aceptable. Es simétrica: ----------------------------------------------------------------------------------------------------------J. ‘de varianza-covarianza’). y s x es la varianza de la escala total. como en esta salida de Spss. ITEMS 1 3 4 4 3 2 3 4 4 3 2 3 5 2 2 2 3 2 1 1 4 3 3 3 3 4 3 1 2 2 2 1 2 3 3 2 1 3 3 4 4 4 5 5 4 3 5 5 4 3 3 3 5 3 4 3 2 2 3 3 4 4 2 3 3 2 -------------------------------------------------------------Se muestra a continuación la matriz de covarianzas (llamada a veces. los items están en las columnas y las personas en las líneas. La fórmula de α es: k ⎛ 2 ⎞ ⎜ ∑ si ⎟ k ⎜1 − i=1 2 ⎟ α= k −1⎜ sx ⎟ ⎜ ⎟ ⎝ ⎠ en que k es el número de items. Los valores de α van de 0 a 1. Una escala Likert de cinco items es aplicada a doce personas. Rodríguez Cano.cl . U.de Viña del Mar. si2 es la varianza del ítem i. Se presenta abajo una salida de Spss a la que he agregado comentarios.70 ó . Si es menor. La fórmula contiene un factor de corrección (k / k-1) y la proporción de varianza ‘buena’ (igual a uno menos la proporción de varianza ‘mala’). julianrc@uvm.

de Viña del Mar.545455 --------------------------------------------------------------- R E L I A B I L I T Y A N A L Y S I S - S C A L E (A L P H A) Statistics for SCALE Mean 15.6098 .992424 0.4167 12.0000 12.090909 0.7197 5.727273 0.1929 .sus triángulos superior e inferior son iguales. Rodríguez Cano.9091 Corrected ItemTotal Correlation .6436 .0451 N of Variables 5 ---------------------------------------------------------------- ITEM-TOTAL Statistics Scale Mean if Item Deleted ITEM1 ITEM2 ITEM3 ITEM4 ITEM5 Alpha = 11.181818 0.7281 El coeficiente α es aceptable (.0000 . U.7537).3333 5.6667 12.272727 0.515152 0.090909 0.4683 Alpha if Item Deleted .7537 Scale Variance if Item Deleted 5.7118 .181818 ITEM3 ITEM4 ITEM5 0.7064 .6364 6.492424 0. VARIANCE-COVARIANCE MATRIX ITEM1 ITEM2 ITEM3 ITEM4 ITEM5 ITEM1 0.363636 ITEM2 0. julianrc@uvm. Spss muestra sólo uno.628788 0.cl .9167 11.0000 Variance 9.9015 7. pero la última columna (‘Alpha if Item Deleted’) nos dice que puede aumentar a .7687 .2727 Std Dev 3.8175 .787879 0. el inferior.8175 si se elimina el ítem 4.090909 0. En la diagonal principal aparecen las varianzas de cada ítem.515152 0. Se puede ver la baja correlación de este ítem con el conjunto de los demás: .5374 . ----------------------------------------------------------------------------------------------------------J.1929 (columna ‘Corrected ItemTotal Correlation’).

Item 1 Item 1 Item 2 Item 3 10 5 4 Item 2 5 5 3 Item3 4 3 8 Ejercicio 2.6667 8. R E L I A B I L I T Y Scale Mean if Item Deleted ITEM1 ITEM2 ITEM3 ITEM4 ITEM5 Alpha = 14.5333 .7155 .5282 .5402 .6282 .4167 8.0000 Scale Variance if Item Deleted 4.7793 .8099 .9167 8.0000 Variance 7.1333 12.8286 7.8381 S C A L E (A L P H A) Corrected ItemTotal Correlation .8375 Alpha = .4545 Corrected ItemTotal Correlation . los cambios que ha producido la eliminación del ítem 4: R E L I A B I L I T Y A N A L Y S I S S C A L E (A L P H A) Statistics for SCALE Mean 11.7810 6.4470 5. Analizar la siguiente salida de Spss para una escala de cinco items.6430 Alpha if Item Deleted .1143 6.7656 .0667 12. después sólo el item 2.5696 ----------------------------------------------------------------------------------------------------------J.2652 4.4000 13.4743 Alpha if Item Deleted .7066 A N A L Y S I S Scale Variance if Item Deleted 6.8175 Ejercicio 1.A continuación.7515 .5781 . julianrc@uvm.6667 .2396 .4441 .4000 12.de Viña del Mar.6434 .6996 .0606 4. Después calcularlo eliminando sólo el item1. U. después sólo el item 3.cl . Rodríguez Cano.6364 Std Dev 2. Calcular α a partir de la siguiente matriz de covarianzas.2667 4.7634 N of Variables 4 ITEM-TOTAL Statistics Scale Mean if Item Deleted VAR00001 VAR00002 VAR00003 VAR00005 7.

y hay que rehacer la escala. por lo tanto. Esto puede producirse: (1) cuando los items negativos no han sido recodificados. si el numerador es mayor que el 2 sx denominador. (2) si los items tienen realmente covarianzas negativas porque miden cosas diferentes. y q es la proporción en desacuerdo. En la fórmula de α se puede ver que es mayor que 1. p es la proporción de personas de acuerdo con el ítem. Para demostrar esto empecemos calculando el promedio Lo haremos con la siguiente tabla. La fórmula es similar a α. Para que esto ocurra. en que las frecuencias están expresadas en proporciones (p y q) cuya suma es n = 1.de Viña del Mar. x 1 0 f p q 1 fx p 0 p ----------------------------------------------------------------------------------------------------------J.A veces puede aparecernos un α negativo.cl . El promedio de un ítem dicotómico es p y su varianza es pq. U. k ⎛ ⎞ ⎜ ∑ pi q i ⎟ k ⎜1 − i=1 2 ⎟ KR20 = k −1⎜ sx ⎟ ⎜ ⎟ ⎝ ⎠ Una escala de items dicotómicos presenta aseveraciones y las personas optan por las respuestas ‘sí’ o ‘no’. la suma de las covarianzas tiene que ser negativa. con puntajes 1 y 0 respectivamente. con la varianza (piqi) del ítem dicotómico i. Rodríguez Cano. p + q = 1. o sea. esto es posible sólo si ∑s i =1 k 2 i El coeficiente KR20 de Kuder-Richardson es usado para medir la consistencia interna de escalas de items dicotómicos. julianrc@uvm.

La fórmula de la varianza en tablas de frecuencia es: s = n x 1 0 f p q 1 x. la varianza de un ítem dicotómico es: s2 = Σ f ( x − X ) 2 pq = = pq n 1 El coeficiente KR20 fue creado por G.cl . El coeficiente α de Cronbach. INTERPRETACION DE PUNTAJES La escala Likert diferencia personas: a mayor puntaje. creado unos quince años después. quiere decir que 60 % de las personas está de acuerdo. no es posible interpretar un puntaje en forma absoluta. F. significa que es una variable cuantitativa. no se puede decir que tenga una actitud positiva o negativa. U. o muy cercanos a ellos. y que n=1. W. Por lo tanto. Que tenga sentido calcular el promedio de una variable dicotómica. más positiva es su actitud. que el resultado sea interpretable. Richardson a fines de los años 30.de Viña del Mar. No existe un puntaje ----------------------------------------------------------------------------------------------------------J. n 1 El promedio de un item dicotómico es la proporción de casos de acuerdo con el ítem.X )2 q2 p2 f (x . Hay que recordar que esto es posible sólo si los valores asignados a las respuestas son 1 (sí) y 0 (no). Demostremos que la varianza de un ítem dicotómico es pq usando la siguiente ∑ f ( x − X )2 2 tabla. julianrc@uvm.X q -p (x .X )2 pq2 p2q pq(p+q) Dado que p+q=1. es una generalización del KR20 para todo tipo de items. sino con respecto al grupo. Rodríguez Cano. Kuder y M. si el promedio = p = .60.El promedio de la variable dicotómica es: X = ∑ fx = p = p . Sin embargo. Salvo que una persona tenga el puntaje máximo o el mínimo.

cl . julianrc@uvm. Cuando los puntajes son estandarizados (se transforman a desviaciones standard: puntaje z). es rápida y barata. los valores son referidos al grupo. Si se aplica la escala a una o más muestras. sirven para comparar. no lo es el puntaje central de la escala (el punto medio entre el mínimo y el máximo posibles). • • • • • ----------------------------------------------------------------------------------------------------------J. VENTAJAS DE LA ESCALA LIKERT • Es un instrumento estructurado. formato y opciones de respuesta. Puede abarcarse a gran cantidad de personas. Esto hace inncecesario formular items extremos (que además no discriminan) para detectar diferencias. y sirven para comparar. recomendaciones. la persona se siente más libre para opinar sobre temas comprometedores. que permiten interpretar puntajes refiriéndolos a la población. Se dice que la escala ha sido estandarizada. no ya con el grupo o muestra. Como cada ítem tiene varias opciones y los puntajes de los items se suman. La ‘responsabilidad’ de lo afirmado en la aseveración se traslada del entrevistado al entrevistador. Tampoco estar sobre la mediana de los puntajes del grupo indica una actitud positiva. expresados en percentiles. sólo que se está en la mitad de la muestra que tiene una actitud más favorable (o menos desfavorable). puede ser usada como instrumento permanente. Como los items no consisten en preguntas sino en aseveraciones. Aplicada en un cuestionario. Si la escala tiene buena validez y confiabilidad. sino con lo que podría ser considerada la población. lo que disminuye sus problemas de confiabilidad: las personas reciben los items presentados de la misma manera. grande(s) y representativa(s) de una población específica. Rodríguez Cano. Los datos que produce son fáciles de manejar usando programas estadísticos. se pueden asociar puntajes a percentiles. U.de Viña del Mar. la escala muestra las diferencias entre las actitudes de las personas. Los puntajes. que habitualmente contienen los coeficientes necesarios para evaluar las propiedades de la escala. El costo por persona es relativamente bajo. En este caso se habla de establecer normas.neutral. con igual introducción.

Sign up to vote on this title
UsefulNot useful