Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Analisis Likert
Analisis Likert
1. INTRODUCCIN.
El mtodo de escalamiento de Likert es el mtodo ms utilizado en
Psicologa para medir actitudes, y su uso se ha extendido a la medicin de
otros constructos, como por ejemplo las dimensiones de personalidad.
Likert (1932) propuso su mtodo de escalamiento a finales del primer
tercio del siglo XX. Previamente, Thurstone (1928) haba propuesto un mtodo
para la medicin de actitudes que implicaba la participacin de sujetos que
desempeaban el papel de jueces (el mtodo de los intervalos aparentemente
iguales). Segn Thurstone (1928), el nmero de jueces debea oscilar entre
200 y 300. La tarea de estos sujetos consista en valorar un conjunto de tems.
A partir de estas valoraciones, se calibraban los tems, es decir, se estimaba el
valor del tem en la escala. Una vez se dispona de un conjunto de tems
calibrados que constituan un cuestionario, ste se aplicaba al grupo de sujetos
que se deseaba estudiar, y se les peda que marcaran los tems con los que
estaban de acuerdo y aqullos con los que disentan. La puntuacin de cada
persona consista en la media de los valores de los tems con los que estaban
de acuerdo. El empleo de un nmero elevado de jueces y la necesidad de
calibrar los tems hacan que este mtodo fuera muy costoso y laborioso.
Asimismo, el mtodo de Thurstone implicaba una serie de supuesto
estadsticos que no haban sido verificados, por ejemplo, que los valores de
escala de los enunciados son independientes de la distribucin de actitudes de
los jueces que los valoran (Likert, 1932).
Tras reconocer la importancia de las aportaciones de Thurstone en el
terreno de la medicin de las actitudes, Likert (1932) se pregunt si la
construccin de escalas de medida mediante procedimientos ms sencillos
dara resultados tan buenos como los obtenidos por Thurstone en cuanto a la
fiabilidad y validez de las medidas, y si sera posible construir escalas evitando
asumir supuestos estadsticos innecesarios. As pues, el objetivo principal de
ACTITUD
puntuacin que indique el grado de actitud hacia la escuela de manera que a mayor puntuacin se
pueda inferir una actitud ms favorable, entonces habr que transformar los tems que denotan una
actitud desfavorable. Antes de la transformacin, estos tems suelen denominarse tems invertidos.
Cuando se trabaja con una base de datos grande, la transformacin de los tems invertidos
puede realizarse fcilmente con la ayuda de un programa estadstico de anlisis de datos, o incluso
con una hoja de clculo, implementando una frmula de transformacin. Si la escala de respuesta
empleada presenta como valor ms pequeo el 1 (que es lo ms frecuente), entonces la frmula de
transformacin es:
Pi = (Pm+1) - Po
donde:
Pi : puntuacin transformada en el tem invertido lista para calcular la puntuacin total en
el cuestionario;
Pm : puntuacin mxima que puede darse al tem;
Po : puntuacin original obtenida en el tem invertido.
Si la escala de respuesta utilizada para contestar los tems presenta como valor ms
pequeo el cero, entonces la frmula de transformacin es:
Pi = Pm - Po
Por ejemplo, supongamos que un sujeto ha contestado cuatro tems del cuestionario de
actitudes hacia la escuela utilizando una escala de respuesta de 6 puntos como la presentada en este
mismo apartado. Imaginemos que sus puntuaciones en los tems son las siguientes:
Items
Puntuacin (Po)
1. La escuela es divertida....................................................5
2. En la escuela aprendo cosas tiles...................................6
3. La escuela es un rollo......................................................2
4. En la escuela pierdo el tiempo.........................................1
Los tems 1 y 2 manifiestan una actitud favorable, mientras que los tems 3 y 4 denotan una actitud
desfavorable. Procedamos ahora a transformar los tems 3 y 4 aplicando la frmula
correspondiente. Como la escala de respuesta oscila entre 1 y 6, aplicaremos la frmula P i =
(Pm+1) - Po.
Items
Puntuacin (Po)
3. La escuela es un rollo...................................2.....................................(6+1)-2 = 5
4. En la escuela pierdo el tiempo......................1.....................................(6+1)-1 = 6
Ahora que ya hemos transformado las puntuaciones obtenidas en los tems invertidos,
podemos calcular la puntuacin total de cada sujeto en el cuestionario. Como se indic al comienzo
de este tema, la puntuacin total de un sujeto en el cuestionario se determina sumando o
promediando los valores de las alternativas de respuesta escogidas ante cada tem (Likert, 1932),
razn por la que las escalas o cuestionarios construidos siguiendo este mtodo se denominan
escalas sumativas. En el ejemplo anterior, la puntuacin total del sujeto sera:
Items
Puntuacin
1. La escuela es divertida....................................................5
2. En la escuela aprendo cosas tiles...................................6
3. La escuela es un rollo......................................................5
4. En la escuela pierdo el tiempo.........................................6
Puntuacin total (suma)......................................................22
r S
riTiT
donde, riT es la correlacin tem- 2S2r test, Si es la desviacin tpica que muestran las puntuaciones
Ti
en el tem, y ST es la desviacin
tpica que presentan las puntuaciones en test.
ITEM1
4
2
5
3
5
2
5
4
2
3
2
4
2
4
1
4
ITEM2
5
2
6
2
6
1
3
5
1
2
3
5
3
5
2
5
ITEM3
5
1
4
3
4
1
2
5
1
1
1
6
1
4
1
6
ITEM4
4
2
5
3
5
1
5
5
2
1
2
4
1
6
2
5
TEST
18
7
20
11
20
5
15
19
6
7
8
19
7
19
6
20
En la tabla siguiente, se muestran los estadsticos necesarios para calcular IH. Tan slo hay que
recordar que en nuestro caso la variable X es el tem 1, y la variable Y la puntuacin en el test. As
pues, vemos que ztem1 ztest = 13.47, es decir, ya tenemos el valor del sumatorio del producto
cruzado de las puntuaciones tpicas, que es el numerador de la frmula del coeficiente de
correlacin.
SUJETOS
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
SUMA
MEDIA
D.T.
ITEM1
4
2
5
3
5
2
5
4
2
3
2
4
2
4
1
4
ITEM2
5
2
6
2
6
1
3
5
1
2
3
5
3
5
2
5
ITEM3
5
1
4
3
4
1
2
5
1
1
1
6
1
4
1
6
ITEM4
4
2
5
3
5
1
5
5
2
1
2
4
1
6
2
5
TEST
18
7
20
11
20
5
15
19
6
7
8
19
7
19
6
20
3,25
1,29
3,50
1,75
2,88
1,96
3,31
1,74
12,94
6,23
tem 1
z test
ZITEM1
0,58
-0,97
1,36
-0,19
1,36
-0,97
1,36
0,58
-0,97
-0,19
-0,97
0,58
-0,97
0,58
-1,74
0,58
ZTEST
0,81
-0,95
1,13
-0,31
1,13
-1,27
0,33
0,97
-1,11
-0,95
-0,79
0,97
-0,95
0,97
-1,11
1,13
ZITEM1 X ZTEST
0,47
0,92
1,54
0,06
1,54
1,23
0,45
0,57
1,08
0,18
0,77
0,57
0,92
0,57
1,94
0,66
13,47
13.47
0.84
16
El resultado obtenido indica que el tem est muy relacionado con el resto de tems que
componen el test, debido a que miden la misma actitud. Como caba esperar, el IHc es menor
que el IH, y la diferencia es apreciable debido a la pequea longitud del test: tan slo 4 tems. En
este caso un 25% del test (es decir, 1 tem de 4) es parte de las dos variables que correlacionamos
cuando calculamos el IH. Este porcentaje se reduce a medida que aumenta la longitud del test
(cuando la longitud del test es 5, el porcentaje es del 20%; cuando 6, el 17%; cuando 7, el 14%, ...).
Por ello, cuanto mayor sea la longitud del test menor ser la diferencia entre el IH y el IHc. Cuando
trabajamos con tests muy largos la diferencia es muy pequea.
10
11
Ejemplo de clculo.
Vamos a aplicar este tipo de anlisis basado en el criterio de consistencia interna a los datos
que utilizamos anteriormente. Como en el caso anterior, el anlisis se centrar en el tem 1. En la
siguiente tabla aparecen las puntuaciones de los 16 sujetos, pero stos han sido ordenados de
manera decreciente en funcin de su puntuacin en el test. Los sujetos que configuran los dos
grupos con puntuaciones extremas en el test estn marcados en negrita.
SUJETOS
3
5
16
8
12
14
1
7
4
11
2
10
13
9
15
6
ITEM1
5
5
4
4
4
4
4
5
3
2
2
3
2
2
1
2
MEDIA A
4,5
MEDIA B
1,75
D. T. A
0,5
D. T. B
0,43
ITEM2
6
6
5
5
5
5
5
3
2
3
2
2
3
1
2
1
ITEM3
4
4
6
5
6
4
5
2
3
1
1
1
1
1
1
1
ITEM4
5
5
5
5
4
6
4
5
3
2
2
1
1
2
2
1
TEST
20
20
20
19
19
19
18
15
11
8
7
7
7
6
6
5
estadsticas
X A XB
H0 : A B
X A XB
4.51.75
8.34
1 El ejemplo que se presenta pretende ayudar al lector a aplicar esta prueba en el anlisis de
tems. En la prctica, y trabajando con muestras ms grandes, es necesario verificar hasta qu
punto se cumplen los supuestos de la prueba.
12
Ejemplo de clculo.
2 Estas dos propiedades sern objeto de un estudio ms detenido en el bloque de temas
dedicado a la Teora de los Tests.
13
Con los datos del ejemplo que estamos utilizando, vamos a calcular el coeficiente alfa del
cuestionario de actitudes hacia la escuela. En la primera tabla que hemos mostrado, aparecen las
desviaciones tpicas de cada uno de los cuatro tems y de las puntuaciones totales en el test. Con
esta informacin ya podemos aplicar la frmula del coeficiente alfa de Cronbach:
n 2
S
El n i1 i 4 1.2921.752 1.9621.742 resultado obtenido indica que el cuestionario es fiable.
1 2 1 2 0.93
1n Sx 3 6.23
La
validez de un test hace referencia al grado en el que un test mide lo que
pretende
medir. El estudio de la validez de un test se desarrolla a partir de la
verificacin de las hiptesis de validacin. Una hiptesis de validacin hace referencia a las
relaciones que presentar el test objeto de estudio con otras variables, bajo el supuesto de que mide
lo que pretenda medir. Por ejemplo, en el caso del cuestionario de actitudes hacia la escuela una
hiptesis de validacin podra ser la siguiente: Se espera que las puntuaciones totales en el test
presenten una correlacin positiva con el rendimiento acadmico, de manera que a mayor
puntuacin en el test se observe un mayor rendimiento acadmico. Las hiptesis de validacin se
fundamentan en teoras contrastadas y/o en resultados empricos previos. La hiptesis de validacin
indica cul es el mtodo estadstico que se utilizar para su verificacin. En el caso anterior, la
hiptesis alude a la relacin entre dos variables cuantitativas, por lo tanto, su verificacin se
realizara calculando el coeficiente de correlacin entre las variables. Las hiptesis de validacin
pueden tomar diversas formas, y por lo tanto, pueden ser diversos los mtodos estadsticos
implicados en su verificacin. Para ilustrar este punto, veamos otro ejemplo. Supongamos que se ha
elaborado un cuestionario de actitud hacia el aborto. Si el test mide la actitud que pretende medir,
las puntuaciones en el test de dos grupos de sujetos que mantienen actitudes extremas y opuestas,
deberan ser diferentes. Por lo tanto, en el proceso de validacin del test se ha elaborado la
siguiente hiptesis de validacin: La puntuacin media en el test de un grupo de mujeres
pertenecientes a asociaciones feministas ser mayor que la puntuacin media de un grupo de
mujeres pertenecientes a asociaciones catlicas. En este caso, la hiptesis de validacin implica la
comparacin de dos medias, comparacin que se puede realizar mediante la prueba t
correspondiente. Obsrvese que a diferencia de lo que ocurra cuando se usaba el criterio de
consistencia interna para analizar los tems, aqu se definen los dos grupos con actitudes opuestas y
extremas en base a un factor externo al test: su pertenencia a asociaciones que mantienen posturas
contrarias respecto al aborto.
14
que requieren un alto grado de actitud favorable para dar una respuesta de acuerdo, entonces
podramos inferir que ese sujeto tiene un nivel de actitud muy favorable.
Por todo ello, para poder interpretar las puntuaciones obtenidas en una escala Likert es
necesario referirlas a las puntuaciones obtenidas por el grupo de referencia al que pertenece el
sujeto. Una forma de hacerlo es calcular la diferencia entre las puntuaciones de los sujetos (X i) y la
media del grupo (es decir, calcular las puntuaciones diferenciales). Adems, podemos medir esas
diferencias utilizando como unidad de medida la desviacin tpica de las puntuaciones en el
cuestionario en ese grupo. Para ello dividiremos las diferencias por la desviacin tpica, lo cual no
es ms que transformar las puntuaciones directas en el test (Xi) en puntuaciones tpicas (zi):
Las puntuaciones tpicas nos
X i X indican cuntas desviaciones tpicas se
aleja la puntuacin del sujeto de la media z i S
de su grupo, y en qu sentido. Por
x
ejemplo, si un sujeto presenta una zi =
-0.5, entonces podemos decir que se trata
de un sujeto que est media desviacin tpica por debajo de la media del grupo. Si las puntuaciones
en el test siguen una distribucin aproximadamente normal, entonces, con ayuda de las tablas de la
distribucin normal, podemos transformar esa puntuacin tpica en el porcentaje de sujetos que
quedan por debajo (o por encima) de esa puntuacin. El valor de probabilidad (funcin de
distribucin) asociado a zi = -0.5 es 0.3085. Ahora podemos decir que el sujeto que ha obtenido una
zi = -0.5 supera aproximadamente al 31% de los sujetos de su grupo. Si las puntuaciones en el test
no siguen una distribucin aproximadamente normal no debe realizarse esta ltima transformacin.
Entonces podemos calcular el centil que corresponde a cada puntuacin en el test. De esta manera
sabremos cul es el porcentaje de sujetos que queda por debajo de cada puntuacin en el test.
5. VALORACIN.
Una de las crticas que suele hacerse del mtodo de escalamiento de Likert es que no est
basado en un modelo matemtico determinado. Esta es una diferencia importante con los mtodos
desarrollados por Thurstone, que bas sus mtodos en una serie de supuestos formales y unas leyes
(por ejemplo, la Ley del Juicio Comparativo). En todo caso, el mtodo de Likert puede emnarcarse
dentro del mbito ms general de la Teora Clsica de los Tests.
Otra crtica se refiere al uso del coeficiente de correlacin tem-test (ndice de
homogeneidad) como base para realizar el anlisis correlacional de los tems. Ya hemos sealado
que para evitar aumentar artificialmente esa correlacin es necesario utilizar el ndice de
homogeneidad corregido.
La verificacin de la unidimensionalidad del test tambin presenta ciertas deficiencias.
Likert (1932) supona que una vez se hubiera eliminado todos los tems indiferenciadores, los tems
restantes mediran una misma dimensin subyacente o actitud. Sin embargo, esto no tiene que ser
necesariamente as. Si un test mide dos actitudes diferentes pero relacionadas, los IHc sern
probablemente elevados, y llevarn a la conclusin errnea de que los tems miden una nica
actitud. El clculo de los IHc no es una buena base para evaluar la unidimensionalidad del test. En
su lugar hay que utilizar mtodos ms apropiados como el anlisis factorial.
Recordemos que Likert pretenda desarrollar un mtodo sencillo para medir las actitudes
que ofreciera resultados similares al mtodo ms costoso de los intervalos
aparentemente iguales desarrollado por Thurstone. Likert (1932) observ que
15
la fiabilidad de los cuestionarios producidos por los dos mtodos era muy
similar, y que la correlacin entre las puntuaciones obtenidas por los dos
mtodos era muy elevada. Estos resultados muestran que Likert consigui su
objetivo. Quizs lo que no previ Likert es que su mtodo tuviera tanto xito.
Su relativa sencillez, en comparacin a otros mtodos ms modernos, es la
responsable de que actualmente sea todava el mtodo ms utilizado para
medir actitudes, dimensiones de la personalidad, y otros constructos
psicolgicos.
BIBLIOGRAFIA.
Arce, C. (1994). Construccin de escalas psicolgicas. Madrid: Sntesis.
Garca Cueto, E. (1993). Introduccin a la psicometra. Madrid: Siglo XXI.
Meli, J. L. (1991). Mtodos de escalamiento unidimensional. Valencia: Cristbal Serrano Villalba.
Sancerni, M. D.; Meli, J. L.; Gonzlez Rom, V. y Daz, J. V. (1992). Psicometra: Problemas y
Prcticas. Valencia: Cristbal Serrano Villalba.
Wainerman, CH (1976) Escalas de medicin en Ciencias Sociales. Buenos Aires: Nueva Visin.
16
Referencias bibliogrficas.
Andrich, D. & Schoubroeck, L. (1989). The General Health Questionnaire: a
psychometric analysis using latent trait theory. Psychological Medicine, 19,
469-485.
Andrich, D.; Jong, J. y Sheridan, B. E. (1997). Diagnostic opportunities with
the Rasch model for ordered response categories. En J. Rost y R.
Langeheine (Eds.), Applications of latent trait and latent class models in
the social sciences (pp. 58-68). Mnster, Germany: Waxman Verlag.
Bock, R. y Jones, L. V. (1968). The measurement and prediction of
judgement and choice. San Francisco: Holden Day.
Dubois, B. y Burns, J. A. (1975). An analysis of the meaning of the question
mark response category in attitude scales. Educational and
Psychological Measurement, 35, 869-884.
Edwards, A. L. (1957). Techniques of attitude scale construction. New York:
Appleton-Century-Crofts.
Espejo, B. y Gonzlez-Rom, V. (1999). El significado de las categoras
centrales en las escalas tipo Likert. Trabajo presentado al VI Congreso de
Metodologa de las CC. Sociales y de la Salud. Oviedo, Espaa.
Espejo, B. y Gonzlez-Rom, V. (2001). Orden y relevancia de las alternativas de respuesta
"no estoy seguro", "trmino medio" y "?". Trabajo presentado al VII Congreso de
Metodologa de las CC. Sociales y de la Salud. Madrid, Espaa.
Hernndez, A.; Espejo, B.; Gonzlez-Rom, V. y Gmez-Benito, J. (en prensa).
Escalas de respuesta tipo Likert: es relevante la alternativa indiferente?.
Metodologa de Encuestas
Kaplan, K. J. (1972). On the ambivalence-indifference problem in attitude
theory: A suggested modification of the semantic differential technique.
Psychological Bulletin, 77, 361-372.
Likert, R. (1932). A technique for the measurement of attitudes. Archives of Psychology, 140, 1-50.
(Traduccin al castellano en C. H. Wainerman (Comp.) (1976), Escalas de medicin en
ciencias sociales, pp-199-260. Buenos Aires: Nueva visin.
McIver, J. P. y Carmines, E. G. (1981). Unidimensional scaling. Beverly Hills, CA: Sage.
Neumann, L. (1979). Effects of categorization on relationships in bivariate
distributions and applications to rating scales. Dissertation Abstracts
International, 40, 2262-B
Nunnally, J. C. (1978). Psychometric theory. New York: McGraw-Hill.
Peters, C. C. y Van Vorhis, W. R. (1940). Statistical procedures and their mathematical bases. New
York: McGraw-Hill.
Sudman, S. y Bradburn, N. M. (1989). Measuring attitudes: recording
responses. En Sudman, S. y Bradburn, N. M. (Eds.). Asking questions: a
practical guide to questionnaire design. San Francisco: Jossey-Bass
Publishers.
Worthy, M. (1969). Note on scoring midpoint responses in extreme response
style scores. Psychological Reports, 24, 189-190.
17