Documentos de Académico
Documentos de Profesional
Documentos de Cultura
VICERRECTORADO ACADEMICO
FACULTAD HUMANIDADES
CARRERA-PROGRAMA PSICOLOGA
GUIA DE ESTUDIO UNIDAD II
EVALUACIN ESCRITA (EXAMEN)
Docente. Lcda. Carla Vsquez
Objetivo: Conocer y comprender las principales teoras y modelos bsicos de medicin en
psicologa para construir instrumentos de medicin psicolgica.
1.- Las escalas de medicin en psicologa.
La medicin es un tipo de observacin rigurosa realizada en condiciones controladas y
frecuentemente referida de algn modo a patrones. Es una descripcin rigurosa e
inequvoca que tiene un significado constante para una comunidad cientfica y profesional.
Medir es sustituir sistemticamente las cosas o sus propiedades por nmeros, de tal modo
que podamos usar los nmeros como si se tratase de lo representado.
Medir es utilizar los procedimientos matemticos para asignar nmeros e identificar
atributos fsicos y psicolgicos que permitan poner en claro las diferencias individuales.
Una escala de medida permite al investigador determinar el tipo de anlisis estadsticos
que deber utilizar para examinar una prueba y as poder considera a la prueba como
buena.
Los instrumentos que se utilizan para llevar a cabo tal medicin se les denominan Escalas
de medicin.
Existe una equivalencia de forma entre la naturaleza y los sistemas lgicos de las
matemticas. Es decir, la estructura de la naturaleza, tiene propiedades que son paralelas
a las propiedades que exhibe la estructura de los sistemas lgicos de las matemticas. De
acuerdo a este principio, podemos usar legtimamente los nmeros en la medicin.
2.-Tipos de escalas.
De acuerdo con Stevens (1951) Una escala slo es posible si se respeta el principio de
isomorfismo, es decir, las mismas relaciones que se dan entre los fenmenos u objetos, se
deben dar tambin entre los numerales asignados a cada fenmeno.
Ejemplo:
o igual longitud y el sujeto asigna nmeros a las sensaciones producidas, tomando como
referencia el valor del mdulo. As, si el sujeto considera que un segmento mide el doble
del mdulo, deber decir 20, si mide la mitad, asignar el valor 5, etc.
Una variante de este mtodo consiste en no proporcionar, en ningn momento, un mdulo
al sujeto, sino que se le presentan los segmentos, en orden aleatorio, en los diversos
ensayos y se le indica que asigne los nmeros que desee, pero teniendo en cuenta que las
unidades subjetivas que establece reflejen las relaciones mtricas entre los diversos
segmentos.
Mtodo de produccin de magnitudes. En este caso es el experimentador quien
presenta los nmeros, uno cada vez y en orden al azar, y el sujeto ajusta el estmulo,
mediante un dispositivo, hasta emparejarlo adecuadamente. Por ejemplo, si estoy
construyendo una escala de brillo de 1 a 10 niveles y muestro el 5, el sujeto debe regular
el brillo de la pantalla en un trmino medio.
Mtodo de emparejamiento de modalidad cruzada. Consiste en que el sujeto ajuste
un estmulo que el puede manipular a voluntad, con otro, de otra modalidad cualquiera
que le es presentado. Por ejemplo, ajustar el volumen de un tono a la intensidad de dolor
que le producen unas descargas de microvoltios.
Estimacin de razones. Se presentan al observador diversas parejas de estmulos, y
ste debe indicar, en cada par (ensayo) que razn o cociente existe entre las intensidades
de las sensaciones correspondientes que elicitan. Por ejemplo, cuando se presentan al
sujeto dos tonos cuyas intensidades son 20 y 40 dB, si la sensacin que produce el
primero es la mitad de la que produce el segundo, debera indicar 1/2.
Produccin de razones. Se le presenta al sujeto una proporcin numrica y tiene que
producir un estmulo que est en la misma proporcin con respecto a otro estmulo
standard. Por ejemplo, el sujeto debe ajustar la intensidad de dos tonos hasta que se
hallen en una relacin prefijada (1/2, 1/3, 1/4, etc.).
Emparejamiento de razones cruzadas. Se presentan a los sujetos dos estmulos
diferentes y se les pide que ajusten entre s otros dos (de otra modalidad), para que
guarden la misma proporcin que los primeros. Es decir, dado un par de estmulos ajustar
otros dos a la misma distancia. Por ejemplo, muestro dos niveles de brillo de un mismo
color del rbol de Munsell y le pido que ajuste dos generadores de tonos, de modo que
exista la misma proporcin entre ellos que entre los brillos.
Estimacin de intervalos. Se le pide al sujeto que asigne nmeros que representen el
tamao de las diferencias estimulares presentadas. Aqu, se supone que el sujeto es capaz
de dividir el rango del estmulo en intervalos iguales, manteniendo fijas las fronteras entre
ellos.
Produccin de intervalos. El ms popular es la particin continua o equiseccin, que
consiste en calcular el punto en el cual un estmulo se percibe como la mitad de otro en
cuanto a intensidad, frecuencia o cualquier otro parmetro.
Tambin, es muy conocido el mtodo de produccin de intervalos aparentemente iguales,
en el que se solicita al sujeto que distribuya los estmulos, de modo equidistante unos de
otros.
2. Datos que se requieren de los sujetos. Aqu Torgerson distingue entre mtodos
aplicables a respuestas categricas y mtodos aplicables a respuestas comparativas. Y por
ltimo,
3. Nmero de dimensiones sobre las que se miden los estmulos y los sujetos.
Este criterio permite diferenciar los mtodos unidimensionales y los mtodos
multidimensionales.
Hay que hacer notar que Torgerson (1958) no propone ninguna clasificacin de los
mtodos centrados en el sujeto, lo que justifica sealando que esta aproximacin "no ha
llevado, en gran medida, al desarrollo de los modelos de escalamiento" (Torgerson, 1958,
p. 47).
5.-Teoras Psicomtricas.
Con Louis Leon Thurstone se inicia el escalamiento psicolgico propiamente dicho.
Thurstone advirti que ciertos mtodos empleados en la investigacin psicofsica podan
ser utilizados para medir atributos psicolgicos con precisin si se desarrollaba un modelo
terico apropiado (Gulliksen, 1958). En 1927, Thurstone present su modelo bajo la
denominacin de Ley del Juicio Comparativo. Esta es un conjunto de ecuaciones que
relaciona: 1. la proporcin de veces que un estmulo es juzgado mayor que otro respecto a
un atributo o continuo psicolgico concreto, con 2. los valores escalares y las dispersiones
discriminativas de los dos estmulos. Un supuesto bsico de esta ley es que el grado en
que dos estmulos cualesquiera pueden ser discriminados es una funcin directa de la
diferencia de su posicin respecto al atributo en cuestin (McIver y Carmines, 1981; p. 18).
A partir de aqu, y usando el mtodo de las comparaciones apareadas -un mtodo
elaborado por Fechner-, Thurstone fue capaz de ubicar a los estmulos en un continuo
unidimensional, asignndoles valores escalares.
Adems de importar de la Psicofsica el mtodo de las comparaciones apareadas,
Thurstone ide otros mtodos, como el de los intervalos aparentemente iguales y el de los
intervalos sucesivos. Si bien sus aportaciones representan una de las contribuciones ms
importantes a la medida de atributos psicolgicos, no estn exentas de algunas
limitaciones y problemas. Entre ellos cabe destacar que los mtodos de Thurstone
presumen la unidimensionalidad de la escala, pero no ofrecen ninguna evidencia al
respecto; y que la construccin de escalas mediante sus mtodos requiere por lo general
mucho tiempo y trabajo.
El mtodo de escalamiento propuesto por Likert (1932) superara la primera y
cuarta limitaciones sealadas anteriormente. Tras reconocer la importancia de las
aportaciones de Thurstone en el terreno de la medicin de las actitudes, Likert (1932) se
pregunt si la construccin de escalas de medida mediante procedimientos ms sencillos
dara resultados tan buenos como los obtenidos por Thurstone en cuanto a la fiabilidad y
validez de las.
El mtodo de medicin de Likert consiste bsicamente en la presentacin a los sujetos
de una serie de items ante los que tienen que expresar su posicin escogiendo una
alternativa de respuesta entre las ofrecidas. La puntuacin del sujeto se determina
sumando o promediando los valores de las alternativas de respuesta escogidas ante cada
tem (Likert, 1932). El modelo aditivo de Likert asume que los items que se presentan a los
sujetos miden un nico atributo bajo investigacin, y que cada uno de esos items est
monotnicamente relacionado con el continuo del atributo subyacente.
Una diferencia fundamental respecto a los mtodos propuestos por Thurstone para la
medicin de actitudes reside en que no se necesita que los items o enunciados sean
calibrados previamente, lo cual supone un ahorro de tiempo y trabajo considerable.
Likert (1932) compar distintos procedimientos de puntuacin de las respuestas dadas
a los tems, comprobando que el procedimiento ms sencillo, consistente en asignar
valores de 1 a 5 a cada una de las cinco alternativas de respuesta ofrecidas (entre "Muy
de acuerdo" y "Muy en desacuerdo"), ofreca unos niveles de fiabilidad tan buenos como
otros procedimientos ms complejos. Asimismo, comprob que las escalas construidas con
su mtodo presentaban niveles de fiabilidad incluso superiores a escalas similares
elaboradas mediante los mtodos ideados por Thurstone, mostrando a su vez una buena
validez (Likert, 1932). A estas propiedades hay que aadir que para la construccin de
escalas siguiendo el mtodo propuesto por Likert no era necesario recurrir a jueces,
evitando as los inconvenientes asociados.
Todo ello contribuy a que el uso del mtodo de escalamiento de Likert se extendiera
rpidamente. Pero este mtodo tambin presenta ciertas limitaciones. Una de ellas hace
referencia a la interpretacin de las puntuaciones de los sujetos en la escala. El mtodo de
Likert no ofrece como resultado "la ubicacin de los tems individuales en un continuo
actitudinal subyacente. Consecuentemente, no se puede ofrecer una interpretacin
absoluta de la puntuacin de un sujeto en trminos de ese continuo" (McIver y Carmines,
1981, p. 27). Por todo ello, la interpretacin de la puntuacin de un sujeto en una escala
sumativa de Likert depende de la distribucin de las puntuaciones del grupo de sujetos al
que pertenece el sujeto. Otras crticas recibidas por el mtodo de Likert aluden a los
procedimientos empleados para garantizar la unidimensionalidad de la escala, basados en
el anlisis de la homogeneidad de los tems (McIver y Carmines, 1981). A pesar de estas
limitaciones, y debido principalmente a su sencillez, el mtodo de escalamiento de sujetos
propuesto por Likert es hoy el ms extendido en el campo de la medicin de actitudes.
A partir de 1941 Louis Guttman publica una serie de trabajos en los que presenta su
aproximacin innovadora al escalamiento. Su mtodo, conocido por los nombres de
escalamiento acumulativo y anlisis de escalograma, permite escalar tems y sujetos
sobre una dimensin acumulativa subyacente. En el caso ideal, la puntuacin total en una
escala Guttman permite reproducir las respuestas dadas ante cada uno de los tems que
configuran la escala.
Una de las caractersticas del modelo de Guttman es que se trata de un modelo
determinista: las respuestas de los sujetos a los tems estn determinadas por la situacin
de los sujetos y los tems en el continuo del rasgo subyacente que se pretende medir. Por
ejemplo, desde este modelo se espera que un sujeto que tenga un nivel de aptitud
numrica igual o superior al que exige un problema aritmtico, siempre dar con la
solucin correcta. Sin embargo, la prctica nos muestra que ste no es siempre el caso, y
que a veces el sujeto fallar. Mokken (1971) desarroll una versin probabilstica del
modelo de Guttman. En este modelo es la probabilidad de dar una determinada respuesta
la que depende de la situacin de los sujetos y los tems en el continuo del rasgo
subyacente que se pretende medir.
sujeto; las diferencias entre las puntuaciones observadas se deben a que el componente
debido a errores de medicin es distinto; el componente verdadero es estable.
2.- Los componentes verdadero y de error son independientes, la correlacin entre los
mismos es cero.
3.- La puntuacin observada es la suma de ambos componentes.
Otros autores modifican algo el modelo segn su manera de conceptualizar la varianza
debida a errores de medicin. Bsicamente, y segn este modelo, la correlacin entre
pruebas paralelas indicar la proporcin de varianza comn, que es la varianza verdadera
y que corresponde a un nico factor comn; la unidimensionalidad est implcita en este
modelo, pero solamente si se cumplen unos determinados presupuestos.
El modelo de las pruebas paralelas es muy estricto en sus supuestos: dos pruebas son
pruebas paralelas,
a) Si tienen idntica varianza (y eso al menos se puede comprobar, pero es el
supuesto menos importante).
b) Ambas correlacionan en idntico grado con los puntuaciones verdaderas (y esto no
hay manera de probarlo).
c) La varianza de cada prueba paralela no explicable para las puntuaciones
verdaderas se debe a errores de medicin; los errores de una prueba no tienen
relacin ni con las puntuaciones verdaderas ni con los errores de la otra prueba
paralela. Con estos supuestos se demuestra que la correlacin entre dos pruebas
paralelas indica la proporcin de verdadera varianza.
Las pruebas paralelas suponen, en un principio, que los mismos sujetos responden en
principio a dos pruebas; casi al mismo tiempo, y de manera independiente; Spearman
(1910) y Brown (1910) derivaron su conocida frmula para calcular la fiabilidad con una
sola aplicacin del mismo test. Posteriormente Kuder y Richardson (1937) desarrollaron
una serie de frmulas, derivadas de las de Spearman y Brown y dentro del mismo modelo,
para calcular la fiabilidad tambin a partir de una sola aplicacin del mismo test.
7.-Teora de la Generalizabilidad (Crombach).
Se trata de una extensin de la Teora Clsica de los Test (TCT), que busca, apoyndose
en la tcnica de anlisis de varianza, calcular las diferentes fuentes de error presentes en
un estudio el cual fue difcil el control adecuado de todas las variables implicadas.
Descripcin de la TG
En los estudios de Generalizabilidad, la estimacin de los componentes de la varianza
se llevan a cabo a partir del modelo ANOVA del mismo nombre o modelo de efectos
aleatorios; en la prctica, en ocasiones es difcil suponer que se puede realizar una
muestra aleatoria de un universo infinito de las condiciones de una faceta, bien porque la
poblacin sea finita o porque las condiciones afectivas en el proceso de medicin estarn
fijadas completamente.
ESTUDIOS G CON FACETAS FIJADAS
Una faceta fijada en un estudio de medida puede tener lugar por alguna de las siguientes
razones:
a) El investigador selecciona condiciones del universo de estudio G y no est interesado
en generalizar.
problema de dicha ciencia. As, la TRI, como su nombre lo indica, evala el tem, y no la
prueba en su totalidad. Esta relacin entre la habilidad (o conocimiento) y la probabilidad
de acertar el tem queda manifiesta en la Curva Caracterstica del tem (CCI), en donde se
grafica esta relacin (figura 1).
Sin embargo, la TRI no siempre puede ser aplicada, puesto que para esto, se deben de
cumplir dos grandes requisitos (Hambleton, Swaminathan y Rogers, 1991; Muiz,2010; : 1)
lo que se pretenda medir debe ser unidimensional. De ah que sea una sola habilidad la
que se evale. Sin embargo, esto no siempre es posible puesto que muchos constructos
psicolgicos (tanto de personalidad como cognitivos) dependen de otros factores; para
esto Hambleton, Swaminathan y Rogers (1991) mencionan que el requisito indispensable
para asumir la unidimensionalidad de un constructo es que haya un factor dominante que
est influyendo en el desempeo de la prueba. 2) Lo que mida un tem, debe ser
independiente a lo que mida otro tem (esto es conocido como independencia local),
esto es, nada, a excepcin de la habilidad del sujeto, debe de influir en el desempeo de
ste en un tem determinado. Como se puede observar, una vez cumplido el supuesto de
unidimensionalidad, es fcil cumplir el de independencia local.
As, en la TRI el desempeo del sujeto no depende de la escala de medicin, sino de la
habilidad real del sujeto, de ah que este se site entre los valores de menos infinito a
ms infinito. Para conocer ms acerca de stas diferencias entre la TRI y la TCT,
obsrvese la tabla 1, donde Muiz (2010) compara varias caractersticas de ambas
teoras.
Modelos de Teora de Respuesta al tem
Muiz (2010) menciona que tericamente podran existir infinitdad de modelos de TRI,
ya que stos dependen de los clculos y funciones que se empleen, segn los objetivos y
caractersticas del instrumento en cuestin. Sin embargo, existen dos grandes vertientes,
la funcin logstica y la curva normal. Debido a la facilidad de manejo y entendimiento de
la primera, sta es la que ms suele utilizarse. De los modelos de funcin logstica, los que
mayoritariamente se utilizan son los que adoptan la funcin logstica de la Curva
Caracterstica del tem, la cual dependiendo de la cantidad de parmetros que se usan es
el nombre que reciben.
Cuando se utiliza el parmetro de dificultad del tem (parmetro a), se tiene un modelo
de un solo parmetro, que tambin es conocido como modelos de Rasch, debido a que fue
Rash quien lo propuso inicialmente en la dcada de 1960 (Muiz, 2010). Si adems se usa
el parmetro de discriminacin del tem (b), se tiene un modelo logstico de dos
parmetros, propuesto inicialmente por Lord y modificado posteriormente por Birnbaum
(Hambleton, Swaminathan y Rogers, 1991). Si adems se usa el parmetro de la
probabilidad de acertar el tem al azar (c), se tiene un modelos logstico de tres
parmetros (Muiz, 2010).
Implicaciones de la TRI en la evaluacin educativa
Quiz una de las grandes ventajas de la TRI en la evaluacin educativa sea el hecho de
que intenta evaluar la habilidad del sujeto y las caractersticas del tem, y no as su
habilidad comparada con el resto de la poblacin.
Esto es fundamental en evaluaciones
a gran escala. Por otra parte, la TRI no excluye la utilizacin de la TCT, pues ambas pueden
convivir (y lo hacen) en la construccin de los test. Ambas resuelven y aportan
informacin vlida para la elaboracin de evaluaciones, y ms que ser rivales resultan
complementarias (Muiz, 2010). Esto es algo que todo profesional de la educacin debe
tener en cuenta, pues asegurarse de cumplir ambos criterios tal vez repercuta en una
mejor calidad de instrumentos de evaluacin.
Ventajas de la TRI
Las principales ventajas que aporta la TRI se pueden resumir en los siguientes puntos
(McAlpine, 2002, en Mateo, 2008)
*Ofrece medidas de la habilidad de los sujetos que son independientes del conjunto de
tems y muestra de sujetos.
*Los parmetros que describen a los tems son invariantes e independientes de la muestra
se sujetos y del resto de los tems que conforman el test. Esta caracterstica permite que
se puedan comparar sujetos aunque contesten diferentes grupos de tems.
*Esta teora no utiliza medidas repetidas de un mismo test o formas paralelas para
justificar las puntuaciones empricas y los errores de medida.
*Los conceptos desarrollados por sta teora son compatibles con la elaboracin de test
normativos, criterios o individualizados.
*Facilita la creacin de bancos de tems.
9.- Teora trirquica de la Inteligencia.
La teora trirquica de la inteligencia ha sido desarrollada por Robert J. Sternberg, una
figura destacada en la investigacin de la inteligencia humana. La teora fue de las
primeras en ir contra el enfoque psicomtrico y adoptar un acercamiento ms cognitivo.
La definicin de Sternberg de la inteligencia es: actividad mental dirigida hacia la
adaptacin intencional, seleccin o transformacin de entornos del mundo real relevantes
en la propia vida (mental activity directed toward purposive adaptation to, selection and
shaping of, real-world environments relevant to ones life), que significa que la inteligencia
es qu tan bien un individuo trata con los cambios en el entorno a lo largo de su vida.
La teora de Sternberg propone tres tipos de inteligencia: anlitica, creativa y prctica.
Cada uno de estos tipos conforman tres subteoras parciales que se complementan entre
s: componencial, experiencial y contextual.
Subteora componencial - analtica
6.
7.
8.
9.
BIBLIOGRAFA
Amn, J. (1999): Estadstica para psiclogos I. Estadstica descriptiva. Madrid, Espaa:
Pirmide.
Hambleton, R. K. y Rusell, J. (1993). Comparison of Classical Test theory and Item
Response Theory and their aplications to test development. Instructional Topics in
Educactional Measurement,253-262.
Hambleton, R. K., Swaminathan, H. y Rogers, H. J. (1991). Fundamentals of Item Response
Theory. E.U.A.: SAGE Publications, Inc.
Mateo, J. y Martnez, F. (2008). Medicin y Evaluacin Educativa. Espaa: Editorial La
Muralla S.A.
Meli, J. L. (1990): Introduccin a la medicin y anlisis de datos. Valencia, Espaa:
Cristbal Serrano.
Muiz, J. (2010). Las teoras de los tests: Teora Clsica y Teoras de Respuesta a los tems.
Papeles del Pscologo, 31(1), 57-66.
Muiz, J. y Hambleton, R. K. (1992). Medio siglo de teora de respuesta al tem. Anuario de
Psicologa, 52, 41-66.
Stevens, S. S. (1951)Handbook of Experimental Psychology. Nueva York, NY: Wiley