Está en la página 1de 18

UNIVERSIDAD YACAMBU

VICERRECTORADO ACADEMICO
FACULTAD HUMANIDADES
CARRERA-PROGRAMA PSICOLOGA
GUIA DE ESTUDIO UNIDAD II
EVALUACIN ESCRITA (EXAMEN)
Docente. Lcda. Carla Vsquez
Objetivo: Conocer y comprender las principales teoras y modelos bsicos de medicin en
psicologa para construir instrumentos de medicin psicolgica.
1.- Las escalas de medicin en psicologa.
La medicin es un tipo de observacin rigurosa realizada en condiciones controladas y
frecuentemente referida de algn modo a patrones. Es una descripcin rigurosa e
inequvoca que tiene un significado constante para una comunidad cientfica y profesional.
Medir es sustituir sistemticamente las cosas o sus propiedades por nmeros, de tal modo
que podamos usar los nmeros como si se tratase de lo representado.
Medir es utilizar los procedimientos matemticos para asignar nmeros e identificar
atributos fsicos y psicolgicos que permitan poner en claro las diferencias individuales.
Una escala de medida permite al investigador determinar el tipo de anlisis estadsticos
que deber utilizar para examinar una prueba y as poder considera a la prueba como
buena.
Los instrumentos que se utilizan para llevar a cabo tal medicin se les denominan Escalas
de medicin.
Existe una equivalencia de forma entre la naturaleza y los sistemas lgicos de las
matemticas. Es decir, la estructura de la naturaleza, tiene propiedades que son paralelas
a las propiedades que exhibe la estructura de los sistemas lgicos de las matemticas. De
acuerdo a este principio, podemos usar legtimamente los nmeros en la medicin.
2.-Tipos de escalas.
De acuerdo con Stevens (1951) Una escala slo es posible si se respeta el principio de
isomorfismo, es decir, las mismas relaciones que se dan entre los fenmenos u objetos, se
deben dar tambin entre los numerales asignados a cada fenmeno.

Cohen (2001) define elaboracin de escalas como el proceso de establecimiento de


reglas para la asignacin numrica en la medicin. Es el proceso por el que se disea y
calibra un dispositivo de medicin, y la forma en que se asignan nmeros (u otros ndices),
valores de escala a diferentes cantidades del rasgo, atributo o caracterstica que se est
midiendo (Cohen, 2001, pg. 288). Por lo regular existen diferentes mtodos de medicin
escalar, los cuales pueden estar abocados a medir personas, estmulos y tipos de
respuesta.
La clasificacin de Stevens considera cuatro tipos de escala: nominal, ordinal, de intervalo
y de razn.
2.1.- Escalas Nominales
Cuando la nica relacin que existe entre los elementos es de igualdad o desigualdad
(pero no orden) de modo que slo podemos aspirar a etiquetar distintas clases de
equivalencia de objetos con distintos nmeros. Los nmeros tan solo se usan como
nombres o etiquetas, por lo que pueden ser cambiados por cualquier otros tipo de
smbolos (letras, colores...). No admiten ninguna operacin aritmtica, ya que el resultado
carecera de sentido.
Se distinguen dos subtipos:
Escala nominal dicotmica, cuando utiliza dos modalidades.
Escala nominal politmica, cuando utiliza tres o ms modalidades.
Ejemplo:

2.2. Escalas Ordinales:


Slo podemos establecer una relacin de orden, pudiendo asignar cualesquiera nmeros a
los objetos siempre y cuando respeten su relacin emprica de orden. Reflejan
simplemente rdenes, sin que sepamos qu distancia hay entre dos puntos.

Se subdividen en Pares Comparativos, Ordenamientos y Suma de Constantes:


2.2.1. En las escalas de pares comparativos, la respuesta tiene solo dos opciones.
Este tipo de escala facilita la construccin de mapas perceptuales, porque se pueden
evaluar un nmero indefinido de objetos entre s, tambin funciona muy bien para pruebas
de producto.

Ejemplo:

2.2.2. En las escalas de Ordenamientos, se permite construir el reconocimiento de


marca. Esta escala se considera ordinal porque se puede inferir que la primera opcin
tiene una mayor evaluacin que la ltima opcin, pero no hay nmeros que la respalden,
es decir, no se sabe cunto prefiere la primera opcin, de la ltima opcin.
Ejemplos:
Escala de nivel de estudios universitarios: 1=Diplomado; 2=Licenciado; 3=Estudios de
Tercer Ciclo;
4=Doctorado.

2.2.3 Suma de Constantes, Esta escala es apropiada para establecer la importancia de


los atributos en la evaluacin de un producto.
Un error frecuente en la aplicacin de esta escala se origina cuando un participante no
suma correctamente los puntos, arrojando resultados superiores o inferiores al
establecido; la recomendacin es realizar esta escala en medios como Internet o en la
entrevista personal directa.
Ejemplo:

2.3. Escalas de Intervalos


Son las escalas en las que las transformaciones admisibles han de conservar la ordenacin
no slo de los objetos sino tambin la de los intervalos entre ellos. Se utiliza con variables
cuantitativas, tanto discretas como continuas. Cumplen las relaciones de
igualdad/desigualdad (escala nominal), la de orden (escala ordinal), y adems, la distancia
entre dos puntos contiguos de la escala es constante (ej. de 2 en 2 o de 3 en 3...). Son
propiamente mediciones.
Se subdividen en Continuas y Tipo Likert
2.3.1 Escala de Intervalo Continuas
Una escala de intervalos (mtrica y no comparativa) clasifica al objeto con nmeros que
indican tanto su posicin relativa como sus diferencias con relacin a otros objetos.
Algunos ejemplos son actitudes y opiniones.
Ejemplo: Rango de Inteligencia: 106 110 / 101 105 / 96 - 100

2.3.2 Escala de Intervalo tipo Likert


En la escala de Likert cuyo nombre proviene de su creador Rensis Likert, se mide el grado
de aceptacin o rechazo del participante ante una serie de afirmaciones relacionadas al
objeto.
Ejemplo:

2.4. Escalas de razn


Son escalas de intervalo donde el punto de origen es absoluto (p.e. para la longitud y el
peso) de modo que el origen del sistema numrico no puede moverse de cero (ausencia

total de la caracterstica que se mide). En psicologa se utiliza para variables como el


tiempo de reaccin o el porcentaje de errores y aciertos.
Si un sujeto tarda 16 milisegundos en responder a un estmulo y otro tarda solo 8
milisegundos, se puede decir que el tiempo de reaccin del primer sujeto es el doble que
el del segundo (16 = 2 x 8).
Ejemplo: el peso, la altura, el tiempo de reaccin de un sujeto ante la presentacin de un
estmulo doloroso.
La escala de razn admite cualquier transformacin del tipo y = ax (donde a > 0)
El cociente entre los valores originales o transformados es el mismo (16/8 = 160/80)
porque su origen no es arbitrario (existe el cero absoluto). Algo que no suceda en la
escala de intervalo donde (150/75 es distinto 250/25) porque su origen es arbitrario.
Tabla 1. Principales caractersticas distintivas de las escalas de Stevens

3.- Escalamiento psicofsico.


Los mtodos psicofsicos directos o escalas psicofsicas
Al adoptar, Stevens, el modelo ciberntico, concibe al organismo como un sistema
receptor de informacin (input) y emisor de informacin elaborada (output). Segn l el
organismo recibe estimulaciones de continuos fsicos, que pueden producir:
Cambios cuantitativos en el nivel de excitacin (magnitudes protticas).

Cambios cualitativos que implican procesos fisiolgicos diferentes o alternativos


(magnitudes metatticas).
Stevens slo acepta la validez de las estimaciones numricas en los juicios de
apreciacin directa para la construccin de escalas de sensibilidad, por lo que a su
psicofsica se le denomina Psicofsica directa, en contraposicin a la psicofsica indirecta
propuesta por Fechner, as llamada porque la medicin de la sensacin se obtiene por
referencia al continuo fsico (medicin indirecta). En efecto, Fechner nunca crey que las
sensaciones pudieran medirse directamente, sino que stas deban cuantificarse en
relacin con las unidades de la escala fsica (objetiva).
La psicofsica directa de Stevens sustituye a la psicofsica indirecta de Fechner, en la
que se relacionan sensaciones con la intensidad del estmulo; mientras que Stevens parte
de las apreciaciones subjetivas para llegar a construir escalas de estimacin. Por
consiguiente, "los mtodos directos de Stevens se basan en la capacidad del sujeto de
emitir juicios sobre la magnitud de las sensaciones que experimentan. Estos juicios son,
inmediatamente, convertidos en medida de la magnitud sensorial" (Tudela, 1981).
En definitiva, los mtodos de construccin de escalas psicofsicas pretenden desvelar la
relacin existente entre los continuos fsicos de energa del estmulo y los juicios de
apreciacin del sujeto.
Fechner fue el primero en desarrollar procedimientos que permitan esclarecer la
relacin existente entre la escala fsica y la escala de sensacin. Sin embargo, no sera til
construir una escala de valores de dmp (diferencia mnima perceptible) acumuladas, en
funcin de la magnitud del estmulo, y particularmente cuando las dmp se obtienen
indirectamente (como en el mtodo de los estmulos constantes), sino que sera
conveniente disponer de una escala de medicin directa, mediante la cual el sujeto
informe sobre el valor de sus sensaciones (Corso 1967).
Entre los mtodos directos para la construccin de escalas psicofsicas los ms
profusamente empleados son:
I) EMPAREJAMIENTO DE MAGNITUDES:
a.
Estimacin de magnitudes.
b.
Produccin de magnitudes.
c.
Emparejamiento de modalidad cruzada.
II) EMPAREJAMIENTO DE RAZONES:
a.
Estimacin de razones.
b.
Produccin de razones.
c.
Emparejamiento de razones cruzadas.
III) EMPAREJAMIENTO DE INTERVALOS:
a.
Estimacin de intervalos.
b.
Produccin de intervalos.
c.
Emparejamiento de intervalos cruzados.
d.
Clasificacin en categoras.
Los describiremos, muy brevemente, a continuacin:
Mtodo de estimacin de magnitudes. El sujeto asigna nmeros a la intensidad del
estmulo. Aqu, se le pide al sujeto que haga una estimacin de las magnitudes sensoriales
producidas por varios estmulos. Por ejemplo, se le presenta un primer segmento al sujeto
y se le dice que tiene el valor 10 (este valor recibe el nombre de mdulo). En los ensayos
sucesivos (10 o 20 es lo habitual), se le presentan al sujeto otros segmentos de diferentes

o igual longitud y el sujeto asigna nmeros a las sensaciones producidas, tomando como
referencia el valor del mdulo. As, si el sujeto considera que un segmento mide el doble
del mdulo, deber decir 20, si mide la mitad, asignar el valor 5, etc.
Una variante de este mtodo consiste en no proporcionar, en ningn momento, un mdulo
al sujeto, sino que se le presentan los segmentos, en orden aleatorio, en los diversos
ensayos y se le indica que asigne los nmeros que desee, pero teniendo en cuenta que las
unidades subjetivas que establece reflejen las relaciones mtricas entre los diversos
segmentos.
Mtodo de produccin de magnitudes. En este caso es el experimentador quien
presenta los nmeros, uno cada vez y en orden al azar, y el sujeto ajusta el estmulo,
mediante un dispositivo, hasta emparejarlo adecuadamente. Por ejemplo, si estoy
construyendo una escala de brillo de 1 a 10 niveles y muestro el 5, el sujeto debe regular
el brillo de la pantalla en un trmino medio.
Mtodo de emparejamiento de modalidad cruzada. Consiste en que el sujeto ajuste
un estmulo que el puede manipular a voluntad, con otro, de otra modalidad cualquiera
que le es presentado. Por ejemplo, ajustar el volumen de un tono a la intensidad de dolor
que le producen unas descargas de microvoltios.
Estimacin de razones. Se presentan al observador diversas parejas de estmulos, y
ste debe indicar, en cada par (ensayo) que razn o cociente existe entre las intensidades
de las sensaciones correspondientes que elicitan. Por ejemplo, cuando se presentan al
sujeto dos tonos cuyas intensidades son 20 y 40 dB, si la sensacin que produce el
primero es la mitad de la que produce el segundo, debera indicar 1/2.
Produccin de razones. Se le presenta al sujeto una proporcin numrica y tiene que
producir un estmulo que est en la misma proporcin con respecto a otro estmulo
standard. Por ejemplo, el sujeto debe ajustar la intensidad de dos tonos hasta que se
hallen en una relacin prefijada (1/2, 1/3, 1/4, etc.).
Emparejamiento de razones cruzadas. Se presentan a los sujetos dos estmulos
diferentes y se les pide que ajusten entre s otros dos (de otra modalidad), para que
guarden la misma proporcin que los primeros. Es decir, dado un par de estmulos ajustar
otros dos a la misma distancia. Por ejemplo, muestro dos niveles de brillo de un mismo
color del rbol de Munsell y le pido que ajuste dos generadores de tonos, de modo que
exista la misma proporcin entre ellos que entre los brillos.
Estimacin de intervalos. Se le pide al sujeto que asigne nmeros que representen el
tamao de las diferencias estimulares presentadas. Aqu, se supone que el sujeto es capaz
de dividir el rango del estmulo en intervalos iguales, manteniendo fijas las fronteras entre
ellos.
Produccin de intervalos. El ms popular es la particin continua o equiseccin, que
consiste en calcular el punto en el cual un estmulo se percibe como la mitad de otro en
cuanto a intensidad, frecuencia o cualquier otro parmetro.
Tambin, es muy conocido el mtodo de produccin de intervalos aparentemente iguales,
en el que se solicita al sujeto que distribuya los estmulos, de modo equidistante unos de
otros.

Otra variante til es la construccin de relacin, consistente en modificar la magnitud de


un estmulo a cierta relacin, mitad, cuarta parte, doble, triple, etc.
Emparejamiento de intervalos cruzados. Los sujetos deben emparejar los intervalos
entre los estmulos de un continuo con los intervalos de otro continuo. Por ejemplo, ajustar
los intervalos hechos mediante unas marcas, a lo largo de una lnea, con el aparente
distanciamiento tonal de unos sonidos.
Clasificacin en categoras. En el que se proporciona al sujeto un conjunto de
categoras (Por ejem., sobre intensidad de un sonido: muy fuerte, fuerte, medio, dbil,
muy dbil) y debe asignar (clasificar) cada estmulo presentado a una de tales categoras.
4.-Escalamiento psicolgico. (Mtodos de escalamiento unidimensional.)
Son diversos los criterios que se han propuesto para clasificar los distintos mtodos de
escalamiento existentes (ver Torgerson, 1958; Lpez Feal, 1986). Sin embargo, uno de los
criterios todava hoy ms utilizados (p. ej., McIver y Carmines, 1981) fue propuesto hace
ya ms de cuatro dcadas por Torgerson (1958). Tal criterio alude a la atribucin de la
variabilidad de las respuestas que dan los sujetos frente a los estmulos. En base a ese
criterio, Torgerson distingui tres tipos de mtodos:
1. Mtodos centrados en el sujeto: La variabilidad de las respuestas es atribuida a las
diferencias entre los sujetos. Estos mtodos pretenden medir personas. (Por ejemplo, el
mtodo de Likert).
2. Mtodos centrados en el estmulo o mtodos de juicio: La variabilidad de las
respuestas es atribuda a las diferencias que presentan los estmulos en relacin a un
determinado atributo. El propsito inmediato de estos mtodos es escalar estmulos. (Por
ejemplo, el mtodo de las comparaciones aparedas de Thurstone).
3. Mtodos de respuesta: La variabilidad de las respuestas es atribuida tanto a las
diferencias individuales como a las estimulares. Estos mtodos permiten escalar tanto
sujetos como estmulos. (Por ejemplo, el mtodo de Guttman).
Torgerson (1958) clasifica los mtodos de juicio en base a los procedimientos
empleados para obtener la unidad de medida de la escala resultante. As distingue entre
los mtodos de juicio cuantitativo y los mtodos basados en la variabilidad de los juicios.
En los primeros, la unidad de medida se obtiene directamente a partir de los juicios
cuantitativos acerca de los estmulos (por ejemplo, mtodos de estimacin subjetiva,
mtodos de fraccionamiento, mtodos de equiseccin). En los segundos, la unidad de
medida se obtiene a partir de la variabilidad de los juicios ofrecidos ante los estmulos
(mtodos de sensibilidad diferencial, mtodos thurstonianos).
Para clasificar los mtodos de respuesta, Torgerson (1958) propone tres criterios:
1. Consideracin de la varianza de error o no sistemtica. Este criterio permite
distinguir entre mtodos o modelos determinsticos y probabilsticos. Los primeros no
consideran la varianza de error, y asumen que las respuestas estn totalmente
determinadas por los parmetros asociados al sujeto y al estmulo. Los probabilsticos s
consideran la varianza de error, y, en este caso, los parmetros asociados al sujeto y al
estmulo determinan la probabilidad de que el sujeto d una determinada respuesta.

2. Datos que se requieren de los sujetos. Aqu Torgerson distingue entre mtodos
aplicables a respuestas categricas y mtodos aplicables a respuestas comparativas. Y por
ltimo,
3. Nmero de dimensiones sobre las que se miden los estmulos y los sujetos.
Este criterio permite diferenciar los mtodos unidimensionales y los mtodos
multidimensionales.
Hay que hacer notar que Torgerson (1958) no propone ninguna clasificacin de los
mtodos centrados en el sujeto, lo que justifica sealando que esta aproximacin "no ha
llevado, en gran medida, al desarrollo de los modelos de escalamiento" (Torgerson, 1958,
p. 47).
5.-Teoras Psicomtricas.
Con Louis Leon Thurstone se inicia el escalamiento psicolgico propiamente dicho.
Thurstone advirti que ciertos mtodos empleados en la investigacin psicofsica podan
ser utilizados para medir atributos psicolgicos con precisin si se desarrollaba un modelo
terico apropiado (Gulliksen, 1958). En 1927, Thurstone present su modelo bajo la
denominacin de Ley del Juicio Comparativo. Esta es un conjunto de ecuaciones que
relaciona: 1. la proporcin de veces que un estmulo es juzgado mayor que otro respecto a
un atributo o continuo psicolgico concreto, con 2. los valores escalares y las dispersiones
discriminativas de los dos estmulos. Un supuesto bsico de esta ley es que el grado en
que dos estmulos cualesquiera pueden ser discriminados es una funcin directa de la
diferencia de su posicin respecto al atributo en cuestin (McIver y Carmines, 1981; p. 18).
A partir de aqu, y usando el mtodo de las comparaciones apareadas -un mtodo
elaborado por Fechner-, Thurstone fue capaz de ubicar a los estmulos en un continuo
unidimensional, asignndoles valores escalares.
Adems de importar de la Psicofsica el mtodo de las comparaciones apareadas,
Thurstone ide otros mtodos, como el de los intervalos aparentemente iguales y el de los
intervalos sucesivos. Si bien sus aportaciones representan una de las contribuciones ms
importantes a la medida de atributos psicolgicos, no estn exentas de algunas
limitaciones y problemas. Entre ellos cabe destacar que los mtodos de Thurstone
presumen la unidimensionalidad de la escala, pero no ofrecen ninguna evidencia al
respecto; y que la construccin de escalas mediante sus mtodos requiere por lo general
mucho tiempo y trabajo.
El mtodo de escalamiento propuesto por Likert (1932) superara la primera y
cuarta limitaciones sealadas anteriormente. Tras reconocer la importancia de las
aportaciones de Thurstone en el terreno de la medicin de las actitudes, Likert (1932) se
pregunt si la construccin de escalas de medida mediante procedimientos ms sencillos
dara resultados tan buenos como los obtenidos por Thurstone en cuanto a la fiabilidad y
validez de las.
El mtodo de medicin de Likert consiste bsicamente en la presentacin a los sujetos
de una serie de items ante los que tienen que expresar su posicin escogiendo una
alternativa de respuesta entre las ofrecidas. La puntuacin del sujeto se determina
sumando o promediando los valores de las alternativas de respuesta escogidas ante cada
tem (Likert, 1932). El modelo aditivo de Likert asume que los items que se presentan a los
sujetos miden un nico atributo bajo investigacin, y que cada uno de esos items est
monotnicamente relacionado con el continuo del atributo subyacente.

Una diferencia fundamental respecto a los mtodos propuestos por Thurstone para la
medicin de actitudes reside en que no se necesita que los items o enunciados sean
calibrados previamente, lo cual supone un ahorro de tiempo y trabajo considerable.
Likert (1932) compar distintos procedimientos de puntuacin de las respuestas dadas
a los tems, comprobando que el procedimiento ms sencillo, consistente en asignar
valores de 1 a 5 a cada una de las cinco alternativas de respuesta ofrecidas (entre "Muy
de acuerdo" y "Muy en desacuerdo"), ofreca unos niveles de fiabilidad tan buenos como
otros procedimientos ms complejos. Asimismo, comprob que las escalas construidas con
su mtodo presentaban niveles de fiabilidad incluso superiores a escalas similares
elaboradas mediante los mtodos ideados por Thurstone, mostrando a su vez una buena
validez (Likert, 1932). A estas propiedades hay que aadir que para la construccin de
escalas siguiendo el mtodo propuesto por Likert no era necesario recurrir a jueces,
evitando as los inconvenientes asociados.
Todo ello contribuy a que el uso del mtodo de escalamiento de Likert se extendiera
rpidamente. Pero este mtodo tambin presenta ciertas limitaciones. Una de ellas hace
referencia a la interpretacin de las puntuaciones de los sujetos en la escala. El mtodo de
Likert no ofrece como resultado "la ubicacin de los tems individuales en un continuo
actitudinal subyacente. Consecuentemente, no se puede ofrecer una interpretacin
absoluta de la puntuacin de un sujeto en trminos de ese continuo" (McIver y Carmines,
1981, p. 27). Por todo ello, la interpretacin de la puntuacin de un sujeto en una escala
sumativa de Likert depende de la distribucin de las puntuaciones del grupo de sujetos al
que pertenece el sujeto. Otras crticas recibidas por el mtodo de Likert aluden a los
procedimientos empleados para garantizar la unidimensionalidad de la escala, basados en
el anlisis de la homogeneidad de los tems (McIver y Carmines, 1981). A pesar de estas
limitaciones, y debido principalmente a su sencillez, el mtodo de escalamiento de sujetos
propuesto por Likert es hoy el ms extendido en el campo de la medicin de actitudes.
A partir de 1941 Louis Guttman publica una serie de trabajos en los que presenta su
aproximacin innovadora al escalamiento. Su mtodo, conocido por los nombres de
escalamiento acumulativo y anlisis de escalograma, permite escalar tems y sujetos
sobre una dimensin acumulativa subyacente. En el caso ideal, la puntuacin total en una
escala Guttman permite reproducir las respuestas dadas ante cada uno de los tems que
configuran la escala.
Una de las caractersticas del modelo de Guttman es que se trata de un modelo
determinista: las respuestas de los sujetos a los tems estn determinadas por la situacin
de los sujetos y los tems en el continuo del rasgo subyacente que se pretende medir. Por
ejemplo, desde este modelo se espera que un sujeto que tenga un nivel de aptitud
numrica igual o superior al que exige un problema aritmtico, siempre dar con la
solucin correcta. Sin embargo, la prctica nos muestra que ste no es siempre el caso, y
que a veces el sujeto fallar. Mokken (1971) desarroll una versin probabilstica del
modelo de Guttman. En este modelo es la probabilidad de dar una determinada respuesta
la que depende de la situacin de los sujetos y los tems en el continuo del rasgo
subyacente que se pretende medir.

6.-Teora clsica de Spearman.


El modelo de Spearman parte de tres supuestos.
1.- En medidas sucesivas con el mismo instrumento (o en medidas casi simultaneas con
pruebas paralelas), las puntuaciones verdaderas son siempre las mismas para cada

sujeto; las diferencias entre las puntuaciones observadas se deben a que el componente
debido a errores de medicin es distinto; el componente verdadero es estable.
2.- Los componentes verdadero y de error son independientes, la correlacin entre los
mismos es cero.
3.- La puntuacin observada es la suma de ambos componentes.
Otros autores modifican algo el modelo segn su manera de conceptualizar la varianza
debida a errores de medicin. Bsicamente, y segn este modelo, la correlacin entre
pruebas paralelas indicar la proporcin de varianza comn, que es la varianza verdadera
y que corresponde a un nico factor comn; la unidimensionalidad est implcita en este
modelo, pero solamente si se cumplen unos determinados presupuestos.
El modelo de las pruebas paralelas es muy estricto en sus supuestos: dos pruebas son
pruebas paralelas,
a) Si tienen idntica varianza (y eso al menos se puede comprobar, pero es el
supuesto menos importante).
b) Ambas correlacionan en idntico grado con los puntuaciones verdaderas (y esto no
hay manera de probarlo).
c) La varianza de cada prueba paralela no explicable para las puntuaciones
verdaderas se debe a errores de medicin; los errores de una prueba no tienen
relacin ni con las puntuaciones verdaderas ni con los errores de la otra prueba
paralela. Con estos supuestos se demuestra que la correlacin entre dos pruebas
paralelas indica la proporcin de verdadera varianza.
Las pruebas paralelas suponen, en un principio, que los mismos sujetos responden en
principio a dos pruebas; casi al mismo tiempo, y de manera independiente; Spearman
(1910) y Brown (1910) derivaron su conocida frmula para calcular la fiabilidad con una
sola aplicacin del mismo test. Posteriormente Kuder y Richardson (1937) desarrollaron
una serie de frmulas, derivadas de las de Spearman y Brown y dentro del mismo modelo,
para calcular la fiabilidad tambin a partir de una sola aplicacin del mismo test.
7.-Teora de la Generalizabilidad (Crombach).
Se trata de una extensin de la Teora Clsica de los Test (TCT), que busca, apoyndose
en la tcnica de anlisis de varianza, calcular las diferentes fuentes de error presentes en
un estudio el cual fue difcil el control adecuado de todas las variables implicadas.
Descripcin de la TG
En los estudios de Generalizabilidad, la estimacin de los componentes de la varianza
se llevan a cabo a partir del modelo ANOVA del mismo nombre o modelo de efectos
aleatorios; en la prctica, en ocasiones es difcil suponer que se puede realizar una
muestra aleatoria de un universo infinito de las condiciones de una faceta, bien porque la
poblacin sea finita o porque las condiciones afectivas en el proceso de medicin estarn
fijadas completamente.
ESTUDIOS G CON FACETAS FIJADAS
Una faceta fijada en un estudio de medida puede tener lugar por alguna de las siguientes
razones:
a) El investigador selecciona condiciones del universo de estudio G y no est interesado
en generalizar.

b) El universo de condiciones es pequeo y todas ellas son incluidas en el diseo de


medida.
La TG trata una faceta fijada promediando sobre las condiciones de la faceta, utilizando el
procedimiento de la reconversin de Brennan, pero tambin pueden estudiarse cada uno
de las condiciones de la faceta fijada.
PROMEDIANDO PARA LAS CONDICIONES DE LA FACETA FIJADA (se deben seguir una serie
de pasos)
1. Realizar un ANOVA.
2. Identificar la parte aleatoria del diseo mixto.
3. Calcular los componentes hallados de la varianza de la parte aleatoria.
LOS ERRORES EN LA TEORA DE TG
La varianza de diferenciacin es en la TG la varianza de las puntuaciones del universo,
para determinarla, habr que establecer cul es el objeto de medida en el estudio que
normalmente ya se ha establecido en una fase anterior.
La TG establece una diferenciacin conceptual entre distintos tipos de errores que se
cometen en funcin del tipo de decisin que se pretenda tomar con el instrumento de
evaluacin. Antes se ha distinguido entre las decisiones absolutas y las relativas, ambos
tipos de decisiones conducen a distintos errores:
a) ERRORES EN LAS DECISIONES ABSOLUTAS
El decisor quiere generalizar de la puntuacin observada en una muestra a la
puntuacin del universo. La diferencia entre las dos puntuaciones es el error de la medida,
se representa con el mismo smbolo delta mayscula y se denominan errores absolutos.
b) ERRORES EN LAS DECISIONES RELATIVAS
Se definen como las diferencias existentes entre la diferencia observada entre dos
puntuaciones empricas y la diferencia en el universo entre sus correspondientes
parmetros.
8.-Teora de la respuesta al tem o del rasgo latente.
En esta teora se parte del supuesto de que el comportamiento de un sujeto se puede
explicar en trminos de una o varias caractersticas personales, es decir, rasgos que se
encuentran latentes, pero que se manifiestan a travs del comportamiento del individuo
en el test o en la respuesta a los tems. As mismo, tambin expresa la relacin que existe
entre el nivel de rasgo de la persona medido con un test y la respuesta de la persona a un
tem del test.
La Teora de Respuesta al tem (TRI) viene a resolver este problema de medicin a partir
de una serie de propuestas metodolgicas y asunciones bsicas. Segn Hambleton,
Swaminathan y Rogers (1991), el desempeo real de un sujeto depender de su
habilidad nicamente, y sta a su vez impactar en la probabilidad de que el sujeto
acierte en un tem determinado. Es decir, cuanto mayor sean los conocimientos que un
sujeto tiene sobre fsica, mayor probabilidad tendr de resolver correctamente un

problema de dicha ciencia. As, la TRI, como su nombre lo indica, evala el tem, y no la
prueba en su totalidad. Esta relacin entre la habilidad (o conocimiento) y la probabilidad
de acertar el tem queda manifiesta en la Curva Caracterstica del tem (CCI), en donde se
grafica esta relacin (figura 1).

Sin embargo, la TRI no siempre puede ser aplicada, puesto que para esto, se deben de
cumplir dos grandes requisitos (Hambleton, Swaminathan y Rogers, 1991; Muiz,2010; : 1)
lo que se pretenda medir debe ser unidimensional. De ah que sea una sola habilidad la
que se evale. Sin embargo, esto no siempre es posible puesto que muchos constructos
psicolgicos (tanto de personalidad como cognitivos) dependen de otros factores; para
esto Hambleton, Swaminathan y Rogers (1991) mencionan que el requisito indispensable
para asumir la unidimensionalidad de un constructo es que haya un factor dominante que
est influyendo en el desempeo de la prueba. 2) Lo que mida un tem, debe ser
independiente a lo que mida otro tem (esto es conocido como independencia local),
esto es, nada, a excepcin de la habilidad del sujeto, debe de influir en el desempeo de
ste en un tem determinado. Como se puede observar, una vez cumplido el supuesto de
unidimensionalidad, es fcil cumplir el de independencia local.
As, en la TRI el desempeo del sujeto no depende de la escala de medicin, sino de la
habilidad real del sujeto, de ah que este se site entre los valores de menos infinito a
ms infinito. Para conocer ms acerca de stas diferencias entre la TRI y la TCT,
obsrvese la tabla 1, donde Muiz (2010) compara varias caractersticas de ambas
teoras.
Modelos de Teora de Respuesta al tem
Muiz (2010) menciona que tericamente podran existir infinitdad de modelos de TRI,
ya que stos dependen de los clculos y funciones que se empleen, segn los objetivos y
caractersticas del instrumento en cuestin. Sin embargo, existen dos grandes vertientes,
la funcin logstica y la curva normal. Debido a la facilidad de manejo y entendimiento de
la primera, sta es la que ms suele utilizarse. De los modelos de funcin logstica, los que
mayoritariamente se utilizan son los que adoptan la funcin logstica de la Curva
Caracterstica del tem, la cual dependiendo de la cantidad de parmetros que se usan es
el nombre que reciben.

Cuando se utiliza el parmetro de dificultad del tem (parmetro a), se tiene un modelo
de un solo parmetro, que tambin es conocido como modelos de Rasch, debido a que fue
Rash quien lo propuso inicialmente en la dcada de 1960 (Muiz, 2010). Si adems se usa
el parmetro de discriminacin del tem (b), se tiene un modelo logstico de dos
parmetros, propuesto inicialmente por Lord y modificado posteriormente por Birnbaum
(Hambleton, Swaminathan y Rogers, 1991). Si adems se usa el parmetro de la
probabilidad de acertar el tem al azar (c), se tiene un modelos logstico de tres
parmetros (Muiz, 2010).
Implicaciones de la TRI en la evaluacin educativa
Quiz una de las grandes ventajas de la TRI en la evaluacin educativa sea el hecho de
que intenta evaluar la habilidad del sujeto y las caractersticas del tem, y no as su
habilidad comparada con el resto de la poblacin.
Esto es fundamental en evaluaciones
a gran escala. Por otra parte, la TRI no excluye la utilizacin de la TCT, pues ambas pueden
convivir (y lo hacen) en la construccin de los test. Ambas resuelven y aportan
informacin vlida para la elaboracin de evaluaciones, y ms que ser rivales resultan
complementarias (Muiz, 2010). Esto es algo que todo profesional de la educacin debe
tener en cuenta, pues asegurarse de cumplir ambos criterios tal vez repercuta en una
mejor calidad de instrumentos de evaluacin.
Ventajas de la TRI
Las principales ventajas que aporta la TRI se pueden resumir en los siguientes puntos
(McAlpine, 2002, en Mateo, 2008)
*Ofrece medidas de la habilidad de los sujetos que son independientes del conjunto de
tems y muestra de sujetos.
*Los parmetros que describen a los tems son invariantes e independientes de la muestra
se sujetos y del resto de los tems que conforman el test. Esta caracterstica permite que
se puedan comparar sujetos aunque contesten diferentes grupos de tems.
*Esta teora no utiliza medidas repetidas de un mismo test o formas paralelas para
justificar las puntuaciones empricas y los errores de medida.
*Los conceptos desarrollados por sta teora son compatibles con la elaboracin de test
normativos, criterios o individualizados.
*Facilita la creacin de bancos de tems.
9.- Teora trirquica de la Inteligencia.
La teora trirquica de la inteligencia ha sido desarrollada por Robert J. Sternberg, una
figura destacada en la investigacin de la inteligencia humana. La teora fue de las
primeras en ir contra el enfoque psicomtrico y adoptar un acercamiento ms cognitivo.
La definicin de Sternberg de la inteligencia es: actividad mental dirigida hacia la
adaptacin intencional, seleccin o transformacin de entornos del mundo real relevantes
en la propia vida (mental activity directed toward purposive adaptation to, selection and
shaping of, real-world environments relevant to ones life), que significa que la inteligencia
es qu tan bien un individuo trata con los cambios en el entorno a lo largo de su vida.
La teora de Sternberg propone tres tipos de inteligencia: anlitica, creativa y prctica.
Cada uno de estos tipos conforman tres subteoras parciales que se complementan entre
s: componencial, experiencial y contextual.
Subteora componencial - analtica

Sternberg asocia el funcionamiento de la mente a una series de componentes. Estos


componentes los etiquet como metacomponentes, componentes de rendimiento,
performance, y componentes de adquisicin de conocimiento.
Los metacomponentes son los procesos ejecutivos usados en resolucin de problemas y
toma de decisiones que implican la mayor parte de la capacidad de gestin de nuestra
mente. Dicen a la mente cmo actuar. Los metacomponentes tambin son llamados a
veces Homnculos. Un "homnculo" es una "persona ficticia" o "metafrica" dentro de
nuestra cabeza que controla nuestras acciones, y que frecuentemente sugiere una
regresin infinita de homunculi que se controlan unos a otros.
El siguiente conjunto de componentes de Sternberg, componentes de rendimiento, son
los procesos que llevan a cabo realmente las acciones que dictan los metacomponentes.
stos son los procesos bsicos que permiten que hagamos tareas, tales como percibir
problemas en nuestra memoria a largo plazo, percibiendo relaciones entre los objetos, y
aplicando relaciones a otro conjunto de trminos.
El ltimo conjunto de componentes, componentes de adquisicin de conocimiento, se
utilizan en la obtencin de la nueva informacin. Estos componentes completan tareas
que implican escoger selectivamente informacin de informacin irrelevante. Estos
componentes se pueden tambin utilizar para combinar selectivamente varios bloques de
informacin recopilada. Los individuos dotados son eficientes al usar estos componentes
porque pueden aprender nueva informacin a un ritmo ms rpido.
Sternberg asocia la subteora componencial con la capacidad analtica. ste es uno de
tres tipos de capacidad que Sternberg reconoce. La capacidad analtica permite separar
problemas y ver soluciones no evidentes. Desafortunadamente, los individuos con slo
este tipo de capacidad no son tan aptos creando ideas nuevas por s mismos. Esta forma
de capacidad es el tipo que ms a menudo se evala. Otras reas se ocupan de la
creatividad y de otras capacidades no evaluadas con frecuencia.
Sternberg dio el ejemplo de un estudiante, "Alicia", que tena excelentes resultados de
examen y cursos en la escuela, y los profesores la vean como extremadamente despierta.
Alicia ms adelante result tener apuros en secundaria porque no era hbil en crear ideas
por s misma.
Subteora experiencial - creativa
La segunda etapa de la teora de Sternberg es la subteora experiencial. Esta etapa
trata principalmente de cuan bien se realiza una tarea, con relacin a lo familiar que sea.
Sternberg divide el papel de la experiencia en dos partes: novedad y automatizacin.
Una situacin de novedad es aquella que nunca se ha experimentado antes. Personas
que son aptas en el manejo de una situacin de novedad pueden tomar la tarea y
encontrar nuevas maneras de solucionarla que la mayora de gente no percibira.
Un proceso automatizado es el que se ha realizado mltiples veces y ahora puede
hacerse con poco o nada de pensamiento adicional. Una vez que se automatice un
proceso, puede ser ejecutado en paralelo con otro igual u otros procesos distintos. El
problema con la novedad y la automatizacin es que el ser experto en un componente no
asegura el ser experto en el otro.
La subteora experiencial tambin se correlaciona con otro de los tipos de Sternberg de
capacidad. La capacidad sinttica se ve en la creatividad, la intuicin, y el estudio de las
artes. Personas con capacidad sinttica a menudo no muestran un cociente intelectual
muy alto porque no hay actualmente ninguna prueba que pueda medir suficientemente
estas cualidades, pero la capacidad sinttica es especialmente til en crear nuevas ideas
para crear y resolver nuevos problemas. Sternberg tambin asoci otro de sus

estudiantes, "Brbara", a la capacidad sinttica. Brbara no se desempeaba tan bien


como Alicia en las pruebas de acceso a la enseanza secundaria, pero fue recomendada
para la universidad de Yale basndose en sus habilidades creativas e intuitivas
excepcionales. Brbara fue ms tarde muy vlida creando nuevas ideas para la
investigacin.
Subteora contextual - prctica
La tercera subteora de la inteligencia de Sternberg, llamada contextual o prctica, se
ocupa de la actividad mental implicada en conseguir ajuste al contexto, deals with the
mental activity involved in attaining fit to context. Con los tres procesos de la adaptacin,
conformado y seleccin, los individuos producen un ajuste ideal entre s mismos y su
ambiente. Este tipo de inteligencia se conoce a menudo como pcaros callejeros street
smarts.
La adaptacin ocurre cuando uno hace un cambio en s mismo para ajustarse mejor a lo
que le rodea. Por ejemplo, cuando el tiempo cambia y las temperaturas bajan, la gente se
adapta utilizando ms ropa para estar abrigados.
La conformacin ocurre cuando uno cambia su ambiente para que encaje mejor con sus
necesidades. Un profesor puede invocar una nueva regla, de levantar la mano para hablar,
para asegurarse de que imparte la leccin con las menos interrupciones posibles.
El proceso de seleccin se emprende cuando se encuentra un ambiente alternativo
totalmente nuevo para substituir un ambiente anterior que era insatisfactorio para las
metas del individuo. Por ejemplo, los inmigrantes dejan sus vidas en sus pases de origen
donde soportaban dificultades econmicas y sociales y viajan a Estados Unidos en
bsqueda de una vida mejor y menos opresiva.
La eficacia con la cual un individuo encaja en su ambiente y se enfrenta con situaciones
cotidianas refleja el grado de inteligencia. El tercer tipo de capacidad de Sternberg,
llamada capacidad prctica, implica el poder aplicar habilidades sintticas y analticas a
las situaciones diarias. La gente prcticamente dotada es magnfica en su capacidad de
tener xito en cualquier situacin. Un ejemplo de este tipo de capacidad es Celia. Celia
no tena capacidades analticas o sintticas excepcionales, pero era altamente acertada
en imaginarse lo necesario para tener xito en un ambiente acadmico. Saba qu clase
de investigacin era valorada, cmo conseguir artculos en las revistas, cmo impresionar
la gente en las entrevistas de trabajo, y cuestiones similares. La inteligencia contextual
de Celia le permiti usar dichas habilidades para su provecho.
Sternberg tambin reconoce que un individuo no est restringido a destacar slo en una
de estas tres inteligencias. Mucha gente puede poseer una integracin de las tres y ser
destacado en las tres inteligencias.
10.-Proceso de elaboracin de una prueba o test.
Segun J. L. Padilla(1995) en la elaboracin de tests, como en las disciplinas artsticas, la
genialidad suele asentarse sobre un perfecto dominio de los fundamentos tcnicos.
Dejando a un lado las comparaciones, presentamos a continuacin los pasos habituales
para la elaboracin de un test, un cuestionario, e incluso cualquier tipo de escala (Croker y
Algina, 1986):
1. Delimitacin del objetivo para el que van a utilizarse las puntuaciones.
2. Definicin del constructo que se pretende medir con el test.
3. Descripcin general de los componentes del constructo.
4. Diseo del test.
5. Redaccin de los tems. (Consulta a expertos y estudio de campo)

6.
7.
8.
9.

Anlisis de la calidad de los tems.


Estudio de la fiabilidad del test.
Estudio de la validez del test.
Elaboracin de las normas de aplicacin, interpretacin y baremacin de la puntuacin

BIBLIOGRAFA
Amn, J. (1999): Estadstica para psiclogos I. Estadstica descriptiva. Madrid, Espaa:
Pirmide.
Hambleton, R. K. y Rusell, J. (1993). Comparison of Classical Test theory and Item
Response Theory and their aplications to test development. Instructional Topics in
Educactional Measurement,253-262.
Hambleton, R. K., Swaminathan, H. y Rogers, H. J. (1991). Fundamentals of Item Response
Theory. E.U.A.: SAGE Publications, Inc.
Mateo, J. y Martnez, F. (2008). Medicin y Evaluacin Educativa. Espaa: Editorial La
Muralla S.A.
Meli, J. L. (1990): Introduccin a la medicin y anlisis de datos. Valencia, Espaa:
Cristbal Serrano.
Muiz, J. (2010). Las teoras de los tests: Teora Clsica y Teoras de Respuesta a los tems.
Papeles del Pscologo, 31(1), 57-66.
Muiz, J. y Hambleton, R. K. (1992). Medio siglo de teora de respuesta al tem. Anuario de
Psicologa, 52, 41-66.
Stevens, S. S. (1951)Handbook of Experimental Psychology. Nueva York, NY: Wiley

También podría gustarte