Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Manual de Psicometría y Evaluación Psicológica
Manual de Psicometría y Evaluación Psicológica
net/publication/351094332
CITATIONS READS
6 52,298
2 authors, including:
SEE PROFILE
All content following this page was uploaded by Leonardo Adrián Medrano on 25 April 2021.
Manual de Psicometría y
Evaluación Psicológica
Título: Manual de Psicometría y Evaluación Psicológica
Compiladores: Leonardo Medrano y Edgardo Pérez
Autores: Leonardo Medrano y Edgardo Pérez; Alberto Luis Fernández; María Marta Morales;
María Alejandra Pujol; Mario Trógolo; Luciana Moretti; Eugenia Griffoulière, Luis Pedro
Morera; Lucas Lapuente; Carlos Spontón; Estanislao Castellano; Ezequiel Flores Kanter;
Mauricio Zalazar y Javier Sánchez Rosas
Medrano, Leonardo A.
Manual de psicometría y evaluación psicológica / Leonardo A. Medra-
no ; Edgardo Pérez. - 2a ed ampliada. - Córdoba : Brujas, 2019.
300 p. ; 25 x 17 cm.
ISBN 978-987-760-203-6
www.editorialbrujas.com.ar publicaciones@editorialbrujas.com.ar
Tel/fax: (0351) 4606044 / 4691616– Pasaje España 1486 Córdoba–Argentina.
|
Índice
Prefacio..................................................................................................................................9
Interpretación de Puntuaciones.........................................................................................79
Leonardo Medrano
5
Introducción..........................................................................................................................79
Interpretación referida a Normas..........................................................................................80
Interpretación referida a Criterios. .......................................................................................86
A modo de síntesis................................................................................................................87
6
Evaluación Psicométrica en Psicología Organizacional................................................183
Mario Trógolo, Carlos Spontón, Estanislao Castellano,
María Alejandra Pujol y Leonardo Medrano
Introducción........................................................................................................................183
El uso de Pruebas Psicométricas en la Psicología Organizacional.....................................184
Evaluación del Bienestar en el Trabajo...............................................................................185
Evaluación con fines de Selección......................................................................................191
Consideraciones Finales......................................................................................................201
7
Apéndice I: ¿Cómo leer artículos de Investigación en Psicometría?
Pautas para una lectura crítica .......................................................................................251
Leonardo Medrano................................................................................................................ 251
Introducción........................................................................................................................251
Secciones de un Artículo Científico....................................................................................252
Guía para la Lectura Crítica de Artículos Instrumentales...................................................255
Consideraciones Finales......................................................................................................259
9
los test psicológicos, cuente con habilidades para seleccionar una prueba y
juzgar la calidad de los test publicados, sepa administrar una prueba, inter-
pretarla y comunicar adecuadamente los resultados, permitiendo así una uti-
lización ética y responsables de los test psicológicos.
Leonardo Medrano
Edgardo Pérez
10
Parte 1
Psicometría:
Teoría y Normas Técnicas
11
|
Introducción a la Psicometría: el desafío de
medir en psicología
Leonardo Medrano
Introducción
13
análogo al del lenguaje, la diferencia radica en que en vez de utilizar palabras
utilizaremos números.
De esta forma, la medición conlleva un proceso de abstracción, mediante
el cual intentamos cuantificar (usar números para representar cantidades) y/o
clasificar propiedades de la realidad. Cuenta la leyenda que el nacimiento de los
números se dio en un intento por abstraer la cantidad de ovejas que tenían los
pastores. Para chequear si todas las ovejas del rebaño habían regresado, se repre-
sentaba con una piedra a cada oveja. El pastor incluía en una bolsa tantas pie-
dras como ovejas observaba, de esta forma si al regresar había más piedras que
ovejas significaba que había extraviado alguna y debía volver para encontrarla.
Se puede decir entonces que existía un isomorfismo entre las piedras y las ovejas,
es decir, elementos distintos (piedras y ovejas) mantenían “una misma forma o
estructura”, en este caso representaban la misma cantidad.
El uso de piedras para representar cantidades y poder operar con ellas
constituye un primer intento de abstracción (de hecho, la palabra “cálculo”
proviene del latín “calculus” que significa “piedra”). Con el paso del tiempo,
en vez de utilizar piedras, se utilizaron símbolos para representar cantidades,
dando nacimiento a los números. Esta vez el isomorfismo es entre la realidad
y un símbolo numérico (figura 1).
15
persona presenta un “4” de nivel educativo posee mayor nivel que una de
“2”, pero no es adecuado señalar que “duplica” su nivel educativo. Tampoco
podemos señalar que dos personas con un nivel primario (en este caso repre-
sentados con
conununnivel
“2”) equivalen a una con un nivel universitario (en este caso
primario (en este caso representados con un “2”) equivalen a una
representado con
con un nivelun “4”). Solamente
universitario (en este casoes lícito efectuar
representado juicios
con un “4”). del tipo
Solamente es “mayor
que…” olícito
“menor que…”
efectuar (figura
juicios del 3). que…” o “menor que…” (figura 3).
tipo “mayor
17
Figura 3. Ejemplo
Figura de medición
4. Ejemplo de mediciónmétrica:
métrica:el
el isomorfismo
isomorfismo entreentre el sistema
el sistema empíricoempírico y numérico
y numérico
se mantiene parapara
se mantiene laslaspropiedades
propiedades dede distintividad,
distintividad, ordinalidad
ordinalidad y proporcionalidad.
y proporcionalidad.
16
Un ejemplo de este tipo de medición podría ser el consumo de alcohol.
Supongamos que queremos comparar el nivel de alcohol consumido por una
persona que ingirió un vaso de vino y otra que bebió whisky. Es posible deter-
Un ejemplo de este tipo de medición podría ser el consumo de alcohol.
Supongamos que queremos comparar el nivel de alcohol consumido por una
persona que ingirió un vaso de vino y otra que bebió whisky. Es posible de-
terminar esto ya que existe una unidad constante de medición para determinar
la graduación alcohólica de una bebida. La “graduación alcohólica” o “grado
alcohólico volumétrico” es la expresión en grados del número de volúmenes
de alcohol (etanol) contenidos en 100 volúmenes del producto. El vino por
ejemplo suele tener una graduación de 10 grados, mientras que el whisky de
50 grados. Esto significa que si dos personas toman la misma cantidad (por
ejemplo, un vaso), el que bebió whisky bebió cinco veces más de alcohol que
el que bebió vino. Este tipo de mediciones permite efectuar juicios acerca de
la proporcionalidad entre intervalos.
Como se señaló anteriormente, la posibilidad de medir y representar
propiedades de la realidad mediante un sistema de número conlleva grandes
ventajas. Gracias a este proceso de abstracción podemos efectuar operaciones y
análisis sobre el sistema numérico que nos permitan extraer nuevas conclusio-
nes sobre el mundo empírico. Por ejemplo, podemos utilizar procedimientos
estadísticos sobre el sistema numérico para identificar relaciones entre varia-
bles, identificar patrones subyacentes o efectuar predicciones sobre el sistema
empírico, por mencionar solo algunos ejemplos. No obstante, es importante
señalar que la posibilidad o no de realizar estos análisis depende del tipo de
medición que estemos usando. En efecto, no es posible hacer sumas o divisio-
nes si utilizamos mediciones de tipo ordinal o nominal. Es por ello que antes
de realizar un análisis matemático debemos contemplar cuidadosamente el
tipo de medición que estamos utilizando.
17
de indicadores observables o empíricos. Por ejemplo, podemos ver si presenta
movimientos lentos, si al hablar manifiesta sentimientos de desesperanza o
inutilidad, si menciona tener problemas para dormir, o si siente que no tiene
energía o ganas para hacer actividades.
Cuando efectuamos una medición en psicología lo hacemos asumiendo
dos grandes supuestos o axiomas. En primer lugar, asumimos que existen ras-
gos o características psicológicas reconocibles que describen aspectos impor-
tantes de los individuos. En el ejemplo anterior, asumimos que existe algo que
se llama “depresión” que describe o explica los síntomas que observamos en el
paciente. En segundo lugar, asumimos que es posible cuantificar estos rasgos.
Por ejemplo, podemos decir que se trata de una depresión leve, moderada o
severa, y otorgarle un número. Sin embargo, este proceso de medición no se
encuentra exento de dificultades.
Retomando la definición de medición de Stevens (1949): “medir consis-
te en asignar números en función de ciertas reglas”. El aspecto más importante
de la definición refiere al término “según ciertas reglas”, ya que la asignación
de los números debe establecerse de manera explícita y las reglas empleadas
para definir una medición debe estar exenta de ambigüedades. Esto reviste una
gran dificultad cuando se trabaja con variables inobservables (es decir, cons-
trucciones teóricas o “constructos”). Concretamente, pueden surgir al menos
tres problemas de medición:
18
constructo (por ejemplo, inteligencia) pero que utilizan metodolo-
gías radicalmente distintas. Esto genera que muchas veces hablemos
de la misma variable, cuando en realidad estamos midiendo cosas
distintas.
3. Dificultades de acuerdo o convención en relación al modo en que con-
ceptualizamos el atributo que se pretende medir. Probablemente se
trate del mayor problema de medición en psicología, ya que en esta
disciplina los constructos no pueden definirse operacionalmente de
manera aislada, sino que deben relacionarse o integrarse a una teo-
ría. Cuando pretendemos medir un constructo teórico, debemos
definir los indicadores que usaremos para efectuar tal medición.
Para ello, es esencial haber definido previamente la naturaleza del
atributo que pretendemos medir. La forma en que conceptualiza-
mos un atributo determina que indicadores operacionales vamos a
considerar. Por ejemplo, algunos autores señalan que la “ideación
suicida” (tener ideas recurrentes de muerte) no forma parte de la
depresión, sino que se trata de un constructo distinto que surge
como consecuencia de la desesperanza. Sin embargo, otros autores
lo incluyen como un síntoma de la depresión, conceptualizando
que se trata de un comportamiento propio del mismo trastorno. Por
ende, en un caso se utilizará la ideación suicida como un indicador
de depresión, mientras que en el otro no. Este es un problema que
se repite con prácticamente todos los constructos que se trabajan
en psicología (personalidad, inteligencia, trastornos mentales, y un
largo etcétera). Cada vez que se pretenda medir una misma varia-
ble psicológica nos encontraremos con varios modelos teóricos que
plantean diferentes conceptualizaciones de la misma, y, en conse-
cuencia, contemplan diferentes indicadores operacionales.
19
la construcción y análisis de instrumentos de medición, y b) las técnicas psi-
cométricas, es decir, la utilización de pruebas o test con el objetivo de medir
o evaluar constructos psicológicos con fines profesionales o de investigación.
La delimitación de tests psicológicos no es sencilla, y a lo largo de la historia
su definición ha ido cambiando. Actualmente la definición más aceptada es la
propuesta por la American Psychological Association (en adelante APA, 1999)
quien conceptualiza a los tests como “un procedimiento por medio del cual una
muestra de comportamiento de un dominio especificado, es obtenida y posteriormen-
te calificada, empleando un proceso estandarizado”. A continuación, desglosare-
mos esta definición para lograr una mayor comprensión de la misma.
Cuando intentamos medir un constructo existe una amplia cantidad de
indicadores operacionales que pueden reflejar dicho dominio. Supongamos
por ejemplo que queremos medir la “responsabilidad”, la cantidad de com-
portamientos que indican la existencia de ese rasgo psicológico es innumera-
ble (llegar temprano a clase, hacer las actividades que plantea el profesor, leer
mientos que indican la existencia de ese rasgo psicológico es innumerable (llegar
los contenidos del programa, concluir las actividades planificadas, cumplir las
temprano a clase, hacer las actividades que plantea el profesor, leer los contenidos
obligaciones, ser ordenado
del programa, concluir las yactividades
muchosplanificadas,
otros comportamientos). Difícilmente
cumplir las obligaciones, ser
un testordenado
pueda evaluar todos los comportamientos que se encuentren
y muchos otros comportamientos). Difícilmente un test pueda evaluar involucra-
dos entodos
ese dominio o constructo
los comportamientos que seteórico. Es por
encuentren ello queentrabajamos
involucrados ese dominio con o una
muestraconstructo teórico. Es por
de comportamiento deello
un que trabajamos
dominio con4).
(figura unaDe muestra de comporta-
la misma manera que
miento con
trabajamos de ununa
dominio (figura de
muestra 4). De la mismapara
personas manera que trabajamos
hacer con una sobre
generalizaciones
muestra de personas para hacer generalizaciones sobre una población, en este
una población, en este caso los elementos en vez de ser personas son compor-
caso los elementos en vez de ser personas son comportamientos representativos
tamientos
de unrepresentativos
dominio o constructo.de un dominio o constructo.
Una vez obtenida la muestra
Una vez obtenida la muestra de de comportamiento,
comportamiento, la “calificamos
la “calificamos utilizando uti-
lizandounun proceso
proceso estandarizado”.
estandarizado”. Estoque
Esto significa significa
utilizamosqueunautilizamos
misma consignauna ymisma
consignaescala de respuesta
y escala para calificar
de respuesta parala muestra
calificarde la
comportamientos. Por ejemplo,
muestra de comportamientos.
indicar en
Por ejemplo, qué medida
indicar cada medida
en qué una de lascadaconductas
una del
de test
las refleja características
conductas del testde refleja
tu personalidad usando una escala que va desde el “1” (“muy en desacuerdo con
características de tu personalidad usando una escala que va desde el “1” (“muy
esta descripción de mí mismo”) hasta el “5” (“muy de acuerdo con esta descrip-
en desacuerdo
ción de mí con esta descripción de mí mismo”) hasta el “5” (“muy de
mismo”).
acuerdo con esta descripción de mí mismo”).
Figura Figura
4. Representación deldel
5. Representación proceso subyacente
proceso subyacente en test
en un un psicométrico.
test psicométrico.
21
observación subjetiva y aumentar las posibilidades de replicabilidad por parte
de otros profesionales o investigadores. Otra ventaja es la comunicabilidad,
dado que al disponer de medidas estandarizadas se facilita la comunicación
y la precisión de los datos. El reporte de puntuaciones de test brinda mayor
detalle que los juicios personales. La eficiencia de los test es una ventaja que
no debe pasarse por alto. Si bien el desarrollo de un buen instrumento es-
tandarizado demanda mucho tiempo y esfuerzo, las evaluaciones mediante
pruebas estandarizadas son más económicas en tiempo y dinero que las eva-
luaciones subjetivas. Finalmente, la principal ventaja de los test radica en la
posibilidad de matematizar constructos psicológicos. La posibilidad de abstraer
y representar mediante símbolos numéricos, permite realizar análisis lógico-
matemáticos sobre los valores numéricos y obtener nueva información sobre
los datos observados.
22
|
Un panorama de los test psicométricos:
generalidades, clasificación y tendencias
actuales
Edgardo Pérez y Leonardo Medrano
Introducción
24
en la psicología. La existencia de un factor general de inteligencia es apoyada
por investigaciones psicométricas y de la genética del comportamiento (Plo-
min, DeFries, McClearn y McGuffin, 2002), pero esto no implica negar la
existencia de aptitudes más específicas. En general se asocia este factor g a la
velocidad de procesamiento cognitivo o tiempo de inspección cuyas bases
biológicas no están aun bien determinadas, aunque se ha encontrado alguna
evidencia preliminar en relación con los niveles de glucosa en sangre, la velo-
cidad de conductancia eléctrica, y el volumen cerebral y neuronal.
El neurocientífico Howard Gardner (1994; 1999) efectuó una crítica
radical al modelo de inteligencia general con su teoría de las Inteligencias
Múltiples (multiple intelligences, MI). Para Gardner, los tests miden prefe-
rentemente aptitudes relacionadas con los requerimientos académicos de la
cultura occidental y por eso sólo reconocen dos o tres dimensiones de la inte-
ligencia (lingüística y lógico-matemática, por ejemplo). Su teoría, basada pri-
mordialmente en criterios neuropsicológicos, propone ocho potenciales biop-
sicológicos de procesamiento de información (“inteligencias”) que permiten
resolver problemas o crear productos valorados por una cultura. Estas inteli-
gencias son: Linguistica, Lógico-Matemática, Espacial, Cinestésico-Corporal,
Musical, Interpersonal, Intrapersonal y Naturalista (figura 1). La teoría MI,
de fuerte atractivo, constituye una fuente riquísima de hipótesis que no po-
seen una corroboración empírica exhaustiva ni técnicas validadas de medición
objetiva de sus constructos (Hood y Jonson, 2002). En efecto, los tests dise-
ñados para medir aspectos relacionados con las inteligencias múltiples, tales
como MIDAS (Shearer, 1999) o IAMI (Pérez, 2001), evalúan las habilidades
autopercibidas o la autoeficacia (concepto desarrollado más adelante) y no in-
cluyen problemas a resolver relacionados con las dimensiones de inteligencia
propuestas por Gardner (1999).
25
También existen desarrollos teóricos contemporáneos que representan
una solución de compromiso entre ambas posturas, admitiendo la existencia
de un factor g pero también de aptitudes generales y habilidades específicas
relativamente independientes. Una de estas teorías es la de Cattell-Horn-Ca-
rroll (Carroll, 1993; McGrew, Flanagan, Keith y Vanderwood, 1997), que
propone un modelo de tres estratos (figura 2): la inteligencia general en el es-
trato superior (g), un estrato medio de aproximadamente diez aptitudes cog-
nitivas (procesamiento visual, por ejemplo) y un estrato con numerosas ha-
bilidades más específicas (destrezas manuales, por ejemplo). Un instrumento
contemporáneo basado explícitamente en la teoría CHC es la batería WJ-III
de aptitudes cognitivas (Woodcock, McGrew y Mather, 2001). Las nueve ap-
titudes medidas por este test son: rapidez en el procesamiento, procesamien-
to visual, procesamiento auditivo, memoria a corto plazo, memoria a largo
plazo, comprensión-conocimiento, razonamiento fluido, lectura-escritura y
aptitud cuantitativa. Existen versiones de la batería WJ-III en varios idiomas
(incluida una versión en español) y con un rango de aplicación de 2 a 90 años.
Este tests es extensa, de aplicación individual y posee excelentes propiedades
psicométricas de estandarización, confiabilidad y validez.
Figura 2. Modelo
Figura Integrado
2. Modelo IntegradoCHC
CHC(extraído
(extraídode
de Pérez
Pérez yyMedrano,
Medrano, 2013)
2013)
27
Tabla 1 Relaciones entre los subtests de las escalas Wechsler y los cuatro factores de segun-
do orden
Comprensión Memoria Organización Velocidad de
Subtest
verbal de trabajo perceptual Procesamiento
Subtest verbales
Vocabulario x
Semejanzas x
Aritmética x
Retención de dígitos x
Información x
Sucesión de letras y
x
números
Subtest de ejecución
Figuras incompletas x
Dígitos y símbolos
x
claves
Diseño con cubos x
Matrices x
Búsqueda de
x
Símbolos
28
nación según la teoría de respuesta al ítem, algo muy novedoso en nuestro
país. El test puede ser aplicado a jóvenes y adultos desde los 16 años, y con
al menos tres años cursados de educación secundaria. También se dispone de
una forma abreviada del test que mantiene las condiciones de confiabilidad y
validez de la forma completa y que puede aplicarse con un tiempo límite de
8 minutos.
Evaluación Neuropsicológica
Otra área relevante para la utilización de tests de ejecución máxima es
la neuropsicología, que estudia las relaciones entre el cerebro y la conducta
(Kolb y Wishaw, 1986). El desarrollo de la neuropsicología ha estado deter-
minado por la necesidad de investigar y encontrar herramientas que permitie-
ran el diagnóstico y el tratamiento de los déficits en el rendimiento cognitivo
(memoria, lenguaje, atención, funciones visoespaciales, funciones ejecutivas)
después de la ocurrencia de una lesión cerebral. Frecuentemente, estas lesiones
resultan en trastornos cognitivos que afectan el desempeño de una persona en
las actividades de la vida diaria, especialmente en la esfera laboral. Por ello,
luego de una lesión cerebral es imperioso determinar la cantidad y calidad de
daño cognitivo que puede haber sufrido una persona.
La evaluación neuropsicológica (EN) es la herramienta que posibilita
este diagnóstico. Lezak (1995) identifica cuatro aplicaciones esenciales de la
EN: evaluación propiamente dicha; cuidado del paciente y planificación del
tratamiento; rehabilitación y evaluación del tratamiento; e investigación. En
el manual de Lezak, el texto de actualidad en donde se ha realizado la mayor
recopilación y descripción de tests neuropsicológicos existentes, se mencionan
más de 500 pruebas de este tipo.
Las áreas cognitivas evaluadas por los tests neuropsicológicos son de
una enorme variedad. Así podemos citar: memoria, atención, discriminación
visual, gnosias visuales, gnosias auditivas, discriminación de color, funciones
ejecutivas (planeamiento, verificación), lenguaje (expresión, comprensión,
denominación), praxias (constructivas, de miembros), entre otras. Algunos
de los tests más conocidos en este ámbito son: el Test de la Función Men-
tal Mínima (Mini-mental State Examination) (Folstein, Folstein y McHugh,
1975), utilizado como una prueba de inspección rápida (dura aproximada-
mente 5 minutos) del estado cognitivo general de una persona; el Test de
Stroop (1935), una prueba de atención que requiere determinar el color en
el que están escritos nombres de colores impresos en colores incongruentes
con la palabra (por ejemplo, la palabra “rojo” escrita en tinta verde); el Test de
Clasificación de Cartas de Wisconsin (Heaton, Chelune, Talley, Kay y Cur-
tiss, 1991), una prueba de flexibilidad cognitiva; y la Figura Compleja de
Rey (Rey, 1941), un test de memoria visual y praxias constructivas. Se ha
29
demostrado acabadamente la importancia, utilidad y justificación de esta área
de medición, cuyo logro más reciente es la posibilidad de identificar precoz-
mente déficits cognitivos, tales como la demencia.
Otro dominio íntimamente relacionado con la prevención e interven-
ción es el desarrollo infantil. Los tests de evaluación del desarrollo infantil
miden las áreas motora, afectiva, cognitiva, y del lenguaje, facilitando la de-
tección precoz de posibles anomalías. La población meta de estos instrumen-
tos es la que posee entre 0 y 5 años; incluyendo por lo tanto la evaluación del
neonato (los primeros 30 días de la vida extrauterina); el lactante (desde los
30 días hasta los 24 meses de edad) y el pre-escolar (desde los dos a los cinco
años). Estas pruebas requieren un buen entrenamiento del evaluador en el
manejo y observación de niños pequeños, y sólidos conocimientos teóricos
que permitan otorgar a las conductas observadas la debida importancia en un
contexto de diagnóstico. Debe destacarse que en ningún caso los test de desa-
rrollo reemplazan el examen neurológico del niño, sino que se complementan
mutuamente.
En general, las pruebas de evaluación del desarrollo poseen menos con-
fiabilidad y validez que otros tests de ejecución máxima, debido quizá a la
pobre capacidad de concentración de los niños pequeños y a la rápida madu-
ración cognitiva que caracteriza a este período de la vida (Aiken, 2003). No
obstante, estos tests son útiles para el diagnóstico precoz del retraso mental,
los trastornos cerebrales orgánicos y los trastornos del aprendizaje (dislexia y
discalculia, por ejemplo). Entre los principales instrumentos que se utilizan
en nuestro país podemos destacar las escalas de Gesell y Amatruda (1971),
construidas para diagnosticar si los niños alcanzan parámetros adecuados de
desarrollo. A lo largo de un extenso programa de investigación relacionado
con estas últimas escalas se obtuvieron datos normativos sobre el desarrollo
de las habilidades motrices, lingüísticas y personales-sociales, así como del
comportamiento adaptativo, en niños de 0 a 6 años. Las puntuaciones de
las escalas de desarrollo de Gesell, determinadas por la presencia o ausen-
cia de conductas específicas características de los niños a determinada edad,
se expresan en términos de la edad de desarrollo (ED). Un desarrollo más
contemporáneo y de mucha aceptación internacional es la Escala Bayley del
Desarrollo Infantil, creada en 1933, y cuya última revisión data de 1993. Las
tres secciones de la escala Bayley (escala motora, social y comportamental) se
consideran complementarias y ofrecen una contribución diferente a la evalua-
ción clínica (Bayley, 1993).
En este tipo de tests ninguna respuesta puede ser calificada como co-
rrecta o incorrecta. Aquí se evalúa el comportamiento típico de los individuos,
30
recurriendo a distintas afirmaciones ante las cuales el examinado debe indicar
su nivel de acuerdo o agrado, por ejemplo (Cronbach, 1998). Como expresa-
mos anteriormente, estos tests utilizan preferentemente un formato likert de
respuesta a sus ítems. Los tests de respuesta típica comprenden las medidas
de rasgos de personalidad, intereses y actitudes, así como otros constructos
afectivos y motivacionales relacionados, tales como las actitudes, los rasgos de
personalidad, los intereses profesionales y las creencias de autoeficacia.
31
persona, como en el caso de las habilidades, sino que se vinculan con la con-
ducta típica de las personas en la vida cotidiana, por ejemplo, el nivel típico
de ansiedad o de amabilidad que posee una persona. Existe un buen número
de estrategias diferentes para medir los rasgos de personalidad, aunque en los
últimos años se utilizan preferentemente los inventarios autodescriptivos o de
autoinforme (Casullo et al., 1994). Ejemplos de ítems típicos de este tipo de
inventarios puede ser:
–– Me agradan las reuniones sociales
–– Pongo atención a los detalles
–– Intento no llamar la atención
–– Evito mis obligaciones
32
torno psicológico, y así pueden mencionarse el Inventario de Depresión de
Beck (BDI-II; Beck, Steer y Brown, 1996) o el Inventario de Ansiedad Ras-
go-Estado (STAI; Spielberberg, 1983), el Inventario de Expresión de la Ira
(STAXI; Spielberger, 1988), el inventario de Situaciones y Respuestas de An-
siedad (ISRA; Miguel-Tobal y Cano-Vindel, 1986), entre otros numerosos
ejemplos.
Entre los inventarios autodescriptivos usados para evaluar rasgos de per-
sonalidad en personas sin trastornos psicológicos severos los más populares
son el Inventario de Personalidad 16PF-5 (Russell y Karol, 2000), el Cues-
tionario de Personalidad EPQ (Eynseck y Eynseck, 1997), y los Inventarios
NEO de Costa y Mc Crae (1999).
La teoría de los cinco grandes factores (Norman, 1963; Costa y Mc
Crae, 1999) es, en la actualidad, predominante en la construcción de los in-
ventarios de personalidad elaborados para medir predisposiciones no pato-
lógicas. Esta teoría postula cinco dimensiones afectivas básicas en las cuales
diferimos los seres humanos: Estabilidad Emocional o Neuroticismo, Extra-
versión, Apertura, Responsabilidad y Amabilidad, todas influidas por la he-
rencia. El volumen de investigación acerca de este modelo es abrumador y
parece sugerir mayor consenso entre los investigadores que el obtenido en el
terreno de la inteligencia. No obstante, existen en la literatura contemporá-
nea algunas voces disidentes que prefieren modelos explicativos alternativos,
tales como la teoría PEN de Eynseck (1981), proponiendo tres factores (Neu-
roticismo, Impulsividad o Psicoticismo, Extraversión). Pueden establecerse
relaciones entre ambas teorías, puesto que dos constructos son perfectamente
asimilables: Extraversión y Neuroticismo, y el tercer factor de la teoría PEN,
Impulsividad, se relaciona con Responsabilidad de manera inversa. Los facto-
res Amabilidad y Apertura de Costa y McCrae (1999) son consideradas como
facetas (rasgos más específicos) en la teoría de Eynseck (1981).
El NEO-PI-R (Costa y Mc Crae, 1999) es uno de los instrumentos más
relevantes que se han desarrollado para medir los cinco grandes factores y las
30 facetas específicas que permiten una mayor discriminación en la medición
de la personalidad. El NEO-PI-R se emplea en diferentes áreas de la psicolo-
gía aplicada (en especial en el ámbito laboral) y ha sido adaptado en España
por editorial TEA. También existe una versión abreviada de este inventario, el
NEO-FFI, que mide solamente los cinco factores principales, sin las respec-
tivas facetas.
En general, los inventarios de personalidad son más utilizados en psicolo-
gía clínica con fines de diagnóstico de trastornos psicológicos. Los inventarios
que miden rasgos de personalidad “normales”, tales como el inventario NEO
en sus diferentes versiones (Costa y Mc Crae, 1999) y el inventario 16PF-5
(Russell y Karol, 2000), se emplean crecientemente en Psicología Ocupacio-
nal y Educacional, aunque también en contextos clínicos en especial para
33
diseñar programas de intervención preventivos, relacionados con el manejo
de la afectividad y las relaciones interpersonales. Varias investigaciones han
demostrado que los factores Responsabilidad y Apertura, en particular, son
predictivos del rendimiento académico y ocupacional (Tokar, Fisher y Subich,
1998). Por su parte, Extraversión y Neuroticismo son factores asociados con
la satisfacción en el empleo y el bienestar psicológico general (Lent, 2004).
34
y asignar números a las diversas alternativas de respuesta a esos ítems. Esos
valores numéricos reflejan la intensidad de la actitud, positiva o negativa, que
posee un sujeto frente a un objeto determinado. Los procedimientos de de-
terminación de la confiabilidad y validez de las escalas de actitudes tampoco
difieren de los utilizados en los otros tipos de tests.
Aiken (2003) construyó una escala likert de actitud ante la matemática,
luego adaptada por Murat (1984) para nuestro medio. Una escala frecuente-
mente citada en la investigación contemporánea es la de roles sexuales de Bem
(1974) que mide actitudes ante la masculinidad y la feminidad. Cada ítem
describe algunas características personales típicas de los géneros, y la persona
respondiente debe indicar su grado de acuerdo empleando una escala likert
de siete puntos (muy de acuerdo, bastante de acuerdo, algo de acuerdo, ni
acuerdo ni desacuerdo, algo en desacuerdo, bastante en desacuerdo y muy en
desacuerdo).
En nuestro medio, Tornimbeni y González (1997) elaboraron una es-
cala de actitud hacia la investigación, para ser aplicada en el marco de una in-
vestigación que se realizó encuestando a estudiantes y docentes de las carreras
de psicología de universidades nacionales de Argentina. Uno de los ítems de
esta escala es:
–– Recién al finalizar mi carrera voy a pensar en la posibilidad de con-
vertirme en investigador.
El formato de respuesta de esta escala posee 5 alternativas: muy de acuer-
do, acuerdo, ni acuerdo-ni desacuerdo, desacuerdo, y muy en desacuerdo.
Evaluación de la autoeficacia
La Teoría Social Cognitiva ha destacado el papel de la autoeficacia per-
cibida entre las variables motivacionales y afectivas. Bandura (1997) define la
autoeficacia como creencias en las propias capacidades para ejecutar determina-
dos cursos de acción. Para este eminente teórico, las creencias de las personas
acerca de sí mismas son elementos claves para la determinación de compor-
tamiento. Las creencias de autoeficacia son un elemento de gran influencia y
juegan un rol determinante en las elecciones efectuadas por las personas, el
esfuerzo que ellas invierten, la perseverancia para alcanzar metas y el grado de
ansiedad y confianza que experimentan frente a las tareas de la vida.
La autoeficacia se relaciona fuertemente con los intereses vocacionales
pero se trata de una relación asimétrica, puesto que tal como se ha com-
probado en numerosas investigaciones, las personas tienden a interesarse por
aquéllas actividades en las cuales se sienten capaces de poder realizarlas (Lent,
Brown y Hackett, 1994). La autoeficacia también se relaciona con las apti-
tudes, puesto que las personas se sienten más seguras de emprender aquéllas
actividades en las que han experimentado éxito. No obstante, personas con
35
igual nivel de habilidad pueden experimentar diferente seguridad para em-
prender determinados cursos de acción, por lo cual la autoeficacia permite
mejorar la predicción del rendimiento que realizaríamos si sólo nos guiáramos
por el nivel de habilidad real. Esto es así porque el desarrollo de creencias de
autoeficacia no sólo depende del éxito previo sino de otras fuentes, tales como
el aprendizaje vicario y la persuasión social.
La teoría Social-Cognitiva del desarrollo de carrera (Lent, Brown y
Hackett, 1994) propone un modelo explicativo de las interrelaciones entre
rasgos de personalidad, intereses, habilidades y autoeficacia que contribuye a
esclarecer el significado diferencial de estos constructos (figura 4).
36
En las figuras anteriores pueden observarse las relaciones entre rasgos
de personalidad (más básicos y ligados a lo genético), las aptitudes (también
hereditarias en gran parte y una de las fuentes de la autoeficacia al facilitar las
experiencias de logro en un dominio), la autoeficacia (más ligada al aprendiza-
je, relacionada con el constructo anterior pero también influida por experien-
cias de aprendizaje adicionales tales como la persuasión social y el aprendizaje
vicario), y los intereses vocacionales (aprendidos en gran parte y relacionados
directamente con la autoeficacia y las expectativas de resultados, e indirecta-
mente con las experiencias de aprendizaje y la personalidad).
Bandura (2001) elaboró una monografía para orientar la construcción y
análisis psicométrico de este tipo de escalas, que es de consulta indispensable
para investigadores interesados en la medición de la autoeficacia. El lector
interesado puede acceder al artículo completo titulado Guía para la construc-
ción de escalas de Autoeficacia, ingresando a: www.revistaevaluar.com.ar. Este
es el sitio web de la revista científica Evaluar, publicada por el Laboratorio de
Evaluación Psicológica y Educativa (LEPE).
En nuestro medio Pérez (2001) construyó un Inventario de Autoefi-
cacia para Inteligencias Múltiples (IAMI), con fines de orientación vocacio-
nal, que evalúa la confianza que los adolescentes poseen en características
asociadas con las inteligencias múltiples propuestas por Gardner (1999). El
IAMI incluye 8 escalas obtenidas por análisis factorial y 64 ítems (“Resolver
problemas numéricos”, por ejemplo). El usuario de la prueba debe responder
utilizando un formato de 10 alternativas, desde (1) “no puedo realizar esa
actividad” a (10) “totalmente seguro de poder realizar exitosamente esa acti-
vidad”. Este inventario está incluido en el Sistema de Orientación Vocacional
Informatizado (Fogliatto y Pérez, 2003) y se ha obtenido evidencia favorable
de su confiabilidad y validez respecto a criterios de rendimiento académico y
metas de elección de carrera.
37
Los inventarios de intereses son los instrumentos más populares en
evaluación del comportamiento vocacional, según se desprende de encuestas
realizadas en Estados Unidos, donde instrumentos como el Strong Campbell
Interest Inventory (Campbell y Hansen, 1981) son empleados por casi el
90 % de los orientadores (Hood y Johnson, 2002). Han sido caracterizados
como una serie de ítems en los que se solicita a los individuos indicar sus pre-
ferencias vocacionales y una puntuación final que representa un perfil o pauta
de intereses (Cronbach, 1998).
Se coincide en señalar que deben aplicarse para seleccionar metas voca-
cionales, confirmar elecciones previas, descubrir campos de actividad laboral,
incrementar el autoconocimiento y encontrar ocupaciones que proporcionen
satisfacción (Cronbach, 1998; Hood y Jonhson, 2002). Es claro que los in-
ventarios de intereses poco nos dicen respecto al éxito académico u ocupacio-
nal que podrá alcanzar una persona, pero nos ayudan a identificar carreras u
ocupaciones donde puede encontrar satisfacción.
Debe evitarse la práctica profesional de usar los inventarios de intereses
para orientar de manera específica a los estudiantes, puesto que éstos necesitan
considerar, en el proceso de toma de decisiones de carrera, variables igualmente
relevantes y, además, reunir experiencia exploratoria sobre carreras y ocupacio-
nes (Hood y Johnson, 2002). En general, se recomienda confiar en los resulta-
dos de estos instrumentos a partir de los 15-17 años, aproximadamente, puesto
que se ha verificado que las puntuaciones de medidas de intereses son realmente
estables a partir de esa edad.
El paradigma más influyente en el dominio de la medición de los intereses
vocacionales es el formulado por Holland (1997). La teoría de Holland ha sido
descrita como un modelo de congruencia entre los intereses y habilidades de
una persona por un lado y los factores inherentes a su ambiente por otro. Según
este modelo, existen seis tipos de personalidad: Realista, Investigador, Artista,
Social, Emprendedor y Convencional (RIASEC), los que a su vez determinan
patrones análogos de intereses y habilidades (figura 5).
El desarrollo de estos tipos depende de una compleja serie de aconteci-
mientos familiares, orientaciones personales iniciales, preferencias ocupacio-
nales e interacciones con contextos ambientales específicos. Los ambientes en
los que viven y trabajan las personas pueden también caracterizarse de acuer-
do a su semejanza con seis modelos que se corresponden con los seis tipos de
personalidad anteriormente mencionados.
38
Figura 5. Modelo RIASEC de Holland
39
También debe considerarse el papel de los factores culturales que pue-
den falsear de algún modo los resultados de tests cuando éstos se emplean en
otros medios. Es frecuente encontrar en los inventarios de intereses, ítems que
mencionan actividades que en sus culturas de origen poseen una popularidad
que no tienen en otros contextos; jugar béisbol, por ejemplo, tiene diferente
significación en USA que en otros países donde es un deporte poco practi-
cado. Algunos ítems mencionan títulos ocupacionales que son familiares en
el lugar de elaboración del inventario y, en cambio, resultan extraños para
habitantes de otras regiones (Fogliatto, 1991).
Estos problemas indican con claridad los riesgos de emplear de modo
acrítico inventarios de intereses construidos en otros contextos sociocultura-
les. Fogliatto (1991) planteó la necesidad prioritaria de construir un cuestio-
nario de intereses de características locales y más adecuadas a las preferencias,
actividades educacionales, laborales, así como lenguaje habitual de los jóvenes
de nuestro medio. El Cuestionario de Intereses Profesionales Revisado (CIP-
R, tabla 2) es un módulo del Sistema de Orientación Vocacional Informatiza-
do (SOVI 3; Fogliatto y Pérez, 2003), que incluye también al IAMI, así como
un banco de información académica sobre carreras.
40
elegir una carrera al finalizar su educación secundaria, sino también a los ado-
lescentes que están terminando su educación básica y deben escoger una espe-
cialidad del nivel medio (Polimodal). El CIP-R posee buenas propiedades de
confiabilidad y validez de criterio respecto a metas de elección de carrera. Un
aspecto criticable de este inventario es que su construcción ha sido empírica
(no orientada por un modelo teórico explícito de los intereses vocacionales)
y, por consiguiente, es dificultoso relacionar sus escalas con los constructos
de teorías bien establecidas, tales como el modelo RIASEC (Holland, 1997)
comentado anteriormente.
41
niveles de informatización se desarrollaron gracias a los aportes de la Teoría
de Respuesta al Ítem (TRI), que permitió la creación de los tests adaptativos
informatizados y la construcción automatizada de tests. La idea fundamental
de ambos avances es la de generar pruebas adaptadas al nivel de cada parti-
cipante. De esta forma luego de generarse un banco de ítems y evaluar sus
propiedades psicométricas, la computadora selecciona aquellos que muestren
mayor ajuste al nivel de competencia de la persona evaluada, logrando un au-
mento en la precisión de las medidas y un ahorro en el tiempo de aplicación.
Desde sus inicios, las cuatro generaciones de tests informatizados han
sido utilizadas con diversos y variados propósitos, debido principalmente a la
mayor eficiencia que presentan respecto a las versiones lápiz y papel. Cabe des-
tacar que al informatizar cuestionarios en versión papel y organizarlos dentro
de un sistema de evaluación se introducen una serie de cambios beneficiosos.
Principalmente un mayor control y precisión para la administración de ítems,
mayor eficiencia para la corrección y almacenamiento de respuestas y final-
mente una elaboración rápida y eficaz de informes psicológicos (Drasgow y
Olson-Buchanan, 1999; Sands, Waters y McBride, 1997). Asimismo, los test
informatizados ofrecen menores posibilidades de error en la carga de datos,
los recursos de multimedia hacen más vistosos e interesantes los contenidos
del test para los examinados y permite al profesional ahorrar tiempo evitando
actividades rutinarias de carga y análisis de datos. Tomando esto en conside-
ración no es de extrañar la gran cantidad de estudios actuales desarrollados
con el objetivo de informatizar test en versión lápiz y papel. Esta tendencia
resulta particularmente provechosa en el ámbito de la psicología educacional
donde se deben efectuar evaluaciones a una gran cantidad de participantes y
con cierta frecuencia.
Los test informatizados permiten otra importante ventaja: la adminis-
tración a través de internet. Las ventajas y desventajas de ésta modalidad de ad-
ministración han sido intensamente analizadas en los últimos años. Tal como
sugiere Bagby et al., (2014) dentro de las ventajas se encuentra el bajo costo
de administración, la posibilidad de administrar la prueba desde un lugar re-
moto, incluir dentro de la muestra a personas que no puedan aproximarse al
lugar de evaluación, la velocidad en la recolección de datos con muestras de
gran tamaño, la reducción del tiempo en la corrección de la prueba, e incluso
mayores facilidades para el desarrollo de estudios transculturales.
Los tests informatizados se transformaron en el método de medición
psicológica más recomendado en situaciones estructuradas, ya que garanti-
zan una mayor precisión en la corrección de las pruebas y proporcionan un
feedback inmediato a los examinados mediante el uso de representaciones
gráficas o reportes impresos (Burke y Normand, 1987). En la actualidad se
observa un uso importante de sistemas informatizados de evaluación en el
ámbito laboral (Woicik, Stewart, Pihl y Conrod, 2009), sanitario (Thornton
42
III y Gibbons, 2009), clínico y neuropsicológico (Butcher, Perry y Hahn,
2004). Sin embargo, el uso de sistemas informatizados ha sido especialmente
influyente en el ámbito educativo (Marks y Burden, 2005).
A pesar del enorme potencial de los test informatizados debe consi-
derarse que aparecen nuevos problemas y situaciones que pueden alterar la
confiabilidad y validez de las mediciones con respecto a los test convencio-
nales. De hecho algunos factores como la familiaridad con las computadoras
(McDonald, 2002), la resolución y tamaño del monitor (Ziefle, 1998), las ca-
racterísticas de la fuente de letra utilizada (Bernard, Mills, Peterson y Storrer,
2001), la manipulación del teclado (Choi y Tinkler, 2002), la presentación
de los ítems (Dimock y Cormier, 1991) y la posibilidad de revisar las respues-
tas (Vispoel, 2000), pueden afectar el desempeño y las respuestas brindadas
por los examinados. Por otra parte la evaluación informatizada on line puede
generar dificultades adicionales sobre todo en personas que experimentan an-
siedad ante la tecnología, o bien que desconocen el uso de internet (Bagby et
al., 2014). Por otra parte, la distancia que se genera entre los examinados y el
evaluador dificulta que éste pueda prestar ayuda si aparece alguna dificultad o
error durante el proceso de evaluación. Asimismo, la Comisión Internacional
de Test (International Test Commission, ITC, 2005) destaca la necesidad de
contemplar el aumento de riesgos que surgen con la administración por inter-
net, ya que se dificulta controlar la autenticidad de los examinados y garanti-
zar el correcto resguardo de los ítems y datos del test (seguridad informática).
Frente a ello la literatura especializada enfatiza que los investigadores no
pueden asumir la equivalencia de la versión informatizada online y la versión
tradicional de lápiz y papel. Los cambios en el formato de evaluación pueden
afectar las propiedades psicométricas de los instrumentos y sesgar los puntajes
que se obtienen en las pruebas. Por ello, antes de utilizar un sistema informa-
tizado de evaluación deben contemplarse una serie de directrices y normativas
técnicas. Lamentablemente se observa en muchos casos un uso inadecuado de
los test informatizados. De hecho, la existencia de herramientas on line tales
como SurveyMonkey, Google Doc, u On Line Encuesta, facilita el proceso de
informatizar pruebas de lápiz y papel, llevando en muchos casos a un proceso
de evaluación informatizada que no garantiza la validez y confiabilidad de las
puntuaciones obtenidas. De esta forma puede afirmarse que, junto al creci-
miento de las versiones informatizadas de test, se observa un aumento en el
mal uso de las mismas.
A continuación, se exponen una serie de directrices y recomendaciones
a tener en cuenta para el desarrollo y la utilización de test informatizados. Para
ello se realizará una síntesis de las directrices definidas por la Internacional
Test Commission (2005), American Educational Research (AERA), Ameri-
can Psychological Associatton (APA) y la National Council on Measurement
in Education (NCME; 2014). Por otra parte, y a los fines de lograr una mayor
43
claridad en la exposición de las mismas, se tomará como ejemplo el Sistema
Informatizado de Evaluación de la Satisfacción Académica (SESA-U), un siste-
ma desarrollado en nuestro contexto con el objetivo de identificar estudiantes
con riesgo de experimentar bajos niveles de satisfacción durante su primer
año en la universidad (Medrano, Peréz y Liporace, 2014).
Directrices para el desarrollo y utilización de Test Informatizados:
Recomendaciones de la ITC
44
(Dimock y Cormier, 1991) pueden alterar la confiabilidad y validez de las
puntuaciones. Por tanto, este aspecto debe ser contemplado tanto por los
constructores como por los usuarios del test.
Siguiendo estas directrices el SESA-U se desarrolló utilizando una plata-
forma simple y sin requerimientos técnicos sofisticados que pudieran afectar
la accesibilidad al sistema (figura 6). Cabe señalar que al incluir pocos elemen-
tos gráficos se evitan demoras excesivas en usuarios que tuvieran conexiones
lentas.
45
ma se busca proporcionar orientación a los usuarios sobre cómo proceder en
caso de que surjan problemas que interfieran con el proceso de evaluación.
Asimismo, el SESA-U incluye un servicio de correo electrónico desde el cual
se brinda soporte técnico u orientación en el caso de que aparezcan errores o
fallas no contempladas.
La poca experiencia en la utilización de computadoras puede afectar el
desempeño de los examinados cuando utilizan instrumentos informatizados
de evaluación (Olea y Hontangas, 1999). Para eliminar el efecto diferencial
que puede provocar la falta de familiaridad con el uso de test informatiza-
dos la ITC (2005) recomienda el entrenamiento previo de los usuarios. En
función de ello se recomienda brindar la posibilidad de realizar una práctica
previa, ya que esto puede disminuir los niveles de ansiedad, aumentar la con-
fianza de los examinados en el uso del test y, por lo tanto, disminuir posibles
sesgos que atenten contra la validez y confiabilidad de los resultados (Muñiz
y Hamblenton, 1999).
Por ejemplo, el SESA-U cuenta con un módulo de entrenamiento. De
esta manera al realizar un click sobre “Ayuda - ¿Cómo utilizar el SESA-U?” se
abre un cuadro de dialogo que proporciona una descripción paso a paso sobre
cómo registrarse en el sistema, cerrar la sesión de evaluación o realizar los test
del SESA-U. Asimismo, los usuarios pueden descargar un breve video que
ilustra la manera en que se opera el sistema (figura 7). También es útil proveer
a los usuarios un “test de prueba”, de esta manera puede familiarizarse con
la modalidad de evaluación informatizada y adquiriera cierta práctica previa
antes de proceder con la administración del test (figura 8).
46
Figura 8. Módulo de entrenamiento SESA-U: test de prueba.
47
personas puedan acceder a las respuestas brindadas por el examinado garanti-
zando así la confidencialidad de los datos recabados.
Por otra parte, para resguardar la seguridad del material del test (ítems
por ejemplo), los usuarios solo pueden ingresar al sistema con una contrase-
ña provista por los administradores. Dicha contraseña se modifica periódi-
camente y evita que los cuestionarios del SESA-U se encuentren disponibles
para personas ajenas al proceso de evaluación. Sumado a ello, el SESA-U está
configurado para que los administradores puedan habilitar los cuestionarios
por un tiempo predeterminado, evitando que los ítems se encuentren dis-
ponibles en internet full time. En conjunto estos procedimientos de control
apuntan a impedir el acceso ilegítimo al sistema y controlan la posibilidad
de que los cuestionarios y respuestas de los participantes sean descargadas o
copiadas por personas ajenas al proceso de evaluación SESA-U (figura 9).
Sin lugar a dudas, los test informatizados poseen amplias ventajas por
sobre las versiones tradicionales de papel, tales como una mayor eficiencia
48
para la corrección y almacenamiento de respuestas, menores costos, elabo-
ración rápida y eficaz de informes psicológicos, por mencionar solo algunas.
Sin embargo, todas las ventajas de la evaluación informatizada se tornan irre-
levantes sino se garantiza el cumplimiento de las directrices mencionadas. La
simplicidad con la que hoy puede informatizarse una prueba puede llevar a
un mal uso de las mismas.
No cumplir con las directrices revisadas lleva a que no se pueda garan-
tizar una evaluación responsable y ética. Basta considerar la violación algunas
de las pautas mínimas para el uso de test propuestas por ADEIP (200), como
por ejemplo: 1) no se puede garantizar la seguridad e integridad del material,
2) no se puede garantizar que todos los evaluados comprendan las instruccio-
nes de la prueba, 3) no se garantiza que las condiciones de evaluación permi-
tan el rendimiento óptimo de los evaluados, o 4) no se logra establecer una
relación positiva entre el evaluador y el examinado.
Un uso responsable y ético de los test informatizados necesariamente
implica el cumplimiento de las directrices de tecnología, calidad, control y
seguridad. Asimismo, deben garantizarse el cumplimiento de las normas psi-
cométricas exigidas para los test tradicionales y mantener los resguardos nece-
sarios en relación al control del contexto y la comunicación de resultados. Si
bien puede afirmarse que las ventajas del uso de test informatizados son supe-
riores a sus desventajas, es fundamentar reflexionar sobre estos aspectos para
garantizar un uso ético y responsable de estas potentes técnicas de evaluación.
Revistas Científicas
Muchas publicaciones científicas periódicas incluyen dentro de sus nú-
meros artículos sobre test psicométricos. Más aún, algunas revistas científicas
se especializan en este tipo de trabajos, publicando solamente artículos rela-
cionados con la psicometría y la evaluación psicológica. Algunas de las pu-
blicaciones más recomendadas son: Psychological Assessment, Journal of Perso-
nality Assessment, Educational and Psychological Measurement y Psychometrika,
por mencionar algunas de las revistas internacionales más prestigiosas. Tam-
bién existen revistas en español de muy buena calidad, como, por ejemplo,
49
Psicothema, Anales de Psicología, Ansiedad y Estrés, Revista Iberoamericana de
Evaluación y Diagnóstico Psicológico, Evaluar y la Revista Argentina de Ciencias
del Comportamiento.
Catálogos de Editoriales
La principal fuente de información para los usuarios de pruebas suelen
ser los catálogos de las editoriales. Para acceder a ellos solo debe solicitarse
un ejemplar a la editorial o acceder a ellos a través de la web. Las editoriales
suelen publicar un catálogo cada año. Entre los catálogos más importantes
de pruebas en español se encuentran los publicados por Paidós (http://www.
paidosdep.com.ar/html/tests.php), y por la editorial española TEA (http://
web.teaediciones.com/Catalogos-TEA-Ediciones-2018.aspx).
Listados electrónicos
Existen listados electrónicos a los que se puede acceder a través de in-
ternet. Estos listados proveen información exhaustiva sobre una amplia can-
tidad de pruebas. Entre los listados más importantes a nivel mundial se des-
tacan el Test Locator Service (permite realizar búsqueda de instrumentos por
área temática), la ETS Test collection (permite realizar búsqueda a través del
TestLink, figura 10), el Mental Measurement Yearbook (porporciona revisiones
de pruebas), y el HaPI (una base de datos que cuenta con descripciones de
casi 15.000 pruebas). Por otra parte, la American Psychological Association
(APA) ha elaborado un compendio de test (PsycTest) el cual puede consultar-
se por la web (www.apa./pubs/databases/psyctest/index.aspx).
50
|
Normas Psicométricas: Evidencias de Validez
Leonardo Medrano y Edgardo Pérez
Introducción
51
Puede ocurrir que el investigador cometa el error de elegir comportamientos
que no son representativos del constructo, como, por ejemplo: “me gusta
escuchar música y bailar” o “cuando salgo me gusta tomar alcohol”. Si bien
estos comportamientos pueden estar asociados con la extraversión (es pro-
bable que a una persona extravertida le guste la música o tomar alcohol), no
son representativos del dominio de interés. En consecuencia, el puntaje que
se obtiene del test no representa adecuadamente el constructo que se está mi-
diendo, y, por ende, cometeríamos un error al generalizar los puntajes de la
prueba a todo el dominio.
52
embargo, pueden ocurrir diferentes errores en la selección de los elementos
de la prueba que lleven a que la muestra de comportamientos no represente
adecuadamente el constructo que se pretende medir, es decir, no se obtengan
puntuaciones válidas.
Por ejemplo, puede ocurrir que el investigador seleccione comporta-
mientos que no son representativos del dominio (figura 2). La inclusión de
ítems que no reflejan el constructo lleva a que las puntuaciones de la prueba
se vean contaminadas con ítems sobre constructos que no se pretenden medir,
y por ende no se realicen inferencias adecuadas sobre el dominio de interés.
Seleccionar ítems que no provienen del constructo se denomina inclusión de
varianza irrelevante del constructo, ya que la variabilidad del puntaje total de
la prueba se ve influenciada por respuestas sobre procesos ajenos al verdadero
propósito de la medición. Otro error habitual es el de seleccionar comporta-
mientos que no cubran la totalidad del constructo (figura 3), generando una
sub-representación del constructo.
53
de una prueba, ya que la validez es una propiedad de sus puntuaciones (APA,
1999). Es decir, las puntuaciones que se obtienen de una prueba pueden re-
sultar o no válidas dependiendo del propósito con que se utilicen. No basta
con preguntarse ¿es el IAMI es una prueba válida?, sino que es necesario for-
mularse cuestionamientos tales como ¿es válido utilizar las puntuaciones del
IAMI para examinar el perfil de autoeficacia para inteligencias múltiples? ¿las
puntuaciones del IAMI permiten pronosticar la elección de carrera de estu-
diantes del último año del secundario? En segundo lugar, es importante des-
tacar que la validez es una cuestión de grado. No se valida un test en sí mismo,
sino que se brindan diferentes tipos de evidencias para indicar que las pun-
tuaciones del test reflejan adecuadamente el constructo que se intenta medir.
Cuantas más evidencias se posean, mayores garantías tendremos respecto a la
validez de las puntuaciones.
Esta concepción de validez se refleja en las Normas para Tests Psicoló-
gicos y Educativos (APA, 1999), donde se define a la validez como la adecua-
ción, significación y utilidad de las inferencias específicas hechas a partir de las
puntuaciones de los tests. De esta manera, la validez sería un concepto unitario
y refiere al grado en que la evidencia empírica apoya estas inferencias. La
APA (1999) propone cinco evidencias de validez: 1) evidencias basadas en el
contenido del test, 2) evidencias basadas en la estructura interna del test, 3)
evidencias basadas en el proceso de respuestas, 4) evidencias basadas en las
relaciones que las puntuaciones del test presentan con variables externas, y 5)
evidencias relacionadas con las consecuencias de su aplicación. A continua-
ción, se desarrollan cada una de estas evidencias, detallando el procedimiento
involucrado, los coeficientes estadísticos que se utilizan y brindando ejemplos
aplicados de cada una de ellas.
54
dominio. Posteriormente, mediante un procedimiento estadístico se analiza
el acuerdo de los jueces y se determina cuáles son los ítems que representan
adecuadamente el constructo y cuáles no.
Por ejemplo, un equipo de investigación dirigido por Moretti desarrolló
un test con el objetivo de evaluar pensamientos negativos asociados a los exámenes
(Maurino, Vicente, Medrano y Moretti, 2017). Este constructo refiere a pensa-
mientos que se dan de forma automática, con contenidos negativos, que gene-
ran preocupaciones excesivas, dificultad para pensar en forma clara y disminu-
ción de la confianza. Para elaborar un test que midiera este dominio realizaron
entrevistas a alumnos analizando que tipos de pensamientos solían tener antes
de un examen. A continuación, seleccionaron una muestra de pensamientos y
redactaron ítems preliminares. Posteriormente identificaron jueces expertos en
el tema y les solicitaron que realizaran una evaluación de los ítems considerando
su pertinencia para representar al constructo. Además, se les pidió que evaluaran
la calidad de los reactivos utilizando una escala numérica comprendida entre
1 y 5 (el puntaje de 5 es el más alto e indica una alta calidad mientras que el
puntaje de 1 representa una baja calidad). Finalmente, se les solicitó que ana-
lizaran aspectos formales vinculados a la redacción de los mismos (sintácticos,
por ejemplo). En la tabla 1, se expone un ejemplo de la guía que se proporcionó
a cada uno de los jueces que participó de la revisión de los ítems.
55
crítico V = .50 para ser considerado aceptable (Aiken, 1985). Sin embargo,
estudios más recientes sugieren considerar valores V superiores a .70 (Soto y
Segovia, 2009). En el ejemplo seleccionado se estableció como criterio que
solo se incluirían en el test aquellos ítems que hayan obtenido valores V su-
periores a .70. Los ítems con puntajes inferiores fueron eliminados o refor-
mulados, con el fin de garantizar que el contenido de los ítems represente
adecuadamente el constructo que se pretende medir.
Figura 4. Representación del factor latente común entre dos variables observables.
56
que el análisis factorial constituye una técnica útil para aportar evidencias de
que “se mide lo que se pretende medir”.
58 63
Al inspeccionar las cargas factoriales de cada ítem se aprecia que por
un lado se encuentran las emociones positivas, y en un factor distinto se en-
cuentran las emociones negativas. Dado que los ítems se agruparon en las
dimensiones predichas a nivel teórico, entonces se obtienen evidencias sobre
la validez de la medición.
“me empiezo a acordar de otras veces que tuve un problema parecido y si pude resol-
verlo… en general los resuelvo bien por eso puse un puntaje alto”
59
“para responder a esta pregunta me pongo recordar lo que me dice mi supervisor, por
ahí me corrige mucho y creo que eso hace que no tenga tanta confianza”
“Yo me fijo en lo que dicen mis clientes, si ellos están satisfechos eso significa que hice
un buen trabajo y que soy bueno en lo que hago”.
“Tengo mucha experiencia en este trabajo, hace más de 20 años que trabajo en esto y
he aprendido mucho... por eso creo que soy bastante bueno”
Evidencias basadas en las relaciones que las puntuaciones del test presentan
con variables externas
El análisis de las relaciones de las puntuaciones del test con variables
externas constituye otra fuente importante de evidencia. Dentro de esta cate-
goría suelen diferenciarse tres procedimientos: a) evidencias de relación test-
criterio, b) evidencias convergente-discriminante, y c) grupos contrastados (o
también denominada grupos conocidos).
La evidencia basada en las relaciones “test-criterio” consiste en correla-
cionar las puntuaciones de la prueba con un criterio externo, es decir, una
medida directa e independiente que el test intenta predecir. Por ejemplo, una
medida criterio para una prueba que evalúa aptitudes o inteligencia podría
ser el rendimiento académico obtenido por el alumno al final del cursado, o
para una prueba que evalúa depresión el diagnóstico que efectúa un terapeuta
mediante una entrevista estructurada. De la misma forma, una medida crite-
rio para una prueba que evalúa motivación laboral puede ser el rendimiento
que reporta el supervisor del examinado. Es decir, que las medidas “criterio”
hacen referencia a una variable que puede medirse de manera independiente
al test y que teóricamente se encuentra relacionada con el constructo de inte-
rés. De esta forma, si se corrobora que el test se relaciona con un criterio (con
el que teóricamente debería estar relacionado), entonces estamos obteniendo
evidencias de que el test mide lo que dice que mide.
Dentro de este tipo de evidencias se pueden diferenciar dos procedi-
mientos, uno de tipo predictivo y otro concurrente. La diferencia entre ambos
procedimientos radica sobre todo en el tiempo que transcurre entre la admi-
nistración del test y la medición del criterio. Cuando se utiliza un abordaje
predictivo (también denominado validez predictiva) se espera que la prueba
60
pronostique el valor que tendrá la medida criterio en el futuro. Por lo tanto,
debe transcurrir un tiempo entre ambas mediciones. Por el contrario, cuando
se realiza un estudio de tipo concurrente (también denominado validez concu-
rrente) se analiza la concordancia entre las puntuaciones obtenidas en la prue-
ba y la condición actual del examinado en otra variable o criterio. Es decir que
la medición se realiza de forma simultánea. Tal como señala Hogan (2004)
la diferencia radica entonces en el tiempo en que se mide la variable criterio.
Un ejemplo de validez predictiva se puede observar en una investiga-
ción realizada por Medrano, Moretti, Ortiz y Pereno (2014), en donde se
recaban evidencias de validez para un Cuestionario de regulación emocional.
Este constructo refiere a toda estrategia (voluntaria o involuntario) que con-
tribuye a mantener, aumentar o disminuir un estado afectivo en curso. Así,
la rumiación (pensar excesivamente sobre un evento displacentero) o la ca-
tastrofización (tener pensamientos que enfatizan o agradan las consecuencias
negativas de un evento) son estrategias automáticas que pueden aumentar
los niveles de ansiedad de una persona. En contrapartida, estrategias como
la reinterpretación positiva (pensamientos que otorgan un significado posi-
tivo al evento displacentero) o poner en perspectiva (relativizar la gravedad
de un evento comparándolo con otros o analizando su impacto a lo largo
del tiempo), pueden generar una disminución de un estado emocional desa-
gradable. Para recabar evidencias de validez predictiva se administró el test y
varias semanas después se evaluó el nivel de ansiedad que los alumnos presen-
taban en un examen. Si la prueba efectivamente mide lo que dice que mide,
entonces debería poder pronosticarse los niveles de ansiedad a partir de las
puntuaciones de la prueba. Los resultados obtenidos al utilizar un coeficiente
de correlación de Pearson, corroboraron que existía una relación significativa
entre los niveles de rumiación (r =.22) y catastrofización (r =.45) con los ni-
veles de ansiedad que experimentaban los alumnos durante el examen. Como
estos resultados son coherentes con los esperados a nivel teórico, se obtienen
evidencias que indican que el test mide lo que dice que mide.
Un ejemplo de validez concurrente se observa en un estudio realizado
por Moretti, Medrano y Basler (2015) que tuvo por objetivo aportar eviden-
cias de validez para una escala de locus de control del dolor. Este constructo
hace referencia a la creencia que posee la persona acerca de la relación entre
su conducta y los niveles de intensidad del dolor. Se trata de una variable de
importancia en personas que padecen dolor crónico ya que quienes poseen
mayor locus de control interno (creencia de que el nivel de dolor se asocia a
mi propio comportamiento) suelen mostrar mayor proactividad en acciones
beneficiosas para la salud que incluyen conductas de autocuidado, manteni-
miento de habilidades de la vida cotidiana y, en consecuencia, menor inten-
sidad del dolor. Por el contrario, mayor locus de control externo (creencia
de que el nivel de dolor no se asocia con mi comportamiento) se relaciona
61
con un peor afrontamiento y malestar psicológico, aumentando los niveles
de intensidad del dolor. Para recabar evidencias de validez concurrente se ad-
ministró el cuestionario de locus de control junto a un test que evalúa inten-
sidad percibida del dolor. Los resultados obtenidos mediante el coeficiente
de correlación de Pearson indican que las personas que tenían puntuaciones
más elevadas de locus de control externo también presentaban mayor nivel
de dolor (r =.15). En consecuencia, se obtienen evidencias favorables sobre la
validez de las puntuaciones del test.
Es importante señalar que el comportamiento humano resulta dema-
siado complejo como para esperar que a partir de los resultados de una única
prueba se logre una predicción exacta de un criterio. Por ello las correlacio-
nes esperables en este tipo de estudio suelen ser moderadas, vale decir que
coeficientes de correlación significativamente distintos de cero y con valores
aproximados a .30 ya son aceptables. Actualmente la mayoría de las investi-
gaciones realizadas para verificar la utilidad predictiva de las puntuaciones de
un test utilizan un enfoque multivariado puesto que permite esclarecer las
interrelaciones entre un conjunto de predictores y un criterio, y no solamente
las relaciones entre una única variable predictora y un criterio. Mediante mé-
todos multivariados como el análisis de regresión múltiple podemos estimar
cuánto se incrementa la precisión de las predicciones cuando un test se incluye
en una batería de tests en comparación con las ocasiones en que no se incluye
(Aiken, 2003). Este tipo de evidencia de validez se denomina incremental,
pero debido a su complejidad no será trabajada en el presente capítulo.
Un segundo tipo de procedimiento habitualmente utilizado para reca-
bar evidencias mediante variables externas es la evidencia convergente-discrimi-
nante. Esta evidencia consiste en correlacionar las puntuaciones del test que
se pretende validar con las obtenidas en otros test que evalúan constructos
semejantes (validez convergente) o diferentes (validez discriminante o diver-
gente). Se espera así que la prueba presente correlaciones más altas con el test
que mide un constructo semejante, que con aquellos que miden un construc-
to diferente.
En un estudio desarrollado por Medrano y Trógolo (2014), por ejem-
plo, se correlacionaron las puntuaciones obtenidas en un cuestionario de difi-
cultades en la regulación emocional con una prueba que evalúa extraversión y
otra que evalúa neuroticismo.
62
Figura 7. Extracto del artículo de Medrano y Trógolo (2014) sobre evidencias de validez con-
vergente-discriminante.
63
Figura 8. Extracto del artículo de García-Bastista et al. (2017) sobre evidencias de validez
mediante grupos contrastados.
64
ciente o que proporciona información para brindar intervenciones a ingresan-
tes universitarios. Si se obtienen resultados que sustentan dichas afirmaciones
(por ejemplo, se corrobora que se logra una intervención más eficaz sobre
los alumnos al utilizar el test), entonces se obtienen evidencias favorables de
validez.
Este tipo de evidencia no se encuentra exenta de críticas, dado que mu-
chos autores sostienen que las consecuencias de las aplicaciones de una prueba
no afectan directamente la validez de sus puntuaciones. Por lo cual, la validez
de las consecuencias no sería un concepto psicométrico legítimo. No obs-
tante, otros autores sostienen que se trata de una evolución del concepto de
validez. En todo caso lo que queda claro es que la polémica sobre la validez de
las consecuencias continuará durante algún tiempo (Hogan, 2004).
A modo de síntesis
65
Tabla 2. Síntesis de métodos y evidencias de validez propuestas por la APA (1999)
66
|
Normas Psicométricas: Confiabilidad
Leonardo Medrano
Introducción
67
constituye la norma psicométrica más importante en la teoría de los test, es un
prerrequisito que la prueba sea confiable. Puede que la prueba esté compuesta
por ítems que reflejan adecuadamente el constructo, pero si el examinador
comete errores al administrar la prueba, o al interpretar sus puntuaciones,
entonces los puntajes del test dejan de reflejar con precisión el constructo.
Entre las fuentes más comunes de error se encuentran los errores en la
calificación de la prueba. Esto puede ocurrir cuando los evaluadores utilizan
diferentes criterios para puntuar una misma prueba, por ejemplo, si uno de
los evaluadores es más “exigente” que otro respecto a las respuestas que con-
siderará correctas. También puede ocurrir que el evaluador cometa errores en
la corrección de la prueba, tales como calificar accidentalmente las respuestas
de una prueba de opción múltiple al utilizar una grilla de corrección inco-
rrecta. Otra fuente de error pueden ser las variaciones en la administración
de la prueba. Por ejemplo, si los evaluadores explican una misma consigna
de forma diferente, o cometen errores al dar las instrucciones de la prueba, o
administran la prueba en condiciones físicas inadecuadas (un lugar con poca
luz o mucho ruido, por ejemplo).
Las condiciones personales temporales del examinado también pueden
constituir una fuente de error. Supongamos que aplicamos la misma prueba
a una misma persona en diferentes ocasiones. Lo más probable es que las
puntuaciones de una ocasión a otra varíen ya que las condiciones temporales
de los examinados pueden ejercer una influencia no sistemática en sus pun-
tuaciones. Puede ocurrir por ejemplo que un día se encuentre más cansado,
o tenga hambre, o se encuentre más enojado, triste o nervioso. Es decir, el
rasgo que se pretende medir (por ejemplo, inteligencia) no ha cambiado, las
condiciones de administración y la prueba son las mismas, pero los puntajes
cambian de una ocasión a otra debido a que la condición personal temporal
ha influido en las puntuaciones.
Todas estas leves variaciones van introduciendo errores que afectan la
precisión de la medición. En este marco surgen los siguientes interrogantes ¿Es
posible lograr una medición libre de error? ¿De qué manera podemos determinar
el nivel de error de una medición y evaluar su impacto en las puntuaciones de la
prueba?
El interrogante acerca de la precisión de los instrumentos y herramien-
tas que utilizamos para aproximarnos a la realidad, constituye uno de los
problemas centrales de la filosofía de la ciencia y especialmente de la psico-
metría. El largo camino que conduce a los actuales coeficientes estadísticos de
confiabilidad (reliability en inglés), comienza en la astronomía del siglo XVII.
Los astrónomos observaban que sistemáticamente aparecían diferencias entre
las observaciones que realizaban mediante sus telescopios (Maradi, Archenti y
Piovani, 2007). En función de ello, se comenzó a hipotetizar que dichas dife-
rencias se debían a fallas en las herramientas o personas que las manejaban. Es
decir, comienza a considerarse el problema de la precisión de los instrumentos
68
y herramientas utilizadas en el ámbito científico.
El primer ensayo sobre “fallas en la observación” es un artículo del ma-
temático Thomas Simpson publicado en el año 1757. Posteriormente, a prin-
cipios del siglo XIX, el matemático Gauss recolectó una serie de registros
realizados por diferentes observatorios astronómicos europeos. Su objetivo
consistía en confrontar los resultados de observaciones repetidas del mismo
fenómeno para cuantificar la precisión de dichos instrumentos. A partir de
sus investigaciones, Gauss observó que las fallas de medición se distribuían de
una manera normal (figura 2).
Recién en el año 1904, el psicólogo Spearman propone un modelo para
abordar esta problemática. La teoría clásica de los tests (TCT) es un modelo
lineal de medición formulado por Spearman y posteriormente consolidado
por Thurstone (1935) y Gulliksen (1950). Su hipótesis fundamental es que la
puntuación observable de una persona en un test es una función de dos com-
ponentes: su puntaje verdadero y el error de medición implícito en la prueba.
El postulado esencial de la TCT se expresa como:
PO = PV + E
69
Figura 2. Distribución hipotética de las puntuaciones observadas (PO) en torno a la puntua-
ción verdadera.
70
de un test están libres de errores de medición. En otras palabras, refiere a la
consistencia entre los puntajes de un test, obtenidos por los mismos indivi-
duos en distintas ocasiones o entre diferentes conjuntos de ítems equivalentes.
De manera semejante a como ocurre en la validez, la confiabilidad es
una cuestión de grado, y no existe un único procedimiento que permita es-
timar todos los errores de una prueba. Ello se debe a que existen diferentes
fuentes de inestabilidad o error. Por este motivo suelen considerarse diferentes
dimensiones de la confiabilidad. A continuación, se expondrán tres procedi-
mientos que se utilizan habitualmente para determinar el impacto de alguna
fuente de inestabilidad sobre las puntuaciones. Ninguno de estos procedi-
mientos permite evaluar de manera “integral” a la confiabilidad, sino que
brinda información sobre alguna de sus dimensiones. Las dimensiones reco-
nocidas por la APA (1999) son la estabilidad, consistencia interna y confiabi-
lidad inter-examinadores.
Estabilidad
En esta dimensión se pretende evaluar el grado en que el puntaje obser-
vado está libre de errores causados por cambios en las condiciones personales
temporales del examinado (estado de ánimo, nivel de motivación o cansancio,
por ejemplo), y por variaciones en las condiciones de administración de la
prueba (condiciones físicas de la administración, por ejemplo). Cuando las
puntuaciones de una prueba no se ven seriamente afectadas por estas fuentes
de inestabilidad decimos que las puntuaciones son estables. Los procedimien-
tos sugeridos para evaluar la estabilidad son el método test-retest, y el método
de formas equivalentes (APA, 1999).
El método consiste test-retest es el más utilizado para evaluar la estabili-
dad. Consiste en admnistrar el mismo test en dos oportunidades a la misma
muestra de sujetos, con un intervalo de tiempo intermedio. Posteriormente
se calcula la correlación entre los puntajes obtenidos en la primera y segunda
administración. Cuando se obtienen valores elevados de correlación (valores r
de Pearson en torno a .80), significa que los puntajes obtenidos en la prueba
no se alteran sustancialmente por variaciones en las condiciones personales o
por las condiciones de administración.
A modo de ejemplo, para evaluar la estabilidad del IAMI se administró
la prueba a una muestra de 119 sujetos y un mes después los mismos suje-
tos respondieron nuevamente al inventario. Los puntajes obtenidos en ambas
aplicaciones fueron correlacionados (r de Pearson). Los resultados obtenidos
(figura 3) indicaron niveles óptimos de estabilidad para alguna de sus escalas
(valores r superiores a .80) y aceptables para otras (valores r superiores a .70).
71

Figura 3. Extracto del artículo de Pérez, Beltramino y Cupani (2003) sobre la estabilidad del
IAMI.
72
Figura 4. Diagrama de los métodos Test-Retest y Formas Equivalentes.
73
ción, sino que además considera variaciones en el contenido de la prueba. Es
por ello que se lo considera un método adecuado para evaluar las dimensiones
de estabilidad y consistencia interna de una prueba. A pesar de sus ventajas es un
procedimiento poco utilizado en psicometría por la sencilla razón de que son
pocas las pruebas que cuentan con versiones paralelas (Hogan, 2004).
Consistencia Interna
Esta dimensión de la confiabilidad consiste en determinar si las dife-
rentes partes del test evalúan el mismo constructo, vale decir, si son homo-
géneas. Tal como señala Hogan (2004), la homogeneidad (del griego homos,
que significa “misma” y genos, que significa “clase”) refiere al grado en que los
reactivos o ítems de una prueba son iguales en términos de lo que miden. La
fuente de inestabilidad que se intenta examinar en esta dimensión es la refe-
rida a las variaciones en el contenido de los ítems o errores en el muestreo de
ítems, y resulta especialmente relevante cuando utilizamos el puntaje total de
la prueba (es decir, la sumatoria o promedio de los ítems). Supongamos que
una prueba incluye ítems que evalúan razonablemente bien el rasgo medido,
pero también incluye ítems que por variaciones en su contenido o por un
error en el muestreo examinan otro constructo. En consecuencia, al calcular
el puntaje total del test obtendremos una medida compuesta por ítems que
examinan adecuadamente el rasgo e ítems que examinan otra cosa, generando
que la puntuación de la prueba pierda precisión. La homogeneidad de una
prueba es deseable en tanto permite una interpretación relativamente directa
del rasgo examinado (Cohen y Swerdlik, 2006).
Como señala Kline (1983), es importante que una medida sea auto-
consistente por la sencilla razón de que, si las diferentes partes que componen
una prueba no se relacionan entre sí, entonces es probable que estén midien-
do cosas distintas. El énfasis que se otorga a la consistencia interna implica
que de no ser consistente la prueba, sus puntuaciones reflejarán diferentes
constructos y por ende no serán válidas. No obstante, como veremos más
adelante, existen muchas críticas y posiciones que disienten sobre la relevancia
de esta dimensión.
Los procedimientos para evaluar la consistencia interna de un test son:
el método de formas equivalentes (descripto anteriormente), el método de par-
tición en mitades, y los métodos basados en la covariación de ítems.
El método de partición en mitades fue muy popular, pero en la actuali-
dad se encuentra prácticamente en desuso. El mismo analiza la consistencia
interna dividiendo la prueba en dos mitades comparables, y correlacionando
las puntuaciones obtenidas en ambas mitades. En caso de obtenerse correla-
ciones elevadas, se corrobora que las diferentes partes de la prueba examinan
el mismo constructo. Sin embargo, esta metodología adolece de dos grandes
limitaciones. En primer lugar, los criterios para obtener las dos mitades son
74
arbitrarios y en algunos casos la división de la prueba puede generar mitades
no comparables (por ejemplo, si se trata de una prueba de dificultad crecien-
te). Pero la segunda limitación es aún más preocupante, ya que como pueden
establecerse diferentes criterios para dividir la prueba (ítems pares vs. impares,
los primeros ítems vs. los últimos, división aleatoria, etc.), podrían existir tan-
tos coeficientes de confiabilidad como posibilidades de división de la prueba.
Esto llevaría a que una misma prueba pueda presentar múltiples índices de
consistencia interna.
Los métodos basados en la covariación de ítems son los más utilizados en
la actualidad para estimar la consistencia interna de una escala. El coeficiente
Alfa de Cronbach (para ítems politómicos) y las fórmulas Kuder-Richardson
(para ítems dicotómicos) son los procedimientos estadísticos preferidos para
examinar esta dimensión. A diferencia del método de partición en mitades
que solo correlacionaba dos partes de la prueba, analizan la intercorrelación
promedio entre todos los reactivos. Dicho de otra manera, producen una
estimación del promedio de todos los posibles coeficientes obtenidos por par-
tición en mitades (Hogan, 2004).
En la actualidad, el coeficiente alfa de Cronbach es el estadístico más
citado para obtener una estimación de la consistencia interna de los test psico-
lógicos. De hecho, se estima que el artículo de Cronbach (1951) se cita cerca
de 325 veces por año en diferentes investigaciones realizadas en el ámbito de
las ciencias sociales (Liu y Zumbo, 2007). El coeficiente alfa permite evaluar
que tan similares son el conjunto de ítems de una prueba determinada. A
diferencia del coeficiente de Pearson que fluctúa entre –1 y +1, el coeficiente
alfa varía típicamente en un rango entre 0 y 1 (Aiken, 2003). Esto quiere de-
cir que la similitud de un agrupamiento de ítems va a variar entre 0 (no hay
similitud entre los reactivos) hasta 1 (los reactivos son idénticos).
Existe cierta disparidad entre los autores respecto a los valores que debe
presentar dicho coeficiente para considerar que la escala es consistente. Por
ejemplo, Nunnally y Bernstein (1994) consideran que un valor de α =.95
debe ser la norma aceptable. Por el contrario, Manzano y Tobio (2003) seña-
lan que un valor de alfa superior a .90 s demasiado alto e indica redundancia
de reactivos. En general, se acepta que estimaciones de .80 o superiores son
consideradas entre moderadas y elevadas, mientras que puntajes cercanos a
.70 resultan aceptables (Hogan, 2004). Los mismos criterios se utilizan para
interpretar las puntuaciones del coeficiente KR-20 de Kuder-Richardson.
Un ejemplo del uso de esta metodología puede observarse en un estu-
dio de Medrano y Trógolo (2016). En dicho trabajo se analizó la consistencia
interna de una serie de escalas que componen el DERS (Difficulties in Emo-
tion Regulation Scale). Un instrumento que examina diferentes estrategias de
regulación emocional, como, por ejemplo, aceptación emocional o control de
impulsos. Los resultados obtenidos mediante el alfa de Cronbach (α) sugieren
que cada una de las escalas que componen el instrumento son consistentes
75
(figura 6), es decir, sus ítems son homogéneos en términos de lo que miden.
Figura 6. Consistencia interna de las escalas del DERS (extraído de Medrano y Trógolo, 2017).
76
los problemas del paciente desde un marco teórico específico y aplicar técnicas
o métodos terapéuticos congruentes con los objetivos del tratamiento y las ca-
racterísticas del paciente. Para calificar la prueba el examinador debe observar
una sesión terapéutica y luego puntuar los comportamienos que se describen
en cada ítem (por ejemplo, “el terapeuta trabajó con el paciente para establecer
un plan apropiado con objetivos específicos adecuado al tiempo disponible”,
o “el terapeuta desplegó niveles óptimos de calidez, preocupación, confianza
y autenticidad”). Mientras observa dichas conductas utiliza una escala que va
desde de 0 (pobre desempeño) a 6 (excelente desempeño) para calificar el des-
empeño observado. En un estudio realizado por Medrano y Moretti (2015) se
filmaron sesiones de diferentes terapeutas y luego se solicitó a 10 evaluadores
que calificaran a los terapeutas evaluando de forma independiente los mismos
videos. Posteriormente, se efectuó una correlación inter-clase obteniéndose
resultados de .81 para la escala de competencias generales y de .83 para las de
competencias específicas. Sin embargo, algunos ítems presentaron menores
niveles de acuerdo, por lo cual fueron reformulados (figura 7).
Figura 7. Acuerdo entre examinadores para la Escala de Terapia Cognitiva (extraído de Me-
drano y Moretti, 2017).
A modo de síntesis
77
por ítems que reflejan adecuadamente el constructo, pero si el examinador
comete errores al administrar la prueba, o al interpetar sus puntuaciones, en-
tonces los puntajes del test dejan de reflejar con precisión el constructo.
Entre las fuentes más comunes de error se encuentran los errores en la
calificación de la prueba, las variaciones en las condiciones de administración de
la prueba y por condiciones personales temporales. Tal como ocurre en la validez,
la confiabilidad es una cuestión de grado, y no existe un único procedimiento
que permita estimar todos los errores de una prueba. Ello se debe a que exis-
ten diferentes fuentes de inestabilidad o error. Por este motivo suelen conside-
rarse diferentes dimensiones de la cofiabilidad. En la tabla 1 se exponen sinté-
ticamente los procedimientos recomendados por la APA (1999). Ninguno de
estos procedimientos permite evaluar de manera “integral” a la confiabilidad,
sino que brinda información sobre alguna de sus dimensiones
78
|
Interpretación de Puntuaciones
Leonardo Medrano
Introducción
79
pueden contribuir a desregularnos emocionalmente, ya que prolongan de for-
ma innecesaria emociones como la tristeza o el miedo (Medrano et al., 2013).
Los ítems presentados anteriormente forman parte de un cuestionario
que permite evaluar la frecuencia con que ocurren diferentes procesos cogni-
tivos implicados en la regulación emocional (CERQ, Medrano et al., 2013),
concretamente los cuatro ítems anteriores examinan la tendencia a autoincul-
parse. Ahora bien, en función de los valores que usted obtuvo en la prueba
¿Cuál es su nivel de autoinculpación? Supongamos que obtuvo un puntaje
total de 10 o 15 puntos ¿El nivel de autoinculpación es alto o bajo? ¿Cómo
debemos interpretar estos puntajes?
La suma de las respuestas a los ítems constituye un ejemplo de puntua-
ción original o natural. Esta es el resultado más inmediato de la calificación
de una prueba. Se pueden obtener de diferentes formas, puede ser el total de
preguntas correctas, el promedio de puntuaciones de los ítems o la sumatoria
de los ítems individuales. El problema de esta puntuación es que no puede in-
terpretarse de forma directa y por ende no se le puede otorgar un significado.
Las puntuaciones naturales que obtenemos de un test no pueden inter-
pretarse directamente ya que las mediciones en psicología poseen dos limita-
ciones: 1) no poseen unidades constantes de medición (cada test emplea uni-
dades de medida diferentes), y 2) carecen de cero absoluto (el cero no puede
indicar ausencia del rasgo porque nunca se obtiene un muestreo exhaustivo o
de todos los posibles “indicadores operacionales” del rasgo).
Por este motivo es que debe apelarse al uso de diferentes estrategias para
poder interpretar los puntajes de una prueba. En el presente capítulo nos cen-
traremos en los dos métodos de interpretación más utilizados: interpretación
referida a normas e interpretación referida a criterios.
80
versitarios. El promedio obtenido fue de 12,42 (con una desviación estándar
de 3,53). Esto significa que, si obtuvimos un puntaje de 10, nuestros niveles
de autoinculpación son inferiores al promedio de estudiantes universitarios.
Sin embargo, aunque tenemos más información que antes para inter-
pretar el puntaje natural siguen persistiendo interrogantes ¿cuán alejados es-
tamos del promedio? ¿cuánta es la distancia que hay entre una persona que
obtuvo 10 y otra que obtuvo 15? En efeto puede suponerse erróneamente que
la diferencia es de 5 puntos, pero debemos recordar que no contamos con uni-
dades constantes de medición, por lo cual no podemos responder drectamen-
te a estos interrogantes. Par poder hacerlo debemos transformar los puntajes
originales en puntuaciones derivadas que nospermitan indicar la posición re-
lativa de los puntajes directos individuales en relación al grupo de referencia.
Existen dos métodos populares de trasformación: a) las puntuaciones estándar
y, b) los rangos percentilares y percentiles (Hogan, 2004).
Puntuaciones estándar
Existen una variedad de puntuaciones estándar. Todas ellas parten de la
utilización de puntajes z. Conociendo la media y desviación estándar de un
conjunto de datos podemos transformar la puntuación natural de un indivi-
duo en un puntaje z (independientemente del tipo de variable que estemos
midiendo). Para ello solo debemos aplicar la siguiente formula:
X−X
Z=
sx
10 –12,42 = 0,68
3,53
81
de medida, podemos hacer juicios sobre las proporciones ya que contamos
con una unidad constante de medición. Siguiendo con el ejemplo, podemos
afirmar que quien obtuvo 20 puntos posee más del doble de autoinculpación
que quien obtuvo 15 puntos.
82
Figura 2. Transformación de los puntajes naturales de dos variables a una métrica en común
(puntaje Z).
83
tan el inconveniente de ser difíciles de comunicar para usuarios no especiali-
zados. Decir a una persona que su nivel de autoinculpación es equivalente a
0,68 desviaciones estándar por debajo de la media puede ser poco comprensi-
ble. Por este motivo, es habitual que la mayor parte de las pruebas psicológicas
utilicen rangos percentilares y percentiles.
84
limita a leer la tabla e identificar el percentil correspondiente para la puntua-
ción natural que le interesa interpretar. En la figura 3 se presenta un baremo
para la escala de autoinculpación del ejemplo. Sugerimos al lector que trate de
interpretar el puntaje natural que obtuvo utilizando este baremo.
85
percentiles con fines de comunicación profesional, y las puntuaciones están-
dar sean más comunes en contextos de investigación.
86
Figura 4. Ítems del PHQ-9 para la evaluación de la depresión.
A modo de síntesis
87
debe apelarse al uso de diferentes estrategias para poder interpretar los pun-
tajes de una prueba. En el presente capítulo se analizaron los dos métodos de
interpretación más utilizados: la interpretación referida a normas, y la inter-
pretación referida a criterios.
Es importante señalar que hablar de pruebas referidas a normas o prue-
bas referidas a criterio es inapropiado (Hogan, 2004), ya que no es la prueba
sino el marco de referencia para interpretar el puntaje natural lo que refiere al
criterio o la norma. De hecho, ambos tipos de interpretación pueden utilizar-
se en una misma prueba.
La interpretación referida a normas es la estrategia más común para
interpretar las puntuaciones naturales de un test y poder otorgarles un signifi-
cado. Este método consiste en comparar el puntaje obtenido por el individuo
con los obtenidos por un grupo de referencia. Para poder hacerlo debemos
transformar los puntajes originales en puntuaciones derivadas que nos permi-
tan indicar la posición relativa de los puntajes directos individuales en rela-
ción al grupo de referencia. Existen dos métodos populares de trasformación:
las puntuaciones estándar y los rangos percentilares y percentiles.
Los percentiles son más fáciles de interpretar y comunicar, pero alteran
la distribución original de las puntuaciones naturales afectando el funciona-
miento de diversos procedimientos estadísticos. Por su parte, las puntuacio-
nes estándar respectan la distribución original de las puntuaciones naturales,
pero son más difíciles de comunicar para un público no especializado. Por este
motivo, es habitual que se utilicen los percentiles con fines de uso profesional,
y las puntuaciones estándar sean más comunes en contextos de investigación.
Las interpretaciones referidas a criterio en vez de comparar el punta-
je del sujeto con un grupo de referencia, analizan la posición absoluta del
individuo con respecto a un dominio de conductas previamente definido.
Este método de interpretación es especialmente útil para medir cambios en
los propios individuos, es decir diferencias intraindividuales observadas como
efecto de una intervención clínica o educativa. Por ello resulta una interpre-
tación más adecuada para fines de diagnóstico y evaluación de la eficacia de
intervenciones psicológicas sobre el dominio o constructo en estudio.
88
|
Construcción y Adaptación de Test Psicométricos
Leonardo Medrano, Edgardo Pérez y Alberto Fernández
Introducción
89
Sesgos, Construcción y Adaptación de Test
90
Tomemos como ejemplo una hipotética investigación en donde se mi-
diese la capacidad de denominar objetos o animales. Si entre los ítems estu-
vieran incluidas las figuras de un canguro y un oso koala es más probable que
una muestra de australianos obtenga puntuaciones superiores a las de una
muestra de argentinos. Estos datos no estarían demostrando una mayor capa-
cidad de denominación de los por parte de ls australianos, sino que sugerirían
que el indicador empleado en la medición está sesgado. Es decir, existe un ele-
mento diferente (la familiaridad con el estímulo presentado en este ejemplo)
a la capacidad (de denominación en este caso) que influye en el desempeño
en la prueba. Entre los sesgos más habituales se encuentran el sesgo de ítem,
el sesgo de constructo y los sesgos metodológicos (Fernández, Pérez, Alderete
y Richaud de Minci, 2015; Van de Vijver y Tanzer, 1997).
El sesgo del ítem es habitual cuando un constructo posee muchos ele-
mentos éticos y algunos componentes émicos (figura 2). Este sesgo consiste
en que la mayor parte de los elementos de la prueba son equivalentes en
ambas culturas, pero algunos ítems tienen un significado diferente. De esta
forma, ciertos grupos culturales pueden obtener puntajes significativamente
distintos en un ítem determinado a pesar de obtener un puntaje total similar
en el test.
91
acción honorable. De la misma forma, en algunas culturas confucianas la
expresión de alegría se considera inadecuado ya que implica priorizar un sen-
timiento individual por sobre uno colectvo (Keller & Otto, 2009). Estos son
ejemplo de ítems que pueden tener un significado diferente según la cultura,
aunque la mayor parte de los reactivos se mantengan equivalentes.
El sesgo de constructo ocurre cuando el constructo posee muchos ele-
mentos émicos y pocos componentes éticos (figura 3). En este caso las di-
ferencias culturales no se focalizan en solo algunos comportamientos, sino
que el constructo medido difiere entre una cultura y otra. Por ejemplo, una
variable tan clásica como la inteligencia tiende a ser conceptualizada de muy
diverso modo de unas culturas a otras; mientras en Occidente suele asociarse
a eficiencia y rapidez, en algunas sociedades del Este se asocia con actitudes
reflexivas y reposadas, más que con rapidez (Lonner, 1990). En consecuencia,
difícilmente una prueba desarrollada en un contexto cultural pueda reflejar de
manera válida el constructo tal como se manifiesta en la otra cultura.
92
su vez está vinculado con la memoria de trabajo. La menor duración de los
dígitos en el japonés que en el inglés les otorgaba ventaja a los japoneses y, a
su vez, la menor duración de la pronunciación de los dígitos en chino com-
parado al japonés e inglés, les daba ventaja a los chinos sobre los dos grupos
restantes. Este tipo de sesgo metodológico se suele denominar sesgo de instru-
mento, ya que afecta a la totalidad de la prueba.
La existencia de los diferentes sesgos mencionados demuestra que pue-
den cometerse graves errores cuando se traslada automáticamente un test
construido en un grupo cultural a otro. Esto lleva a que los psicometristas de
países donde la producción de test es menor, se deban enfrentar con el proble-
ma de optar por construir o adaptar una prueba. A continuación, se exponen
de manera sintética los métodos y pasos implicados en cada caso.
93
Otra metodología tradicional de corte netamente empírico son los métodos de
clave empírica. Básicamente consiste en elegir los reactivos en función de su capacidad
para discriminar entre dos grupos de referencia. No se parte de un modelo teórico
previo, sino de un pool inicial de reactivos que serán o no incluidos en la prueba en
función de su capacidad para discriminar dos grupos (normal y clínico, por ejemplo).
El MMPI-II es un ejemplo de un test desarrollado mediante este método.
Con el perfeccionamiento del análisis factorial tomaron fuerzo los métodos de
reducción de datos como estrategia para la elaboración de pruebas. Este método con-
siste en redactar ítems y examinar las correlaciones entre los reactivos e identificar
factores subyacentes mediante análisis factorial. Posteriormente se asigna un nombre
a los factores identificados que describe el significado de la dimensión subyacente. El
Cuestionario de Intereses Profesionales (CIP) constituye un ejemplo de esta metodo-
logía, ya que los factores obtenidos son empíricos, es decir, no parten de un modelo
teórico previo.
En la actualidad los métodos de corte empírico “ateóricos” se encuentran en
declive. El método más recomendado para la elaboración de pruebas consiste en par-
tir de una clara delimitación conceptual, para luego recabar evidencias empíricas que
permitan determinar su validez. Para ello resulta indispensable partir de un buen mo-
delo teórico que describa con claridad no solo el constructo, sino también sus dimen-
siones. Las estrategias de análisis, como el análisis factorial confirmatorio, permitirán
determinar si efectivamente el modelo de medición propuesto es plausible. Por ejem-
plo, el Inventario de Autoeficacia para Inteligencias Múltiples constituye un buen
ejemplo de esta metodología, ya que parte de un modelo teórico bien delimitado (la
teoría de las ocho inteligencias propuestas por Gardner, 1983), en combinación con
métodos empíricos que aportan evidencias empíricas sobre la validez del modelo.
Antes emprender la redacción de los ítems, es necesario también delimi-
tar aspectos complementarios del test, tales como: finalidad y población meta
del test (por ejemplo, un inventario de autoinforme para evaluar el autocon-
cepto en niños), modo de aplicación (individual o colectivo, por ejemplo),
formato de respuesta (dicotómica o tipo lickert, por ejemplo), y tiempo de
administración (duración del test), entre otras consideraciones preliminares
(Hogan, 2004).
94
ítems son la ambigüedad (preguntas vagas que admiten varias respuestas, por
ejemplo, “que pasó con el Arte en el siglo XV?”); y la trivialidad (centrarse en
aspectos poco importantes del constructo o dominio, por ejemplo, requerir
la memorización de fechas irrelevantes). Por su parte Bandura (2001), reco-
mienda redactar ítems que consideren diferentes niveles de dificultad, sobre
todo cuando se evalúa autoeficacia o en pruebas de habilidades. Si no hay
obstáculos que superar todos los sujetos tendrán altas creencias de eficacia
en dicha actividad o responderán fácilmente al ítem. En contrapartida, ac-
tividades absurdamente difíciles generarán que las personas expresen escasas
creencia de eficacia o no puedan responder correctamente. En cualquiera de
los dos casos los ítems pierden poder discriminativo. Para evitar problemas
de este tipo resulta recomendable redactar ítems con una amplia variedad de
niveles de dificultad.
Finalmente, debe evitarse la redacción de “ítems multidimensionales”,
los cuales se caracterizan por indagar sobre más de una actividad, ej: “Cuales
son las creencias sobre tus capacidades para pintar un cuadro y cantar en un
coro”. Redacciones de este tipo impiden medir con precisión un comporta-
miento específico (Bandura, 2001). En efecto, en el ítem anterior la persona
puede sentirse confundida para responder, puesto que se siente competente
para cantar pero no para pintar, por ejemplo.
Revisión de expertos
La mayoría de los autores recomiendan que los ítems preliminares sean
revisados por expertos, tanto en construcción de pruebas, como en el domi-
nio o rasgo a medir (autoeficacia, por ejemplo), y en la población a la cual se
dirije el test (preadolescentes, por ejemplo). Los tres aspectos esenciales que
los expertos deben evaluar en cada ítem son: a) claridad semántica y correc-
ción gramatical, adecuación al nivel de comprensión de la población meta
(niños, por ejemplo), y c) congruencia con el constructo o dominio medido.
Este último es el principal parámetro y hace referencia al grado de con-
sistencia que debe existir entre un ítem particular y los constructos a medir
por el test. Los procedimientos empíricos para cuantificar el juicio de expertos
acerca de la calidad de los ítems fueron descriptos en el capítulo de validez
(apartado de evidencia relacionada con el contenido).
Además del juicio de experto siempre es conveniente administrar la ver-
sión preliminar de la prueba a una muestra piloto, es decir una muestra de
menor tamaño pero relativamente representativa de la población meta. La
posibilidad de efectuar un estudio piloto permite confirmar si los ítems son
claros y comprensibles para la población meta del test que se está desarrollan-
do. Otro de los aspectos que se suelen evaluar en las pruebas piloto son: 1)
familiaridad con el vocabulario y expresiones utilizadas en los ítems y en las
instrucciones; 2) comprensión de los ítems y de las instrucciones; 3) motiva-
95
ción que genera en los evaluados; 4) el tiempo que insume la aplicación del
instrumento, y 7) análisis de dificultades en la codificación de las respuestas
(Moretti y Medrano, 2012).
Traducción de la prueba
El proceso de traducción de una prueba es complejo e implica más que
la traducción literal de las palabras escritas a un nuevo lenguaje. Existen dos
métodos fundamentales: la traducción directa (forward translation) e inversa
(backward translation). En el método de traducción directa un traductor o,
preferentemente, un grupo de traductores, traducen el test desde el idioma
original al nuevo idioma. Luego otro grupo de traductores juzga la equivalen-
cia entre las dos versiones. De este modo pueden realizarse las correcciones
96
pertinentes a las dificultades o errores identificados. En el caso de la traduc-
ción inversa, el más utilizado de los métodos, un grupo de traductores realiza
una traducción desde el idioma original al nuevo idioma; luego un segundo
grupo de traductores toma el test traducido (en el nuevo idioma) y vuelve a
traducirlo al idioma original. Seguidamente, se realizan las comparaciones
entre la versión original y la versión retraducida al idioma original para deter-
minar su equivalencia. Ambos métodos poseen ventajas y desventajas que no
serán analizadas en este texto introductorio. El lector interesado en profundi-
zar esta problemática específica puede consultar el texto clásico de Hambleton
(1994).
Independientemente del método de traducción que utilicemos, es im-
portante señalar que las traducciones deben realizarse atendiendo a una equi-
valencia conceptual, semántica y funcional de los ítems, más que a una equi-
valencia literal (Herdman, FoxRushby y Badia, 1997; Mimura y Griffiths,
2008). Si bien existe cierto solapamiento entre estos tres tipos de equiva-
lencia, las mismas refieren a diferentes aspectos necesarios para asegurar un
adecuado funcionamiento de los ítems traducidos.
La equivalencia conceptual consiste en que el ítem original y el tra-
ducido evalúen el mismo constructo teórico. Por ello puede que algunas de
las traducciones realizadas no presenten las mismas palabras que los ítems
originales, ya que debe priorizarse una correspondencia con el constructo me-
dido y no una correspondencia literal. Por ejemplo, durante el proceso de
adaptación de una escala norteamericana sobre Apoyo Percibido se incluían
la figura de consultor o consejero académico de la universidad. Estas figuras
son inexistentes en el contexto local, por lo que al realizar la adaptación del
instrumento Medrano, Pérez y Liporace (2014) optaron por modificar dichas
palabras por figuras académicas equivalentes (por ejemplo, “get helpful assis-
tance from my advisor” fue traducida como “puedo obtener ayuda provechosa de
mis profesores”).
La equivalencia semántica hace referencia a que las palabras traduci-
das tengan el mismo significado tanto a nivel connotativo como denotativo.
Mientras que la denotación de una palabra puede ser la misma (referirse a un
mismo objeto, acción o propiedad) su connotación o significado emocional
puede ser distinto. Este tipo de equivalencia resulta especialmente importante
en las expresiones idiomáticas que no poseen una traducción directa a nuestro
idioma. En caso de que exista un significado equivalente pero no una expre-
sión idiomática del mismo, la solución es crear una expresión u oración de
significado equivalente. En caso de que no exista la expresión idiomática ni el
significado de la misma, entonces se trata de un ítem específico de la cultura
que no puede ser traducido. Por ejemplo, un ítem de una escala norteameri-
cana sobre Expectativas de Resultados decía: “... do work that can “make a di-
fference” in people’s lives”, el cual fue traducido por Medrano, Pérez y Liporace
97
(2014) como “realizar un trabajo que pueda mejorar la vida de otras personas”.
Finalmente, la equivalencia funcional se circunscribe a que las acciones
involucradas en los reactivos posean metas y dificultades semejantes en am-
bas culturas. De hecho, puede suceder que una misma acción posea metas
diferentes según la cultura (por ejemplo, ganar un buen salario), o bien que
la dificultad para realizarla varíe de una cultura a otra (acceder a un título
universitario o sobresalir en un área académica, por ejemplo). Por ejemplo,
un ítem de una escala norteamericana sobre Progreso de Metas Académicas
incluye la meta de “permanecer inscripto” en la universidad. Esta acción re-
sulta más simple en nuestro contexto dado que un alumno de la universidad
nacional puede permanecer inscripto durante años sin necesidad de aprobar
materias o rendir exámenes. En función de ello Medrano, Pérez y Liporace
(2014) optaron por traducir el ítem como “permanecer regular en el curso”,
manteniendo así un nivel semejante de dificultad.
Estudios de equivalencia
Una vez que se ha traducido adecuadamente la prueba debe establecerse
si esta la versión traducida es equivalente a la original. Existen dos estrategias
que son ampliamente utilizadas para determinar esta equivalencia. Una de
ellas es la administración del test original y traducido a individuos bilingües. En
este caso se les administra ambas versiones de un test a personas que hablen
ambos idiomas. Este método posee ventajas y limitaciones. En primer lugar
permite controlar las diferencias de los participantes en el test en el rasgo
que se está midiendo (inteligencia, por ejemplo), puesto que ambas versio-
nes del test son administradas a las mismas personas. Sin embargo, posee la
desventaja de asumir que los individuos son igualmente competentes en am-
bos idiomas, lo cual es difícil de sostener. Es probable entonces, que puedan
observarse diferencias entre los resultados de ambas versiones debido a una
menor capacidad de algunas personas para entender los ítems en alguno de
los dos idiomas. La segunda gran desventaja de este diseño es que no puede
asegurarse que los bilingües posean el mismo nivel de competencia que la po-
blación general. Por el hecho de conocer otro idioma es probable que se trate
de personas con una mayor capacidad intelectual o mejor educación.
El segundo método es la administración de la versión original del test y
su traducción inversa a monolingües en el idioma original. Supongamos que
traducimos una prueba de idioma ingles mediante tradución inversa. Enton-
ces dispobemos de dos versiones en inglés, la orginal y la re-traducida. Este
método consiste entonces en administrar ambas versiones (la versión original
y la versión obtenida por traducción inversa) a personas cuyo idioma natal es
el inglés. La equivalencia en los ítems se determina comparando el desempeño
de cada individuo en cada ítem de ambas versiones. Nuevamente, la ventaja
98
está en el control de las diferencias en las características de los participantes.
Una gran limitación es que este diseño no permite obtener datos de la versión
en el idioma meta del test (español en este ejemplo).
A modo de síntesis
99
adaptación de tests siempre y cuando la misma involucre un riguroso proceso
de investigación que asegure la equivalencia de constructos en primer lugar
y una correcta adaptación de la escala para evitar toda fuente de sesgos. La
construcción sería una alternativa cuando la adaptación no es conveniente
debido a la existencia de un sesgo de constructo o al hecho de que las caracte-
rísticas del instrumento que se quiere adaptar haga que ese proceso sea tanto
o más laborioso que crear uno nuevo (Fernández, Pérez, Alderete y Richaud
de Minci, 2015).
100
Parte 2
Evaluación Psicológica
mediante instrumentos psicométricos
101
|
Prefacio de la Segunda Parte
103
La decisión de utilizar una prueba u otra no depende solo de sus propie-
dades psicométricas. La principal limitación al momento de medir atributos
psicológicos es que éstos son difíciles de delimitar. Cada prueba o instrumen-
to psicométrico debe partir de un modelo teórico que delimite con claridad
el constructo que se pretende medir. Por ello resulta indispensable conocer el
modelo teórico subyacente a cada instrumento. La manera en que definamos
un constructo determinará la forma en que lo mediremos, por este motivo a
lo largo de los capítulos no solo se describirán pruebas que habitualmente se
utilizan en el ejercicio profesional, sino que además se desarrollará brevemen-
te el modelo teórico del cual parte cada instrumento. Es importante que el
lector valore el sustento teórico de una prueba, tanto como el estrictamente
psicométrico.
Como se mencionó en el volumen 1, el presente material se divide en
dos volúmenes. El primero se centra en los conceptos básicos de la teoría psi-
cométrica y las normativas psicométricas exigidas para una evaluación válida y
confiable. El segundo se centra en el desarrollo conceptual y aplicado de dife-
rentes pruebas psicológicas, haciendo foco en los procesos de administración,
interpretación y elaboración de informes psicométricos. Cabe señalar que esta
sección no refiere a una catalogación de pruebas. Más que una breve reseña
de diferentes pruebas se seleccionaron test que permitan reflejar al amplio
espectro de evaluación de las técnicas psicométricas.
Se espera que el lector adquiera con este breve manual los conocimien-
tos y competencias necesarias para comprender la utilidad y limitaciones de
los test psicológicos, cuente con habilidades para seleccionar una prueba y
juzgar la calidad de los test publicados, sepa administrar una prueba, inter-
pretarla y comunicar adecuadamente los resultados, permitiendo así una uti-
lización ética y responsables de los test psicológicos.
Leonardo Medrano
104
|
Evaluación Psicométrica en Psicología Educacional
Leonardo Medrano, Edgardo Pérez,
Mauricio Zalazar y Javier Sánchez Rosas
Introducción
105
se relaciona estrechamente con un proceso de aprendizaje exitoso y satisfactorio.
Diversas acciones implicadas en el proceso de aprendizaje, tales como leer un
libro, asistir a clases o prepararse para un examen, requieren de motivación. Los
maestros suelen percatarse rápidamente de la falta de motivación en los alumnos,
sin embargo, se requiere
En las últimas de un modelo
décadas, la Teoría teórico
Socialy pruebas específicas
Cognitiva (TSC)paraha deter-
captado
minar con precisión las causas de la desmotivación.
la atención de numerosos investigadores y profesionales de la educación y la
En las últimas décadas, la Teoría Social Cognitiva (TSC) ha captado la aten-
psicología (Brunning et al., 2005). El creciente interés se debe a la re-concep-
ción de numerosos investigadores y profesionales de la educación y la psicología
tualización que esta teoría proporciona sobe los procesos de aprendizaje y el
(Brunning et al., 2005). El creciente interés se debe a la re-conceptualización que
papel otorgado al alumno en la construcción del conocimiento (Woolfolk,
esta teoría proporciona sobre los procesos de aprendizaje y el papel otorgado al
2006).
alumno Según Bandura (1987),
en la construcción las personas
del conocimiento no están2006).
(Woolfolk, determinadas por im-
Según Bandura
pulsos
(1987),internos o moldeadas
las personas automáticamente
no están determinadas por estímulos
por impulsos internos oexternos.
moldeadasPor
el automáticamente
contrario, se considera
por estímulos externos. Por el contrario, se consideraanalizarse
que el comportamiento humano debe que el
considerando
comportamiento la interacción
humano debe entre la persona
analizarse y su ambiente.
considerando la interacción entre la
Desde
persona y sulaambiente.
TSC se postula que los estudiantes no transitan su carrera
de manera Desde“cerrada”,
la TSC se sino que
postula quevarían sustancialmente
los estudiantes lassumaneras
no transitan carrera dedemane-
atrave-
sarrauna
“cerrada”, sino que varían sustancialmente las maneras de atravesar una carrera la
carrera académica. Desde esta perspectiva los trayectos que toma
vida dependen
académica. Desdedel interjuego recíproco
esta perspectiva entre los
los trayectos quefactores
toma la personales,
vida dependenla propia
del
conducta
interjuego recíproco entre los factores personales, la propia conducta y el entorno. bi-
y el entorno. La TSC plantea la existencia de una interacción
direccional donde
La TSC plantea las personas
la existencia y las
de una situaciones
interacción se determinan
bidireccional donde lasmutuamente.
personas y
Esta teoría favorece una concepción de la interacción basada
las situaciones se determinan mutuamente. Esta teoría favorece una concepción en el Modelo
de
Reciprocidad
la interacciónTriádica
basada en(figura 1). Reciprocidad Triádica (figura 1).
el Modelo
Factores Personales
Ambiente Conducta
150 En Enesteeste
modelo
modelodedecausalidad,
causalidad, lala conducta,
conducta, loslos factores
factorespersonales
personales y
y las
las influencias
influenciasambientales
ambientales interactúan entre sí bidireccionalmente. El com-
interactúan entre sí bidireccionalmente. El comportamiento
portamiento humano no se concibe como controlado por factores internos
humano nosino
o externos, se concibe como controlado
como dependiente porinteracción
de la factores internos
entreolos externos, sino como
tres elementos
mencionados.
dependiente de Cabe destacar entre
la interacción que ellostérmino reciprocidad,
tres elementos no significa
mencionados. que los
Cabe destacar que
treselcomponentes del modelo se influyan entre sí de la misma manera. La in-
término reciprocidad, no significa que los tres componentes del modelo se influyan
fluencia relativa de cada factor varía en función de las actividades, las personas
entre
y las sí de la misma manera. La influencia relativa de cada factor varía en función de las
circunstancias.
Para la las
actividades, TSC los factores
personas del entorno no constituyen una entidad que
y las circunstancias.
determinaPara el curso de nuestras vidas, sino que los individuos juegan un rol en
la TSC los factores del entorno no constituyen una entidad que determina el
la construcción de su propio desarrollo. Si bien los factores del entorno y las
curso de nuestras
circunstancias vidas, pueden
fortuitas sino que afectar
los individuos
el cursojuegan
de launvida,
rol enlalaforma
construcción
en quedelassu
personas aprovechan
propio desarrollo. las oportunidades
Si bien y manejan
los factores del entorno las situaciones
y las circunstancias de presión
fortuitas pueden
sonafectar
los factores que marcan la diferencia. Así la TSC aboga por una perspec-
el curso de la vida, la forma en que las personas aprovechan las oportunidades y
manejan las situaciones de presión son los factores que marcan la diferencia. Así la TSC
106
aboga por una perspectiva agentica según la cual las personas son pro-activas, regulan y
tiva agentica según la cual las personas son pro-activas, regulan y organizan su
propio comportamiento, y reflexionan sobre el mismo. Por lo tanto, las per-
sonas no son vistas como productos de las circunstancias, sino como agentes
que contribuyen a crearlas.
Para la TSC la agencia humana refiere a la capacidad para originar y
dirigir las propias acciones para la consecución de determinados propósitos
(Bandura, 2006). De manera semejante Lent (2013) lo conceptualiza como
la capacidad para afrontar y lidiar con la adversidad de manera proactiva y
dirigiendo de manera regulada e intencionada el propio esfuerzo.
La agencia humana no es sólo una idea que forma parte de la TSC, sino
que constituye una concepción sobre la naturaleza humana. El hombre no sólo
es producto de presiones ambientales, mutaciones genéticas y recombinaciones
reproductivas. La capacidad de simbolización nos permite comprender, prede-
cir y alterar los cursos de nuestras propias vidas, constituyéndose así en una ven-
taja evolutiva. Así el lenguaje, la abstracción y deliberación cognitiva permitió
suplantar la selección del entorno por la agencia humana. Los seres humanos
somos una especie agentica capaz de trascender las imposiciones del ambiente
inmediato y dirigir el curso de nuestras propias vidas (Bandura, 2006).
Esta perspectiva agentica del comportamiento humano ha enriquecido
la comprensión de problemáticas habituales en la educación. Indagar sobre
los factores de la agencia humana que fomentan el crecimiento y desarrollo
personal de los estudiantes constituye un aspecto de importancia para pro-
mover el funcionamiento óptimo y saludable. A partir de ello se desarrolló la
Teoría Social Cognitiva de la Carrera (TSCC) la cual intenta capturar la idea
de agencia humana propuesta por Bandura (1987), aplicándola específica-
mente al contexto académico (Lent, 2013). Según la TSCC (Lent y Brown,
2006) existen tres componentes principales que permiten ejercer la capacidad
agentica: las creencias de autoeficacia, las expectativas de resultado y las metas.
El impacto de la autoeficacia en el funcionamiento humano ha sido am-
pliamente corroborado (Bandura, 1997). Las creencias que posee una persona
sobre sus capacidades para lograr determinado rendimiento permiten explicar
si una persona tendrá iniciativa, perseverancia y, finalmente, si logrará la acción
que se propuso. Asimismo, las expectativas de resultados constituyen un factor
motivacional clave dado que antes de ejecutar una conducta las personas an-
ticipan cuáles serán las consecuencias de ejecutarla. De esta manera llevarán a
cabo un comportamiento sólo si anticipan resultados positivos y evitarán eje-
cutarlos sin prevén consecuencias negativas. Finalmente, las metas, vale decir,
la intención de realizar una actividad en particular o producir un determinado
resultado; permiten a las personas desarrollar una capacidad auto-evaluativa.
Es a partir del establecimiento de este criterio interno que las personas pueden
regular el propio comportamiento (Lent, Brown y Hackett, 1994).
Estas tres variables representan la idea de agencia humana y constituyen
el corazón de la TSCC. Sumado a ello, la TSCC incluye el papel de factores
107
no agenticos que también pueden afectar el transcurso de una carrera. Con-
cretamente estos factores son denominados por Lent y Brown (2006) como
Barreras y Apoyo Contextuales. Estas variables contextuales pueden facilitar u
obstaculizar el cumplimiento de los propósitos que las personas se plantean, y
pueden ser objetivas (ingreso de los padres, por ejemplo) o percibidas (dispo-
nibilidad de un modelo académico, por ejemplo).
En síntesis, para Lent y Brown (2006) el “corazón” del modelo de la TSCC
estaría dado por cuatro factores, tres factores personales agenticos (autoeficacia,
expectativas de resultados y metas) y un factor contextual no agentico (apoyo y
barreras contextuales). Estas variables aparecen sombreadas en la figura 2.
Inicialmente, la TSCC propone tres modelos construidos para explicar
el desarrollo de los intereses profesionales, l lección de carrera y el rendimien-
to académico (figura 2; Sheu et al., 2010). Cada uno de estos modelos presen-
ta los factores centraes del modelo TSCC e incorpora variables más específicas
según el tipo de comportamiento que se intenta explicar. Por ejemplo, para
explicar el rendimiento académico se incluye dentro del modelo a las aptitu-
des personales, o para explicar la elección de carrera se incluye, por ejemplo,
a los intereses profesionales (figura 2).
Dichos modelos teóricos han sido corroborados empíricamente en di-
versos trabajos (Lee, Flores, Navarro y Kanagui-Muñoz, 2015; Lent et al.,
2013; Lent, Lopez, Sheu, Lopez, 2011) y en distintas poblaciones (Cupani y
Pautassi, 2013; Cupani, de Minzi, Pérez y Pautassi, 2010; Lent, Sheu, Gloster
y Wilkins, 2010; Navarro, Flores, Lee y González, 2014), observándose en
todos los casos que las variables centrales o “corazón” del TSCC presentan un
elevado poder explicativo.
108
Figura 2. Modelos de Intereses, Elección Vocacional y Rendimiento Académico de la TSCC
(adaptado de Lent, Brown y Hacket, 1994).
Figura 3. Modelo Social Cognitivo de Satisfacción Académica y Satisfacción con la Vida (adap-
tado de Lent, 2007)
109
A continuación, se exponen diferentes instrumentos adaptados a nues-
tro contexto que permiten evaluar los tres componentes agenticos de la TSCC
(autoeficacia, expectativas de resultados y metas) y el componente no agen-
tico (apoyo social percibido). También se revisan algunos instrumentos de-
sarrollados para medir los intereses vocacionales, uno de los componentes
claves del modelo de carrera de la TSC y con implicancias para la orientación
vocacional.
Evaluación de la Autoeficacia
En términos generales las creencias de autoeficacia pueden ser enten-
didas como las creencias que las personas poseen en sus propias capacidades
para organizar y ejecutar las acciones necesarias para producir exitosamente
determinados logros (Bandura, 1997). La importancia de los juicios de au-
toeficacia se debe a que influyen en el comportamiento humano a través de
múltiples vías. Estas creencias afectan la elección y el desarrollo de nuevas
actividades, ya que las personas tienden a evitar actividades que creen que
exceden sus capacidades y realizar aquellas que consideran capaces de domi-
nar. Por otra parte, las creencias de autoeficacia determinan el esfuerzo y la
persistencia para la realización de tareas, sobre todo en situaciones adversas.
Asimismo, intervienen en la conformación de los patrones de pensamientos
de las personas y consecuentemente en sus sentimientos. Por último, influyen
en la organización de los recursos para la realización exitosa de tareas, deter-
minando así el rendimiento de las personas (Bandura, 1997).
Un aspecto que merece consideración refiere a las dimensiones de la
autoeficacia académica. Según Bandura (2001) las creencias de autoeficacia
son un constructo micro-analítico asociado a comportamientos delimitados.
Esto significa que podemos sentirnos capaces para realizar una acción (por
ejemplo, estudiar para un examen), pero no para otra (por ejemplo, hacer
preguntas al frente de mis compañeros). Diversas investigaciones han tratado
de identificar cuáles son las dimensiones más relevantes de la autoeficacia en
el contexto académico. A partir de dichos estudios se proponen tres dimensio-
nes principales (Medrano, 2011): 1) autoeficacia para el rendimiento, es decir
las creencias que poseen los estudiantes de lograr una buena calificación; 2)
autoeficacia para la autorregulación del estudio, entendida como la creencias
de poder regular las propias acciones y pensamientos necesarios para alcanzar
las metas de aprendizaje que se proponen y, finalmente; 3) autoeficacia social
académica, la cual refiere a la confianza que poseen los estudiantes para llevar
a cabo comportamientos sociales competentes en el contexto académico.
La autoeficacia para el rendimiento puede evaluarse a través de la Escla
de Autoeficacia para el Rendimiento (EAR), la cual fue desarrollada inicialmen-
te por Frank Pajares y adaptada al contexto local por Medrano (2009). Esta
110
escala mide las creencias que los estudiantes poseen acerca de su capacidad
para aprobar y obtener buenas calificaciones. Cuenta con seis ítems que eva-
lúan la creencia que poseen de aprobar una materia y obtener un promedio
final superior a 4, 5, 6, 7, 8 y 9. Para ello se utiliza una escala de 10 posiciones
(desde 1 “no puedo hacerlo” hasta 10 “estoy seguro de poder hacerlo”). Los
estudios psicométricos realizados (Medrano, 2009) señalan que el inventa-
rio presenta una estructura unidimensional y una consistencia interna óp-
tima (α=.94). A su vez, los estudios de relación test –criterio demostraron
que la EAR predice de manera satisfactoria el rendimiento académico (r=.42;
p<0.00). A continuación, se presentan una adaptación de la EAR para ingre-
santes a la universidad:
111
Otro instrumento desarrollado para evaluar la autoeficacia para la auto-
rregulación es el IDAPE, el cual fue desarrollado por Pérez y Delgado (2006).
Se trata de inventario de autoinforme para evaluar autoeficacia para el estudio
para estudiantes de escuelas secundarias (a diferencia del SELF-A diseñado
para población universitaria). Este instrumento incluye ocho ítems que men-
cionan estrategias autorregulatorias de aprendizaje (“Relacionar los conceptos
nuevos que estoy estudiando con otros que ya conozco”). Los examinados
deben utilizar una escala lickert de diez posiciones, desde 1 “Nada seguro
de poder usar esta estrategia” a 10 “Totalmente seguro de poder usar esta
estrategia”, pudiendo responder con cualquier valor intermedio de la escala
para indicar su nivel de seguridad. A continuación, se presentan los ítems que
componen el IDAPE (extraído de Pérez y Delgado, 2006):
112
presenta una adecuada consistencia interna (α= .84). Por otra parte, la escala
cuenta con estudios que evidenciaron su capacidad predictiva en relación al
rendimiento académico de ingresantes universitarios (r=.21; p<0.00; Medra-
no y Olaz, 2008).
Más allá de las tres dimensiones mencionadas, se han desarrollado otras
escalas de autoeficacia para evaluar el comportamiento académico. Tal es el
caso de la escala de autoeficacia para la escritura, la cual fue desarrollada por
Pajares (1996) y adaptada al contexto local por Pérez, Medrano, Mattus y Ay-
llón (2008). Comprende 10 ítems donde los adolescentes deben evaluar su se-
guridad para realizar exitosamente actividades de escritura (escribir con buena
ortografía, por ejemplo), utilizando una escala de respuesta de 1 (nada seguro
de poder realizar esa actividad adecuadamente) a 10 (totalmente seguro).
113
Para la TSCC las metas son claves para desarrollar una capacidad au-
to-evaluativa. Las mismas funcionarían como un estándar de referencia in-
terno que utilizan la personas para evaluar su experiencia académica. De esta
forma si percben que están logrando un progreso en sus metas se genera una
evaluación positiva de su experiencia académica, mientras que la percepción
de no progreso genera una evaluación negativa.
En este marco, Lent et al., (2007) desarrollaron una escala para evaluar
el progreso en metas académicas. Se trata de un instrumento breve que evalúa
el progreso que los estudiantes perciben en sus metas académicas. Para ello
los estudiantes deben indicar en qué medida han superado cada una de las
metas que se les plantean en los ítems (“estudiar de manera efectiva para los
exámenes”, por ejemplo). Los estudios psicométricos reportados por Lent et
al., (2007) señalan una estructura unidimensional y una adecuada consisten-
cia interna (α=.81). Resultados semejantes han sido obtenidos en la valida-
ción realizada en estudiantes argentinos (Medrano, Pérez y Liporace, 2014).
A continuación, se exponen los ítems que confirman este instrumento.
114
Evaluación del Apoyo Percibido
El modelo de TSCC puede dividirse en dos niveles teóricos comple-
mentarios entre sí. El primero involucra las variables cognitivo-personales
(autoeficacia, expectativas de resultado y metas), que permiten al individuo
el ejercicio de su agencia personal. El segundo nivel considera un conjunto
de variables contextuales que interactúan con los factores personales y que
también afectan el comportamiento académico. Éstas variables pueden ser
tanto objetivas (apoyo financiero, por ejemplo), como subjetivas (apoyo social
percibido, por ejemplo), no obstante, en la TSCC se considera que aunque
los factores objetivos pueden ejercer cierto efecto sobre el comportamiento
académico, dicho efecto depende en gran medida de la manera en que las per-
sonas interpretan y reaccionan a los mismos. Las personas no son receptores
pasivos de su pasado o de sus influencias ambientales, más bien son agentes
activos en el procesamiento de la información del entorno. Las oportunida-
des u obstáculos de un contexto se encuentran en parte determinadas por las
interpretaciones que realizan las personas. Es decir que los estudiantes pueden
perjudicarse o beneficiarse de loseventos del entorno dependiendo de cómo
procesan y perciben estos eventos (Lent, 2013).
Más allá de la existencia real de un apoyo del entorno es importante
considerar la valoración subjetiva de quien recibe el apoyo (Pedrosa, Gar-
cía-Cueto, Suárez-Alvarez y Pérez Sanchez, 2012). El apoyo percibido refiere
a si el estudiante considera que su entorno le provee los recursos necesarios
115
para afrontar las adversidades y alcanzar los logros personales u académicos
(Lent, Brown y Hackett, 2000). Para evaluar el apoyo percibido, Lent et al.
(2007) desarrollaron un instrumento de nueve ítems que analiza en qué me-
dida el contexto próximo del estudiante apoya al mismo en la consecución
de sus objetivos académicos (“mis amigos me estimulan a que continúe con mis
estudios”, por ejemplo). Los estudios psicométricos informados por Lent et al.
(2007) indican una consistencia interna satisfactoria (α=.84) y una estructura
unidimensional.
116
Strong-Campbell, por ejemplo, es utilizado por casi el 90% de los orientadores en
Estados Unidos. Han sido definidos como un conjunto de ítems donde se solicita
a los individuos indicar sus preferencias vocacionales y aquéllos poseen un valor
numérico que permite obtener una puntuación final que representa un perfil o
pauta de intereses (Cronbach, 1998).
Los autores coinciden en señalar que estos instrumentos deben utilizarse
para ayudar a seleccionar metas vocacionales, confirmar elecciones previas, descu-
brir campos de actividad educacional u ocupacional, descubrir ocupaciones que
proporcionen satisfacción e incrementar el autoconocimiento. Del mismo modo,
los resultados de los tests de intereses poco nos dicen acerca del éxito académico
u ocupacional, variables más influidas por otros constructos tales como perseve-
rancia o aptitudes, por ejemplo (Cronbach, 1998; Hood y Johnson, 2002). Se-
gún Holland (1997) el individuo se pregunta esencialmente: para que carrera soy
competente? y en que carrera seré feliz?; los inventarios de intereses contribuyen
principalmente a elucidar este segundo interrogante.
Debe evitarse la práctica de usar los inventarios de intereses vocacionales
para orientar muy específicamente a los individuos, puesto que ellos necesitan
considerar en el proceso de toma de decisiones de carrera otras variables igualmen-
te relevantes (aptitudes y autoeficacia, por ejemplo) y, además, reunir exploratoria
sobre carreras y ocupaciones. En general se ha verificado que los resultados de
estos tests son estables a partir de los 15-17 años (Hood y Johnson, 2002).
El paradigma más influyente en el dominio de los intereses vocacionales
es el formulado por Holland (1997). La teoría de Holland ha sido descrita como
un modelo de congruencia entre los intereses y habilidades de una persona, por
un lado, y los factores inherentes a su ambiente, por otra parte. En esta teoría se
proponen seis tipos de personalidad (figura 4): Realista (preferencia por activida-
des que requieran destreza manual), Investigador (preferencia por el trabajo con
ideas), Artista (preferencia por actividades artísticas), Social (preferencia por el tra-
to con personas más que con cosas o ideas), Emprendedor (preferencia por tareas
de liderazgo) y Convencional (preferencia por tareas administrativas), los que a su
vez determinan patrones análogos de intereses y habilidades. El desarrollo de estos
tipos es producto de una compleja serie de acontecimientos familiares, orienta-
ciones del temperamento iníciales, preferencias ocupacionales e interacciones con
contextos ambientales específicos. Los ambientes en los que vien y trabajan las
personas también puede caracterizarse según su semejanza con seis modelos que
se corresponden con los seis tipos de personalidad que mencionamos. La con-
gruencia entre las personas y los ambientes generan satisfacción. Así por ejemplo,
una persona con una orientación de tipo Realista se sentirá satisfecha trabajando
en ambientes donde haya maquinaria (un taller mecánico, por ejemplo) y expe-
rimentará disgusto si debe desempeñarse en un ambiente artístico (un museo de
arte, por ejemplo). En general, las mujeres presentan intereses más elevados en las
categorías Social, Convencional y Artística, y los hombres en los tipos Realista e
Investigador.(Su, Rounds y Amstrong, 2009). Los estudios meta-analíticos sumi-
117
nistran apoyo a los principales postulados de la teoría aunque existe alguna con-
troversia respecto a su adecuación a minorías étnicas en USA y algunas muestras
internacionales (Rounds y Tracey, 1996).
119
El adolescente debe responder indicando su agrado, indiferencia o desagra-
do a cada uno de los 72 ítems (seis por escala) y los resultados del CIP-4 se expresa
en un perfil de intereses vocacionales comprendiendo doce dimensiones: Tecno-
logía, Empresas, Cálculo, Arte, Servicio, Música, Comunicación, Humanidades,
Idiomas, Naturaleza, Salud y Leyes.
El CIP-R (Fogliatto y Pérez, 2003) se incluye en un Sistema de Orientación
Vocacional Asistido por computadora (SOVI 3) junto al IAMI (Pérez, 2001) y
un banco de datos con información sobre carreras terciarias y universitarias. El
adolescente responde a cada uno de los módulos de exploración psicológica (in-
tereses vocacionales y autoeficacia para inteligencias múltiples) y el sistema genera
un perfil sugiriendo opciones educativas congruentes con ese perfil que pueden
revisarse en el módulo de información sobre carreras. El SOVI 3 es comercializa-
do por Editorial Paidós y puede responderse online con la licencia otorgada por
la empresa a cada usuario que este adquiere junto al manual técnico del sistema.
Como expresamos inicialmente en este apartado, la orientación vocacional
es un proceso de asistencia profesional a un individuo que debe tomar decisiones
de carrera y no se agota con la evaluación de los intereses (Pérez, Passera, Olaz y
Osuna, 2005). Todas las variables que mencionamos en la descripción de la Teoría
Social Cognitiva de Carrera (Brown, Lent y Hackett, 1994) son relevantes para
la elección de carrera, en especial la autoeficacia y las aptitudes. La situación ideal
sería cuando un estudiante posee intereses, autoeficacia y aptitudes elevadas para
las actividades inherentes a una carrera. No obstante, los intereses vocacionales
y las aptitudes presentan mayor influencia genética que la autoeficacia donde el
aprendizaje juega un rol más relevante (Plomin, DeFries, McClears y McGuffin,
2002). Por este motivo pueden diseñarse intervenciones para modificar la autoefi-
cacia utilizando las fuentes de la misma (aprendizaje vicario, por ejemplo). Si una
adolescente cree, por ejemplo, que aunque la ingeniería mecánica le interesa no
es capaz de estudiar una carrera “masculina” como esta, entrevistar a una profesio-
nal joven y exitosa de esa disciplina puede ayudarle a incrementar su autoeficacia
para emprender esa carrera (Pérez, Pássera, Olaz y Osuna, 2005). Las estrategias
de modelado pueden ser empleadas para ayudar a ciertos estudiantes (mujeres,
personas de color, por ejemplo) a considerar áreas de carreras que previamente no
habían tenido en cuenta o no habían sido alentados a considerar (Lent, 2004).
Los instrumentos adecuados para examinar las aptitudes y la autoeficacia
han sido revisados en otras secciones de este capítulo. Como también mencio-
namos anteriormente, los apoyos y barreras contextuales a la elección de carrera
son muy importantes y el orientador debe examinarlos junto al orientado en las
entrevistas que componen un proceso integral de orientación vocacional. Ayudar
a los estudiantes a prever y prepararse para probables obstáculos, tales como des-
aprobación de los pares o problemas económicos, puede disminuir las oportuni-
dades de que sean sorprendidos y conducidos por las circunstancias desfavorables.
Además de las estrategias de afrontamiento de obstáculos, el modelo SCCT debe
120
prestar consideración al aprovechamiento de los apoyos ambientales y la estructu-
ra de oportunidades. Así como los estudiantes pueden ser asistidos para enfrentar
obstáculos probables, también pueden ser ayudados a reconocer y acceder a los re-
cursos del entorno que puedan sostener su transición al trabajo. Así, por ejemplo,
los estudiantes pueden ser alentados a identificar y utilizar fuentes de búsqueda de
trabajo dentro de sus sistemas naturales de apoyo (miembros de su familia o veci-
nos, por ejemplo), o a vincularse a nuevos grupos de amigos que probablemente
apoyarán más sus metas vocacionales que sus grupos de referencia actuales. Las
intervenciones psicoeducacionales dirigidas a estos aspectos del proceso de tran-
sición al trabajo de construcción de apoyos y superación de obstáculos también
deberían concentrarse en el sentido de eficacia y afrontamiento de los estudiantes
con obstáculos ambientales como el racismo y el sexismo (Lent, 2004).
También el adolescente necesita explorar los roles ocupacionales que les
resulten atractivos antes de tomar una decisión vocacional relevante. La infor-
mación ocupacional puede obtenerse mediante videos ocupacionales, ferias de
carrera, visitas a universidades, guías del estudiante o portales de internet. En
este sentido, técnicas como Career Shadowing donde el adolescente entrevista a
un profesional y observa directamente las actividades que realiza en su puesto de
trabajo durante varias sesiones son muy útiles para aprender sobre las ocupaciones
(Herr y Cramer, 1996).
Debido a que la transición exitosa hacia el trabajo depende del recorrido de
los estudiantes por muchas tareas iniciales de desarrollo de carrera (cristalización
de los intereses, exploración de carreras, formación en habilidades de toma de
decisión, por ejemplo), los intentos para comprender y facilitar esta transición po-
drían perfectamente comenzar en la escuela elemental y media, continuando has-
ta (y después) el ingreso de los estudiantes al trabajo (Lent, 2004). Esta propuesta
se inserta en una Educación para la Carrera que puede verse como un marco
más amplio que la mera Orientación para la Elección de Carrera (Pérez, Passera,
Olaz y Osuna, 2004). Por consiguiente, intervenciones y estudios evolutivamente
apropiados, deberían ser distribuidos durante los años de escolaridad, en lugar de
concentrarse solamente en los estudiantes de los últimos años de secundario y la
adquisición de destrezas laborales.
121
toreo), las cuales están íntimamente relacionadas y además, se retroalimentan
cíclicamente. De este modo, un déficit en alguna de estas etapas puede afectar
el proceso de autorregulación, por ejemplo, un estudiante que posee dificul-
tades para planificar su estudio probablemente no logre una ejecución exitosa.
Asimismo, la falta de monitoreo puede llevar a que un alumno no vislumbre
que su planificación es inadecuada. Sin embargo, cada una de estas etapas
involucra un conjunto de variables (ver figura 5), las cuales produce a que el
tránsito por cada una de ellas se torne complejo, y en algunos casos, afecte el
proceso de autorregulación del aprendizaje.
122
cias positivas del propio comportamiento (expectativas de resultados), cons-
tituye un pre-requisito para una adecuada autorregulación. Además, la TSC
ha destacado el rol de la percepción de apoyo (Rosa & Bernardo, 2013) dado
que, si los estudiantes perciben que su entorno les provee recursos para la
consecución de objetivos, estos aumentaran su autoeficacia, desarrollando ex-
pectativas más favorables (Lent, 2004).
La fase ejecución involucra aspectos ligados al autocontrol del compor-
tamiento, y al proceso de estudio. El primero refiere a aquellas estrategias des-
tinadas a incrementar el interés y la concentración en la tarea (Zimmerman &
Moylan, 2009). En este marco, diversos autores destacan el papel del control
volitivo y la procastinación. Pintrich y De Groot (1990) mencionan la nece-
sidad de que los estudiantes mantengan conductas de persistencia y esfuerzo
ante situaciones consideradas como desafiantes (control volitivo), en contra
posición a la procastinación, entendida como una tendencia a posponer la
tarea o la toma de decisiones (van Earde, 2003). Ambas variables se explican
en parte por el déficit en la regulación de emociones, ya que la dificultad para
regular un estado emocional displacentero (interferencia emocional) puede
favorecer la aparición de conductas de procastinación. Asimismo, el lugar
de estudio ha demostrado ser otro factor de importancia debido a que un
ambiente tranquilo, ordenado y relativamente libre de distractores favorece el
control volitivo (Pintrich, Smith, Garcia, & McKeachie, 1991). En conjunto,
los factores mencionados pueden llevar a que el estudiante no cumpla con las
metas que había planificado, y en consecuencia, falle en su proceso de auto-
rregulación (Richardson, Abraham & Bond, 2012).
La manera en que los estudiantes se aproximan al material de estudio
constituye el segundo componente de esta fase. El proceso de aprendizaje
puede desarrollarse mediante estrategias profundas de estudio, que implican
un proceso activo donde se destaca la elaboración y la organización de ideas
(Elliot & McGregor, 2001; Greene et al., 2004). Mientras que las estrate-
gias superficiales de estudio se centran en la memorización y reproducción
de la información, sin lograr una elaboración propia de ideas que permita un
aprendizaje significativo (Biggs, 1987; Fredricks, Blumenfeld & Paris, 2004).
Finalmente, Zimmerman (2000) destaca que en la fase de monitoreo,
donde el estudiante evalúa su trabajo (control del estudio) y emite juicios en
base a sus propios criterios de trabajo. Fruto de dicha evaluación se generan
una serie de emociones que inciden sobre las expectativas del sujeto y su pos-
terior desempeño (Pintrich, 2000; Zimmerman, 2011). En este marco, Lent
et al. (2005) señalan que los estudiantes continuamente evalúan el avance en
sus metas de estudio (metas de progreso), siendo este un factor crítico en la
elaboración de los juicios de satisfacción académica (Lent, Taveira, Sheu &
Single, 2009). Un último factor, frecuentemente obviado en esta etapa, es la
búsqueda de ayuda. Esta conducta es de suma importancia para la autorregu-
123
lación ya que permite al alumno enfrentar con mayor eficacia sus dificultades
y aumentar su aprendizaje autónomo a futuro (Ryan & Pintrich, 1997; Ka-
rabenick, 2004).
En la literatura son numerosos los instrumentos destinados a evaluar los
aspectos motivacionales del aprendizaje, destacándose el Learning and Study
Skills Inventory (LASSI; Weinstein, Palmer, & Schulte, 1987), y el Meta-
cognitive Awareness Inventory (Schraw & Dennison, 1994), entre otros. No
obstante, el Motivated Strategies for Learning Questionnaire (MSLQ; Pin-
trich, Smith, Garcia, & McKeachie, 1991), constituye una de las medidas
más utilizadas en el ámbito educativo (Schunk, 2005; Mayer, Faber & Xu,
2007; Moos & Ringdal, 2012).
El MSLQ fue desarrollado bajo el marco de la teoría social cognitiva,
la cual destaca que la motivación del estudiante se encuentra vinculada con
la habilidad para auto-regular sus actividades de aprendizaje (Pintrich & De
Groot, 1990). Para Pintrich (2000), el aprendizaje autorregulado se caracteri-
za por ser un proceso activo, constructivo, donde los alumnos seleccionan las
metas parasu aprendizaje e intentan monitorear, regularsu cognición, motiva-
ción y conducta, los cuales se actualizan en función del contexto.
El MSLQ es un instrumento de auto-reporte, dividido en dos seccio-
nes, motivación (31 ítems), y estrategias de aprendizaje (50 ítems), donde el
estudiante debe responder mediante una escala Lickert con siete opciones de
respuesta (desde “no me describe enabsoluto” a “me describe muy bien”). La
sección de motivación se encuentra compuesta por tres aspectos, valoración,
expectativas y afecto. El primero refiere a las metas de los estudiantes y sus
creencias acerca de la importancia e interés en la tarea (por ejemplo, “lo más
satisfactorio en este curso, es tratar de entender el contenido”), por su parte,
las expectativas implican las creencias de los estudiantes respecto a sus propias
habilidades para desempeñar una tarea (“estoy seguro de que puedo dominar
las habilidades que se enseñan en esta clase”), y el afecto, alude a las reacciones
emocionales ante una actividad en particular (“cuando realizo un examen,
pienso en las consecuencias de fallar”; Pintrich & De Groot, 1990).
La escala de estrategias de aprendizaje se divide en aquellas que permiten
al estudiante aprender, recordar, comprender y analizar el material (estrategias
cognitivas y meta-cognitivas), y los recursos no intelectuales que dispone el
alumno los cuales permiten cumplimentar sus objetivos y necesidades (estra-
tegias de gestión de recursos). En cuanto a las estrategias cognitivas y meta-
cognitivas, Pintrhich et al. (1991) destacaron la importancia de los procesos
asociados al ensayo (“cuando estudio para esta clase, practico diciéndome el
material a mí mismo una y otra vez”), elaboración (“trato de relacionar las
ideas de este tema con las de otros cursos”), organización (“hago gráficos, dia-
gramas o tablas para ayudarme a organizar el material”), pensamiento crítico
(“a menudo me encuentro cuestionando cosas que escucho o leo para decidir
124
si las encuentro convincentes”), y autorregulación (“cuando leo, me hago pre-
guntas para ayudarme a enfocar mi lectura”).
Por su parte, los distintos tipos de gestión de recursos lo constituyen
el tiempo y ambiente de estudio (“por lo general estudio en un lugar donde
puedo concentrarme”), la regulación del esfuerzo (“incluso cuando los mate-
riales del curso son aburridos y poco interesantes, me las arreglo para seguir
trabajando hasta que termine”), el aprendizaje entre pares (“cuando estudio, a
menudo trato de explicar el material a un compañero de clase o a un amigo”),
y la búsqueda de ayuda (“le pido al profesor que me aclare los conceptos que
no entiendo bien”).
125
específicas por encima del promedio. De este modo, un individuo entre 10
sería ligeramente dotado (una desviación estándar por encima del promedio),
1 entre 100 moderadamente rdotado (dos desviaciones estándar por encima
del promedio) y 1 entre 1000 altamente dotado (tres desviaciones estándar
por encima del promedio), y así sucesivamente, hasta arribar a la excepcionali-
dad donde la ratio sería 1/100000. Una serie de “catalizadores” (Gagné, 2003)
co-ayudarían para la conversión del talento potencial (dones) en destrezas
altamente desarrolladas (talentos), tales como aprendizaje y práctica (ormal
o informal), factores intrapersonales (motivación, temperamento), factores
medioambientales (familia, vecindario, escuela) y sucesos fortuitos (combina-
ción particular de genes, entre otros).
Renzulli (2003) postuló en su teoría de los Tres Anillos que existen tres
factores que explican la dotación, y que ninguno de ellos de manera aislada
es condición suficiente para generarlo: aptitudes por encima del promedio,
compromiso con la tarea (motivación) y creatividad. Como puede apreciarse,
el papel de la inteligencia (y las aptitudes) continúa estimándose como im-
portante pero en esta teoría se incorporan también dos factores explicativos
no-intelectuales, o al menos parcialmente no-intelectuales: motivación (com-
promiso con la tarea) y creatividad (ver figura 6). Numerosas investigaciones
(Renzulli y Reis, 2003) contrastaron diferentes aspectos e hipótesis de esta
teoría y proporcionan apoyo general a sus postulados.
126
cognitivos del individuo, los cuales se originan en un complejo proceso de
interacción entre factores biológicos y culturales. En su teoría de las inteli-
gencias múltiples (MI), Gardner (1999) definió la inteligencia como poten-
cial biopsicológico para procesar información en diferentes vías; facilitando
la resolución de problemas o la creación de productos valiosos en un entorno
cultural determinado. Esas ocho se denominan: Lingüística, Musical, Lógico-
Matemática, Espacial, Corporal, Intrapersonal, Interpersonal y Naturalista.
Puesto que no hay consenso en la literatura respecto a la utilización
de los términos superdotado, dotado, altas capacidades y talentoso, y el
significado específico de cada uno de ellos, en este artículo utilizaremos estos
conceptos con el significado atribuido por el Ministerio de Educación de Es-
paña (2007) en su normativa específica, donde se expresa que: los estudiantes
superdotados son aquéllos que evidencian un rendimiento superior en casi
todas las asignaturas escolares y se destacan en varias aptitudes, y el término
talentoso debe utilizarse para aquéllos estudiantes que muestran habilidades
específicas en áreas concretas. Debido a que pocos estudiantes se destacan en
todas las áreas académicas durante todo el tiempo (Reis y Housand, 2007)
nos inclinamos preferentemente a utilizar el término talento o dotación, aun-
que respetando la terminología empleada por cada autor citado.
En este apartado se revisan sintéticamente los principales instrumentos
utilizados para identificar a los niños y adolescentes talentosos, enfatizando
aquéllos más empleados y, preferentemente, adaptados para nuestro medio.
El proceso de identificación constituye el primer paso para abordar la
atención educativa de los alumnos con talento y pretende determinar su ca-
pacidad y ritmo de aprendizaje como indicadores indispensables para poder
ofrecer respuestas que tengan en cuenta sus necesidades especiales (Rodríguez,
2004). Ritchert (1987) sintetizó algunos riesgos inherentes a este proceso,
tales como los originados en definiciones elitistas, que solo incluyen deter-
minados tipos de talento y, normalmente, excluyen a los estudiantes poco
favorecidos social o culturalmente; o en la falta de equidad educativa, la cual
ocasiona baja representación de poblaciones desfavorecidas en los programas
educativos debido a la utilización de instrumentos de medida que los pe-
nalizan. Este tipo de dificultades deberían ser contrarrestadas mediante una
concepción amplia del talento, que implique un proceso cuidadoso de iden-
tificación y facilite la elaboración de programas específicos y sistemáticos a lo
largo de la escolarización del estudiante.
Una de las estrategias de identificación más validada es la utilizada en
el SMPY (Study of Mathematical Precocius Youth), un ambicioso proyecto
iniciado en 1971 en la Universidad John Hopkins, cuyo objetivo inicial fue
identificar y suministrar recursos educativos adecuados a los jóvenes talentos
matemáticos. Este objetivo se ha ampliado y, en la actualidad, se denomina
Talent Search e incluye el diagnóstico del talento verbal y espacial así como la
127
utilización de inventarios de intereses y valores como herramientas adiciona-
les a los tests de aptitudes (Lubinski, 2003). En este programa se identifican
estudiantes muy talentosos de séptimo año y octavo año (12-13 años) uti-
lizando las escalas SAT-V (Aptitud Verbal) y SAT-M (Aptitud Matemática)
para ingresantes a la universidad (17 años). La utilización de test apropiados
para un nivel de edad superior se justifica en el hecho que los tests utilizados
en esas edades no discriminan adecuadamente en los niveles superiores del
rango de aptitudes (efecto celling).
Esos adolescentes identificados como talentosos son incluidos en clases
avanzadas de Matemática o Lengua correspondientes a los años finales del
secundario (high school). Se estima que un adolescente de 12 años que ha
obtenido una puntuación de 500 o superior en el SAT-V o SAT-M (rango de
puntajes 200-800) puede asimilar un curso completo de secundario superior
(Inglés o Matemática, por ejemplo) en tres semanas asistiendo a un programa
de verano para jóvenes talentosos.
Mediante investigación longitudinal de calidad se demostró que la ma-
yor parte de los estudiantes identificados como talentosos mediante el Talent
Search alcanzan logros académicos destacados. Un estudio de seguimiento de
una de las cohortes del programa durante 20 años demostró que el 25% de
los adolescentes con puntuaciones de 500 o superiores en el SAT obtuvo un
doctorado. Teniendo en cuenta que la tasa de doctorados en USA es del 1% el
éxito de este proceso de identificación es realmente notable (Lubinski, 2003).
El programa incluye actualmente técnicas para evaluar las aptitudes espacia-
les. En efecto, las mismas son relevantes para el arte, la ciencia y la ingeniería
pero los jóvenes que las poseen en alto grado no están adecuadamente repre-
sentados cuando se emplean solamente tests de aptitud verbal o cuantitativa
en el proceso de identificación.
Pfeiffer y Jarosewich (2003) proponen utilizar en primer lugar las es-
calas de calificación del talento por parte de docentes, que revisaremos más
adelante. Un conjunto inicial de niños es seleccionado según los puntos de
corte establecidos en los estudios normativos de cada escala; en la Gifted Ra-
ting Scales (Pfeiffer y Jarosewich, 2003), por ejemplo, una puntuación T de
60 (media 50, desviación estándar 10) indica una probabilidad moderada de
ser talentoso en alguna de las áreas medidas por este instrumento (liderazgo,
por ejemplo). Este grupo identificado es posteriormente evaluado con tests
de inteligencia y/o aptitudes utilizando los criterios previamente estableci-
dos por la investigación para cada instrumento (entre una y dos desviaciones
estándar por encima del promedio en el WISC-IV, por ejemplo). El empleo
de la puntuación total del test de inteligencia o de sus puntuaciones parciales
(comprensión verbal, por ejemplo) dependerá de la modalidad de oferta edu-
cativa para la cual se desee identificar a los estudiantes. Para un programa de
enriquecimiento en escritura creativa resultará pertinente utilizar medidas de
128
la aptitud verbal, por ejemplo (Stutler, 2011). Finalmente, puede emplearse
algún autoinforme que mida aspectos motivacionales (inventarios de inte-
reses, escalas de autoeficacia, etc.) de los estudiantes antes de su inclusión
en programas de enriquecimiento o aceleración pertinentes para sus talentos
específicos.
Existen numerosas herramientas de identificación, tanto de tipo formal
(tests y escalas) como de carácter informal (portfolio, por ejemplo). Aquí se
describen tres tipos de instrumentos formales (estandarizados) muy utiliza-
dos en el proceso de identificación del talento: tests de inteligencia y aptitu-
des, escalas de calificación del talento por parte de docentes, y autoinformes.
Brindar un panorama exhaustivo de estas categorías de pruebas psicológicas
resulta imposible en este contexto; por consiguiente, nos concentraremos en
las pruebas más utilizadas e investigadas en el área de la dotación y en algunos
instrumentos construidos o adaptados en Argentina.
129
y su administración completa requiere una sesión de aproximadamente dos
horas de duración. Las propiedades psicométricas del test en lo referente a
confiabilidad en sus diferentes dimensiones, estructura interna y validez ex-
terna son excelentes. Es uno de los instrumentos más utilizados en el mundo
para identificar estudiantes talentosos y los índices de Comprensión Verbal y
Razonamiento Perceptivo son excelentes indicadores para esa finalidad. En la
muestra de estandarización original del WISC-IV, el grupo identificado como
dotado intelectualmente obtuvo un Puntaje Total promedio de 123.5, un
valor de 124.7 en el índice de Comprensión Verbal, y de 123.5 en el índice
de Razonamiento Perceptivo (Wechsler, 2003). La muestra control de com-
paración obtuvo puntuaciones de 106.7, 106.6 y 105.6 en el Indice General,
Comprensión Verbal y Razonamiento Perceptivo, respectivamente. La inves-
tigación ha demostrado que los subtests más útiles para identificar talento son
los de Vocabulario, Semejanzas, Comprensión, Matrices, Cubos y Conceptos
(Flanagan y Kaufman, 2004). Puede concluirse que el WISC-IV es una medi-
da excelente de inteligencia genera, aptitud verbal, memoria y aptitud espacial
pero no mide otras aptitudes específicas relevantes (de liderazgo, psicomoto-
ras o musicales, por ejemplo) y, por consiguiente, no debe utilizarse como
herramienta única de identificación del talento.
Otro test de aptitudes muy utilizado en nuestro medio (particularmen-
te en el ámbito de la orientación vocacional y selección de personal) es el Tests
de Aptitudes Diferenciales (DAT-5; Bennet, Seashore y Wesman, 2000). El
DAT-5 fue diseñado para medir las aptitudes de aprendizaje en ocho áreas:
Razonamiento Abstracto, Rapidez y Exactitud Perceptiva, Relaciones Espa-
ciales, Ortografía, Razonamiento Mecánico, Uso del Lenguaje, Razonamien-
to Verbal y Razonamiento Numérico. Las puntuaciones combinadas de Ra-
zonamiento Verbal y Numérico pueden utilizarse para generar un índice de
aptitud académica general.
El DAT-5 se presenta en dos versiones, una para adolescentes que cur-
san séptimo a noveno año (12-14 años) y otra para adolescentes que cursan
décimo a duodécimo (15-17 años). Es un test de administración colectiva y
se sugiere aplicarlo en una sesión de dos horas o dos sesiones de una hora de
duración cada una. Puede administrarse de manera completa o utilizando
solo algunos de sus subtests, según las finalidades de evaluación.
Las propiedades de confiabilidad (consistencia interna y estabilidad) y
de validez predictiva en relación a rendimiento académico (particularmente
su puntaje combinado general) son meritorias pero se ha criticado la escasa
validación de la estructura interna del test y la falta de conexión del mismo
con las teorías contemporáneas de la inteligencia y las aptitudes cognitivas
(Kline, 2000). En el ámbito del talento es un instrumento menos utilizado e
investigado que el WISC-IV. No obstante, algunas investigaciones recientes
(Lubinski, 2003) han demostrado que el puntaje combinado de Razonamien-
130
to Mecánico y Relaciones Espaciales es un excelente predictor de la aptitud
para la ciencia y la ingeniería y puede utilizarse con confianza durante la iden-
tificación de estudiantes dotados en esa área.
131
nal reune diferentes evidencias de validez, tales como basadas en la estructura
interna utilizando análisis factorial confirmatorio, así como convergente-dis-
criminante en relación a otros tests y escalas que miden constructos semejan-
tes (WISC-IV, SRBCSS, Torrance Tests of Creative Thinking), y relacionada
con criterio comparando el desempeño de estudiantes identificados como
dotados y no dotados en las seis escalas de la GRS-S. La confiabilidad de la
GRS-S fue examinada en las dimensiones de consistencia interna (rango del
coeficiente alfa de Cronbach entre .97 y .99), estabilidad (rango del coeficien-
te r test-retest entre .79 y .97) y confiabilidad interexaminadores (rango del
coeficiente de correlación intraclase entre .62 y .80). La estandarización de la
GRS fue realizada en una muestra de 600 niños de Estados Unidos, estrati-
ficada en lo referente a edad, etnia y nivel educativo de los padres, conside-
rando el censo nacional de U.S. Para interpretar los resultados de la GRS-S el
puntaje total de cada escala es convertido en una puntuación T con media de
50 y desviación estándar de 10. Se presentan baremos diferenciados en ocho
bandas de edad entre 6 y 13.11 años.
Este instrumento ha sido adaptado a diversas culturas y lenguajes en
el mundo (Pfeiffer y Jarosewich, 2003). En particular resulta relevante un
estudio transcultural que suministró evidencias de invarianza factorial de la
GRS-S utilizando análisis factorial confirmatorio en muestras de cinco países:
Estados Unidos, Puerto Rico, China, Corea del Sur y Turquía. Adicionalmen-
te, todas las escalas presentaron elevada consistencia interna y fuertes correla-
ciones entre sí. La validez de criterio del instrumento respecto al rendimiento
académico de los estudiantes es satisfactoria aunque el poder de predicción
diferencial de las escalas resultó escaso, lo que hace pensar en que un modelo
alternativo con un factor general (g?) de segundo orden podría contrastarse y
comparar sus índices de ajuste con el modelo original de seis factores correla-
cionados pero relativamente independientes. Este argumento también se jus-
tifica en las elevadas intercorrelaciones que presentan las diferentes subescalas.
Los resultados preliminares que obtuvimos en nuestro medio son muy seme-
jantes a los originales (Pérez et al., 2012). Otra hipótesis para explicar este
pobre poder predictivo diferencial (fundamental en el área de la identificación
del talento) serían un posible sesgo en la evaluación realizada por los docentes.
En síntesis, las escalas de calificación pueden ser de utilidad aunque en
ocasiones el entorno escolar no facilita el despliegue de los diferentes talentos
de los estudiantes y los educadores tienden a evaluar de modo muy general a
sus estudiantes, sin poder discriminar adecuadamente entre talentos académi-
cos y no académicos. Por otra parte, no resulta una tarea sencilla la observación
detallada que exigen estas escalas en las condiciones frecuentes de enseñanza
en nuestro medio (grupos muy numerosos de estudiantes, docentes mal re-
munerados, etc.). Por este motivo, deberían utilizarse como una herramienta
secundaria de identificación del talento, interpretando sus resultados como
132
un complemento de la información suministrada por los otros instrumentos
de observación (portfolios de desempeño, tests de aptitudes, autoinformes).
Autoinformes
Como hemos expresado anteriormente, existe acuerdo entre los investi-
gadores respecto a que el proceso de identificación del talento debe realizarse
utilizando diferentes estrategias de evaluación (Gagné, 2003; Lubinski, 2003,
Renzulli et al, 2009). Sin instrumentos con esas características un número
considerable de niños talentosos podrían no ser identificados (error de me-
dición tipo II), o podrían incluirse erróneamente a niños sin talentos espe-
ciales en programas educativos para superdotados (error tipo I) (Pfeiffer y
Jarosewich, 2003). Específicamente, las escalas de autoevaluación (autoinfor-
mes) de habilidades, autoeficacia y/o intereses vocacionales pueden facilitar
la identificación de estudiantes talentosos en dominios no contemplados por
los tests de aptitudes, tales como destrezas sociales, atléticas o artísticas. Los
autoinformes poseen limitaciones importantes: no permiten evaluar niños pe-
queños y, por otra parte, los examinados pueden subestimar o sobreestimar
sus competencias y/o preferencias de manera consciente o involuntaria. No
obstante, la ciencia psicológica no ha generado hasta el presente otro método
igualmente económico y confiable para evaluar los aspectos motivacionales
del talento. Como en el caso de los tests de aptitudes y las escalas de clasifi-
cación del talento, los autoinformes nunca deben ser el único elemento de
identificación, sino que deben integrarse en una batería de medidas.
Chan (2001) desarrolló el Perfil de Inteligencias Múltiples del Estu-
diante (SMIP), un autoinforme que mide habilidades autopercibidas e inte-
reses relacionados con las inteligencias múltiples y se utiliza con la finalidad
de identificar niños y adolescentes talentosos en Hong Kong. Este autor (op.
cit) informó que el SMIP posee propiedades psicométricas satisfactorias en
muestras de estudiantes identificados como talentosos, incluyendo una es-
tructura factorial clara verificada por métodos exploratorios y confirmatorios,
moderada consistencia interna (α = .64 a .76) y correlaciones significativas
con variables externas, tales como aptitudes musicales, razonamiento no ver-
bal y liderazgo.
En nuestro contexto, Pérez (2001) construyó un Inventario de Auto-
eficacia para Inteligencias Múltiples (IAMI), basándose en la teoría de las
intelgencias múltiples (Gardner, 1999) y en la teoría social-cognitiva (Bandu-
ra, 1997). El IAMI se utiliza en procesos de orientación para la elección de
carrera con adolescentes (Fogliatto y Pérez, 2003), y posee propiedades psi-
cométricas aceptables de estabilidad, consistencia interna, validez de criterio
en relación a rendimiento académico y metas de elección de carrera, y validez
factorial, en este último caso utilizando tanto métodos exploratorios como
133
confirmatorios (Pérez y Cupani, 2008; Pérez y Medrano, 2007). El IAMI en
su versión revisada (IAMI-R) ha sido adaptado a la población estudiantil de
Italia (Lodi, Pérez, Petrucelli y Medrano, 2009) y actualmente se investiga
su utilidad para la identificación de adolescentes talentosos de la población
chilena (M. C. García, comunicación personal, Septiembre 20 de 2016). En
la siguiente tabla se presentan las instrucciones de administración y algunos
ítems del instrumento.
134
nible en tres niveles (Primario, Elemental y Secundario). La interpretación de
los resultados del Interest-A-Lyzer permite tomar decisiones adecuadas para
el desarrollo del talento, tales como el tipo de oportunidades de aceleración o
enriquecimiento que se van a recomendar y/o suministrar a cada estudiante
talentoso.
Achter, Lubinski, Benbow y Eftekhari- Sanjani (1999) demostraron que
la utilización de inventarios de intereses vocacionales incrementa la validez de
los tests de aptitudes para identificar perfiles de talento verbal, numérico y
espacial y predecir diferentes indicadores de logro académico.
Los descubrimientos que comentamos más adelante con relación a es-
tudios de seguimiento de individuos muy destacados en sus campos de activi-
dad (Bloom, 1985) así como las teorías prominentes del desarrollo del talento
(Renzulli, 2003; Gagné, 2003) enfatizan el rol de factores de personalidad ta-
les como responsabilidad, perseverancia o compromiso con la tarea. En este
sentido los tests que miden esos rasgos de personalidad (NEO, por ejemplo)
pueden ser de ayuda en la tarea de identificación del talento. Este es un tema
que requiere investigación futura.
En este apartado revisamos sintéticamente algunos instrumentos de uso
frecuente y con propiedades psicométricas adecuadas que se emplean para
identificar estudiantes talentosos. El proceso de identificación de la dotación
y/o el talento tiene sentido cuando se poseen programas educativos adecuados
para niños y adolescentes talentosos. Por consiguiente, el psicólogo especiali-
zado en esta área de la psicología educacional deberá escoger las herramientas
adecuadas para identificar individuos que luego serán incluidos en programas
de enriquecimiento o aceleración.
El método de aceleración consiste en colocar al niño talentoso en algún
curso más avanzado, teniendo en cuenta sus capacidades y no su edad (Sán-
chez Manzano, 1997). En los Estados Unidos existen varias alternativas de
aceleración de la currícula, tales como: a) currícula compactada, que permite
saltear los contenidos y materias que los estudiantes ya dominan, b) escolari-
dad acortada, la cual permite hacer tres cursos en dos, por ejemplo, c) acele-
ración temática en una o más áreas determinadas, Matemática o Inglés, por
ejemplo, d) admisión temprana en la universidad, antes de haber concluido la
educación secundaria, entre otras.
La estrategia de enriquecimiento proporciona al estudiante talentoso
oportunidades de aprendizaje extraescolar que no están disponibles en la edu-
cación regular (Sánchez Manzano, 1997). El enriquecimiento se puede llevar
a cabo en el contexto escolar, con las adecuaciones necesarias de la currícula,
o de manera extracurricular, con programas de fines de semana o de vacacio-
nes de verano ofrecidos por las universidades, por ejemplo.
Estudios longitudinales con individuos que alcanzaron grandes logros
en sus campos de actividad (neurología, natación o intérprete musical, por
135
ejemplo) demuestran que la práctica intensiva, tiempo de aprendizaje y apo-
yo social requerido es realmente considerable y excede el marco de las tareas
escolares o los cursos de verano (Bloom, 1985). Estos hallazgos nos exigen
prudencia respecto a los resultados esperados en los programas de enrique-
cimiento y destaca el rol de los factores motivacionales y de personalidad
(perseverancia, compromiso con la tarea) y del contexto social (hogar, escuela,
expertos en el vecindario o la región) más allá de la contribución necesaria
de las aptitudes para el desarrollo del talento (Renzulli, 2003; Gagné, 2003).
Nadie se destaca en un campo de actividad humana de cualquier índole con
un semestre de cursos realizados, dentro o fuera de la escuela, por más que los
mismos sean de alta calidad.
En el contexto de Sudamérica el país más avanzado en lo referente a la
organización de recursos educativos para el joven talentoso es Chile (Benaví-
dez, Maz, Castro y Blanco, 2004). Uno de los programas pioneros comenzó
en el año 1993, en la Facultad de Matemáticas de la Pontificia Universidad
Católica, y tuvo como objetivo detectar a niños de nueve y diez años con
habilidades matemáticas elevadas, para ofrecerles una educación complemen-
taria. A los estudiantes seleccionados se les ofrecieron cursos avanzados de ma-
temáticas especialmente diseñados por especialistas en la materia, tales como
Algebra, algunos de ellos complementados con la utilización de un software
matemático (Benavídez, 2001).
Basándose en la experiencia anterior se implementó, a partir del año
2001, el Programa para Niños con Talentos Académicos (PENTA), cuyo ob-
jetivo es identificar a niños y jóvenes que posean talentos académicos sobre-
salientes, para ofrecerles un conjunto de servicios educacionales de excelencia
que sean complementarios a las experiencias de aprendizaje que les brinda el
sistema escolar regular, tales como cursos científicos, humanistas e interdisci-
plinarios. A diferencia del programa inicial para talentos matemáticos, la ofer-
ta curricular ofrecida en PENTA no se reduce a un campo de conocimiento,
sino que ayuda al alumno a desarrollar su potencial en varias áreas. La aplica-
ción sistemática de estos programas ha tenido repercusión en el ámbito edu-
cativo, generando pasantías de perfeccionamiento para docentes y seminarios
vinculados con la educación de niños con talento. Actualmente, la Pontificia
Universidad Católica de Chile ofrece un diplomado en Talento y Superdo-
tación que puede cursarse de manera semipresencial y es de duración anual.
En nuestro medio, durante dos años implementamos un programa de
enriquecimiento para niños con talento verbal, el “Taller de Escritores”, en
una escuela privada de la ciudad de Unquillo, (Pérez, Lescano y Medrano,
2012). El taller de escritores (Calkins, 1994) es un enfoque de instrucción
que enfatiza el aprendizaje del proceso de escritura (planificación, composi-
ción, revisión, publicación). Se evaluó la efectividad del programa utilizando
un diseño cuasiexperimental pre-post de grupo único con el programa de in-
136
tervención operando como variable independiente y la calidad de la escritura
como variable dependiente. Por tratarse de una muestra pequeña y haberse
empleado una medida de tipo ordinal, se utilizó la prueba no paramétrica
de Wilcoxon para medir el efecto del programa. A los fines de analizar los
resultados obtenidos en ambos estudios, uno en cada año, se utilizó el test
combinado de Stouffer (Cortada de Cohan, Macbeth y López Alonso, 2008).
Este estadístico permite evaluar conjuntamente una serie de pruebas diferen-
tes que contrastan de manera independiente la misma hipótesis, en este caso
el impacto de la intervención sobre la calidad de la escritura. El valor del test
de Stouffer fue estadísticamente significativo (Zc=2.18, p<.05), con un tama-
ño del efecto moderado (delta -.40). Estos datos sugieren que los resultados
conjuntos obtenidos por pruebas independientes apoyan la efectividad de la
intervención.
Por otra parte, el análisis de una encuesta administrada al final de la
experiencia indicó que los participantes evaluaron el taller como muy útil
(66%) o útil (34%), y que las actividades específicas percibidas como más
provechosas fueron: un experimento de imaginación guiada para escribir
poesía, mini-lecciones sobre la estructura de los géneros literarios, aprender
nuevas técnicas de escritura, compartir los textos propios con los demás parti-
cipantes y analizar las obras de autores consagrados. Una de las participantes
ganó el premio anual de poesía del colegio, con un poema trabajado en el
taller. Estos hallazgos promisorios del programa piloto deberían confirmarse
con un diseño más riguroso.
137
ciones emocionales habituales (AE-rasgo) como las reacciones emocionales
momentáneas (AE-estado). Las escalas de AE incluyen ítems que preguntan a
los estudiantes cuán frecuentemente o intensamente experimentan estas res-
puestas de ansiedad antes o durante los exámenes.
Brown (1938), al crear el primer cuestionario de AE, construyó un cues-
tionario de 70 ítems que medían indicadores afectivos, cognitivos, fisiológicos
y conductuales de ansiedad (e.g., ¿Estás nervioso antes de la evaluación?), con
respuestas provistas en una escala de frecuencia de 5 puntos (1 = siempre a 5
= nunca). Brown no estimó la confiabilidad del instrumento pero calculó las
correlaciones ítem-total (no corregida) y encontró que 58 ítems superaron el
punto de corte que estableció para su inclusión en el cuestionario (rit> .25).
Además, encontró que los puntajes medios de ansiedad difieren entre grupos
de estudiantes, aportando evidencia adicional para la validez del instrumento.
Varios instrumentos (e.g., Mandler & Sarason, 1952) han sido desa-
rrollados bajo la concepción de que la AE es un fenómeno uni-dimensional,
homogéneo. Con el avance en la investigación, se ha confirmado que es po-
sible distinguir entre dos componentes (afectivo-fisiológicos y cognitivos) de
la AE (Liebert & Morris, 1967) e, incluso, múltiples componentes (Hodapp
& Benson, 1997) han sido propuestos para refinar la medición de la faceta
cognitiva.
138
de logro-rasgo), reacciones emocionales en una materia o dominio específico
(emociones de logro-materia/dominio), o emociones en un punto específico
de tiempo (emociones de logro estado). En cada una de las tres secciones, los
ítems están ordenados en tres bloques y evalúan las experiencias emocionales
antes, durante y después de estar en las situaciones de logro indicadas por la
sección.
Escalas
Clase Estudio Evaluación
Emociones a Ítems a Ítems a Ítems
Disfrute .85 10 .78 10 .78 10
Esperanza .79 8 .77 6 .80 8
Orgullo .82 9 .75 6 .86 10
Alivio - - - - .77 6
Enojo .86 9 .86 9 .86 10
Ansiedad .86 12 .84 11 .92 12
Desesperanza .89 11 .86 11 .87 10
Vergüenza .90 10 .90 11 .92 11
Aburrimiento .93 11 .92 11 - -
* Coeficientes alfa para la versión en inglés del AEQ.
Tabla 1. Cuestionario de Emociones de Logro (AEQ): escalas y confiabilidad*.
139
chez-Rosas, 2015), filipino (King, 2010) y portugués (Peixoto, Mata, Mon-
teiro, Sanches, & Pekrun, 2015). Las versiones alternativas del AEQ miden
emociones de los estudiantes en dominios académicos específicos (e.g., AEQ-
Mathematics; Frenzel, Thrash, Pekrun, & Goetz, 2007) y en estudiantes de
nivel primario (AEQ-Elementary School; Lichtenfeld, Pekrun, Stupnisky,
Reiss, & Murayama, 2012).
140
ser evaluado, ansiedad por preocupaciones relacionadas con los estudiantes,
ansiedad por el control de la clase y ansiedad por los requerimientos de la
práctica docente.
El Cuestionario de Emociones de Logro para Docentes (AEQ-Teachers,
Frenzel et al., 2016) mide, mediante escalas de cuatro ítems, tres emocio-
nes frecuentes y relevantes en el contexto de la enseñanza: disfrute (Disfruto
de enseñar), enojo (Suelo tener razones para estar enojado cuando enseño),
ansiedad (Suelo sentirme tenso y nervioso mientras enseño). Basado en los
resultados de una muestra de 944 docentes, Frenzel et al. (2016) brindaron
evidencias de confiabilidad (consistencia interna) y validez interna mediante
análisis factorial confirmatorio. La validez test-criterio de las escalas se obtuvo
al demostrar relaciones teóricamente consistentes con afecto positivo y nega-
tivo, burnout, satisfacción laboral, autoeficacia y calidad instruccional de los
docentes.
141
Métodos de evaluación de la calidad instruccional docente
La evaluación docente basada en los puntajes de opinión de los estu-
diantes recolectados por cuestionarios es la estrategia de evaluación más uti-
lizada en todo el mundo. Si bien existen otros métodos (como la evaluación
por parte de pares, el rendimiento de los estudiantes, autoevaluación, eva-
luación por expertos, evaluación por superiores, evaluación por ex alumnos,
clima de clase, materiales elaborados, productividad investigadora, informes
de las notas y matriculados), los cuestionarios de evaluación parte de los es-
tudiantes tienen mucho mayor soporte empírico para justificar la validez de
sus resultados. Otras razones prácticas para su uso extendido es que se pueden
evaluar las respuestas de muchos estudiantes sobre una misma clase, son rela-
tivamente fáciles de implementar y de bajo costo para la obtención de datos
en grupos numerosos. Por esta razón, son a menudo el método preferido para
la evaluación de la calidad instruccional docente en la investigación educativa.
142
partir de ese momento aparecieron cientos de instrumentos destinados a la
evaluación de la calidad instruccional docente.
En la práctica, los instrumentos de evaluación rara vez se utilizan para
informar a los profesores acerca de las áreas de instrucción que necesitan me-
jorar. Estas evaluaciones pueden servir a las instituciones encargadas de la pre-
paración docente para informarlos sobre las áreas de fortaleza y la debilidad
en la preparación de sus futuros docentes y así mejorar la calidad profesional.
Dentro de una amplia gama de instrumentos, el Inventario de Com-
portamiento Docente de Murray (1983) destaca como uno de los más apro-
piados para la medición de la calidad instruccional docente y posee ciertas
ventajas respecto a otros instrumentos. Mide comportamientos de baja in-
ferencia, lo que ayuda a distinguir los comportamientos efectivos de los que
no lo son. Los estudiantes son los evaluadores de dichos comportamientos,
proporcionado datos confiables. Se han realizado estudios experimentales con
este instrumento que avalan su validez y confiabilidad para medir la calidad
instruccional docente. Por último, a través de sus resultados se pueden imple-
mentar mejoras en el desempeño de los docentes en el aula.
143
teracción entre el docente y los estudiantes. Cada categoría está comprendida
por varios ítems que se responden en una escala tipo likert de cinco puntos
para indicar la frecuencia del comportamiento en clase.
Basado en este inventario, Murray y Smith (1989) propusieron la ver-
sión feedback del Inventario de Comportamiento Docente que esencialmente
contiene los mismos 60 ítems pero con una escala de respuesta diferente. Los
estudiantes, en vez de puntuar la frecuencia de ocurrencia de los comporta-
mientos de enseñanza, puntúan cada comportamiento en una escala bipolar
de 5 puntos para indicar si, a los fines de mejorar la enseñanza, la frecuen-
cia de ocurrencia del comportamiento en cuestión necesita ser incrementada
(puntuación de +1 o +2), disminuida (puntuación de -1 o -2), o deber per-
manecer igual (puntuación de 0).
El Inventario de Comportamiento Docente combina herramientas des-
criptivas y evaluativas. Es descriptiva porque los ítems no requieren que el
analista (alumno o evaluador) evalúe la calidad de la instrucción sino simple-
mente si ocurre un comportamiento de enseñanza particular. Es evaluativa
porque los investigadores han encontrado que las categorías del Inventario de
Comportamiento Docente (por ejemplo, claridad, entusiasmo) suelen aso-
ciarse a la enseñanza efectiva.
Comentarios Finales
144
intrincada red de factores psicosociales. El adecuado uso de procedimientos
de evaluación psicológica puede contribuir a identificar los factores asociado
al bajo desempeño académico, monitorear estudiantes que presenten riesgo
de abandonar sus estudios, y evaluar innovaciones educativas que permitan
mejorar el proceso de enseñanza-aprendizaje. El uso ético y responsable de
estos procedimientos resulta un aliado estratégico para la labor del psicólogo
en este complejo campo de ejercicio profesional.
145
|
Evaluación Psicométrica en Psicología Clínica y
de la Salud
Leonardo Medrano, Luciana Moretti, Eugenia Griffoulière,
Lucas Lapuente y Ezequiel Flores Kanter
Introducción
147
El uso de test psicométricos en el Proceso de Evaluación Clínica
148
De esta manera, el proceso de evaluación clínica se inicia con una des-
cripción general del estado del paciente y el establecimiento de las primeras
hipótesis diagnósticas. Con esta información se pueden establecer hipótesis
globales que permitan avanzar hacia una formulación clínica a partir de la
cual se pueda explicar el inicio, curso y mantenimiento de los problemas es-
pecíficos del paciente.
Tomando en consideración a Muñoz (2003), el proceso de evaluación
clínica involucra las siguientes fases: a) exploración inicial, b) evaluación para
el diagnóstico y severidad del trastorno, c) análisis funcional y formulación
del caso, y, d) diseño del tratamiento. Los test psicométricos resultan par-
ticularmente útiles para las dos primeras fases. En particular las pruebas de
detección o screening resultan útiles para la fase de exploración, mientras que
las pruebas de diagnóstico resultan más adecuadas para la segunda fase, donde
se establece un diagnóstico preliminar y se evalúa la severidad del trastorno.
149
de ansiedad, alcoholismo, trastornos somatomorfos y de la conducta ali-
mentaria; la segunda, implica una guía de evaluación clínica que la debe
aplicar el profesional (Diez-Quevedo, Rangil, Sanchez-Planell, Kroenke,
y Spitzer, 2001).
Debido a la cantidad de tiempo que suponía administrar la guía y
la dificultad de algunos profesionales en la utilización de los algoritmos
necesarios para obtener los resultados, se desarrolló el PHQ el cual com-
bina ambos componentes en un cuestionario de autoreporte breve, rápido
e igual de eficaz (Diez–Quevedo et al., 2001; Spitzer y Kroenke, 1999).
Al tratarse de una versión breve auto-administrada que provee resultados
semejantes a los obtenidos por psicólogos clínicos, es que el PHQ consti-
tuye en la actualidad uno de los instrumentos de mayor uso tanto para fines
clínicos como de investigación (Kroenke y Spitzer, 2002).
El PHQ permite examinar la existencia de los desórdenes emociona-
les más prevalentes como son el trastorno depresivo mayor, el trastorno de
pánico, el trastorno de ansiedad generalizada, bulimia nerviosa y atraco-
nes así como también abuso o dependencia del alcohol (Diez-Quevedo et
al., 2001). El PHQ incluye diferentes conjuntos de ítems que permiten la
evaluación de los diferentes trastornos conformando módulos o subtests,
de los cuales el PHQ-9 (depresión), el GAD-7 (ansiedad generalizada) y el
PHQ-PD (trastorno de pánico), entre otros (Muñoz-Navarro, Cano-Vindel,
Medrano, Schmitz, 2017; Muñoz-Navarro et al., 2017).
La versión en inglés del PHQ ha sido analizada por numerosos es-
tudios internacionales que han demostrado validez y confiabilidad acep-
tables (Diez-Quevedo et al., 2001; Spitzer y Kroenke, 1999). Además, ha
sido traducido y analizado en más de 25 idiomas, por ejemplo, alemán,
italiano, francés, turco y sueco, entre otros.
150
Tabla 1. Ítems correspondientes al PHQ-9.
152
Asimismo, el GAD-7 cuenta con una versión breve denominada GAD-
2. El GAD-2 está compuesto por los ítems 1 y 2 del original (“se ha sentido
nervioso(a), ansioso (a) o con los nervios de punta”; “No ha sido capaz de parar o
controlar su preocupación”). Estos ítems presentan propiedades aceptables para
identificar TAG, los puntajes del GAD-2 oscilan entre 0 y 6, un puntaje de
corte de 3 puntos o más es suficiente para constatar su presencia (Kroenke,
Spitzer, Monahan y Löwe, 207; Kroenke, Spitzer,Williams, Monahan y Löwe,
2007; Plummer, Manea, Trepel y McMillan, 2015).
Tabla 3. Fragmento del PHQ donde contiene los ítems correspondientes al PHQ –PD.
153
Con respecto a la interpretación del PHQ-PD solo basta una respues-
ta positiva de tres de los cinco reactivos correspondientes. De acuerdo a lo
planteado, el PHQ es una herramienta de gran utilidad en el ámbito clínico
e investigativo para detectar de manera rápida y eficaz los desórdenes emocio-
nales de los pacientes. Tanto el PHQ como las subescalas que lo componen
han demostrado sensibilidad y especificidad adecuadas para tal labor. Poder
acceder y saber utilizar estos elementos de screening es de gran utilidad para
el trabajo de los profesionales de la salud.
154
racterizados por síntomas corporales de tensión física y aprensión acerca del
futuro, que afectan la calidad de vida del paciente, sus relaciones sociales y
su funcionamiento cotidiano (por ejemplo, estudiar o trabajar). Dentro de
los trastornos de ansiedad más comunes se encuentran la fobia específica, la
agorafobia, el trastorno de pánico, la ansiedad social y el trastorno de ansiedad
generalizada.
155

Otro inventario popular es el Cuestionario de Miedos (FQ) construido
por Marks y Mathews (1979). Este cuestionario ofrece medidas de agorafobia,
miedo a las heridas y miedo a las situaciones sociales. Los estudios psicomé-
tricos señalan que se trata de una prueba confiable en cuanto a su estabilidad
(estudios de test-retest con valores de .80), y que además ha demostrado ser
sensible a los cambios producidos por tratamientos cognitivo-conductuales
(Echeburúa, 1996).
156
Evaluación de la Agorafobia
Tradicionalmente la agorafobia ha sido definida como “el temor y evi-
tación por estar solo o en lugares públicos”. Las personas con agorafobia ex-
perimentan una ansiedad intensa en situaciones tales como usar el transporte
público, estar en espacios abiertos o en sitios cerrados, estar en una cola o
en medio de una multitud, o bien, estar solos y fuera de su casa. El miedo
marcado por estas situaciones lleva a que las personas que padecen agorafobia
eviten activamente este tipo de situaciones o bien requieran la presencia de un
acompañante (DSM-V, 2016).
Es común que la agorafobia se desarrolle en el curso de un trastorno de
pánico o como consecuencia de ataques de ansiedad, sin embargo, también
puede darse en ausencia de dicho trastorno. La agorafobia genera un deterioro
significativo a nivel social, laboral y en otras áreas importantes de funciona-
miento, afectando sustancialmente la calidad de vida de las personas que la
padecen.
El Inventario de Movilidad (MI, Chambles et al., 1985) es un instru-
mento que consta de 29 ítems que evalúan la severidad de la evitación con-
157
ductual. Este instrumento permite obtener un puntaje que diferencia cuando
la evitación se realiza de manera asilada o bien en compañía de otra persona.
Este es un aspecto de relevancia dado que el comportamiento del agorafóbico
puede diferir notablemente en estas dos circunstancias.
El investigador español Enrique Echeburúa ha desarrollado un Inventa-
rio de Agorafobia que incluye 69 ítems que evalúan diferentes respuestas de an-
siedad (motoras, fisiológicas y cognitivas) cuando la persona está sola o acom-
pañada en diferentes situaciones estimulares (por ejemplo, lugares públicos
o aglomeraciones). Los estudios psicométricos indican adecuados niveles de
consistencia interna (valores alfa superiores a .87), y estudios satisfactorios de
validez convergente con el cuestionario de miedos (Echeburúa et al., 1991).
158
de 45 ítems que evalúan respuestas conductuales, fisiológicas y cognitivas de
ansiedad social. Las personas deben indicar la frecuencia con que experimen-
tan ansiedad en cada una de las situaciones propuestas. A diferencia de otros
instrumentos, este inventario posee una subescala de agorafobia (compuesta
por 13 ítems). El objetivo de la misma es determinar si el malestar social ex-
perimentado se debe a la percepción de sentirse encerrado o por temor a sufrir
un ataque de pánico. La escala cuenta con estudio de estabilidad, estudios de
validez discriminante y evidencias favorables de validez de criterio.
159
generalizada no es lo mismo que una preocupación nrmal. Para el diagnóstico
de este trastorno la preocupación debe ser intensa y excesiva, debiendo tener
una duración mínima de 6 meses. Además, dicha preocupación debe ser causa
de angustia y provocar un deterioro significativo en la vida de la persona.
Probablemente uno de los instrumentos de mayor uso para la evalua-
ción de este trastorno sea el Inventario de Preocupación (PSWQ; Meyer et
al., 1990). Aunque no examina de forma directa los síntomas de la ansiedad
generalizada, si evalúa el síntoma núcleo del trastorno, es decir, las preocupa-
ciones patológicas. Se trata de un instrumento breve (16 ítems) que examinan
el grado de preocupabilidad (por ejemplo, “todo el tiempo estoy preocupado
por algo”). Una amplia variedad de estudios realizados en población clínica y
general corroboran la validez de sus puntuaciones. Asimismo, los estudios de
confiabilidad indican adecuada estabilidad (.93) y consistencia interna (.95).
160
algunos se centran en modelos que se focalizan en el rasgo-estado de ansie-
dad (Cattell y Scheier, 1961), otros se centran en el componente situacional
(Mischel, 1968) o enfatizan la necesidad de un abordaje interactivo (Endler
y Magnunsson, 1974). Asimismo, ciertos modelos proponen una concepción
unitaria de la ansiedad, en contraposición a modelos multidimensionales que
proponen la consideración de respuesta cognitivas, fisiológicas y conductuales
(Lang, 1968).
Un instrumento de amplio uso es el Inventario de Ansiedad Estado-Rasgo,
(STAI; Spielberger, Gorsuch, y Lushene, 1970), el cual ha sido citado en más
de 14.000 estudios (Guillen- Riquelme & Buela-Casal, 2015) y cuenta con
más de 60 adaptaciones (Buela-Casal, Guillén-Riquelme & Seisdedos, 2011).
Las propiedades psicométricas del STAI, han sido examinadas en muestras
españolas y latinoamericanas, mostrando resultados favorables en cuanto a
la consistencia interna, estabilidad y validez de criterio (Guillén-Riquelme y
Buela-Casal, 2014).
Según Spielberger (1972) la ansiedad puede ser conceptualizada como
rasgo y estado. Mientras el estado de ansiedad refiere a un estado emocional
determinado por las circunstancias ambientales o la situación del momento,
el rasgo de ansiedad da cuenta de una respuesta afectiva que tiende a pre-
sentarse con independencia de la situación, más asociada a una característi-
ca de personalidad. Diversos estudios señalan que las personas con elevadas
puntuaciones en la escala de ansiedad-rasgo son más vulnerables al estrés y
responden más intensamente a una amplia variedad de situaciones peligrosas
y amenazantes.
El STAI evalúa la ansiedad estado y la ansiedad rasgo mediante 20 reac-
tivos para cada tipo de ansiedad. Utiliza una escala de respuesta tipo Likert de
cuatro alternativas. En el caso de la ansiedad estado, la escala va de 0 (Nada) a
3 (Mucho), mientras que en la ansiedad rasgo comprende de 0 (Casi nunca)
a 3 (Casi siempre). Tanto en la ansiedad rasgo como en la ansiedad estado,
un porcentaje de los reactivos está invertido y evalúa bienestar o ausencia de
ansiedad, mientras que el resto de los reactivos se refieren a la presencia de
ansiedad (Guillén-Riquelme y Buela-Casal, 2015).
En el contexto español, Miguel-Tobal y Cano-Vindel (1986; 1988;
1994) desarrollaron un inventario centrado específicamente en el modelo
interactivo y multidimensional de la ansiedad: el Inventario de Situaciones
y Respuestas de Ansiedad (ISRA). Estos autores proponen conceptualizar a la
ansiedad como una respuesta emocional compleja (ya que se expresa a través
de un patrón variable de respuestas cognitivas, fisiológicas y motoras) y que se
genera a partir de la interacción de factores individuales y situaciones especí-
ficas (Cano-Vindel y Miguel-Tobal, 1999).
El ISRA es el único instrumento que parte de un modelo interactivo,
desde el cual se deriva la hipótesis de congruencia o diferencial (Endler, 1977;
161
Endler y Kocovski, 2001). Según esta hipótesis existen cuatro rasgos o facetas
de ansiedad (de evaluación, interpersonal, física y ambigua), la intensidad de
una respuesta de ansiedad dependerá de la congruencia entre la faceta y la
situación concreta. De esta forma, es esperable que una persona con rasgos
de ansiedad interpersonal, experimente una mayor respuesta en situaciones
sociales y no en situaciones que impliquen un riesgo físico, como por ejem-
plo, subirse a un avión o ir al dentista. A partir de esta formulación el ISRA
examina cuatro factores de situaciones de ansiedad (de evaluación, interper-
sonales, fóbicas y de la vida cotidiana) que se corresponderían con las cuatro
facetas o rasgos de ansiedad propuestos por Endler (1977). Sumado a ello, el
ISRA examina las respuestas de ansiedad considerando el modelo multidi-
mensional de Lang (1968), que diferencia tres niveles de respuesta: 1) cogniti-
vo (pensamientos de preocupación e inseguridad, p.ej.); 2) motor (conductas
de agitación que interfieren, p.ej.), y 3) fisiológicos: (índices de activación del
sistema nervioso autónomo, p.ej.). Debido a la correlación observada entre las
sub-escalas, los autores proponen la existencia de un factor general de situa-
ciones de ansiedad, y un factor general de respuestas de ansiedad, los cuales se
obtienen de la sumatoria de las sub-escalas.
Diversos estudios psicométricos sustentan que el ISRA es un instrumen-
to útil, válido y confiable tanto en la práctica clínica, como en investigación. El
mismo cuenta con estudios de validez convergente (Miguel Tobal y Cano Vindel,
1986), ha demostrado adecuada capacidad de discriminación entre grupos con
diversos trastornos de ansiedad (Miguel-Tobal y Cano-Vindel, 1995) y ha resul-
tado útil para la valoración de los factores emocionales asociados a diversas pato-
logías en las que la ansiedad juega un papel destacado (Martínez-Sánchez et al.,
1995; Miguel-Tobal, Cano-Vindel, Casado,yEscalona, 1994; Pérez-Pareja, Borrás
y Palmer, 1994). Por otra parte, es sensible para la detección de cambios entre me-
diciones pre y post-tratamiento, siendo adecuado para la evaluación de la eficacia
de intervenciones psicoterapeúticas (Cano-Vindel y Miguel-Tobal, 1999).
Una versión abreviada del ISRA ha sido adaptada al contexto argentino
(Medrano, Moretti, Muñoz-Navarro y Cano-Vindel, 2017). Esta versión, deno-
minada ISRA-B, consta de 24 reactivos para evaluar “Respuestas” de ansiedad y
22 reactivos que evalúan los cuatro tipos de “Situaciones” de ansiedad del ISRA
original. Mediante análisis factorial confirmatorio se corroboró la estructura fac-
torial de la versión original. Además, se verificó la consistencia interna y se obtu-
vieron evidencias satisfactorias de validez externa. Como conclusión, las puntua-
ciones del ISRA-B son válidas y confiables para la evaluación de problemas de
ansiedad en población argentina.
162
Figura 2. Estructura Factorial del Inventario de Situaciones y Respuestas de Ansiedad (IS-
RA-B, adaptado de Medrano et al., 2017)
163
pacidad, y ocupa el primer lugar de prevalencia (10.4%) entre los trastornos
psiquiátricos graves.
Este trastorno se caracteriza por presentar síntomas tales como la tristeza,
pesimismo, perdida generalizada de interés, fatigabilidad, pérdida del apetito,
dificultades e inhibiciones laborales, cambios en el sueño, apetito y psicomo-
tricidad, disminución de la atención, concentración y capacidad para tomar
decisiones, pérdida de la confianza en sí mismo, sentimientos de inferioridad o
inutilidad y culpa, así como de desesperanza, y pensamientos de muerte recu-
rrentes con ideación, planeación y/o actos suicidas (Bas y Andrés, 1996).
La teoría de la depresión de Beck se considera una de las principales
representantes de las explicaciones cognitivas de la depresión. Esta teoría se
basa en un modelo de vulnerabilidad al estrés, en el que se activan esquemas
de pensamiento distorsionado que contribuyen a la forma negativa en que el
individuo percibe, codifica e interpreta de manera negativa la información
sobre sí mismo, sobre el mundo y sobre el futuro, lo cual inicia y mantiene
los síntomas depresivos (Beltrán, Freyre & Hernández, 2012). A partir de esta
explicación surgió el Inventario de Depresión de Beck (BDI por sus siglas en
inglés), para detectar la existencia de síntomas depresivos y su gravedad, en
adolescentes y adultos.
El BDI, desarrollado originalmente por Beck y sus colaboradores en
1961, cuenta con más de 500 estudios publicados que avalan sus propiedades
psicométricas en población clínica y no clínica, así como su uso transcultural
en investigación. Desde su creación, ha recibido revisiones menores, la más
reciente e importante es la que se publicó en 1996, de la cual surge el BDI-II.
Esta versión denominada Beck Depression Inventory—II (BDI-II; Beck, Steer
& Brown, 1996) presenta modificaciones sustanciales con respecto a sus pre-
decesores. Estas modificaciones van encaminadas a conseguir que el BDI-II
cubra todos los criterios diagnósticos sintomáticos de los trastornos depresi-
vos propuestos por el DSM-IV (Sanz, Navarro & Vásquez, 2003).
El BDI-II constituye en el instrumento de auto-informe más utilizado
en las publicaciones científicas sobre depresión, tal como sugiere la revisión
realizada por Sanz (2011). Su relevanca no se circunscribe al ámbito de la
depresión, ya que, en la práctica profesional general, ocupa el tercer lugar
entre los test más utilizados en la práctica clínica española (Estrada, Delgado,
Landero & González, 2014).
Este instrumento involucra 21 ítems, en los cuales se presentan cua-
tro opciones de respuesta en una escala de 0 a 3. Por ejemplo, para medir
pesimismo (ítem 2) se utilizan las opciones de respuesta desde “No me siento
especialmente desanimado de cara al futuro” (puntaje 0) a “El futuro es desespe-
ranzador y las cosas no mejorarán” (puntaje 3). El BDI-II instrumento agrupa
los síntomas depresivos descriptos en el DSM, en tres factores: Cognitivo (e.g.
Autocrítica; Disconformidad con uno mismo), Afectivo (e.g. Tristeza; Perdida
de placer), y Somático (e.g. Llanto; Agitación; Cansancio o fatiga). Asimis-
164
mo, la sumatoria de los ítems permite obtener un puntaje total que indica la
severidad de la depresión.
165
adaptada en Argentina (Mikulic, Casullo, Crespi & Marconi, 2009) que ha
mostrado adecuadas propiedades psicométricas.
166
y diagnóstico oportuno. Las escalas de evaluación de la manía comienzan a
desarrollarse a principios de los años setenta. Inicialmente se trataba de ins-
trumentos extensos y complejos que requerían un tiempo de aplicación pro-
longado. Con el tiempo se han construido herramientas de medición cortas y
de fácil aplicación y procesamiento, llegando incluso al desarrollo de escalas
de autoreporte del estado maníaco (Sánchez-Pedraza y Rosero-Villota, 2003).
Entre los instrumentos clásico en la evaluación de la manía es la Escala
de Evaluación del Estado Maníaco, desarrollada por Beigel, Murphy y Bunney
(1971). Mediante 26 ítems se evalúa la frecuencia e intensidad de síntomas
maníacos. Si bien se trata de un instrumento ágil y de fácil administración, no
cuenta con estudios psicométricos exhaustivos.
167
Evaluación de los Factores de Mantenimiento: Regulación Emocional
e Intolerancia a la Frustración
168
En general, los agentes estresores suelen ejercer un efecto inespecífico
sobre el bienestar psicológico y emocional. Un mismo estresor puede ejercer
efectos diferentes en distintas personas en función de la forma en que esta
afronta los problemas o regula sus emociones. Si una persona pierde su em-
pleo y no logra regular el impacto emocional de este estresor o afrontar el
problema, seguramente desarrollará un cuadro de desesperanza que derive en
una depresión. Por el contrario, si cuenta con un repertorio adecuado de habi-
lidades de regulación emocional o desarrolla conductas efectivas para afrontar
esta problemática, seguramente experimentará malestar emocional por haber
sido despedido, pero no desarrollará un cuadro de depresión.
En este apartado abordaremos tres factores de mantenimiento relevan-
tes para el ámbito clínico, la prevención y promoción de la salud mental: a) la
dificultad en la regulación emocional y las estrategias cognitivas de regulación
emocional, b) meta experiencias emocionales y creencias referidas a la intole-
rancia a la frustración, y c) estrategias de afrontamiento.
169
generales de los propuestos en un primer momento por los autores del instru-
mento (Medrano & Trógolo, 2017). En este sentido, la dificultad en la regu-
lación emocional se agruparía en dos factores, uno referido al Procesamiento
Emocinal, y otro a la Respuesta Emocional.
170
Aunque existe evidencia que sustenta el modelo de nueve factores sub-
yacentes, aún se discute la existencia de factores de orden superior. Uno de
los modelos propuestos sugiere la existencia de dos dimensiones subyacentes:
1) Estrategias Adaptativas (incluye las estrategias de Aceptación, Refocaliza-
ción Positiva, Refocalización en los Planes, Reinterpretación Positiva, y Po-
ner en Perspectiva) y, 2) Estrategias Desadaptativas (incluye las estrategias de
Autoculparse, Rumiación, Catastrofización, y Culpar a otros). Aunque este
modelo ha obtenido evidencia favorable (d’Acremont & Van der Linden,
2007; Domínguez-Sánchez et al., 2011; Jermann et al., 2006), no se cuenta
actualmente con una explicación satisfactoria que justifique teóricamente la
existencia de factores de orden superior. En este marco, Medrano et al. (2016)
han propuesto un agrupamiento de estos factores utilizando como base las
contribuciones de la psicología evolucionista.
Desde el modelo evo-psi se plantea que los seres humanos evoluciona-
ron a partir de la adopción de comportamientos que favorecían su supervi-
vencia (Pinker, 1997). De esta forma, la tendencia a pensar de manera exce-
siva y repetitiva en eventos negativos favoreció la supervivencia de nuestros
antepasados. Por otra parte, durante la historia evolutiva reciente, la especie
humana desarrolló patrones cognitivos más elaborados. Sobre la base de estos
postulados, Medrano et al. (2016) proponen agrupar las estrategias cogniti-
vas de regulación emocional en dos categorías amplias, a) Automáticas, y b)
Elaborativas.
Este modelo sugiere que existirían al menos dos sistemas de procesa-
miento de información relacionados con la amenaza y la seguridad. Un pri-
mer sistema denominado “automático”, se caracterizaría por ser automático,
preconsciente, consumir escasos recursos atencionales, ser rápido y difícil de
regular. La existencia de este sistema se debe a que en algún momento resultó
171
una ventaja evolutiva para la especie, y continúa siéndolo en situaciones de
amenaza o peligro real. De esta manera, procesos cognitivos tales como la
catastrofización y la rumiación permiten maximizar la seguridad y evitar o
manejar toda situación que presente una amenaza inmediata. Sin embargo,
contribuyen a aumentar y mantener las respuestas de ansiedad o alerta del
organismo (Beck y Clark, 1997).
Un segundo sistema de procesamiento denominado “elaborativo” se
caracteriza por ser voluntario, totalmente consciente, consumir altos recur-
sos atencionales y ser lento. Este sistema implica el manejo y la elaboración
consciente de la información, permite realizar un procesamiento más racional
y complejo de la misma, facilitando interpretaciones más realistas y contribu-
yendo a disminuir la intensidad de las respuestas de ansiedad. Dentro de los
procesos cognitivos elaborativos se encontrarían la reinterpretación cognitiva,
la focalización en los planes y la aceptación emocional, entre otros. Así, el
aceptar que el acontecimiento ha ocurrido, encontrar un significado posi-
tivo al evento negativo o tener pensamientos referidos a cómo puede volver
a planificarse la acción que desencadenó el evento negativo, facilitarían una
disminución de la respuesta de ansiedad y aumentarían las probabilidades de
llevar a cabo comportamientos más adaptativos que promuevan el bienestar
psicológico y el crecimiento personal.
De esta forma, a lo largo de nuestra historia evolutiva hemos desarro-
llado procesos cognitivos que nos permiten detectar amenazas y reaccionar
en consecuencia, aumentando así las probabilidades de seguridad y supervi-
vencia del organismo. Procesos como la catastrofización y la rumiación serían
antiguos en términos evolutivos, y por ello involucrarían fundamentalmente
estructuras subcorticales del cerebro, mientras que los procesos elaborativos
más complejos se asentarían sobre estructuras más modernas que involucran
fundamentalmente la neo-corteza (LeDoux, 2012). Esta disposición en el ce-
rebro explicaría por qué algunos procesos cognitivos disfuncionales para la
regulación de emociones se activan de manera automática, y porqué resulta
difícil desactivarlos. Básicamente, se debería a que al involucrar estructuras
sub-corticales se encontrarían en gran medida fuera del control voluntario.
La disposición de dichos sistemas en nuestro cerebro provoca que los
procesos cognitivos automáticos sean más rápidos, intensos y difíciles de re-
gular dado que se ubican a un nivel subcortical. Los fallos en la regulación
cognitiva de las emociones se explicarían sobre la base de este hecho, es decir,
que al ser procesos difíciles de regular muchas personas pueden experimentar
fuertes obstáculos para lograr un procesamiento cognitivo más elaborado y
en consecuencia sucumbir a procesos automáticos tales como la rumiación
y la catastrofización, los cuales aumentarían las respuestas de ansiedad y la
probabilidad de desarrollar trastornos de ansiedad (Gellatly & Beck, 2016;
Jenness, et al., 2016).
172
A partir de este modelo se explicaría con mayor claridad las fallas en los
procesos de regulación emocional. Básicamente, existirían patrones cogniti-
vos automáticos difíciles de inhibir que contribuirían a aumentar la frecuen-
cia e intensidad de un estado emocional negativo. Diversos estudios permiten
visualizar que las estrategias cognitivas de regulación emocional, particular-
mente la rumiación y la catastrofización, se asocian fuertemente con la psico-
patología (Aldao, Nolen-Hoeksema & Schweizer, 2010; Flores-Kanter, Gar-
cía-Batista, Moretti & Medrano, 2018; Potthoff, et al. 2016) mientras que las
estrategias elaborativas están más asociadas al bienestar subjetivo y psicológico
(Balzarotti, Biassoni, Villani, Prunas & Velotti, 2014).
173
representar estas creencias irracionales los ítems de la EIF enfatizan la natura-
leza absolutista de las aseveraciones involucrando tanto una demanda como
una creencia secundaria referida a la frustración (p. ej., “No puedo estar espe-
rando porque no puedo tolerar la espera y bajaría totalmente mi autoestima”,
Medrano, Franco & Mustaca, 2018). La escala inicialmente fue construida
para medir 4 factores: 1) Intolerancia a la incomodidad, refieren a la creencia
de que la vida debería ser fácil, cómoda y libre de problemas; 2) Derechos;
que refleja creencias de que los deseos personales deben ser cumplidos y que
las otras personas deben complacer y no frustrar estos deseos; 3) Intolerancia
emocional; indica intoleranci a la angustia o malestar emocional; y 4) Logro;
son afirmaciones sobre sentimientos de frustración relacionados con una tarea
o un rendimiento óptimo.
Esta escala es mundialmente utilizada y cuentas con validaciones en di-
versos países (véase Medrano et al. 2018). La versión adaptada y validada en
Argentina por Medrano et al. (2018) cuenta con menos ítems (un total de 17),
pero sustentan los factores de la escala original presentando valores de consisten-
cia interna en su mayoría aceptables (α entre .55 y .84). En dicha validación se
verificó también que las dimensiones de la EIF presentaban correlaciones nega-
tivas y estadísticamente significativas con la escala de autoestima de Rosenberg
(r entre -.07 y -.22). Otros estudios han dado cuenta también de la asociación
que estas dimensiones de creencias irracionales mantienen con ciertos trastornos
emocionales, como ser la depresión, la ansiedad, y la ira (Harrington, 2006).

174
Estrategias de Afrontamiento
Las estrategias de afrontamiento se definen como aquellos procesos cog-
nitivos y conductuales en constante cambio que se desarrollan para manejar
las demandas que son evaluadas como desbordantes de los recursos indivi-
duales (Lazarus & Folkman, 1986). Estos modos de afrontamiento tienen el
objetivo principal de reducir la influencia del estrés sobre la persona y regular
las reacciones emocionales ante éstas. Desde este enfoque, las estrategias de
afrontamientos son definidas como aquellos esfuerzos conductuales y cogni-
tivos destinados a hacer frente al estrés y a las demandas específicas del am-
biente. Un aspecto importante a considerar es que estas demandas específicas
son valoradas por las personas como que exceden o desbordan los recursos
personales (Lazarus & Folkman, 1984).
El afrontamiento puede considerarse como un factor estabilizador debi-
do a que facilita el ajuste individual y la adaptación cuando la persona se en-
frenta ante situaciones estresantes. Asimismo, las estrategias de afrontamiento
tienden a frenar, amortiguar y, si es posible, anular los efectos de las situacio-
nes amenazantes (Moran, Landero & González, 2010). Existen una buena
cantidad de estrategias de afrontamiento que un individuo puede desplegar,
y la utilización de una u otra estrategia de afrontamiento va a depender de la
situación en sí, la evaluación cognitiva y el control percibido, las emociones y
la activación fisiológica (Londoño, Henao López, Puerta, Posada, Arango &
Aguirre-Acevedo, 2006; Vázquez, Crespo & Ring, 2000).
En Argentina, Moretti y Medrano (2011) realizaron una adaptación del
Cuestionario de Estrategias de Afrontamiento (COPE). En dicho estudio se
identificaron ocho estrategias de afrontamiento: 1) afrontamiento activo (α=
.86); 2) apoyo social emocional e instrumental (α= .88); 3) negación y des-
conexión conductual (α= .77); 4) consumo de alcohol y drogas (α= .94); 5)
religión (α= .91); 6) humor (α= .84); 7) aceptación y refrenar el afrontamien-
to (α= .69); 8) centrarse en las emocionarse y desconexión mental (α= .72).
A grandes rasgos las estrategias de afrontamiento podrían agruparse en
dos categorías generales: Afrontamiento centrado en el problema vs. Afron-
tamiento centrado en la emoción. El afrontamiento centrado en el problema
parace más apropiado en casos de estrés controlable (por ejemplo, rendir un
examen o invitar a salur a una persona), mientras que el afrontamiento cen-
trado en la emoción parace más adecuado para estrés que se percibe como
no controlable (por ejemplo, verse expuesto a una enfermedad o un desastre
natural). No obstante, algunas estrategias centrada en la emoción pueden ser
disfuncionales, tal es el caso el consumo de sustancias o algunas forma de
evasión emocional (por ejemplo, evitar una situación de examen). A conti-
nuación se presentan los ítems del COPE.
175

176
Evaluación del Bienestar subjetivo: delimitación conceptual e instru-
mentos para su medición
177
Figura 2. Estructura del Bienestar: Factores Cognitivos y Afectivos.
178
Asigne 1 si está muy en desacuerdo y 7 muy de acuerdo. Recuerde que usted
Nivel de acuerdo
tiene la posibilidad de responder con toda la escala del 1 al 7.
Las situaciones son las siguientes: 1 2 3 4 5 6 7
1. “…La mayoría de los aspectos de mi vida es como quiero que sea...”
2. “…En general, estoy satisfecho con mi vida...”
3. “…Hasta ahora he obtenido las cosas importantes que quiero en la vida...”
4. “…Si pudiera vivir mi vida de nuevo, me gustaría que todo volviese a ser
igual...”
5. “…Las circunstancias de mi vida son buenas…”
179

Localmente se han llevado una serie de estudios tanto exploratorios
como confirmatorios de la escala que corroboran esta estructura del afecto
(Flores-Kanter & Medrano, 2016; Medrano, Flores-Kanter, Trógolo, Cura-
rello & Gonzales , 2015). Estos resultados se corresponde con las evidencias
tomadas de las neurociencias las cuales se han identificado neuroanatómica-
mente ciertas estructuras cerebrales más ligadas a estos factores comunes de
Afectividad Negativa y de Afectividad Positiva. En el caso del Afecto Nega-
tivo, una de estas estructuras es la amígdala, la cual ha demostrado activarse
preferentemente al experimentar afectos negativos. Para el caso del Afecto
Positivo la estructura involucrada es el núcleo accumbens, identificado como
el sistema de recompensa y placer.
En la práctica clínica, la comprensión de los componentes involucrados
en la promoción del bienestar del paciente es un tema fundamental para el
diseño y posterior tratamiento. Por ejemplo, en el caso de un tratamiento clí-
nico, se pueden dividir las intervenciones del tratamiento enfocando los tres
componentes del bienestar. Por un lado, se puede trabajar sobre la promoción
de afectos positivos, mediante diferentes técnicas como por ejemplo la activa-
ción conductual. Por otro lado, podemos aumentar la tolerancia a los afectos
o emociones negativas del paciente dotándolo de herramientas que le permi-
tan lidiar con situaciones estresantes de manera más funcional. Por último,
podemos diseñar intervenciones enfocadas en la reinterpretación positiva de
su situación de vida para centrarnos en el componente cognitivo del bienestar
subjetivo del paciente.
Como vemos, las intervenciones en la terapia dependen en gran me-
dida del conocimiento que tengamos sobre los componentes que creamos
convenientes promover en el paciente. Para ello debemos seguir estudiando e
investigando las características de los constructos trabajados por la psicología
positiva.
180
positivo y las teorías del ciclo vital. Según la autora el nivel de bienestar ten-
dría importantes variaciones según la edad, la cultura y el sexoría propuesta
por la autora contempla seis dimensiones: 1) una apreciación de sí mismo;
2) la capacidad para manejar de forma efectiva el medio y la propia vida; 3)
la alta calidad de los vínculos personales; 4) la creencia de que la vida tiene
propósito y significado; 5) el sentimiento de que cada uno va creciendo y de-
sarrollándose a lo largo de la vida, la aceptación del paso de los años; y 6) el
sentido de autodeterminación.
En nuestro país, la autora María Martina Casullo ha desarrollado un
instrumento de medición basado en las propuestas teóricas de Ryff. El instru-
mento consta de 13 sentencias o frases que se agrupan en las siguientes cuatro
dimensiones (ver ejemplo de ítems tabla 6): Control; Vínculos; Proyectos; y
Aceptación. Cada una de las frases se responde en un formato de Likert con 3
opciones de respuesta (De acuerdo, ni acuerdo ni desacuerdo, en desacuerdo).
Consideraciones Finales
181
mún que facilita la comunicación acerca de los trastornos psicológicos y dan
información útil a la hora de tomar decisiones con respecto a un tratamiento.
No obstante, estas categorías deben ser utilizadas como información prelimi-
nar. Para lograr un adecuado tratamiento se requiere un abordaje ideográfico
que contemple las especificidades, características y circunstancias únicas de
cada paciente. Tal como se señaló a lo largo del capítulo, el uso de las pruebas
psicométricas debe insertarse dentro de un proceso de evaluación clínica más
amplio que involucra una formulación precisa del caso, contemplando los
factores que en cada paciente en particular generan y mantienen sus proble-
mas psicoemocionales,
182
|
Evaluación Psicométrica en Psicología Organizacional
Mario Trógolo, Carlos Spontón, Estanislao Castellano, María Alejandra
Pujol y Leonardo Medrano
Introducción
183
El uso de Pruebas Psicométricas en la Psicología Organizacional
184
alternativa es el uso de instrumentos que contemplen escalas que analicen la
sinceridad de las respuestas. Por ejemplo, la Escala L del MMPI-II contienen
ítems que permiten evaluar el grado de franqueza al responder el inventario y
proporciona información sobre la tendencia a cubrir las fallas personales a fin
de brindar una imagen más ajustada socialmente. Así puntuaciones elevadas
se encuentran asociados a sujetos que intentan brindar una impresión favora-
ble de sí mismo (Casullo, 1999).
Otra particularidad de la evaluación en el contexto organizacional re-
fiere a la vinculación del psicólogo con la organización. El hecho de realizar
evaluaciones y pertenecer a la misma organización puede condicionar el cum-
plimiento de los requerimientos que permiten una evaluación ética. Según
Carvajal (2007), muchos psicólogos se alejan de los parámetros establecidos
en cuanto a las normas estipuladas para el buen uso e interpretación de tests
psicométricos, y actúan a partir de otras lógicas como las urgencias de las or-
ganizaciones o pedidos de clientes que requieren se administre un test particu-
lar. Un aspecto especialmente problemático es el caso de psicólogos que deben
evaluar a sus propios compañeros de trabajo, como, por ejemplo, superiores,
subordinados o colegas. Todos esos eventos pueden afectar su objetividad y
generar sesgos en el proceso de medición.
185
Evaluación del Estrés Laboral y el Burnout
Durante las últimas décadas los procesos de globalización, desregula-
ción del mercado laboral provocaron cambios sustanciales en las condicio-
nes de trabajo, caracterizadas por mayores exigencias de calidad y producti-
vidad, aumento de la presión temporal y de la sobrecarga laboral, así como
por nuevas formas de contratación y remuneración que colocan al trabajador
en condiciones de indefensión ante muchos abusos (Schaufeli, Leiter & Mas-
lach, 2009). Asimismo, los cambios generados por la introducción de nuevas
tecnologías en las organizaciones plantean nuevos retos que producen, en al-
gunos casos, consecuencias sobre la salud de las personas (Salanova, 2003).
Como resultado de ello, los problemas relacionados con el estrés laboral se
extendieron rápidamente en las organizaciones, particularmente el burnout
(Carod-Artal & Vázquez-Cabrera, 2013).
El burnout, conocido también en la literatura hispana como “síndrome
de desgaste profesional” o “síndrome de quemarse por el trabajo”, fue defini-
do inicialmente por Maslach y Jackson (1986) como un síndrome caracteri-
zado por agotamiento emocional (sentimiento de no dar más de sí, a causa
de las demandas interpersonales que surgen en el trabajo con las personas),
despersonalización (actitudes negativas y de distanciamiento hacia las perso-
nas destinatarias del trabajo) y baja realización personal (tendencia a evaluar
negativamente las propias competencias y logros en el trabajo), que puede
ocurrir en cualquier individuo que trabaja con personas de alguna manera.
De este modo, se consideraba que sólo los profesionales y grupos ocupacio-
nales que trabajan en contacto con personas eran susceptibles de desarrollar
burnout. No obstante, con el tiempo diferentes investigaciones pusieron de
manifiesto que el burnout puede producirse en una gran variedad de profesio-
nes y ocupaciones, no sólo en aquellas dedicadas a trabajos “de contacto” con
personas, reconociéndose así su carácter transprofesional (Grau, Flichtentrei,
Suñer, Prats & Braga, 2009).
Como consecuencia directa de lo anterior, el concepto de burnout fue
evolucionando y redefiniéndose de manera más amplia como un estado men-
tal negativo, relacionado con el trabajo, que ocurre en personas normales y
que se caracteriza por síntomas de agotamiento, cinismo e ineficacia profesio-
nal (Schaufeli, Leiter, Maslach & Jackson, 1996). De esta manera, se concibe
como un fenómeno relacionado con el trabajo en general y no sólo en relación
con los trabajos que suponen un contacto directo con personas. Comple-
mentariamente, los componentes del burnout fueron ligeramente reformu-
lados con el objeto de hacerlos extensivos a las distintas ocupaciones. Así, el
agotamiento se define como la fatiga producida por el esfuerzo psicológico
que se realiza en el trabajo, sin hacer referencia explícita a si la causa de este
estado son las relaciones con las personas o el trabajo en general. El cinismo,
a diferencia de la antigua dimensión de despersonalización, engloba actitudes
186
de indiferencia y distanciamiento hacia el trabajo en un sentido amplio, y no
sólo hacia las personas para y con las que se trabaja. Finalmente, la ineficacia
profesional refiere a la tendencia a evaluar negativamente las propias habilida-
des para realizar con eficacia el trabajo, incluyendo tanto los aspectos sociales
como no sociales de éste (Schaufeli & Salanova, 2007).
Si bien este concepto constituye la definición más utilizada (Maslach,
Schaufeli & Leiter, 2001), la conceptualización del burnout ha sido y conti-
núa siendo objeto de debate, especialmente sus dimensiones o componentes
(Schaufeli & Taris, 2005). Así, mientras que existe consenso en considerar al
agotamiento y el cinismo como los factores centrales o el “corazón” del bur-
nout (Halbesleben & Demerouti, 2005), no existe acuerdo en torno al papel
desempeñado por la ineficacia laboral. En este sentido, se ha sugerido que la
ineficacia laboral representaría un precursor del burnout (Ventura, Salanova
& Llorens, 2015), una consecuencia de éste (Schaufeli & De Witte, 2017a),
o una variable que modula la influencia de los estresores laborales sobre el
desarrollo del burnout (Gil-Monte, García-Juesas & Hernández, 2008). Por
lo tanto, se ha cuestionado fuertemente el papel de este factor como un com-
ponente genuino del burnout.
El creciente interés en el estudio y la medición del burnout se ha visto
reflejado en el desarrollo de numerosos instrumentos, como el Burnout Mea-
sure (BM; Pines & Aronson, 1988), el Oldenburg Burnout Inventory (OLBI;
Halbesleben & Demerouti, 2005), el Copenhagen Burnout Inventory (CBI;
Kristensen, Borritz, Villadsen & Christensen, 2005), el Cuestionario para la
Evaluación del Síndrome de Quemarse por el Trabajo (CESQT; Gil-Monte et
al., 2006), y el Maslach Burnout Inventory (MBI; Maslach & Jackson, 1986),
que cuenta con diferentes versiones, incluyendo una genérica (MBI-GS; Mas-
lach Burnout Inventory- General Survey) que puede ser aplicada a trabajadores
de cualquier profesión u ocupación, independientemente de las tareas espe-
cíficas que desarrollen (Schaufeli et al., 1996). De todos los instrumentos
disponibles, ha sido el MBI-GS el instrumento más utilizado, probablemente
debido a su alcance y cualidades psicométricas.
En su propuesta original, el MBI-GS consta de 16 ítems que evalúan las
tres dimensiones teóricas del burnout propuestas por Maslach: agotamiento,
cinismo e ineficacia profesional. No obstante, investigaciones posteriores del
MBI-GS en distintos países no obtuvieron apoyo empica ineficacia profesio-
nal (Langballe et al., 2006). De manera similar, en un estudio llevado a cabo
en Argentina (Spontón, Trógolo, Medrano & Castellano, 2018) se observó,
mediante análisis factorial confirmatorio, que la estructura teórica que mejor
representa el burnout consiste de dos factores compuestos por agotamiento
y cinismo (Tabla 1). En síntesis, la evidencia obtenida en diferentes estudios
sugiere, en consonancia con algunas propuestas recientes (Schaufeli, Maslach
& Marek, 2017), que sería más apropiado conceptualizar el burnout como un
síndrome bidimensional conformado por síntomas de agotamiento y cinismo.
187
Tabla 1. Instrucciones, formato de respuesta e ítems de la versión Argentina del MBI-GS
188
tración plena en el trabajo, al punto tal de que se experimenta la sensación
de que el tiempo “pasa volando”, y se tiene dificultades para desconectarse
debido al alto grado de disfrute y concentración en la tarea (Salanova & Llo-
rens, 2008). Pese a esta definición general, se suele considerar al vigor y la
dedicación como las dimensiones más importantes, mientras que se ha puesto
en duda al tercer factor como una dimensión del engagement (Taris, Schaufeli
& Shimazu, 2009).
Inicialmente, el engagement fue concebido como un constructo teórico
opuesto al burnout. De esta manera, mientras que engagement se caracteriza
por altos niveles de energía (vigor) y una fuerte identificación con el trabajo
(dedicación), el burnout se caracteriza, por el contrario, por bajos niveles de
energía (agotamiento) junto con una falta de identificación (cinismo) con el
propio trabajo (Maslach & Leiter, 1997). Desde esta perspectiva, el engage-
ment y el burnout constituyen polos opuestos de un continuo, donde la pre-
sencia de uno implica la ausencia de otro (Figura 1). En consecuencia, Mas-
lach y Leiter (1997) propusieron que ambas experiencias podían ser medidas
a través de las escalas del MBI, en las que puntajes altos correspondía a “bur-
nout”, mientras que el patrón de puntajes opuestos indicaría “engagement”.
Por el contrario, Schaufeli, Salanova, Gonzalez-Roma y Bakker (2002)
conceptualizaron el engagement como una experiencia psicológica cualitati-
vamente distinta del burnout. Así definido, más que el complemento opuesto
a burnout, el engagement representaría una experiencia particular, relativa-
mente independiente (Schaufeli & Bakker, 2004). Por lo tanto, la ausencia de
burnout en los trabajadores no presupone la existencia de una alta vinculación
positiva (engagement) con el trabajo. De igual modo, la ausencia de engage-
ment no implica, necesariamente, estar quemado o burned-out (Figura 1). La
evidencia científica acumulada a través de diferentes estudios parece indicar
que el engagement y el burnout constituyen constructos psicológicos inde-
pendientes, más que opuestos, aunque no totalmente independientes debido
a las relaciones negativas entre uno y otro (Cole, Walter, Bedeian & O’Boyle,
2012; Crawford, LePine & Rich, 2010). Por este motivo, tal vez la mejor
manera de definir al engagement es considerarlo como una experiencia “ni
completamente opuesta, ni completamente independiente” (Schaufeli & De
Witte, 2017b, p. 58) al burnout.
189

190
A continuación, le preguntamos sobre algunas cuestiones referentes a
sus sentimientos en el trabajo. Indiqué con qué frecuencia se siente de la
manera descrita, utilizando la siguiente escala de respuesta:
Siempre /
Nunca Casi nunca Raramente Algunas veces Bastante Con frecuencia
Casi siempre
0 1 2 3 4 5 6
191
Aunque la evaluación con fines de selección es la que ha concentrado el
mayor número de prácticas (Albajari y Mames, 2005), es importante subra-
yar que la medición es pertinente a todos los procesos de gestión de recursos
humanos en los que se requiera medir una variable psicológica (Martinez M.,
2011). Para Cohen y Swerdlik (2006) no sólo se utilizan técnicas de evalua-
ción en selección de personal sino también en otros procesos y para otros
objetivos en el lugar de trabajo. Son variados los usos de esas herramientas
con referencia a pruebas de capacidad cognitiva, productividad, motivación,
agotamiento, satisfacción, compromiso laboral y cultura organizacional.
Los constructos psicológicos evaluados en este contexto son en algunos
casos generales y típicos de taxonomías tradicionales, y en otros, constituyen
rasgos de interés propios de un campo laboral determinado (Aguilar, 2010).
Siguiendo a Albajari y Mames (2005), es posible clasificar las variables en dos
grandes grupos: a) habilidades entre las que se encuentran, por ejemplo, la
memoria, velocidad de ejecución, precisión, capacidad de organización y pla-
nificación, atención, concentración, tipo de pensamiento, habilidad verbal,
nivel intelectual y tipo de pensamiento y; b) variables de personalidad, donde
se consideran por ejemplo, la autonomía, capacidad de liderazgo, control de
impulsos, capacidad de adaptación, creatividad, motivación, relación con la
autoridad, tolerancia a la frustración, relaciones interpersonales, tolerancia
al estrés y trabajo en equipo. En este apartado realizaremos hincapié en dos
variables: evaluación del liderazgo y evaluación de la personalidad.
192
ganizaciones. Si bien este enfoque es muy utilizado, ha sido objeto de críticas
al no tener en cuenta ni a los seguidores ni a la situación. Al mismo tiempo,
no existe entre los defensores del enfoque un acuerdo acerca de cuáles serían
los rasgos hacen de una persona un líder eficaz (Castro Solano, 2007).
Por su parte, desde el enfoque conductual el liderazgo es entendido como
un conjunto de comportamientos específicos (Hunt & Larson, 1977). De
manera general, las investigaciones bajo este enfoque han permitido identifi-
car cuatro comportamientos característicos en los líderes, que posteriormente
fueron reducidos a dos: consideración e iniciación de estructura. La conside-
ración son conductas que tienen como fin el mantenimiento o la mejora de
las relaciones entre el líder y los seguidores. Incluyen el respeto, la confianza, y
la creación de un clima de camaradería. En cambio, la iniciación de estructura
comprende conductas orientadas a la consecución de la tarea e incluyen actos
tales como organizar el trabajo, dar estructura al contexto laboral, definir roles
y obligaciones, entre otros. Los resultados desde este enfoque han sido incon-
sistentes, básicamente por el criterio utilizado para determinar la efectividad
de los líderes. En algunos casos un líder con una fuerte orientación a la tarea
era mejor que uno que se preocupaba por los subalternos, y a la inversa (Yukl,
2002). Por otra parte, el énfasis en el análisis de las conductas de los líderes
ha llevado a desestimar la importancia de otras variables, como las diferentes
situaciones o contextos en que las conductas de los líderes resultan eficaces.
Como resultado de lo anterior surge el enfoque situacional del liderazgo
(Hersey & Blanchard, 1993). El supuesto básico de este enfoque es que di-
ferentes patrones de conductas pueden ser efectivos en diferentes situaciones
pero que una misma conducta no es óptima para todas ellas. De esta manera,
un líder eficaz es aquel que adapta su estilo de liderazgo según la situación
para que sus acciones resulten efectivas. Por consiguiente, los modelos situa-
cionales enfatizan la flexibilidad del proceso de liderar, de modo de ajustar las
propias conductas a los requerimientos de la situación y de las características
de los subordinados. A pesar del auge de las teorías propuestas dentro de este
enfoque y de su utilización en programas de entrenamiento en organizacio-
nes, no existen estudios que hayan probado su eficacia (Graeff, 1997) y no
toma en cuenta otras variables mediadoras entre las conductas de los líderes
y de los seguidores, tales como el nivel de estudios, educación, experiencia y
edad (Northouse, 2004).
Finalmente, se destacan los enfoques basados en el procesamiento de la
información (Lord, Foti & De Vader, 1984), desde los cuales se intenta ana-
lizar el papel que juegan las percepciones y las teorías implícitas de los líde-
res y seguidores en el proceso de liderazgo, reconociendo al mismo tiempo
la importancia del contexto en el que éstas surgen. Desde este enfoque, se
asume que tanto los líderes como los seguidores poseen ciertos estereotipos
o creencias acerca de cuáles son las conductas esperadas de una persona para
que ésta sea considerada líder (Wofford, Godwin & Wittington, 1998). Las
193
teorías implícitas de liderazgo definen las creencias acerca de cómo los líderes
se tienen que comportar para ser considerados como tales y qué se espera de
ellos (Mumford, Zaccaro, Hardin, Jacobs & Fleishman, 2000).
A pesar de sus limitaciones, los diferentes enfoques sobre el liderazgo
contribuyeron a ampliar el término de liderazgo, dando origen a nuevas teo-
rías que destacan la interacción diádica líder y seguidor/colaborador (Cruz-
Ortiz, Salanova & Martínez, 2013). Así, mientras que en un principio la
investigación se centró en estudiar la figura del líder desde una perspectiva
individual –ya sea desde el análisis de los rasgos o las conductas-, las perspec-
tivas actuales en el estudio del liderazgo se centran no sólo en el líder, sino
también en los seguidores, compañeros, supervisores, entorno/contexto y la
cultura. De este modo, el liderazgo ya no es simplemente considerado como
una característica individual, sino más bien como una diada compartida de
relación, y una dinámica social estratégica, global y compleja (Avolio, Walum-
bwa & Weber, 2009).
Es así que actualmente se define al liderazgo como un proceso de in-
fluencia sobre otros con el propósito de lograr determinados objetivos (Yukl,
2002). Al ser conceptualizado como proceso, el liderazgo no es solamente un
rasgo que reside en la figura del líder. Más bien, el líder influye y es influido
por sus seguidores, mediante un proceso dinámico y recíproco. Esta influen-
cia se produce exclusivamente en un contexto grupal, siendo así un fenómeno
social. Finalmente, la influencia del líder involucra objetivos o metas; en efec-
to, el liderazgo no ocurre en el vacío, sino que el líder fija objetivos o metas en
común, y la relación con los seguidores se establece en función de estas metas
(Castro Solano, 2007)
Dentro de esta perspectiva, uno de los enfoques que mayor número de
investigaciones ha generado es la teoría de los Estilos de Liderazgo propuesto por
Bass (1985). Basándose en los estudios de House (1977) y Burns (1978) acerca
del liderazgo carismático y transformacional, Bass propuso una teoría sobre el
liderazgo que toma en cuenta tanto los rasgos y conductas del líder como las
variables situacionales, dando lugar así a una perspectiva más integradora que los
enfoques descritos (Yukl & Van Fleet, 1992).
Uno de los estilos de liderazgo que propone la teoría es el liderazgo trans-
formacional, definido como aquel que produce cambios en sus seguidores a partir
de concientizarlos acerca de la importancia y el valor que revisten los resultados
obtenidos tras realizar las tareas asignadas, incitándolos a que trasciendan sus in-
tereses personales en virtud de los objetivos de la organización (Bass, 1985). De
acuerdo con este autor, existen cuatro características que definen a este estilo lide-
razgo: el carisma (los líderes transformacionales se proponen como ejemplos a
seguir), la inspiración (proveen significado a las acciones de sus subordinados),
la estimulación intelectual (alientan la búsqueda de soluciones alternativas a
problemas cotidianos) y la consideración individualizada de los trabajadores
194
(suelen preocuparse por las necesidades individuales de sus subordinados).
195
En Argentina, Castro Solano, Nader y Casullo (2004) desarrollaron el
Cuestionario de Estilos de Liderazgo (CELID) basado en la teoría propuesta
por Bass. Este cuestionario cuenta con 34 ítems que evalúan los diferentes
estilos de liderazgo (transformacional, transaccional, laissez faire) y las dimen-
siones que lo componen, permitiendo obtener una puntuación para cada una
de ellas y un puntaje global correspondiente a cada estilo. Los autores elabo-
raron dos versiones del CELID: el CELID-S y el CELID-A. En la primera
versión, el empleado/subordinado debe responder en qué medida percibe que
cada uno de los comportamientos descritos se ajustan a los comportamientos
de su superior o jefe. En cambio, en la segunda modalidad es el jefe/superior
quien responde, indicando en qué medida los comportamientos se ajustan a
su estilo de liderar (Tabla 3)
3. Ejemplos
Tabla 3. Ejemplosde
deÍtems
Ítemsdel
delCELID
CELID (Versión S)

CUESTIONARIO DE ESTILOS DE LIDERAZGO
(CELID – S)
Protocolo de Administración
Instrucciones: A continuación, hay una serie de afirmaciones acerca del li-
derazgo y del acto de liderar. Por favor, indique cuánto se ajusta cada una de ellas
al estilo de liderar que usted percibe en su SUPERIOR. 1 indica: Total desacuer-
do con la afirmación, 5 indica: Total acuerdo con la afirmación y 3 es intermedio
(Ni de acuerdo ni en desacuerdo).
1 2 3 4 5
1. Su presencia tiene poco efecto en nuestro rendimien-
to
2. No trata de cambiar lo que hacemos mientras las
cosas salgan bien
3. Nos sentimos orgullosos de trabajar con él.
4. Pone especial énfasis en la resolución cuidadosa de
los problemas antes de actuar
5. Evita involucrarse en nuestro trabajo
6. No nos dice en donde se sitúa en algunas ocasiones
7. Demuestra que cree firmemente en el dicho “si fun-
ciona, no lo arregles”
8. Nos da lo que queremos a cambio de recibir nuestro
apoyo
9. Evita intervenir, excepto cuando no se consiguen los
objetivos
10. Se asegura que exista un fuerte acuerdo entre lo que
se espera que hagamos y lo que podemos obtener por
nuestro propio esfuerzo
Evaluación de la Personalidad
Un aspecto tradicionalmente evaluado en el campo organizacional son
las diferencias individuales relacionadas con la personalidad, especialmente en
el contexto de selección de personal (García Izquierdo, García Izquierdo &
Ramos Villagrasa, 2007). En esencia, las investigaciones han mostrado con-
sistentemente una notable capacidad predictiva de esta variable sobre diversos
comportamientos organizacionales (Lievens, Highhouse & De Corte, 2005;
Ones, Viswesvaran & Dilchert, 2005) y, en particular, sobre el desempeño
desde la selección del personal (Barrick & Mount, 1991; Salgado, 2003).
Actualmente, existen numerosas teorías y modelos que se han pro-
puesto con el objetivo de describir la estructura básica de la personalidad
humana. Entre los modelos más relevantes se encuentran el modelo psico-
biológico de Eysenck (Eysenck, 1991), el modelo de siete factores de Clonin-
ger (Cloninger, Przybeck, Svrakic & Wetzel, 1994), el modelo de los cinco
197
factores o Cinco Grandes (Costa & McCrae, 1992), y el modelo de los Cinco
Factores Alternativos de Zuckerman (Zuckerman, Kuhlman, Joireman, Teta
& Kraft, 1993). De todos éstos, el modelo de los Cinco Grandes representa
la taxonomía más aceptada de los rasgos de personalidad (Sanz, Avia & Sil-
va, 1999) y la más utilizada en el contexto laboral (Salgado, 2005), siendo
avalada por diferentes estudios transculturales (McCrae, Costa, del Pilar, Ro-
lland & Parker, 1998; Salgado, Moscoso & Lado, 2003) que demuestran la
generalización de los rasgos propuestos por el modelo en diferentes culturas y
poblaciones.
De acuerdo con los autores de este modelo, existen cinco dimensiones
bipolares que conforman los rasgos básicos de la personalidad: (1) extraversión
(opuesto a la introversión), (2) neuroticismo/inestabilidad emocional (opuesto
a la estabilidad emocional), (3) amabilidad (opuesto a la hostilidad), (4) res-
ponsabilidad (opuesto a la irresponsabilidad), y (5) apertura a la experiencia
(opuesto a la falta de apertura a la experiencia). A la fecha, se han generado
diferentes instrumentos sobre la base del modelo de los cinco grandes facto-
res: el Inventario de personalidad (NEO-PI; Costa & McCrae, 1985), que
cuenta con una versión revisada (NEO-PI-R; Costa & McCrae, 1992) y una
versión abreviada (NEO-FFI; Costa & McCrae, 1999), y el Cuestionario de
Personalidad IPIP-FFM de Goldberg (Goldberg, 1999).
El Cuestionario de Personalidad IPIP-FFM comprende 50 ítems cons-
truidos para medir los cinco grandes factores de personalidad. Cada ítem se
encuentra redactado en forma de frase que describe comportamientos típicos
de las personas, donde se solicita al sujeto que evalúe el grado con que cada
afirmación lo describe, utilizando na escala con cinco opciones de respuesta,
desde 1 (muy en desacuerdo con esta descripción de mí mismo) hasta 5 (muy de
acuerdo con esta descripción de mí mismo) (Tabla 4). En nuestro país, Cupani
(2009) llevó a cabo estudios de validación del IPIP-FFM en pre-adolescentes,
reportando una adecuada estructura factorial, valores de consistencia interna
satisfactorios (coeficientes alfa de Cronbach entre .77 y .84) y evidencia de
validez convergente con el Cuestionario de Cinco Factores para Niños (Bar-
baranelli, Caprara, Rabasca & Pastorelli, 2003) Las buenas propiedades del
IPIP-FFM fueron confirmadas en un estudio posterior sobre una muestra
amplia de individuos de la población general (Gross, Zalazar-Jaime, Piccolo
& Cupani, 2012), representando de esta manera una alternativa válida para la
medición de los cinco grandes factores en la población local.
Ofendo a la gente.
198
Pongo atención en los detalles.
Me preocupo demasiado.
Deseabilidad Social
A pesar de la eficacia de las medidas de personalidad para predecir di-
ferentes comportamientos organizacionales (Barrick, Mount & Judge, 2001;
Hogan & Holland, 2003), su utilización en este ámbito no está exenta de pro-
blemas. En concreto, se ha sugerido que las personas podrían estar motivadas
a distorsionar sus respuestas con el objetivo de brindar una imagen favorable
de sí mismos, particularmente en aquellas situaciones donde las respuestas en
los cuestionarios de personalidad tienen consecuencias importantes para las
personas que responden, como ocurre en los procesos de selección de personal
(Salgado, 2005).
La tendencia de los individuos a distorsionar las respuestas en los cues-
tionarios con el objetivo de proyectar una imagen favorable de sí mismos, se
conoce como deseabilidad social (Paulhus, 1984). El problema de la deseabi-
lidad social en las medidas de personalidad ha sido extensamente analizado
en el contexto de selección de personal. Las investigaciones realizadas han de-
mostrado repetidamente que los puntajes en las escalas de personalidad de los
solicitantes difieren significativamente de las puntuaciones que obtienen las
personas que los completan de forma voluntaria como, por ejemplo, personas
que actualmente ocupan esos empleos o personas que participan en volun-
tariamente en una investigación (Birkeland, Manson, Kisamore, Brannick y
199
Smith, 2006; Hough, 1998). En concreto, Sanz y García-Vera (2009) com-
pararon las respuestas de una muestra de candidatos que participaban en un
proceso de selección de personal con las respuestas de sujetos que participa-
ron voluntariamente. Hallaron puntajes más altos en extraversión, apertura,
amabilidad y -especialmente- responsabilidad, y puntajes más bajos en neu-
roticismo en los candidatos. Los autores concluyeron que el principal efecto
de la deseabilidad social consiste en aumentar las puntuaciones en aquellos
aspectos de la personalidad que están (o que los candidatos creen que están)
positivamente relacionados con el desempeño laboral, y en reducir los pun-
tajes en aquellos aspectos de la personalidad que están (o que los candidatos
creen que están) asociados negativamente con el desempeño.
Debido a esto, es dable suponer que la validez de los cuestionarios o in-
ventarios de personalidad se encuentren seriamente limitados en los procesos
de selección de personal. En otras palabras, la utilidad predictiva de las medi-
das de personalidad podría verse afectada negativamente, o incluso anulada,
debido a los efectos de deseabilidad social (Goffin & Christiansen, 2003). No
obstante, estudios que analizan el sesgo de deseabilidad social mostraron que,
tras controlar los efectos de la deseabilidad social, las medidas de personalidad
mantienen su capacidad predictiva sobre diferentes variables como la satisfac-
ción laboral y el compromiso organizacional (Ones & Viswesvaran, 1998).
Estos resultados respaldan la utilidad de los cuestionarios de personalidad
para la evaluación con fines de selección.
Con todo, el control y la detección del sesgo de deseabilidad social con-
tinúa siendo un problema importante. Al respecto, se han desarrollado distin-
tas estrategias aunque dos de ellas han demostrado ser efectivas: (a) informar a
los evaluados de que se examinarán sus respuestas en relación con la deseabili-
dad social y que la existencia de distorsiones tendrá consecuencias negativas, y
(b) crear baremos específicos a partir de muestras de candidatos o de personas
que contestan a las medidas de personalidad en contextos que puedan suscitar
deseabilidad social (e.g., selección de personal o promoción; Salgado, 2005).
Por otra parte, se ha comprobado que ciertas escalas del MMPI-2 pueden
ser útiles para la detección de patrones de respuesta de simulación y engaño
en contextos de selección de personal (Rosario-Hernández, Rovira, Álvarez
& Rodríguez, 2007). Por lo tanto, una alternativa útil podría consistir en
complementar la aplicación de las medidas de personalidad con estas escalas.
Finalmente, existen algunas propuestas metodológicas recientes basadas en el
uso de pruebas implícitas para evaluar la personalidad (qIAT; Yovel & Fried-
man, 2013) que resultan prometedoras, aunque se requiere de investigaciones
que examinen la validez incremental respecto de las medidas tradicionales de
personalidad, en el contexto de selección.
200
Consideraciones Finales
201
de los instrumentos. Finalmente, resta por recordar que los test contribuyen
a la toma de decisiones, no las dirigen (Muchinsky, 2002), por lo que es clave
no sobrevalorarlos, ni subestimarlas, sino utilizar aquellas pruebas debida-
mente calificadas en cuanto a sus propiedades psicométricas ya que, en parte,
a partir de ellas se tomarán decisiones importantes sobre la vida de las perso-
nas (Muñiz et al., 2015).
202
|
Pruebas Psicométricas en la Evaluación
Neuropsicológica
Alberto Luis Fernández
Introducción
203
Feldman, 2007; Salmon & Bondi, 2009) como así también en casos de niños
con dificultades del aprendizaje (dislexia, discalculia, disgrafia) o Trastorno
por Déficit de Atención e Hiperactividad (Semrud-Clikeman, 2005; Silver et
al. 2006). Finalmente, la utilización de esta herramienta en los casos de perso-
nas que padecen trastornos psiquiátricos también ha sido muy útil. La Tabla
1 resume todos los casos en los que la EN puede resultar de utilidad.
Traumatismos de cráneo
Heridas abiertas (balas, hierros, cuchillos, etc.)
Accidente cerebrovasculares (hemorragia o isquemia cerebral)
Infecciones virales o bacterianas (meningitis)
Intoxicación por inhalación de gases tóxicos
Enfermedades degenerativas (Alzheimer, Parkinson, Esclerosis múltiple, etc.)
Consumo crónico abusivo de alcohol u otras drogas
Anoxia (interrupción del flujo respitarorio por un tiempo prolongado)
Dificultades de aprendizaje (dislexia, discalculia, disgrafia)
Trastornos de la niñez (Déficit de atención e hiperactividad, trastorno del espectro autista, etc.)
Hipertensión crónica
Trastornos cardíacos crónicos
Infección por VIH
La EN, no obstante, tiene aplicaciones que van más allá del diagnóstico.
Lezak, Howieson, Bigler & Tranel (2012) señalan 5 aplicaciones de la evalua-
ción neuropsicológica:
–– Evaluación: es útil para discriminar entre síntomas psiquiátricos y
neurológicos, en la identificación de un posible trastorno neuro-
lógico en un paciente no psiquiátrico, en ayudar a distinguir entre
diferentes condiciones neurológicas y en proveer datos comporta-
mentales para localizar el sitio – o al menos el hemisferio – de una
lesión.
–– Cuidado del paciente y planeamiento: la descripción detallada de las
alteraciones que un paciente determinado puede padecer ayuda en
las medidas a tener en cuenta por quienes cuidan de él por ejemplo,
adaptándose a sus dificultades.
–– Rehabilitación y evaluación del tratamiento: esta evaluación indica al
terapeuta a qué funciones es necesario dirigir el tratamiento y posi-
bilita además controlar la evolución del mismo.
–– Investigación: la investigación en neuropsicología comprende tanto
la evaluación de las relaciones entre diferentes estructuras cerebrales
204
y el comportamiento como la referida a las metodologías diagnósti-
cas y terapéuticas.
–– Neuropsicología forense: la pericia de los neuropsicólogos es requeri-
da muchas veces en el ámbito forense para dirimir cuestiones tales
como la comprensión de una persona de sus actos jurídicos, los da-
ños cognitivos resultantes de un accidente o mala praxis, etcétera.
205
Arango-Lasprilla (2016). La misma situación se da en otros países
(Rabin, Barr & Barton, 2005). Si el objetivo es realizar una detec-
ción de casos o un rastreo inicial [screening], una evaluación breve
será adecuada. Por el contrario, si lo que se desea es establecer con
precisión funciones y grado de alteraciones para realizar un trata-
miento de rehabilitación neuropsicológica, la exploración deberá
ser, necesariamente, más profunda.
No obstante, dentro del esquema de baterías flexibles, se han de-
sarrollado algunas que se suponen más sensibles para la detección
de algunas patologías específicas como por ejemplo Enfermedad de
Alzheimer, esclerosis múltiple, VIH, etcétera (Burin, 2007)
b. Validez y confiabilidad: un aspecto imprescindible al momento
de conformar una batería de evaluación neuropsicológica - como
en cualquier otra evaluación psicológica - es conocer las caracterís-
ticas técnicas de los instrumentos a utilizar, es decir los estudios de
validez y confiabilidad realizados con tales pruebas. Este aspecto,
que suele ser escasamente considerado entre algunos profesionales,
es substancial para poder establecer los alcances y límites de nues-
tros datos. Las pruebas con mayor cantidad y calidad de estudios
técnicos darán mayor certeza a nuestros datos reduciendo nuestro
margen de error al momento de realizar la evaluación. Existen casos
en donde el trabajo del neuropsicólogo adquiere fundamental im-
portancia para la elaboración del diagnóstico de un paciente, como
es el caso del diagnóstico de demencia. La comunidad científica
ha acordado que la verificación de deterioro cognitivo a través de
una evaluación neuropsicológica profunda es imprescindible para
el diagnóstico de demencia (McKhann et al., 2011). Es importante
señalar que, al igual que en muchas otras áreas de la psicología, al-
gunos de los constructos que se manejan en la neuropsicología no
se encuentran definidos con claridad o existen tanta variedad de
definiciones del mismo constructo (ver Fernández, 2014) que es
muy importante determinar cuál es el constructo en el que se basa
la prueba que estamos utilizando.
c. Especificidad y sensibilidad: además de la confiabilidad y validez,
existen otras propiedades técnicas que es sumamente importante
considerar, fundamentalmente en los casos en donde se realiza un
rastreo inicial o una detección de casos, cuales son la sensibilidad y
especificidad. La sensibilidad hace referencia a la precisión de una
prueba para identificar a aquellas personas que poseen una condi-
ción determinada por ejemplo, demencia, déficit de memoria, etcé-
tera. La sensibilidad de una técnica para determinar si tal deterioro
existe es trascendental sobre todo en aquellos casos en donde tal
206
daño es incipiente y la distinción entre la normalidad y la patología
es sumamente difícil - en este caso particular los estudios de vali-
dez concurrente adquieren un rol fundamental. La especificidad, en
cambio, es la capacidad de una prueba para clasificar correctamente
como negativos a aquellos casos que no presentan esa condición.
Un test de detección perfecto sería aquel que identificara a todos los
sujetos que poseen y no poseen esa condición. Sin embargo, esto es
imposible ya que a medida que la sensibilidad aumenta la especifici-
dad disminuye y viceversa. Por lo tanto, es necesario buscar en una
prueba un equilibrio, que puede lograrse a través de técnicas que
permiten seleccionar un punto de corte adecuado y que nos permi-
ta reducir al mínimo los costos de producir tanto falsos negativos
como falsos positivos.
d. Tiempo y costo: para que una batería neuropsicológica sea útil
debe ser reducida en el tiempo. Una persona que ha sufrido un
daño cerebral suele fatigarse con facilidad. Esto puede provocar que
luego de un tiempo lo que se esté evaluando sea un efecto de fatiga
sobre la cognición de esa persona y no su verdadera capacidad. En
otras situaciones el individuo se traslada desde una localidad en la
que reside y no tiene acceso a un servicio neuropsicológico hacia
otra en donde puede realizarse la EN. En estos casos el individuo
puede contar con un tiempo muy limitado para permanecer en el
lugar en el que se realiza la EN. Por otra parte, una batería dema-
siado extensa implica muchas horas de trabajo profesional, incre-
mentando como consecuencia el costo de esta tarea. Por lo tanto,
una de las principales ventajas de la aplicación de la psicometría en
la evaluación neuropsicológica con respecto a otros enfoques es su
brevedad, ya que nos permite, con pruebas que pueden extenderse
por un período tan breve como 1 minuto, observar el rendimiento
de determinadas funciones cognitivas que mediante la mera obser-
vación conductual implicaría un tiempo significativamente mayor.
Es, por otra parte, sumamente difícil establecer el rendimiento de
determinadas funciones sin una estimulación específica. Por ejem-
plo, ¿cómo podría determinarse la integridad de la memoria semán-
tica de una persona sin utilizar un test que mediante sus estímulos
provoque específicamente la expresión de dicha capacidad?
e. Adaptabilidad: Lezak et al. (2012) señalan la necesidad de contar
con pruebas que puedan adaptarse a cualquier situación para la eva-
luación (incluida dentro de lo que ellos denominan “practical bat-
tery”). Existen circunstancias en que un paciente debe ser evaluado
en una sala de internación o en las que la movilidad del mismo se ve
muy reducida por dificultades en su sistema motor (por ejemplo, un
207
paciente con trastornos de la marcha por lesión del sistema nervioso
periférico). En casos como el mencionado, una prueba que cuente
con un instrumental difícil de trasladar disminuye sus posibilidades
de ser aplicada fuera de un ambiente determinado.
f. Facilidad de administración: esta es otra característica necesaria
para lograr una mayor utilidad de una prueba. Las pruebas que re-
quieren de materiales complejos y cuya administración implica un
proceso igualmente complejo resultan poco prácticas al momento
de la evaluación. Esto aumenta los tiempos de administración y
disminuye la confiabilidad de la misma, ya que es posible que la
persona evaluada haya interpretado las consignas en forma errónea
y no se esté analizando la conducta deseada. Por otra parte contri-
buyen a una mala disposición del sujeto a continuar con la eva-
luación debido a su gran dificultad para comprender las consignas.
Esta situación suele suscitarse con las pruebas computarizadas al
intentar ser administradas a personas que no están habituadas a uti-
lizar computadoras. Aunque en la actualidad esa situación es cada
vez menos frecuente sigue existiendo un gran número de personas,
particularmente adultos mayores, que no utilizan computadoras
habitualmente. En consecuencia, en esos casos, los tests deberían
contar con ensayos de prueba que permitan que el entrevistado se
familiarice con el teclado, mouse o dispositivo que se esté utilizan-
do. Lamentablemente en muchos casos las pruebas no disponen de
estos ensayos.
g. Adaptación cultural: muchas de las pruebas utilizadas actualmente
han sido desarrolladas mayoritariamente en EE.UU y Europa. Por
esa razón, en muchos casos los estímulos utilizados no son apropia-
dos para nuestro medio. Un ejemplo paradigmático y ampliamente
documentado de una prueba con un fuerte sesgo cultural es el del
Test de Denominación de Boston, cuyas láminas tienen dibujos de
elementos que son poco conocidos (castor) fuera de EE.UU o para
los cuales no existe una palabra en otro idioma (pretzel) (Fernández
& Fulbright, 2015). Asimismo, los baremos desarrollados en esos
países pueden no ser apropiados para la población local. Estas varia-
bles tienen mucha mayor influencia cuando estos tests se aplican en
culturas no occidentales.
Por estas razones es sumamente importante que los tests a utilizar
sean adaptados al medio local asegurándose de que son cultural-
mente apropiados para la población en la que se van a utilizar.
208
Ventajas y Limitaciones de la Psicometría en Neuropsicología
Ventajas
Objetividad: esta es una de las características más importantes que
puede aportar la psicometría a la neuropsicología, como lo hace en toda la
psicología. Al establecer un procedimiento estándar para la administración,
corrección e interpretación de una prueba se abre la posibilidad de que di-
ferentes evaluadores en forma independiente obtengan resultados altamente
similares, aumentando de este modo la confiabilidad de una prueba, y por lo
tanto, de la evaluación. Este constituye uno de los mayores progresos de la
ciencia psicológica, y la neuropsicología no es ajena a ello. El hecho de confiar
en la experiencia personal o en una observación detallada deja mucho lugar a
la subjetividad del examinador y conduce a muchos errores en la interpreta-
ción de las conductas bajo observación. Para ejemplificar podemos describir
dos situaciones: a) los casos en donde se pretende diagnosticar la presencia
de un trastorno cognitivo degenerativo en una persona que padece de un
deterioro cognitivo incipiente. La frontera entre el envejecimiento normal y
el comienzo de una demencia en sus estadios más primarios es tan sutil que
su determinación es prácticamente imposible sin la utilización de pruebas
psicométricas. Establecer si los olvidos de una persona de edad avanzada son
normales para su edad o constituyen el comienzo de una enfermedad degene-
rativa no es posible sin contar con baremos que nos indiquen este hecho; b)
los casos en los que una persona ha sufrido un daño cerebral leve en la corteza
prefrontal. Las quejas de los familiares suelen ser de este estilo: “es diferente.
No puedo explicar cómo pero su conducta ha cambiado”. La sola observación
de estos comentarios nos da una idea de la dificultad de establecer la calidad
y cantidad del deterioro de una persona con este tipo de patología. Su deter-
minación frecuentemente requiere de la aplicación de pruebas técnicamente
muy sofisticadas tales como la Prueba de Clasificación de Tarjetas de Wis-
consin [TCTW] (Heaton, Chelune, Talley, Kay y Curtis, 1993) o la Torre de
Hanoi entre otras. Intentar su diagnóstico mediante la mera observación pue-
de conducir a confusiones con características de personalidad premórbidas o
alteraciones psiquiátricas, sobre todo en un observador poco experimentado.
La distinción de ambos síndromes solo podría ser posible en un observador
con una abundante experiencia clínica, lo que tampoco elimina la posibilidad
de cometer errores. Por otra parte, al tratarse de medición de habilidades, el
evaluador siempre está realizando una medición, ya sea que use técnicas psi-
cométricas o no. En el segundo caso, lo que hará es disminuir la confiabilidad
de su medición.
Costo: esto constituye otra de las principales ventajas de la psicometría
en una evaluación neuropsicológica ya que permite reducir notablemente los
tiempos de una evaluación, reduciendo por lo tanto sus costos.
Tiempo: también como fuera mencionado anteriormente, mediante la
209
utilización de pruebas psicométricas es posible reducir considerablemente el
tiempo de una evaluación, lo que aumenta la calidad técnica de la evaluación
al evitar la fatiga del paciente, entre otras ventajas ya mencionadas.
Sensibilidad: la sensibilidad de las técnicas psicométricas en neuropsi-
cología está íntimamente ligada a los conceptos vertidos anteriormente. Estas
técnicas nos ofrecen la posibilidad de detectar síndromes o alteraciones en
etapas muy iniciales o leves. Dicha detección mediante una mera observación
clínica resulta muy difícil y conduce a muchos errores, arrojando frecuen-
temente falsos negativos, es decir, a no diagnosticar a personas que padecen
algún tipo de patologías. Esta sensibilidad ha permitido la identificación y el
tratamiento precoz de muchas patologías como por ejemplo la Enfermedad de
Alzheimer (Bastin & Salmon, 2014), o la dislexia (Schatschneider, Fletcher,
Francis, Carlson, & Foorman, 2004) entre otras, generando, de este modo, la
posibilidad de una prevención o mejor calidad de vida para el paciente.
Minuciosidad: la minuciosidad es otra peculiaridad de estas técnicas. El
empleo de pruebas psicométricas nos permite realizar una exploración muy
amplia del funcionamiento cognitivo incluyendo las más diversas funciones.
Esto es muy importante ya que hay alteraciones que sólo se hacen evidentes
mediante una detallada inspección de la función. A veces, tal deterioro pasa
desapercibido en el medioambiente en el que se desempeña esa persona por
situaciones tales como poca actividad - jubilados, personas que realizan sus
tareas en lugar del paciente -, o por realizar actividades en las que la función
bajo observación no es frecuentemente requerida - por ejemplo, dibujar, en
el caso de la evaluación de las praxias constructivas; leer o realizar operacio-
nes matemáticas en los casos de personas que se ocupan de tareas rurales o
manuales.
Limitaciones
También existen algunas limitaciones de estos procedimientos que se-
rán mencionadas a continuación:
Artificialidad: normalmente la evaluación neuropsicológica se realiza en
el ámbito de un consultorio u oficina en el cual la persona se encuentra ais-
lada de toda otra estimulación y su atención está completamente dirigida a
la resolución de las pruebas mediante las cuales se la estimula. Este no es el
ambiente natural en el que una persona desarrolla sus actividades de la vida
diaria. Frecuentemente, nos encontramos rodeados de estimulación y durante
el desarrollo de una tarea laboral, por ejemplo, nos vemos requeridos de rea-
lizar más de una operación en forma simultánea. Esto puede conducir a una
disminución del rendimiento en las tareas consideradas, que el profesional
puede no observar durante la EN debido a esta “artificialidad” de la situación
de evaluación. Esto ha conducido al concepto de validez ecológica de una
prueba neuropsicológica. La validez ecológica hace referencia a la capacidad
210
de una técnica de predecir el desempeño de una persona en su medio am-
biente natural. Las pruebas neuropsicológicas clásicas, fueron originalmente
diseñadas para localizar las lesiones cerebrales y el diagnóstico clínico, por
lo que presentan dificultades con relación a la validez ecológica (Marcotte,
Scott, Kamat & Heaton, 2010; Sbordone, 1996). Es por ello que durante las
últimas décadas se intentó desarrollar tests con mayor validez ecológica. La neu-
ropsicología inglesa ha realizado, hasta ahora, los intentos más exitosos (Wilson,
Cockburn y Baddeley, 1985; Wilson, Cockburn & Halligan, 1987; Wilson et
al. 1996). El desempeño en los tests neuropsicológicos permite predecir la eje-
cución de las actividades de la vida diaria tales como rendimiento académico,
actividades instrumentales de la vida diaria, nivel de empleo y habilidad para
conducir un automóvil (Marcotte et. al, 2010). No obstante, dicha correlación
ha sido calificada como “moderada”. Se destaca, sobre todo, la correlación entre
el funcionamiento ejecutivo y las actividades de la vida diaria.
Longitud: en la actualidad existen muchas pruebas neuropsicológicas de
incuestionable utilidad que fracasan con aquel requisito de la brevedad. Suce-
de que muchas de ellas fueron creadas en contextos de investigación en donde
se utilizaba sólo una prueba. Al integrar dichas pruebas a baterías (conjuntos
de tests individuales) más amplias se evidencia su problemática longitud. No
obstante, en muchos casos se ha logrado desarrollar versiones más breves de
pruebas muy eficaces pero extensas, como es el ejemplo de la versión breve del
TCTW desarrollada por Axelrod, Woodard y Henry (1992).
Atención
El concepto de atención ha sido definido de múltiples maneras y es
considerado por la mayoría de los autores como un concepto multifactorial
(Fernandez, 2014). Estos modelos se derivan de diferentes fuentes clínicas,
211
experimentales y psicométricas. A continuación, se presentará el esquema
conceptual delineado por Mirsky y su grupo de colaboradores y posterior-
mente desarrollado en Mirsky y Duncan (2001). Este modelo fue elegido
debido a que es uno de los más utilizados en la evaluación clínica.
Sostenida (vigilancia): este componente de su modelo “representa la
capacidad de mantener el foco y la alerta en el tiempo, o la vigilancia”. (p.
112). Un test paradigmático para la evaluación de esta función es el Test de
Rendimiento Continuo [Continuous Performance Test] (Rosvold, Mirsky,
Sarason, Bransome & Beck, 1956). Esta prueba, tiene varias versiones, pero
básicamente implica la presentación de un estímulo blanco entre otros estí-
mulos distractores durante un período de hasta 15 minutos. El desempeño se
evalúa contando las omisiones y comisiones, como así también los tiempos de
reacción del individuo. Esta es una prueba computarizada.
Focalización: para Mirsky et al. este elemento representa la capacidad
de seleccionar un segmento de información determinada, de entre toda la
información presentada, para procesarla. Una de las pruebas más utilizadas
a este propósito es el Test del Trazado [Trail Making Test] (Army Individual
Test Battery, 1944). Otra prueba posible de utilizar es el Test de Interferencia
Palabra-Color de Stroop (Stroop, 1935).
Alternancia: este componente del modelo de Mirsky et al. hace refe-
rencia a “la capacidad para cambiar el foco de la atención de un modo flexible
y adaptativo” (p. 112). A tal fin, en su investigación, ellos utilizan el TCTW.
Es importante considerar que este concepto se superpone con el de Ejecu-
tivo Central, que pertenece al esquema de Memoria de Trabajo. Dentro de
este esquema conceptual, lo que Mirsky denomina alternancia de la atención,
Baddeley lo supone como una función a cargo del subsistema Ejecutivo Cen-
tral. Se asemeja también, como veremos más adelante, al concepto de flexibi-
lidad cognitiva o conceptual, dentro de las denominadas funciones ejecutivas.
Codificación: este componente no existía teóricamente en el modelo,
sino que fue incluido a partir de esta investigación en la cual se reveló su
presencia a partir del análisis factorial. No posee una definición precisa y en
este estudio dos pruebas saturaron en ese factor: los subtests de Aritmética
y Amplitud de Dígitos de la Escala de Inteligencia de Weschler - Revisada
(WAIS -R).
Estabilidad: un componente no descripto con precisión, fue definido
como la coherencia en la respuesta a los estímulos “diana”. Los autores no
precisan ninguna región específica del cerebro para apoyar este elemento.
Memoria
Dentro de los múltiples sistemas de memoria del ser humano, los tres
más frecuentemente evaluados son:
Memoria episódica: este concepto hace referencia a “la capacidad adi-
cional de adquisición y retención de conocimientos sobre eventos personal-
mente experimentados y sus relaciones temporales en el tiempo subjetivo y la
212
capacidad de ‘viajar hacia atrás’ mentalmente en el tiempo” (Tulving, 1985;
p. 387). Es una memoria muy frágil y muy sensible a cualquier tipo de lesión
cerebral. Entre las pruebas clásicas más utilizadas se encuentran el Test de
Aprendizaje Auditivo-Verbal de Rey (Rey, 1964), el Test de Recuerdo Selec-
tivo de Buschke (Buschke, 1973; Buschke & Fold, 1974), el Test de Apren-
dizaje Verbal de California (Delis, Kramer, Kaplan & Ober, 1987), el Test de
Retención Visual de Benton (Benton, 1974), y la Figura Compleja de Rey
(Rey, 1941), entre otros.
Memoria semántica: “hace referencia a la información consolidada,
bien aprendida. Es la memoria que contiene nuestro conocimiento general
del mundo, la ‘cultura general’; los significados de las palabras, el conocimien-
to perceptual del mundo que nos rodea y las reglas por las que se rige nuestra
sociedad” (Fernández, Monti & Bacile, 1998; p. 10). La alteración de esta
memoria suele ser un marcador muy sensible de comienzo de la Enfermedad
de Alzheimer. Entre las pruebas más frecuentemente utilizadas están el Test
de Asociación de Palabras Orales Controladas, y el Test de Denominación de
Boston (Goodglass & Kaplan, 1996).
Memoria de trabajo (working memory): de acuerdo con Baddeley,
uno de los creadores de este concepto, la memoria de trabajo es “la capaci-
dad de realizar tareas que implican almacenar y manipular información en
forma simultánea” (1995; p. 12). Esta memoria consta de tres subsistemas,
de los cuales usualmente se examina el Bucle Fonológico, a través del Test de
Amplitud de Dígitos - que es un subtest del Test de Inteligencia de Weschler
[WAIS] (Weschler, 1984). El Ejecutivo Central es una función involucrada
en la ejecución de muchos tests tales como el TCTW.
Funciones viso-espaciales
Las funciones visoespaciales comprenden un espectro bastante amplio
de funciones cognitivas. Aquí se presentarán tres conceptos claves dentro de
este campo.
Discriminación: en este caso, lo que interesa conocer en una evaluación
neuropsicológica es la capacidad del sujeto de discriminar objetos complejos o
posiciones espaciales relativas. Las lesiones del lóbulo occipital suelen generar
alteraciones visuales en la capacidad de discriminación de estímulos visuales.
A tal fin se utilizan pruebas como el Test de Discriminación de Formas Vi-
suales de Benton (Rey & Sivan, 1995) o el Test de Estimación de Ángulos de
Benton (Rey & Sivan, 1995).
Construcción: también denominadas praxias constructivas, lo que se
considera aquí es la capacidad del sujeto para realizar dibujos o ensamblar
objetos. En este dominio son utilizadas con mayor frecuencia las siguientes
pruebas clasicas: Figura Compleja de Rey y substest de Diseño con Cubos de
las distintas versiones del WAIS.
213
Gnosias visuales: aquí se evalúa la capacidad de una persona para re-
conocer dibujos, objetos, colores, etcétera. Las agnosias visuales - es el déficit
resultante de la alteración de las gnosias - pueden ser múltiples e incluso muy
específicas, por lo que la variedad de pruebas es bastante importante. El Test
de Figuras Superpuestas de Poppelreuter (Poppelreuter, 1917) es una de las
pruebas más comúnmente utilizadas.
Lenguaje
La evaluación del lenguaje puede ser muy amplia, ya que sus subcom-
ponentes son múltiples: escritura, lectura, denominación, comprensión de
lenguaje escrito o hablado, fluidez, producción fonémica, etcétera. El lengua-
je es, no obstante, una de las funciones más resistentes al daño cerebral, por
lo que se la utiliza, en muchos casos, como una medida del nivel de actividad
premórbida del sujeto, es decir, evaluando el estado actual del lenguaje del pa-
ciente se puede inferir el estado de todas sus funciones cognitivas previamente
a la ocurrencia de la lesión cerebral. Hay, sin embargo, algunos componentes
del lenguaje que resultan más sensible a algunos daños sutiles del lenguaje. Ta-
les elementos suelen estar alterados en casos en los que otras alteraciones más
evidentes del lenguaje no están presentes, como por ejemplo afasias de Broca,
o de Wernicke. Estos elementos son la denominación y la fluidez verbal. De-
bido a que la magnitud de una exploración detallada del lenguaje excede los
propósitos de este capítulo, nos referiremos aquí solo a estas últimas.
Denominación: es la capacidad de una persona para “encontrar pala-
bras”. El síntoma que resulta de la dificultad para encontrar palabras se ha
denominado “anomia”, el cual ha sido definido como “…una dificultad en
encontrar palabras de alta información en el habla fluente y cuando se re-
quiere identificar un objeto o acción nombrándolo (Goodglass & Wingfield,
1997, p. 3). En una evaluación clínica se utilizan normalmente pruebas de
denominación confrontacional. En estas pruebas, al sujeto evaluado, se le
presenta una lámina con el dibujo de un objeto y se le pide que mencione el
nombre de dicho objeto. Se utilizan dibujos de diferentes frecuencias de inte-
racción en la vida aria: de alta frecuencia (un árbol), hasta baja frecuencia (un
compás). Una de las pruebas más populares es el Test de Denominación de
Boston. Sin embargo, ha sido demostrado que la misma tiene un significativo
sesgo cultural. Por esa razón recientemente ha sido desarrollado en Argentina
el Test de Denominación Córdoba (Fernández, 2013), el cual es apropiado
para ser utilizado con hispano-parlantes (ver Figura 1).
Fluidez verbal: es la capacidad para producir palabras en secuencias
conectadas e ininterrumpidas. Lesiones de ciertas zonas de los lóbulos frontal
y temporal, entre otras pueden producir una reducción significativa en la tasa
de producción de palabras. Una técnica muy sencilla en su implementación,
pero muy sensible - el Test de Asociación de Palabras Orales Controladas - se
utiliza frecuentemente para examinar esta función.
214
Figura 1. Ejemplos de algunas figuras incluidas en el Test de Denominación Córdoba.
Funciones ejecutivas
215
mover una serie de anillos desde una clavija a otra pero respetando ciertas
reglas.
Flexibilidad conceptual: en este caso lo que se evalúa es la capacidad
de una persona para cambiar el curso de acción de su pensamiento de acuer-
do a las demandas de la situación. La rigidez o inflexibilidad aparece cuando
el sujeto se encuentra “atado” al estímulo y no puede cambiar de actividad
mental. Por ejemplo, frente a la presentación de un dibujo simple (un círculo)
del cual se le ha requerido al paciene que realice una copia, éste continuará
dibujando en forma indefinida hasta que se acabe su hoja o hasta que el eva-
luador lo detenga. Esta alteración, técnicamente, se denomina perseveración
o inflexibilidad cognitiva. Frecuentemente, las pruebas dirigidas a evaluar este
aspecto requieren que el sujeto alterne entre una y otra tarea con intervalos
de tiempo determinados. Tal es el caso del TCTW, una de las pruebas más
utilizadas y de mayor calidad técnica.
Fluidez gráfica: como un análogo de la fluidez verbal, pero en el plano
no verbal, lo que se intenta medir en este caso es la habilidad de un individuo
para producir diseños geométricos únicos o figuras dentro de un período de
tiempo determinado. Entre los tests que suelen utilizarse a tal fin se encuen-
tran el Test de los 5 Puntos (Regard, Strauss & Knapp, 1982) y el Test de
Fluidez Figural de Ruff (Ruff, 1996).
Conceptualización
216
en el campo de la evaluación neuropsicológica clínica. Dicho esquema consta
de 4 componentes (Razonamiento, Producción de Pensamiento, Resolución
de Problemas y Comprensión Social y Juicio), que se subdividen, a su vez, en
varios subcomponentes. Cabe aclarar que estas categorías no corresponden
a procesos bien diferenciados, sino que existe superposición entre ellas. Las
pruebas para la evaluación de estas funciones están dirigidas, fundamental-
mente, al pensamiento lógico la comprensión de las relaciones y los juicios
prácticos.
Razonamiento: este componente está referido a los procesos de ha-
bilidades básicas (secuenciamiento y clasificación), razonamiento deductivo,
inductivo y pensamiento convergente. Dentro de este componente una de las
pruebas más utilizadas es el TCTW, para evaluar la capacidad de clasificación.
Otra prueba adecuada es el Test de Matrices Progresivas de Raven (Raven,
Raven & Court, 1993).
Producción de pensamiento: entre sus subcomponentes, pensamiento
divergente y capacidad de abstracción, suele evaluarse este último a través de
pruebas de interpretación de Proverbios o las subpruebas de Similitudes del
WAIS.
Resolución de Problemas: en este caso se evalúan los procesos de se-
lección de estrategias, aplicación de operaciones y evaluación de resultados a
través de pruebas como el Test de Laberinto de Porteus, entre otras.
Comprensión Social y Juicio: fundamentalmente en este caso se in-
tenta evaluar los procesos cognitivos sociales entre los que se encuentran as-
pectos tales como teoría de la mente, empatía, autoconciencia, razonamiento
moral, intencionalidad e imitación. En este contexto se destaca la evaluación
de la teoría de la mente, que puede definirse como la capacidad de atribuirles
estados mentales a otras personas y usar esta información para predecir sus
conductas. Algunas pruebas que se utilizan a tal fin (especialmente en niños)
son el test de las Falsas Creencias (Baron-Cohen, 1989) o el Test de Faux Pas
(Baron-Cohen, O’Riordan, Stone, Jones & Plaisted, 1999). El juicio social
también puede evaluarse con el subtest de Comprensión de las distintas ver-
siones de los tests de Wechsler.
Consideraciones Finales
Introducción
219
(Farla, Alkemade & Suurs, 2010). De esta manera, la psicología del tránsito
configura hoy un campo heterogéneo, que se refleja en una gran diversidad de
temas de investigación y en el estudio de los diferentes usuarios (conducto-
res, pasajeros, peatones, ciclistas y motociclistas), con un objetivo en común:
contribuir a una movilidad más segura y más sustentable (Ledesma, Poó &
Montes, 2011).
A pesar de ello, la investigación psicológica en el área se ha centrado,
fundamentalmente, en el estudio del comportamiento de los conductores de
automóviles y los factores de riesgo asociados (Ulleberg & Rundmo, 2003).
En esencia, aun cuando es posible advertir el crecimiento de modalidades de
transporte alternativas o no hegemónicas (e.g., bicicleta y motocicleta), el uso
del automóvil como medio principal de desplazamiento representa una seria
amenaza para la salud pública, debido a las lesiones fatales y no fatales que
produce (OMS, 2015). Al mismo tiempo, se estima que aproximadamente
el 90% de los siniestros viables se deben a factores derivados del conductor
(Hoffmann, 2005; Petridou y Moustaki, 2000). En este contexto, es fácil
entender por qué buena parte de la investigación en Psicología del Tránsito se
ha enfocado en comprender e identificar los factores psicológicos & compor-
tamentales que afectan la conducción.
221

Figura 2. Ejemplos de vehículos equipados con instrumentales de medida
222
el Multidimensional Driving Style Inventory (MDSI-S; Poó, Ledesma, Taub-
man-Ben-Ari & Díaz Lázaro, 2013). Se trata de un instrumento multidimen-
sional que evalúa el comportamiento habitual o estilo de conducción de las
personas. En concreto, el MDSI-S contiene 40 ítems que evalúan 6 dominios
de conducción: Estilo Riesgoso (9 ítems), Estilo Agresivo (6 ítems), Estilo
Ansioso (4 ítems), Estilo Disociativo (10 ítems), Estilo Prudente y Cordial
(6 ítems), y Estilo de Reducción de Estrés (5 ítems). No obstante, estudios
posteriores en Argentina (Trógolo, Ledesma, Poó, Tosi & Medrano, 2018)
mediante análisis factorial confirmatorio, no obtuvieron evidencia que con-
firme la validez de la Reducción de Estrés como estilo de conducción (Tabla 1
224
Tabla 3. Ejemplo de ítems de la escala DAX
225
Tabla 4. Ejemplo de ítems la escala de percepción de riesgo en la conducción (ARTS)
226
Tabla 5. Ejemplos de ítems de la de actitudes hacia el riesgo en la conducción

Comentarios finales
227
Introducción a la Evaluación Psicométrica en Psicología del Deporte:
Reseña Teórica y Modelos Teóricos
228
competición en relación a un determinado oponente y la evaluación mediante
criterios pre-post como por ejemplo pre y post la realización de un entrena-
miento específico en el dominio de una destreza psicológica.
El proceso de evaluación psicológica en el deporte especialmente en el
deporte de rendimiento y alto rendimiento así como las diferentes teorías que
los sustenta evolucionaron en dos diferentes trayectos complementarios: 1)
La dimensión práctica, en la aplicación de pruebas en los ciclos y megaciclos
del entrenamiento, la competición y el desentrenamiento y 2) La dimensión
teórica en la confección y puesta a punto de las pruebas y en la construcción
y deconstrucción de los paradigmas que las sustentan (Morales y Marzano,
2007).
Entre los años 2002 y 2012 los trabajos de evaluación y de investigación
de las variables psicológicas en el deporte en español se refieren en su mayoría
a la motivación, siguiéndole la percepción y el autoconcepto. Los deportes
más estudiados son Basquetbol y Fútbol (probablemente porque al estar pro-
fesionalizados tienen más posibilidades económicas para financiar desarrollo
científico) y la etapa evolutiva más estudiada es la adolescencia.
Existe una importante demanda desde el deporte de elite que busca
en la intervención psicológica una posibilidad más para incrementar el ren-
dimiento deportivo de los atletas que no se equipara con la demanda prove-
niente del deporte de salud, recreativo y comunitario (Del Grosso, Fernández
y Matosko, 2012).
Históricamente, se ha solicitado a los psicólogos del deporte intervenir
para lograr la maximización en el rendimiento del deportista evaluando cada
aspecto y momento de ese proceso. Esto se realizó en un principio desde
la óptica de un modelo teórico innatista no siempre explicitado, al que ha-
bía que desarrollar mediante la estimulación ambiental. Considerando que
el éxito deportivo del atleta dependía de forma exclusiva de sus cualidades
individuales o talento como rasgos de personalidad o cualidad estable que for-
ma parte de la estructura temperamental del sujeto ligada a lo constitucional
(hereditario, genético y congénito). Por ello, entre l1920 y 1980, se estudió
la personalidad del deportista a partir de este supuesto como predictor de la
conducta en todas las situaciones deportivas.
Este movimiento se inicia en la URSS P. con Rudik y Puni (1930) con
la creación del Instituto Central de Investigación Científica para el Estudio
de de la Educación Física y continúa en EEUU con C. Griffith (1932) con la
fundación del primer Laboratorio de Psicología del Deporte en la Universi-
dad de Illinois. En ambos, evaluando –detectando- talentos mediante la utili-
zación de tests de personalidad, de inteligencia y de psicomotricidad a partir
de observaciones, cuestionarios, auto-informes y entrevistas con deportistas.
Se indaga sobre variables tales como: capacidad de liderazgo, control emocio-
nal, autoconfianza, autocontrol emocional, capacidad de determinación, op-
229
timismo, etc. (Cruz y Capdevila en Cruz, 1980). Emergiendo la controversia
que ha acompañado el desarrollo teórico de esta disciplina a lo largo de las
décadas: campeón se nace o se hace (Martens, 1987)
En los Institutos de Cultura Física creados en Moscú y en Leningrado,
donde trabajaron P. Rudik y A.Z. Puni respectivamente, se promovían las
habilidades deportivas desde la niñez; con evaluación constante de las capaci-
dades físicas y atléticas. Los niños que evidenciaban mayor potencial podían
continuar sus estudios en los Institutos del Deporte y de Cultura Física don-
de eran entrenados y estimulados de manera individual en sus habilidades
motoras, para su posterior incursión de forma natural en la especialización
deportiva específica y también en el más alto nivel de las Ciencias Deportivas
(Pérez Córdoba y Estrada Contreras, 2015). Este laboratorio tuvo dos áreas
fundamentales la investigación fisiológica y el estudio experimental de los
tiempos de reacción, el aprendizaje deportivo y la adquisición de las habilida-
des motrices que es el área de investigación psicológica).
A partir de la segunda mitad del siglo XX comienza la producción y
proliferación de instrumentos estandarizados de medición; del establecimien-
to de perfiles personales de funcionamiento psicológico aptitudinal y actitu-
dinal y la medición pre-post. Algunos de esos instrumentos son famosos en
la literatura específica y perduran hasta la actualidad, realizándose periódica-
mente con ellos estudios de confiabilidad y baremación. Ejemplo de ello son:
el Athletic Motivation Inventory (AMI) (Tutko, Lyon y Ogilvie, 1969), para
evaluar un posible rasgo de motivación deportiva; el Sport Competition Anxie-
ty Test (SCAT) (Martens, 1977), para evaluar el rasgo de ansiedad competi-
tiva, específico de los deportistas (Cruz, 1991); el Test of Attentional And In-
terpersonal Style (Nideffer, 1976)que evalúa el estilo atencional característico
del deportista; el Profile of Mood States (POMS) McNair, Lorr y Droppleman
(1971) que establece el perfil anímico predominante del deportista; la Measu-
rement of values expresión in sports and athletics (Simmons y Dickinson, 1986)
que evalúa la valoración del deportista acerca de la actividad físico deportiva.
Cabe consignar que este instrumento deriva de la Rokeach Value Sur-
vey (RVS) (Rokeach, 1968). Esta Encuesta sobre los valores que las personas
atribuimos a diferentes cosas de la existencia humana que inspiró varios ins-
trumentos de medición a partir del los años ’60, por ser una temática de la
Psicología-Social impuesta en la época.
Sin embargo, comienza a vislumbrarse también una controversia en re-
lación a los instrumentos de medición, pues no todos los instrumentos de
medición resultan buenos predictores del rendimiento deportivo. Algunos es-
pecialistas plantean la inutilidad práctica de contar con instrumentos estanda-
rizados bien calibrados que son útiles en otras áreas de la Psicología pero no en
ésta. Éstas y otras dificultades, dieron inicio a la construcción de un ámbito de
la Psicología del Deporte, con un corpus teórico, instrumentos de evaluación
y dispositivos de intervención propios (Martens, 1975).
230
Hacia fines de los ‘70, la Psicología del Deporte asume un enfoque
predominantemente cognitivo-conductual (aunque co-existiendo con otras
corrientes). Pero, este modelo cognitivo, esencialmente psicológico, se dife-
rencia del modelo médico psiquiátrico pues no tiene como referente a la pa-
tología sino al máximo desarrollo de la función, lo que instituye el epicentro
en el comportamiento y el aprendizaje. Sustituyendo el concepto de enferme-
dad por el de distorsión cognitiva, producto de condicionamientos nocivos
o aprendizajes negativos. Proponiendo una línea de abordaje que bien puede
denominarse de entrenamiento cognitivo-comportamental (Gardner, 1987).
Fuertemente centrados en la figura del deportista y en el ámbito especí-
fico del juego con todos sus componentes incluido el espectador y los vínculos
relacionales (Escenario deportivo), en este período, la evaluación adopta un
enfoque más empírico. Se utilizan test, cuestionarios y auto-informes cuyo
objetivo es evaluar los aspectos cognitivos, los estados (más que los rasgos) de los
deportistas durante los entrenamientos y las competiciones. Aunque, se con-
tinúa empleando registros cognitivos con instrumentos adaptados de otras
áreas, como la Psicología Clínica; y, en algunos casos, aplicando sin ninguna
modificación test estandarizados cuyos baremos de comparación correspon-
dían a poblaciones de no deportistas (Martens, 1987 en Cruz, 1997).
En líneas generales, en esta etapa los procesos psicológicos más inves-
tigados fueron los emocionales, atencionales y motivacionales con la idea de
producir entrenamiento de la atención para el aprendizaje de los estados emo-
cionales que se consideran favorables para la exitosa perfomance deportiva
y el control y des- aprendizaje de aquellos que no lo eran. Son medidos los
constructos de activación y control utilizando el Test of Attentional and In-
terpersonal Style (TAIS) (Nideffer, 1976). Considerando que los atletas en
situación de activación extrema controlan la situación según un rasgo o estilo
atencional personal al cual hay de educar en función de las necesidades para
éxito deportivo.
Esto produce el giro de la mirada de los instrumentos de evaluación. Los
procesos emocionales, como la ansiedad o stress competitivo, estado de ansie-
dad específico de la situación deportiva, son evaluados a partir de la creación
del Sport Competition Anxiety Test (SCAT), desarrollado por Martens (1977),
bajo la conceptualización cognitiva de la percepción que el atleta tiene de la
situación deportiva como amenazante (Martens, 1977).
De igual modo, otras pruebas, como el Profile of Mood States (POMS)
de Mc Nair, Lorr y Droppleman (1971), informan por evaluación sobre el
cambio en el estado de ánimo que va adquiriendo el perfil personal del depor-
tista a través de las diversas situaciones de entrenamiento y de competición.
Obteniendo el entrenador un perfil multidimensional general del atleta lo
que le permite observar las oscilaciones del estado de ánimo en diferentes
categorías.
231
A través de la evaluación de los procesos motivacionales surgen mo-
delos explicativos trascienden aquellos de meta de ejecución y meta de logro e
intentan explicar los aspectos motivacionales desde perspectivas pluri-dimen-
sionales que incluyen los factores cognitivo - sociales y valorativos de moda
en la época. Surgen así modelos teóricos como la Teoría de la Atribución que
considera a la motivación como el resultado de la confluencia de factores di-
versos, entre los cuales, el ámbito social y cultural puede ser determinante; ya
que, los pensamientos y sus significados cambian cuando el contexto social
también lo hace. (Roberts, 1995)
En síntesis, en esta área, la evaluación abarca tres niveles o modalidades
de respuesta psicológica con su indicador conductual y su correspondientes
instrumentos de medición (Cruz, 1997).
1. Nivel de Modalidad Cognitiva (pensamientos, sentimientos, ex-
pectativas, cogniciones, motivaciones). Este indicador se evalúa
mediante técnicas tales como test, cuestionarios, inventarios, auto-
informes y entrevistas.
2. Nivel de Modalidad Conductual Externa (lo que hace y / o dice
el atleta, incluyendo la modalidad motora externa). Este indicador
que se evalúa mediante técnicas de observación sistemática de la
conducta externa para lo cual el equipo técnico diseña instrumentos
adecuados al contexto (Mora Mérida, et al, 2000)
3. Nivel de Modalidad Psicofisiológica (informa sobre los valores que
alcanzan los procesos funcionales orgánicos del atleta frecuencia
cardiaca, sudoración, tensión muscular y que también se utilizan
para obtener alguna información psicológica, ya que estos cambios
pueden observarse como variables dependientes de alguna interven-
ción del entrenamiento físico o psico-conductual. (Capdevila, 1989
en Cruz, 1991)
232
En este escenario comienza a adquirir protagonismo el coaching en la
conducción del atleta hacia la excelencia (Martens, 1987) y el rol del Psicó-
logo del Deporte se amplía y enriquece a partir de estas concepciones; ya que
“…deberá intervenir en el nivel psico-fisiológico, el nivel que podemos llamar per-
sonológico - motivación, ansiedad, auto-confianza, etc.- y el nivel social del equipo
deportivo, con toda la complejidad que este presenta…” (Valdés Casal, 2000);
lo cual requiere de un soporte teórico-instrumental adecuado al que cada
coach debe llegar mediante estudios y preparaciones específicas que incluyen
el dominio de la construcción de pruebas para la evaluación de cada nivel de
intervención al mismo tiempo que la especificidad que cada tarea requiera.
233
|
Organización y Redacción de Informes Psicométricos
Leonardo Medrano y Lucas Lapuente
Introducción
235
¿Qué es un informe psicométrico?
236
La segunda diferencia radica en el rol del evaluador, de hecho durante
un proceso de evaluación psicológica el examinador constituye el punto cla-
ve ya que deberá integrar las diferentes fuentes de información para realizar
predicciones o pronósticos. Por otra parte, en la aplicación de una prueba el
objetivo principal se encuentra en las puntuaciones obtenidas por la prueba
y no en las decisiones del examinador. Como puede observarse existen nota-
bles diferencias entre ambos procesos, lo que derivará en diferentes tipos de
informes. Un informe psicológico no sólo resulta más amplio y profundo,
sino que además contiene de forma explícita los razonamientos que llevaron
al examinador a integrar la información aportaa por las diferentes técnicas
de recolección de datos. Por el contrario, en un informe psicométrico sería
imprudente extenderse más allá de los resultados obtenidos y las teorías sub-
yacentes a la prueba utilizada.
237
Figura 2. Esquema sobre la organización de un Informe Psicométrico
238
En este punto cabe señalar que el informe escrito podría ser acompañado de
un informe oral para evitar malinterpretaciones por parte de los destinatarios.
El lenguaje utilizado debe ser claro, sencillo y sin ambigüedades, a la vez
que no se recomienda emplear un lenguaje técnico que pudiera dificultar la
comprensión e interpretación del informe. Por ello, debe constituir un objeti-
vo primordial del psicólogo la búsqueda de una comunicación que resulte en-
tendible para los destinatarios del informe. Lamentablemente resulta frecuen-
te encontrar informes que se limitan a la exposición de las cifras obtenidas
por el test, o bien incluyen siglas (por ejemplo, IAMI, CIP, TIMI, DAT), en
vez de describir con claridad las características de la prueba empleada. Estos
aspectos dificultan una correcta comprensión. También resulta contraprodu-
cente redactar informes mediante una descripción literal y técnica de la teoría
utilizada para interpretar los resultados, o bien, empleando un lenguaje vulgar
que reste seriedad y rigurosidad científica al informe. Es importante saber
conservar un equilibrio entre el lenguaje técnico y el coloquial, sólo una equi-
librada dosis de cada uno permitirá una adecuada comprensión del informe.
Además de estas consideraciones generales para la redacción del informe
psicométrico, también se sugieren algunas más específicas, pero igualmente
importantes. En primer lugar, se recomienda ser claros respecto al grado de
certeza de los datos recabados, mostrando convicción de los datos fiables y
utilizando frases como “probablemente” o “tal vez” cuando se trate de inferen-
cias o deducciones del examinador. Por otra parte, se recomienda centrar el
informe en los rasgos o datos presentes en el examinado, más que en los rasgos
ausentes (“el examinado no posee capacidad para la música”, por ejemplo). A
menos que los comportamientos ausentes constituyan el foco del motivo de
consulta. También se recomienda comenzar por los aspectos más adaptativos
y positivos del evaluado e ir incluyendo aspectos menos positivos de manera
paulatina y matizada.
Otro aspecto a considerar es la inclusión de variables que la prueba no
mide efectivamente. Cabe recordar que un informe psicométrico, a diferencia
de un informe psicológico, se basa en los datos recabados a partir de la aplica-
ción de una prueba aislada y una breve interacción con el examinado, por lo
cual resultaría aventurado realizar evaluaciones de aspectos no contemplados
en la prueba. En efecto, resulta habitual observar que los evaluadores realizan
abstracciones infundadas de los datos objetivos, como por ejemplo, afirmar
que la persona posee baja autoestima o que es introvertida, cuando la prueba
utilizada no mide estos aspectos psicológicos.
Según Jiménez (2001) estas conductas generalmente provienen de la
falta de asertividad de los examinadores, ya que éstos optan por brindar infor-
mación infundada para satisfacer las demandas del examinado. Estas conduc-
tas generalmente provienen de la ansiedad generada en el evaluador por tener
que circunscribirse a un dominio comportamental delimitado y no poder
239
explayarse sobre el comportamiento general del examinado, aún cuando éste
lo solicita. Por ello, resulta importante mantenerse firme y asertivo respecto
a la información comunicada, focalizando nuestro informe en aquellos datos
que recabamos mediante la prueba.
Finalmente, se sugiere evitar informes superficiales que puedan ajus-
tarse a cualquier persona, así como el uso de “etiquetas diagnósticas” que
reduzcan la complejidad de la conducta humana a una definición estática.
Por ejemplo, afirmando que el sujeto examinado es neurótico sólo por que
obtuvo una puntuación elevada en la escala de Neuroticismo del inventario
NEO. En efecto, el evaluador debe ser modesto al comunicar los resultados
aportados por la prueba, debe recordarse que un test psicométrico constituye
un instrumento útil y válido, pero también sujeto a errores e imprecisiones.
1. Datos personales
Alumna: Martina
Edad: 12 años
Colegio: Privado de la Ciudad de Córdoba
Evaluador:
2. Referencias y objetivos
La profesora Patricia ha pedido que se realizase una evaluación de Mar-
tina para tener una mejor comprensión de las necesidades educativas de su
alumna. Actualmente Patricia es profesora particular de Martina y le da clases
todos los días después del colegio, principalmente para ayudarla a completar
sus tareas escolares. La evaluación fue pedida para explorar los posibles facto-
res que pudieran estar interviniendo en el desarrollo educativo y en el rendi-
miento en las materias escolares. A su vez, se plantea la pregunta de si es nece-
sario que Martina acuda a un centro de educación especial o si se mantiene en
el colegio donde está pero con un programa especial que permita atender a sus
características particulares. Por último, la profesora está interesada en conocer
cuáles son los programas y técnicas de instrucción que resultarían más eficaces
para el aprendizaje de la niña.
240
3. Datos biográficos relevantes
Martina fue adoptada cuando era bebé y según cuenta su madre, todas
las etapas del desarrollo se han cumplido dentro de los límites normales. Ac-
tualmente vive en Córdoba Capital con su madre y un hermano de 8 años que
también fue adoptado.
En el historial médico de la chica se encuentran algunas infecciones
auditivas a temprana edad (hasta los 2 años), asma (entre los 2 y los 3 años)
y una reacción extrema a los ruidos o movimientos inesperados (cuando es-
taba en el jardín de infantes). Empezó el colegio en una institución pública y
permaneció allí hasta el 4to grado. En ese momento el profesor del curso re-
comendó buscar un colegio que le pudiera dar atención más individualizada.
A raíz de esa recomendación Martina comenzó a asistir a un colegio privado
caracterizado por tener pocos alumnos por curso, lo que permite que el pro-
fesor tenga un seguimiento más individualizado de cada chico. En ese colegio
repitió el 4to grado.
Los informes más recientes describen a Martina como “educada, res-
petuosa y colaborativa”. No hay ningún indicador de que tenga problemas
sociales o de conducta en el entorno escolar, incluso varios profesores han
indicado que se esfuerza constantemente y que ha mostrado mejoría en sus
tareas. Las mayores dificultades se muestran en el campo de la matemática y el
profesor indica que presenta dificultades para dominar los conceptos básicos.
4. Conductas durante la evaluación
Martina mantuvo una actitud cooperadora en todas las sesiones de la
evaluación y se mostraba cómoda y atenta. Se mostraba interesada de intentar
todas las tareas y mostraba una actitud positiva, incluso cuando las tareas iban
aumentando en dificultad. En ocasiones se distrajo por ruidos ambientales,
pero rápidamente volvió a dirigir su atención a las que tareas que se le indica-
ban. La niña comentó que le gusta el colegio y sus profesores y que además no
le importa dedicar tanto tiempo para hacer las tareas para la casa.
5. Test aplicados
Los test utilizados fueron:
–– WJ III COG, Woodcock-Johnson III, Test of cognitive Ability: #
1-9; 11-18
–– WJ III ACH, Woodcock-Johnson III, Test of Achivement: #1-2,
13-15, 18, 19.
–– Dinostic Supplement to the Test of Cognitive Abilities (# 21,26)
–– Key-Math- Revised, con tipificación actualizada.
241
6. Resultados de los test
Como Martina ha repetido el 4º grado, en los WJ III Test of Cognitive
Abilities y Test of Achivement los resultados se compararon con los baremos de
su curso y con los de su edad; en ambos casos las puntuaciones derivadas eran
muy similares. Como esos dos instrumentos (de aptitudes y rendimiento)
se tipificaron conjuntamente (con la misma muestra), se pueden comparar
directamente los datos cognitivos de Martina con los de rendimiento. Estas
comparaciones ayudan a determinar la presencia y significación de cualquier
punto fuerte y débil entre sus aptitudes. En el resumen siguiente las aptitudes
de Martina, medidas por los componentes del WJ III, se dan en puntuaciones
típicas (Pt) y los niveles o categorías se han creado con el intervalo de confian-
za del 68% (Pt +- 1 desviación típica).
Resultados cognitivos
A partir de los test WJ III COG, la puntuación compuesta en aptitud
intelectual general de Marta se encuentra en el nivel medio (Pt=96, interva-
lo de confianza 93-98). Este resultado es congruente con exámenes previos
en el WJ-R y en el WISC-III, como lo son los puntos fuertes y débiles
encontrados en evaluaciones anteriores. En conjunto, hay una diferencia
significativa entre las aptitudes verbal y pensamiento (nivel medio) y su
eficiencia cognitiva (nivel inferior). A continuación, se ofrece una revisión
de los resultados.
242
Procesamiento fonológico y auditivo. Martina ha mostrado un rendimien-
to de nivel muy superior en su capacidad para escuchar y manipular sonidos
del lenguaje. Su puntuación tanto en el test de Atención fonémica como en
el test Procesamiento auditivo superan el valor del 99,9% de sus compañeros.
Esto significa que sólo un uno por mil de personas obtendría una puntua-
ción mejor. En realidad, Martina obtuvo una puntuación máxima en el test
Mezcla de sonidos, que indica una facilidad muy grande para ensamblar so-
nidos hablados, una habilidad importante para leer y escribir correctamente.
Martina también obtuvo una puntuación de nivel superior en un test que el
exigió completar un sonido en una frase hablada incompleta (test Palabras
incompletas) y de nivel medio en otro test (Atención auditiva) que le pidió
que discriminara las palabras en un ambiente ruidoso creciente. Estos resulta-
dos sugieren que Martina será capaz de emplear con facilidad las habilidades
fónicas en la lectura y en la escritura.
Aptitud verbal, conocimientos adquiridos y lenguaje oral. Martina ha de-
mostrado un rendimiento proporcionado en comparación con sus compañe-
ros en cuanto al lenguaje oral, ya que demostraba tener aptitud para seguir
instrucciones con pasos múltiples, logró identificar relaciones entre palabras,
comprensión de información hablada y logró retener información narrativa.
Su puntuación en el conglomerado Aptitud verbal extensa superaba al 61%
de sus compañeros de curso, como lo hacía su puntuación en el conglomera-
do Lenguaje oral del WJ III ACH. El conocimiento general de Martina en la
información adquirida en sus experiencias diarias y el aprendizaje escolar esta-
ba en el nivel medo de sus compañeros de clase (medido por el conjunto Co-
nocimientos) y superaba al 52% de sus compañeros. Estos resultados indican
que Martina podrá aprovechar las instrucciones verbales y podrá comunicarse
oralmente con sus compañeros sin problemas.
Pensamieno visoespacial y razonamiento fluido. En los test de Pensamien-
to visoespacial y de razonamiento fluido, Martina obtuvo puntajes que se
encontraban en el nivel medio. Esto indica que ella puede razonar mediante la
utilización de patrones visuales, puede realizar con éxito tareas como recordar
dibujos después de un breve intervalo de tiempo, a su vez puede percibir las
relaciones entre la parte y el todo y puede manipular mentalmente partes de
un modelo para conformar el diseño completo. En el factor de Pensamiento
visoespacial su rendimiento superó al 53% de sus compañeros de clase. En el
de Razonamiento fluido su rendimiento superaba al del 28% de sus compa-
ñeros. Estos datos sugieren que Martina tiene aptitudes adecuadas para perci-
bir patrones visuales y usar razonamiento para resolver problemas.
Memoria. Martina ha mostrado un puntaje débil, en un grado entre leve
y moderado, en varias medidas de la memoria existentes en el WJ III COG.
Sin embargo, se han observado diferencias significativas entre los test. En el
factor de memoria a corto plazo, su rendimiento sólo superaba al 14% de sus
243
compañeros. Sus puntuaciones más bajas se daban en el test Números inver-
tido, en el que se le pidió que recordara series de dígitos y los presentara en
orden inverso; su rendimiento superaba al 9% de sus compañeros. En el fac-
tor de Memoria a largo plazo su rendimiento superaba al 9%. En el conjunto
de Memoria de trabajo su rendimiento superaba al 12 % de sus compañeros.
En contraste, en el conjunto de memoria asociativa, su rendimiento estaba en
el nivel medio y superaba al 52% de sus compañeros. Sin embargo existía una
diferencia significativa entre su puntuación de nivel normal bajo en un test
que exigía leer y aprender miniaturas, y medía su capacidad para almacenar y
recordar asociaciones dentro de un contexto (Pt de 83 en el test Aprendizaje
visoauditivo), y su puntuación medio alta en un test que implicaba recordar
los nombres de personajes espaciales (Pt de 114 en el test de Memoria de
nombres). En contraste, en los test que exigían más memoria del lenguaje y de
significados, tales como los test Comprensión de instrucciones y recuerdo de
historias del WJ II ACH, sus puntuaciones estaban en el nivel medio. Cuan-
do se examina el conjunto, su rendimiento en los diferentes test de memoria
sugiere que le resultan más difíciles las tareas que requieren la memoria de
materiales poco significativos (como memorizar los datos de una multiplica-
ción), que aquellas otras que implican la memoria de lenguaje y material con
mayor significado.
Eficiencia cognitiva, rapidez perceptiva y nombrado rápido de dibujos. Las
menores puntuaciones de Martina estaban en instrumentos con tiempo li-
mitado. La eficiencia cognitiva alude a la facilidad con la que el sistema cog-
nitivo puede procesar automáticamente la información, sin necesidad de un
pensamiento consciente y, por lo tanto, este se ve libre para atender a tareas de
razonamiento y pensamiento complejo. Este conjunto implica unas medidas
de la rapidez de proceso y la memoria de trabajo. La rapidez perceptiva alude
a la capacidad para realizar con prontitud tareas simples y frecuentemente
practicadas. Sus resultados en los tests indicaban que su rapidez para procesar
tareas simples superaba solo al 3% de sus compañeros de clase. La puntua-
ción de Martina e el conjunto de eficiencia cognitiva era debida en parte a su
lenta rapidez perceptiva. Para Martina el test más difícil fue el de rapidez de
procesamiento, que implicaba examinar filas de números para encontrar unas
determinadas parejas (test Emparejamiento visual); su puntuación superaba
solo la del 1% de sus compañeros. Además, tuvo dificultades para comprobar
filas de símbolos y encontrar los cinco que se emparejaban (test Cruzado) y
nombrar rápidamente dibujos simples (test Nombrado rápido de dibujos);
en este último test su puntuación superaba solo al 1% de sus compañeros de
clase. Todos estos resultados sugieren que Martina trabajará lentamente en
tareas que requieran un procesamiento rápido de la información.
244
Resultados académicos
Los exámenes escolares indican que Martina ha hecho un considerable
progreso tanto en lectura como en escritura, mientras que tiene problemas
con el dominio de las habilidades y los conceptos básicos en matemáticas.
Lectura y lenguaje escrito. La puntuación de Martina en el conjunto
Lectura general del WJ III estaba en el nivel medio, con una puntuación
superior al 31% de sus compañeros. En general, su disposición e identifi-
cación de palabras eran adecuadas, pero su rapidez para reconocer palabras
era baja. Su puntuación más baja estaba en el test Fluencia lectora, en el que
tenía que leer frases simples (p. ej., “los autos van por el agua”) y decidir si
la respuesta debería ser verdadera o falsa; en este test Martina puntuó en el
nivel normal bajo y su resultado solo superaba al 10% de sus compañeros.
Aunque la precisión de Marta en lectura ha mejorado mucho, su nivel de
lectura es todavía bajo.
Martina obtuvo puntuaciones de nivel medio en todos los test de escri-
tura, con una puntuación en lenguaje escrito general que era mejor que la del
42% de sus compañeros. Parecía que le gustaba escribir y redacto frases con
facilidad y confianza. Fue capaz de escribir con rapidez y facilidad cuestiones
simples (test Fluencia en la escritura). Aunque sus puntuaciones estaban en el
nivel medio, cuando intento escribir unas frases más descriptivas tuvo dificul-
tad para organizar su pensamiento y controlar la ortografía. Se sintió confusa
entre palabras simples: cama y coma; correo y correa.
Matemáticas. Las principales dificultades de Martina están en la adqui-
sición y el dominio de habilidades numéricas básicas. Su puntuación en las
medidas de habilidades para el cálculo numérico solo era mejor que las del
4% de sus compañeros. Actualmente, puede sumar y restar combinaciones de
números de un digito, conoce algo sobre la multiplicación y hace divisiones
simples (p. ej. 10/2). Sin embargo, no tiene unas bases firmes sobre esas ope-
raciones simples.
A causa de sus dificultades en matemáticas en los test del WJ III ACH,
se le aplico el Key-Math versión revisada, un inventario de diagnóstico de
las bases matemáticas. El Key-Math-R tiene 13 tests que miden tres áreas
principales: conceptos básicos, operaciones y aplicaciones. El propósito de la
evaluación era determinar unas metas apropiadas de instrucción para Marti-
na en el campo de las matemáticas. Obtuvo las puntuaciones que aparecen
a continuación en el recuadro siguiente; en las puntuaciones escalares (Pe)
la media es 10 y su desviación típica es 3; en las típicas Pt su media es 100 y
su desviación típica es 15, con sus correspondientes percentiles (Pc) y grado
equivalente.
245
Test Pe
Operaciones
Adición 7
Sustracción 4
Multiplicación 5
División 5
Cálculo mental 5
Conceptos básicos
Numeración 6
Números racionales 9
Geometría 11
Aplicaciones
La medida 8
El tiempo y el dinero 7
La estimación 6
Interpretación de datos 8
Resolución de problemas 8
Áreas Pt Pc Ge
Conceptos básicos 92 30 4,8
Operaciones 73 4 2,7
Aplicaciones 84 14 3,8
Puntuación total 81 10 3,6
Discrepancias en el WJ III
En este instrumento se calculan dos tipos de discrepancias para mostrar
la probabilidad de que una persona obtenga una determinada puntuación: la
diferencia entre las aptitudes (puntos fuertes y débiles entre las aptitudes) y la
diferencia entre aptitud y rendimiento (la aptitud se emplea para estimar el
rendimiento). En las discrepancias entre las aptitudes, la puntuación estimada
se basa en las puntuaciones de la persona en los demás conjuntos de puntua-
ciones d aptitudes y rendimiento. Martina tiene unos significativos puntos
fuertes intrasujeto en procesamiento auditivo y atención fonémica. Cuando
estas aptitudes se comparan con el promedio de las otras aptitudes, solo un
1 por mil de las personas obtendría una puntuación estimada más alta. Esta
aptitud superior ante el sonido sugiere que Martina tiene buena aptitud en
temas como los fonemas, la lingüística, la música y el aprendizaje de una
lengua extranjera. En contraste, cuando su rapidez perceptiva se compara con
las otras aptitudes cognitivas, solo el 3 por mil de los alumnos con igual pun-
tuación estimada obtendría una puntuación tan baja. Esta información, junto
a su lenta capacidad para dar nombres de modo rápido, sugiera que Martina
tiene dificultad para procesar rápidamente tanto la información verbal como
246
la visual. Cuando su aptitud intelectual general y su lenguaje oral general se
comparan con el rendimiento académico, la capacidad numérica para el cál-
culo de Martina presenta una predicción significativamente baja.
Resumen y conclusiones
Recomendaciones escolares
En general
1. Como Martina trabaja con intensidad y desea tener éxito, propor-
ciónele frecuentes alabanzas y dele refuerzos por su trabajo y sus
esfuerzos.
2. Compruebe que Martina se mantenga dentro de un ambiente esco-
lar de apoyo.
3. Anime a Martina para que vaya aumentando su responsabilidad
para terminar las tareas encargadas para hacer en casa.
4. Ayude a Martina a que vaya ganango confianza en sus aptitudes de
aprendizaje. Es una alumna capaz y trabajadora, y seguira haciendo
progresos paulatinos.
247
Terapia escolar y de aula
1. Martina seguirá con provecho la instrucción en una clase normal
de educación, puesto que sus aptitudes intelectuales y sus niveles
de rendimiento en lectura y escritura son comparables a los de sus
compañeros.
2. Seguirá con provecho una instrucción individualizada que atienda
y resuelva sus problemas en las capacidades numéricas básicas, que
aumente su fluencia lectora y que mejore sus habilidades de escritu-
ra y redacción.
3. Martina se esfuerza, completa sus tareas y se lleva bien con sus pro-
fesores y sus compañeros. Su buen rendimiento indica que no ne-
cesita un entorno escolar restrictivo y podrá seguir beneficiándose
de estar en el aula actual o en un centro público, aunque aumenten
mucho las demandas de las tareas para hacer en casa.
4. Si entrase en un centro público, es probable que cumpliese los re-
quisitos exigidos para recibir unos servicios por problemas de apren-
dizaje en el área de aptitudes numéricas básicas.
Ajustes escolares
1. Dada su lenta fluencia lectora y na generalmente lenta rapidez de
procesamiento de la información, Martina necesitará mayor tiempo
en ls test tipificados, así como en algunas de las tareas para hacer en
clase.
2. Dada su lenta fluencia lectora, necesitará ajustes en la cantidad de
lectura que se espera de ella. En vez de ajustar el número de páginas
a leer, sería preferible que se le asigne una cantidad de tiempo para
su tarea lectora.
Consideraciones Finales
248
excluirse aspectos superficiales aplicables a cualquier individuo. En aquellos
casos donde el destinatario sea otro profesional, se recomienda un lenguaje
riguroso y objetivo tanto en el contenido como en los aspectos metodológicos
del informe. Esto facilitará la toma de decisiones por parte del colega y la re-
plicación del examen en caso de que se considere necesario.
En todo momento, tanto en el examen como en la comunicación de los
resultados, debe considerarse el bienestar del examinado. Bajo ninguna cir-
cunstancia se deben descuidar los derechos del examinado y las obligaciones
deontológicas del profesional. En este punto, Múrat (1985) subraya la impor-
tancia de tres principios éticos: el derecho a la privacidad, el consentimiento
informado y la honestidad intelectual. El primero hace referencia al derecho
a guardar toda información relacionada con la vida privada de los examina-
dos, es decir, que el evaluador sólo debe recabar la información estrictamente
necesaria y vinculada al objeto de la consulta o examen. Sumado a ello, el
profesional tiene la obligación de mantener en secreto los datos recabados
y pedir autorización al examinado en caso de que deba comunicar dicha in-
formación a terceras personas. El informe debe ser confidencial y en caso de
querer realizar una exposición pública del mismo se debe pedir autorización a
los evaluados y presentar el caso de manera anónima (sin identificar al sujeto).
El consentimiento informado, por otra parte, consiste en que el sujeto
o cliente acepte voluntariamente a ser examinado. Para ello debe estar infor-
mado acerca de la evaluación, los destinatarios del informe, si la evaluación
fue solicitada por terceros y conocer los límites en el manejo y accionar del
psicólogo. En el anexo de la presente guía se presenta un formato elaborado
por Aiken (2003), para obtener el consentimiento informado y llevar a cabo
un examen psicológico.
El último principio destacado por Múrat (1985) es la honestidad inte-
lectual, el mismo señala que los psicólogos debemos reconocer los límites de
nuestra competencia y de las técnicas empleadas. Este principio exhorta a los
psicólogos a ser claros y precisos en la expresión de los alcances y limitacio-
nes de los resultados obtenidos. Para esto resulta crucial que el examinador
comunique claramente el grado de certeza que posee sobre los contenidos
transmitidos y reconozca los aspectos o variables que escapan a la evaluación
efectuada.
249
|
Apéndice I: ¿Cómo leer artículos de Investigación en
Psicometría? Pautas para una lectura crítica
Leonardo Medrano
Introducción
251
y actualizados, sino también ser usuarios que promuevan el crecimiento de la
investigación científica en nuestro contexto.
A pesar de la importancia de la lectura de artículos científicos, son po-
cos los esfuerzos destinados a promover estas conductas en los estudiantes.
Como señala Carlino (2007), la preocupación por lo poco o mal que leen
los estudiantes suele estar acompañada por la inactividad de los docentes,
cuando en realidad las acciones de lectura y comprensión de los estudiantes
deberían verse acompañada de la experiencia y orientación de los docentes.
Las dificultades para leer artículos de investigación, no proviene de una falta
de habilidad o capacidad, en general los problemas de lectura se deben a que
los estudiantes deben enfrentarse con nuevas “culturas escritas” que exigen
modalidades diferentes de lectura y comprensión. Tomando esto en consi-
deración una forma de estimular la lectura de artículos de investigación en
los estudiantes, se basaría en la transmisión de herramientas que permitan
una adecuada compresión de los textos científicos. De esta manera, el pre-
sente apéndice tiene como objetivo brindar una serie de recomendaciones y
sugerencias que guíen la lectura y favorezcan una mayor comprensión de los
artículos de investigación, más precisamente, artículos de investigación rela-
cionados con la investigación en psicometría.
252
En la introducción de un artículo también se brinda al lector una revi-
sión bibliográfica sobre el tema en estudio. Aunque la revisión bibliográfica
posee diferentes funciones, se caracteriza principalmente por suministrar el
“telón de fondo” del problema de investigación (Pajares, 2007). Dicha revi-
sión debe ser breve y directa presentando los descubrimientos recientes que
sean pertinentes al problema en estudio. De esta forma el autor brinda una
fundamentación teórica sobre la importancia del trabajo, así como un marco
de referencia para comparar los resultados recabados con los conseguidos por
otras investigaciones.
También suele incluirse en la introducción las hipótesis del trabajo. Las
hipótesis son proposiciones contrastables que constituyen las guías del estudio
y nos preparan para interpretar los resultados de la investigación. Por ejem-
plo, “la inducción de estados emocionales positivos y negativos aumentará y
disminuirá, respectivamente, los niveles de autoeficacia académica de los estu-
diantes universitarios” (Medrano, 2010). Tomando en consideración esta afir-
mación es que podemos interpretar los resultados del estudio y determinar si
los mismos se corresponden con la teoría sostenida por el investigador. Dado
que estas proposiciones son derivaciones directas de las teorías consideradas
por el investigador, habitualmente se presentan en esta sección del artículo
junto a la revisión bibliográfica.
En la sección de “Metodología” se describe de manera detallada la se-
cuencia de pasos seguida por los investigadores para poner a prueba las hi-
pótesis de trabajo. Esta sección puede ser considerada como el corazón de la
investigación ya que dependiendo de los pasos seguidos por el investigador
los resultados serán considerados válidos o no. En efecto, existen considera-
bles fuentes de errores que pueden distorsionar los resultados obtenidos. Por
ejemplo, se puede suponer equivocadamente que existen diferencias entre dos
cursos en la ejecución de una prueba, cuando en realidad se comunicaron
diferentes consignas a cada curso. Aunque no existen diseños metodológicos
perfectos, es decir, libres de errores, se deben considerar las posibles fuentes de
error y observar cómo fueron atenuadas. Dentro de ésta sección encontrare-
mos un apartado denominado “procedimientos” donde el investigador descri-
be las fuentes de error identificadas en el estudio y cómo fueron controladas.
Otro apartado incluido dentro de la “Metodología” se denomina “par-
ticipantes”. En esta sub-sección se describe la muestra utilizada, vale decir, el
subconjunto de la población en estudio que participó de la investigación. Es
importante atender a la representatividad de la muestra, ya que de ello de-
penderá que los resultados puedan ser generalizados a personas o situaciones
diferentes de las observadas en el estudio (Pajares, 2007). En esta sección se
presentan datos referidos al método de elección de los participantes (probabi-
lístico vs. no probabilístico), el tamaño de la muestra y las características de la
misma (género, edad, situación socioeconómica, entre otras).
253
Por último, la sección de “Metodología” también incluye información
referida a los “instrumentos” de recolección de datos, esta información es cru-
cial ya que constituye la definición operacional del constructo en estudio. Tal
como señala Pajares (2007), en esta sub-sección se presentan los instrumentos
que se utilizarán, indicando las propiedades psicométricas de los mismos o
bien los estudios psicométricos que se pretenden examinar en caso de que se
trate de un instrumento nuevo.
En la sección de “Resultados” no sólo se provee información sobre los
datos recolectados, sino que también se comunican los procedimientos de
análisis de datos seleccionados. Habitualmente en los estudios instrumentales
se utilizan procedimientos estadísticos, los cuales son brevemente descriptos y
justificados por el investigador. Existen diferentes modos de presentar los re-
sultados de la investigación, generalmente se opta por utilizar gráficos y tablas
para mostrar de manera clara y sintética los datos obtenidos. Sin embargo, los
resultados también pueden ser presentados en el cuerpo del texto.
Finalmente, en la sección de “Discusiones” se presenta una interpreta-
ción de los resultados obtenidos considerando el modelo teórico de base y las
hipótesis presentadas en la introducción del trabajo. En esta sección suelen
indicarse las limitaciones y delimitaciones (Pajares, 2007). Las limitaciones
refieren a las debilidades del estudio, por ejemplo, que la muestra no es repre-
sentativa, o que no se controlaron ciertas fuentes de error o que el instrumen-
to utilizado es poco válido o confiable. Por otra parte, la delimitación refiere
al alcance específico del estudio, vale decir, las acciones que no se efectuaron.
De esta forma el investigador presenta aquí aspectos que serían esperables de
encontrar en el estudio, junto con una clara explicación de las razones por las
que no están presentes. Por ejemplo, “en la presente investigación el tamaño
muestral fue relativamente bajo (N=23), dado que resulta sumamente costoso
realizar análisis de contenido de entrevistas abiertas, lo cual podría modificar-
se en futuras investigaciones utilizando cuestionarios estandarizados” (Medra-
no, Fernández, Galera & Galleano, en prensa).
Generalmente se finaliza la sección de “Discusiones” destacando la im-
portancia del trabajo. Se describe de qué manera el estudio efectuado amplía
los conocimientos en el área de investigación indicando las consecuencias
teóricas, prácticas y técnicas de la investigación. Por ejemplo, en un estudio
realizado por Moriondo, Palma, Medrano, y Murillo, (2012) se lee en el últi-
mo párrafo “cabe destacar el valor heurístico del presente trabajo así como las
importantes implicaciones prácticas del mismo. En efecto a partir de la adap-
tación del PANAS se podrán realizar numerosos estudios tendientes a exami-
nar el rol de las emociones en diferentes ámbitos del ejercicio profesional”. Pa-
jares (2007) sugiere una serie de preguntas útiles para analizar esta sección del
artículo. Alguna de ellas son: 1) qué importancia tienen estos resultados para
la teoría de base?, 2) los resultados tendrán influencia en programas, método
o intervenciones?, y 3) cómo se implementarán los resultados del estudio?.
254
Guía para la Lectura Crítica de Artículos Instrumentales
1. Delimitación conceptual
Una de las principales dificultades en el desarrollo de instrumentos psi-
cométricos es que un mismo constructo puede ser definido de diferentes ma-
neras. Por ello los usuarios de tests no sólo deben conformarse con la etiqueta
denominativa del instrumento, sino que deben realizar un exhaustivo análisis
de los ítems y la definición teórica del constructo evaluado.
Un claro ejemplo puede observarse en el contexto de evaluación de la
inteligencia. De hecho, la escala Weschsler para niños (WISC-IV) supone
la existencia de un factor cognitivo general (factor g) que puede obtenerse a
partir de la sumatoria de puntajes obtenidos en las subescalas de organización
perceptual, memoria de trabajo, comprensión verbal y velocidad de proce-
255
samiento. Por otra parte, el test de Matrices Progresivas de Raven mide el
factor g de inteligencia mediante una serie de ítems no verbales, en los que el
examinado debe responder completando la secuencia faltante de una serie de
figuras. De esta manera puede observarse que ambas escalas miden el mismo
constructo teórico (factor g), pero una de ellas contiene medidas de razona-
miento verbal, mientras que la otra no.
Sumado a lo anterior, debe considerarse que muchas pruebas no poseen
una clara delimitación del constructo o dominio que están evaluando. En
consecuencia, los ítems de la escala resultan ambiguos e inespecíficos, lo cual
trae aparejado puntuaciones imprecisas y cuyo resultado final resulta difícil de
interpretar (Carretero-Dios y Pérez, 2007).
256
un test resultan altamente dificultosos (contestados por menos del 25% de la
población), o muy sencillos (contestados por más del 75% de la población),
la varianza será pequeña y en consecuencia, el test y sus puntuaciones serán
poco fiables ya que los examinados se posicionarán de manera muy similar
respecto al rasgo evaluado (Álvaro, 1997). Por otra parte. si la mayor parte de
los índices de discriminación no resultan estadísticamente significativos, estos
resultados sugieren que la escala no podrá distinguir entre examinados que
poseen en alto grado el rasgo evaluado de los que lo poseen en bajo grado. En
ambas situaciones, se sugiere la búsqueda de escalas alternativas con mejores
propiedades psicométricas.
257
5. Análisis de la confiabilidad
La confiabilidad de un test constituye un criterio crucial al momento de
seleccionar un test. Más aún, se observa en los usuarios una sobrevaloración
de los índices de confiabilidad en relación a otros criterios igualmente relevan-
tes para evaluar las propiedades psicométricas de una escala. Sin embargo, la
justificación de la elección de una prueba no sólo debe basarse en la confiabi-
lidad de la misma, sino que debe considerarse todo el proceso de construcción
del instrumento (Carretero-Dios y Pérez, 2007). De hecho hasta que no se
conozca con exactitud la estructura interna del instrumento, no resulta acon-
sejable efectuar estudios de confiabilidad en la escala.
La confiabilidad hace referencia a la precisión o exactitud de las medi-
ciones de un test. Para determinar la confiabilidad de un test habitualmente
son dos las dimensiones consideradas: 1) la estabilidad de la prueba y 2) la
consistencia interna. Los estudios de estabilidad pretenden evaluar en que
medida el puntaje de un test está libre de errores de medición causados por
los cambios personales aleatorios del examinado, o por los cambios en las
condiciones de administración. El método más utilizado para evaluar esta
dimensión es el método test-retest, el cual consiste en correlacionar dos con-
juntos de datos obtenidos por la aplicación repetida de una misma prueba.
Cuando el objetivo del test es el diagnóstico o la clasificación de personas se
recomienda seleccionar escalas que presenten coeficientes de correlación con
valores superiores a r =.80 (Buela-Casal & Sierra, 1997).
La consistencia interna de un test hace referencia al grado en que los
ítems de una prueba son homogéneos, vale decir miden un mismo constructo.
La homogeneidad de una prueba es deseable en tanto permite una interpre-
tación relativamente directa del rasgo examinado (Cohen & Swerdlik, 2006).
En la actualidad, el coeficiente alfa de Cronbach es el procedimiento más
utilizado para estimar la consistencia interna de una escala (Liu & Zumbo,
2007). Sin embargo, no se observa un acuerdo unánime respecto a que tan
elevado debe ser el valor obtenido para considerar adecuada la consistencia de
una prueba. Por ejemplo, Nunnally y Bernstein (1994) consideran que un va-
lor de α=.95 debe ser la norma aceptable. Por el contrario, Manzano y Tobio
(2003) señalan que un valor de alfa superior a .90 es demasiado alto e indica
redundancia de reactivos. En general, se acepta que estimaciones de .80 o su-
periores son consideradas entre moderadas y elevadas, mientras que puntajes
cercanos a .70 resultan aceptables para fines de investigación (Hogan, 2004).
258
evaluado en un entramado de relaciones teóricas con otros constructos. Es de-
cir, obtener evidencias de que el constructo medido se relaciona con variables
con las que se esperaría que esté relacionado.
Según Carretero-Dios y Pérez (2007), las evidencias externas de validez
se basan en el análisis de las relaciones entre las puntuaciones obtenidas de
la prueba y: 1) criterios externos con los que se espera que exista relación (una
escala que mide Ansiedad ante los Exámenes debería asociarse de manera in-
versa con el Rendimiento Académico de los estudiantes, por ejemplo), 2) otros
test con el mismo objetivo de medición o con otros constructos con los que
se esperaría relación (las puntuaciones de una escala de Habilidades Sociales
deberían relacionarse positivamente con las puntuaciones obtenidas por los
mismos sujetos en una escala de Extraversión de un inventario de personali-
dad, por ejemplo) y 3) otros test con los que se esperaría ausencia de relación o
bien menor que la esperada con otras variables (por ejemplo, las puntuaciones
en una escala que mida Bienestar Psicológico deberían relacionarse de manera
negativa o no significativa con una escala que mida Depresión).
Dado que no existe una estrategia metodológica única para obtener este
tipo de evidencia, ya que se pueden utilizar estudios experimentales o no
experimentales, no es posible especificar criterios generales para evaluar este
tipo de evidencia. Por ello, lo que se sugiere en este punto es examinar si los
autores del test han justificado correctamente las relaciones evaluadas del test
con otros constructos ya sea a través de modelos teóricos o resultados empíri-
cos de investigaciones previas.
Consideraciones Finales
260
|
Apéndice II: Revisión de Conceptos y
Procedimientos Estadísticos
Leonardo Medrano y Edgardo Pérez
261
afirmar que las personas tienden a acordarse alrededor de 7.5 palabras, algu-
nas personas recuerdan más palabras y otras menos, pero en general los valores
obtenidos son cercanos a 7.5. Tal como puede apreciarse la media no debe ser
una observación real, en efecto es imposible que una persona se acuerde 7 pa-
labras y media. El valor 7.5 simplemente está reflejando el punto de equilibrio
de todos los datos obtenidos.
Desviación estándar
El escritor George Bernard Shaw solía decir que “la estadística es una
ciencia que demuestra que, si mi vecino tiene dos coches y yo ninguno, los
dos tenemos uno”. Este chiste puede ser cierto si el usuario sólo contempla el
valor de la media, pero ignora los valores relacionados con la varibilidad. Ade-
más de conocer la tendencia central en un conjunto de datos el investigador
debe atender a la dispersión de los mismos. Imaginemos que estamos intere-
sados en comparar el rendimiento de dos cursos de alumnos y obtenemos los
siguientes valores:
Grupo 1: 8 8 8 8 8
Grupo 2: 7 9 6 10 8
262
desviación estándar simplemente debemos calcular el promedio de los desvíos
cuadráticos y luego la raíz cuadrado del mismo. Al hacerlo obtenemos, ahora
sí, la desviación promedio o estándar la cual es igual a 1.87. Esto quiere decir
que si bien la media de palabras recordadas es 7.5, se observa una desviación
promedio de 1.87. Pasando esta información a valores netos podemos decir
que las personas tienden a recordar 7± 2 palabras, es decir entre 5 y 9 palabras.
263
Muestra y Muestreo
Los conceptos de muestra y muestro son de gran importancia en el
campo de la estadística, aunque con frecuencia se confunden. Hasta ahora los
conceptos mencionados tenían un fin meramente descriptivo, su uso se res-
tringía a reducir información y hacerla interpretable. Sin embargo, la estadís-
tica también posee un alcance inferencial, es decir, pretende extender nuestros
hallazgos sobre datos no observados. Este proceso inferencial es sumamente
común en nuestra vida cotidiana. Supongamos que vamos a una fiesta y nos
invitan a comer un plato de comida china que nunca hemos probado. Imagi-
nemos que el plato incluye 5 “rollos” o “maki”. Si probamos 1 de los 5 maki
y no nos gusta, seguramente no necesitaremos comer todos los “maki” para
concluir que no nos gustan. Bastaría con probar una “muestra” es decir un
sub-conjunto de la totalidad de “maki” (la población) para realizar una con-
clusión general.
La lógica subyacente en un proceso inferencial es que si tomamos un
sub-conjunto de una población, y si esta muestra es representativa, las conclu-
siones que obtengamos de la misma pueden luego extenderse a la población
aun cuando no hayamos analizado a la totalidad de la población. Ahora bien,
el punto clave en este razonamiento es que la muestra debe ser “representa-
tiva”, ¿qué ocurriría si justo el “maki” que probamos estaba en mal estado?
Quizás concluiríamos erróneamente que toda la población de “maki” es desa-
gradable cuando en realidad solo hubo un error en la selección de la muestra
¿Qué garantiza entonces que una muestra sea representativa? En este punto es
donde cobra importancia el concepto del muestreo, entendido como el proce-
so por medio del cual se selecciona a los elementos que conformarán la mues-
tra. Este es un punto de suma importancia ya que con frecuencia se tiende a
pensar que solo el tamaño de la muestra es lo que otorga representatividad, lo
cual lleva a cometer graves errores al momento de extender los resultados al
resto de la población.
Supongamos un ejemplo real; en el año 2008 se publica una nota en
el diario La Voz del Interior donde se titula que entre los infectados de HIV
de la Universidad Nacional de Córdoba (UNC) el 60% son mujeres y que
habría 305 estudiantes con HIV en toda la universidad (figura 1). Entre las
afirmaciones que se incluyen en la nota se escribe que “la UNC tiene caracte-
rísticas similares a las de África” y que “las cifras implican que se trata de un
grupo que está avanzado en la epidemia”. Asimismo, se afirma que partici-
paron 1710 estudiantes y que “la muestra es estadísticamente representativa,
por lo cual los resultados podrían extrapolarse al conjunto de la población
universitaria”. Sin embargo, estas afirmaciones son altamente discutibles. En
primer lugar, porque más allá del tamaño de la muestra para determinar la
representatividad de la misma es crucial el muestreo es decir ¿cómo se selec-
cionaron los participantes? En efecto existe mucha diferencia entre un mues-
264
treo probabilístico donde los participantes se seleccionan por azar (y por ende
todos tienen la misma probabilidad de ser seleccionados), y un muestreo no
probabilístico donde la selección no es por azar (y por ende no se puede ga-
rantizar posibilidades homogéneas de selección).
Tal como se afirma en la nota citada “los datos provienen del testeo
voluntario”, es decir que los estudiantes interesados en conocer si estaban
infectados o no de HIV se dirigían a la universidad para realizarse el estudio.
Este tipo de muestreo no es probabilístico y en consecuencia no garantiza
que la muestra sea representativa de la población. De hecho se trata de un
muestreo “autoconformado” dado que la decisión de formar parte o no de la
muestra queda en manos de los participantes y no del investigador. ¿Podemos
suponer que los estudiantes que están interesados realizarse un estudio para
conocer si tienen HIV son igualmente representativos que los estudiantes que
directamente optan por no participar? ¿No sería acaso riesgoso extender los
resultados obtenidos al resto de la población?
Cabe señalar que, si bien los muestreos no probabilísticos son muy uti-
lizados en el campo de las ciencias sociales, debemos tener especial cuidado
al momento de extender los resultados observados en la muestra al resto de la
población. En la not ejemplificada los autores concluyen que el 60% de los
infectados son mujeres y que habría 305 estudiantes con HIV en la población
universitaria. La base para concluir esto es que de los 1710 estudiantes de la
muestra 5 presentaron HIV. Como 2 eran hombres y 3 mujeres concluyeron
que el 60% de los infectados son mujeres, y como 5 de 1710 es el 0.29%, esti-
man que este mismo valor se obtendría a nivel poblacional. Esta extensión de
los resultados los lleva a concluir que existirían 305 estudiantes con HIV en
la población (es decir el 0.29% de 105 mil que es el total de estudiantes de la
UNC). Como puede observarse en el ejemplo dichas conclusiones no se sos-
tienen en los datos, por el contrario, se podría señalar que se está cometiendo
un error en el proceso de inferencia dado que se extienden los resultados de la
muestra a la población, sin considerar que el muestreo utilizado no garantiza
una adecuada representatividad.
265
Puntaje Z
Una práctica habitual en psicología es la de estandarizar variables, que
conlleva transformar una variable a una métrica en común para poder com-
parar observaciones de variables medidas en diferentes escalas. La relevan-
cia de este concepto es doble, ya que en sí mismo constituye un método de
importancia para interpretar puntuaciones, pero además constituye un paso
clave para determinar si dos variables (medidas con diferentes escalas) se rela-
cionan entre sí. Supongamos que me interesa conocer la relación entre el nivel
de agotamiento laboral de una persona y su satisfacción laboral, y que para
averiguarlo mido ambas variables mediante un test psicométrico, observando
que una persona posee un valor de 45 de agotamiento y 17 de satisfacción
laboral. ¿Se trata de un valor alto, bajo o medio? Esto no puede determinarse
dado que el tipo de escala del test (escala intervalar) no posee cero absoluto,
por lo cual el puntaje 75 será relativo a la puntuación obtenida por el resto
de las personas en dicha escala. Suponiendo que el promedio de la población
obtuvo una puntuación de 45, en este caso el puntaje 75 es alto, por el con-
trario, si el promedio de la población obtuvo un puntaje de 90, el valor 75 es
bajo. En ausencia de datos interpretativos adicionales la puntuación bruta de
una prueba psicológica carece de significado, la manera tradicional de resolver
este problema surge de la utilización de los puntajes Z (Anastasi y Urbina,
1998). Las puntuaciones Z, se definen como un modo de transformación
de los puntajes originales que permite al investigador estandarizar los valores
obtenidos con el objeto de poder comparar observaciones de variables medi-
das en diferentes escalas (Everitt y Wykes, 2001). La transformación de los
puntajes consiste en utilizar la desviación estándar como unidad de medida.
Para calcular una puntuación Z se resta una constante (la media) a cada pun-
taje bruto y se divide el resultado en otra constante (la desviación estándar),
lo cual permite mantener las relaciones numéricas exactas de las puntuaciones
originales (Cortada de Kohan, 1994).
Las ventajas de estas puntuaciones, sumamente utilizadas en psicología,
son principalmente dos: 1) no modifica la forma de la distribución de fre-
cuencias originarias, y 2) las puntuaciones Z obtenidas en dos o más variables
pueden ser comparadas directamente entre sí, dado que comparten un origen
(la media aritmética) y una unidad de medida (la desviación estándar).
Correlación
Con frecuencia se debe determinar si dos variables co-varían, es decir,
si los cambios en una variable se ven acompañados por cambios en la otra
variable. Para determinar de manera precisa si dos variables están o no corre-
lacionadas podemos apelar al uso de procedimientos estadísticos, como por
ejemplo el cálculo de un coeficiente de correlación r de Person. Este coeficien-
266
te permite determinar la dirección y magnitud de una relación. La dirección de
una correlación va a depender del patrón de la relación, podemos hablar de
una correlación positiva cuando el aumento de una de las variables se asocia
a un aumento en la otra variable (por ejemplo, a mayor sobrecarga laboral,
mayor estrés). Por el contrario, hablamos de una dirección negativa cuando
los valores altos de una variable coinciden con los bajos de la otra variable y
viceversa (por ejemplo, a mayor consumo de alcohol, menor equilibrio).
El segundo componente que se analiza en un coeficiente de correlación
r de Pearson es la magnitud o grado de la correlación, el cual hace referencia
a la fuerza o intensidad de la relación. El grado de correlación indica en qué
medida existe un patrón claro de relación, este patrón dependerá de la canti-
dad de coincidencias entre los valores de las variables. Se puede hablar de una
relación prfecta cuando un cambio determinado en una variable es acompa-
ñado por un determinado cambio en la otra, en esta situación un valor en la
variable X conduce siempre a un mismo valor en la variable Y. Si esto ocurre
al representar gráficamente los datos en un gráfico de dispersión se observa
que todos los puntos están en una línea recta. Un coeficiente de correlación
expresa de manera cuantitativa la magnitud y dirección de una correlación. El
coeficiente puede variar de -1 a +1. El signo indica si la dirección es positiva
o negativa, mientras que el número describe la magnitud (valores cercanos a
1 indican mayor intensidad, mientras que cercanos al 0, menor intensidad).
El coeficiente de correlación de Pearson (o también denominado coefi-
ciente de correlación producto momento de Pearson) se define como el pro-
medio de los productos cruzados de puntuaciones Z (Aron y Aron, 2001). La
fórmula del coeficiente de correlación es:

267
con negativos y negativos con positivos se originan productos negativos. Este
es el caso de la correlación negativa o inversa. Finalmente, puede suceder que
existan coincidencias en algunos casos y no existan en otros, en esta situación
al sumar los productos cruzados negativos en algunos casos, y positivos en
otros, se observa una cancelación entre los productos llevando a un resultado
cercano a cero. Esto sucede cuando no existe correlación entre las variables.
En conclusión, si al multiplicar dos puntuaciones Z de un mismo grupo
de personas, sumar los productos cruzados y calcular el promedio se obtiene
un número positivo, existe una correlación positiva, si se obtiene un número
negativo, existe una correlación negativa, finalmente, si se obtiene un valor
cercano al cero, no existe correlación.
Regresión múltiple
El análisis de regresión múltiple permite ponderar la contribución inde-
pendiente realizada por cada predictor para la explicación de un criterio deter-
minado. La ecuación de regresión múltiple se basa en la correlación de cada
variable con el criterio, pero también informa sobre las correlaciones entre las
variables predictoras. Las pruebas que correlacionan más alto con el criterio
reciben más peso en la ecuación, pero es igualmente importante considerar la
correlación con las variables restantes. Cuando las variables correlacionan alto
entre sí representan una duplicación innecesaria puesto que explican casi los
mismos aspectos del criterio.
Los estadísticos fundamentales del análisis de regresión múltiple son: a)
los coeficientes de regresión estandarizados (ß), que indican cual es la impor-
tancia relativa de cada variable independiente en la predicción de la variable
dependiente; b) el coeficiente de correlación múltiple (R) que expresa el gra-
do de asociación entre dos o más variables independientes (predictoras), en
conjunto, con una variable dependiente; c) el coeficiente de regresión múlti-
ple al cuadrado (R2), que permite determinar el porcentaje de varianza de la
variable dependiente explicada en conjunto por las variables independientes
(predictoras) de la ecuación, y d) el cambio en R2 que indica el porcentaje de
varianza de la variable dependiente explicada independientemente por cada
uno de los pasos (ingresos de predictores) de la ecuación de regresión. Esta-
dísticos adicionales como el análisis de la comunalidad y los coeficientes de
correlación semiparcial son también muy útiles para interpretar los resultados
del análisis de regresión múltiple, refinando la comprensión de la varianza
explicada específica de cada predictor sin estar contaminada por la varianza
común (compartida por los predictores).
Lo que incrementa el coeficiente de correlación múltiple al añadir una
variable predictora a la ecuación de regresión es precisamente la correlación
268
semiparcial de esa variable predictora (inteligencia, por ejemplo) con el cri-
terio (rendimiento académico, por ejemplo) controlando la influencia de las
restantes variables predictoras (motivación, por ejemplo) sobre ese predictor
(inteligencia, en este caso). En el contexto del análisis de regresión múltiple el
coeficiente de correlación semiparcial indica el grado de asociación existente
entre la variable dependiente y la parte de la variable independiente que no
está explicada por el resto de las variables independientes de la ecuación de re-
gresión. Existen varios procedimientos de análisis de regresión múltiple, pero
los dos más empleados son el análisis de regresión jerárquico o secuencial y el
análisis stepwise (Tabachnick y Fidell, 2001).
En el análisis de regresión jerárquico las variables predictoras son ingre-
sadas a la ecuación de predicción en el orden lógico sugerido por la teoría y
es el procedimiento más recomendable. Así, por ejemplo, si un investigador
quisiera predecir el rendimiento académico utilizando tests de aptitudes y de
autoeficacia, las medidas de aptitudes deberían ser ingresadas primero puesto
que son una de las fuentes antecedentes de la autoeficacia y, posteriormente,
ingresar las medidas de este último constructo.
El método stepwise se aplica en las fases exploratorias de investigación,
cuando no existe un modelo teórico explícito respecto a las interrelaciones
entre las variables. En este método, el programa de computación (SPSS, por
ejemplo) selecciona primero la variable independiente que presenta la co-
rrelación más elevada con la dependiente. El proceso continúa hasta que la
incorporación de variables al modelo no implica una mejora significativa en la
predicción (Aron y Aron, 2001). Este método posee limitaciones que lo hacen
poco recomendable excepto con fines exploratorios o para encontrar la mejor
ecuación de predicción de una variable sin importar su significado teórico.
Una de las principales dificultades es que los resultados son muy dependientes
de las características de la muestra empleada en una investigación determina-
da. En efecto, el orden de ingreso de las variables que determina el programa
puede depender de diferencias triviales en las relaciones entre los predictores
en una muestra en particular que no reflejan diferencias reales en la población
(Tabachnick y Fidell, 2001).
El análisis de regresión múltiple pese a su relativa sencillez (comparado
con otros métodos multivariados) posee una serie de supuestos exigentes que
el investigador debe respetar para interpretar inequívocamente los resultados.
Entre ellos cabe mencionar el tamaño muestral requerido (104 casos más el
número de variables independientes incluidas en el modelo como regla gene-
ral), el análisis de los casos con valores extremos en las variables (outliers), la
ausencia de multicolinearidad (correlaciones elevadas entre los predictores), la
distribución normal de todas las variables, la linealidad de las relaciones entre
las variables y la adecuada confiabilidad de las medidas empleadas (Tabach-
nick y Fidell, 201).
269
Los diferentes métodos del análisis de regresión múltiple son potentes
para estimar la predicción de una variable dependiente pero no tanto para
reflejar las interrelaciones entre las variables independientes incluidas en el
modelo. Estas limitaciones son subsanadas con el empleo del método de aná-
lisis de senderos (path analysis), un procedimiento especial del Modelo de
Ecuaciones Estructurales, que permite comprender con más claridad la red de
intercorrelaciones entre las variables y determinar no sólo las contribuciones
directas a la explicación de una variable, sino tabién las indirectas (Tabachnick
y Fidell, 2001).
a= 1− 2
k − 1 st
Donde
k = número de ítems de la prueba
k ∑ ssi2 = sumatoria de la varianza de cada ítem
2
a= 1− 2 i
k − 1 2st
st = varianza del total de las puntuaciones del test.
Coeficiente Kappa
Este coeficiente se utiliza habitualmente para estimar la concordancia
entre observadores, es decir, hasta qué punto los jueces coinciden en su pun-
tuación considerando el porcentaje de acuerdos que se observarían solamente
por azar. La fórmula de kappa es:
F
c −F
a
K=
N−Fa
Donde, Fc son las frecuencias de coincidencias o número de casos en
los que las clasificaciones de ambos jueces coinciden. Se obtiene sumando las
celdas que representan los casos que fueron evaluados de la misma manera
por ambos jueces. Fa son las frecuencias de azar, o número de casos en que
270
cabe esperar que las clasificaciones de los jueces coincidan por mero azar, y
se obtienen mediante la sumatoria de los productos de los subtotales de cada
categoría sobre el número de casos. N es el número total de casos evaluados
por los jueces.
La máxima concordancia posible corresponde a k = 1. El valor k = 0
se obtiene cuando la concordancia observada es la que se espera exclusiva-
mente del azar. A la hora de interpretar el valor de k se suele considerar que
un coeficiente de acuerdo de .80 o superior sugeriría que el test en cuestión
permite una interpretación unívoca de sus resultados independientemente del
evaluador.
Análisis factorial
En términos generales, el análisis factorial (AF) es el nombre genérico
con que se designa a un conjunto de métodos estadísticos multivariados de
interdependencia cuyo propósito principal es el de identificar una estructura
de factores subyacentes a un conjunto amplio de datos. Si bien constituye una
técnica ampliamente utilizada en ciencias sociales, posee especial relevancia
en el campo de la psicometría. En efecto, el paso decisivo para verificar la
estructura interna de cualquier escala, así como para seleccionar y otorgar sig-
nificado teórico a un conjunto inicial de ítems de un test es el AF (Martínez
Arias, 1995). Este método multivariado permite agrupar las variables (ítems,
por ejemplo) que se correlacionan fuertemente entre sí, y cuyas correlaciones
con las variables de otros agrupamientos (factores) es menor.
Según Kline (2000), mediante el AF la variabilidad de las puntuaciones
de un conjunto de variables es explicada por un número más reducido de di-
mensiones o factores. De este modo, por ejemplo, una gran cantidad de ítems
de tests puede reducirse a un número pequeño de factores o dimensiones (ap-
titud verbal, extraversión, por ejemplo) que confieran un significado teórico
a la medición. Cada uno de estos factores agrupa a los ítems intecorrelaciona-
dos que son, al mismo tiempo, relativamente independientes de los restantes
conjuntos (factores) de ítems.
Como otras técnicas estadísticas, el AF se inicia con los trabajos de
Galton (1889) quien propuso el concepto de rasgo latente para explicar por
qué un conjunto de variables se encontraba relacionadas. Según este autor, el
hecho de que dos variables se encuentran relacionadas entre sí proviene del
hecho que ambas variables poseen algo en común y algo que las diferencia. De
esta manera, la varianza total de una variable se debe a factores que comporte
con las otras variables (comunalidad) y a factores específicos de la variable
(especificidad). A partir de esta idea se sostiene la lógica del AF, vale decir, si
un conjunto de variables, se encuentran correlacionadas entre sí, estas relacio-
nes recíprocas se deben a que poseen un factor o rasgo latente en común, y
271
además, dicho factor explica en parte la varianza de las variables o indicado-
res medidos (Blalock, 1966). Teniendo esto en consideración, Galton (1889)
afirmó que debía desarrollarse una técnica que permitiera descubrir estos fac-
tores o variables latentes subyacentes.
Como se mencionó con anterioridad el AF constituye una designación
genérica. Dentro de los métodos de AF cabe diferenciar el Análisis Factorial
Exploratorio (AFE) y el Análisis Factorial Confirmatorio (AFC). La diferen-
cia principal entre ambos análisis es que en el AFE el investigador no conoce
la estructura subyacente al conjunto de variables y su interés radica en encon-
trar un número de factores (en principio indeterminado) que expliquen las
correlaciones observadas entre las variables. Por el contrario en el AFC el in-
vestigador posee hipótesis explícitas sobre la estructura latente de las variables.
Los conocimientos para la formulación de hipótesis están basados en la teoría,
la investigación empírica previa o ambas.
Tal como señalan Barbero García, Vila Abad y Holgado Tello (2011), el
AFE no permite incorporar restricciones sobre la forma en que se relacionan
los indicadores con los factores subyacentes. Dichas limitaciones son supera-
das por el AFC donde el investigador puede imponer restricciones sobre la
manera en que se relacionan los indicadores con los factores, e incluso acotar
parámetros del modelo a valores determinados. Cabe destacar que dichas res-
tricciones se efectúan partiendo de un modelo teórico de base. Por lo cual en
el AFC se trabaja con hipótesis que posteriormente serán contrastadas, mien-
tras que en el AFE se carece de hipótesis. Para llevar a cabo un AFC se deben
considerar las siguientes fases:
1. Especificación del Modelo: Consiste en establecer un modelo formal
que en esencia es una explicación teórica plausible de por qué las
variables están o no relacionadas. Esta primera etapa depende fun-
damentalmente del conocimiento teórico sobre el fenómeno a abor-
dar. De esta manera el investigador debe conocer de antemano 1)
El número de variables latentes, 2) las saturaciones factoriales, y 3)
la covarianza entre los factores. Con esta información se construye
un sistema de ecuaciones que expresa cada elemento de la matriz de
covarianza en función de los parámetros del modelo. Generalmen-
te, es preferible la utilización de diagramas para representar teorías
que involucran muchas relaciones (este aspecto se desarrollará con
mayor detenimiento en el apartado de Ecuaciones Estructurales).
2. Identificación del Modelo: Implica verificar si se posee la suficiente in-
formación en los datos muestrales para estimar los parámetros del mo-
delo especificado. Se deben calcular la cantidad de grados de libertad
del modelo (gl) a partir de la diferencia entre el número de momentos
distintos de las matrices de varianza y covarianza (relaciones posibles
entre las variables observables) y la cantidad de parámetros a estimar. El
272
modelo puede clasificarse como:1)sub-identificado (gl<0), 2) identifi-
cado (gl=0) o, 3) sobre-identificado (gl>0). Sólo aquellos modelos con
menor cantidad de parámetros que varianzas y covarianza en la matriz
observada (gl>0), son susceptibles de ser estimados y contrastados.
3. Estimación de los Parámetros: La etapa de estimación consiste en obtener
los valores de los parámetros especificados en el modelo a partir de las
varianzas y covarianzas muestrales. El proceso de estimación apunta a la
obtención de aquellos valores de los parámetros que proporcionen una
matriz reproducida que ajusten lo mejor posible a la matriz observada.
Aunque existen muchos métodos de estimación el método de máxima
probabilidad es el más recomendado cuando los datos presentan una
distribución normal multivariada.
4. Evaluación del Ajuste del Modelo: durante esta etapa se efectúa un diag-
nóstico con el fin de determinar si el modelo especifica correctamente
las relaciones entre las variables analizadas. Un modelo “correcto” con-
duce a diferencias reducidas entre las varianzas y covarianzas observadas
y las reproducidas por el modelo, es decir, una predicción adecuada de
la realidad (Hair et. al., 1999). La literatura especializada recomienda
el uso de múltiples indicadores de ajuste. Una revisión de los valores
críticos para determinar el ajuste del modelo se presenta en el apartado
de Ecuaciones Estructurales.
5. Re-especificación del Modelo: A menudo el modelo inicial no se ajusta
adecuadamente a los datos, lo cual puede deberse a inclusiones o exclu-
siones incorrectas de parámetros. Se recomienda re-espesificar el mo-
delo atendiendo a los residuos, especialmente los mayores. Los índices
de modificación indican cuanto decrecería el valor de c2 si se liberase el
parámetro. Se recomienda ser muy cauto en este punto para no termi-
nar con modelo que presenten un buen ajuste a los datos pero un pobre
fundamente teórico.
Ecuaciones Estructurales
El análisis mediante ecuaciones estructurales (SEM) parte de la premi-
sa que las covarianzas pueden proporcionar información sobre las relaciones
causales. Aunque la existencia de covarianza brinda información insuficiente,
dado que existe una multitud de efectos posibles que pueden provocarla, se
considera que es posible dilucidar la causalidad mediante el uso del control
estadístico y la selección de efectos guiada por criterios teóricos. La lógica sub-
yacente consiste en descomponer la covarianza entre las variables para obtener
información sobre los parámetros del proceso causal subyacente.
De esta manera, utilizando reglas de descomposición y seleccionando
posibles fuentes de covariación, se establece de forma intuitiva la relación
273
entre los parámetros y las covariaciones. Por ejemplo, si se observa covarianza
entre ansiedad (A) y autoeficacia social (AS), esta relación podría deberse a
que la ansiedad influye sobre la autoeficacia social, que la autoeficacia social
influye sobre la ansiedad o que otras variables están afectando la covariacion
entre ls mismas (por ejemplo, un sesgo cognitivo; SC). Dado que existen
muchas relaciones causales que podrían explicar la covarianza entre A y AS,
por medio de criterios teóricos se elige uno de los posibles nexos causales. Por
ejemplo, un modelo que plantea que los sesgos cognitivos afectan la autoefi-
cacia social y esto aumenta la ansiedad.
Una vez seleccionada la posible relación causal entre las variables, se
procede a estimar los parámetros de la relación considerando las reglas de
descomposición de la varianza y utilizando métodos de estimación (máxima
probabilidad, por ejemplo).
Básicamente existen dos reglas de descomposición: 1) la covarianza en-
tre dos variables es igual a la suma de los efectos directos, indirectos, espúreos
y conjuntos, 2) la varianza de una variable dependiente es igual a la varianza
debida a la perturbación, más la varianza explicada por otras variables del mo-
delo. Mediante el uso de dichas reglas se construye un sistema de ecuaciones
estructurales que expresa cada elemento de la matriz de covarianza en función
de los parámetros del modelo. En otras palabras, dichas ecuaciones imponen
una forma o estructura determinada a la matriz de varianza y covarianza de la
población bajo estudio (Batista Foguet & Gallart, 2000).
El SEM constituye una técnica de gran utilidad para el desarrollo de
modelos conceptuales, ya que permite poner a prueba modelos hipotéticos
y mediante el contraste empírico adquirir nuevos insights teóricos que de-
puren el modelo inicialmente especificado. A su vez, el uso de teorías bien
fundamentadas y sostenidas por la evidencia empírica, favorecen una mejor
aproximación a la realidad. De esta manera, el SEM podría conceptualizarse
como una técnica que mediatiza el proceso de ida y vuelta entre el desarrollo
teórico y los hechos de la realidad (Blalock, 1994).
Las fases para llevar a cabo un análisis SEM son las mismas que para el
AFC. No obstante en el presente apartado se desarrollarán con mayor profun-
didad algunos de los pasos anteriormente descriptos.
1. Especificación del Modelo: tal como se señaló con anterioridad en
esta etapa el investigador establece cuáles serán las variables que se
incluirán en el modelo explicativo y cuál es la relación que existe en-
tre ellas. Esta primera etapa depende fundamentalmente del conoci-
miento teórico sobre el fenómeno a abordar. Con el fin de no obviar
potenciales variables importantes algunos investigadores tienden a
incluir en el modelo variables poco relevantes o fundamentadas teó-
ricamente. La mera inclusión de variables también constituye un
error de especificación ya que puede llevar a desarrollar modelos
274
poco parsimoniosos y de bajo valor explicativo.
2. Identificación del Modelo: los autores Weston y Gore (2006) advier-
ten que antes de recolectar los datos, se debe determinar si un mo-
delo está correctamente identificado. Esta etapa consiste fundamen-
talmente en determinar si se cuenta con la cantidad suficiente de in-
formación para contrastarse el modelo. Para ello los investigadores
deben calcular los grados de libertad del modelo, el cual se obtiene
restando el número de parámetros a ser estimado, del número de
elementos conocidos de la matriz de correlación. Esto se logra me-
diante la siguiente fórmula:
3. gl= ½ x (Nº de variables observadas x (Nº de variables observadas +
1)) – Nº parámetros a estimar
4. Cabe recordar que solo si el modelo se encuentra sobre-identificado
se puede proceder con la estimación de los valores de los parámetros
especificados a partir de las varianzas y covarianzas muestrales.
5. Estimación del Modelo: El método más común de estimación es del
de máxima verosimilitud (ML, Maximum Likelihood), siempre
que se cumplan los supuestos referidos, tales como disponer de una
muestra de tamaño adecuada, medidas al menos de nivel intervalar,
y distribución normal multivariada. No obstante, este método es
robusto a ligeras desviaciones de la distribución normal (valores de
hasta 70 en el coeficiente Mardia, Rodríguez Ayán y Ruiz, 2008;
Bentler, 1995). En caso de existir mayores alejamientos de la distri-
bución normal se sugiere transformar los datos, utilizar métodos de
bootstrapping o aplicar métodos de estimación alternativos como
de Distribución Asintótica Libre (ADF, Assintotic Distribuccion
Free). Aunque este último requiere de muestras de gran tamaño (su-
periores a 500 participantes).
6. Evaluación del Modelo: La evaluación del ajuste tiene por objeto de-
terminar si las relaciones entre las variables del modelo estimado
reflejan adecuadamente las relaciones observadas en los datos (Wes-
ton & Gore, 2006). Los investigadores deberían evaluar el ajuste en
términos de (a) magnitud y significación de los parámetros estima-
dos, (b) varianza explicada por las variables, y (c) ajuste del modelo
a los datos. Existen tres tipos de estadísticos de bondad de ajuste, los
de ajuste absoluto (chi cuadrado por ejemplo), los de ajuste relativo
que comparan el ajuste respecto a otro modelo (CFI, por ejemplo) y
los de ajuste parsimonioso que valoran el ajuste respecto al número
de parámetros utilizados (NFI, por ejemplo). Ninguno de estos es-
tadísticos de ajuste aporta toda la información necesaria para valorar
el modelo, por lo cual habitualmente se utiliza un conjunto de ellos
simultáneamente. En la tabla 2 se sintetizan algunos de los estadís-
275
ticos de ajustes más utilizados y algunos valores críticos sugeridos
por la literatura (Bentler, 1995 y Byrne, 2001). Cuando se trata de
muestras de tamaño igual o inferior a 250 participantes, Hu y Bent-
ler (1999) sugieren utilizar solamente los índices de ajuste CFI y
SRMR. Si se desea comparar el ajuste relativo de dos o más modelos
alternativos la mayoría de los autores recomiendan utilizar el Crite-
rio de Información de Akaike (AIC; Akaike, 1987). El índice AIC
ajusta el estadístico chi-cuadrado al número de grados de libertad
del modelo. Valores inferiores de AIC para un modelo indican su
relativo mejor ajuste respecto a los modelos alternativos.
7. Re-especificación del Modelo: Finalmente, a los fines de mejorar el
ajuste el investigador podrá efectuar la re-especificación del modelo.
Es importante que las decisiones de añadir o eliminar parámetros
sean coherentes con la teoría subyacente al modelo de medición
propuesto. Para realizar una re-especificación se sugiere explorar los
índices de modificación de los parámetros individuales y un análisis
pormenorizado de los residuos. El valor del índice de modificación
corresponde aproximadamente a la reducción en el que se produ-
ciría si el coeficiente fuera estimado. Un valor > 3.84 sugiere que se
obtiene una reducción estadísticamente significativa en el cuan-
do se estima el coeficiente. La existencia de residuos elevados entre
parejas de variables ( 2.58) señalarían la necesidad de introducir
parámetros adicionales susceptibles de explicar la relación entre las
variables en cuestión.
276
|
Apéndice III: El uso de Biomarcadores como
complemento de la Evaluación Psicológica
Luis Pedro Morera y Leonardo Medrano
Introducción
277
rán desencadenando una serie de respuestas neurofisiológicas, bioquímicas y
comportamentales ya sea que tengas que dar una conferencia magistral frente
a un auditorio repleto o que te asuste el perro del vecino. Resulta lógico en-
tonces que, en el estudio de éste y otros procesos complejos, la cuantificación
de marcadores biológicos juegue un rol protagónico como complemento de
la evaluación psicológica.

Figura 1. Sustrato biológico implicado en el Sistema de Respuestas al Estrés
Pros y contras
En el campo del estrés, desde la psicología, se han desarrollado nume-
rosos instrumentos para la evaluación del estrés (Moretti & Medrano, 2014).
Existen más de 150 instrumentos de auto-reporte que evalúan estrés (Ko-
calevent et al., 2007), además de entrevistas clínicas y otros procedimientos
subjetivos de evaluación. Sin embargo, inclusive las herramientas más confia-
bles en evaluación psicológica, tales como los test psicológicos, poseen limi-
taciones importantes. La distorsión y sesgos de quien contesta cuestionarios
auto-administrados es uno de los factores que más afecta la validez de los
278
mismos. Por ejemplo, las personas tienden a responder de tal manera que se
los presenta de una forma más favorable, incluso si sus respuestas no reflejan
exactamente cómo piensan o se comportan (respuestas socialmente deseables
(Paulhus, 1991). De acuerdo con (Schwarz, 1999) “los auto-informes son
una fuente falible de datos, y cambios menores en la redacción el formato o
el contexto de las preguntas pueden resultar en cambios importantes en los
resultados obtenidos”.
Su simplicidad al momento de ser interpretados, fácil aplicabilidad, la
posibilidad de alcanzar grandes tamaños muestrales y la posibilidad de reco-
pilar datos en forma veloz (Kline, 2000), se constituyen como ventajas indis-
cutibles en la aplicación de esta metodología. Pero hay un creciente consenso
en la comunidad científica acerca de la necesidad de aplicar una variedad de
métodos al momento de determinar constructos psicológicos (Dodorico Mc-
donald, 2008).
Además, a pesar de los avances de la teoría psicométrica, las escalas de
medición utilizadas en estos instrumentos carecen de cero absolutos y, fre-
cuentemente, alcanzan sólo un nivel ordinal de medición (Bunge y Ardila,
2002). Por este motivo, si bien éstas medidas pueden ser auxiliares importan-
tes en la investigación o el diagnóstico psicológico se requiere de instrumentos
más objetivos y con propiedades métricas más sólidas.
279
¿Qué otros biomarcadores podríamos medir?
280
duo. Los tipos de muestras más utlizados, así como también los biomarcado-
res que pueden ser determinados en las mismas se enumeran en la tabla …..
281
Referencias
282
Differences, 34, 645-654.
Baron-Cohen, S. (1989). The autistic child’s theory of mind: a case of specific
developmental delay. Journal of Child Psychology and Psychiatry,30, 285-
297.
Baron-Cohen, S., O’Riordan, M., Stone, V., Jones, R. & Plaisted, K. (1999).
Recognition of Faux Pas by Normally Developing Children and Children
with Asperger Syndrome or High-Functioning Autism, Journal of Autism and
Developmental Disorders, 29 (5), 407-418.
Barrick, M. & Mount, M. (1991). The Big Five personality dimensions and job
performance: A meta-analysis. Personnel Psychology, 44, 1-26.
Barrick, M., Mount, M. & Judge, T. (2001). Personality and performance at the
beginning of the new millennium: What do we know and where do we go
next? International Journal of Selection and Assessment, 9, 9-30.
Bass, B. & Avolio, B. (1990). Transformational leadership development: Manual
for the Multifactor Leadership Questionnaire. Palo Alto, CA: Consulting
Psychologists Press.
Bass, B. (1985). Leadership and performance beyond expectations. Nueva York, NY:
Free Press.
Bass, B. (1997). Does the transactional–transformational leadership paradigm
transcend organizational and national boundaries? American Psychologist, 52,
130-139.
Bastin, C., & Salmon, E. (2014). Early neuropsychological detection of
Alzheimer’s disease. European Journal Of Clinical Nutrition, 68(11), 1192-
1199. doi:10.1038/ejcn.2014.176
Benavides, M. (2001). The use of technology in a program for mathematically
gifted children. En Proceeding of The 14th Biennal Conference of the World
Council for Gifted and Talented Children (p. 40). Barcelona.
Benavídes, M., Maz, A., Castro, E. y Blanco, R. (2004). La educación de niños con
talento en Iberoamérica. Santiago de Chile: Oficina Regional de Educación de
la Unesco para América Latina y el Caribe.
Bennet, G.; Seashore, H. y Wesman, A. (2000). Tests de Aptitudes Diferenciales
Benton, A. L. (1974). Revised visual retention test [Test de Retención visual
revisado] (4th ed.). San Antonio, Texas: The Psychological Corporation.
Bezanilla, J. M., Torres Pérez, V. y Lara Hernández, L. A. (2010) Análisis de
la adaptación de la prueba psicológica MMPI-II para su aplicación en la
población Mexicana. Revista ECOS. Año 5, Nº 6.
Birkeland, S., Manson, T., Kisamore, J., Brannick, M. & Smith, M. (2006). A
meta-analytic investigation of job applicant faking on personality measures.
International Journal of Selection and Assessment, 14, 317-335.
Bloom, B. S. (1985). Developing talent in young people. New York: Ballantine.
Brown, C. H. (1938). Emotional reactions before examinations: II. Results of a
questionnaire. Journal of Psychology, 5, 11–26.
Brun, G., Doğuoğlu, U., & Kuenzle, D. (2008). Epistemology and emotions.
Aldershot, UK: Ashgate.
Brussino, S.; Medrano, L.; Sorribas, P. & Rabia, H. (2011) Young Adults’
Knowledge of Politics: Evaluating the Role of Socio-cognitive Variables Using
283
Structural Equations. The Spanish Journal of Psychology, 14 (1), 183-194.
Brussino, S.; Sorribas, P. & Medrano L. (2008). Características Psicométricas de
la Medición del Conocimiento Político. Revista Iberoamericana de Diagnóstico
y Evaluación Psicológica (RIDEP), 25 (1), 179-192.
Burin, D. I. (2007) Planificación de la batería de evaluación neuropsicológica.
En I. D. Burin, M. A. Drake, & P. Harris, Evaluación neuropsicológica en
adultos. Buenos Aires: Paidós.
Burns, J. (1978). Leadership. New York: Harper & Row
Buschke, H. (1973). Selective reminding for analysis of memory and learning
[Recuerdo selectivo para el análisis de la memoria y el aprendizaje]. Journal of
Verbal Learning and Verbal Behavior, 12, 543-550.
Buschke, H., & Fuld, P. A. (1974). Evaluating storage, retention, and retrieval in
disordered memory and learning [Evaluación del almacenamiento, retención
y recuperación en los trastornos de la memoria y el aprendizaje]. Neurology,
24, 1019-1025.
Calkins, L. (1994) The Art of Teaching Writing. Portsmouth, NH, Heinemann
Educational.
Cano-Vindel, A., Muñoz-Navarro, R., Medrano, L. A., Ruiz-Rodríguez, P.,
González-Blanch, C., Castillo, M. D. G., ... & PsicAP Research Group.
(2018). A computerized version of the Patient Health Questionnaire-4 as
an ultra-brief screening tool to detect emotional disorders in primary care.
Journal of Affective Disorders.
Cano-Vindel, A.; Muñoz-Navarro, R.; Mae Wood, C.; Limonero, J.T.;
Medrano, L.A.; Ruiz-Rodríguez, P.; Gracia-Gracia, I.; Dongil-Collado, E.;
Iruarrizaga, I.; Chacón, F.; Santolaya, F. (2016). Transdiagnostic Cognitive
Behavioral Therapy Versus Treatment as Usual in Adult Patients With
Emotional Disorders in the Primary Care Setting (PsicAP Study): Protocol
for a Randomized Controlled Trial.Journal of Medical Internet Research [JMIR
Protocols], 5 (4):e246. Doi: 10.2196/resprot.6351
Cárdenas, T. & Jaik, A. (2014). Inventario para la medición del Engagement
(ilusión por el trabajo). Un estudio instrumental. Psicogente, 17, 294-30.
Carod-Artal, F. & Vázquez-Cabrera, C. (2013). Burnout syndrome in an
international setting. In S. Bährer-Kohler (Ed.), Burnout for experts: Prevention
in the context of living and working (pp. 15-35). London: Springer.
Carsten, O. & Jamson, H (2011). Driving simulators as research tools in traffic
psychology. En E. Porter (Ed.), Handbook of Traffic Psychology (pp. 87-96).
Oxford: Elsevier Science
Carvajal Marín, L. M., Ulloa Ulloa, I., Morales Silva, M. (2007). La utilización
de pruebas psicométricas: ¿un absurdo en una EST? Universitas Psychologica,
vol. 6, núm. 1, enero-abril, (pp. 79-87) Pontificia Universidad Javeriana.
Bogotá, Colombia.
Castro Solano, A. (2007). Teoría y evaluación del liderazgo. Buenos Aires: Paidós.
Castro, A., Nader, M. & Casullo, M. (2004). La evaluación de los estilos de
liderazgo en población civil y militar: Un estudio con el MLQ (Multifactor
Leadership Questionnaire) de Bass y Avolio. Revista de Psicología, 22, 65-88.
Casullo, M. M. (Comp.) (1999) Aplicaciones del MMPI-2 en los ámbitos
284
clínico, forense y laboral. Argentina: Paidós
Chan, D. W. (2001). Assessing giftedness of Chinese secondary students in Hong
Kong: A multiple intelligences perspective. High Ability Studies, 12, 215-234.
Chmil, F., Gañan, F., Medrano, L.A., & Flores Kanter, P.E. (2017).
Representaciones sociales de la profesión del psicólogo en integrantes a la
carrera de psicología de Córdoba, Argentina. Informes Psicológicos, 17(1), pp.
143-158.
Cloninger,C., Przybeck,T., Svrakic, D. & Wetzel, R. (1994): The Temperament and
the Character inventory (TCI): A guide to its development and Use. Washington
University: Center for Psychobiology of Personality, St Louis.
Cohen, R. J. & Swerdlik, M. E. (2006) Pruebas y Evaluación Psicológicas.
España: Mc Graw Hill.
Cole, M., Walter, F., Bedeian, A. & O’Boyle, E. (2012). Job burnout and employee
engagement: A meta-analytic examination of construct proliferation. Journal
of Management, 38, 1550-1581.
Conn, H.; Medrano, L. & Moretti, L. (2013). Adaptación del Cuestionario de
Alianza de Ayuda Revisado Versión Paciente (HAQ-II-P) para la población de
Cordobeses. Terapia Psicológica, 31 (2), 165-174.
Cook, S. S. (1989). Improving the quality of student ratings of instruction: A
look at two strategies. Research in Higher Education, 30(1), 31-45.
Cordero-Andrés, P., González-Blanch, C., Umaran-Alfageme, O., Muñoz-
Navarro, R., Ruíz-Rodríguez, P., Medrano, L. A., Hernández-de Hita,
F., Pérez-Poo, T. & Cano-Vindel, A. (2017). Tratamiento psicológico de
los trastornos emocionales en atención primaria: fundamentos teóricos y
empíricos del estudio PsicAP. Ansiedad y Estrés, 23, 91-98
Costa, P. & McCrae, R. (1985). The NEO Personality Inventory manual. Odessa,
FL: Psychological Assessment Resources.
Costa, P. & McCrae, R. (1992). The Revised NEO Personality Inventory (NEO-
PI-R) and NEO Five-Factor-Inventory (NEO-FFI) professional manual. Odessa,
FL: Psychological Assessment Resources (Adaptación española, 1999, TEA
Ediciones, S.A.).
Costa, P. & McCrae, R. (1999) Inventario de Personalidad NEO Revisado.
Madrid: TEA
Crawford, E., LePine, J. & Rich, B. (2010). Linking job demands and resources
to employee engagement and burnout: a theoretical extension and meta-
analytic test. Journal of Applied Psychology, 95, 834-848.
Cronbach, L.(1998). Fundamentos de la evaluación psicológica. Madrid: Biblioteca
Nueva
Cruz F., J (1991) Psicología del deporte. Ed. Síntesis.Madrid.
Cruz, J. (1997). Psicología del deporte: historia y propuestas de desarrollo. En J.
Cruz (Ed.), Psicología del deporte (pp. 15-43). Madrid:Síntesis
Cruz-Ortiz, V., Salanova, M. & Martínez, I. (2013). Liderazgo transformacional
y desempeño grupal: Unidos por el engagement grupal.Revista de Psicología
Social, 28, 183-196.
Cuadra, A., y Veloso, C. (2007). Liderazgo, clima y satisfacción laboral en las
organizaciones.Universum, 22, 40-56.
285
Cuetos Vega, F., Ramos Sánchez, J.L., y Ruano Hernández, E. (2004). PRO-
ESC. Manual. Madrid: Tea Ediciones
Cupani, M. (2009). El cuestionario de Personalidad IPIP-FFM: Resultados
preliminares de una adaptación en una muestra de preadolescentes argentinos.
Perspectivas en Psicología, 6, 51-58.
Cupani, M. y Pérez, E. (2014). Adaptación de la escala de actividades de dominio
público de indicadores del modelo RIASEC a la población universitaria
cordobesa. Revista Argentina de Ciencias del Comportamiento, 6, 2, 23-34.
D’Mello, S., Lehman, B., Pekrun, R., & Graesser, A. (2014). Confusion can be
beneficial for learning. Learning and Instruction, 29, 153–170.
Deffenbacher, J., Lynch, R., Oetting, E. & Swaim, R. (2002). The driving anger
expression inventory: A measure of how people express their anger on the
road. Behaviour Research and Therapy, 40, 717-737.
Deffenbacher, J., Oetting, E. & Lynch, R. (1994). Development of a driving
anger scale. Psychological Reports, 74, 83-91.
Del Grosso, A., Fernández, M., Matosko, M. (2012) Estudio bibliométrico sobre
la producción científica de Psicología del Deporte en español, en los últimos 10
años. Tesis de Licenciatura. Facultad de Psicología.UNC.
Delis, D. C., Kramer, J. H., Kaplan, E., & Ober, B. A. (1987). California verbal
learning test: adult version [Test de aprendizaje verbal de California: versión
adulta]. San Antonio, TX: The Psychological Corporation.
Diener E., Lucas R.E. &Oishi S. (2002). Handbook of positive psychology. New
York: Oxford university press. “Subjective well-being is defined as a person’s
cognitive and affective evaluations of his or her life”. Traducción propia.
Dodorico Mcdonald, J. (2008). Measuring personality constructs: The advantages
and disadvantages of self-reports, informant reports and behavioural
assessments (Vol. 1).
Dominguez, S., & Medrano, L. (2016). Propiedades psicométricas del
Cuestionario de Regulación Cognitiva de la Emociones (CERQ) en estudiantes
universitarios de Lima. Psychologia: Avances de la Disciplina, 10(1), 53-67.
Dominguez-Lara, S., & Medrano, L., (2016). Invarianza factorial del Cognitive
Emotional Regulation Questionnarie (CERQ) en universitarios limeños y
cordobeses. Universitas Psychologica, 15(1), 89-98.
Dorn, L. & Machin, M. (2004). Learner driving experience questionnaire.
Queesland, Australia: Cranfield University.
Dumdum, R., Lowe, K. & Avolio, B. (2002). A meta-analysis of transformational
and transactional leadership correlates of effectiveness and satisfaction: An
update and extension. En B. Avolio & F. Yammarino (Eds.), Transformational
and charismatic leadership: The road ahead (pp. 35-66). New York, NY:
Erlbaum Associates.
Elcovich, H. G., Andiloro, L., Cepeda, J., Chiesa, V. S. y Guzman, L. (2015). Guía
para el proceso de evaluación psiológica: una introducción al ámbito clínico,
educacional, jurídico y laboral. VII Congreso Internacional de Investigación
y Práctica Profesional en Psicología XXII. Jornadas de Investigación XI
Encuentro de Investigadores en Psicología del MERCOSUR. Facultad de
Psicología - Universidad de Buenos Aires, Argentina.
286
Eysenck, H. (1991). Dimensions of personality: 16, 5, or 3? - Criteria for a
taxonomicparadigm. Personality and Individual Differences, 12, 773-790.
Farla, J., Alkemade, F. & Suurs, R. (2010). Analysis of barriers in the transition
toward sustainable mobility in the Netherlands. Technological Forecasting and
Social Change, 77, 1260-1269.
Fernandez, A. L. (2013) Development of a Confrontation Naming Test for
Spanish-speakers: The Cordoba Naming Test. The Clinical Neuropsychologist,
27(7), 1179-1198.
Fernández, A. L. (2014) Neuropsicología de la atención. Conceptos, alteraciones
y evaluación. Revista Argentina de Neuropsicología, 25, 1-28.
Fernández, A. L. , Monti, A. A. , Bacile, E. A. (1998). La memoria en la
enfermedad de Alzheimer. Revista Neurológica Argentina, 23, 64-69.
Fernandez, A. L., & Fulbright, R. L. (2015). Construct and Concurrent
Validity of the Spanish Adaptation of the Boston Naming Test. Applied
Neuropsychology: Adult, 22(5),355-362.
Fernandez, A. L., Ferreres, A., Morlett-Paredes, A., Rivera, D. & Arango-
Lasprilla, J. C. (2016) Past, present, and future of neuropsychology in
Argentina, The Clinical Neuropsychologist, 30:8, 1154-1178, DOI:
10.1080/13854046.2016.1197313
Flanagan, D. P.y Kaufman, A. S. (2004). Essentials of WISC-IV assessment.
Hoboken, NJ: John Wiley & Sons.
Flores Kanter, E. & Medrano, L. (2016). El afecto y sus dimensiones: contrastes
de modelos ortogonales y oblicuos mediante análisis factorial confirmatorio
de la Escala PANAS. Liberabit, 22 (2), 173-184.
Flores Kanter, P. E. & Medrano, L. (2015). Is it possible that Mood affects
Self-Conception? Analysis through an Approach based on Natural Semantic
Networks. International Journal of Behavioral Research & Psychology, 3 (5),
114-120.
Flores Kanter, P. E. & Medrano, L. (2016). El afecto y sus dimensiones: Contrastes
de modelos ortogonales y oblicuos mediante análisis factorial confirmatorio
de la escala PANAS. LIBERABIT, 22(2), 173-184.
Flores Kanter, P. E., Medrano, L. & Manoiloff, L. (2014). Estados de Ánimo y
Juicios de Autoconcepto en Universitarios: Análisis desde un abordaje basado
en Redes Semánticas Naturales. Interamerican Journal of Psychology, 48 (2),
291-307
Flores Kanter, P.E.; Moretti, L.; Losano, C. & Medrano, L. (2017) Empirical
Evidence for a Socio-Cognitive Model of Academic Satisfaction: A Review
and Meta-Analysis Approach. Psychology and Education – An Interdisciplinary
Journal, 54 (2), 1-25.
Flores-Kanter, P. E., Rossi, S. A., Llamas, J., & Medrano, L. A. (2017). Estado
anímico y juicios de satisfacción académica: infusión afectiva analizada
mediante redes semánticas. Revista de Estudios e Investigación en Psicología y
Educación, 4 (1), 18-25.
Fogliatto, H. (1991). Cuestionario de Intereses Profesionales. Manual. Buenos
Aires: Guadalupe
Fogliatto, H. y Pérez, E. (2003). Sistema de Orientación Vocacional Informatizado
287
(SOVI 3). Manual. Buenos Aires: Paidós.
Frenzel, A. C., Pekrun, R., Goetz, T., Daniels, L. M., Durksen, T. L., Becker-
Kurz, B., & Klassen, R. M. (2016). Measuring teachers’ enjoyment, anger,
and anxiety: The teacher emotions scales (TES). Contemporary Educational
Psychology, 46, 148-163.
Frenzel, A. C., Thrash, T. M., Pekrun, R., & Goetz, T. (2007). Achievement
emotions in Germany and China: A cross-cultural validation of the Academic
Emotions Questionnaire-Mathematics (AEQ-M). Journal of Cross-Cultural
Psychology, 38, 302–309.
Gagné, F. (2003). Transforming gifts into talents: The DMGT as a Developmental
Theory. En N. Colángelo y G. A. Davis (Eds.), Handbook of Gifted Education
(3nd ed) (pp. 60-74). Boston: Pearson Education.
García Izquierdo, A., García Izquierdo, M. & Ramos Villagrasa, P. (2007).
Aportaciones de la inteligencia emocional y la autoeficacia: Aplicaciones para
la selección de personal. Anales de psicología, 23, 231-239.
García-Batista, Z. E., Guerra-Peña, K., Cano-Vindel, A., Herrera-Martínez, S.
X., Flores-Kanter, P. E., & Medrano, L. A. (2017). Propiedades psicométricas
del Inventario de ansiedad estado-rasgo en población general y hospitalaria de
República Dominicana. Ansiedad y Estrés, 23, 53-58.
García-Batista, Z.E.; Guerra-Peña, K; Cano-Vindel, A.; Herrera-Martínez S.
& Medrano, L. A. (2018). Validity and reliability of the Beck Depression
Inventory (BDI-II) in general and hospital population of Dominican
Republic. PLoS ONE, 13 (6): e0199750.https://doi.org/10.1371/journal.
pone.0199750.
Gardner, F L (1987) Proffesionalization of sport psychology. The sport psychologist,
5,55-60.
Gardner, H. (1994). Estructuras de la mente. La teoría de las Inteligencias Múltiples.
México: Fondo de Cultura Económica.
Gardner, H. (1999). Intelligence Reframed. Multiple Intelligences for the 21st
Century. New York: Basic Books.
Gil-Monte, P. (2002). Validez factorial de la adaptación al español del Maslach
Burnout Inventory-General Survey. Salud Pública de México, 44, 33-40.
Gil-Monte, P., García-Juesas, J. & Hernández, M. (2008). Influencia de la
sobrecarga laboral y la autoeficacia sobre el síndrome de quemarse por el
trabajo (burnout) en profesionales de enfermería. Interamerican Journal of
Psychology, 42, 113-118.
Glosser, G. & Goodglass, H. (1990). Disorders in executive control functions
among aphasic and other brain-damaged patients [Desórdenes en las funciones
de control ejecutivo en afásicos y otros pacientes con daño cerebral]. Journal
of Clinical and Experimental Psychology, 12, 485-501.
Goffin, R. & Christiansen, N. (2003). Correcting personality test for faking:
A review of popular personality tests and initial survey of researchers.
International Journal of Selection and Assessment, 11, 340-344.
Goldberg, L. (1999). A broad-bandwidth, public-domain, personality inventory
measuring the lower-level facets of several five-factor models. Personality
Psychology in Europe, 7, 7-28.
288
González Llaneza, F. M. (2007) Instrumentos de Evaluación Psicológica. La
Habana: Editorial Ciencias Médicas.
González, L (1996) El entrenamiento psicológico en los deportes. Editorial Biblioteca
Nueva.Madrid.
González-Blanch C, Medrano LA, Muñoz-Navarro R, Ruíz-Rodríguez P,
Moriana JA, Limonero JT, et al. (2018) Factor structure and measurement
invariance across various demographic groups and over time for the PHQ-9
in primary care patients in Spain. PLoS ONE 13(2): e0193356. https://doi.
org/10.1371/journal.pone.0193356
González-Blanch, C., Umaran-Alfageme, O., Cordero-Andrés, P., Muñoz-
Navarro, R., Ruiz-Rodríguez, P., Medrano, L. A., Ruiz-Torres, M.; Dongil
Collado, E. & Cano-Vindel, A. (2018). Tratamiento psicológico de los
trastornos emocionales en Atención Primaria: el manual de tratamiento
transdiagnóstico del estudio PsicAP. Ansiedad y Estrés, 24, 1-11. https://doi.
org/10.1016/j.anyes.2017.10.005.
Goodglass, H., & Wingfield, A. (1997). Word-finding deficits in aphasia:
Brain—behavior relations and clinical symptomatology. In H. Goodglass &
A. Wingfield (Eds.), Anomia Neuroanatomical and Cognitive Correlates (pp.
3–30). San Diego, CA: Academic Press.
Goodglass, H., Kaplan, E. (1996). Evaluación de la afasia y de trastornos
relacionados. Madrid, España: Editorial Médica Panamericana.
Graeff, C. (1997). Evolution of situational leadership theory: A critical review.
The Leadership Quarterly, 8, 153-170.
Grau, A., Flichtentrei, D., Suñer, R., Prats, M. & Braga, F. (2009). Influencia de
factores personales, profesionales y transnacionales en el síndrome de burnout
en personal sanitario hispanoamericano y español (2007). Revista Española de
Salud Pública, 83, 215-230.
Groeger, J. & Rothengatter, J. (1998) Traffic Psychology and behaviour.
Transportation Research Part F: Traffic Psychology and Behavior, 1, 1-9.
Gross, M., Zalazar-Jaime, M., Piccolo, N. & Cupani, M. (2012). Nuevos estudios
de validación del cuestionario de personalidad IPIP-FFM. Trabajo presentado en
las Memorias del X Congreso Latinoamericano de Sociedades de Estadística,
Córdoba, Argentina.
Guinzbourg de Braude, M. et al. (2016). Aportes del Psicodiagnóstico ante las
demandas actuales en los ámbitos clínico, laboral y forense. Revista de la CPU
Coordinadora de Psicólogos del Uruguay, N° 284. (pp,28 a 32). ISSN:2301-
0770.
Halbesleben, J. & Demerouti, E. (2005). The construct validity of an alternative
measure of burnout: Investigating the English translation of the Oldenburg
Burnout Inventory. Work & Stress, 19, 208-220.
Hart, N. I. (1987). Student teachers’ anxieties: four measured factors and their
relationships to pupil disruption in class. Educational Research, 29, 12-18.
Hattie, J. (2009). Visible learning: A synthesis of meta-analyses relating to
achievement. London, United Kingdom: Routledge.
Heaton, R. K., Chelune, G. J., Talley, J. L., Kay, G. G. & Curtiss, G. (1993).
Wisconsin Card Sorting Test Manual [Manual del Test de Clasificación de
289
Tarjetas de Wisconsin]. Odessa, Florida, EE. UU: Psychological Assessment
Resources.
Herr, E. y Cramer, S. (1996). Career Guidance and Counseling through the Life
Span. Glenview, IL: Scott Foresman.
Herrero-Fernández, D. (2011). Psychometric adaptation of the Driving Anger
Expression Inventory in a Spanish sample: Differences by age and gender.
Transportation Research Part F: Traffic Psychology and Behaviour, 14, 324-329.
Hersey, P & Blanchard, K. (l993). Management of organization behavior utilizing
human resources (8th. ed.). Englewood Cliffs. NJ: Prentice-Hall.
Hodapp, V., & Benson, J. (1997). The multidimensionality of test anxiety: A test
of different models. Anxiety, Stress and Coping, 10, 219-244.
Hoffmann, M. (2005). Comportamento do condutor e fenômenos psicológicos.
Psicologia: Pesquisa e Trânsito, 1, 17-24.
Hogan, J. & Holland, B. (2003). Using theory to evaluate personality and
job performance relations: A socioanalytic perspective. Journal of Applied
Psychology, 88, 100-112.
Hogan, T. (2004). Pruebas Psicológicas. Una introducción práctica. México:
Manual Moderno.
Holland, J.(1997)Making Vocational Choices. Odessa, Fl: Psychological
Assessment Resources (Hood y Johnson, 2002).
Hollland, J. (1994). Self-Directed Search. Manual. Odessa, Fl: Psychological
Assessment Resources
Hood, A. y Johnson, B. (2002.Assessment in Counseling: A guide to the use of
psychological assessment resources. Alexandria, VA: American Counseling
Association.
Hough, L. (1998). Effects of intentional distortion in personality measurement
and evaluation of suggested palliatives. Human Performance, 11, 209-244.
House, R. (1977). A path goal theory of leader effectiveness. Administrative
Science Quarterly, 16, 321-339.
Hunt, J. & Larson, L. (Eds.) (1977). Leadership: The cutting edge. Carbondale,
IL: Southern Illinois University Press.
Ibarra, M. F. (2010). De la psicotecnia al psicodiagnóstico y de la orientación
profesional a la orientación vocacional. Breve historia de la psicología
aplicada al área laboral en Argentina:1925-1957. II Congreso Internacional
de Investigación y Práctica Profesional en Psicología XVII. Jornadas
de Investigación Sexto Encuentro de Investigadores en Psicología del
MERCOSUR. Facultad de Psicología - Universidad de Buenos Aires, Buenos
Aires. Extraído de: http://www.aacademica.org/000-031/375
Ismail, N. M. (2015). EFL Saudi Students’ Class Emotions and Their
Contributions to Their English Achievement at Taif University. International
Journal of Psychological Studies, 7(4), 19-42.
Iversen, H. (2004). Risk-taking attitudes and risky driving behaviour.
Transportation Research Part F: Traffic Psychology and Behaviour, 7,135-150.
Jacova, C., Kertesz, A., Blair, M., Fisk, J. D., & Feldman, H. H. (2007). Review
article: Neuropsychological testing and assessment for dementia. Alzheimer’s
& Dementia: The Journal Of The Alzheimer’s Association, 3299-317.
290
doi:10.1016/j.jalz.2007.07.011
Kelloway, E., Barling, J. & Helleur, J. (2000). Enhancing transformational
leadership: The roles of training and feedback. Leadership & Organization
Development Journal, 21, 145-149.
Kim, J. R., & Lee, E. (2014). The validation of the Korean version of the
Achievement Emotions Questionnaire-Mathematics (K-AEQ-M) for middle
school students. The Korean Journal of Human Development, 21, 115–139.
King, R. B. (2010). What do students feel in school and how do we measure
them?: Examining the psychometric properties of the S-AEQ-F [Short-
Academic Emotions Questionnaire-Filipino]. Philippine Journal of Psychology,
43, 161–176.
Klauer, S., Dingus, T., Neale, V., Sudweeks, J. & Ramsey, D. (2006). The impact
of driver inattention on near-crash/crash risk: An analysis using the 100-car
naturalistic driving study data [NHTSA Report No. DOT HS 810 594].
Balcksburg, Virginia:Virginia Tech Transportation Institute.
Kline, P. (2000). Handbook of Psychological Testing. Londres: Routledge.
Kline, P. (2000). The Handbook of Psychological Testing / P. Kline.
Kocalevent, R. D., Levenstein, S., Fliege, H., Schmid, G., Hinz, A., Brahler, E.,
& Klapp, B. F. (2007). Contribution to the construct validity of the Perceived
Stress Questionnaire from a population-based survey. J Psychosom Res, 63(1),
71-81. doi: 10.1016/j.jpsychores.2007.02.010
Kristensen, T., Borritz, M., Villadsen, E. & Christensen, K. (2005). The
Copenhagen Burnout Inventory: A new tool for the assessment of burnout.
Work & Stress, 19, 192-207.
Lajunen, T. & Summala, H. (2003). Can we trust self-reports of driving? Effects
of impression management on driver behavior questionnaire responses.
Transportation Research Part F: Traffic Psychology and Behaviour, 6,97-107.
Langballe, E., Falkum, Innstrand, S. & Aasland, O. (2006). The factorial validity
of the Maslach Burnout Inventory–General Survey in representative samples
of eight different occupational groups. Journal of Career Assessment, 14, 370-
384.
Lapuente, L., Dominguez-Lara, S., Flores-Kanter, P. E. & Medrano, L. A. (2018).
Bienestar Subjetivo, ¿unidimensional o multidimensional? Análisis bifactor
en una muestra de estudiantes universitarios. Revista Avaliação Psicológica. En
Prensa.
Ledesma. R., Poó, F. & Montes, S. (2011). Psicología del tránsito: Logros y
desafíos de la investigación. Psiencia: Revista Latinoamericana de Ciencia
Psicológica, 3, 108-119.
Lent, R. W., Brown, S. D. y Hackett, G. (1994). Toward a unifying social
cognitive theory of career and academic interest, choice, and performance
[Monograph]. Journal of Vocational Behavior, 45, 79-122.
Lent, R. W., Hackett, G. y Brown, S.D. (2004).Una perspectiva social-cognitiva
de la transición entre la escuela y el trabajo. Evaluar, 4,1-22.
León-Carrión, J. (1997). Rehabilitation and assessment: old tasks revisited for
computarized neuropsychological assessment. En J. León-Carrión (Ed.).,
Neuropsychological Rehabilitation. Delray Beach, Florida, EE.UU: GR/St.
291
Lucie Press.
Lezak, M. D., Howieson, D.B., Bigler, E.D. & Tranel, D. (2012)
Neuropsychological Assessment. Fifth edition. New York: Oxford.
Lichtenfeld, S., Pekrun, R., Stupnisky, R. H., Reiss, K., & Murayama, K. (2012).
Measuring students’ emotions in the early years: The Achievement Emotions
Questionnaire-Elementary School (AEQ-ES). Learning and Individual
Differences, 22, 190–201.
Liebert, R. M., & Morris, L. W. (1967). Cognitive and emotional components
of test anxiety: A distinction and some initial data. Psychological Reports, 20,
975–978.
Lievens, F., Highhouse, S. & De Corte, W. (2005). The importance of traits
and abilities in supervisors’ hirability decisions as a function of methods of
assessment. Journal of Occupational and Organizational Psychology, 78, 453-
470.
Linnenbrink-Garcia, L., Patall, E. A., & Pekrun, R. (2016). Adaptive motivation
and emotion in education: Research and principles for instructional design.
Policy Insights from the Behavioral and Brain Sciences, 3(2), 228-236.
Lodi, E.; Pérez, E.; Petrucelli, F. y Medrano, L. (2009). Vallutazione dell
autoefficacia per le intelligenze multiple in un contesto de career counseling.
Counseling. Giornale Italiano di Ricerca e Applicazioni, 2, 3, 347-362.
Lodi, E.; Pérez, E.; Petrucelli, F. y Medrano, L. (2009). Vallutazione dell
autoefficacia per le intelligenze multiple in un contesto de career counseling.
Counseling. Giornale Italiano di Ricerca e Applicazioni, 2 (3) 347-362.
Lord, R., Foti, R. & De Vader, C. (1984). A test of leadership categorization
theory: Internal structure, information processing, and leadership perceptions.
Organizational Behavior and Human Performance, 34, 343-378.
Lowe, K., Kroeck, K. & Sivasubramaniam, N. (1996). Effectiveness correlates of
transformational and transactional leadership: A meta-analytic review of the
MLQ literature. Leadership Quartely, 7, 385-425.
Lubinski, D. (2003). Exceptional Spatial Abilities. En N. Colángelo y G. A.
Davis (Eds.), Handbook of Gifted Education (3nd ed) (pp. 521-532). Boston:
Pearson Education.
Maffei, L. et al. (2012) Adaptación del Cuestionario de Autoeficacia Profesional
(AU-10) a la población de trabajadores cordobeses. Pensam. psicol. (online).
vol.10, n.1, (pp.51-62). ISSN 1657-8961.
Mandler, G., & Sarason, S. B. (1952). A study of anxiety and learning. Journal
of Abnormal and Social Psychology, 47, 166–173.
Marcotte, T.D., Scott, J. C., Kamat, R. & Heaton, R. K. (2010). Neuropsychology
and the prediction of everyday functioning. En T. Marcotte, & I. Grant,
Neuropsychology of everyday functioning (pp. 5-38). New York: The Guilford
Press.
Marsh, H. W. (1987). Student ´s evaluation of university teaching: research
findings. Methodological issues and directions for future research. International
Journal of Educational Research, 11(3), 253-288.
Martens, R (1975) The paradigmatic crisis in american sportpersonology.
Sportwissenschaft, 1, 9-24.
292
Martens, R (1977) Sport Competition Anxiety Test (SCAT). Champaign III;
HumanKinetics.
Martens, R (1987) Coaches guide to sport psychology. Human Kinetic Publisher.
Champaign,Illinois.
Martens, R (1987) Science, knowledge and sport psychology. The sport psychologist,
1,29-55.
Martínez-Mejía, E. (2011). Relevancia de la medición psicológica en las
organizaciones laborales. Cartel presentado en el XIX Congreso Mexicano
de Psicología. Revista Mexicana de Psicología, Número Especial -Memoria in
extenso), (pp. 1034-1035), ISSN 01856073.
Maslach C. & Leiter, M. (1997). The truth about burnout. San Francisco, CA:
Jossey-Bass.
Maslach, C. & Jackson, S. (1986). Maslach Burnout Inventory (2nd Ed.). Palo
Alto, CA: Consulting Psychologists Press.
Maslach, C., Schaufeli, W. & Leiter, M. (2001). Job burnout. Annual Review of
Psychology, 52, 397-422.
Mateu, M. (1994). El psicólogo en la empresa. Anuario de Psicología, n° 63, (pp
219-233). Facultat de Psicologia Universitat de Barcelona.
Matthews, M. S. (2007). Review of the Scales for Identifying Gifted Students.
En B. S. Plake (Ed.), The seventeenth mental measurements yearbook (pp. 729–
731). Lincoln, NE: Buros Institute of Mental Measurement of the University
of Nebraska.
Mc Nair, D.M., Lorr, M., y Droppleman, L.F. (1971). Manual flr the Profile
of Mood States. San Diego, California: EdITS/Educational and Industrial
TestingService.
Mc Nair, D; Lorr, L y Droppleman, M (1971) Manual of Profile od Mood States
(POMS). Educational and Industrial testing Service. SanDiego.
McCrae, R., Costa Jr, P., del Pilar, G., Rolland, J. & Parker, W. (1998). Cross-
cultural assessment of the five-factor model: The Revised NEO Personality
Inventory. Journal of Cross-Cultural Psychology, 29, 171-188.
McKhann, G., Knopman, D., Chertkow, H., Hyman, B., Jack, C., Kawas,
C., & ... Phelps, C. (2011). The diagnosis of dementia due to Alzheimer’s
disease: Recommendations from the National Institute on Aging-Alzheimer’s
Association workgroups on diagnostic guidelines for Alzheimer’s disease. (3),
doi:10.1016/j.jalz.2011.03.005.
Medrano L.A. & Trógolo, M. (2016) Construct Validity of the Difficulties in
Emotion Regulation Scale: Further Evidence Using Confirmatory Factor
Analytic Approach.Abnormal and Behavioral Psychology, 2: 117-124.
Medrano, L. & Moretti, L. (2013). Eficacia de un programa de entrenamiento
para disminuir manifestaciones cognitivas de ansiedad ante los exámenes en
ingresantes universitarios. Informes Psicológicos, 13 (1), 41-52.
Medrano, L. & Olaz, F. (2008).Autoeficacia Social en Ingresantes Universitarios:
su relación con el Rendimiento y la Deserción Académica.Revista de Psicología
General y Aplicada, 61 (4), 369-383
Medrano, L. & Pérez, E. (2010). Adaptación de la Escala de Satisfacción
Académica a la Población Universitaria de Córdoba. Revista Summa Psicológica,
293
7 (2), 5-14.
Medrano, L. & Pérez, E. (2013). Reseña Histórica del Laboratorio de Evaluación
Psicológica y Educativa (LEPE) y Análisis Bibliométrico de la Revista Evaluar.
Evaluar, 13, 61-71.
Medrano, L. & Trógolo, M. (2014). Validación de la Escala de Dificultades en la
Regulación Emocional en la población universitaria de Córdoba, Argentina.
Universitas Psychologica. Panamerican Journal Of Psychology, 13 (4), 15-26.
Medrano, L. (2008). Utilització de Programari de Lliure Accés per a l’Ensenyament
d’Estadística i Psicometría. Revista d’Ensenyament de la Psicologia: Teoria i
Experiència, 4 (1), 1-7. (ISSN:1699-5546)
Medrano, L. (2009). Adaptación de la Escala de Autoeficacia para el Rendimiento
en Ingresantes Universitarios (EAR-I). Avances en Medición, 7, 91-102.
Medrano, L. (2011). Modelo social cognitivo del rendimiento académico en
ingresantes universitarios. La contribución de la autoeficacia social académica.
Revista Tesis, 2, 87-106.
Medrano, L. A. & Flores Kanter, P. E. (2017). La Problemática del Ingreso a la
Universidad desde una perspectiva de la teoría de la agencia social: Aportes
de la Teoría Social Cognitiva. Revista Argentina de Educación Superior (9) 15;
11-35.
Medrano, L. A. & Muñoz-Navarro, R. (2017). Conceptual and Practical
Approach to Structural Equations Modeling.Revista Digital de Investigación
en Docencia Universitaria, 11(1), 213-233.http://dx.doi.org/10.19083/
ridu.11.486
Medrano, L. A. & Trógolo, M. A. (2018). Employee well-being and life
satisfaction in Argentina: The contribution of psychological detachment
from work. Journal of Work and Organizational Psychology. Advance online
publication. https://doi.org/10.5093/jwop2018a9
Medrano, L. A., Flores Kanter, P. E., Trógolo, M., Curarello, A., & Gonzales,
J. (2015). Adaptación de la Escala de Afecto Positivo y Negativo (PANAS)
para la población de Estudiantes Universitarios de Córdoba. Anuario de
Investigacionesde la Facultad de Psicología, 2(1), 22-36.
Medrano, L. A., Moretti, L. S., Muñoz-Navarro, R., & Cano-Vindel, A. (2017).
Validación Argentina de la Versión Breve del Inventario de Situaciones y
Respuestas de Ansiedad. Revista Latinoamericana de Ciencia Psicológica, 9,
doi: 10.5872/psiencia/9.4.41
Medrano, L. A., Muñoz-Navarro, R., & Cano-Vindel, A. (2016). Procesos
cognitivos y regulación emocional: aportes desde una aproximación
psicoevolucionista. Ansiedad y Estrés, 22, 47-54.
Medrano, L. y Flores Kanter, E. (2014). Feedback positivo y desempeño no
verbal en exposiciones orales. Diálogos Pedagógicos, 23 (1); 59-74.
Medrano, L. y Marchetti P. (2014). Impacto de un programa de entrenamiento
en aprendizaje autorregulado y habilidades sociales académicas sobre el
rendimiento y la deserción en ingresantes universitarios. European Journal of
Education and Psychology, 7 (2), 131-144.
Medrano, L., Flores Kanter, E.; Trógolo, M. & Curarello, A., González, J. (2015).
Adaptación de la Escala de Afecto Positivo y Negativo (PANAS) a la Población
294
de Estudiantes Universitarios de Córdoba. Anuario de Investigaciones de la
Facultad de Psicología, 2 (1), 22-36.
Medrano, L.; Flores Kanter, E.; Moretti, L. & Pereno, G. (2016). The Effects
of Positive and Negative Emotional induction on Academic Self-Efficacy.
Educational Psychology, 22 (2), 135-141.
Medrano, L.; Galleano, C.; Galera, L. & Fernández, R. (2010). Creencias
Irracionales, Rendimiento y Deserción Académica en Ingresantes
Universitarios. Liberabit 16 (2), 183-191.
Medrano, L.; Moretti, L. & Ortiz, A. (2015). Medición del Engagement
Académico en Universitarios. Revista Iberoamericana de Diagnóstico y
Evaluación Psicológica (RIDEP), 40 (2), 114-123.
Medrano, L.; Moretti, L.; Ortíz, A. & Pereno, G. (2013) Validación del
Cuestionario de Regulación Emocional Cognitiva en universitarios de
Córdoba. Revista Psykhe, 22 (1), 83-96.
Medrano, L.; Pérez, E. & Fernandez Liporace, M. (2014). Computerized
Assessment System for Academic Satisfaction (ASAS) for first-year University
Student. Electronic Journal of Research in Educational Psychology, 12 (2), 541-
562.
Ministerio de Educación y Cultura (2007). Alumnos precoces, superdotados y de
altas capacidades. Madrid: Author.
Mirsky, A. F., Anthony, B. J., Duncan, C. C., Ahearn, M. B., & Kellam, S. G.
(1991). Analysis of the elements of attention: a neuropsychological approach
[Análisis de los elementos de la atención: un abordaje neuropsicológico].
Neuropsychology Review, 2, 109-145.
Mönks, F. y Mason, E. (2000). Developmental psychology and giftedness:
theories and research. En K. Heller, F. Mönks, R. Sternberg, R. Subotnik
(Eds.), International Handbook of Giftedness and Talent (pp. 81-96). Oxford:
Pergamon Press.
Mora Mérida et al(2000)Psicologíaaplicadaalaactividadfísico-deportiva. Ed.
Pirámide. Madrid.
Morales, J. & Molero, F. (1995). Leadership in two types of healthcare
organization. En J. Peiró, F. Pietro, J. Meliá & O. Luque (Eds.), Work and
Organizational Psychology: European contributions of the nineties (pp. 209-
221). East Sussex, UK: Erlbaum.
Morales, M.M., Marzano, A. (Comps.) (2007) Algunas nociones introductorias a
la Psicología de la Actividad Física y los Deportes. Facultad de Psicología. UNC.
Moretti, L y Medrano, L. (2014). Estructura Factorial del Cuestionario de Estrés
Percibido en la población Universitaria, Evaluar, 14, (1), 67-83.
Moretti, L. S., Candini, V., Cárdenas, F., Conn, H., Fabbro, F., Muñoz-Navarro,
R., & Medrano, L. A. (2018). An appraisal of the fit of a cognitive behavioural
model of headache in University students. Journal of Behavior, Health & Social
Issues.
Moretti, L. y Medrano, L. (2014). Validación del Cuestionario de Conductas de
Dolor en estudiantes con cefaleas. Liberabit, 20 (1), 101-107.
Moretti, L., & Medrano, L. (2014). Estructura Factorial del Cuestionario de
Estrés Percibido en la población Universitaria (Vol. 14).
295
Moretti, L.; Medrano L. & Basler, H. (2015). Validación del Cuestionario de
Lugar de Control del Dolor en estudiantes universitarios argentinos con
cefaleas recurrentes. Pensamiento Psicológico, 13 (1), 27-38.
Moriondo, M.; Palma, P.; Medrano, L. & Murillo, P. (2012). Adaptación de la
Escala de Afectividad Positiva y Negativa (PANAS) a la población de Adultos
de la ciudad de Córdoba: Análisis Psicométricos Preliminares. Universitas
Psychologica, Panamerican Journal Of Psychology, 11 (1), 187-196.
Muchinsky P. (2002) Psicología aplicada al trabajo. México: Thomson Editores.
Mumford, M., Zaccaro, S., Harding, F., Jacobs, T. & Fleishman, E. (2000).
Leadership skills for a changing world: Solving complex social problems. The
Leadership Quarterly, 11, 11-35.
Muñiz, J., Hernández, A., Ponsoda, V. (2015). Nuevas directrices sobre el uso de
los test: investigación, control de calidad y seguridad. Papeles del Psicólogo,
vol. 36, N 3, septiembre-diciembre, (pp. 161-173) Consejo General de
Colegios Oficiales de Psicólogos Madrid, España.
Muñoz-Navarro, R., Cano-Vindel, A., Medrano, L. A., Schmitz, F., Ruiz-
Rodríguez, P., Abellán-Maeso, C., ... & Hermosilla-Pasamar, A. M. (2017).
Utility of the PHQ-9 to identify major depressive disorder in adult patients
in Spanish primary care centres. BMC Psychiatry, 17(1), 291.
Muñoz-Navarro, R., Cano-Vindel, A., Moriana, J. A., Medrano, L. A., Ruíz-
Rodríguez, P., Agüero, L., ... & Ramírez-Manent, I. (2017). Screening for
generalized anxiety disorder in Spanish Primary Care Centers with the
GAD-7. Psychiatry Research, 256, 312-317. http://dx.doi.org/10.1016/j.
psychres.2017.06.023
Muñoz-Navarro, R., Cano-Vindel, A., Ruiz-Rodríguez, P., Medrano, L. A.,
González-Blanch, C., Moriana, J. A., Capafons Bonet, A. & Dongil-Collado,
E. (2017). Modelo jerárquico de diagnóstico y derivación de los trastornos
mentales comunes en centros de atención primaria. Una propuesta a partir
del ensayo clínico PsicAP. Ansiedad y Estrés, 23, 124-129.
Muñoz-Navarro, R.; Cano-Vindel, A.; Wood,C.; Ruíz-Rodríguez, P.; Medrano,
L.A.; Limonero, J.T.; et al. (2016). The PHQ-PD as a Screening Tool for Panic
Disorder in the Primary Care Setting in Spain. PLoS ONE 11(8): e0161145.
doi:10.1371/journal. pone.0161145
Murray, H. G. (1983). Low-inference classroom teaching behaviors and student
ratings of college teaching effectiveness. Journal of Educational Psychology,
75(1), 138-149.
Murray, H. G. (1999). Low-inference teaching behaviours and college teaching
effectiveness: Recent developments and controversies. Higher education:
handbook of theory and research, 15, 239-272.
Murray, H. G. (2001). Low-inference teaching behaviors and college teaching
effectiveness: Recent developments and controversies. Higher Education:
Handbook of Theory and Research, 16, 239-272.
Murray, H. G., & Smith, T. A. (1989). Effects of midterm behavioral feedback on
end-of-term ratings of instructor effectiveness. Paper presented at annual meeting
of the American Education Research Association, San Francisco.
Nahás, R.A. & Medrano, L. (2011). El impacto de la cirugía estética sobre
296
el bienestar psicológico: La importancia de la apariencia personal en el
funcionamiento psicosocial. Revista Argentina de Cirugía Plástica, 8 (2), 82-
88.
Nahás, R.A. & Medrano, L. (2015). El impacto de la cirugía estética sobre
el bienestar psicológico: La importancia de la apariencia personal en el
funcionamiento psicosocial. Cirugía Plástica, 25 (2), 114-122.
Nideffer, RM (1976) Testo f Attentional and Interpersonal Style (TAIS) Journal
of personality and social psychology, 34 (3) 281-290
Northouse, P. (2004). Leadership: Theory and practice. London: Sage Publications.
Nunnally, J. & Bernstein, I. (1995). Teoría psicométrica. México: McGraw-Hill.
Olea, J., Abad, F. J., Barrada, J. R. (2010) Test informatizados y otros nuevos
tipos de tests. Papeles del Psicólogo, vol. 31, núm. 1, enero-abril, (pp. 97-107)
Olivier P. R., Navarro Guzmán J. I., Menacho Giménez, I., López Sinoga, M. M.
& García Sedeño, M. A. (2016). Bienestar psicológico en personas con alta
capacidad intelectual. European Journal of Education and Psychology, 9 (2),
72-78. doi: https://doi.org/10.1016/j.ejeps.2015.12.001
Omar, A. (2011). Liderazgo transformador y satisfacción laboral: El rol de la
confianza en el supervisor. Liberabit, 17, 129-137.
Ones, D. & Viswesvaran, C. (1998). The effects of social desirability and faking
on personality and integrity assessment for personnel selection. Human
Performance, 11, 245-269.
Ones, D., Viswesvaran, Ch. & Dilchert, S. (2005). Personality at work: Raising
awareness and correcting missconceptions. Human Performance, 18 (4), 389-
404.
Palumbo, P., Medrano, L., Lussenhoff, F., González, J. & Curarello, A. (2011).
Emociones Positivas y Negativas en Futbolistas de Alto Rendimiento de la
Ciudad de Córdoba. Psiencia. Revista Latinoamericana de Ciencia Psicológica,
3(2) 66-77
Passow, A. (1993).National/State policies regarding education of the gifted. En
K. Heller, F. Mönks y A. Passow (Eds.), International Handbook of Research
and Development of Giftedness and Talent (pp. 29-46). Oxford:Pergamon Press.
Paulhus, D. (1984). Two-component models of socially desirable responding.
Journal of Personality and Social Psychology, 46, 598-609.
Paulhus, D. (1991). Measurement and Control of Response Bias (Vol. 1).
Peiró, J. (2000). Psicología de la organización. Universidad Nacional de Educación
a Distancia, Madrid, 159, 165-170.
Peixoto, F., Mata, L., Monteiro, V., Sanches, C., & Pekrun, R. (2015). The
Achievement Emotions Questionnaire: Validation for Pre-Adolescent
Students. European Journal of Developmental Psychology, 12, 472-481.
Pekrun, R., Goetz, T., Frenzel, A. C., & Perry, R. P. (2011). Measuring emotions in
students’ learning and performance: The achievement emotions questionnaire
(AEQ). Contemporary Educational Psychology, 36, 36–48.
Pekrun, R., Vogl, E., Muis, K. R., & Sinatra, G. M. (2016). Measuring emotions
during epistemic activities: The epistemically-related emotion scales. Cognition
and Emotion, 1–9.
Pérez Córdoba, E., Estrada Contreras, O., Historia de la Psicología del Deporte.
297
Apuntes de Psicología (2015) Apuntes de Psicología Colegio Oficial de Psicología
de Andalucía Occidental Universidad de Cádiz, Universidad de Córdoba
33 (1) 39-46. Disponible enwww.apuntesdepsicologia.es/index.php/
revista/article/download/561/424
Pérez E.; Medrano, L.; Ayllón, S. & Furlán, L. (2010). Evaluación de un modelo
social cognitivo del rendimiento en lengua y la contribución adicional de la
estructura de metas de aula de dominio. Revista de Infancia y Aprendizaje, 33
(4), 475-487.
Pérez, E. & Medrano, L. (2007) Inventario de Autoeficacia para Inteligencias
Múltiples Revisado: evidencia de validez relacionadas con criterio.Revista
Avances de Medición, 5, 105-114.
Pérez, E. & Medrano, L. (2010). Análisis Factorial Exploratorio: Bases Conceptuales
y Metodológicas. Revista Argentina de Ciencias del Comportamiento, 2 (1), 58-
66.
Perez, E. & Medrano, L. (2013). Teorías contemporáneas de la inteligencia. Una
revisión crítica de la literatura. Psiencia. Revista Latinoamericana de Ciencia
Psicológica, 5 (2), 105-118.
Pérez, E. (2001). Construcción de un Inventario de Autoeficacia para Inteligencias
Múltiples. Tesis Doctoral. Universidad Nacional de Córdoba, Facultad de
Psicología. Inédita.
Pérez, E. y Cupani, M. (2006). Desarrollo y validación de un inventario de
intereses vocacionales: el CIP-4. Psicothema, 18, 2, 238-242
Pérez, E. y Medrano, L. (2007). Inventario de Autoeficacia para Inteligencias
Múltiples Revisado: un estudio de validez de criterio. Avances en Medición, 5,
105-114
Pérez, E., & Medrano, L. (2014). Exploratory factor analysis: conceptual and
methodological basis. Revista Argentina de Ciencias del Comportamiento, 6(3),
71-80.
Pérez, E., Heredia, D., Furlán, L., Zalazar, P., Lescano, C., Pfeiffer, S. y Rosado,
J. (2012). Propiedades psicométricas de la Escala de Clasificación del Talento
(Gifted Rating Scales, Forma Escolar-GRS-S) en una muestra argentina.
Perspectivas en Psicología, 9, 134-141.
Pérez, E., Lescano, C., y Medrano, L. (2012). Un programa de enriquecimiento
en escritura en niños con talento verbal. Libro de resúmenes del IV Congreso
Regional de la Sociedad Interamericana de Psicología, pp. 149. Universidad
Privada de Santa Cruz de la Sierra, Bolivia.
Pérez, E., Passera, J., Olaz, F. y Osuna, M. C. (2005). Orientación, información
y educación para la elección de carrera. Buenos Aires: Paidós.
Pérez, E., y Cupani, M. (2008). Validación del Inventario de Autoeficacia para
Inteligencias Múltiples Revisado (IAMI-R). Revista Latinoamericana de
Psicología, 40, 1, 47-58.
Pérez, E.; Medrano, L. & Furlán, Luis (2012). Evaluación de un modelo social-
cognitivo del rendimiento académico en Lengua. Anuario de Investigaciones de
la Facultad de Psicología, 1 (1), 248-263.
Pérez, E.; Medrano, L. & Sánchez Rosas, J. (2013). El Path Analysis:
conceptos básicos y ejemplos de aplicación. Revista Argentina de Ciencias del
298
Comportamiento, 5 (1), 52-66.
Pérez, E.; Medrano, L.; Mattus, J. y Ayllón, S. (2008). Adaptación de Escalas
de Autoeficacia para Escritura y Lengua. Perspectivas en Psicología. Revista de
Psicología y Ciencias Afines, 5 (1), 86-92.
Petridou, E. & Moustaki, M. (2000). Human factors in the causation of road
traffic crashes. European Journal of Epidemiology, 16, 819-826.
Pfeiffer, S. I., & Jarosewich, T. (2003). Gifted Rating Scales. San Antonio, TX:
The Psychological Corporation.
Pines, A. (1993). Burnout: An existential perspective. En W. Schaufeli, C.
Maslach & M. Tadeusz (Eds.), Professional burnout: Recent developments in
theory and research (pp. 33-51). Philadelphia, PA: Taylor & Francis.
Pinker, S. (1999). How the Mind Works (Vol. 882).
Plomin R, DeFries JC, McClear GE, McGuffin P. (2002). Genética del
comportamiento. Madrid: Gedisa
Poó, F., Ledesma. R. & Montes, S. (2010). Propiedades psicométricas de la
escala de deseabilidad social del conductor (versión en español). Avaliação
Psicológica, 9, 299-310.
Poó, F., Taubman-Ben-Ari, O., Ledesma, R. & Díaz-Lázaro, C. (2013).
Reliability and validity of a Spanish-language version of the multidimensional
driving style inventory. Transportation Research Part F: Traffic Psychology and
Behaviour, 17, 75-87.
Poppelreuter, W. (1917). Die psychischen Schadigungen durch Kopfschuss im
Kriege 1914/16. Leipzig: Verlag von Leopold Voss.
Porter, L. (1991). 22nd International Congress of Applied Psychology: A
summary evaluation. Applied Psychology: An International Review, 40, 239-
244.
Porteus, S. D. (1965) Porteus Maze Test. Fifty years’ application [Test de
Laberintos de Porteus. Cincuenta años de administración]. New York,
EE.UU: Psychological Corporation.
Posada Galeano, D.Y. (2016). Catálogo de pruebas e instrumentos. Laboratorio
de Psicología. Universidad de San Buenavetura Medellín. Extraído de: http://
www.usbmed.edu.co/Portals/0/PDF/Laboratorios-Psicologia/Catalogo-de-
Pruebas-2016.pdf
Praetorius, A. K., Lenske, G., & Helmke, A. (2012). Observer ratings of
instructional quality: Do they fulfill what they promise? Learning and
Instruction, 22(6), 387-400.
Rabin, L. A., Barr, W. B., & Burton, L. A. (2005). Assessment practices of clinical
neuropsychologists in the United States and Canada: A survey of INS, NAN,
and APA Division 40 members. Archives of Clinical Neuropsychology, 20,
33–65.
Raven, J., Raven, J. C., & Court, J. H. (1993). Test de Matrices Progresivas.
Manual. Buenos Aires, Argentina: Paidós.
Rebuffo, M.; Siravegna, M. & Medrano, L. (2012). Comorbilidad Depresiva en
Mujeres con Trastornos en la Conducta Alimentaria. Articulo enviado para su
evaluación. Revista Psicología y Salud, 22 (2), 215-224.
Regard, M., Strauss, E., & Knapp, P. (1982). Children’s production on verbal
299
and non-verbal fluency tasks. Perceptual and Motor Skills, 55, 839–844.
Reis, S., & Housand, A. (2007). Characteristics of gifted and talented learners:
Similarities and differences across domains. En F. A. Kames & K. R. Stephens
(Eds.), Achieving excellence (pp. 62–81). New York, NY: Merrill/Prentice
Renzulli, J. S. (2003). Conception of Giftedness and its relationship to the
development of Social Capital. En N. Colángelo y G. A. Davis (Eds.),
Handbook of Gifted Education (3nd ed) (pp. 75-87). Boston: Pearson
Education.
Renzulli, J. S. y Reis, S. M. (2003). The Schoolwide Enrichment Model:
Developing Creative and Productive Giftedness. En N. Colángelo y G. A.
Davis (Eds.), Handbook of Gifted Education (3nd ed) (pp. 184-203). Boston:
Pearson Education.
Renzulli, J. S., & Reis, S. M. (1997). The Schoolwide Enrichment Model: A
comprehensive plan for educational excellence (2nd ed.). Mansfield Center, CT:
Creative Learning Press.
Renzulli, J. S., Del Siegle, E., Reis, S. M., Gavin, K. M. y Systma Reed, R. E.
(2009). An investigation of the reliability and factor structure of four news
Scales for Rating the Behavioral Characteristics of Superior Studentes. Journal
of Advanced Academics, 21, (1), 84-108.
Rey, A. (1941). L’examen psychologique dans les cas d’encèphalopathie
traumatique. Archives de Psychologie, 28, 286-340.
Rey, A. (1964). L’examen clinique en psychologie. Paris: Press Universitaire de
France.
Rey, G. J., Sivan, A. B. (1995). Las pruebas de Benton para el diagnóstico
neuropsicológico. Manual clínico. Iowa city, EE. UU: AJA Associates.
Rich, B., LePine, J. & Crawford, E. (2010). Job engagement: Antecedents and
effects on job performance. Academy of Management Journal, 53, 617-635.
Ríos, M., Medrano, L. & Moretti, L. (2011).Estructura de les representacions
socials sobre la psicologia durant el transcurs de la carrera. REP:TE. Revista
d’Ensenyament de la Psicologia: Teoria i Experiència, 7 (1), 11-19.
Ritchert, E. (1987). Rampant problems and promising practices in the
identification of disadvantaged gifted students. Gifted Child Quarterly, 31 (4),
149-154.
Roberts, GC (1995) Motivación en el deporte y el ejercicio. Ed. Desclée Brouwer.
Bilbao.
Rodríguez, L. (2004). Identificación y evaluación de niños con talento. En
Benavídes, M.,Maz,A., Castro, E. y Blanco, R. (2004). La educación de niños
con talento en Iberoamérica (pp. 37−47). Santiago de Chile: Oficina Regional
de Educación de la Unesco para América Latina y
Rokeach, M. (1968). Beliefs, attitudes, and values: A theory of organization and
change. San Francisco:Jossey-Bass
Rosario-Hernández, E., Rovira, L. V., Álvarez, C. & Rodríguez, A. (2007).
Efectividad de las escalas clínicas y de validez del MMPI-2 en detectar patrones
de contestación honesto, simulación y engaño en el contexto de selección de
personal. Revista Interamericana de Psicología Ocupacional, 26, 128-139.
Ross, P. O. (1993). National excellence: A case for developing America´s talent.
300
Washington, D. C.: U.S. Department of Education, Office of Educational
Research and Improvement.
Rosvold, H. E., Mirsky, A. F., Sarason, I., Bransome, E. D., Jr., & Beck, L.
H. (1956). A continuous performance test of brain damage [Un test de
rendimiento continuo en daño cerebral]. Journal of Consulting Psychology,
20, 343-350.
Rounds, J., & Tracey, T. J. (1996). Cross-cultural structural equivalence of
RIASEC models and measures. Journal of Counseling Psychology, 43, 310-329.
Ruff, R. M. (1996). Ruff Figural Fluency Test. Lutz, FL: Psychological Assessment
Resources Inc.Salmon, D. P., & Bondi, M. W. (2009). Neuropsychological
assessment of dementia. Annual Review Of Psychology, 60257-282.
doi:10.1146/annurev.psych.57.102904.190024
Ruiz-Rodríguez, P., Cano-Vindel, A., Muñoz-Navarro, R., Wood, C. M.,
Medrano, L. A., & Moretti, L. (2018). Cost-effectiveness and cost-utility
analysis of the treatment of emotional disorders in Primary Care: PsicAP
clinical trial. Description of the sub-study design. Frontiers in Psychology, 9,
281.
Ruiz-Rodríguez, P., Cano-Vindel, A., Navarro, R. M., Medrano, L., Moriana,
J. A., Aguado, C. B., Jiménez Cabré, G. & González-Blanch, C. (2017).
Impacto económico y carga de los trastornos mentales comunes en España:
una revisión sistemática y crítica. Ansiedad y Estrés, 23, 118-123.
Rumschlag, G., Palumbo, T., Martin, A., Head, D., George, R. & Commissaris,
R. (2015). The effects of texting on driving performance in a driving simulator:
The influence of driver age. Accident Analysis & Prevention, 74, 145-149.
Saint - Cyr, J. A., & Taylor, A. E. (1992). The mobilization of procedural learning:
The “key signature” of the basal ganglia. En L. R. Squire & N. Butters (Eds.).,
Neuropsychology of Memory (2nd ed.). New York, EE.UU: Guilford Press.
Saks, A. (2006). Antecedents and consequences of employee engagement. Journal
of Managerial Psychology, 21, 600-619.
Salanova, M. & Llorens, S. (2008). Estado actual y retos futuros en el estudio del
Burnout. Papeles del Psicólogo, 29, 59-67.
Salanova, M. (2003). Trabajando con tecnologías y afrontando el tecnoestrés:
El rol de las creencias de eficacia. Revista de Psicología del Trabajo y de las
Organizaciones, 19, 225-246.
Salanova, M., Llorens, S., Cifre, E. & Martínez, I. (2012). We need a Hero!
Toward a validation of the Healthy and Resilient Organization (HERO)
Model. Group & Organization Management, 37, 785-822.
Salanova, M.; Martínez, I., y Llorens, S. (2005). Psicología Organizacional
Positiva. En F. Palací (Coord.), Psicología de la Organización (pp. 349-376).
Madrid: Pearson Prentice Hall.
Salgado, J. (2003). Predicting job performance using FFM and non-FFM
personality measures. Journal of Occupational and Organizational Psychology,
76, 323-346.
Salgado, J. (2005). Personalidad y deseabilidad social en contextos
organizacionales: Implicaciones para la práctica de la psicología del trabajo y
las organizaciones. Papeles del Psicólogo, 26, 115-128.
301
Salgado, J. F. y Peiro, J. M. (2008) Psicología del Trabajo, las organizaciones y
los recursos humanos en España. Papeles del Psicólogo, Vol. 29 - 1, (pp. 2-5).
Extraído de: http://www.cop.es/papeles
Salgado, J., Moscoso, S. & Lado, M. (2003). Evidence of cross cultural invariance
of the Big Five personality dimensions in work settings. European Journal of
Personality, 17, 67-76.
Sánchez Manzano, E. (1997). Hacia una didáctica para la educación de los niños
superdotados. Revista Complutense de Educación, 8, (2), 1−14
Sánchez-Rosas, J. & Esquivel, S. (2016). Instructional Teaching Quality, Task
Value, Self-Efficacy, and Boredom: A Model of Attention in Class. Revista de
Psicología, 25(2), 1-20.
Sánchez-Rosas, J. (2015). The Achievement Emotions Questionnaire-Argentine
(AEQ-AR): internal and external validity, reliability, gender differences and
norm-referenced interpretation of test scores. Evaluar, 15, 41-74.
Sánchez-Rosas, J., Esquivel, S., & Cara, M. (2016). Teacher Behaviors
Inventory: Internal structure, reliability, and criterion relations with boredom,
enjoyment, task value, self-efficacy and attention. International Journal of
Psycho-Educational Sciences, 5(3), 37-51.
Sanz, J. & García-Vera, M. (2009). Nuevos baremos para la adaptación española
del Inventario de Personalidad NEO Revisado (NEO PI-R): Fiabilidad y
datos normativos en voluntarios de la población general. Clínica y Salud, 20,
131-144.
Sanz, J., Silva, F. & Avia, M. (1999). La evaluación de la personalidad desde el
modelo de los “Cinco Grandes”: El Inventario de Cinco Factores NEO de
Costa y McCrae. En F. Silva (Ed.), Avances en evaluación psicológica (pp. 171-
234). Valencia: Promolibro.
Sbordone, R. J. (1996). Ecological validity: some critical issues for the
neuropsychologist. En R. J. Sbordone & C. J. Long (Eds.), Ecological
validity of neuropsychological testing [Validez ecológica de la evaluación
neuropsicológica] (pp. 15 - 42). Delray Beach, Florida, EE. UU: St. Lucie
Press.
Schabracq, M. & Cooper, C. (2000). The changing nature of work and stress.
Journal of Management Psychology, 15, 227-241.
Schatschneider, C., Fletcher, J. M., Francis, D. J., Carlson, C. D. & Foorman,
B. R. (2004) Kindergarten prediction of reading skills: A longitudinal
comparative analysis. Journal of Educational Psychology, 96, 265-282.
Schaufeli, W. & Bakker, A., (2004). Job demands, job resources, and their
relationship with burnout and engagement: A multi-sample study. Journal of
Organizational Behavior, 25, 293-315.
Schaufeli, W. & De Witte, H. (2017). Outlook work engagement in contrast to
burnout: Real and Redundant! Burnout Research, 5, 58-60.
Schaufeli, W. & De Witte, H. (2017a). Work engagement in contrast to burnout:
Real or redundant? Burnout Research, 5, 1-2.
Schaufeli, W. & Salanova, M. (2007). Efficacy or inefficacy, that’s the question:
Burnout and work engagement, and their relationships with efficacy beliefs.
Anxiety, Stress, and Coping, 20, 177-196.
302
Schaufeli, W. & Taris, T. (2005). The conceptualization and measurement of
burnout: common ground and worlds apart. Work & Stress, 19, 256-262.
Schaufeli, W., Bakker, A. & Salanova, M. (2006). The measurement of work
engagement with a short questionnaire: A cross-national study. Educational
and Psychological Measurement, 66, 701-716.
Schaufeli, W., De Witte, H. (2017b). Outlook work engagement in contrast to
burnout: Real and Redundant! Burnout Research, 58-60.
Schaufeli, W., Leiter, M. & Maslach, C. (2009). Burnout: 35 years of research
and practice. Career Development International, 14, 204-220.
Schaufeli, W., Leiter, M., Maslach, C. & Jackson, S. (1996). Maslach Burnout
Inventory - General Survey. En C. Maslach, S. Jackson & M. Leiter (Eds.), The
Maslach Burnout Inventory-Test Manual (3º Ed.). Palo Alto, CA: Consulting
Psychologists Press.
Schaufeli, W., Maslach, C. & Marek, T. (Eds.) (2017). Professional burnout:
Recent developments in theory and research (2nd Ed). Washington, DC: Taylor
& Francis.
Schaufeli, W., Salanova, M., González-Romá, V. & Bakker, A. (2002). The
measurement of burnout and engagement: A confirmatory factor analytic
approach. Journal of Happiness Studies, 3, 71-92.
Schwarz, N. (1999). Self-Reports: How the Questions Shape the Answers (Vol.
54).
Seligman, M. & Csikszentmihalyi, M. (2000). Positive psychology: An
introduction. American Psychologist, 55(1), 5-14.
Seligman, M.E.P. y Csikszentmihalyi, M.(2000). PositivePsychology: An
Introduction. American Psychologist,55 (1), 5-14
Semrud-Clikeman, M. (2005). Neuropsychological Aspects for Evaluating
Learning Disabilities. Communication Disorders Quarterly, 26(4), 242-247.
Shallice, T. (1982). Specific impairments of planning. Philosophical Transactions
of the Royal Society of London, 298, 199-209.
Silver, C. H., Blackburn, L. B., Arffa, S., Barth, J. T., Bush, S. S., Koffler, S.
P., & ... Elliott, R. W. (2006). The importance of neuropsychological
assessment for the evaluation of childhood learning disorders. NAN Policy
and Planning Committee. Archives Of Clinical Neuropsychology, 21741-
744. doi:10.1016/j.acn.2006.08.006
Simmons, D.D. y Dickinson, R.V. (1986). Measurement of values expresión in
sports and athletics. Perceptual and Motor Skills, 62,651-658.
Sohlberg, M. M. & Mateer, C. A. (1989). Introduction to cognitive
rehabilitation[Introducción a la rehabilitación cognitiva]. New York, EE.
UU: The Guilford Press.
Spontón, C., Medrano, L. A., Maffei, L., Spontón, M. & Castellano, E. (2012).
Validación psicométrica del cuestionario de engagement UWES a la población
de trabajadores de Córdoba, Argentina. Liberabit, 18, 147-154.
Spontón, C., Medrano, L., Castellano, E., Spontón, M. y Maffei, L. (2012).
Adaptación del Cuestionario de Autoeficacia Profesional (AU-10) a la
población de Trabajadores Cordobeses. Pensamiento Psicológico, 10 (1), 51-62.
Spontón, C., Medrano, L., Maffei, L., Spontón, M. y Castellano, E. (2012).
303
Validación del Cuestionario de Engagement UWES a la población de
trabajadores de Córdoba, Argentina. Liberabit, 18 (2), 147-154.
Spontón, C., Trógolo, M., Medrano, L. A. & Castellano, E. (2018). Medición
del burnout: Estructura factorial, validez y confiabilidad en trabajadores
argentinos. Interdisciplinaria, 35(1).
Sternberg, R. (1985). Beyond IQ a triarchic theory of human intelligence.
Cambridge: Cambridge University Press.
Strimbu, K., & Tavel, J. A. (2010). What are biomarkers? Curr Opin HIV AIDS,
5(6), 463-466. doi: 10.1097/COH.0b013e32833ed177
Stroop. J. R. (1935). Studies of interference in serial verbal reaction [Estudios de
interferencia en la reacción verbal serial]. Journal of Experimental Psychology,
18, 643-662.
Stutler, S. L. (2011). Gifted Girls´Passion for Fiction: The Quest for Meaning,
Growth, and Self-Actualization. Gifted Child Quaterly, 55, (1), 18-38
Su, R.; Rounds, J.; Armstrong, P. (2009). Men and things, women and people:
A meta-analysis of sex differences in interests.Psychological Bulletin, 135(6),
859-884.
Suchy, Y. (2016). Executive Functioning. A comprehensive guide for clinical
practice. New York, EE.UU, Oxford University Press.
Sullman, M. & Taylor, J. (2010). Social desirability and self-reported driving
behaviours: Should we be worried? Transportation Research Part F: Traffic
Psychology and Behaviour, 13, 215-221.
Taris, T., Schaufeli, W. & Shimazu, A. (2009). The push and pull of work: The
differences between workaholism and work engagement. En A. Bakker & M.
Leiter (Eds.), Work engagement: A handbook of essential theory and research (pp.
39-53). New York, NY: Psychology Press
tasks in the identification of economically disadvantaged and minority gifted
learners: Findings from Project STAR. Gifted Child Quarterly, 46, 110–123.
Taubman-Ben-Ari, O., Eherenfreund-Hager, A. & Prato, C. (2016). The value of
self-report measures as indicators of driving behaviors among young drivers.
Transportation Research Part F: Traffic Psychology and Behaviour, 39, 33-42.
Taubman-Ben-Ari, O., Mikulincer, M. & Gillath, O. (2004). The
multidimensional driving style inventory —scale construct and validation.
Accident Analysis & Prevention, 36, 323-332.
Tetreau, B. y Trahan, M. (1983). Test Visuel d´Interests. Manuel. Montreal:
SECOREP
Titz, W. (2001). Emotionen von Studierenden in Lernsituationen [Students’
emotions in situations of learning]. Muenster, Germany: Waxmann. sertation,
Institute of Psychology, University of Regensburg, Germany.
Tortosa, F. & Montoro, L. (2002). La psicología aplicada a la selección de
conductores. Cien años salvando vidas. Psicothema, 14, 714-725.
Tosi, J., Ledesma, R., Poó, F., Montes, S. & López, S. (2018). El Test de Asociaciones
Implícitas (Implicit Association Test). Una revisión metodológica. Revista
Iberoamericana de Diagnóstico y Evaluación Psicológica - e Avaliação Psicológica,
46, 175-187.
Tripiana, J., y Llorens, S. (2015). Fomentando empleados engaged:El rol del líder
304
y la autoeficacia. Anales de Psicología, 31, 636-644.
Trógolo, Ledesma, R. & Medrano, L. A. (2018). Adaptación de la Aversion to
Risk Taking Scale en conductores argentinos. Psykhe, 27(2).
Trógolo, M. & Medrano, L. (2012). Personality traits, difficulties in emotion
regulation and academic satisfaction in a sample of argentine college students.
International Journal of Psychological Research, 5 (2), 30-39.
Trógolo, M., Flores Kanter, P. & Medrano, L. A. (2018). Validez y confiabilidad
del Inventario de Expresión de Ira en la Conducción (DAX) en conductores
de Argentina. Revista Iberoamericana de Diagnóstico y Evaluación Psicológica –
e Avaliação Psicológica. RIDEP, 46, 21-35.
Trógolo, M., Flores Kanter, P. E., Pareja, A., & Medrano, L. A. (2017). Adaptación
argentina de la Escala Abreviada de Ira en la Conducción (DAS). Revista
Latinoamericana de Ciencia Psicológica, 9. doi: 10.5872/psiencia/9.3.41
Trógolo, M., Flores Kanter, P., Pareja, A. & Medrano, L. (2017). Adaptación
Argentina de la Escala Abreviada de Ira en la Conducción (DAS). Psiencia.
Revista Latinoamericana de Ciencia Psicológica, 9, 1-20.
Trógolo, M., Ledesma. R. & Medrano, L. A. (2018). The Attitudes toward Traffic
Safety Scale: Translation and validation study in Argentina. Artículo enviado
a evaluación. Journal of Safety Research
Trógolo, M., Pereyra, P. & Spontón, C. (2012). Impacto de diferentes estilos
de liderazgo sobre el engagement y burnout: Evidencia en una muestra de
trabajadores argentinos. Ciencia & Trabajo, 15, 152-157.
Trógolo, M.; Flores Kanter, E. & Medrano, L. A. (2018). Validez y Confiabilidad
del Inventario de Expresión de Ira (DAX) en Conductores de Argentina.
Revista Iberoamericana de Diagnóstico y Evaluación Psicológica, 46 (1), 21-35.
Trógolo, M.; Medrano, L.A.; Ledesma, R. (2017). Propiedades psicométricas
de una escala breve de autoeficacia para la conducción en conductores de
Argentina. Liberabit, 23 (1), 23-38.
Trógolo, M.; Melchoir, F. & Medrano, L. (2014). The role of difficulties in
emotion regulation on driving behavior. Journal of Behavior, Health & Social
Issues, 6 (1), 107-117. DOI: 10.5460/jbhsi.v6.1.47607
Tukto, Lyon y Ogilvie (1969) Athletic Motivation Inventory. Institute for the
Study of Athletic Motivation. SanJosé.
Tulving, E. (1985). How many memory systems are there? [¿Cuántos sistemas de
memoria hay?]. American Psychologist, 40, 385-398.
Turner, R., Barling, J., y Zacharatos, A. (2002). Positive Psychology at work. En
C. Snyder & S. López (Eds.), The handbook of positive psychology (pp. 715-
730). Oxford, UK: Oxford University Press.
Valdés Casals, H (2000) Precisiones necesarias en relación con la psicología del
deporte. http://www.efdeportes.com/Revista Digital. 5 (19) Buenos Aires.
VanTassel-Baska, J., Johnson, D., & Avery, L. D. (2002). Using performance
Ventura, M., Salanova, M. & Llorens, S. (2015). Professional self-efficacy as a
predictor of burnout and engagement: The role of challenge and hindrance
demands. The Journal of Psychology, 149, 277-302.
Vogel, S., & Schwabe, L. (2016). Learning and memory under stress: implications
for the classroom. Npj Science Of Learning, 1, 16011. doi: 10.1038/
305
npjscilearn.2016.11
Wechsler, D. (2003). The WISC-IV technical and interpretive manual. San
Antonio, TX: Psychological Corporation.
Weschler, D. (1984). Test de inteligencia para adultos. Buenos Aires, Argentina:
Paidós.
Wilson, B. A., Alderman, N., Burgess, P., Emslie, H., & Evans, J. (1996). Behavioral
assesment of the disexecutive syndrome [Evaluación comportamental del
síndrome disejecutivo]. Flempton, Bury St. Edmonds, Suffolk, England:
Thames Valley Test Company.
Wilson, B. A., Cockburn, J., & Halligan, P. (1987). The behavioral innatention
test [El test de inatención visual]. Flempton, Bury St. Edmonds, Suffolk,
England: Thames Valley Test Company.
Wilson, B., Cockburn, J., & Baddeley, A. D. (1985). The Rivermead behavioral
memory test manual [Manual del test de memoria comportamental de
Rivermead]. Flempton, Bury St. Edmunds, Suffolk, England: Thames Valley
Test Company.
Wofford, J., Goodwin, V. & Whittington, J. (1998). A field study of a cognitive
approach to understanding transformational and transactional leadership.
The Leadership Quarterly, 9, 55-84.
Yovel, I. & Friedman, A. (2013). Bridging the gap between explicit and implicit
measurement of personality: The Questionnaire-Based Implicit Association
Test. Personality and Individual Differences, 54, 76-80.
Yukl, G. & Van Fleet, D. (1992). Theory and research on leadership in
organizations. En M. Dunnette & L. Hough (Eds.), Handbook of Industrial
and Organizational Psychology (pp. 147-197). Palo Alto, CA: Consulting
Psychologists Press
Yukl, G. (2002). Leadership in organizations. Englewood Cliff, NJ: Prentice-Hall.
Zaccaro, S. (2007). Trait-based perspectives of leadership. American Psychologist,
62, 1-6.
Zalazar-Jaime, M. F.; Losano, M. C.; Moretti,L. S. & MedranoL. A. (2017).
Evaluation of an Academic Satisfaction Model for first-year University
Students. Journal of Psychological and Educational Research, 25(2), 115-140.
Zeidner, M. (1998). Test anxiety: The state of the art. New York: Plenum.
Zuckerman, M., Kuhlman, D., Joireman, J., Teta, P. & Kraft, M. (1993). A
comparison of three structural models for personality: the big three, the big
five and the alternative five. Journal of Personality and Social Psychology, 65,
757-768.
306
Impreso por Editorial Brujas • marzo de 2019 • Córdoba–Argentina