Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Psicológica: Manual de Evaluación
Psicológica: Manual de Evaluación
Manual de evaluación
psicológica
Fundamentos, técnicas y aplicaciones
yo
r— : j »
5 LE OA $
TR ss de AN
AAA TE
p, J
lo Eeye
es ll
Jeomal 0 del or A JS
AA
á |
” m
'
.
'
'
le
mA he
(
l Ao
P os ós PUNA '
e ; %
S
Todos los capítulos que componen el presente manual
son originales y han sido escritos (en inglés o español)
expresamente para el mismo. Los capítulos 16, 17, 21 y
32 han sido traducidos y adaptados del inglés por Miguel
Ángel Martínez-Cabeza.
MANUAL DE EVALUACIÓN PSICOLÓGICA
por
GUALBERTO BUELA-CASAL
y J. CARLOS SIERRA
(dirs.)
siglo veintiuno editores, sa
CERRO DEL AGUA, 248. 04310 MEXICO, D.F.
htips://archive.org/details/manualdeevaluaci0OOOOunse
ÍNDICE
PROLOGO, Vi A A
TREFACIO ae AENA a ece
PRIMERA PARTE
ASPECTOS CONCEPTUALES Y METODOLÓGICOS
A E E E A e e RO
ai ie loe o o london: ceso: ori ce
io e ed di EN
WE, POACIOES LENA UA
IV.5. Larepercusión de la primera y de la segunda guerra mundial.........
Iv.6. Período de crisis de la evaluación psicolÓgiCa......accaconommmmm.m..
Wita eralvación conducir E. mis
Y. LAEVALUACIÓN PSICOLÓGICA ENLA ACTUALIDAD narnia
acc
A O a A A Pl IIA UN ALO 94
íx2.— Publicaciones ct No E A IIA 95
Dc3.. Actimdades protesionales. oi 9
A CONELUSIONES a A A 96
REFERENCIAS BIBTIO CRA 97
EECTURAS COMPLEMENTANRA 101
IV. MODELO PSICODINÁMICO Pr rr rr rr rr rro rro rro rro rr rr rr error rro o rro nooo orcoranorocacocoso
VI. MODELO CONDUCTUAL Pr rr rr rro rr rro rro rr rro rro src arco rra rro rro rr ro rr rorrororoaoccoso
VIL MODELO COGNITIVO Pr rr rro rr oro rro rro rr rr or rro rr rro rro rro rro rr ron oros rro roo roo 9..
rene nonrnanera
Ll. ANÁLISIS DE ÍTEMS .cuccccnoconnnnnnnca ncnnncnros
nonenenrana ernrnrnenenenteneenanann 173
E OL A A 174
IN CA 176
II. nnnonancn
nencannancnnnacnnns
LAFIABILIDAD DE UN TEST occconccononccnnncnnnrnnononanonacnonnnnenocencnnc 179
TA CACAO E E 189
A A a rt 190
E A 193
2... Conceptede propicdad sl 193
Lun Concepto de menudanes 194
errronrrrrarcrc.... 205
ll Pr rr rr rr rr rr rr rro raros oros rr rro rr rro rrorocerccrcrsscosss 205
IL. rorrrcrrrrorrrcoror oro... 205
TIL. Prrrrorrrrrrcrrc corr... 208
111.1. Dimensionalidad del espacio latente .....ononmmesm..... 208
E A A A AA 209
IIL3. Las curvas características de los ÍteMS ...cuonooonionoonannennsme 210
IV. PARÁMETROSDELA CURVA CARACTERÍSTICA DELÍTEM coconnrnenannesinasnos 210
A O o taatn E 210
A 212
AA A A E o: MIDEN AO A + GRA 213
A EA AA e EN a PISO MARE POE TIO DA 213
V. PRINCIPALES MODELOS UNIDIMENSIONALES DE LA TRl .ccoocnnoccconccinnnonnoronos 213
V.1. Modelo logístico de un parámetro o modelo de Rasch.................... 213
va: "Modelo logístico de dos parámetros nnaimetemecieensnat
renteronacoscaccnsar rear 214
VS Modelo Jopisuco Ue tres PArÁnietros inem rre conri 214
VI PASOSPARA LA'CONSTRUCCIÓN DE UN TEST .crtcnnremcanpoerranerec ona 214
DE A 218
RBEERENCIAS BIBLIOGRÁFICA eo tncoccenacaccnrea neon soso ecropeserion tacrteoDd sed UE aceanad e ovindas Esos 219
LECTURAS COMPLEMENTARIAS o.nccconoconncconacccnnnosccrcnnnccarenconcccccncnnncccncnrnanccrccnn
noncranonccnacarccnano 215
UO O LON E
ENE O S 221
IL. CONCEPTO Y OBJETIVO DEL INFORME ooomoccnccccncnnnnnnnonnconncnnnnnansnncnnanarononarannnass 222
UI TIPOS DE LNEORME PSICOLOGICO coooceoeranrceo toser eco oie CR SCELd pues 223
A A A 223
111.2. El informe escrito Pr rr rr rr rr rr rro rra coronar roo. 224
XII Índice
IT. CONCLUSIONES: costociccnionos cias necencscnes aos casop sados anpsrooo tape radosa donen nieda sea anonimas 245
RERERENCIAS BIBUOGRAPIGAS eones aos ri ii scope Tn dat ces Ds 247
LECTURASCOMPLEMENTARIA ra sae 247
SEGUNDA PARTE
TÉCNICAS DE EVALUACIÓN PSICOLÓGICA
13. LA ENTREVISTA, Jorge Fernández del Valle rr rr arco rr rro ros rr rr raro r error rro roo 271
VII. 292
(rr rr rr rr rr rr rr rr rr rr rr rr rr ross rro rr rr 293
Pr rr rr rr rr rr rro rr rr rr rr rr arras rr rr rre 296
DA
DO
297
TIL. 305
TIL. rocoso
RECOGIDA DEDATOS OBSERVACIONALES ooncocancconcoronnnonnonancancnncnnancccnncano Sl
IL. INTRODUCCIÓN
Y DEFINICIONES oocuonmconocncnonconconcencenconcenreecnnrnnrnrn
cencencencanenss 343
II. FUNCIONES DEL AUTORREGISTRO .oococcccononooonornccnccnnccnoraroncccnnnccncocancancnaccnnoncnos 344
II. PROCEDIMIENTOS DE AUTORREGISTRO oomcconcccccsacocoronconccnasncoranconcnncanconasanconos 345
MA DR e 346
O A A 347
Ha... Registros de la duración Lt ARIAS TE 347
A E A A 347
IIL5s. Procedimientos de autorregistro pasivos y/o Mecánicos ...ccmmoo 348
e reee do o ld nd de 349
MI "Gra RAS 349
IV" EXACTITUD DETOSDATOS DE AUTORREGISTRO ctecre eootondocecorincate
rossones 349
AA e dd A np e dic rs E 369
¡E A DARAS
AE RRA ATRAPAR 374
A abilidad IOSTEOIDERtalanotaron
nte reco 374
O AA A A RA 3
ANS
Y O A A OA 377
ER AAA EA 77
A E O ARO ALA 378
v.3. Muestreo de situaciones (validez de los resultados) ...........wcncoo...... 379
a A de 380
A IES O coiree rbciiemeoness 381
A ON OE o ORO 381
REFERENCIAS BIBLIOGRÁFICAS rr rr rr rr rr rr rr rr rr rr rar rar rro 382
LECTURAS COMPLEMENTARIAS rr rr rr rr rr rr rr rro rr rro rro cr ro rro 384
XVII Índice
515
516
516
324
TERCERA PARTE
EVALUACIÓN DE LA INTELIGENCIA
VIL CONCLUSIONES. cuoncanacdrassas Sano iesnopasosr cascos endosar cactinodacdron nda de danne aenompedadngona2a02na 581
REFERENCIASBIBLIOGRAFIGAS Trracecocecoenoino carino dono o ras niooe cios Tinoco EOI UE R E E00S 583
LECTURAS COMPLEMENTARIAS csocorroosotonaniiicaniooto
orar diesieIci GIR cORO danIIIId diodedd ciande 587
Ls RO UN 589
L.... ANTECEDENTES HISTORICOS ¿A a EAT. 20. 590
IL.1. LA perspechWa PSICOMICTEICA secar aero onto Roto E Sat E ROCES 590
M1EZA LA Perspectra psico ii o IZ
113: Procesamientodé liinformación bis sans llar 592
III. FUNDAMENTACIÓN TEÓRICA DE LA INTELIGENCIA TRIÁRQUICA ronmsasons. JN
1.1. Componentes de la inteligencia individual Perro rro rr rr rro rr rr ro 595
nas Procesos de la inteligencia experiencial rr rr rr rr rar rar rr rra rr rro 598
IEL3., La inteligencia práctica Pr rr rr rr rr rr rr rr rr rr rr rr rr rr rr 599
IV. EVALUACIÓN DE LOS COMPONENTES DE LA INTELIGENCIA arororrcrrranconoss... 600
VAL: Componentes dela modalidad verbal 3 ..cinacasrralidje erase sic 600
12: Componentes de la modalidad cuantitativa 600
IV.3. Componentes de la modalidad figurativa rrrrnrrr rr rre rr rr rr rr rr rr 601
V. EVALUACIÓN DE LA INTELIGENCIA EXPERIENCIAL morros oros rr rr ron orar oro 601
Elle Evaluación de los procesos de imsigbt.......cccccnnonnisncininenes. 601
v.2. Evaluación de los procesos de automatización rrrrrrrrarr corr rro rrrnrcorconssso 602
VI. EVALUACIÓN DE LA INTELIGENCIA PRÁCTICA rr rr rr rr arre rr rr rrr rro rar rr 603
VIt. Inteligencia práctica-modalidad verbal rro rro rr rr rr rr rra rr rro 603
Índice XXI
Prieto Pr rr rr rr rr rr rro rr rr rr rro rro src rro sonoros rrrr ron rr rrorrrorrrrororrrorororrcororrorcrsrco... 609
Pr rr rr rr rr rr rr rr rr rr rr rr rr rr rr rr rr rro rr rr rr rr 609
610
11. Antecedentes de la evaluación dinámica (1920-1940) )...ccconoconicininnns. 610
uz” "Diseños expermentales (1 O o ia aa caia 610
IL3. Diseño de teorías, instrumentos y modelos de evaluación dinámi-
ARONA ELO SIGE UE OSO DA 200%. TP AAA 611
REFERENCIAS EII CABAS eat dra re lr dio leyó lcd cines 626
LECTURAS COMPLEMENTARIAS vevouoncooconcasconorconsacanosnnccononosanonncrvsronnrccanonon
Igonac raoncoc ndaraarenccnan 628
CUARTA PARTE
EVALUACIÓN DEL APRENDIZAJE Y DEL DESARROLLO
na — Introducción as o 641
112. Concepto de atención mocosenrreenceennnes 642
ma ¡Modalidades de tención Lt ai 643
Mu Evaluición dla A e EE MES T Tos 645
REFERENCIAS BIBLIOGRÁFICAS oonoconnnccososaroe nano ncsooco renonone r ona slots oo UE pies ae 650
LECTURAS COMPLEMENTARIAS oococococococoomocscnsorcacsoscoccccaconcacacoracaconnacococrorcacarcaraconacoreccccccoocs 657
683
E 683
IL 684
TIL. 685
IV. 686
IV.1. Pruebas de evaluación de la dependencia-independencia de
tenio seats e IDO PA 688
Iv.2. Principales implicaciones de la evaluación de la dependencia-
independencia dScaapo eee bei 690
REFLEXIVIDAD-IMPULSIVIDAD (R-I) Pr rr rr rr rr rr rro rr ross rr rro 692
V.1. Pruebas de evaluación de la reflexividad-impulsividad.......e.wc..... 693
v2. Principales implicaciones de la evaluación de la reflexividad-
impulsividad PP rr rr rr rr rr rr rro rr rro rr rr rr rr rro rr rro rro ercer rasero ros 696
vL GARANTÍAS CIENTÍFICAS DE LAS PRUEBAS DE EVALUACIÓN DE LOS ESTI-
LOS COGNITIVOS PP rr rr or rr rr rr rr rr rr rro rro rro oros rra ros rro rra orenooro so 698
VL1. Garantías científicas en la evaluación de la DIC Irorrrrrrrorrrrr rra rr scorcacroo. 698
VI2. Garantías científicas en la evaluación de la R-1 rrrreror ron nono rocoso rro rar arc so 699
REFERENCIAS BIBLIOGRÁFICAS Pr rr rro rr rro rr rro rro rr rro ars ros rrr oros rr ross rcercroccor.. 701
LECTURAS COMPLEMENTARIAS Pr rr rr rr rr rr rr rr rr rss rr rn rar rr rro rro rerorrr rro rcrranororroos.. 704
Índice XXI
A A O A A A EAT
IRETENGUATE SOS ASPE TOSE VALIA ronsano scans coseno nsoRocacssassas
vI4. «Visually cued language cards (VCLC)» [Método visual para esti-
mulación del lenguaje] de Foster y cols. (1991) ...aaucananiornoernmess» ns 757
vI5. «The Stycar language test » [Test de lenguaje Stycar] de Sheridan
O Ad RASEra 758
vLó. Otras metodologías no estandarizadaS oumenranonoconcrnerennernneannienrennanos 758
VII. onrccnnncnccnno
coronar
CONCLUSIONES...ccccccooononccnconccnnnanancnnnanoccnronononncnon anna nrnnananaranonos 766
REFERENCIAS BB LOERAFICAS tna Raros cai aca aa LESOTO 767
noncnroccnonannncnnnnnonannnannnn
nnonroonononor
LECTURAS COMPLEMENTARIAS occccconcconcananncnconcncnrnn nacanacannnoss 771
L INTRODUCCIÓN sens ronaraanoaruaaneno senos room reno gamIsns ones pad esó si aedaa resa 173
II... CONCEPTO'DE. DESARROLLO PSICOSOCIAL secscoóanoacsacanabioomecocanoneno
tocancancarordono TES
II. TÉCNICAS DE EVALUACIÓN DEL DESARROLLO PSICOSOCIAL occcnoccoconncnnnnss TR
II ES RR A A A AN LR E 778
111.2. Dimensiones de la socialización: rs 780
13. Escalas de evaluación del desarrollo psicosocial .........awommammm.. 782
IV. CONSIDERACIONES SOBRE LA EVALUACIÓN DEL DESARROLLO SOCIAL.. 787
REFERENCIAS BIBLIOGRACICA o ac No 787
FECTURAS.COMPELEMENTARIAS USCIS AS O SETE RESTA 788
l. INTRODUCCIÓN: e E a Sl. Me A A. 9
TT. EE AMBIODE LAA a ee OEI 792
JL. MEFODOSDE EVALUACION O 793
VI. CONCLUSIONES Pr rr rr rr rr rr rro rr rr ros rr rro ro rro rrr scr rro rro ccoo ororocoranorerocc..
Pr rr rr rr rro rro rr rro rr rr rr rr rr rro rro rro rro oro rro sononor os
E QUINTA PARTE
EVALUACION DE LA PERSONALIDAD
E A a 829
II. LA PROBLEMÁTICA DE LOS RASGOS EN PSICOLOGÍA DE LA PERSONA-
829
Ms o OS eN E NI de 829
mos PA ES tua consmot AR AA MERA IIA A 832
832
1.4. Reformulaciones actuales del concepto de rasgo .oauccumommaesmess. 833
A Odd O. 834
UA LOMO O e a el ar e aa 835
Y... dinan
deal ario
LASEXPECIATIVAS coros coor 862
REFERENCIAS BIBLIOGRÁFICAS Cocoa racnll alcoi ed acord oO Ió RM ARES Are LRS aaaO pa RSS 873
LECTURASCOMPLEMENTARIAS do. ccocsacesadene bebas dee ceenco ted servo soso nee yes PO os 880
35. EVALUACIÓN DE LAS ACTITUDES, Félix Neto y J. Carlos Sierra ............... 881
L. INTRODUCCION ALI LTL ANI LASA, Lon crear epocas 881
T. DEFINICION DEACTTUD cmcosomesaras
retos ass cutsdemoraron sanan vals aislada bones 882
va DD EBRIOS a A TI E E 882
119) (Caracteristicas neta RIO e 884
WirFESdde AA a RA 889
ia ti RESNO retar cadete erro IN TB 890
1134 5Escala de drertacosns aa A 8 891
Wa: Escalade Guam E A SE e A 892
Wi Di A 895
(Pr rr rr rr rr rr rr rr rr rr rr rr rr rr rr 914
vL LS
vLt. Exploración delas carreras profesiomales .......eommomrmes». 915
A e a 915
A A A e AA 915
vIL 916
916
917
920
SEXTA PARTE
EVALUACIÓN EN OTRAS ÁREAS
A A A 935
v.2. Técnicas de registro más utilizadas en psicología del deporte ......... 935
TM... Acerca delmodelo.de habilidades oem aacomnsiasancio coord sanaranaca nen saananra 960
IIL2. Acerca del modelo de evitación de Fuller ...........enocoonononononosnommem. 961
1IL3.. Acerca del modelo homeostático de Wilde ........ccconocacocanccararnornonononoo 962
UL4. Acerca del modelo de “riesgo cero” de Náátánen y Summala ........ 964
ms. Problemas comunes a los modelos motivacionales .......e.o.omoommo. 964
Vr A aa 967
AN ias
e e tae a 969
v. GONCLUSONES caida ode dacatanido esta rccada dela cla batero lio 975
AS 976
980
Pnrmmmmnprrrrsrrrrrrcorararsnrscosos 981
rr rr rr rr rr rr rr rr rr rro rr rr ra rr rr rr ro 981
Pr rr rr rr rr rr rr rr rr rr rr rr rr rr rr rr rro 982
O y a A E 982
m0 >uPlementos dellanihss ambiental 2.00 A 984
13. Principales enfoques en psicología ambiental rro error corr rro rr rr 987
TIL. (rr rr rr rr rr rr rr rr rr rr rr rr rr rro rr rr ro rr 988
HILL Aspectos generals nen 988
nL2. El problema de la validez en investigación ambiental rrrrrrcarcorrrcosorn.. 989
IV. LAS TÉCNICAS EN EVALUACIÓN AMBIENTAL rr rre rr rr corro rr rr rra aro 989
IV. Evaluación de variables físicas del medio ambiente desde un enfo-
JE EC E ES 989
Iv.2. Evaluación de escenarios de conducta desde enfoques ecopsicoló-
990
IV.3. Evaluación de características psicosociales de grupos e institucio-
nes: enfoque ccolóricos oca a TER 991
IV.4. Análisis de las relaciones funcionales entre conducta y ambiente y
sus interacciones: enfoque ecológico conductual error arras errors 992
Índice XXIX
LECTURAS COMPLEMENTARIAS (rr rr rr rr rr rro rro rro rr rro rre rr rocosa roo
e E e es
a Ventajas y lemitaciones del CiSeno BIB ant. ragonenicenonrsestrsorconescasrentzoncras
MOFDISEÑODÚPLEXO. 22 iran e ad A Te Ar arta e
Me Caracteristicas generales erase eones anat dea enano pco
v2. Ventajas e inconvenientes del diseño dúpleX......wwaaomaoommormso.
VIII DISEÑO DUPEERICOMPLE MENTA care
conocio toasseed acens
VIA PROPUESTA DE UN DISENO MO an eatenne mo cncnnecsoneto nova vana iones sdecncenenssy
AS ASAS A A AAA
VI boraición de las Pruebas os tacos codnnoon ecos cepoeoieerreree seis
vis. Laselección de la muestra de SUJELOS e osodrasdinnreracasun arcanones
socaramasooonesn
vIL.4. Fase de aplicación de las pruebas ..ua.aomonnoonnno rmscmernmecnmsnns s
CONCLUSIONES....ccoooonccnnoneccncnnnnanononncononnnanronanccnnnancnancnnnnnnnnnnasac
VII. nncnnnnnn o”.
nenonanoncn
REFERENCIAS BBLIOCRARIOA en eoonooaann Donne Dani onone Dam camne sono neon cno Seo uned oe siosoianons
nnnnnnnanennnon ennnenanannós
ononoonan
rnnnonnnranannnn ran
nnonnasan
LECTURAS COMPLEMENTARIAS coocccconononcnnanearn one
XXX Índice
Las plasmaciones de la ciencia social a finales del siglo XX (y los libros representan una
de estas plasmaciones) están caracterizadas por un conjunto de ritos. En el caso de los
Libros: la elección de temática, de editorial, de autores, de temas adscritos a los autores,
de los plazos sistemáticamente incumplidos por parte de alguno de los eslabones de la
cadena de producción, y casi al final de este proceso se encuentra el de cumplir con el
“prologuismo”, una característica peculiar en la que bien que mal la mayoría de los
autores hemos hecho primero peticiones para que “otro” nos prologue y, posterior-
mente, a medida que la edad pasa, para tener que prologar. Hace unos años resultaba
poco frecuente encontrar personas con un libro publicado y mucho menos prologado,
sin embargo, el incremento de publicaciones en la psicología española ha reconvertido
la situación en otra: resulta muy difícil encontrar un profesor de universidad que no
haya escrito todo o parte de un libro y apareció un club, cada vez más frecuente, de
prologuistas. El tema es, además, recurrente, de modo que hay quienes repiten hasta
el punto de que hay que dejar hueco en las agendas para dedicar un período temporal
a este quehacer, por ello, no sin cierta socarronería, algún colega conocido ya comien-
za a calificar a algún otro compañero como “prologuista”.
Como nuevo oficio, el de prologuista posee algunos problemas graves de entre los
que cabe señalar, por lo que se refiere a nuestra tarea aquí, el prologuismo de loa y el
de crítica. De joven, quien escribe estas líneas leyó un prólogo que no solamente era
de extensión similar al del texto que prologaba sino que defendía tesis bastante con-
trarias, lo que no resultó una experiencia especialmente grata. Asimismo, se ha encon-
trado con la experiencia opuesta: que el prólogo era incluso más optimista, defensor y
partidario de la obra que los “oportunos” extractos que el encargado de la promoción
en la editorial selecciona del texto con el fin no solamente de introducir el libro en el
mercado sino de ampliarlo al máximo echando fuera a los otros que existen sobre el
tema. Pienso que ambas posiciones son contraproducentes no solamente para el prolo-
guista sino para los autores y el libro, y en esta ocasión se intentará no caer en ellas. El
objetivo es más bien otro: proponer una estimación global y ensartar algunas conside-
raciones que pueden tener algún interés en el campo de la evaluación psicológica.
De una u otra forma, escribir un prólogo resulta un honor, y en el caso actual pue-
de llegar a representar un honor inmerecido. Por parte del autor de estas líneas resulta
sin lugar a dudas un honor en la medida en que el presente volumen representa la
obra colectiva de un buen número de profesores de psicología y el alcance de la obra
es considerable. Su lectura promete implícitamente unas continuaciones que rellenen
algunos huecos y completen el amplio panorama que ya, de por sí, abarca. Para bien o
para mal (desde el punto de vista de quien esto escribe, para lo primero, lo que se tra-
tará un poco más adelante), recoge una multiplicidad de orientaciones de “escuelas”
de pensamiento psicológico distintas que, si bien no están todas las que son, son todas
XXXU Prólogo
En tres ocasiones en los últimos doce meses, el autor de estas líneas se ha encontra-
do con un comentario que, procedente de fuentes diversas, ha tenido un contenido co-
mún: el primero, de un artículo en inglés en el que se calificaba a la psicología en espa-
ñol como contrastadora de hipótesis pero no como creadora de modelos (el trabajo se
refería a un tema candente en psicología de la salud, el estudio de la calidad de vida
de los enfermos), los otros dos han sido en congresos internacionales: uno en España y
otro en el extranjero y en ambos casos se defendía la idea de que en España se produ-
Prólogo XXXII
cían obras “de traducción” y, en el mejor de los casos, de compilación de trabajos rea-
lizados por investigadores de otros países (esencialmente de aquellos que ejercen su
actividad en Estados Unidos). Las raíces celtibéricas del autor se removieron y en un
caso protestaron, en los otros, dejaron pasar. El problema, sin embargo, queda abí y
podría resumirse en una frase que tiene la parte de verdad y de mentira que poseen
todas las caricaturas: la psicología española ha generado lectores de libros de psicolo-
gía producidos en otros países con la suficiente “entidad” como para que puedan
“contrastarse” ideas de otros, pero el panorama nacional percibido por “los de fuera”
no da lugar para muchas alegrías.
Es posible que se pueda defender esta situación desde posiciones muy dispares que
van desde la “homogeneización” de la psicología española a cánones internacionales
(nunca jamás han aparecido tantos autores españoles en revistas extranjeras de psico-
logía como en los últimos años), lo que ha sido y es promovido desde estructuras de
política científica estatal (quien no publica en inglés apenas existe en España, si existe;
los trabajos no se califican por su valor en sí mismos sino en función de la revista o la
editorial en la que se publican), hasta la creencia de que la psicología es una ciencia es-
trictamente natural y, por lo mismo, los “sujetos” son tan homogéneos entre sí como
unos átomos de sodio con otros; y las relaciones entre los componentes (la estructura
empírica y funcionalmente activa de la subjetividad) es la misma entre los habitantes
de Manhattan, Idaho, Tokio, Madrid, Tegueste y Alfafar. Si bien esta manera de
pensar es defendible en psicología (y en evaluación psicológica, por lo demás, se refiere
a toda la gran especialidad de la psicología transcultural), la verdad es que representa
una opción posible pero ni la única ni, en opinión del autor de estas líneas, la más ade-
cuada a nivel de aplicación profesional concreta en muchos campos de la psicología de
la evaluación. Las topografías comportamentales —funcionales— y vivenciales de
culturas y pueblos con tradiciones distintas no son superponibles sin negar la especifi-
cidad psicológica de estos pueblos y culturas; y mucho menos de los individuos que las
constituyen y cuyas interacciones forman el entramado de esa cultura. En paralelo y
en contraposición a la tendencia psicológica homogeneizadora de los medios de pro-
ducción, consumo, comunicación e informatización existe otra de diferenciación y es-
pecificación de las interacciones de adaptación del ser humano con el ambiente o con-
texto en el que vive. La negación de la segunda tendencia lleva consigo, entre otras
cosas, la negación de la diversidad cultural y la imposición de una única forma de ver
la realidad, entenderla, sentirla y comunicarla (y de la ciencia que la estudia), lo que
podría derivar en la posible imposición de una ingeniería sociológica homogeneiza-
dora que preludia la posible aplicación de una ingeniería genética encaminada al mis-
mo fin. Sería deseable que las ideas que forman este párrafo fuesen totalmente erró-
neas, aunque me temo que corren el peligro de tener una parte considerable de
verdad, al margen del alarmismo con el que pueden calificarse.
Desde otra perspectiva, la “naturalización” de la psicología convierte los trabajos
publicados en una “psicología transcultural” —émica que ha sido reiteradamente cri-
ticada y denunciadas sus limitaciones desde hace ya más de dos décadas desde presu-
puestos morales, epistemológicos y antropológicos. Y lacrítica viene justificada, entre
otras cosas, porque los modelos e instrumentos científicos tienden a ser originados a
partir de la observación de una parcela de la realidad quesepresenta como funcional-
mente oscura o con problemas. Pero, repárese, de la realidad que tiene delante el in-
XXXIV Prólogo
adecuada de las dos orientaciones que han sido presentadas sea una solución ecléctica
y, además, más eficaz y pertinente para resolver los problemas que tiene planteados
en la actualidad la evaluación en España. Pero los dos, y cada uno de ellos debe tener
su derecho y su lugar dentro de un panorama científico; a nivel aplicado, desde luego
resulta claro que es preferible el que es generado y validado desde los propios proble-
mas, a nivel transcultural es mejor el que se está llevando a cabo. Pero confundir la
ciencia y el valor de la ciencia psicológica eficaz con el dominio de idiomas, el poder
político dentro de la ciencia, el control político de las ideas, la sociología de la ciencia,
los medios de comunicación o la presencia en los foros internacionales de difusión re-
presenta una confusión grave y ante la que es posible que debamos mantenernos en
guardia para que la evolución de esta apenas nacida “oficialmente” psicología espa-
ñola posibilite unos mayores y mejores logros.
Es muy posible que éste no sea el mejor foro para promover una discusión sobre el
tema (al que volverá el autor de estas líneas en breve y en una publicación especial so-
bre ello), pero también es posible que en un libro dedicado a la evaluación psicológica
y en la que ambas orientaciones se encuentran presentes (con predominio de la trans-
cultural), estas líneas representen un caveat conveniente y que sea objeto de reflexión,
siquiera para los que han llegado hasta aquí.
“y rra 4
NILO Y wal Fs
¡NOTES PATATA 10 0-
eE de OL ALE MAN TOA
de forma obligatoria sea cual sea la universidad española en la que se estudie, o dicho
más sencillamente, la ley no permite ser psicólogo sin demostrar que se conocen y
dominan las técnicas y procedimientos de evaluación.
En cuanto a la orientación o modelo en que se puede clasificar este libro, sin
duda está influido, o mejor dicho, determinado por la postura epistemológica de los
directores en lo que se puede considerar evaluación psicológica dentro de un ámbito
académico y con, al menos, algunas garantías científicas. Así, en nuestra opinión, los
modelos de evaluación psicométrica y conductual son válidos, complementarios y
necesarios para la práctica profesional del psicólogo. En la actualidad, ya ningún psi-
cólogo, salvo aquellos que se dedican a “rumiar sus propios pensamientos”, o %a ne-
gar lo cognitivo con sus propias cogniciones” (sin darse cuenta de la estúpida para-
doja), y que viven habitualmente alejados del mundo real y profesional; salvo éstos,
que cada día son menos, ya nadie defiende que un solo modelo es “capaz y suficien-
te” para tratar de entender, explicar y modificar (cuando sea necesario) el tan com-
plejo comportamiento humano. No queremos extendernos en este aspecto, tan sólo
pretendemos dejar explícito que el diseño de este manual es un buen reflejo de nues-
tra postura epistemológica que, por supuesto, el lector puede compartir o no.
El contenido del presente manual está estructurado en seis grandes apartados.
El primero, considerablemente amplio, se dedica a las bases conceptuales y meto-
dológicas. Así, se abordan los aspectos históricos, la epistemología, el proceso, di-
versas alternativas metodológicas... y, por supuesto, las cuestiones éticas y deonto-
lógicas, sin duda algo que debe estar siempre presente en cualquier proceso de
evaluación.
En el segundo apartado se describen y explican las principales técnicas de evalua-
ción psicológica, tanto las conductuales como las psicométricas, desde las cognitivas
hasta las psicofisiológicas y las neuropsicológicas. Quizá sea bueno mencionar que
por primera vez se incluye la técnica de evaluación motora, el tercer componente de
respuesta siempre mencionado y siempre olvidado en los libros de evaluación.
En el tercer apartado se incluyen las diferentes técnicas y procedimientos para
evaluar la inteligencia: los tests de inteligencia más importantes, la evaluación cogni-
tiva de la inteligencia y el modelo triárquico planteado más recientemente por
R. Sternberg.
En un cuarto apartado se aborda la evaluación del aprendizaje y del desarrollo;
desde la memoria y la atención al desarrollo sensoriomotor y psicosocial, pasando
por los estilos cognitivos y el lenguaje. Asimismo, se incluye un tema dedicado a la
evaluación de los problemas emocionales y conductuales infantiles.
El quinto apartado se dedica a uno de los campos más tradicionales de la evalua-
ción psicológica, la evaluación de la personalidad que se hace desde una perspectiva
clásica como es la de los rasgos psicológicos y desde una orientación cognitiva. Tam-
bién se recoge en este bloque la evaluación de las actitudes y la de los intereses.
Por último, en el sexto apartado se incluye una relación de técnicas y procedi-
mientos en ámbitos aplicados que van desde la evaluación en la psicología del depor-
te, evaluación en tráfico y seguridad vial, hasta la compleja metodología de la evalua-
ción de programas. No obstante, aunque al lector le puede llamar la atención la
ausencia de aplicaciones en el ámbito clínico, esto es intencionado, pues los directo-
res de este manual recientemente han publicado otro manual sobre evaluación en
Prefacio XXXIX
GUALBERTO BUELA-CASAL
Santa Bárbara, California, septiembre de 1997
J. CARLOS SIERRA
Granada, septiembre de 1997
porta
PA dl DO
msa uevien
y «Dr
*
q * 4
L
-
a
FAS
verorr componen
, 173 4
dev;
[2
Muse; y ina
Í : y proceden
1] $
% p 14 ÓN
RELACIÓN DE AUTORES
I. INTRODUCCIÓN
Universidad de Granada.
4 Gualberto Buela-Casal y J. Carlos Sierra
influencia de los astros, estando dicha influencia determinada por la posición relativa
de los planetas en el momento del nacimiento. A primera vista, parece que se dan las
condiciones necesarias para un proceso diagnóstico, puesto que existe un evaluador,
un evaluado, unos instrumentos, una intención por la explicación y el pronóstico y
una teoría que lo sustenta. Sin embargo, un análisis más detallado nos lleva a enten-
der la astrología como algo considerablemente distinto de la evaluación psicológica,
para que pueda considerarse un antecedente. En primer lugar, la astrología es una
práctica que podría incluirse dentro de lo mágico; en segundo lugar, el sujeto objeto
de evaluación no es el individuo en sí, ni su ambiente inmediato, sino tan sólo una de
cha, una hora y un lugar —de hecho se puede hacer una predicción sin la presencia
de la persona supuestamente evaluada; en tercer lugar, no tiene ninguna utilidad so-
cial, puesto que se limita a predecir el destino determinado por los astros; y, por últi-
mo, la astrología ha tenido una mínima o escasa evolución desde sus inicios hasta la
actualidad, sin darse ningún tipo de interacción con la evolución de la psicología, es
decir, la psicología se ha desarrollado con total independencia de la astrología. Mues-
tra de ello es que ningún astrólogo ha ido desarrollando su teoría hasta convertirla en
una escuela o corriente psicológica. Por tanto, no hay aspectos de la astrología que se
hayan transformado hasta convertirse en un constructo psicológico. En definitiva,
en nuestra opinión, aunque aparentemente tienen aspectos comunes, consideramos
que la astrología no ha sido un antecedente de la actual evaluación psicológica.
DuBois (1970) sitúa el nacimiento de la evaluación psicológica en la antigua Chi-
na, donde se realizaba una selección de los niños que en el futuro podrían ejercer
funciones en la administración pública. Los seleccionados eran sometidos a un in-
tenso programa de aprendizaje, al final del cual se evaluaba si habían conseguido la
capacitación para ocupar los puestos que les serían asignados. Por tanto, parece un
claro antecedente de la selección de personal. Otro hecho aislado que se suele citar
como antecedente de la evaluación psicológica son los procedimientos de la escuela
de Pitágoras para seleccionar a sus alumnos (Martorell, 1988).
Otro antecedente en el que suelen coincidir los autores que han estudiado la evo-
lución histórica de la evaluación psicológica es la fisiognomia (las características psi-
cológicas de un individuo pueden evaluarse por sus rasgos físicos), que tiene sus
raíces en el pensamiento filosófico griego. Según Rubinstein (1981), la historia de la
ciencia demuestra cómo las antiguas ideas de los filósofos griegos se formaron en el
proceso cognoscitivo práctico del hombre, con la acumulación de conocimientos de
los naturistas, médicos y filósofos. Dichas ideas se desarrollaron en oposición a las
ideas mitológicas sobre el mundo en general y sobre el hombre en particular. En este
contexto, resulta de especial importancia la concepción filosófica de Aristóteles,
quien aspira a vencer el dualismo de su maestro Platón. Aristóteles entiende el cuer-
po y el alma como algo indivisible. Por tanto, cada una de las funciones orgánicas
tiene su alma, considerando al cuerpo un organismo compuesto por órganos e ins-
trumentos del alma. Por ello, la teoría del alma es la teoría general de la vida y sus
funciones, lo que implica tanto sus funciones orgánicas como la vida consciente (Ru-
binstein, 1981). Con Aristóteles, lo psíquico se aproxima a lo físico, lo que implica
una base biológica del carácter. Las ideas de Aristóteles tuvieron su continuidad en
su discípulo Teofrasto. Este hace una sistematización de los principios de la fisiog-
nomia que lleva a plantear distintos caracteres que se establecen por medio de la ob-
Evolución histórica de la evaluación psicológica 5
Los importantes avances científicos ocurridos durante el siglo XVII1, y sobre todo en
el XIX, harán que la psicología se separe de la especulación filosófica y se acerque al
método científico. Los antecedentes científicos de la evaluación psicológica podrían
situarse en el desarrollo de disciplinas como la frenología, la matemática, la psicofísi-
ca, la psiquiatría, la psicología educativa y el evolucionismo.
La frenología surge a finales del siglo XVIII y pronto alcanza una gran populari-
dad. Su creador, Gall (1758-1828), proporciona la primera conceptualización siste-
mática de los rasgos, la cual se apoya en los siguientes enunciados:
a. Se crea una taxonomía mental, según la cual se pueden explicar las diferen-
cias individuales.
Evolución histórica de la evaluación psicológica
7
cos del psiquismo humano. Sin embargo, no todo fue negativo, puesto que la psico-
logía experimental del siglo XIX sirvió para poner de manifiesto la importancia de
controlar de forma rigurosa las condiciones en las que se hacían las observaciones.
Por ejemplo, se controlaban las características del estímulo, el contexto en el que se
presentaba, las instrucciones que recibía el sujeto, etc. En definitiva, se trataba de
evaluar a todos los sujetos en las mismas condiciones tipificadas. Como es bien sabi-
do, esto fue totalmente asumido en el proceso de construcción y en la aplicación de
tests (Anastas1, 1988).
Existe un cierto consenso en considerar a Galton, Cattell y Binet como los autores
que configuraron la evaluación psicológica como disciplina científica. A continua-
ción se hará referencia a ellos, así como a otros autores que también han contribuido
de modo relevante a la constitución de la evaluación psicológica. En segundo lugar,
se hará un recorrido por los diferentes acontecimientos que han supuesto el desarro-
llo de esta disciplina.
con el año en que Wundt inauguraba el primer laboratorio de Psicología, Galton pu-
blica dos artículos sobre psicometría titulados «Psychometric experiments» y «Psy-
chometric facts». En 1883 publica su obra más importante Inquiries into human fa-
culty and its development [Investigaciones sobre la facultad humana y su desarrollo],
que con el transcurso del tiempo se convertiría en un clásico de la evaluación psico-
lógica. Las aportaciones más relevantes de Galton podrían resumirse en los siguien-
tes puntos (Pelechano, 1988):
James McKeen Cattell (1861-1934) fue un psicólogo estadounidense con una sólida
formación adquirida en Europa. Su tesis doctoral trató sobre las diferencias indivi-
duales en el tiempo de reacción y fue realizada en el laboratorio de Wundt (Leipzig).
Posteriormente, trabajó con Galton en el laboratorio antropométrico del South
Kensington Museum de Londres. En 1888 fue nombrado profesor de psicología en
12 Gualberto Buela-Casal y J. Carlos Sierra
Binet (1857-1911) era un licenciado en leyes y doctor en ciencias naturales que entró
en la psicología de la “mano” de Ribot, el gran promotor de la psicología experimen-
tal en Francia. Ribot entendía que el progreso de la psicología estaba en los métodos
experimentales (aunque no era un investigador), no en vano fue el fundador del pri-
mer laboratorio de psicología en la Universidad de la Sorbona, en el año 1889. Este
laboratorio estuvo dirigido por Bonin hasta 1895, a partir de entonces la dirección
pasa a Binet (Yakunin, 1985). En el año 1895, Binet funda L”Année Psychologique, la
primera revista francesa de psicología. En esta revista publica un artículo, «La psy-
chologie individuelle», en el que presenta las bases para una nueva aproximación a la
evaluación de la inteligencia. Binet compartía con Galton el interés por la evaluación
de las diferencias individuales, pero rechazaba la idea de que la inteligencia humana
podía evaluarse por medio de los procesos sensoriomotores. En su artículo, Binet y
Henri defienden que la inteligencia debe evaluarse según el rendimiento de los suje-
tos en diversas tareas que impliquen una variedad de procesos mentales complejos
(McReynolds, 1986). Binet y Henri comenzaron evaluando procesos como la me-
moria, la atención, la imaginación, la comprensión, la sensibilidad artística y moral,
la sugestibilidad, la fuerza de voluntad y la habilidad motora. Binet incluye como ca-
racterísticas de la conducta inteligente el tomar y mantener una dirección definida, el
adaptarse para alcanzar un fin y la autocrítica (Cronbach, 1990).
La gran oportunidad de Binet llega cuando es nombrado por el Ministerio de
Educación francés miembro de la comisión que se encargaría de buscar una solución
Evolución histórica de la evaluación psicológica
13
para los niños deficientes que habían entrado en la escuela pública como consecuen-
cia de la puesta en vigor de la enseñanza obligatoria en Francia. En respuesta a esta
petición, Binet, en colaboración con Simon, desarrolla una escala que contiene 30
problemas con grado de dificultad creciente. Para calcular el nivel de dificultad se
aplicó la escala a 50 niños normales con edades comprendidas entre 3 y 11 años y a
algunos con retraso mental. El contenido de los ítems cubría gran variedad de fun-
ciones, aunque predominaban los problemas relativos a comprensión y razona-
miento. La prueba resultante que se conoce como la escala de 1905 fue considerada
como un instrumento de evaluación provisional (Anastasi, 1988). Como señala Pi-
chot (1994, p. 120) «por primera vez se había salido de la era de las experiencias de la-
boratorio para entrar en la vida concreta». Binet y Simon siguen trabajando en esta
escala, y en 1908 presentan una segunda versión en la que se habían adaptado series
de ítems para grupos de edad. La edad mental se establecía según la edad correspon-
diente a la serie más elevada resuelta totalmente. Puesto que cada serie, que se corres-
ponde con una edad mental determinada, consta de cinco problemas, se añadía a la
edad base (la de la serie correctamente realizada en su totalidad) 1/5 de año por cada
test bien resuelto perteneciente a series superiores. La edad mental obtenida se ponía
en relación con la edad cronológica, viendo de esta forma si el niño seguía una evolu-
ción normal, retrasada o adelantada. En 1911, se presenta una tercera versión de la es-
cala, se aumentó el número de ítems en algunos niveles y se extendió a la edad adulta.
Sin embargo, la versión más difundida fue la realizada por Terman en la Universidad
de Stanford, conocida como la Escala de Stanford-Binet. En ésta se utiliza por pri-
mera vez el término de «cociente intelectual» (CI), como razón resultante de dividir
la edad mental por la edad cronológica. Posteriormente, aparecieron otras versiones,
pero resulta de especial interés la realizada por Kuhlmann en 1912 (Escala Kuhl-
mann-Binet) que extendió la escala por su parte inferior hasta la edad de tres meses,
siendo revisada posteriormente en 1937 y 1960". Terman efectúa otras dos revisiones
y, finalmente, Thorndike realiza la última hasta la fecha, en 1986 (Rogers, 1995).
Sin embargo, estas escalas no estaban exentas de problemas. Así, mientras Gal-
ton postulaba la medida de una inteligencia innata o biológica, Binet defiende la eva-
luación de una inteligencia de origen social (Luján, 1991). Pronto el movimiento euge-
nista toma como instrumento el test de Binet y Simon identificando la inteligencia
innata con la social. Pelechano (1988) señala que la lógica utilizada por Binet en la
construcción e interpretación de la escala era correcta, pero vista desde una óptica
actual tenía algunos problemas importantes:
1 La versión de 1960 fue adaptada en España por un grupo de psicólogos bajo la dirección de José
Germain.
14 Gualberto Buela-Casal y J. Carlos Sierra
Por otra parte, el tipo de problemas que se planteaba estaba íntimamente relacio-
nado con los contenidos académicos, por lo que la escala era buena predictora del
rendimiento académico, que no es lo mismo que capacidad intelectual.
A pesar de los problemas metodológicos que se detectan en las escalas de Binet,
éste debe ser considerado como el gran propulsor de la evaluación psicológica. Su
actividad ha sido realmente la de un evaluador y su influencia ha estado vigente du-
rante varias décadas. Una buena muestra de ello fue la cantidad de investigadores
que se interesó por la evaluación de la inteligencia durante las dos primeras décadas
del siglo XX. La producción en este campo era tan abundante como diversificada.
Por ello, en 1921 los directores del Journal of Educational Psychology organizaron
un congreso bajo el título La inteligencia y su medida e invitaron a distintas autori-
dades en la materia (Terman, Thorndike, Peterson, Thurstone, Woodrow, Pinter,
Colvin, Henmon...) para tratar sobre la naturaleza de la inteligencia (Sternberg,
1986). El resultado fue decepcionante; había casi tantas concepciones de inteligencia
como expertos que opinaban sobre el tema. El desconcierto era tal que Binet llegó a
pronunciar la famosa frase «inteligencia es lo que miden los tests». Sin embargo, el
congreso sirvió para establecer un cierto acuerdo acerca del camino a seguir en la fu-
tura investigación de la inteligencia (Marrero y cols., 1989). Desde entonces, han pa-
sado más de setenta años y aún no se ha llegado a un acuerdo unánime acerca de lo
que es la inteligencia y de cómo debe evaluarse (Eysenck, 1991).
de la evaluación conductual (McReynolds, 1986). Witmer fue un autor con una in-
fluencia limitada en la evaluación psicológica. Sin embargo, su gran mérito fue tratar
de aplicar la psicología a los problemas que se plantean en la vida real. Por otra parte,
su clínica psicológica sirvió como modelo a otras muchas que se fundaron posterior-
mente.
Spearman (1863-1945) supone otro paso importante en la constitución de la eva-
luación psicológica por haber aplicado los métodos correlacionales a la investigación
de la inteligencia. En el año 1904 publicó un importante artículo titulado «General
intelligence, objectively determined and measured», donde se sientan las bases de la
teoría psicométrica. Fue el primer autor que se interesó en buscar una explicación a
la baja correlación que se obtenía entre distintos tests de inteligencia y en plantear la
necesidad de utilizar pruebas paralelas para su evaluación. La gran aportación de
Spearman no sólo fue metodológica, sino que además fue el autor de la primera gran
teoría de la inteligencia, denominada teoría de los dos factores (un factor general y
unos factores específicos). Según dicha teoría, la capacidad representada en el factor
general (factor g) está relacionada con todas las tareas intelectuales, mientras que las
capacidades representadas en los factores específicos se relacionan con tareas senci-
llas. Para explicar la naturaleza del factor g Spearman propuso dos teorías. En la pri-
mera, se decía que el factor g estaba relacionado con el nivel de energía cerebral que
las personas pueden utilizar para resolver problemas intelectuales; la segunda consi-
dera que las diferencias en el factor g pueden explicarse según las diferencias indivi-
duales en la capacidad de las personas para utilizar tres principios cualitativos de
cognición: aprehensión de la experiencia, deducción de relaciones y deducción de
correlaciones (Sternberg, 1986; Marrero y cols., 1989). En la década de los años
treinta este esquema bifactorial será sustituido por un modelo multifactorial repre-
sentado por Thurstone.
Por último, Freud (1856-1939) plantea un enfoque diagnóstico basado en las
técnicas de asociación y en la utilización del simbolismo. En 1909 sus conferencias
en la Clark University of New York propiciarán la difusión del psicoanálisis en
Estados Unidos (Ávila, 1992b), dando lugar al diagnóstico dinámico que se desa-
rrollará a partir de la década de los años treinta con el uso de las técnicas proyec-
tivas.
cológica hasta entonces es interpretado por Silva (1982) en función de tres aspectos
importantes:
para responder también era limitado. Para evaluar la sintomatología neurótica se uti-
lizó el Woodworth personal data sheet, un inventario de personalidad elaborado por
Woodworth y que llegó a aplicarse a más de un millón y medio de personas.
La influencia de todo este proceso ha tenido gran importancia en el desarrollo de
la evaluación psicológica en diversos aspectos, que intentaremos sintetizar en los si-
guientes puntos:
La evaluación psicológica del período entre las dos guerras mundiales es caracte-
rizada por Silva (1982) como de «creciente expansión» y «creciente disociación». La
«creciente expansión» se refiere a la universalización de la evaluación psicológica y
su generalización a otros ámbitos (distintos del militar) y la especialización de la eva-
luación en áreas tan diversas como inteligencia, aptitudes, motricidad, intereses,
conducta social, personalidad, etc. La «creciente disociación» hace referencia a que,
por un lado, se produce un espectacular crecimiento del modelo psicométrico y, por
otro, surge también con gran fuerza una evaluación clínica, principalmente de tipo
proyectivo, y que no acepta los avances técnicos y metodológicos del modelo psico-
métrico. Esta evaluación de corte clínico no surge al azar después de la primera gue-
rra mundial. Por un lado, los instrumentos de evaluación clínica no tenían ninguna
utilidad en las tareas de selección y colocación requeridas por el ejército estadouni-
dense, pero sí se convierten en necesarios después de la guerra para la reinserción
de sujetos a la sociedad. La difusión de las técnicas proyectivas tiene su inicio en la
publicación por parte de Rorschach en 1921 de Psychodiagnostik, aunque no con-
viene olvidar que Jung ya había presentado en 1904 la prueba de asociación libre de
palabras.
Los antecedentes del test de Rorschach pueden remontarse a la antigua idea grie-
ga de que la interacción de una persona con una entidad ambigua facilita informa-
ción para el conocimiento de la primera. Según Álvarez (1972), en sus versiones más
primigenias, el test de Rorschach es tan antiguo como el hombre de Cro-Magnon,
cuando interpretaba las “manchas” de aquellos refugios rupestres. En el Renaci-
miento, Leonardo da Vinci aconsejaba a sus discípulos que ejercitaran su imagina-
ción contemplando los desconchones o las figuras que la humedad dibujaba en las
paredes. También puede relacionarse con una costumbre arraigada en algunas regio-
nes de Alemania que consistía en tirar una gota de plomo fundido en un recipiente
de agua fría e interpretar la forma resultante al solidificarse. Según la tradición, cuan-
do la interpretación se realizaba en la noche de San Silvestre podía averiguarse el fu-
18 Gualberto Buela-Casal y J. Carlos Sierra
turo de la persona que arrojaba el plomo fundido. Pero sin duda, el antecedente más
claro es la técnica denominada klebsografía (desarrollada por Klebs) que consiste en
echar unas gotas de tinta sobre un papel que posteriormente se dobla por la mitad,
interpretándose las manchas resultantes. A finales del siglo XIX, Binet comienza a
utilizar las manchas de tinta para estudiar la capacidad de imaginación visual. Algu-
nos años después, Herman Rorschach utiliza esta técnica para el diagnóstico de la
personalidad y de los trastornos psíquicos. De la totalidad de láminas utilizadas se-
lecciona diez con el fin de publicar su método, lo cual no consiguió hasta dos años
después, gracias a la mediación de Morgenthaler, que además sugirió a Rorschach
que cambiase su título original, «Método y resultados de un experimento diagnósti-
co basado en la percepción e interpretación de formas causales» por el de «Psico-
diagnóstico». En un principio, el libro tuvo muy poca aceptación. Las críticas fueron
pocas y en general desfavorables, lo cual le produjo una decepción considerable.
Rorschach murió sin saber la popularidad que llegaría a tener la técnica que había
creado (Serrate, 1980). En los años siguientes la evaluación dinámica irrumpe con
fuerza, fundamentalmente en la psicología de la personalidad, y la técnica de Rors-
chach se convierte en una de las pruebas más conocidas y utilizadas (Goldstein y
Hersen, 1990b). Una encuesta realizada por Lubin, Larsen y Matarazzo (1984) entre
psicólogos clínicos estadounidenses sitúa al Rorschach en el cuarto lugar entre los
tests más usados, detrás del Wechsler adults inteligence scale (WAIS), Minnesota mul-
tiphasic personality inventory (MMPI) y el Test gestáltico de Bender. Pocos años des-
pués, Murray publica en 1935 el Test de apercepción temática (TAT) como una alter-
nativa a la técnica de Rorschach por su subjetivismo y falta de fiabilidad y validez.
Otra fecha relevante es la de 1939 cuando Frank propone el término “método pro-
yectivo” para aludir a estas pruebas, caracterizándolas por un material con una es-
tructura mínima y en las que el sujeto “estructura” el material proyectando en esta
estructuración su modo personal de ordenar la realidad.
De forma paralela a este desarrollo de técnicas proyectivas se siguen producien-
do avances en el área psicométrica manifestados por un refinamiento de las técnicas
factoriales. Así, Thurstone publica en 1935 Vectors of the mind y en 1938 Primary
mental abilities, en donde la inteligencia adquiere una naturaleza multivariable (Ro-
gers, 1995). En 1939 se publica la Wechsler-Bellevue intelligence scale, la primera es-
cala de Wechsler para adultos, con algunas diferencias con respecto a la Stanford-
Binet: cada subtest incluía ítems para cada grupo de edad, hacía menos énfasis en la
velocidad de respuesta y contenía bastantes componentes no verbales (Rogers,
1995). Otras publicaciones relevantes de esta época son el Inventario de intereses vo-
cacionales de Strong en 1927 y el Test gestáltico de Bender en 1938. La coexistencia
de estos dos polos (clínico-proyectivo e intelectual-psicométrico), aparentemente
opuestos, ha conducido, tal como plantea Pelechano (1988), a una cierta hibridación;
así, la evaluación picométrica intenta ir más allá de una simple puntuación y, al mis-
mo tiempo, hay un intento de objetivización y cuantificación de las técnicas proyec-
tivas. Sin embargo, a pesar de los esfuerzos realizados para aumentar la fiabilidad de
las técnicas proyectivas [véase, por ejemplo, Exner (1990)], las críticas que recibieron
fueron contundentes. Ante esta situación, Silva (1982, 1985) plantea tres posibles Op-
ciones: seguir utilizando estas técnicas basándose en una aproximación proyectivo-
dinámica, haciendo caso omiso de las críticas científicas; prescindir de ellas; o mante-
4
Evolución histórica de la evaluación psicológica 19
un psicólogo que hubiese inventado un test se limitaba a imprimir copias para su uso general
y a través, generalmente, de una empresa que vendía aparatos a los laboratorios de psicología.
Cuando la demanda de tests creció después de la primera guerra mundial, algunas firmas se
especializaron en la publicación de tests, incluyendo las especializadas en tests escolares...
Cada institución, untversidad, empresa, o cualquier otra, planificaba y financiaba su propio
programa. Cada cual adaptaba un test según su propia elección. Y en este sentido, reinaba una
absoluta libertad.
La utilización de tests llega a ser tan frecuente que el propio Cronbach se sor-
prende de que, sólo treinta meses después de haberse aplicado el primer test colecti-
vo para población escolar, éste se había administrado a más de cuatro millones de ni-
Evolución histórica de la evaluación psicológica 21
ños en Estados Unidos. Por su parte, Holtzman (1971) estima que en los colegios es-
tadounidenses se aplican anualmente más de 250 millones de tests.
La psicología soviética durante estos años no sólo se había consolidado, sino que
además había afinado sus críticas hacia los tests. Algunas de estas críticas se resumen
en los siguientes puntos (Rubinstein, 1981):
Todos estos factores contribuyeron a una crisis que Maloney y Ward (1976) des-
cribieron como un período de exacerbado pragmatismo empiristaycon tendencia a
las fórmulas y recetarios de evaluación a modo de “libros de cocina”. Aligual que
Cronbach (1972), estos autores también hablan del abuso y uso indiscriminado que
se ha hecho de los tests, así como de su mala interpretación y/o desconocimiento del
significado de los mismos. Silva (1982) describe esta situación como una «Crisis ex-
terna», de cara a la sociedad, pero, además, este autor habla de una «crisis interna»,
centrada en las garantías científicas y aspectos psicométricos. La eficacia predictiva
de los instrumentos psicométricos queda en entredicho en una revisión de Ghusell:
en 1955; por su parte, Edwards en 1957 habla de la influencia de la deseabilidad so-
cial en los cuestionarios de personalidad. Durante este período las críticas iban dir1-
gidas tanto a las pruebas psicométricas como a las técnicas proyectivas y al diagnós-
tico psiquiátrico. Así, los tests de inteligencia eran acusados de tener escasa utilidad
de cara a la intervención psicológica, algunas de las escalas del MMP1 como las de
depresión y esquizofrenia estaban contaminadas por otras categorías diagnósticas, etc.
Tanto el Rorschach como el 747 fueron objeto de múltiples estudios con el fin de
analizar su objetividad y los diferentes tipos de fiabilidad y validez, los cuales en ge-
neral mostraron resultados negativos. Por su parte, el diagnóstico psiquiátrico fue
fuertemente criticado por la falta de fiabilidad y validez, y por sustentarse en el mo-
delo médico de enfermedad, considerando la conducta anormal como un síntoma de
enfermedad y etiquetando a la persona según un sistema nosológico. Las críticas lle-
garon incluso a la efectividad de la psicoterapia, surgiendo así una nueva área de la
evaluación psicológica, la evaluación de las intervenciones. Un buen ejemplo de ello
es la publicación en 1952 de The effects ofpsychoterapy: An evaluation por parte de
Eysenck.
Sin embargo, toda crisis tiene sus aspectos innovadores y positivos; así, en este
contexto aparecen numerosas publicaciones, consideradas clásicas actualmente, re-
ferentes a aspectos psicométricos. En 1950 Gulliksen publica The theory of mental
test con el fin de sistematizar los procedimientos de validación de los tests; en 1955
aparece el trabajo de Cronbach y Meehl Construct validity in psychological tests; y
en 1958 se publica la primera edición de Psychological testing de Anastas1. El esfuer-
zO por un acercamiento más individualizado a la evaluación psicológica hace que
surjan durante la década de los años cincuenta diferentes pruebas vigentes todavía en
la actualidad: la Prueba de clasificación Q de Stephenson, el Diferencial semántico de
Osgood y las Técnicas de rejilla de Kelly (Silva, 1982). Asimismo, esta década va a su-
poner también el desarrollo de la evaluación factorial de la personalidad. En Gran
Bretaña, Eysenck comienza a elaborar y desarrollar sus cuestionarios de factores bá-
sicos de personalidad; mientras, en Estados Unidos, Cattell publica su cuestionario
de dieciséis factores. Otro hito importante en esta época es la publicación por parte
de Meehl en 1954 del libro Clinical versus statistical prediction. A theoretical analysis
and a review of the evidence, en donde se critican abiertamente las técnicas proyecti-
vas, en especial su baja objetividad, su poca fiabilidad test-retest y su baja validez
predictiva, presentándose como alternativa científica el MMPI; además, como mani-
festa Pelechano (1988), la falta de una teoría en la que sustentarse lleva a identificar
estas técnicas con las teorías psicoanalíticas. Sin embargo, estas críticas no influyeron
en absoluto en su empleo; así, Sundberg (1961) comunica que entre los tests más uti-
Evolución histórica de la evaluación psicológica 93
lizados por psicólogos clínicos en el año 1959 se encontraba en primer lugar el Rors-
chach y en segundo el 7A7. Holtzman relata su experiencia cuando fue contratado
por las Fuerzas Aéreas de Estados Unidos, con la finalidad de comprobar la eficacia
del test de Rorschach en la selección de pilotos:
no se trataba exactamente de la puesta a prueba de la utilidad del Rorschach en la evaluación
clínica de los pacientes, o cualquiera que sufra un trastorno emocional o mental. Era más bien
un intento por comprobar algo que muchos de los defensores del Rorschach proclamaban,
en aquel tiempo, que era capaz de hacer. Durante e inmediatamente después de la segunda
guerra mundial algunos de los pioneros del Rorschach, como Klopfer entre otros, dijeron
que podían utilizar el test para predecir el éxito en las Fuerzas Aéreas. Y así se utilizaba, por
ejemplo, para decidir entre dos candidatos a piloto de guerra [...]. El experimento era la ade-
cuada puesta a prueba de esas particulares exageraciones. El Rorschach había sido propuesto
para la selección de pilotos; para comprobar su eficacia fui contratado por las Fuerzas Aéreas
a tiempo completo. En el estudio colaboraron 20 clínicos, expertos en Rorschach, muy cono-
cidos, repartidos por todo Estados Unidos. Se les proporcionaron protocolos seleccionados
al azar, pidiéndoles que diferenciaran los candidatos que habían tenido éxito de aquellos que
no. No fueron capaces de hacerlo. Este estudio tuvo una gran importancia en su momento
porque supuso la caída del Rorschach en los círculos académicos [...]. Lo que me resultó más
sorprendente es que ninguno de los clínicos, a pesar de sus declaraciones, fuera capaz de su-
perar el mero azar [...] y eso es muy pobre [Holtzman, 1989, pp. 108-109].
Es importante resaltar que Holtzman fue uno de los primeros en realizar estu-
dios sobre la fiabilidad y validez del Rorschach y que cuando le contrataron para
evaluar la eficacia de este test se encontraba en pleno auge la polémica iniciada por
Meehl sobre predicción estadística frente a predicción clínica, siendo Holtzman, en
aquel momento, un defensor de esta última. En 1988, la Society of Personality As-
sessment le concedió el galardón Distinguished Contribution Award por sus impor-
tantes contribuciones a la evaluación de la personalidad.
En un esfuerzo por mejorar la calidad de los instrumentos de evaluación psicoló-
gica, la APA crea un comité dirigido por Cronbach encargado de elaborar el informe
Technical recommendations for psychological tests and diagnostic aids? de 1954 en
donde se plantea la necesidad de que los tests vayan acompañados de un manual con
información acerca de la interpretación de los resultados, validez, fiabilidad, admi-
nistración, etc. (Rogers, 1995).
Sin embargo, todos estos esfuerzos son estériles y la crisis externa de la evalua-
ción psicológica alcanza su punto culminante en el movimiento antitests que tuvo
lugar en Estados Unidos en la década de los años cincuenta y, sobre todo, los sesenta.
La polémica fue iniciada entre defensores de posturas genéticas y ambientalistas, uti-
lizando ambos los resultados de los tests de inteligencia para defender sus posicio-
nes. La realidad era que, a pesar de que los primeros psicómetras utilizaron los tests
con la intención de que todas las personas tuviesen igualdad de oportunidades en
función únicamente de su capacidad, estos procedimientos de evaluación termina-
ron favoreciendo a las clases dominantes y privilegiadas. Pronto esta discusión pasó
de los círculos científicos a la vida ciudadana. Así, se producen hechos tan notables
2 Este informe ha sido revisado posteriormente en diferentes ocasiones, siendo publicada la última
versión en el año 1985.
24 Gualberto Buela-Casal y J. Carlos Sierra
como la quema de protocolos en una escuela de Texas en 1959, la prohibición del uso
de pruebas psicológicas en el estado de California y en las escuelas de Nueva York.
Los tests de personalidad fueron blanco también de fuertes críticas; se manifiesta un
descontento por la utilización de estos tests en la industria, e incluso se habla de in-
vasión de la privacidad (Rogers, 1995). En opinión de Blanco (19865), esta revuelta
antitests fue fruto de cuatro factores diferentes: las limitaciones reales tanto técnicas
(déficit conceptuales, metodológicos e instrumentales) como humanas (lagunas de
conocimiento, fallos o errores), los abusos cometidos en una administración indis-
criminada e inadecuada de pruebas, las reacciones defensivas de la sociedad ante
unos instrumentos que pueden potencialmente violar su intimidad y, en último lu-
gar, las críticas derivadas de una presentación inadecuada de los resultados del proce-
so diagnóstico; es decir, no es la técnica en sí misma, sino su inadecuado uso lo que
puede acarrear riesgos.
Dentro de este nuevo enfoque, Kanfer y Saslow (1965) publican el artículo «Be-
havioral analysis», dando lugar al nacimiento “oficial” de la evaluación conductual,
aunque según Goldfried y Linehan (1977) la idea (no el término) aparece por prime-
ra vez en un texto de Johnson en el año 1946, donde se trata sobre el tipo de evalua-
ción que debe hacer el psiquiatra, diciendo que éste debe obtener información acerca
de lo que hace y en qué situaciones lo hace. La aportación de este trabajo es la admi-
sión de variables subjetivas (eventos internos y variables personales u organísmicas)
dentro del análisis funcional propuesto por Skinner, quedando abierta la posibilidad
del empleo de autoinformes, aunque con cierta cautela.
Poco después, Cautela (1968) y Goldfried y Pomeranz (1968) utilizan por pri-
mera vez el término behavioral assessment; esta nueva forma de evaluación aparece
posteriormente con tres nombres: evaluación conductual, análisis funcional de la
conducta y análisis conductual, que son considerados como sinónimos por la mayo-
ría de los autores (Silva y Martorell, 1991). Por otra parte, Goldstein y Hersen
(1990b) entienden que el desarrollo de la evaluación conductual está, en cierto
modo, relacionado con la innovación en los instrumentos de registro o evaluación
de la conducta, lo cual se puede comprobar en los primeros números de las revistas
Journal of Applied Behavior Analysis, Behaviour Research and Therapy, Journal of
Behavior Therapy and Experimental Psychiatry y Behavior Modification, donde
aparece una gran cantidad de artículos sobre nuevos métodos e instrumentos de re-
gistro conductual. Un apoyo importante a esta incipiente evaluación conductual es
la publicación de Personality and assessment por parte de Mischel en 1968. En esta
obra se vierte una fuerte crítica sobre la evaluación psicológica “tradicional”, propo-
niéndose la evaluación conductual como alternativa que hará énfasis sobre la especi-
ficidad, lo idiográfico, etc. El situacionismo constituyó una dura crítica a la evalua-
ción tradicional de la personalidad (teoría de los rasgos y teoría psicodinámica). Su
crítica se centra en la validez, fiabilidad y en la falta de utilidad que aportan los ins-
trumentos de evaluación de la personalidad, resaltando la inadecuación de los rasgos
para predecir la conducta. La teoría de los rasgos era criticada por el supuesto de que
la personalidad se encuentra constituida por predisposiciones estables y duraderas
que ejercen efectos generalizados sobre la conducta. De igual forma, critica la teoría
psicodinámica por su énfasis en las entidades internas y en la estabilidad temporal y
transituacional. Para explicar la conducta humana, Mischel asume una concepción
interaccionista en la que se tienen en cuenta variables orgánicas, ambientales y de la
propia conducta. Sin embargo, su mayor aportación podría considerarse en el giro
que supone buscar la explicación de la variabilidad de la conducta, en vez de tratar de
hacerlo en función de la estabilidad y consistencia, tal como se venía haciendo. Su
obra ha servido para impulsar los estudios de la evaluación de situaciones, contextos
y ambientes. Paralelamente, Peterson (1968) publicaba The clinical study of social
behavior, donde se planteaba que dentro del ámbito clínico era necesario la cons-
trucción de situaciones que proporcionaran muestras representativas de las conduc-
tas a predecir; además, este autor recomienda la no utilización de los instrumentos
de la evaluación tradicional para inferir las características de la personalidad. Asimis-
mo, cabe destacar el trabajo de Lang (1968) sobre el triple sistema de respuesta y el
de Goldfried y Kent (1972) sobre las diferencias y semejanzas entre la evaluación
psicométrica y la evaluación conductual.
Evolución histórica de la evaluación psicológica 153)Ni
da de los años sesenta y que en la siguiente década tiene lugar una gran expansión
de la evaluación conductual. na
A partir de la mitad de la década de los años setenta se produce la consolidación
de la evaluación conductual como consecuencia de la multitud de publicaciones que
sobre el tema van saliendo a la luz; entre los manuales más destacados se podrían c1-
tar Behavioral assessment. A practical handbook de Hersen y Bellack (1976), Beha-
vior therapy assessment: Diagnosis, design and evaluation de Mash y Terdal (1976),
Handbook of behavioral assessment de Ciminero, Calhoun y Adams (1977), Beha-
vioral assessment. New directions in clinical psychology de Cone y Hawkins (1977),
Behavior modification: Handbook of assessment, intervention and evaluation de
Gambrill (1977), Principles of behavioral assessment de Haynes (1978), A practical
guide to behavioral assessment de Keefe, Kopel y Gordon (1978) y Behavioral as-
sessment: Recent advances in methods, concepts and aplications de Haynes y Wilson
(1979). A estos manuales, ya clásicos, hay que añadir la aparición en 1979 de las re-
vistas Behavioral Assessment y Journal of Behavioral Assessment”. El número de pu-
blicaciones sobre este enfoque llegó a ser tan elevado que el único análisis posible es
el realizado a través de estudios bibliométricos, como el de Prieto, Tortosa y Silva
(1984), quienes hacen un análisis cuantitativo de las publicaciones sobre evaluación
conductual entre los años 1971-1982 a través de la base de datos Social sciences cita-
tion index, concluyendo que se ha producido un incremento considerable en los ar-
tículos publicados a lo largo de estos años, que estos artículos no aparecían exclusi-
vamente en revistas especializadas (por ejemplo, encontraron que la revista que más
trabajos publicó sobre esta temática fue Psychological Reports) y que el autor más
productivo en el área de la evaluación conductual fue Alan E. Kazdin.
A esta fase de consolidación de la evaluación conductual producida durante la
década de los años setenta, a la cual Nelson (1983) califica como “luna de miel”, su-
cede un período de “desencanto”, tal como es calificado por Fernández-Ballesteros
(1994), en el cual la evaluación conductual entra en una crisis en la que todavía parece
estar inmersa. Por otra parte, durante todo este período de auge del modelo conduc-
tual, la evaluación de corte psicométrico continúa dando lugar a publicaciones im-
portantes entre las que destaca un manual de evaluación psicológica por parte de
Cronbach en 1972 en donde se sistematiza la teoría de la generalizabilidad y la obra
de Wiggins (1973) Personality and prediction: Principles of personality assessment.
La situación de la evaluación psicológica desde la década de los años ochenta
hasta la actualidad será abordada en el siguiente apartado.
> A partir de 1985 esta revista pasó a denominarse Journal of Psychopathology and Behavioral As-
sessment.
Evolución histórica de la evaluación psicológica 29
reflexiones sobre las cuestiones de especial relevancia que caracterizan este período,
como puede ser la crisis que experimenta la evaluación conductual, la apertura de la
evaluación psicológica a otras áreas, la introducción de la informática en la evalua-
ción o la teoría de respuesta al ítem, entre otras.
La característica que puede definir la evaluación psicológica de los últimos años
tal vez sea, como comenta Matud (1993), la reelaboración y ampliación de los mode-
los y procedimientos de evaluación, manifestándose de una forma clara una postura
más tolerante e integradora entre las diferentes aproximaciones, incluso entre la eva-
luación psicométrica y la evaluación conductual.
La década de los años ochenta se caracteriza por una serie de cambios dentro de la
evaluación conductual, y por un período de reflexión dentro de la evaluación psi-
cológica. Hayes y Follete (1993) y Fernández-Ballesteros (1994) señalan algunos
hechos que constituyen un reflejo de esta crisis; en primer lugar, dada la relevancia
que tomó el DSM-111 (1980) y DSM-II1-R (1987) los evaluadores conductuales em-
piezan a familiarizarse y a utilizar etiquetas diagnósticas, por lo que se intenta una
aproximación entre evaluación conductual y diagnóstico psiquiátrico (Haynes y
O'Brien, 1988; Hersen, 1988); en segundo lugar, Kendall y Hollon (1981) publican
Assessment strategies for cognitive-behavioral intervention que va a suponer una
ruptura con la propia evaluación conductual; y, por último, se produce un debilita-
miento del análisis funcional y una pérdida de vigencia de los planteamientos que
oponen la evaluación conductual a otros modelos de evaluación psicológica *.
Como ejemplo clarificador de esta situación están las palabras de Bellack y Hersen
(1988, p. 613): <[...] si empleamos entrevistas estandarizadas con el propósito de al-
canzar un diagnóstico con base en el DSM-111, generamos escalas clínicas sobre la
severidad de síntomas, administramos inventarios de autoinforme y evaluamos es-
tilos cognitivos, podemos preguntarnos ¿es todavía conductual la evaluación con-
ductual?».
Esta crisis de asunciones teóricas de la evaluación conductual se pone de mani-
fiesto en un análisis de los artículos publicados entre 1980 y 1987 en Behavioral As-
sessment y en el Journal of (Psychopathology and) Behavioral Assessment? realizado
por Fernández-Ballesteros (1988) [citado en Fernández-Ballesteros (1994)]. En Be-
havioral Assessment únicamente un 15% delos trabajos trataba sobre temas concep-
tuales y solamente un 0,40% hacía referencia al análisis funcional de la conducta; en
la segunda revista los datos tampoco son nada alentadores, con un 6,50% de artícu-
los conceptuales y un 0,50% referido al análisis funcional de la conducta. El mayor
* Aparecen publicaciones que utilizan al mismo tiempo los términos evaluación psicológica y eva-
luación conductual, como es el caso del manual Psychological and behavioral assessment de Magrab
(1984), y otras dedicadas exclusivamente a la evaluación psicológica incluyen apartados de evaluación
conductual que son combinados con la evaluación de la inteligencia, personalidad e incluso técnicas pro-
yectivas, como es el caso del Handbook of psychological assessment de Goldstein y Hersen (1984).
5 Como ya se ha comentado, la revista Journal of Behavioral Assessment fundada en 1979 pasa a de-
nominarse en 1985 Journal of Psychopathology and Behavioral Assessment.
30 Gualberto Buela-Casal y J. Carlos Sierra
tender, esto no es más que una manifestación de la evolución a la cual está sometido
cualquier concepto (Sierra, 1996).
Ahora bien, a pesar de la crisis que experimenta la evaluación conductual en su
seno, ésta goza de un ámbito propio y específico, y sigue manteniéndose en diferen-
tes publicaciones; así, Cone (1993) informa que desde el período 1980-1982 a 1990-
1992 se produce un incremento del 15,80% de trabajos publicados sobre evaluación
conductual, así como un aumento del número de revistas en donde se publica este
tipo de artículos. Sin embargo, no debemos olvidarnos, tal como plantea Fernández-
Ballesteros (1993), que la salida de esta crisis pasa por la mejora de las garantías cien-
tíficas de las medidas conductuales.
objetivos planteados; así, por medio de los tests de inteligencia no nos limitamos a la
obtención de un cociente intelectual, sino que evaluamos procesos cognitivos en pa-
cientes con daño cerebral o esquizofrénicos (Goldstein y Hersen, 19905). En defini-
tiva, la actual evaluación psicológica no se puede identificar con la mera aplicación
de tests psicológicos o la perspectiva clásica del psicodiagnóstico; hoy, la evaluación
psicológica es un elemento fundamental de la intervención e investigación psicológi-
ca (Almeida y Ribeiro, 1994).
En cuanto a la evaluación tradicional, no sólo no ha desaparecido sino que se ha
seguido desarrollando; así, siguen apareciendo manuales importantes tales como
New horizont in testing de Weiss (1983), Psychological testing (6* ed.) de Anastasi
(1988), Psychological testing. Principles and applications (2* ed.) de Murphy y Da-
vidshofer (1991) o The psychological testing enterprise. An introduction de Rogers
(1995). Kaplan y Saccuzzo (1993) indican que en la evaluación psicológica actual se
ha producido una proliferación de nuevos tests, muchos de ellos basados en mode-
los, teorías o conceptos claramente diferentes a los de los tests tradicionales; estos
tests no tradicionales están basados en teorías del aprendizaje, en la psicología social
o experimental. Este hecho respondería, en primer lugar, a un incremento de los
aspectos científicos de la psicología en el campo de la evaluación psicológica y, en
segundo lugar, al esfuerzo realizado por integrar los tests en otros aspectos de la psi-
cología aplicada (por ejemplo, el tratamiento). Además, se ha producido un incre-
mento de la tecnología, una mejora de la objetividad de los tests, y una alta preocu-
pación por los aspectos éticos implicados en la evaluación (especialmente el abuso de
los tests) puesta de manifiesto en 1988 por el Joint Committee on Testing Practices y
respaldada por la American Association for Counseling and Development, la Ame-
rican Educational Research Association, la American Psychological Association, la
American Speech-Language-Hearing-Association y el National Council on Measu-
rement in Education. Otro aspecto relevante citado por Kaplan y Saccuzzo (1993) es
que en la actualidad el “público” en general tiene un mayor conocimiento de los
tests; hoy existe una mayor demanda de servicios psicológicos, incluyendo la evalua-
ción, lo cual, a su vez, repercute en la mejora de la calidad de los tests. En un análisis
realizado de 65 practicum de psicodiagnóstico en psicología en Estados Unidos,
Craig y Horowitz (1990) muestran una perspectiva del empleo de tests durante estos
años; así, estos autores concluyen que los tests proyectivos, las escalas de Wechsler y
el MMPI siguen gozando de gran popularidad entre los evaluadores psicológicos, hay
un incremento en el empleo de tests neuropsicológicos, se usan los mismos tests para
los adolescences que para los adultos y, por último, tests como el Millon clinical mul-
t1axtal inventory (MCMI1) o el Millon adolescent personality inventory (MAPI) son
poco usados en la actualidad pero es muy recomendado su aprendizaje, posiblemen-
te porque los directores de los practicum creen que serán instrumentos importantes
en un futuro próximo.
- En la última década también se ha producido un incremento en el interés por el
diagnóstico psicopatológico; hay que destacar la publicación por parte de la Asocia-
ción Psiquiátrica Americana de tres ediciones del Diagnostic and statistical manual
of mental disorders (DSM-11I en 1980, DSM-I11-R en 1987 y DSM-IV en 1994). Las críti-
cas a la falta de fiabilidad y validez de las anteriores clasificaciones son superadas en
parte con la inclusión de criterios descriptivos ateóricos en cada una de las categorías
Evolución histórica de la evaluación psicológica 33
a. Los autores más citados, en general, y que por tanto podrían considerarse
como los más influyentes fueron en orden decreciente: Cattell, Cronbach, Eysenck,
Reitan, Exner, Guilford, Golden, Jackson, McReynolds, Anastasi, Gough, Hersen,
Mischel, etcétera.
b. Mediante un análisis factorial de correspondencias se determinó la relación
entre autores y temas. Así, se obtuvieron cuatro factores bipolares que mostraban
los autores más citados junto con los temas más tratados. En el primer factor aparece
evaluación neuropsicológica (inteligencia y memoria) con Reitan, Golden, Benton,
Venables, Wechsler, etc., frente a Exner/Rorschach (y otras técnicas proyectivas) con
Exner, Swartz, Bandura, Holtzman, etc. En el segundo factor aparecen determinan-
tes situacionales con Barker, Moos, Haynes, Patterson, etc., frente a determinantes
individuales con Fleishman, Galton, Binet, Terman, etc. En el tercer factor aparece
evaluación ambiental con Moos, Barker, etc., frente a evaluación conductual con
Haynes, Nelson, Cone, Bellack, Kazdin, etc. El resto de los factores presentan bas-
tantes dificultades de interpretación, aunque en uno de ellos aparecía una dicotomía
bastante clara: evaluación de la inteligencia frente a evaluación de la personalidad.
En un análisis más reciente, Sierra (1996) informa que los quince autores de eva-
luación psicológica con más citas recibidas en el período 1993-1995 son Beck, Spit-
zer, Wechsler, Bandura, Piaget, Eysenck, Cronbach, Spielberger, Achenbach, Endi-
cott, Rosenthal, Kazdin, Campbell, Cattel y Zuckerman. En este mismo estudio,
analizando los contenidos del IV Congreso de Evaluación Psicológica (1994) y el
23nd International Congress of Applied Psychology (1994), se pone de manifiesto
que las áreas más relevantes de la evaluación psicológica son la clínica y salud, perso-
nalidad, psicología del trabajo y de las organizaciones, psicología educativa, evalua-
ción de programas, seguridad vial, psicología jurídica, psicología del deporte y psi-
cología ambiental.
3% Gualberto Buela-Casal y J. Carlos Sierra
En otro estudio realizado por Carbonell, Carpintero y Silva (1988) se solicitó in-
formación, por medio de una encuesta acerca de la «situación actual y perspectivas
futuras de la evaluación psicológica (o psicodiagnóstico en su sentido más amplio)»,
a más de cien profesionales seleccionados de los más representativos de la evaluación
psicológica a nivel internacional. El primer resultado, que llama la atención de los
autores, es que la mayoría de los especialistas encuestados evita describir de forma
estructurada la situación actual, lo cual es interpretado por Carbonell y cols. (1988)
como una muestra del grado de especialización alcanzado, con la consiguiente
dificultad que supone dar una visión global y estructurada de la actual evaluación
psicológica. Los resultados relacionados con aspectos conceptuales ponen de mani-
fiesto:
REFERENCIAS BIBLIOGRÁFICAS
Aiken, L. R. (1985). Psychological testing and assessment (5* ed.). Boston. Allyn and Bacon.
Almeida, L. S. y Ribeiro, 1. S. (1994). Avaliacao psicológica: repensar as formas e os contex-
tos. En L. S. Almeida e 1. S. Ribeiro (dirs.), Avaliacao psicológica: formas e contextos
(Vol. 1). Braga. APPORT.
Álvarez, A. (1972). Psicodiagnóstico clínico. Las técnicas de exploración psicológica. Madrid.
Aguilar.
prátbies Psychological Association (1986). Guidelines for computer-based tests and inter-
pretations. Washington. APA.
Anastasi, A. (1973). Los tests psicológicos (3* ed.). Madrid. Aguilar. (Orig. 1968).
Anastasi, A. (1982). Psychological testing (5* ed.). Nueva York. MacMillan.
Anastasi, A. (1988). Psychological testing (6* ed.). Nueva York. McMillan.
Avila, A. (dir.) (1992a). Evaluación en psicología clínica I: proceso, método y estrategias psico-
métricas. Salamanca. Amarú.
Ávila, A. (1992b). La psicología clínica: aproximación histórica y principales cuestiones teó-
rico-conceptuales. En A. Avila (dir.), Evaluación en psicología clínica Í: proceso, método y
estrategias psicométricas. Salamanca. Amarú.
Bartran, D. (1996). Tests qualifications and test use in UK: The competence approach. Exro-
pean Journal of Psychological Assessment, 12, 62-71.
Bellack, A. S. y Hersen, M. (1988). Future directions of behavioral assessment. En A. S. Be-
llack y M. Hersen (dirs.), Behavioral assessment. A practical handbook (3* ed.). Nueva
York. Pergamon Press.
Benton, A. L. (1994). Neuropsychological assessment. Annual Review of Psychology, 45, 1-
Da ,
Blanco, A. (dir.) (19864). Apuntes de psicodiagnóstico. Valencia. Promolibro.
Blanco, A. (1986b). Bases conceptuales e históricas del psicodiagnóstico. En A. Blanco (dir.),
Apuntes de psicodiagnóstico. Valencia. Promolibro.
Blanco, A. (dir.) (1990). Apuntes de diagnóstico clínico. Valencia. Promolibro.
Buela-Casal, G., Caballo, V. E. y Sierra,J.C. (dirs.) (1996). Manual de evaluación en psicolo-
gía clínica y de la salud. Madrid. Siglo XXL
Carbonell, E., Carpintero, H. y Silva, F. (1988). La evaluación psicológica vista por los eva-
luadores: una encuesta de sus perspectivas futuras. Evaluación Psicológica/Psychological
Assessment, 4, 259-314.
Carbonell, E., Silva, F. y Carpintero, H. (1988). Estructuración de la evaluación psicológica
contemporánea: una aproximación cienciométrica. Evaluación Psicológica/Psychological
Assessment, 4, 179-222.
Carpintero, H. (1989). La evolución del psicodiagnóstico en España. Evaluación Psicológi-
ca/Psychological Assessment, 5, 3-21.
Evolución histórica de la evaluación psicológica
41
Cautela, J. (1968). Behavior therapy and the need for behavioral assessment. Psychotherapy,
: Theory, Research and Practice, 5, 175-179.
Ciminero, A. R., Calhoun, K. S. y Adams, H. E. (dirs.) (1977). Handbook of behavioral as-
sessment. Nueva York. Wiley.
Cone, J. D. (1993). The current state of behavioral assessment. European Journal of Psycholo-
gical Assessment, 9, 175-181.
Cone, J. D. y Hawkins, R. (1977). Behavioral assessment. New directions in clinical psycho-
logy. Nueva York. Brunner/Mazel.
Cone, J. D. y Hayes, S. C. (1980). Environmental problems/behavioral solutions. Monterrey.
Brooks-Cole.
Costa, P. T. y McCrae, R. R. (1988). From catalog to classification: Murray's needs and the
five-factor model. Journal of Personality and Social Psychology, 55, 258-265.
Craig, R. J. y Horowitz, M. (1990). Current utilization of pyschological tests at diagnostic
practicum sites. The Clinical Psychologist, 43, 29-36.
Cronbach, L. J. (1972). Fundamentos de la exploración psicológica. Madrid. Biblioteca Nue-
va.
Cronbach, L. J. (1984). Esentials ofpsychology testing. Nueva York. Harper and Row.
Cronbach, L. J. (1990). Esentials of psychological testing (5* ed.). Nueva York. Harper and
Row.
Cruz, J. (comp.) (1995). Psicología y deporte. Revista de Psicología General y Aplicada, 48
1-2
DuBois, P. (1970). A hystory ofpsychological testing. Boston. Allyn and Bacon.
Exner, J. E. (1980). But 11's only an inkblot. Journal of Personality Assessment, 44, 563-577.
Exner, J. E. (1990). Manual de Rorschach para el sistema comprensivo. Barcelona. Sociedad
Catalana del Rorschach y Métodos Proyectivos.
Eysenck, H. J. (1991). Three view of intelligence. Personality and Individual Differences, 12,
971-973.
Eysenck, H. J. yRachman, S. (1965). The causes and cure of neurosis. Londres. Routledge and
Kegan Paul.
Fernández-Ballesteros, R. (1980). Psicodiagnóstico. Concepto y metodología. Madrid. Cincel-
Kapelusz.
Fernández-Ballesteros, R. (1983). Psicodiagnóstico. Madrid. UNED.
Fernández-Ballesteros, R. (1992). Introducción a la evaluación psicológica. Madrid. Pirámide.
Fernández-Ballesteros, R. (1993). Behavioral assessment: Dying, vanishing or still running?
European Journal of Psychological Assessment, 9, 159-174.
Fernández-Ballesteros, R. (1994). Evolución histórica de la evaluación conductual. En
R. Fernández-Ballesteros (dir.), Evaluación conductual hoy. Un enfoque para el cambio
en psicología clínica y de la salud. Madrid. Pirámide.
Fernández-Ballesteros, R. (dir.) (1995). Evaluación de programas. Una guía práctica en ám-
bitos sociales, educativos y de salud. Madrid. Síntesis.
Fernández-Ballesteros, R. y Silva, F. (1985). Presentación. Evaluación Psicológica/Psycholo-
gical Assessment, 1, 3-4.
Fernández-Ríos, M. (1993). Psicología del trabajo y de las organizaciones: marco teórico. Pa-
peles del Psicólogo, 57, 29-35.
Fernández del Valle, J. (1996). Evaluación ecopsicológica de los estilos de vida. En G. Buela-
Casal, V. E. Caballo y J. C. Sierra (dirs.), Manual de evaluación en psicología clínica y de la
salud. Madrid. Siglo XXI.
Eranks, C. M. (1991). Orígenes, historia reciente, cuestiones actuales y estatus futuro de la te-
rapia de conducta: una revisión conceptual. En V. E. Caballo (dir.), Manual de técnicas de
terapia y modificación de conducta. Madrid. Siglo XXI.
Gambrill, E. D. (1977). Behavior modification: Handbook of assessment, intervention and
evaluation. San Francisco. Josey-Bass.
42 Gualberto Buela-Casal y J. Carlos Sierra
García Vega, L. (1989). El antifeminismo científico de Juan Huarte de San Juan, patrón de la
Psicología. Revista de Psicología General y Aplicada, 42, 533-542. . y
Garrido, V. (1991). Psicología jurídica en España: líneas fundamentale s de intervención. Pa-
peles del Psicólogo, 48, 20-28.
Goldfried, M. y Kent, R. N. (1972). Traditional versus behavioral personality assessment:
A comparison of metodological and theoretical assumption. Psychological Bulletin, 23,
75-87.
Goldfried, M. y Linehan, M. (1977). Basic issues in behavioral personality assessment. En
A. Ciminero, K. Calhoun y H. Adams (dirs.), Handbook of behavioral assessment. Nue-
va York. Wiley. ao)
Goldfried, M. y Pomeranz, D. (1968). Role de assessment in behavior modification. Psycho-
logical Reports, 23, 75-87.
Goldstein, G. y Hersen, M. (dirs.) (1984). Handbook of psychological assessment. Nueva
York. Pergamon Press.
Goldstein, G. y Hersen, M. (dirs.) (19904). Handbook of psychological assessment (2* ed.).
Nueva York. Pergamon Press.
Goldstein, G. y Hersen, M. (1990b). Historical perspectives. En G. Goldstein y M. Hersen
(dirs.), Handbook ofpsychological assessment (2* ed.). Nueva York. Pergamon Press.
Gondra, J. M. (1994). Juan Huarte de San Juan y las diferencias de inteligencia. Anuario de
Psicología, 60, 13-34.
Groffman, K. y Michel, L. (1982/1983). Psychologische diagnostik. Gotinga. Verlag fir Psy-
chologie.
Hambleton, R. K. (1994). Guideliness for adapting educational and pyschological tests: A
progress report. European Journal of Psychological Assessment, 10, 229-244.
Hayes, S. C. y Follete, W. C. (1993). The challenge faced by behavioral assessment. European
Journal of Psychopathological Assessment, 9, 182-188.
Haynes, S. N. (1978). Principles of behavioral assessment. Nueva York. Gardner Press.
Haynes, S. N., Blaine, D. y Meyer, K. (1995). Dinamical models for psychological assess-
ment. Phase space functions. Psychological Assessment, 7, 17-24.
Haynes, S. N., Bogan, K. e Ignacio, L. (en prensa). Psychological assessment instruments
used in treatment outcome studies. Journal of Consulting and Clinical Psychology.
Haynes, S. N. y O'Brien, W. H. (1988). The Gordian Knot of DSM-I11-R use: Principles of be-
havior classification and complex causal models. Behavioral Assessment, 10, 95-105.
Haynes, S. N. y O'Brien, W. H. (1990). Functional analysis in behavior therapy. Clinical
Psychology Revierw, 10, 649-668.
Haynes, S. N. y Wilson, C. (1979). Behavioral assessment: Recent advances in methods, con-
cepts and aplications. San Francisco. Josey-Bass.
Hernández. J. M. (1996). Evaluación de programas de salud. En G. Buela-Casal, V. E. Caba-
llo y J. C. Sierra (dirs.), Manual de evaluación en psicología clínica y de la salud. Madrid.
Siglo XXI.
Hersen, M. (1988). Behavioral assessment and psychiatric diagnosis. Behavioral Assessment,
10, 107-121.
Hersen, M. y Bellack, A. (1976). Behavioral assessment. A practical handbook. Nueva York.
Pergamon Press.
Holtzman, W. (1971). The changing world mental measurement and its social significance.
American Psychologist, 26, 546-553.
Holtzman, W. (1989). Entrevista. Papeles del Psicólogo, 41/42, 106-109.
Kanfer, F. y Saslow, G. (1965). Behavioral analysis. Archives of General Psychiatry, 12, 529-
538.
Kaplan, R. M. y Saccuzzo, D. P. (1993). Psychological testing. Principles, applications, and is-
sues (3* ed.). Belmont. Brooks/Cole Publishing.
Kazdin, A. (1991). Sobre los aspectos conceptuales y empíricos de la terapia de conducta. En
Evolución histórica de la evaluación psicológica
40
Nelson, R. O. (1983). Behavioral assessment: Past, present and future. Behavioral Assess-
ment, 5, 195-206.
Nelson, R. O. y Hayes, S. C. (dirs.) (1986). Conceptual foundations of behavioral assessment.
Nueva York. Guilford Press.
Pelechano, V. (1976). Psicodiagnóstico. Madrid. UNED. ]
Pelechano, V. (1988). Del psicodiagnóstico clásico al diagnóstico ecopsicológico (vols. 1 y 2).
Valencia. Alfaplús. 4
Peñate, W/., Matud, P. e Ibáñez, L (1993). Evaluación psicológica: concepto y técnicas de análi-
sis. Valencia. Promolibro.
Pérez-Álvarez, M. (1991). Prehistoria de la modificación de conducta en la cultura española.
En V. E. Caballo (dir.), Manual de técnicas de terapia y modificación de conducta. Madrid.
Siglo XXL
Dies D. (1968). The clinical study of social behavior. Nueva York. Appleton-Century-
Crofts.
Pichot, P. (1994). La evaluación psicológica en Europa. Clínica y Salud, 5, 117-127.
Piotrowski, C. y Zalewski, C. (1993). Training in psychodiagnostic testing in APA-aproved
PsyD and PhD clinical psychology programs. Journal of Personality Assessment, 61, 394-
405.
Pol, E. (1994). Environmental psychology. Applied Psychology. An International Review,
43, 157-174.
Prieto, F., Tortosa, F. y Silva, F. (1984). La evaluación conductual: aproximación bibliométri-
ca. Comunicación presentada en el ICongreso de Evaluación Psicológica. Madrid.
Renom, J. (1993). Tests adaptativos computarizados. En M. Forns y M. T. Anguera (dirs.),
Aportaciones recientes a la evaluación psicológica. Barcelona. PPU.
Richelle, M. (1991). Prólogo. En G. Buela-Casal y V. E. Caballo (dirs.), Manual de psicología
clínica aplicada. Madrid. Siglo XXI.
Robins, L. N., Helzer, J. E., Croughan, J. y Ratcliff, K. S. (1981). National Institute of Mental
Health Diagnostic Interview Schedule. Its history, characteristics, and validity. Archives
of General Psychiatry, 10, 41-46.
Rodríguez, A. (1993). Marco para el desarrollo de la Psicología del Trabajo y de las Organi-
zaciones. Papeles del Psicólogo, 57, 28.
Rogers, T. B. (1995). The psychological testing enterprise. An introduction. Pacific Grove.
Brooks/Cole Publishing Company.
Rubinstein (1981). Principios de psicología general. La Habana. Pueblo y Educación.
Serrate, A. (1980). Ayer y hoy de las técnicas proyectivas en España. Técnicas Proyectivas, 1,
3-11.
Sechrest, L. y Figueredo, A. J. (1993). Program evaluation. Annual Review of Psychology, 44,
645-674,
Sierra, J. C. (1996). De la crisis de la evaluación conductual a la actual evaluación psicológica.
Ponencia presentada en la IV Conferéncia Internacional Avaliacao Psicológica: Formas e
Contextos. Braga (Portugal).
Silva, F. (1982). Introducción al psicodiagnóstico. Valencia. Promolibro.
Silva, F. (1985). Psicodiagnóstico: teoría y aplicaciones. Valencia. Rubio.
Silva, F. y Martorell, M. C. (1991). Evaluación conductual y evaluación tradicional: la cues-
tión psicométrica. En V. E. Caballo (dir.), Manual de técnicas de terapia y modificación de
conducta. Madrid. Siglo XXI.
Spielberger, C. D. y Piotrowski, C. (1990). Clinician's attitudes toward computer-based tes-
ting. The Clinical Psychologist, 43, 60-63.
Pre A. y Staats, C. (1963). Complex human behavior. Nueva York. Holt, Rinehart and
inston.
Stermberg, R. (1986). Capacidad intelectual humana. En R. Sternberg (dir.), Las capacidades
humanas. Un enfoque desde el procesamiento de la información. Barcelona. Labor.
Evolución histórica de la evaluación psicológica 45
Sundberg, N. D. (1961). The practice of psychological testing in clinical services in the Uni-
ted States. American Psychologist, 16, 79-83.
Thorndike, R. M., Cuningham, G. K., Thorndike, R. L. y Hagen, E. P. (1991). Measurement
and evaluation in psychology and education (5* ed.). Nueva York. Maxwell McMillan.
Tryon, W. W. (1996). Behavioral observation. En M. Hersen y A. S. Bellack (dirs.), Behavio-
ral assessment: A practical handbook (4* ed.). Boston. Allyn and Bacon.
Ullmann, L. y Krasner, L. (1965). Case studies in behavior modification. Nueva York. Holt.
Velarde,J.(1993). Huarte de San Juan, patrono de Psicología. Psicothema, 5, 451-458.
Weiss, D. (dir.) (1983). New horizont in testing. Nueva York. Academic Press.
Wiggrns, J. (1973). Personality and prediction: principles ofpersonality assessment. Massachu-
setts. Addison-Wesley.
Wing, J. K. (1980). The use of the Present State Examination in general population surveys.
Acta Psychiatrica Scandinavica, 285, 230-240.
Wolpe, J. (1969). The practice of behavior therapy. Londres. Pergamon Press.
Yakunin, V. (1985). Los primeros laboratorios psicológicos. En B. Lomov y V. Shustiov
(dirs.), La ciencia PS soviética. Moscú. Naúka.
Zabrodin, Y. (1985). Sobre ciertas tendencias del desarrollo de la psicofísica en la Unión So-
viética. En B. Lomov y V. Shustiov (dirs.), La ciencia psicológica soviética. Moscú. Naúka.
Zubin, J. (1989). Use of research instruments in psychopathological assessment: Some histo-
rical perspectives. En S. Wentzler (dir.), Measuring mental illness: Psychometrics assess-
ment for clinicians. Washington. American Psychiatric Press.
LECTURAS COMPLEMENTARIAS
1883 Galton publica Inquiries into human faculty and its development
1884 Galton ofrece pruebas psicológicas en el South Kensington Museum
1890 Cattell utiliza por primera vez la expresión «test mental»
1904 Spearman sienta las bases de la teoría psicométrica ss
1905 Binet y Simon publican la primera versión de su test de inteligencia
1912 Stern propone el concepto de «cociente de inteligencia»
1914 Spearman formula la primera teoría factorial de la inteligencia
1916 Terman publica la primera adaptación de la escala de Binet en Estados Unidos :
1917 Otis elabora el Army alfa test y el Army beta test para la evaluación colectiva de la in-
teligencia durante la primera guerra mundial
1918 Woodworth publica el primer inventario de personalidad: Personal data sheet
1921 Rorschach publica Psychodiagnostik
1922 Cattell funda la Psychological Corporation, primera editorial de tests a gran escala
1927 Strong publica su I/nventario de intereses personales
1935 Murray publica el Test de apercepción temática (TAT)
1936 El Comité Central del Partido Comunista de la Unión Soviética prohíbe el uso de
tests
1938 Thurstone publica Primary mental abilities
1939 Wechsler publica su escala individual de inteligencia
Frank introduce la expresión «técnicas proyectivas»
1940 Comienza a publicarse la revista Educational and Psychological Assessment
1943 Hathaway y McKinley publican el Minnesota multiphasic personality inventory
(MMPI)
1947 La American Army Airforce publica los procedimientos de selección de pilotos
1952 Eysenck con la publicación de The effects ofpsychotherapy comienza la polémica
acerca de la eficacia y evaluación de la psicoterapia
1954 Meehl publica Clinical versus statistical prediction en donde se vierten fuertes críticas a
las técnicas proyectivas
1955 Ghiselli muestra el bajo poder predictivo de muchos tests
157 Edwards demuestra la influencia de la deseabiliadad social, comenzando la polémica
en torno a las tendencias de respuesta de los tests
1958 Anastasi publica la primera edición de Psychological testing
1959 Quema de tests en Texas iniciándose el movimiento antitests
1964 Se prohíbe la aplicación de tests colectivos de inteligencia en las escuelas de Nueva
York
1965 Kantfer y Saslow publican Behavioral analysis, produciéndose el nacimiento “oficial”
de la evaluación conductual
1966 McReynolds publica la primera edición de Advances in psychological assessment
1968 Cautela utiliza por primera vez la expresión «behavioral assessment»
Mischel publica Personality and assessment
Barker con la publicación de Ecological psychology establece los principios de la eva-
luación ambiental
1976 Se publica Behavioral assessment. A practical handbook de Hersen y Bellack.
17 Se inicia la publicación de las revistas Behavioral Assessment y Journal of Behavioral
Assessment
Evolución histórica de la evaluación psicológica 47
É u dE ' EW LAU SR 3
$ .
de pl
EN yl
eo? 4 palénue
ca
. 1]
E,
-
>. 54 olémica
eN
LS
2. EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA
EN ESPAÑA
L INTRODUCCIÓN
Universidad de Granada.
50 Gualberto Buela-Casal y J. Carlos Sierra
El nacimiento de la psicología en España no podría ser más feliz, puesto que nace en
una facultad de ciencias; ¿quién podría imaginarse en aquellos momentos que termina-
ría reapareciendo en una facultad de filosofía casi siete décadas después? En el año
1902, Luis Simarro toma posesión de la cátedra de psicología experimental en la Facul-
tad de Ciencias Naturales de la Universidad de Madrid, que es, según Yela (1982), la
primera del mundo. Si bien es cierto que Urbano González fuecatedrático de Psicolo-
gía, Lógica y Filosofía Moral en el Instituto San Isidro de Madrid en 1875, en ésta no se
considera la psicología como una disciplina independiente. Simarro, médico con una
sólida formación, ocupó la plaza de jefe facultativo en el manicomio de Leganés (Ma-
drid), realizó estudios con Charcot y Claude Bernard en París y posteriormente consi-
guió la cátedra. Fue un gran impulsor de la psicología en España, pues en torno a él se
formaron los que más tarde sentarían las bases de la psicología española. Su labor era
más la de un organizador que la de un investigador. Participó en la creación de la Aso-
ciación Española para el Progreso de las Ciencias y en la Junta de Ampliación de Estu-
dios e Investigaciones Científicas (1907) (Alvarez, Cañas y Campos, 1990).
Desde los primeros años del siglo XX surgen dos líneas de trabajo, una dirigida
por Luis Simarro en Madrid y la otra se consolida en Barcelona bajo la dirección de
Ramón Turró, especialmente interesado en problemas epistemológicos. Carpintero
(1989a, 1994) llega a hablar ya de la escuela de Madrid y la escuela de Barcelona. La
primera evoluciona hacia el campo educativo y clínico, a lo cual contribuye la crea-
ción en 1914 del Patronato Nacional de Anormales, donde Achúcarro y Rodríguez
Lafora comienzan a trabajar en problemas psicopedagógicos; la segunda escuela
evoluciona hacia el campo de la psicotecnia, destacando la fundación en 1914 de la
Secretariat d'Aprenentatge de la Mancomunidad (transformada tres años después en
el Institut d'Orientació Professional), donde inicia sus trabajos Emilio Mira. Car-
pintero (19894) resalta dos características importantes de esta primera psicología:
una es su orientación hacia la intervención, lo cual contribuye al desarrollo de la eva-
luación psicológica y otra la focalización hacia el estudio de las aptitudes.
En Madrid surge una serie de instituciones (Patronato Nacional de Anormales,
Instituto de Reeducación Profesional de Inválidos del Trabajo, Inspección Médico-
Escolar, Colegio Nacional de Sordomudos, Instituto Médico-Pedagógico...) que
traerá como consecuencia una demanda de instrumentos de evaluación. Fruto de
ello son obras relevantes como Diagnóstico de niños anormales (1914) de Anselmo
González, en donde se incluye una descripción de la escala de Binet-Simon y Los ni-
ños mentalmente anormales (1917) de Gonzalo R. Lafora, orientada a maestros es-
pecializados en la enseñanza de niños deficientes. Sin embargo, posiblemente la pu-
blicación más relevante de esta época sea Pruebas de inteligencia. Revisión española
y adaptación práctica del método de L. M. Terman (1930) de José Germain y Merce-
des Rodrigo, lo que pone de manifiesto la preponderancia de la evaluación de la inte-
ligencia, y concretamente de la figura de Binet, en esta incipiente evaluación psicoló-
gica. En esta obra se defendía que estas pruebas de inteligencia (las cuales, en opinión
e los autores, formaban parte de una nueva rama de la psicología experimental: la
psicología aplicada) se aplicasen en la escuela con la ayuda de un psicólogo. Estos
Evolución histórica de la evaluación psicológica en España 51
mismos autores llegaron a publicar un test de inteligencia con diez pruebas (refranes,
analogías, etc.) para detectar estudiantes bien dotados (Carpintero, 1994). Este mis-
mo año se publica La psicología contemporánea, obra póstuma de Viqueira, un discí-
pulo de Simarro que se había formado con Múller en Alemania, donde llegó a publi-
car un estudio sobre la memoria de sílabas sin sentido, lo que en palabras de
Carpintero (1989b) constituye el estreno o puesta de largo de nuestra investigación
psicológica. Viqueira pudo haber sido el primer gran impulsor de la investigación
psicológica, pero su prematura muerte a los 36 años le convirtió en nuestra primera
frustración científica. Sin embargo, puede ser considerado como el primer represen-
tante de la evaluación psicológica en España, tal como queda de manifiesto en su tra-
bajo Los métodos del examen de la inteligencia (1917), en el que analiza las pruebas
de inteligencia de Binet, y en Qué es una medida mental: ¿es posible una psicología
cuantitativa?, trabajo que presentó en el Congreso de la Asociación para el Progreso
de las Ciencias celebrado en Sevilla en 1917. En su libro Introducción a la psicología
pedagógica, publicado en 1926, argumentaba que la psicología era de gran utilidad
para el maestro, pues le permitía conocer la evolución del individuo, por lo que re-
saltaba la importancia del diagnóstico en el ámbito educativo. A pesar de su corta
vida, su producción científica fue abundante y polifacética, tratando temas tan diver-
sos como psicología experimental, psicología infantil, evaluación y personalidad. Se-
gún Del Barrio y Carpintero (1985), Viqueira aparece como un auténtico psicólogo
moderno, con una formación plenamente europea, y cuya obra podría haber sido
decisiva para la psicología española si se hubiera dado el marco académico adecuado.
Ya en 1915, Viqueira planteaba la necesidad de crear un instituto de psicología, que
permitiría formar a los estudiantes que pretendieran estudiar en el extranjero y, al
mismo tiempo, serviría para ofrecerles la posibilidad de seguir trabajando en psico-
logía a su regreso. Sin embargo, su proyecto no encontró ningún apoyo institucio-
nal, por lo que optó por dedicarse a temas de psicología infantil y pedagógica en el
Museo Pedagógico Nacional, donde impartía cursos de psicología experimental. En
1917 consigue una cátedra de filosofía en el instituto de Santiago de Compostela y,
poco después, se traslada al instituto de La Coruña. A partir de entonces, su activi-
dad es aún más polifacética, sigue publicando trabajos de psicología, cultiva la músi-
ca y la poesía, al mismo tiempo que se convierte en un activo galleguista. En opinión
de Blanco y Rosa (1991), resulta difícil comprender el pensamiento de Viqueira sin
tener en cuenta su modo de experimentar lo gallego. No obstante, su primera voca-
ción seguía siendo la psicología y, de hecho, en 1924 había decidido volver a Alema-
nia, pero la osteomelitis que padecía desde la adolescencia, terminó con todas sus as-
piraciones, perdiéndose así uno de los primeros personajes de la exigua historia de la
ciencia española, cuya principal preocupación intelectual tuvo que ver con los pro-
blemas de la psicología científica (Blanco y Rosa, 1991).
Mientras tanto, en la escuela de Barcelona cabe destacar, por su relevancia en la
evaluación psicológica, la creación de la Secretariat d'Aprenentatge de la Mancomu-
nidad (1914) que se constituyó en un centro de orientación y selección profesional
para jóvenes; en 1917 se transforma en el Institut d'Orientació Profesional ' en don-
1 En este centro se llega a realizar todo tipo de evaluaciones (inteligencia, personalidad, etc.), así
como selección y orientación profesional.
52 Gualberto Buela-Casal y J. Carlos Sierra
de Emilio Mira ocupa por concurso oposición en 1919 la dirección del Laboratorio
Psicométrico, el primer laboratorio de psicofisiología (Ballús, 1994). En 1931 el cen-
tro se convirtió, bajo la dirección de Mira, en el Institut Psicotécnic de laGeneralitat
de Catalunya incluyendo tres secciones: orientación y selección profesional, psico-
tecnia comercial e industrial y psicopedagogía (Carpintero, 1994). En 1920 comenzó
a editarse la revista Anals de l'Institut d'Orientació Professional, que posteriormente
interrumpiría su edición en tiempos de Primo de Rivera, reanudando su publicación
(en castellano) en 1928 bajo el nombre de Anales de la Sección de Orientación y Se-
lección Profesional de la Escuela del Trabajo (un año antes el Institut pasó a depender
de esta Escuela). En 1933 inicia su edición la Revista de Psicologia i Pedagogia, en Ca-
talán. De esta revista llegaron a editarse cerca de veinte números, puesto que en 1937
se suprime su edición (Kirchner, 1979). Emilio Mira constituye otra figura relevante
para la evaluación psicológica durante este período; nacido en Santiago de Cuba en
1896, aunque luego se trasladaría a Galicia y posteriormente a Barcelona, donde es-
tudiaría la carrera de medicina, licenciándose con premio extraordinario. En 1921
diseña una serie de pruebas para la selección de conductores de autobuses del Ayun-
tamiento de Barcelona: capacidad de atención distribuida, coordinación de movi-
mientos, curva de fatiga, percepción de velocidades y distancias, tiempo de reacción,
etc. (Carpintero, 19894); asimismo intervino en la selección de agentes de policía, en
la cual tuvo en cuenta la inteligencia y la capacidad de observación de los aspirantes.
Su tesis doctoral sobre «Las correlaciones somáticas del trabajo intelectual», presen-
tada en 1922, es quizás el antecedente más claro de la actual evaluación psicofisioló-
gica. En esta investigación se pretende demostrar que los procesos psíquicos, inclui-
dos los superiores, no sólo están relacionados con el sistema nervioso central, sino
también con el sistema vegetativo. El objetivo principal de su tesis es analizar la co-
rrelación entre la actividad mental evaluada a través de pruebas de memoria y de aso-
ciación de conceptos con la actividad cardiovascular medida en oscilogramas regis-
trados en las extremidades superiores e inferiores. La conclusión de su investigación
es que la actividad mental se relaciona con un tipo de onda que denomina esfigmo-
psíquica, variando su amplitud e intensidad en función del esfuerzo que el sujeto reali-
za a nivel mental (García, Herrero y Carpintero, 1993). Posteriormente, Mira centra
su trabajo en dos campos, la psicotecnia y la psiquiatría, y en ambos ejerce una labor
importante. En relación con la última, colabora en la creación de la Asociación de
Neuropsiquiatras y en la fundación de la revista Archivos de Neurobiología. En 1933
consigue la cátedra de psiquiatría de la Universidad de Barcelona, siendo así el pri-
mer catedrático de esta especialidad en España (Miralles, 1985). Dos años después
publica su Manual de psiquiatría, donde se recoge su labor en este campo. Sin em-
bargo, su mayor producción, tanto en la investigación como en las publicaciones,
pertenece al campo de la psicología, y más concretamente al ámbito de la psicotec-
nia. Así, la contribución más importante de Mira fue la construcción de diversos ins-
trumentos de medida, entre los que hay que destacar el Test miokinético de Mira
(PMK) basado en el supuesto de que todo tono emocional se corresponde a una pauta
muscular determinada. El test consiste en un tablero especial en el que hay que dibu-
Jar determinadas figuras geométricas. Al sujeto se le dice que se trata de evaluar su
capacidad de coordinación motora o su estabilidad de pulso, por lo que no debe
apoyarse sobre la mesa. Los dibujos se realizan a ciegas, unos con la mano derecha,
Evolución histórica de la evaluación psicológica en España 53
otros con la izquierda y otros con las dos. La evaluación consiste en medir las desvia-
ciones con respecto a los modelos, comparando la ejecución de una mano con la
otra; se obtiene así un mínimo de 80 medidas expresadas en unas unidades denomi-
nadas “tetrones” (Álvarez, 1972). El test de Mira llegó a alcanzar una gran difusión;
muestra de ello es que fue adaptado por el Centro de Psicología Aplicada de París y
aparece recogido en la sexta edición del manual de Buros (The sixth mental measure-
ment yearbook del año 1965); llegó a ser mencionado por Sarason quien señaló la
complejidad que tenía para su aplicación, por lo que era más recomendable en la in-
vestigación que en el diagnóstico (Sarason, 1965); de la misma opinión era Wechsler
(1965) al sugerir algunas transformaciones para hacer del PUX una prueba más utili-
zable. Lamentablemente, su test no llegó a ser presentado en España, puesto que en
1939 tiene que exiliarse, lo que podría considerarse como nuestra segunda frustra-
ción científica. El Test miokinético lo presenta oficialmente en octubre de 1939 en la
Royal Society of Medicine de Londres. El exilio lleva a Emilio Mira a realizar algu-
nas estancias en Estados Unidos —donde dio conferencias en las universidades de
Harvard, Princeton, Yale y Chicago—, Cuba, Argentina, Uruguay y finalmente en
Brasil, estableciéndose definitivamente en Río de Janeiro, donde llegó a ser el direc-
tor del Instituto de Selegao e Orientacao Professional (Ardila, 1986), estando dividi-
da su producción científica entre España (153 trabajos) y el exilio (160 trabajos) (Sáiz
y Sáiz, 1992). Entre sus aportaciones a la psicología española hay que resaltar tam-
bién su colaboración en la organización del II y VI Congresos Internacionales de
Psicología Aplicada celebrados en Barcelona en 1921 y 1930 respectivamente. El pri-
mero fue presidido por Claparede y el segundo por Mira. Sin duda, estos congresos
significaban un reconocimiento internacional a la pujante psicología española.
Otra aportación digna de mención son los estudios de Marañón sobre la emo-
ción, los cuales pueden ser considerados como un antecedente de la actual evalua-
ción psicofisiológica. Marañón entendía la emoción como un estado subjetivo en el
que se pueden distinguir tres tipos de manifestaciones: conducta interior, conducta
manifiesta y ciertos patrones de reactividad fisiológica. De hecho, el trabajo más c1-
tado de Marañón fue el que publicó en Francia en 1924, «Contribution a Pétude de
Paction émotive de Padrenaline». Este artículo había sido publicado en España dos
años antes, pasando totalmente desapercibido (Ferrándiz y Carpintero, 1983). En
dicho trabajo estudia los efectos fisiológicos y subjetivos de la adrenalina en más de
doscientos sujetos, concluyendo que:
Tras la guerra civil resurge con fuerza una psicología escolástica con raíces en Aristóte-
les y santo Tomás muy diferente a la psicología científica y aplicada que se estaba co-
menzando a fraguar antes de la contienda. Tal como señala Pelechano (1988), se tuvo
que volver a descubrir la psicología científica en sucesivas batallas con la “ciencia del
alma”. En 1940 llega a España desde Roma el padre dominico Barbado con el fin de di-
rigir las investigaciones psicológicas, consiguiendo abarcar todo el poder académico e
institucional de la psicología española hasta su muerte en 1945. En su obra Introduc-
ción a la psicología experimental (1943) consideraba a Aristóteles como verdadero fun-
dador de la misma y a santo Tomás como responsable de su estatus disciplinar, criti-
cando el conductismo, el psicoanálisis y la reflexología; un dato relevante de este texto
es que santo Tomás es el autor más citado con 191 referencias (Carpintero, 1994).
Con el paso del tiempo, poco a poco se fueron reanudando las actividades de los
institutos de Barcelona y Madrid bajo la dirección de dos ingenieros, Manuel Borrás
y Ricardo Ibarrola, respectivamente. Durante años, estos centros trabajaron con
muy poca coordinación, intentando solucionar mediante técnicas de orientación y
diagnóstico los problemas surgidos a los educadores en la práctica cotidiana de la ac-
tividad escolar. La reorganización del Instituto de Psicología Aplicada y Psicotecnia
de Madrid posibilita la publicación de la revista Psicotecnia que va a suponer un res-
tablecimiento de la tradición científica. Sin duda ninguna, en esta reconstrucción de
la psicología científica española la figura central va a ser José Germain, quien en 1948
funda, con Mariano Yela como secretario, el Departamento de Psicología Experi-
mental en el Consejo Superior de Investigaciones Científicas (CSIC), en el que reúne
a un importante grupo de colaboradores entre los que cabe destacar a Mariano Yela
(especializado en psicometría y en la técnica del análisis factorial con Thurstone en
Chicago), a José Luis Pinillos (formado en Londres, en donde entró en contacto con
Evolución histórica de la evaluación psicológica en España 55
los trabajos de Eysenck), a Miguel Siguán (que había trabajado con Mira y estaba es-
pecializado en el TAT), a Manuel Úbeda (especializado en electroencefalografía), a
Jesusa Pertejo (especializada en el Rorschach), así como a Francisco Secadas, José A.
Forteza, Alfonso Álvarez Villar y Juan García Yagúe. Sin embargo, los inicios fue-
ron difíciles, quedando claramente reflejada esta situación en la anécdota relatada
por Yela (1994, p. 43) ocurrida durante su primer contacto con Germain: «[...] en 1948
cuando le conocí personalmente le propuse que convocase una reunión de los psicó-
logos españoles para considerar nuestra situación y planear nuestro futuro. Me res-
pondió: “siéntese usted ahí, yo me siento aquí; ya estamos reunidos los psicólogos
españoles”. Desde luego exageraba: había otros tres o cuatro». Uno de los proyectos
más amplios desarrollados por Germain y su equipo del CSIC fue la adaptación y ba-
remación de pruebas para selección de pilotos, tomando como base las utilizadas
por el Ejército del Aire de Estados Unidos (Carpintero, 1994). En opinión de Yela
(1987), la contribución de Germain a la psicología consiste en haber conseguido es-
tablecer las condiciones para consolidar la docencia, la investigación y la aplicación
de la psicología. «A él, en muy primer lugar, se debe que exista una psicología en Es-
paña. No que despunte tal o cual psicólogo eminente, que eso ya aconteció en mu-
chos períodos de nuestro pasado, sino, lo que nunca se había conseguido, que haya
miles de psicólogos que enseñan, investigan y aplican su ciencia, día a día, sin inte-
rrupción, por toda la geografía española» (Yela, 1987, p. 60).
Germain en 1946 funda la Revista de Psicología General y Aplicada, la primera
revista española dedicada exclusivamente a la psicología, y en 1952 la primera socie-
dad científica y profesional de psicólogos, la Sociedad Española de Psicología (SEP)
que debería potenciar los trabajos de investigación y la imagen del psicólogo en la
sociedad española, organizando reuniones anuales y congresos nacionales (Mora,
1992; Carpintero, 1994), siendo secretario Mariano Yela. Para fomentar la relación
internacional se nombra a Piaget miembro de honor y se le invita para que imparta
una conferencia sobre «Las ilusiones y los mecanismos perceptivos» en la sede de la
sociedad. Todos los esfuerzos de Germain fueron en vano puesto que asistieron a la
conferencia menos de veinte personas (Siguán, 1981), lo cual es un indicador más del
estado de la psicología en esos momentos.
En este período aparecen los dos primeros libros sobre la técnica de Rorschach.
Uno es El estudio de la personalidad por el test psicodiagnóstico de Rorschach (Tran-
que, 1942), donde se revisa el método y las reglas de validación y se incluyen varios
protocolos de sujetos normales y con alteraciones psiquiátricas. Dos años después se
publica El psicodiagnóstico de Rorschach (Salas, 1944), que se considera en ese mo-
mento como el libro más importante sobre esta técnica escrito por un autor español
(Serrate, 1980).
En el año 1953, gracias a los esfuerzos de José Germain, se crea la Escuela de Psicolo-
gía y Psicotecnia de la Universidad Complutense de Madrid. Se trataba de una es-
cuela para posgraduados de cualquier facultad o escuela especial y era el primer cen-
56 Gualberto Buela-Casal y J. Carlos Sierra
tro de formación de psicología en España (el título que se obtenía era el de Diploma-
do en Psicología). Su director fue el catedrático de pedagogía Juan Zaragúeta, los vi-
cedirectores José Germain y Manuel Úbeda, y el secretario Mariano Yela. La forma-
ción se distribuía en dos años: en el primero se cursaban asignaturas generales
(psicofisiología, impartida por Úbeda; psicometría y estadística, impartidas por
Yela; psicología experimental, impartida por Pinillos; psicología genética y diferen-
cial, impartida por Siguán, etc.); en el segundo año se podía optar entre las especiali-
dades de industrial, pedagógica y clínica; dentro de esta última especialidad estaba
incluido el psicodiagnóstico que era impartido por Romano.
En 1963 la SEP comienza a organizar los congresos nacionales de psicología, en
los cuales los trabajos de psicodiagnóstico y evaluación psicológica constituirán un
tópico frecuente y, a veces, prioritario (Ávila y cols., 1994). En 1964 con la ayuda de
Miguel Siguán se crea en Barcelona la Escuela de Psicología de la Universidad de
Barcelona en donde los estudios duraban tres años y tenía dos secciones: psicología
industrial y psicología pedagógica. De forma simultánea, se creaba la Escuela de Psi-
cología Clínica en la Facultad de Medicina de la Universidad de Barcelona (Siguán,
1981). Casualmente, en este mismo año (1964) fallecía en Brasil Emilio Mira, princi-
pal impulsor de la psicología científica en Cataluña.
A finales de la década de los años sesenta, concretamente en 1968, se inauguraba
en las universidades de Madrid y Barcelona la subsección de psicología, dependiente
de la sección de filosofía pura, de la que surgen los primeros licenciados; el psi-
codiagnóstico y la psicometría estaban incluidos en el plan de estudios. Los alumnos
de psicología de la Universidad Complutense comienzan a editar en 1970 (a mult-
copista) la revista Grupos de Trabajo de Psicología Crítica; tres años después se
transforma en Cuadernos de Psicología, donde se dieron a conocer los escritos de
Luria, Sechenov, Skinner, entre otros. Posteriormente, en 1975, se convierte en una
revista «más formal» pasando a editarse con el nombre de Cuadernos de Psicología 3
(Alvarez, Cañas y Campos, 1991). La evaluación psicológica que se imparte en esos
tiempos estaba representada por la intensa y constante labor de Mariano Yela en el
campo de la psicometría. En 1956 publicó dos importantes libros: Psicometría y es-
tadística y Psicología de las aptitudes y un año después La técnica del análisis facto-
rial. La importancia del primer libro queda de manifiesto por el hecho de que en
1975 se publicaba la vigesimoséptima edición. La aportación de Yela a la psicología
supone 14 libros como único autor, 40 como colaborador, 250 publicaciones en re-
vistas especializadas, 200 tests adaptados o construidos, 70 tesis doctorales dirigidas,
etc. (Muñiz, 1994).
Junto a esta vertiente psicométrica, representada por Yela, se estaba desarrollan-
do un psicodiagnóstico con una clara orientación hacia las técnicas proyectivas prac-
ticado en el Departamento de Psicología Clínica de la Facultad de Medicina de Ma-
drid dirigido por Jesusa Pertejo, y en el de Psicología Clínica del Hospital Provincial
de Madrid bajo la dirección de María Eugenia Romano. El interés por las técnicas
proyectivas en España, que se había iniciado con las publicaciones de Tranque y Sa-
las sobre el test de Rorschach, se consolida en torno a las figuras de María Eugenia
Romano, Jesusa Pertejo y Agustín Serrate, entre otros. En el III Congreso Nacional
de Pedagogía celebrado en Salamanca en 1964 ya se habían presentado algunos tra-
bajos sobre las aplicaciones del Rorschach al campo educativo. A principio de los
Evolución histórica de la evaluación psicológica en España 57
Tal vez, la psicología española tuvo desde el principio un gran interés por lo apli-
cado, lo cual condujo a un crecimiento muy rápido de la aplicación de la evaluación
psicológica a costa de deficiencias en la adaptación de muchos instrumentos (Pele-
chano, 1988). A primera vista parece que hay una tendencia de los psicólogos espa-
ñoles a inclinarse hacia el campo aplicado. Sin embargo, la razón, tal como se señala
en ambas citas, es una razón oficial. Quizás nadie lo ha resumido de forma tan acer-
tada como Yela (1982) cuando dijo que en la construcción de la psicología española
se comenzó la casa por el tejado. Y nunca mejor dicho. Primero se crearon los insti-
tutos de Psicología Aplicada y Psicotecnia, luego la Escuela de Psicología y Psicotec-
58 Gualberto Buela-Casal y J. Carlos Sierra
psicológica, dentro del auge que estaba cobrando la psicología en general. La dota-
ción de cátedras de psicodiagnóstico va a consolidar la enseñanza e investigación de
la disciplina, que serán ocupadas por María Eugenia Romano (fallecida en 1987),
Rocío Fernández-Ballesteros, Fernando Silva y Alfonso Blanco (Ávila y cols.,
1994). La preocupación por mejorar la evaluación psicológica ha sido constante en
España, lo cual conduce, por iniciativa del Departamento de Diagnóstico Psicológi-
co y Medida de la Universidad Autónoma de Madrid, a la celebración en 1981 de la
I Reunión Nacional de Profesores de evaluación psicológica, a la que asistieron
treinta profesores titulares de esta materia de diez universidades españolas. El objeti-
vo principal era tratar sobre el concepto, contenidos y métodos de enseñanza del
psicodiagnóstico, con el propósito de actualizar los programas de estudio y mejorar
la formación de los futuros psicólogos. En nuestra opinión, esta reunión tiene una
especial importancia, puesto que es la primera vez que se plantea una reflexión con-
junta sobre el psicodiagnóstico que se enseña en España, al mismo tiempo que se
compara con programas docentes de diversas universidades extranjeras. Una prime-
ra conclusión, quizás algo sorprendente, fue que aunque había cierta coincidencia en
los contenidos que se impartían en España y en diversos países, el término “psico-
diagnóstico” era poco frecuente en los planes de estudio de psicología de las univer-
sidades extranjeras. Según esto, y teniendo en cuenta las posibles connotaciones
“médicas” del término “psicodiagnóstico”, se optó por sustituirlo por el de evalua-
ción psicológica —lo que asumimos plenamente. Sin embargo, este cambio se limitó
al uso del término en las publicaciones y en la comunicación entre los profesionales,
puesto que, a nivel académico oficial, se ha mantenido hasta principios de la década
de los años noventa. Otra conclusión importante fue la consideración del psicodiag-
nóstico desde una perspectiva científica, definiéndolo como:
el proceso de análisis científico que, partiendo de múltiples datos (biológicos, evolutivos, pa-
tológicos, sociológicos), y a través de la descripción, comprensión y, en su caso, explicación
de la conducta de un sujeto o grupo humano, tiene como objetivo la intervención, en térmi-
nos de orientación, selección, predicción y modificación.
La primera reunión científica organizada por la EAPA (la First European Confe-
rence on Psychological Assessment) tuvo lugar en Barcelona en el año 1991; en 1992
se transforma la revista Evaluación Psicológica/Psychological Assessment en el Enro-
pean Journal of Psychological Assessment, convirtiéndose en el órgano de difusión
oficial de la EAPA. El último evento organizado por la Sociedad Española de Evalua-
ción Psicológica fue el LIL Congreso de Evaluación Psicológica celebrado en Barce-
lona en el año 1991, presentándose 290 trabajos distribuidos en ocho áreas diferen-
tes: psicología clínica y salud, psicología del trabajo y las organizaciones, psicología
educativa, psicología ambiental, psicofisiología y neuropsicología, psicología de la
personalidad, servicios sociales, y psicología del deporte y seguridad vial. En el
IV Congreso de Evaluación Psicológica?, celebrado en Santiago de Compostela en
1994 se presentaron 322 trabajos repartidos en ocho áreas: psicología clínica, psico-
logía educativa, neuropsicología y psicofisiología, organizaciones, personalidad, psi-
cología de la salud, psicología del trabajo y valoración de programas. A lo largo de
estos cuatro congresos nacionales de evaluación psicológica podemos apreciar un
incremento en el número de trabajos presentados; sin embargo, a nuestro entender,
este aumento no es paralelo al gran desarrollo experimentado por la psicología espa-
ñola durante la última década, esperándose un incremento mucho mayor en el nú-
mero de trabajos; téngase en cuenta que se pasó de 197 en 1984 a 322 en 1994. Por
otro lado, se produjo una mayor especialización de los mismos dando lugar a áreas
temáticas más concretas, lo cual está en la dirección que ha tomado la evaluación psi-
cológica en todo el mundo; así, de las cuatro áreas presentes en el primer congreso se
pasó a ocho en el último. Nos hemos detenido con cierto detalle en las reuniones de
profesores y los congresos de evaluación psicológica porque en nuestra opinión am-
bos hechos son fundamentales para comprender la actual evaluación psicológica es-
pañola. Estos encuentros posibilitaron el contacto casi continuo de los psicólogos
relacionados con la evaluación psicológica, lo cual puede explicar en cierta medida la
relativa unificación de criterios que existe en esta disciplina en España.
Otras tres reuniones destacadas que tuvieron lugar en España en los últimos
años y que supusieron un respaldo importante a la evaluación psicológica fueron el
Il Congreso del Colegio Oficial de Psicólogos celebrado en Valencia en 1990, el
Congreso Iberoamericano de Psicología celebrado en Madrid en 1992 y el 23nd In-
ternational Congress of Applied Psychology celebrado también en Madrid en 1994.
El 27,20% de los trabajos presentados en el II Congreso del Colegio Oficial de Psi-
cólogos era de evaluación psicológica, lo cual indica que esta disciplina constituye
una parcela importante de la psicología en general. Las áreas generales que contaron
con más contribuciones de evaluación psicológica fueron la de psicología del trabajo
(38%), servicios sociales (27%) y psicología escolar (20,90%);pero además, se pre-
sentaron trabajos de evaluación psicológica en áreas tan específicas como Fuerzas
cabida la evaluación psicológica; así, entre 1991 y 1995, el 22,16% delos trabajos pu-
blicados en la Revista de Psicología General y Aplicada y el 58,66% de los publica-
dos en Análisis yModificación de Conducta están dedicados a la evaluación psicoló-
gica, estando centrados la mayoría de ellos en el desarrollo de metodología y
tecnología de evaluación, evaluación psicofisiológica, evaluación de la personalidad
y evaluación en psicología clínica y de la salud. La consolidación y el gran desarrollo
experimentado por la evaluación psicológica en España durante los últimos años
también se pone de manifiesto en el alto número de libros publicados sobre esta ma-
teria desde finales de la década de los años setenta, y especialmente en la última déca-
da. El anexo 1 recoge una relación de libros que abarcan total o parcialmente la ma-
teria de evaluación psicológica escritos o compilados por autores españoles, a los
que habría que añadir otros muchos dedicados a aspectos más específicos, así como
las traducciones de libros extranjeros.
Por último, un análisis de las tareas realizadas por los psicólogos españoles en
ejercicio nos puede proporcionar información sobre la situación actual de la evalua-
ción psicológica en España. Para ello, nos vamos a centrar en el estudio de Díaz y
Quintanilla (1992) del cual extraemos los datos referidos a la evaluación psicológica.
En el estudio realizado por estos autores con una muestra representativa de los psi-
cólogos colegiados españoles, se concluye que el 48% de las tareas realizadas por los
psicólogos españoles está relacionado total o parcialmente con la evaluación psicoló-
gica; así, dentro de las diez principales actividades realizadas, cinco de ellas implican
tareas de evaluación, lo que indica la importancia de esta actividad dentro de la psi-
cología aplicada. Tengamos en cuenta ahora las diferentes áreas de intervención. Así,
dentro de la psicología clínica y de la salud, el 46,10% de las tareas realizadas está re-
lacionado con la evaluación, destacando el diagnóstico de pacientes (45,20%), reali-
zación de entrevistas de diagnóstico clínico (45%) y el diagnóstico del problema del
paciente y posterior remisión a otros profesionales (38,40%). En el área de la psico-
logía educativa encontramos que el 60% de las tareas realizadas por los psicólogos
colegiados en ejercicio está relacionado con la evaluación psicológica; entre estas ta-
reas destacan el diagnóstico y tratamiento de las dificultades de aprendizaje
(39,60%), el diagnóstico y tratamiento de problemas escolares (38,90%), elabora-
ción de informes de diagnóstico de niños (34,60%) y elaboración de informes sobre
niños evaluados y tratados (34,40%). En cuanto al área de la psicología del trabajo y
de las organizaciones, el 80% de las tareas corresponde a evaluación psicológica,
destacando la participación en procesos de selección como evaluador en alguna de
las fases (18,50%), realización de entrevistas de selección de personal con los candi-
datos al puesto (17,80%) y administración de pruebas de evaluación para la selección
de personal (17,60%). Por último, cabe destacar dentro del área de los servicios so-
ciales la evaluación de los resultados de un programa de intervención en servicios
sociales que supone un 6,60% de las tareas realizadas dentro de esta área, que aunque
es un porcentaje bajo supone la apertura de la evaluación psicológica a otras áreas.
En resumen, según estos datos la evaluación psicológica está presente en todos los
contextos de la psicología aplicada de igual forma o incluso en mayor medida que
Otras tareas.
La evaluación psicológica como uno de los trabajos más importantes que realiza
el psicólogo se pone de manifiesto también entre la “gente de la calle”. Así, en la en-
64 Gualberto Buela-Casal y J. Carlos Sierra
REFERENCIAS BIBLIOGRÁFICAS
LECTURAS COMPLEMENTARIAS
Ávila, A., Blanco, A., Calonge, 1., Forns, M., Oliva, M., Martorell, M. C., Rodríguez, C., Sil-
va, F. y Torres, M. (1994). El diagnóstico y la evaluación psicológica en España: revisión y
perspectivas. Clínica y Salud, 5, 83-120.
Buela-Casal, G., Caballo, V. E., Bornas, X., Tortella, M. y Servera, M. (1993). Pasado y pre-
sente de la psicología clínica conductual en España. Psicología Conductual, 1, 7-34.
Carpintero, H. (1994). Historia de la psicología en España. Madrid. Eudema.
Fernández-Ballesteros, R. (1991). Enseñanza, investigación y práctica de la evaluación psico-
lógica en España. Evaluación Psicológica/Psychological Assessment, 7, 5-21.
ANEXO 1. PUBLICACIONES MAS IMPORTANTES DE AUTORES ESPAÑOLES
EN EVALUACION PSICOLOGICA.
Año Acontecimiento
Il. INTRODUCCIÓN
Abordar la definición de un término siempre suele ser una tarea compleja, máxime
cuando el término no se refiere a un significado concreto, como es el caso que nos
ocupa, puesto que se trata de un tipo de conocimiento para el que se utilizan algunos
nombres procedentes de la traducción de términos de otro idioma. Por otra parte,
nos encontramos con expresiones afines, en cierta medida, como tests psicológicos,
psicodiagnóstico, evaluación psicológica, evaluación conductual, valoración, medi-
da psicológica, examen psicológico, etc., lo cual incrementa aún más la dificultad del
análisis semántico y conceptual. A continuación intentaremos delimitar el significa-
do de cada uno de estos términos, pero previamente nos centraremos en analizar qué
es una definición, los distintos tipos de definición y las reglas que se deben seguir
para formular una definición válida y eficaz. Por otro lado, dado que la evaluación
psicológica se desarrolla especialmente dentro de una psicología aplicada se tratará
de hacer una aproximación a su concepto a través de sus actividades: trabajos cientí-
ficos presentados a congresos o publicados y tareas realizadas por los psicólogos en
evaluación psicológica.
Universidad de Granada.
72 Gualberto Buela-Casal y J. Carlos Sierra
definido sin problema, a pesar de que no tenga signo ni, lógicamente, significado. En
conclusión, significado es en lo que nos hace pensar un signo, mientras que concepto
es la representación cognitiva evocada directamente por una realidad.
La definición de un signo puede ser de dos tipos: sintáctica o semántica. La pri-
mera se caracteriza porque relaciona un signo con otro, o sea, se limita a señalar una
sinonimia. Por ejemplo, evaluación psicológica podría ser sinónimo de psicodiag-
nóstico. La definición sintáctica sirve para sustituir signos, el que sustituye el defini-
tum por el definiens y viceversa, por lo que resulta útil en las abreviaciones (por
ejemplo, EEG quiere decir electroencefalograma). Cuando interpretamos el signo
que constituye el definiens, la definición sintáctica se convierte en semántica. Así,
podría decirse que la definición semántica se caracteriza por poner en conexión un
signo con su significado. Según la forma de relacionar el signo con el significado
puede hablarse de definición semántica innovadora, cuando se relaciona el signo con
una significación nueva (por ejemplo, valoración quiere decir evaluación de progra-
mas); o conservadora, cuando un signo se pone en conexión con una significación ya
usada por un determinado colectivo (por ejemplo, test quiere decir técnica sistemáti-
ca que compara la conducta de dos o más personas).
Ahora bien, una palabra puede tener diversos significados en función de su uso.
Este determina en parte su significado y además su evolución semántica. Un buen
ejemplo es la palabra psicodiagnóstico, que ha cambiado considerablemente su sig-
nificado desde que comenzara a difundirse en España (esto se verá con detalle en el
apartado IV). Pero además, el uso de las palabras decide acerca de su supervivencia en
la medida en que se sigue considerando o no apta para expresar tal significado o sim-
plemente se va relegando su uso ante otra palabra con mayor aceptación. Esto es lo
que ocurre actualmente con el término “psicodiagnóstico”, que ha sido sustituido
por la expresión “evaluación psicológica”.
Por otra parte, el uso de una palabra en distintos ámbitos puede condicionar una
pluralidad de significados. Esto pone de relieve la importancia del contexto cuan-
do se pretende definir un signo que tiene distintos significados según el ámbito en
que se utilice. Éste es el caso de psicodiagnóstico, pues es evidente que no tiene el
mismo significado cuando se utiliza como nombre de una asignatura que cuando
aparece en el título de un libro como Psicodiagnóstico de Rorschach. Por tanto, según
esto, podemos distinguir entre definiciones contextuales, que son las que se hacen en
función de un contexto, y definiciones explícitas, que se hacen con independencia
del contexto. En las ciencias, cuando un término puede tener más de un significado
se deben utilizar siempre definiciones contextuales. El tipo de definición semántica
más frecuente es la conservadora descriptiva, que es la que se formula como resulta-
do de un análisis de lo que se entiende por un término bien en un contexto determi-
nado o en su uso más general. Si se combinan las dos categorías descritas anterior-
mente tenemos que las definiciones semánticas innovadoras descriptivas pueden ser
innovadoras contextuales o innovadoras explícitas; y, de igual forma, las definiciones
semánticas conservadoras descriptivas pueden ser descriptivas explícitas o descript1-
vas contextuales.
Además de las definiciones semánticas descriptivas existen otros dos tipos de
definiciones: la sinonímica y la etimológica. La primera se utiliza para indicar la sig-
nificación de un signo utilizando otro más conocido o de más fácil comprensión; es
74 Gualberto Buela-Casal y J. Carlos Sierra
Ahora bien, una misma realidad puede delimitarse de diversas formas, lo cual
implica tantas definiciones como formas posibles de delimitar la realidad. Por ello, el
científico, frecuentemente, se ve en la necesidad de elegir. Para ello, existen tres crite-
rios:
a. Debe preferirse aquella definición que es más completa, es decir, que reúna
un conjunto de propiedades más amplio.
b. Debe preferirse la que exponga propiedades radicales frente a la que expon-
ga propiedades derivadas de otras.
c. Debe preferirse la que resulte más adecuada a la investigación.
DE SIGNO
(NOMINAL)
Sintáctica Semántica
Innovadora Conservadora
DE COSA
(REALIDAD)
Estructural Funcional
Utitaria
Concepto de evaluación psicológica 77
a. Cuando el definitum forma parte del definiens, lo cual impide una explica-
ción adecuada, puesto que se pretende explicar un signo o una realidad a través de sí
mismo. Este tipo de transgresión se denomina círculo in definiendo, y habitualmente
se confunde con una regla errónea, muy extendida, que postula que «lo definido no
debe formar parte de la definición», lo cual es incorrecto, pues lo definido es uno de
los tres elementos necesarios de la definición, nos referimos al definitum, que es el
signo o realidad que trata de explicarse.
b. Cuando en el definiens se incluyen signos con significado supuesto o meta-
fórico, por lo que la explicación resulta ambigua.
c. Cuando se emplean signos que tienen posibles significados y no se hace una
delimitación contextual del significado cuando se integran en el definiens.
d. Cuando forman parte del definiens signos con significado confuso, es decir,
no se trata de signos con distintos significados en función del contexto en que apare-
cen, sino de signos sobre los que no hay un acuerdo unánime sobre su significado, y
ello a pesar de identificar el contexto. Estos tres últimos tipos de errores lógicos pro-
ducen una definición ambigua.
El término “test” fue acuñado por J. McKeen Cattell en 1890; para este autor, los
tests mentales eran sistemas normalizados de procedimientos que permitían obtener
información objetiva respecto al rendimiento de personas ante la realización de tareas-
tipo. Muy pronto el vocablo fue aceptado por prácticamente todo el mundo occi-
dental, pasando en el primer tercio del siglo XX a formar parte de los idiomas caste-
llano, francés, italiano y alemán (Pelechano, 1988). Asimismo, se publicaron, y se
siguen publicando, manuales anglosajones en cuyo título aparece la expresión tes-
ting |, que se podría traducir por «hecho o acción de aplicar tests». La aplicación de
tests psicológicos dio lugar a principios del presente siglo a la especialidad de psico-
tecnia, término que en España fue utilizado, tal como se ha comentado en el capítulo
anterior, en algunas publicaciones e incluso en el nombre de algunos institutos, lo
cual es un reflejo de la importancia de los tests psicológicos. Esta relevancia se hace
patente también dentro de la sociedad en general; así, en la encuesta realizada por
Berenguer y Quintanilla (1994) entre la población española, el 85,30% de la misma
considera que la tarea de los psicólogos es pasar tests. Recientemente, Rogers (1995)
llega a limitar más el significado de testing; este autor emplea el término psycholog:1-
cal testing para referirse a aspectos técnicos de los tests (fiabilidad, validez, etc.) y
psychological assessment para aludir al modo en que los tests son usados para tomar
decisiones conjuntamente con otras fuentes de información. En su manual The ps)-
chological testing enterprise. An introduction comenta que el objetivo de su texto es
«proporcionar el bagaje suficiente para permitir la valoración de la evaluación psico-
lógica, pero uno de los prerrequisitos es tener el suficiente conocimiento acerca del
psychological testing para poseer una opinión informada de la evaluación» (Rogers,
1995, p. 48).
Aunque las definiciones de tests psicológicos formuladas han sido diversas, to-
das ellas coinciden en unos aspectos comunes. A continuación vamos a comentar
dos de ellas planteadas por dos de los autores más relevantes de esta disciplina. Anas-
tas (1988, p. 23) afirma que «un test psicológico es esencialmente una medida objeti-
va y estandarizada de una muestra de conducta». En esta definición destaca el adjeti-
vo “estandarizada”, lo cual implica una uniformidad en el procedimiento de
administración y puntuación del test; es decir, el test será administrado en una situa-
ción controlada y la puntuación obtenida se interpretará comparándola con la del
grupo normativo. El otro elemento importante de la definición propuesta por Anas-
tasi es «muestra de conducta»; es decir, lo que se evalúa con un test psicológico no es
más que una muestra de las conductas, por lo que la bondad del mismo radica en la
adecuada elección de los ítems que representen al conjunto total de conductas que
queremos evaluar. Ello nos lleva al concepto empleado por Anastasi de “indicador”,
aludiendo a que los tests psicológicos son medidas indirectas. Por su parte, Cron-
bach (1990, p. 32) define el test psicológico como «un procedimiento sistemático
" Entre estos manuales destacan Psychological testing de Anastasi (1988), Essentials ofpsychological
testing de Cronbach (1990), Psychological testing. Principles, applications, and issues de Kaplan y Saccuz-
z0 (1993) o The Psychological testing enterprise. An introduction de Rogers (1995)
Concepto de evaluación psicológica 79
IV. PSICODIAGNÓSTICO
V. EVALUACIÓN PSICOLÓGICA
muchos libros escritos sobre tests psicológicos y cursos organizados en relación con estos li-
bros se centran especialmente en la teoría y construcción de los tests y minimizan la interpre-
tación de los mismos. Por el contrario, el intento de este libro es centrarse en los procesos que
realizan de modo efectivo los profesionales durante la evaluación [Groth-Marnat, 1990, p. 1].
Según esto, podríamos decir que los otros conceptos que hemos revisado y los
que vamos a revisar a continuación no serían más que elementos integrantes del pro-
ceso de evaluación.
VI VALORACIÓN
Existen ejemplos claros en los que se utilizan indistintamente los términos valo-
ración y evaluación: Fernández-Ballesteros y Vila (1983) en evaluación neuropsico-
lógica; por su parte, Álvaro y Cerdán (1988) al referirse a la distinción hecha por
Scriven, hablan de la evaluación formativa y la evaluación sumativa, mientras que
Fernández-Ballesteros (1992b) lo hace de valoración formativa y valoración suma-
tiva.
Otros autores defienden la complementariedad de ambos términos; tal es el caso
de Pelechano (1988) o Álvaro (1990, p. 61) quien considera que
la palabra castellana evaluación tiene dos acepciones diferentes en su traducción al inglés, am-
bas igualmente correctas. Por la primera de ellas, assessment, se entiende la medida u observa-
ción sistemática realizada sobre la extensión o calidad de la consecución de un logro. La se-
gunda, evaluation, implica la emisión de juicios acerca de los objetivos de aprendizaje usando
la información conseguida por medio de assessment.
88 Gualberto Buela-Casal y J. Carlos Sierra
Juicios positivos, con lo cual el término “evaluación” abarcaría los contextos en los
que se está empleando “valoración”.
Sin embargo, tal como señala Silva (1993), el empleo de esta expresión no es re-
90 Gualberto Buela-Casal y J. Carlos Sierra
comendable dadas las fuertes connotaciones psiquiátricas propias del modelo médi-
co que posee el término “diagnóstico”. ys
El “análisis aplicado de la conducta” (applied behavior analysis) fue definido por
Baer, Wolf y Risley (1968, 1987) en el primer número de la revista Journal of Applied
Behavior Analysis como un proceso de aplicación de principios del comportamiento
al desarrollo de conductas específicas y a la evaluación de si los cambios producidos
son debidos a la aplicación de dichos principios. Según Kazdin (1991), debe conside-
rarse como un procedimiento de análisis y tratamiento que se basa en los métodos del
condicionamiento operante y que pone énfasis en los antecedentes y consecuentes,
no aceptando estados mediacionales, acontecimientos privados ni cogniciones. El
análisis aplicado de la conducta se caracteriza por un enfoque metodológico particu-
lar e incluye la evaluación experimental de la conducta, empleando preferentemente
diseños intrasujeto con medidas repetidas. El polo opuesto del análisis conductual
aplicado es el análisis experimental de la conducta; así, mientras que el primero se cen-
tra en el estudio de conductas socialmente importantes en sus contextos sociales habi-
tuales, el segundo analiza el comportamiento dentro de un contexto de laboratorio.
Por último, el “análisis funcional de la conducta” (functional behavior analysis)
fue definido por Peterson (1968) como un proceso que cumple las siguientes carac-
terísticas:
aquella alternativa a la evaluación psicológica a través de la cual se trata de identificar las con-
ductas objeto de estudio, tanto motoras como fisiológicas o cognitivas, así como las variables
ambientales y/o personales que las mantienen y controlan, con el objetivo de realizar un tra-
tamiento o cualquier otro tipo de intervención conductual y su valoración.
$_-É---MMMmm
|
Propiedades de los números 2, 4 y 16 Propiedades de las personas A, B y C
_ _222. A E ERP PAI EIN A A
2 es diferente de 4, 4 es diferente de 16 Aes diferente de B, B es diferente de C
16 es mayor que 4, 4 es mayor que 2 C tiene más del atributo X que B, B presenta
más que A
La diferencia entre 16 y 4 es mayor que La diferencia en el atributo X entre C yBes
la diferencia entre 4 y 2 mayor que la diferencia entre B y A
—_—_a—a —oco co — _ o a QuOoUuoumnuNINIXIIAA
Concepto de evaluación psicológica 93
presente siglo Xoan Viqueira publica, en 1917, un artículo titulado «Los métodos
del examen de la inteligencia». Sin embargo, este término no fue muy utilizado pos-
teriormente, salvo raras excepciones, como, por ejemplo, en el libro El diagnóstico
neuropsicológico de Luria, donde a pesar de que en la portada aparece la palabra
diagnóstico, en el interior, tanto en el prólogo, en el índice, como en el texto, se utili-
za continuamente el término examen. También aparece como título de algún libro,
como por ejemplo en El examen clínico en psicología de Rey. En los textos recientes,
tal vez sea en Psicodiagnóstico y estadística de Forns y cols. (1980) en donde se utiliza
el término con mayor asiduidad, definiéndose como «el conjunto de acciones enca-
minadas a comprender lo que un sujeto en consulta psicológica transmite al psicólogo
acerca de sus propias aptitudes, actitudes y vivencias, que permiten prever su desa-
rrollo futuro o tomar las decisiones oportunas en vistas a solucionar algún problema»
(Forns y cols., 1980, p. 49).
Sin embargo, en España como consecuencia del predominio que tuvo el término
“psicodiagnóstico” hasta hace poco y la implantación del de “evaluación psicológi-
ca”, el empleo de “examen psicológico” es casi nulo, aunque a nivel más popular
suele usarse con relativa frecuencia la expresión “examen psicotécnico”.
Tal como se comentó al principio de este capítulo vamos a intentar realizar una apro-
ximación al concepto de evaluación psicológica a través de las actividades realizadas
en la actualidad por los profesionales de la psicología que están estrechamente rela-
cionadas con esta disciplina pues, como bien es sabido, la evaluación psicológica
constituye una parte importante de la psicología aplicada. Para tal acercamiento he-
mos optado por tres vías diferentes: aportaciones científicas a algunos congresos re-
levantes para la disciplina, algunas publicaciones importantes de esta disciplina en
los últimos cinco años y la actividad evaluadora del psicólogo.
IX.1. Congresos
Si analizamos dos congresos de carácter general, uno de ellos nacional (1! Congreso
del Colegio Oficial de Psicólogos celebrado en 1990) y otro internacional (23nd In-
ternational Congress of Applied Psychology celebrado en 1994), la evaluación psi-
cológica es una disciplina que está presente en la psicología clínica y de la salud, psi-
cología del trabajo y de las organizaciones, psicología educativa, servicios sociales,
psicología del tráfico y seguridad vial, psicología jurídica, psicología del deporte,
psicología ambiental, etc. Por otro lado, si analizamos los dos últimos congresos de
evaluación psicológica celebrados en 1991 y 1994, nos encontramos que junto a las
tres áreas clásicas (psicología clínica, psicología escolar y psicología del trabajo) van
surgiendo otros ámbitos de aplicación como la evaluación de programas, evaluación
ambiental o evaluación neuropsicológica. Todos estos ámbitos son parte de la actual
evaluación psicológica.
Concepto de evaluación psicológica
95
1x2. Publicaciones
X. CONCLUSIONES
tivos y en los distintos contextos en los que se llevan a la práctica. Por ello, tal como
indica Fernández-Ballesteros (1992c), no es de extrañar que tal diversidad de activi-
dades, contextos y objetivos psicológicos haya dado lugar a lo largo del tiempo y de
los distintos contextos culturales, a que las actividades de evaluación psicológica ha-
yan adoptado distintas denominaciones. Así, se emplea el término “psicodiagnósti-
co” en un período de dominio del modelo médico, generalizándose posteriormente,
en el caso concreto de España, a prácticamente toda la evaluación psicológica, decre-
ciendo en los últimos años su ámbito de generalidad, limitándose su aplicabilidad a
aquellas situaciones en las que el objetivo de la evaluación es el diagnóstico psicoló-
gico, es decir, establecer la clasificación del sujeto con fines clínicos. Un fenómeno
similar sucedió con el término “aplicación de tests” que como consecuencia de la re-
levancia del modelo psicométrico ha llevado a la equiparación de la evaluación psi-
cológica con los tests psicológicos. Sin embargo, en la actualidad, aunque los tests
psicológicos (y las técnicas de evaluación en general) juegan un papel importante en
el proceso de evaluación, existe un consenso general en considerar a la evaluación
como un concepto más amplio que la mera aplicación de tests, que incluye la inte-
gración de toda la información recogida.
Los argumentos expuestos con anterioridad justifican el empleo del término
“evaluación psicológica”. Pero además, en la actualidad, cualquier otro concepto de
los revisados queda desfasado por el hecho de que en los últimos años la evaluación
psicológica ha ampliado su objeto de estudio, no limitándose única y exclusivamente
a las características psicológicas de las personas, sino que abarca contextos específicos
(evaluación del ambiente), tratamientos, programas o intervenciones (evaluación de
programas). Por todo ello, la evaluación psicológica constituye el estudio científico, a
través de diferentes procedimientos de recogida de información (entre otros muchos,
los tests psicológicos), de las actividades o características psicológicas de una persona
(o grupo específico de personas), ambientes específicos y/o intervenciones con el ob-
jetivo de alcanzar unos objetivos propuestos (entre ellos el diagnóstico).
Por último, la evaluación conductual, después de un período de gran auge y ex-
pansión en el que se presentaba incluso como una alternativa a toda la evaluación
psicológica, en la actualidad constituye un modelo más dentro de una disciplina en la
que se defiende de una forma cada vez más generalizada una aproximación de los di-
ferentes enfoques. Así, los evaluadores conductuales utilizan técnicas de evaluación
tradicional (Piotrowski y Keller, 1984), y para muchos autores la crisis de la evalua-
ción conductual ha dado lugar a una aproximación en la evaluación psicométrica
(Cone, 1988; Silva, 1989).
REFERENCIAS BIBLIOGRÁFICAS
LECTURAS COMPLEMENTARIAS
e TAS
; cs TA A
€ 53
1] >
a» 320330DO ANITA 7
ya ll 4 0 + y
A 20m ibm
ote air a
(UA)
¡eoor "5
Apta4
Y $ i
A pls YA A 21125) y
h AN : "4
h . La ó $4 SOLEADA
y y
) > E
¡e
d 131M A
ml
DIESES “Y
4. MODELOS DE EVALUACIÓN PSICOLÓGICA
I. INTRODUCCIÓN
Universidad de Granada.
104 Gualberto Buela-Casal y J. Carlos Sierra
posibilitar una imagen coherente. Sin embargo, las teorías no facilitan una coheren-
cia total y absoluta; tan sólo son interpretaciones provisionales del conocimiento
científico disponible hasta ese momento.
Para que una teoría sea científica debe cumplir varios requisitos:
De una manera más simple, Popper (1962) afirma que las teorías son redes que
lanzamos para explicar aquello que llamamos el mundo, para racionalizarlo, expli-
carlo y dominarlo, y tratando de que la malla sea cada vez más pequeña. Las teorías
se construyen a través de un proceso complejo de contrastación deductiva múlti-
ple. Una serie de contrastaciones deductivas proporcionará un conjunto de conoci-
mientos sobre algún campo de la experiencia; al relacionarse de forma unitaria y
coherente se constituirá la teoría. Este proceso supondrá especulación e intuición,
por lo que también deberá someterse a una contrastación deductiva. Para demos-
trar si una teoría es o no válida, este autor distingue cuatro procedimientos para la
contrastación deductiva de una teoría. En primer lugar se puede realizar una com-
paración lógica de sus conclusiones, con lo que se somete a contraste la coherencia
interna del sistema. El segundo procedimiento se refiere al análisis lógico de la teo-
ría, con el objeto de determinar su carácter, viendo si es una teoría empírica (cientí-
fica) o una tautología. El tercer procedimiento consiste en compararla con otras
teorías, lo cual tiene la finalidad de averiguar si la teoría examinada constituye un
avance científico en caso de que sobreviva a las contrastaciones. Y por último, pue-
de contrastarse por medio de la aplicación empírica de las conclusiones que de ella
se deducen. Es decir, se pretende descubrir hasta qué punto satisfarán las conse-
cuencias de la teoría a la práctica, ya sean experimentos puramente científicos o
aplicaciones tecnológicas.
El procedimiento deductivo que se sigue en la contrastación partiría de unos
enunciados previamente aceptados de los cuales se deducen ciertos enunciados sin-
gulares (que se pueden denominar predicciones), que sean susceptibles de contrasta-
ción. Entre estos enunciados se seleccionan los que no se deducen de la teoría vigen-
te y los que se encuentran en contradicción con ella. Posteriormente, se trata de
decidir sobre los enunciados deducidos, comparándolos con los resultados obten1-
dos de la aplicación práctica o de la experimentación. Si las predicciones resultan
aceptadas o verificadas, la teoría ha superado con éxito las contrastaciones. Pero si la
decisión es negativa, o sea, si las conclusiones han sido falsadas, se pone de manifies-
to que la teoría es también falsa. Es importante resaltar que una decisión positiva tan
sólo puede apoyar temporalmente la teoría examinada, puesto que una decisión ne-
gativa posterior puede rechazarla. En opinión de Popper (1962), durante el tiempo
106 Gualberto Buela-Casal y J. Carlos Sierra
en que una teoría resiste contrastaciones minuciosas y exigentes, y que no queda an-
ticuada por otra teoría en la evolución del progreso científico, podemos decir que ha
«demostrado su temple», o que está corroborada por la experiencia.
delos pueden dividirse en abstractos y materiales. Los primeros son los modelos
propiamente teóricos o matemáticos, que recogen un conjunto de hipótesis que se
supone relativamente completo del campo estudiado y cuya coherencia y posterior
desarrollo deductivo quedan garantizados por una codificación generalmente mate-
mática. En el segundo grupo distingue tres tipos:
c. Los axiomas han de ser suficientes para deducir todos los resultados perte-
necientes a la teoría que se trata de ax1omatizar.
d. Los axiomas no deben contener supuestos superfluos.
Por tanto, quiero dejar bien claro que, a mi parecer, el interés que tiene la explicación —esto
es, el descubrimiento de teorías explicativas— para el científico teórico es irreductible al inte-
rés tecnológico práctico de la deducción de predicciones. El teórico se interesa por las predic-
ciones, por otra parte, lo que es comprensible, pues está interesado en el problema de si sus
teorías son verdaderas o no; o dicho de otro modo, le interesa contrastar sus teorías, tratar de
averiguar si no se puede mostrar que sean falsas [Popper, 1962, p. 59].
IL6. Paradigmas
Este es otro concepto que frecuentemente se utiliza de forma inadecuada como sinó-
nimo de modelo o de teoría (Franks, 1991). Tal como señala Pérez-Álvarez (1985), la
mayoría de los autores alude al primer concepto de paradigma planteado por Kuhn
(1962), quien lo definía como un conjunto de suposiciones interrelacionadas respec-
to al mundo social que proporcionan un marco filosófico para el estudio organizado
de este mundo. En un sentido más amplio, un paradigma representa una “matriz dis-
ciplinaria” que abarca generalizaciones, supuestos, creencias y ejemplos, corriente-
mente compartidos, de lo que constituye el interés de la disciplina. Por tanto, un pa-
radigma sirve como guía a los profesionales de una disciplina, pues les ayuda a
identificar cuáles son las cuestiones importantes, les orienta hacia el desarrollo de un
esquema aclaratorio (teorías y modelos) que haga posible situar a estas cuestiones en
un marco que permita resolverlas, facilita establecer los criterios para el uso de la me-
todología adecuada (métodos, instrumentos, recogida de datos) y proporciona una
epistemología en la que las tareas precedentes pueden ser consideradas guías para la
realización del trabajo normal de la disciplina.
Como se puede apreciar en esta descripción de paradigma, este concepto es más
amplio y general que una teoría o un modelo. Tampoco sería acertado considerar al
paradigma como una gran teoría o un supermodelo, pues además de la amplitud o
extensión, existen otras diferencias. Piénsese que el modelo sirve para “representar”
y, por tanto, ayudar a interpretar un fenómeno o una teoría, mientras que el paradig-
ma es un concepto más filosófico que llega incluso a delimitar cuál debe ser el objeto
de estudio. La ambigiúedad del término paradigma llevó al mismo Kuhn a utilizarlo
de 22 formas distintas, algunas de ellas incluso excluyentes entre sí, tal como demos-
tró Masterman (1975). En este estudio se concluye que los distintos usos del término
paradigma pueden agruparse en tres categorías o nociones generales: paradigmas
metafísicos (que proporcionan principios de organización), paradigmas sociológi-
cos (que describen logros universalmente reconocidos) y paradigmas de constructos
(que describen herramientas e instrumentos metodológicos); este último parece ser
el uso más frecuente que hace Kuhn.
Tomando en consideración las críticas de Masterman (1975), Kuhn (1978) reco-
noce que ha utilizado el concepto de paradigma de manera multiforme y reformula
el concepto de “matriz disciplinar” y “ejemplar”. Dice que las matrices disciplinares
son todos aquellos elementos que nos permiten distinguir lo que se podría llamar
una comunidad científica y la convergencia de criterios, interpretaciones y métodos
que posibilitan un trabajo en común. El término matriz se refiere a un conjunto de
elementos ordenados de diversos tipos, mientras que disciplinar intenta representar
la puesta en común de los que practican una disciplina profesional. Así,los compo-
nentes principales de la matriz disciplinar abarcan modelos, generalizaciones simbó-
)
licas y generalizaciones ejjemplares. Los modelos son analogías con las que un grupo
unifica su idea de la realidad; las generalizaciones simbólicas se refieren a sistemas
110 Gualberto Buela-Casal y J. Carlos Sierra
para determinar patrones de covariación entre ellos con el fin de configurar síndro-
mes, y correlaciones entre indicadores y procesos internos. Las técnicas de evalua-
ción empleadas son múltiples, siendo las más importantes los procedimientos tipifi-
cados (entrevistas, cuestionarios o escalas). En los últimos años han surgido
diferentes entrevistas estructuradas relacionadas con las clasificaciones DSM; por
ejemplo, la Diagnostic Interview Schedule (DIS) de Robins y cols. (1981) o la Struc-
tured Clinical Interview for DSM-I11 (SCID) de Spitzer y Williams (1987). Esta aso-
ciación entre técnicas de evaluación y sistemas clasificatorios es consecuencia de la
importancia que tiene para este modelo el diagnóstico diferencial. :
Uno de los aspectos relevantes de los modelos de evaluación psicológica señala-
do por Fernández-Ballesteros (1992a) es el ámbito de aplicación y los objetivos
planteados. El objetivo primordial del modelo de enfermedad es el diagnóstico del
sujeto por medio de la descripción de síntomas y la clasificación, tal como hemos co-
mentado; este diagnóstico de carácter etiológico ayudará a conocer el pronóstico del
trastorno, lo que facilitará su predicción y tratamiento. Dentro de esta secuencia
diagnóstico-pronóstico-tratamiento, el psicólogo se vio relegado hasta hace poco
tiempo al primer paso de la secuencia, siendo un mero auxiliar del médico. Por últ:-
mo, el ámbito de este modelo ya va implícito en su rótulo, centrándose totalmente
en el contexto clínico.
En la actualidad, la defensa de un modelo radical de enfermedad cae por su pro-
pio peso; plantearse que la evaluación psicológica es similar a la evaluación médica
no tiene sentido actualmente. El modelo de enfermedad parece apropiado para ex-
plicar los trastornos del comportamiento que tienen su base en alteraciones neurofi-
siológicas y/o bioquímicas. Sin embargo, dicho modelo no debe aplicarse al resto de
los trastornos conductuales en los que no se ha demostrado ninguna base biológica o
determinante físico. Por otra parte, es un hecho bien conocido que las variables am-
bientales son capaces de producir modificaciones bioquímicas del organismo, lo cual
lleva a considerar que, aun suponiendo que se demostrara una alteración orgánica en
ciertos trastornos conductuales, ello no justificaría una intervención exclusivamente
médica. Según Carrobles (1989), el concepto de enfermedad ha variado de forma
considerable en la historia de la medicina y aún hoy su naturaleza es compleja, lo que
hace problemática la justificación de este modelo. Un déficit importante de este mo-
delo es la ausencia de un marco teórico adecuado, puesto que en vez de surgir del
desarrollo de alguna teoría parece haber emergido de una práctica profesional en un
contexto determinado. De hecho, otros modelos, como el psicodinámico e incluso
el conductual, asumen algunas de sus técnicas o planteamientos. Como consecuen-
cia de ello fue blanco de fuertes críticas, como por ejemplo realizar una argumenta-
ción circular, puesto que se da el nombre a determinadas manifestaciones de la con-
ducta, para posteriormente utilizar ese nombre como entidad explicativa o causal de
los síntomas que había utilizado para inferir dicha entidad. Otro problema es la utili-
zación de etiquetas diagnósticas para clasificar a los enfermos, aplicando así un trata-
miento estándar que se encuentra más en función de la etiqueta que del propio pa-
ciente (Ibáñez, 1980). Por último, se atribuye causalidad orgánica a la conducta y no
se considera otro tipo de variables conductuales, ambientales o cognitivas, así como
la interacción entre las distintas variables. Pero, sin duda, la crítica más seria que ha
recibido el diagnóstico psiquiátrico ha sido la falta de fiabilidad. Morey, Skinner y
Modelos de evaluación psicológica 113
Bloshfield (1986) revisaron los estudios realizados sobre fiabilidad del sistema de
clasificación psiquiátrica y categorizaron las distintas concepciones dadas al concep-
to de fiabilidad de la siguiente forma: consistencia temporal, consistencia de tasa de
diagnóstico en diferentes situaciones o lugares, heterogeneidad dentro de las catego-
rías diagnósticas y acuerdo entre evaluadores. Esta última categoría fue la más fre-
cuentemente estudiada y, como se sabe, hace referencia a que distintos evaluadores
deben llegar a las mismas conclusiones cuando evalúan un mismo caso. En la mayor
parte de los estudios realizados durante las décadas de los años sesenta y setenta se
encontró una fiabilidad muy baja en los sistemas de clasificación.
En los últimos años se superaron algunas de estas deficiencias, en especial la falta
de fiabilidad, como consecuencia de la mejora de instrumentos y sistemas de clasifi-
cación. De este modo, algunos elementos del modelo de enfermedad siguen vigentes
en la actualidad y son objeto de importantes debates. Por ejemplo, la necesidad de
una clasificación nosológica es tema de discusión entre los evaluadores conductua-
les; para algunos autores (Nelson, 1987; Hersen, 1988) no se trata simplemente de la
necesidad de utilizar un lenguaje común, sino del reconocimiento de la existencia de
covariaciones de respuestas dentro de los repertorios conductuales que merecen un
análisis más global. First y cols. (1992) consideran que la aproximación más global
del DSM-IV y la aproximación específica y atomista de la evaluación conductual están
interrelacionadas y se pueden beneficiar mutuamente tanto en la práctica como en la
investigación clínica. Para estos autores, el esfuerzo por desarrollar entrevistas y es-
calas en función de los constructos del DSM-IV es un indicador de estas relaciones.
En síntesis, el modelo de enfermedad como modelo de evaluación está claramen-
te superado; no obstante, algunas de sus aportaciones a la psicología clínica son to-
davía importantes; un ejemplo de ello es la aparición de disciplinas como la medicina
conductual o la psicología de la salud.
' Un ejemplo claro de ello es la obra de Bohm (1972), Vademécum del test de Rorschach.
114 Gualberto Buela-Casal y J. Carlos Sierra
pectos como las relaciones objetales, lo cual dará lugar a la aparición de nuevos tests
como el Pata negra o el Test de relaciones objetales (Ávila, 19924). ,
El modelo psicodinámico es un modelo organicista. Más concretamente podría
considerarse como una variante del modelo de enfermedad traumática. Se considera
que los factores intrapsíquicos (estructuras internas de la personalidad) constituyen
las causas subyacentes de la conducta manifiesta, y tienen lugar en lamente bajo la
forma de impulsos, deseos, motivos y conflictos. Por tanto, la formalización teórica
de este modelo sería C =f (O), la conducta en función del organismo, pero a diferen-
cia del modelo de enfermedad, “O” alude a un constructo intrapsíquico. Las expe-
riencias infantiles tienen una gran importancia para explicar la conducta posterior de
los individuos. Así, se interpretan los trastornos psicopatológicos en términos de es-
tancamiento en la evolución libidinal, como una regresión a las etapas del desarrollo
psicosexual y una fijación en la etapa no superada. La evaluación y el tratamiento
psíquico deben centrarse en la actividad psíquica que no es directamente observable.
En cuanto a las variables objeto de estudio, Ávila (1992a) establece tres: procesos
y contenidos inconscientes con el fin de comprender su dinámica, estructura psíqui-
ca del yo y de los recursos adaptativos y defensivos a su servicio y la accesibilidad del
sujeto al tratamiento psicoanalítico. Como se puede apreciar, el modelo psicodiná-
mico estudia la estructura de la personalidad desde una perspectiva molar. En este
modelo, al igual que en el de enfermedad, la conducta es considerada como signo;
así, las conductas manifiestas (actos fallidos, sueños o ejecución en técnicas proyecti-
vas) necesitan ser interpretadas simbólicamente para que puedan tener valor diag-
nóstico. Sin embargo, a diferencia del modelo de enfermedad, esta relación entre sig-
no y significado es mucho más distante, alcanzándose un mayor nivel de inferencia.
Las técnicas de evaluación enfatizan la libertad de respuesta, por lo que son fun-
damentalmente procedimientos no estructurados a través de los que se infieren da-
tos relativos a conflictos conscientes e inconscientes (Pervin, 1979). De este modo,
mediante la técnica tratan de verificar la teoría y ésta a través de la teoría, lo cual
constituye una tautología inadmisible dentro de la ciencia positiva (Fernández-
Ballesteros, 1992a). Las técnicas proyectivas se constituirán en buenos instrumentos
que facilitan la aparición de estas respuestas libres. En este contexto, la fiabilidad del
instrumento no tiene demasiado interés, pues no importa tanto que evalúe fielmente
un determinado factor, sino su capacidad para producir respuestas de interés para la
interpretación, es decir, que constituyan reactivos que evoquen respuestas de interés
para el psicoanalista (Ávila, 1992a).
El objetivo básico del modelo psicodinámico de evaluación es ayudar al cambio
terapéutico, confundiéndose la evaluación con el propio proceso de psicoanálisis.
Dentro de este modelo la predicción de la conducta no tiene sentido, pues una misma
entidad intrapsíquica puede provocar distintas formas de conducta manifiesta; lo má-
ximo que se podría hacer sería realizar una explicación a posteriori de la misma (Fer-
nández-Ballesteros, 19924). Tampoco interesa la clasificación nosológica (a pesar de
utilizar terminología psiquiátrica) ni la comparación interindividual (Ávila, 19924).
La crítica más importante que ha recibido el modelo psicodinámico, sin duda, ha
sido la de que no puede ser considerado como un conocimiento científico, dado que
es imposible poder contrastar los constructos que se postulan. La ambigiúedad con
que está formulado y su nivel de abstracción e imprecisión conceptual hacen IMPosi-
Modelos de evaluación psicológica 115
V. MODELO PSICOMÉTRICO
Los orígenes de este modelo se remontan a los clásicos trabajos de Galton, Binet y
Cattell, y el consiguiente interés por el estudio de las diferencias individuales; por
tanto, se trata de un modelo vinculado al desarrollo histórico de la psicometría y a
116 Gualberto Buela-Casal y J. Carlos Sierra
trabajos (Buela-Casal y Navarro, 1989; Eysenck, 1991). Supongamos que llega a es-
tablecerse por este procedimiento una validez del constructo inteligencia. En ese
caso el test sería totalmente válido para pronosticar, o sea, tendría validez empírica.
Como se puede deducir de este supuesto, el modelo utilizado sigue siendo el mismo;
lo que se ha mejorado es la teoría de base. : de
Las deficiencias propias del modelo psicométrico han sido principalmente meto-
dológicas, pues como ya es bien sabido, el uso de un solo coeficiente de correlación
(simple o múltiple) no es suficiente. Así, tenemos técnicas como el análisis de vías
(path analysis) que permite analizar la correlación de los componentes directos e in-
directos, demostrando que el coeficiente puede ser alto o bajo dependiendo de la in-
fluencia de otras variables; lo cual explica, además, la vieja convicción de que resulta
sumamente difícil interpretar en la práctica un único coeficiente de correlación. Sin
embargo, en los últimos años se ha producido un gran avance metodológico en el
modelo psicométrico, desde revisiones conceptuales sobre la validez hasta la incor-
poración de sofisticadas técnicas de análisis que, sin duda, han contribuido al relan-
zamiento del modelo psicométrico (Yela, 1990). Los análisis multivariados, el de-
sarrollo de la teoría de la respuesta al ítem, el renovado interés por el estudio de la
personalidad a través de los cinco factores básicos, la reciente aparición de nuevas
versiones del WISC, WAIS y MMPI, etc., hacen que el modelo psicométrico muestre un
importante auge en la actualidad.
Los orígenes del modelo conductual pueden situarse en los trabajos de Pavlov sobre
el condicionamiento clásico, de Watson sobre el conductismo, de Thorndike sobre
el aprendizaje y de Skinner sobre el condicionamiento operante; no obstante, los an-
tecedentes de la evaluación conductual propiamente dicha habría que situarlos en la
publicación de Kanfer y Saslow (1965) Behavioral analysis. A diferencia de otros
modelos, el conductual contó con distintas variantes desde sus inicios y, posterior-
mente, en su desarrollo se le fueron añadiendo algunas más (Carrobles, 1985). Sin
embargo, en opinión de Kazdin (1991), estas diferencias fueron minimizadas con el
propósito de desarrollar un movimiento relativamente unificado que se opusiese al
modelo tradicional de enfermedad sobre la conducta anormal. Según este autor, la
diversidad se ha incrementado en estos últimos años. De esta misma opinión es
Franks (1991), quien considera que dentro de este modelo se encuadran concepcio-
nes aparentemente bastante distintas, que sólo pueden ser entendidas en el contexto
de su desarrollo histórico. Así, se puede distinguir entre el conductista metodológi-
co y el conductista metafísico o radical. El primero considera que la conducta puede
investigarse sin un examen directo de los estados mentales, aceptándose éstos de for-
ma inferencial. La investigación y la consistencia teórica se basan en variables media-
cionales, para lo cual se utiliza el método hipotético deductivo. Por tanto, «es perfec-
tamente posible ser un conductista metodológico y apoyar conceptos tales como el
libre albedrío, el autocontrol, la cognición y el darse cuenta» (Franks, 1991, p. 15) .
Modelos de evaluación psicológica 119
Sin embargo, el conductista metafísico o radical no acepta los estados mentales como
proposiciones útiles; en consecuencia, es antimentalista y defiende la comprobación
formal de las hipótesis.
Según Cone (1986, 1988), en la actualidad no es posible dar una definición de
evaluación conductual que sea compartida por la mayoría de los autores. El análisis
de los libros más representativos de la denominada etapa de consolidación de la eva-
luación conductual pone de manifiesto una gran diversidad de conceptualizaciones.
Este autor realiza un detallado estudio de éstas según cinco características: objeto de
la materia (rasgos o conducta), enfoque de la evaluación (idiográfico o nomotético),
método (inductivo o deductivo), fuente primaria de variabilidad (intraindividual o
interindividual) y énfasis ambiental (interactivo o no interactivo). A partir de este
análisis obtiene 32 modelos diferentes de evaluación conductual, por lo que conclu-
ye que debemos reconocer la naturaleza pluralista de la evaluación conductual. Sin
embargo, en opinión de Silva y Martorell (1991), la expresión evaluación conductual
debe ser entendida, en la actualidad, en su sentido más amplio, considerándose como
un marco conceptual en el que se incluyen los distintos enfoques de evaluación de la
psicología conductual. En nuestra opinión, una visión globalizadora de la evalua-
ción conductual presenta las ventajas de una unificación teórica, pero ésta, en reali-
dad, no representa la práctica profesional, pues los distintos autores siguen practi-
cando la evaluación según un modelo en concreto. Por ello, dicha unificación debe
ser entendida en el plano teórico, apoyándose en lo que hay en común entre los dis-
tintos modelos, tal como lo plantea Barrios (1988) cuando alude a los propósitos,
precisión y utilidad de la evaluación.
A continuación presentamos de forma resumida los modelos más representati-
vos de lo que se entiende, en la actualidad, por psicología conductual: el modelo del
condicionamiento clásico, el modelo del condicionamiento operante, el modelo
del aprendizaje social, dos que podrían considerarse como innovadores —aunque el
primero de ellos es ya clásico— (modelo interconductual y modelo de interaccionis-
mo evolutivo) y un modelo integrador (modelo conductual integrado).
El punto de partida se sitúa en un modelo básico formalizado por E-R (relación
entre estímulos y respuestas) que sintetiza los planteamientos del condicionamiento
clásico e instrumental. El objeto de la evaluación serán las respuestas motoras y los
estímulos físicos relevantes que supuestamente las controlan. El enfoque mediacio-
nal E-R consiste fundamentalmente en la aplicación de procesos de aprendizaje, en-
fatizando la relación entre estímulos y respuestas. Este modelo se desarrollará desde
el análisis aplicado de la conducta dando lugar a la formulación E-R-C (Estímulos
antecedentes-Respuestas-Consecuencias). Este modelo se caracteriza por plantear el
análisis exclusivamente en función de las variables situacionales. La evaluación y la
intervención se consideran inseparables. Las variables organísmicas no se conside-
ran objeto de estudio de la psicología, aunque no se niega su existencia. Para los de-
fensores de este enfoque, la conducta no está determinada por las variables cognit1-
vas, sino que es la propia conducta la que produce los procesos cognitivos. El
objetivo principal es construir una ciencia de la conducta, por lo que se pone especial
énfasis en los aspectos metodológicos. Tan sólo se acepta como objeto de estudio la
conducta externa, la cual se aborda con diseños de caso único, con la finalidad de es-
tablecer relaciones empíricas y meramente descriptivas entre la conducta y el am-
120 Gualberto Buela-Casal y J. Carlos Sierra
biente. Este modelo experimentará una mayor especificación por parte de Lindsley
(1964) al reformularlo como E-R-K-CG; en este caso, además de los estímulos antece-
dentes, la respuesta y las consecuencias ambientales, se introduce una relación de
contingencia entre la respuesta y sus consecuencias ambientales. mn
En la década de los años setenta se produce un paso importante en la evolución
de estos modelos con la introducción de otro elemento, el organismo (O). Kanfer y
Phillips (1970) plantean el modelo E-O-R-K-C y Goldfried y Sprafkin (1974) el
E-O-R-C; mientras para los primeros autores el nuevo elemento aludía exclusivamen-
te a aspectos biológicos, para los segundos estos elementos biologicistas se combina-
ban con variables cognitivas. Además, estos dos modelos, a diferencia del E-R=-K-C,
asumen que los antecedentes y las consecuencias pueden ser ambientales (como en el
caso anterior) o tener un carácter intrapsíquico. En esta misma década, Bandura
(1978) propone un determinismo recíproco entre ambiente, conducta y procesos
cognitivos (éstos se refieren a la percepción, la regulación y la valoración de la con-
ducta), dando gran importancia a los conceptos de autocontrol y autoeficacia. En su
formalización más reciente, el modelo del aprendizaje social es interaccionista, inter-
disciplinario y multimodal. Franks (1991) señala que mientras los conductistas radi-
cales tienden a rebajar el papel de las cogniciones y los terapeutas cognitivos a mini-
mizar la importancia de la ejecución, los teóricos del aprendizaje social incluyen a las
dos (cognición y ejecución); por otra parte, mientras que el modelo del condiciona-
miento operante da importancia a las contingencias de reforzamiento y el modelo
del condicionamiento clásico se centra casi exclusivamente en los acontecimientos
estimulares externos, el modelo del aprendizaje social toma en cuenta ambas situa-
ciones, utilizando los conceptos derivados de la autoeficacia y del modelado para es-
tablecer las relaciones necesarias.
Del planteamiento crítico de Kantor (1959) al análisis experimental de la con-
ducta surge el modelo interconductual. En opinión de Franks (1991), este modelo
fue olvidado o incomprendido, durante muchos años, debido a la prematura insis-
tencia de que la psicología conductual debe ser tan científica como las ciencias físi-
cas. Kantor planteó una teoría conductual de campo que está integrada por los si-
guientes componentes: organismo, funciones de respuesta, funciones de estímulo,
eventos disposicionales y la historia interconductual. En el organismo distingue tres
niveles de interrelación:
En el ambiente distingue entre las formas del estímulo, que se refiere a la estruc-
tura física del estímulo, y las funciones del estímulo, que indican la actividad de las
formas del estímulo en su relación funcional con las respuestas dentro del campo
conductual. Los eventos disposicionales hacen referencia al contexto de interacción
que puede facilitar o dificultar las conductas subsiguientes. Estas tres formas o nive-
Modelos de evaluación psicológica 121
2 Este modelo ha ido cambiando de denominación con el transcurso de los años. Así, empieza a de-
sarrollarse en la década de los años setenta por Staats bajo el nombre de conductismo social; en la década
de los años ochenta, con el fin de no confundirlo con la teoría del aprendizaje social de Bandura, pasó a
denominarse conductismo paradigmático; recientemente, Tryon (1990) en un afán integrador lo llamó
conductismo psicológico.
122 Gualberto Buela-Casal y J. Carlos Sierra
a ABE O, O
[do]
=>3
Pri
Un aspecto relevante del modelo son los repertorios básicos de conducta que se-
rían patrones complejos de respuestas aprendidos mediante un proceso acumulati-
vo-jerárquico, que podrían ser tanto variables dependientes (los RBC son determi-
nados por el ambiente y las condiciones biológicas iniciales) como variables
independientes (los RBC determinan parcialmente la conducta). Estos repertorios
básicos de conducta manifiestan unas diferencias importantes con respecto a la con-
ducta; Fernández-Ballesteros (19944) señala en primer lugar que los RBC son gene-
ralizables a través del tiempo y de las situaciones, mientras que C manifiesta especifi-
cidad temporal y situacional; en segundo lugar, los RBC son constelaciones de
conductas por lo que los instrumentos para evaluarlos son conjuntos de conductas
expresados en los ítems de un test, mientras que C es considerada molecularmente
según una definición operativa basada en su ocurrencia, frecuencia, duración, etc.; y,
en tercer lugar, C constituye la variable dependiente y los RBC las variables inde-
pendientes. Según este modelo, la evaluación conductual debería centrarse tanto en
aspectos conductuales o sincrónicos (lo que hacían los modelos previos) como en as-
pectos históricos o diacrónicos que constituyen la base de los repertorios básicos de
conducta, los que por su condición de variable independiente, sin duda tienen que
ser tomados en cuenta.
En definitiva, si por algo se ha caracterizado el modelo conductual ha sido por su
constante evolución; al modelo básico E-R se han añadido variables organísmicas,
éstas (e incluso el propio ambiente) se han convertido en constructos cognitivos, y,
por último, se ha intentado realizar una integración mediante el conductismo para-
digmático. Después de este desarrollo evolutivo del modelo conductual y teniendo
en cuenta el esquema que hemos seguido para los anteriores modelos vamos a anali-
zar su objeto de estudio, su metodología básica y sus ámbitos de aplicación.
Dejando a un lado los diferentes matices expuestos con anterioridad, las tres va-
riables objeto de estudio del modelo conductual son la conducta, el ambiente y el or-
ganismo. Sin duda el foco de interés ha estado en la conducta y en la forma de opera-
tivizarla, pues ello marca los propios límites del modelo conductual. La propuesta
de Lang (1968) de la triple modalidad de respuesta (motora, psicofisiológica y cogni-
tiva) ha permitido operativizar la conducta y, a pesar de las críticas recibidas por no
ser modalidades mutuamente excluyentes, por no proceder de sistemas biológicos
claramente diferentes (Evans, 1986) o la falta de interrelación entre los tres niveles
(Sierra y cols., 1993), constituye una de las características esenciales de la evaluación
conductual (Haynes, 1992). En cuanto al elemento cognitivo, éste no tiene por qué ir
en contra del modelo conductual, siempre y cuando sea considerado como variable
dependiente, y no como explicativa de otras respuestas. Por su parte, el ambiente
Modelos de evaluación psicológica 123
Las razones argumentadas para dudar de la inclusión del modelo cognitivo dentro
de la evaluación psicológica pueden extrapolarse a la hora de hablar del modelo hu-
manista. Ávila (1992b) señala como pilares de este modelo la psicología individual de
Adler, las formulaciones guestálticas que postulan una concepción totalista de la
conducta, los constructos personales de Kelly y las obras de Rogers y Maslow cen-
tradas en la autorrealización y crecimiento personal.
Según este modelo, la conducta del sujeto está determinada por su percepción
del mundo. Por tanto, la subjetividad y la introspección se convertirán en elementos
centrales. Sólo se podrá comprender realmente a una persona cuando nos situemos
en su lugar para percibir el mundo desde ella misma (Carrobles, 1989). Una limita-
ción que plantea el modelo es una insuficiente formulación de un concepto de con-
ducta, limitándose a describirla sin intentar identificar las causas funcionales de la
misma. En principio, el objeto de estudio planteado es la personalidad como algo
global, por lo que no se haría énfasis en variables aisladas; sin embargo, según Ávila
(1992b) podrían señalarse como objetos de estudio la autopercepción, el autocon-
cepto, la percepción de los otros y del ambiente, las estrategias personales de solu-
ción de problemas, la tendencia a la autorrealización, etc. Pero sin duda ninguna, la
mayor limitación de este modelo es que sus postulados y conceptos no son científi-
cos, constituyendo simples y vagas descripciones de las que resulta difícil generar hi-
pótesis verificables (Carrobles, 1989).
Aunque parece inherente al modelo el uso de la introspección, se utiliza la obser-
vación y la autoobservación (Ávila, 1992b), aunque puesta en marcha a través de la
entrevista como marco de relación (Forns y cols., 1991). Las técnicas subjetivas,
como la técnica de rejilla de Kelly para la evaluación de los constructos personales o
la técnica Q de Stephenson son propias de este modelo. Asimismo, el análisis de
contenido aplicado a las técnicas psicobiográficas y las narraciones personales tienen
cabida dentro de este enfoque. El ámbito de aplicación por excelencia del modelo
humanista es el clínico, proponiendo una visión unitaria y molar de la personalidad
frente a posturas moleculares.
Modelos de evaluación psicológica 127
COGNITIVO-CONDUCTUAL CONSTRUCTIVISMO
xKá— MMMM
—El objetivo son unidades aisladas del — El objetivo son sistemas de creencias,
pensamiento, aurorreferencias, creen- narraciones personales, etc.
Clas, etc.
— El tipo de cognición estudiado son las — El tipo de cognición estudiado son las
proposiciones; por ejemplo, «soy des- distinciones fundamentales o construc-
preciable». tos bipolares.
— Los instrumentos de evaluación son es- — Los instrumentos de evaluación son me-
tructurados y estandarizados. nos estructurados.
teoreticistas al modo freudiano». Otro hándicap importante es que dentro del pro-
pio paradigma coexisten teorías muy diversas, lo que nos coloca en la duda de si en el
futuro se producirá una integración o una escisión. Por último, de cara a una solidez
del paradigma, se necesitan operativizar (o al menos especificar mejor) aspectos tan
relevantes dentro del paradigma como, por ejemplo, el desarrollo evolutivo de los
constructos personales, cómo afectan las primeras experiencias, cómo se modifican,
ué papel juega el ambiente físico o social, etc. Entre los elementos positivos, Pérez-
Álvarez (1995) señala el énfasis que hace en el carácter proactivo y reconstructivo, lo
cual podría ser de interés en la relación terapeuta-paciente. En el caso concreto de la
130 Gualberto Buela-Casal y J. Carlos Sierra
X. CONFLUENCIA DE MODELOS
a. Adoptar una postura ecléctica, es decir, utilizar cualquier técnica que pueda
ser útil en la práctica, independientemente del modelo teórico de partida.
b. Adoptar una postura integradora como, por ejemplo, la aplicación de los
principios psicométricos al modelo conductual (Silva, 1989; Silva y Marto-
rell, 1991).
Dentro del paradigma constructivista el enfoque idiográfico alcanza su máxima expresión, puesto
que cada evaluación-reconstrucción tiene lugar en un acto interactivo evaluador-evaluado irrepetible.
Modelos de evaluación psicológica 131
— Las respuestas son signos o indicado- —Las respuestas son muestras de con-
res de características subyacentes. ducta.
— Menor costo para el evaluador y para el — Mayor costo para el evaluador y para el
evaluado. evaluado.
x1. Eclecticismo
tiene prácticamente en los mismos términos. Este autor plantea que si bien un cientí-
fico no puede permitirse el lujo de ser ecléctico, el clínico no puede permitirse ellujo
de no serlo; es decir, mientras que el eclecticismo teórico es lógicamente imposible, y
en esto coincide la totalidad de los científicos, el eclecticismo técnico se justifica ar-
gumentando que cualquier técnica que resulte útil será bienvenida en la terapia. Esta
postura es realmente peligrosa, puesto que en muchas ocasiones la selección de la
técnica es consecuencia de la atracción subjetiva, vivencia o creatividad del terapeuta
sin que haya ninguna base conceptual (Feixas, 1994). Franks (1991) critica estos ar-
gumentos por incurrir en una clara contradicción. Este autor defiende que la investi-
gación sistemática es la estrategia ideal tanto para la investigación como para la prác-
tica; por tanto, la información más útil y eficaz en la práctica es aquella que se va
acumulando de forma consistente dentro de un enfoque teórico. Por otra parte, dada
la gran cantidad de técnicas disponibles sería sensato inclinarse por aquellas que tie-
nen un fuerte respaldo en la investigación realizada en el marco teórico con el que se
identifica el clínico. Según esta perspectiva, es menos eficaz practicar el eclecticismo
técnico, ya que para saber qué es lo que funciona son necesarios estudios de valida-
ción. De manera similar opina Wolpe (1989) cuando acusa de eclecticismo amorfo a
la práctica de muchos clínicos actuales que han abandonado el modelo del condicio-
namiento, pasándose a otros modelos en los que no han obtenido mejores resulta-
dos; defiende la terapia conductual clásica y el modelo del condicionamiento y hace
duras críticas a la terapia conductual surgida a partir de la denominada revolución
cognitiva.
En la actualidad, autores como Kazdin (1991) y Franks (1991) consideran que
los psicólogos conductuales ya no son tan intolerantes con otros modelos como el
psicodinámico, e incluso en algunos sectores se está produciendo un acercamiento,
tanto en el ámbito clínico como en el teórico, con vistas a la búsqueda de perspecti-
vas integradoras. Algunas encuestas realizadas ponen de manifiesto la existencia de
este tipo de posturas, sobre todo en Estados Unidos. En una encuesta efectuada en-
tre los miembros de la Association for Advancement of Behavior Therapy (AABT) se
encontró que los instrumentos propios de la evaluación tradicional eran utilizados
de forma asidua por los terapeutas de conducta; así, un 70% aplicaba el MMPI y un
34% el Rorschach (Piotrowski y Keller, 1984). Datos similares se registraron en otra
encuesta realizada a los miembros de la división de psicología clínica de la American
Psychological Association (APA), de los cuales un 29% se autodefinía como eclécti-
cos, siendo esta orientación la más importante en el año 1986 (Norcross, Prochaska
y Gallagher, 1989). En Alemania, el porcentaje de eclécticos llegaba al 74% (Ávila,
1989); en un estudio más reciente, Schorr (1993) pone de manifiesto el empleo que
los terapeutas de conducta alemanes hacen de las técnicas proyectivas. No obstante,
estos datos deben ser tomados con cierta cautela pues, tal como considera Feixas
(1994), la etiqueta de ecléctico puede entenderse más por lo que no es (no adhesión a
ningún modelo concreto) que por lo que es. En un análisis reciente de los programas
de doctorado acreditados por la APA realizado por Piotrowski y Zalewski (1993), se
halla que en la formación se combinan técnicas psicométricas, proyectivas y conduc-
tuales. El caso de España, tal como apuntan Buela-Casal, Sierra y Carrobles (1995)
basándose en diferentes encuestas realizadas (Andrés y Ferrezuelo, 1984; Ferrezue-
lo, 1985; Camarero y Ferrezuelo, 1988), dista bastante del de Estados Unidos, sien-
Modelos de evaluación psicológica 133
mi posición en este debate es clara: los dos son básicamente irreconciliables a niveles concep-
tuales y teóricos, y la integración a nivel de la práctica clínica plantea numerosos problemas
[...]. Los terapeutas de conducta y los psicoanalistas se basan en paradigmas distintos, entien-
den y formulan los problemas psicológicos de manera diferente, confían en métodos diferen-
tes de verificación y aceptan hechos distintos como datos legítimos [...]. Desde mi punto de
vista, una solución, al menos en un futuro cercano, sería que cada sistema fuese a su avío, con
la esperanza de desarrollar una teoría y una práctica más viables dentro de su propio sistema.
Entre las distintas razones que se han formulado en contra del eclecticismo po-
demos señalar que el eclecticismo incrementa el distanciamiento entre la teoría y la
práctica, siendo un indicador de debilidad teórica y falta de rigor metodológico.
Además, en la postura ecléctica se intenta minimizar las diferencias entre los distin-
tos enfoques y, aunque es cierto que hay aspectos comunes, también lo es que hay
distinciones importantes. De forma similar opina Ardila (1990, p. 103) al señalar que
es un hecho que en los distintos sistemas psicológicos hay muchas cosas que rescatar. Y es un
hecho que no todos los marcos conceptuales pueden ser correctos ni válidos porque se basan
en diferentes filosofías y en distintas maneras de mirar el mundo. Si alguien trata de hacer una
síntesis ecléctica de las teorías de la psicología de hoy el resultado sería imposible de manejar,
estaría lleno de contradicciones y carecería de una columna vertebral. Carecería completa-
mente de validez.
x.2. Integración
Otra opción ante la diversidad de enfoques es intentar una integración, lo cual hasta
cierto punto es lógico y factible, tal como hemos visto en los modelos integradores
de la evaluación conductual. No obstante, cuando se trata de modelos considerable-
mente distintos en su fundamentación teórica, como ocurre por ejemplo con el mo-
delo conductual y el psicométrico, la integración resulta sumamente compleja. La
integración no consiste en hacer desaparecer la pluralidad para reafirmar un único
modelo, sino partir de la diversidad y aprovechar las diferencias de las perspectivas
(Feixas, 1994). Se trataría de buscar aspectos comunes, unificando las partes para
crear algo nuevo, siendo este algo más que la suma de las partes, con lo cual se dife-
renciaría del eclecticismo que busca las diferencias, representa la suma de las partes y
aplica lo existente (Caro, 1995). Una integración para que sea válida y efectiva debe
realizarse a tres niveles diferentes: epistemológico, metodológico y aplicado. En pri-
mer lugar habría que analizar si los tipos de conocimientos que se obtienen con am-
bos modelos están en un mismo nivel y por tanto si es factible la integración. Por
134 Gualberto Buela-Casal y J. Carlos Sierra
ya es hora de que los evaluadores conductuales adopten un paradigma más adecuado a su ob-
jeto de estudio, la conducta, y de que rechacen conceptos que pertenecen a un paradigma ra-
dicalmente distinto y desarrollado para un objeto de estudio completamente diferente [...]
tampoco sería sorprendente contemplar el surgimiento de un movimiento separatista en la
evaluación conductual, y que los evaluadores conductistas radicales formaran su propia disci-
plina o subdisciplina.
evaluación conductual hace muy difícil tratar con aspectos psicométricos concisos;
desde entonces mantiene esta postura, si cabe aún más radical, manifestando la im-
posibilidad de ver la conducta con “gafas psicométricas”. Asimismo, L. E. Bleutler
(comunicación personal, 15 de agosto de 1995) señala que tal integración está muy
pobremente formulada y que es difícil llevarla a la práctica. De la misma opinión es
5. C. Hayes (comunicación personal, 25 de septiembre de 1995), para quien el mode-
lo conductual podría integrar aspectos psicométricos, pero el problema es que los
resultados encontrados son negativos, pues para el modelo psicométrico la fiabilidad
y la validez están por encima de la utilidad. Este autor llega incluso a poner en duda
la importancia de los aspectos psicométricos, puesto que el relevante papel que han
tenido durante cincuenta años no ha servido para mejorar la actual evaluación psico-
lógica. Por su parte, K. R. Murphy (comunicación personal, 4 de septiembre de
1995) considera que una posible integración sólo tendría sentido en algunos contex-
tos y ante algunos objetivos, pues los fines de ambos modelos son diferentes.
La situación actual es que sigue promoviéndose un intento de integración, que
parece ser bien aceptado por autores del modelo psicométrico. Un buen ejemplo es
Anastasi (1985) al plantear la necesidad de contextualizar la medición y su intento de
definir el rasgo según una perspectiva conductual. Mientras que la oposición a la in-
tegración está representada por autores conductuales. Es importante resaltar que la
expresión evaluación conductual representa en realidad distintos modelos de evalua-
ción, tal como hemos visto anteriormente, por lo que sería necesario analizar si to-
dos los modelos son integrables. A. W. Staats (comunicación personal, 15 de sep-
tiembre de 1995) habla de una tercera generación del conductismo con las
características conceptuales, metodológicas y empíricas que proporcionan la base de
la unificación psicométrico-conductual; como ejemplo de ello pone el conductismo
paradigmático. Por su parte, A. E. Kazdin (comunicación personal, 17 de agosto de
1995) considera que ambos enfoques son diferentes, pero que pueden ser integrados
hasta el punto de que cualquier medida puede satisfacer los requerimientos plantea-
dos por la evaluación. Asimismo, la postura de Haynes y WaiAlae (1994) parece ser
realista al considerar que la naturaleza funcional de la evaluación conductual fomen-
ta el uso de variables mínimamente inferenciales, pero en el caso de las variables mo-
leculares son importantes las dimensiones psicométricas de exactitud, validez y fia-
bilidad. Por su parte, L. Almeida (comunicación personal, 24 de septiembre de 1995)
señala que la integración de ambos modelos es algo muy deseable de cara a la investi-
gación y la práctica clínica porque permite el análisis de un mayor número de varia-
bles (tanto internas como externas). En resumen, aunque a nivel conceptual y meto-
dológico la integración parece difícil o al menos polémica, en la práctica
Por último, habría que matizar una cuestión planteada por Carbonell, Carpinte-
ro y Silva (1988) quienes después de realizar un estudio sobre la situación actual y
136 Gualberto Buela-Casal y J. Carlos Sierra
x3. Interdisciplinariedad
Una tercera opción ante la diversidad de enfoques sería la interdisciplinariedad, la
cual puede definirse como la convergencia de dos o más disciplinas científicas para el
conocimiento de un objeto común. Según Monserrat (1984), en la actualidad se pue-
de plantear con toda seguridad que no está justificado hablar de disciplinas científi-
cas autónomas, puesto que todas tienen un cierto grado de interdependencia; la in-
terdisciplinariedad va borrando de forma progresiva las barreras de las ciencias. Con
la interdisciplinariedad se trata de hacer compatibles la especialización inherente al
actual conocimiento científico con la complejidad de los fenómenos empíricos que
son abordados por la ciencia. Debemos comenzar distinguiendo dos términos que
en muchas ocasiones se utilizan como sinónimos, cuando en realidad se refieren a
dos conceptos distintos. Nos referimos a “multidisciplinar” e “interdisciplinar”. El
primero se refiere a la yuxtaposición o sumación de diversos estudios, con diversos
enfoques, en torno a un tema común. Los datos son obtenidos de forma indepen-
diente por cada uno de los enfoques, sin que las teorías y los métodos de ninguna de
las disciplinas se modifiquen por la influencia de las otras disciplinas que intervienen
en el estudio. El segundo concepto implica que la explicación y el análisis de los su-
puestos básicos y las teorías de una determinada disciplina son estudiados utilizando
los modelos, las teorías y los métodos de otras disciplinas. Esto permite comprender
muchos planteamientos que a primera vista pueden parecer lógicos, pero que resul-
tan sumamente complejos o, por el contrario, encontrar sencillas explicaciones a
problemas aparentemente complejos. Sin embargo, como señala Gyarmat1 (1990), lo
interdisciplinar no debe entenderse como una simple mezcla de dos o más discipli-
nas, o el traspaso de los principios y métodos de unas a otras, sino que debe ser una
síntesis armónica. Con el enfoque interdisciplinar se perfecciona cada una de las dis-
ciplinas implicadas, al mismo tiempo que se aumenta su capacidad para interaccio-
nar y colaborar con otras disciplinas.
La interdisciplinariedad ha nacido como una necesidad promovida por el avance
científico. Al principio cada disciplina era capaz de abordar su objeto de estudio, tra-
tando los problemas de una forma acotada, pero el avance del conocimiento implica
una perspectiva cada vez más amplia y, con ello, aparece la necesidad de utilizar da-
138 Gualberto Buela-Casal y J. Carlos Sierra
la evaluación psicológica aparece como un campo donde los autores se centran en parcelas es-
pecíficas, biendeaplicación (clínica, educativa, organizacional, neuropsicológica, suicidio...),
bien de conocimiento (técnicas concretas, psicopatología, personalidad, inteligencia...). Esto
aún resulta más claro si observamos que la mayor parte de las restantes contestaciones se ubi-
can en un ámbito específico para generalizar después, en su caso, al conjunto de la evaluación
psicológica.
REFERENCIAS BIBLIOGRÁFICAS
Álvarez-Castro, S., Buela-Casal, G. y Sierra, J. C. (1994). Situación actual del modelo con-
ductual en España. Psicología Contemporánea, 1, 80-91.
Anastasi, A. (1985). Mental measurement: Some emerging trends. En J. Mitchell (dir.), The
ninth mental measurements yearbook (vol. 1). Nebraska. The University of Nebraska
Press.
Andrés, V. y Ferrezuelo, P. (1984). Los centros madrileños de psicología clínica. Papeles del
Colegio. Psicólogos, 13, 3-26.
Ardila, R. (1988). Síntesis experimental del comportamiento. Madrid. Alhambra.
Ardila, R. (1990). ¿Qué es la síntesis experimental del comportamiento? Anuario de Psicolo-
gía, 4, 101-107.
Aronow, E., Reznikoff, M. y Moreland, K. L. (1995). The Rorschach: Projective technique
or psychometric test? Journal of Personality Assessment, 64, 213-228.
Ávila, A. (1989). La psicología clínica en España: perspectiva de una década. Papeles del Psi-
_ cólogo, 36/37, 84-89.
Ávila, A. (19924). Aproximación a perspectivas y modelos de la evaluación psicológica en la
clínica contemporánea. En A. Ávila y C. Rodríguez (dirs.), Psicodiagnóstico clínico. Ma-
drid. Eudema.
Ávila, A. (1992b). La psicología clínica: aproximación histórica y principales cuestiones teó-
rico-conceptuales. En A. Ávila (dir.), Evaluación en psicología clínica I: proceso, método y
estrategias psicométricas. Salamanca. Amarú.
Ávila, A., Blanco, A., Calonge, 1., Forns, M., Oliva, M., Martorell, M. C., Rodríguez, C., Sil-
ya, F. y Torres, M. (1994). El diagnóstico y la evaluación psicológica en España: revisión y
perspectivas. Clínica y Salud, 5, 83-120.
Badiou, A. (1972). El concepto de modelo. Buenos Aires. Siglo XXI.
Bandura, A. (1978). The self-system in reciprocal determinism. American Psychologtst, 33,
344-358.
140 Gualberto Buela-Casal y J. Carlos Sierra
Rodríguez, C. (1990). Situación actual del test del Rorschach. Anuario de Psicología, 45, 88-
5)9
Salmerón, A. (1985). ¿Qué es y para qué sirve la epistemología? En M. Bunge (dir.), Episte-
mología. Barcelona. Ariel.
Schorr, A. (1993). Projective testing in behavior therapy. Exropean Journal of Psychological
Assessment, 9, 213-221.
Segal, Z. W. y Shaw, B. F. (1988). Cognitive assessment: Issues and methods. En K. S. Dob-
son (dir.), Handbook of cognitive-behavioral therapies. Nueva York. Guilford Press.
Sierra, J. C., Álvarez-Castro, S. y Buela-Casal, G. (1994). Situación actual del psicoanálisis en
España. Revista Latinoamericana de Psicología, 26, 189-203. A
Sierra, J. C., Fernández-Guardiola, A., Luna-Villegas, G. y Buela-Casal, G. (1993). Relación
entre diversos indicadores de activación (tiempo de reacción, estimación del tiempo, tasa
cardíaca y activación autoinformada) en una situación control y bajo los efectos del diace-
pam. Vigilia-Sueño, 4, 15-21.
Sierra, J. C. y Freixa i Baqué, E. (1993). Estudio preliminar de la evolución de la imagen de la
psicología en estudiantes españoles de esta carrera. Psicothema, 5, 67-82.
Sierra, J. C., Pál-Hegediis, C., Álvarez-Castro, S. y Freixa i Baqué, E. (1995). Imagen de la
psicología en estudiantes universitarios de España y Costa Rica. Psicología Contemporá-
nea, 2,60-69.
Silva, F. (1988). La evaluación psicológica como proceso. Evaluación Psicológica/Psychologi-
cal Assessment, 4, 31-50.
Silva, F. (1989). Evaluación conductual y criterios psicométricos. Madrid. Pirámide.
Silva, F. y Martorell, M. C. (1991). Evaluación conductual y evaluación tradicional: la cues-
tión psicométrica. En V. E. Caballo (dir.), Manual de técnicas de terapia y modificación de
conducta. Madrid. Siglo XXI.
Spitzer, R. L. y Williams, J. B. (1987). Structured Clinical Interview for DSM-111-R-Outpa-
tient version (SCID-OP, 1/4/87). Nueva York. New York Psychiatric Institut.
Staats, A. W. (1963). Complex human behavior. Nueva York. Wiley.
Staats, A. W. (1975). Social behaviorism. Nueva York. Wiley.
Taylor, H. G. (1988). Learning disabilities. En E. J. Mash y L. G. Terdal (dirs.), Behavioral
assessment of childhood disorders (2.2 ed.). Nueva York. Guilford Press.
Tryon, W. W. (1990). Why paradigmatic behaviorism should be entitled psychological beha-
viorism? The Behavior Therapist, 13, 127-128.
Viney, L. L. (1993). Listening to what my clients and 1 say: Content analysis categories and
scales. En G. J. Neimeyer (dir.), Constructivist assessment. A casebook. Londres. Sage.
Weiner, I. B. (1972). Does psychodiagnosis have a future. Journal of Personality Assessment,
36, 534-546.
Wolpe, J. (1989). The derailment of behavior theraphy: A tale of conceptual misdirection.
Journal of Behavior Therapy and Experimental Psychiatry, 20, 3-15.
Yela, so (1990). Evaluar qué y para qué. El problema del criterio. Papeles del Psicólogo,
46/47, 50-54.
LECTURAS COMPLEMENTARIAS
SUIa
: Ed
ea
E
2404
PÚ Di dis
_..
Silva,E- TP La ió hp co A
brersrenas, €, 1130
PE ut " TMIánci POT
' : . APORTA, Es alerian coneiurt alió
k Hatloíde.: Maita idetdt le ed
1
ás ci Ed d o
cal Insecta for Par da -R-Oiipa
= Paytú ar lost
Y PE e , ley ' i
wr : a Fa
7 | CJ % ; Le erdal (dira y Bebav
: TA ao ross, sz
r
ud) be envitdesl psrclutogicalbeha
IX
bn ¿EL rre sd
e 2
' cOn.
á
, 5
f nm
+
: |
5d
d A
'
5. MÉTODO CIENTÍFICO Y EVALUACIÓN PSICOLÓGICA
GUALBERTO BUELA-CASAL
Il. INTRODUCCIÓN
El término objetividad (de los enunciados científicos) hace alusión a que el conoci-
miento científico ha de ser susceptible de contrastarse de forma intersubjetiva. La
objetividad se encuentra en relación con la construcción de las teorías, puesto que
sólo cuando se produce la recurrencia de ciertos acontecimientos de acuerdo con
unas reglas, tal como ocurre en los experimentos repetibles, pueden ser contrasta-
das las observaciones. Éstas no deben ser aceptadas como científicas hasta que se
han repetido y contrastado. Sólo así podemos llegar al convencimiento de que no
Universidad de Granada.
148 Gualberto Buela-Casal
nos encontramos con un efecto aparente, sino que se trata de un fenómeno que de-
bido a su regularidad y repetitividad, es en principio contrastable. Si un fenómeno
es irrepetible y único, no puede considerarse objeto de la ciencia.
Una experiencia subjetiva o un sentimiento de convicción nunca pueden consi-
derarse enunciados científicos, aunque sí pueden ser objeto de indagación empíri-
ca. Por tanto, podemos estar absolutamente convencidos de la verdad de un enun-
ciado, seguros de la evidencia de nuestra percepción, incluso puede parecer absurda
cualquier duda. Sin embargo, todo ello no es suficiente para que pueda ser un
enunciado científico, puesto que no aporta ninguna razón a la ciencia. Ahora bien,
la experiencia subjetiva puede constituir una hipótesis a contrastar de forma expe-
rimental. Por tanto, desde una perspectiva científica tendría la misma considera-
ción una simple sospecha que una convicción de certeza indudable, es decir, el gra-
do de convicción subjetiva es irrelevante para la justificación de un enunciado
científico.
La exigencia de objetividad de los enunciados científicos es de suma importancia
puesto que soluciona el problema de la base empírica. Las experiencias que descri-
ben nuestras percepciones sólo pueden incluirse en la ciencia como hipótesis. Los
enunciados que pertenecen a la base empírica tienen que ser también objetivos, o
sea, contrastables de forma intersubjetiva. Por tanto, si todos los enunciados han
de ser contrastados, no puede existir en la ciencia ninguno que no sea contrastable, y
en consecuencia, que no pueda ser refutado al falsar alguna de las conclusiones que
de él se puedan deducir. Los sistemas teóricos se contrastan deduciendo de ellos
enunciados con un nivel de universalidad más bajo, los cuales también deben ser
contrastados. Esto, aparentemente, nos lleva a una continua contrastación en la que
nunca se llega a aceptar un enunciado. Sin embargo, no es así, puesto que no es nece-
sario haber contrastado todo enunciado científico antes de aceptarlo; sólo se exige
que sean susceptibles de contrastación. Popper se niega a admitir que en la ciencia
existan enunciados cuya verdad se acepte de forma resignada, por la única razón de
no poder someterse a contraste por razones lógicas.
La base empírica de la ciencia objetiva, pues, no tiene nada de absoluta; la ciencia no está ci-
mentada sobre roca; por el contrario, podríamos decir que la atrevida estructura de sus teo-
rías se eleva sobre un terreno pantanoso, es como un edificio levantado sobre pilotes. Éstos se
introducen desde arriba en la ciénaga, pero en modo alguno hasta alcanzar algún basamento
natural o “dado”; cuando interrumpimos nuestros intentos de introducirlos hasta un estrato
más profundo, ello no se debe a que hayamos topado con terreno firme: paramos simplemen-
te porque nos basta que tenga firmeza suficiente para soportar la estructura, al menos por el
momento [Popper, 1962, p.106].
Método es una regla, o conjunto de reglas, para actuar según un determinado orden
con el fin de alcanzar una meta. Por tanto, un método puede ser formalizado como
una concatenación de varias pautas, cada una de las cuales describe un paso del pro-
cedimiento a seguir. Así, por ejemplo, la introspección no puede ser considerada
Método científico y evaluación psicológica
149
como un método, puesto que no está dirigida por reglas (Bunge y Ardila, 1988). Una
técnica es un método para realizar algo especial. Para que una técnica sea científica
debe ser compatible con el cuerpo de conocimiento científico, es decir, una técnica
será científica si:
La teoría de la ciencia no solamente nos indica cómo construir una teoría de forma
adecuada, sino que además nos facilita los criterios y métodos que debemos utilizar
para confrontarla con la experiencia. Verificación científica podría definirse como la
comprobación de la verdad de un conocimiento determinado (teorías, leyes, hipóte-
sis, hechos...). El concepto de verdad se refiere a la adecuación entre la representa-
ción de la realidad y la misma realidad. El conocimiento implica interpretación; por
tanto, la comprobación es siempre provisoria (Monserrat, 1984). La verificación
científica puede analizarse según tres aspectos:
Por otra parte, hay que tener en consideración que lareactividad no se produce
por igual en cualquier conducta o situación. Ásí por ejemplo, cuando la conducta
tenga un margen de variabilidad mínimo en su forma o en sus relaciones con el am-
biente, de forma que se manifieste con cierta independencia de la situación, el efecto
de la reactividad es menor. Lo mismo sucede cuando los sujetos observados no tie-
nen la capacidad de procesar la información sobre los cambios de una situación na-
tural a una de laboratorio, tal como ocurre en los neonatos (Riva, 1991).
152 Gualberto Buela-Casal
senta otro trabajo titulado «Más allá de las dos disciplinas de la psicología científica»,
donde defiende la necesidad de una psicología aplicada integrada. Así, plantea la ne-
cesidad de encontrar para cada individuo el tratamiento que puede adaptarse más fá-
cilmente, lo cual exige la aplicación conjunta de métodos experimentales y correla-
cionales. Para apoyar este planteamiento presenta los resultados de distintos
estudios sobre la interacción de la aptitud y el tratamiento (estudios ATI), donde se
resalta la importancia de las interacciones de los fenómenos observados y las condi-
ciones de laboratorio (Silva, 1986).
TEORÍAS
INCONTRASTADAS
Incontrastables Contrastables
No
científicas
Incompatibles Compatibles
No Científicas
científicas
lación entre la propiedad y el sujeto es puramente fortuita, por lo que no se debe te-
ner en cuenta al hacer la generalización (Monserrat, 1984). En este método pueden
distinguirse cuatro modalidades:
En un cuento popular ruso se narra la historia de dos ranas que un día se cayeron
en una vasija que contenía leche. Ambas saltaron una y otra vez para intentar salir de
la vasija, pero no conseguían elevarse lo suficiente para alcanzar el borde. Después
de muchos intentos, una de las ranas pensó: «está claro, por mucho que lo intente,
nunca conseguiré salir, por tanto es mejor ahogarme que seguir sufriendo». La otra
rana pensó que el hecho de no haberlo conseguido hasta el momento no era razón
para dejar de intentarlo y, por tanto, continuó saltando. Por efecto de los saltos, la le-
che se fue convirtiendo en manteca y llegó un momento en que pudo tomar suficien-
te impulso para salir de la vasija. Este cuento es, sin duda, ilustrativo de que en el mé-
todo inductivo no siempre se cumplen las inferencias.
REFERENCIAS BIBLIOGRÁFICAS
Alvira, P., Avia, M., Calvo, R. y Morales, F. (1979). Los dos métodos en las ciencias sociales.
Madrid. Centro de Investigaciones Sociológicas. E
Anguera, M. T. (dir.) (1991). Metodología observacion al en investigació n psicológica. Barce-
lona. PPU. z .
Bakeman, R. (1991). Prólogo al libro de M. Anguera (dir.), M etodología observacion al en la
investigación psicológica. Barcelona. PPU. | ]
Bunge, M. y Ardila, R. (1988). Filosofía de la psicología. Barcelona. Ariel.
162 Gualberto Buela-Casal
LECTURAS COMPLEMENTARIAS
Alvira, P., Avia, M., Calvo, R. y Morales, F. (1979). Los dos métodos en las ciencias sociales.
Madrid. Centro de Investigaciones Sociológicas.
Bunge, M. y Ardila, R. (1988). Filosofía de la psicología. Barcelona. Ariel.
Monserrat, J. (1984). Epistemología evolutiva y teoría de la ciencia. Madrid. Servicio de Pu-
blicaciones de la Universidad Pontificia Comillas.
Popper, K. (1962). La lógica de la investigación científica. Madrid. Tecnos.
6. ELPROCESO DE EVALUACIÓN PSICOLÓGICA
Il. INTRODUCCIÓN
tuación inicial. Las hipótesis planteadas serán contrastables y deberán estar basadas
en datos empíricos debidamente comprobados, por lo que en este momento los co-
nocimientos teóricos del evaluador son fundamentales. Según Fernández-Balleste-
ros (1992), se pueden formular cuatro supuestos diferentes en función del objeti-
vo de la evaluación; si el objetivo es un simple diagnóstico es suficiente con supuestos
de semejanza, si el objetivo es orientar o seleccionar se deberán formular supuestos de
cuantificación y asociación predictiva, y si la meta final es el tratamiento se deben
plantear supuestos de relación funcional, una vez verificados los supuestos de aso-
ciación predictiva durante el proceso correlacional.
e. Juicio diagnóstico. Éste ha sido definido por Silva (1988) como aquel proce-
dimiento por medio del cual se llega, a partir del conjunto de datos recopilados, a
una formulación sintética que permite deducir conclusiones dirigidas hacia la plani-
ficación de medidas de acción (orientar, seleccionar o proponer un tratamiento).
Esta etapa es de suma importancia, pues permite tomar decisiones sobre el motivo
de la consulta. Si el juicio emitido lleva a la formulación de nuevas hipótesis, enton-
ces el proceso no debería darse por concluido, sino que habría que retomar las fases
anteriores.
f.. Informe de los resultados. La mayoría de los autores coincide en señalar que
el informe debe ser un documento científico que permita trasmitir una informa-
ción ajustada, rigurosa y estructurada sobre los resultados y el procedimiento se-
guido en la evaluación. En su redacción es importante tener en consideración quién
es el destinatario, pues el nivel de comprensión de éste puede variar en gran medi-
da, puesto que puede dirigirse a otro profesional, al propio sujeto,a los familiares,
a otros profesionales no psicólogos, etc. En el informe deben incluirse, además, re-
comendaciones acerca de cómo orientar o intervenir en relación al tema objeto de
la evaluación.
166 Gualberto Buela-Casal, Miguel Ángel Verdugo y J. Carlos Sierra
el número de pasos que deben incluirse en este proceso, aunque en la mayoría de los
casos se distinguen tres fases principales:
a. Análisis del motivo de la consulta. Ésta es la fase que menos atención ha reci-
bido por parte de los investigadores e incluso por muchos terapeutas, que suelen co-
menzar directamente con la operacionalización de las conductas problema. No obs-
tante, antes de iniciar la delimitación de tales conductas es necesario tener un
conocimiento claro acerca del problema real del paciente.
es decir, los cambios logrados deberán ser clínicamente relevantes y socialmente sig-
nificativos; por tanto, su valoración debe enfocarse desde distintas perspectivas, dan-
do solución a las demandas del paciente. Las metas últimas del tratamiento depen-
den, fundamentalmente, de los juicios de valor de los que de forma directa o
indirecta intervienen en la terapia: el terapeuta, el paciente y el medio social en que
vive el paciente.
d. Estudio de los objetivos terapéuticos. Las conductas meta son aquellas sobre
las que se centra la intervención. Cuando se han modificado las conductas objetivo,
supuestamente deben haber quedado resueltas las quejas y las demandas. Pero no
toda queja o demanda supone una conducta objetivo, ya que es frecuente que ante
una queja o demanda el terapeuta proponga varios puntos sobre los que debe incidir
la terapia; y por el contrario, en algunos casos se pretende abordar varias quejas o de-
mandas con la intervención sobre una única conducta objetivo. Es importante resal-
tar que por la expresión conducta objetivo, no sólo debe entenderse una conducta
del sujeto, sino que, además, puede referirse a determinadas condiciones ambientales
o a la relación del sujeto con su ambiente social. Para la selección de las conductas
objetivo suelen tenerse en cuenta diversas consideraciones, tales como, por ejemplo,
que sólo deben ser consideradas como conductas objetivo aquellas que son suscepti-
bles de ser modificadas. Por último, hay que tener presente que el problema no suele
ser monosintomático, por ello resulta necesario establecer una prioridad en las con-
ductas objetivo.
nóstico, mientras que el análisis funcional sería especialmente útil en aquellos casos
en que hay una interrelación del problema con el ambiente.
f.. Evaluación de los resultados del tratamiento. Una vez finalizado el trata-
miento, éste debe ser evaluado por diversas razones:
Para evaluar los resultados del tratamiento se pueden utilizar dos procedimien-
tos. Uno consiste en valorar los resultados con respecto a la línea base, por el cual se
compara al paciente en cada una de las conductas elegidas como conducta objeto de
intervención con las medidas de las mismas conductas durante la línea base. Este
tipo de evaluación nos indica la magnitud del cambio, pero no nos da información
acerca de su relevancia. Otro procedimiento consiste en evaluar los resultados de la
intervención por comparación con las metas últimas del tratamiento, es decir, se tra-
ta de comparar el estado actual con los objetivos meta previamente fijados, y no con
la línea base. Así, cuanto más próximo esté el estado actual de los objetivos marca-
dos, mayor será la relevancia clínica y social de los cambios producidos (véase
Goncgalves y cols. , 1996).
Una vez descrito el proceso debemos relacionar las técnicas de evaluación con el
mismo; Fernández-Ballesteros (1992, 1994) indica que la inclusión de las técnicas de
evaluación dentro del proceso está en función de dos factores: el costo de aplicación
y su nivel de especificidad y rigor. De este modo, los instrumentos utilizados en la
primera fase de recogida de información son de amplio espectro y sometidos a un
mayor número de sesgos (entrevista, observación asistemática, autobiografía...) en
un segundo nivel se utilizan técnicas más precisas y de mayor costo de administra-
ción (autorregistros, observación sistemática...), y en las últimas fases del proceso se
emplean técnicas de mayor costo, especificidad y rigor (tests situacionales, observa-
ciones en vivo y registros psicofisiológicos).
REFERENCIAS BIBLIOGRÁFICAS
Carey, M. P., Flasher, L. V., Maisto, S. A. y Turkat, D. (1984). The a priori approach to psy-
chological assessment. Professional Psychology, 15, 515-527,
Elstein, A. S., Shulman, L. S. y Sprafka, S. A. (1978). Medical problem solving. Cambridge.
Harvard University Press.
El proceso de evaluación psicológica 171
LECTURAS COMPLEMENTARIAS
Ala
sn
bei ins
ido eb: eS
My sido eii raimd
a
NEO
h
3
Mos LETRA EE S
sa
1 IVY YPITLA robo
6
5 en O
h ” $
b
p
Ñ AA
«ft 7
ER
+4 E
13 -
3 AE >
Ñ
7. PRINCIPIOS PSICOMÉTRICOS DE LA EVALUACIÓN
PSICOLÓGICA
MARIANO ÁLVARO
En este capítulo se tratan aspectos básicos referidos a la teoría clásica de los tests:
análisis de ítems, fiabilidad y validez. Además de la exposición conceptual de los tér-
minos utilizados y de las fórmulas estadísticas necesarias en cada caso, se incluyen
comentarios y recomendaciones, que pueden ser útiles para el profesional que haga
uso de los tests.
Cuando se habla de análisis de ítems se está haciendo referencia al estudio del índice
de dificultad y del índice de discriminación. Sin embargo, antes de pasar a hablar de
estos índices, parece conveniente definir algunos conceptos referidos a los ítems más
utilizados y considerados como prototipo: los ítems de alternativa múltiple.
De forma general, el ítem puede definirse como una pregunta o enunciado en la
que se presenta al sujeto una situación problemática y se le pide que dé una respues-
ta, sólo una, siguiendo ciertas instrucciones de tipo formal. Un ítem está configura-
do por las siguientes partes:
Instituto de la Mujer.
174 Mariano Álvaro
n
PIN
N
en donde » es el número de aciertos y N es el número de sujetos.
(ti (0
N-O
en donde O hace referencia al conjunto de sujetos que han omitido el test.
= —n x 100
N-NA
en donde NA es el número de sujetos que no han alcanzado el ítem.
Principios psicométricos de la evaluación psicológica
175
pik Ora
n
nens
NOTAS
e. Porcentaje de aciertos penalizando errores:
E
as
N 10
en donde A indica número de aciertos, E número de errores, K número de opciones
del ítem y N número de sujetos.
E
a its
Kal abera o
presto
N-0
g Porcentaje de aciertos penalizando errores y excluyendo a los sujetos que
“no han alcanzado” el ítem:
E
de Re]
Re 10)
N-NA
h. Porcentaje de aciertos penalizando errores y excluyendo a los sujetos que
han “omitido el ítem” y a los que “no lo han alcanzado”:
Sobre qué valores deben tener los índices de dificultad de los ítems que se utili-
cen, cabe decir que, en principio, desde el punto de vista psicométrico es aconsejable
que estén en torno a 50, puesto que de esta forma la varianza será mayor. No se olvi-
de que, cuando las puntuaciones son binarias (1,0), la varianza es igual al producto
deppor q (S? = pq), siendop el porcentaje de casos favorables, aciertos, y q es igual a
1 menosp (1-p); al tratarse de porcentajes: Q = 100— P. El mayor valor pg se obtiene
cuando p es igual a q (p =q), lo que solamente ocurre cuando el valor de p y q es igual
a 0,50 (expresado en proporciones) ó 50 (expresado en porcentajes). S1 la varianza es
176 Mariano Álvaro
mayor, el coeficiente de fiabilidad del test será mayor, puesto que este coeficiente de
fiabilidad es la correlación del test consigo mismo. En principio, a mayor varianza
mayor correlación. Por otra parte, una varianza pequeña indica que las puntuacio-
nes de todos los sujetos se posicionan respecto al rasgo evaluado de manera muy
agrupada. Todos obtienen resultados similares y, en consecuencia, será muy difícil
que el poder de discriminación del ítem o test en cuestión sea alto. Una varianza
grande no avala un poder de discriminación alto, pero es muy difícil que un ítem
tenga capacidad de discriminar entre los sujetos con alta y baja posesión del rasgo
evaluado si la variabilidad de las puntuaciones de todos los sujetos es pequeña. En
suma, una varianza grande avala un coeficiente de fiabilidad alto y un índice de dis-
criminación alto en mayor medida que una varianza baja. ne
Ahora bien, por razones de tipo funcional puede interesar que los índices de difi-
cultad sean superiores o inferiores al 50%. Por ejemplo, en determinadas circunstan-
cias convendría empezar el test con ítems fáciles para que el sujeto vaya tomando
confianza y pueda tener un rendimiento en la prueba apropiado a la posesión del
rasgo evaluado. Asimismo, en un momento dado interesaría discriminar entre suje-
tos con un nivel bajo o un nivel alto en un determinado rasgo, en cuyo caso tendrían
que utilizarse ítems fáciles o ítems difíciles con alto poder discriminativo en esos ni-
veles. En consecuencia, puede afirmarse que, aunque desde el punto de vista estadís-
tico es deseable que todos los ítems tengan un índice de dificultad en torno al 50%,
desde el punto de vista funcional puede ser recomendable que haya un determinado
número de ítems fáciles y/o un determinado número de ítems difíciles. La mayor
parte de los manuales recomienda la siguiente distribución a la hora de aplicar una
prueba de rendimiento o aptitudes a una muestra representativa de una población
“normal” de sujetos: 25% de ítems fáciles, 25% de ítems difíciles y 50% de ítems de
dificultad media. Se entendería por ítem fácil aquel que es respondido correctamente
por más del 75% de la población. Un ítem difícil sería el que es contestado de forma
adecuada por menos del 25% de la población. Los ítems de dificultad media ten-
drían valores de dificultad comprendidos entre 25 y 75% (Álvaro, 1993).
I,=p,—P, en donde
Di
a
, en donde
a
Py= , en donde
b
12.2. Diferencia entre el número de aciertos del grupo más alto y del grupo
más bajo, dividida por el número de aciertos del grupo más alto
00
tE
n a
Quiere ello decir que el número de acertantes del grupo más bajo es 66,66%
(2/3) más pequeño que el del grupo más alto.
de era de 4
r, = HE x Pai que equivale a:
Se y
r,= A Pi , en donde
$ t y
X,, es la media en el test de los sujetos que aciertan el ítem 7, X,, es la media en el test
de los sujetos que no aciertan el ítem z, S, es la varianza de las puntuaciones obtenidas
en el test, p, es la proporción de sujetos que aciertan el ítem 7, q, es la proporción de
sujetos que no aciertan el ítem ¿(q,=1-p,), y es el valor de la ordenada que separa en
1
una distribución normal la proporción de sujetos que acierta el ítem ¿ (p) de la pro-
porción que no lo acierta (q,) y X, es la media del test, considerando a todos los suje-
tos que lo han contestado.
2d Mis
tp = 2 2 xp, q,, o lo que es lo mismo:
h XX, 7)
ed E t 4;
Principios psicométricos de la evaluación psicológica 179
11. Fiabilidad
absoluta y relativa
Cuando se evalúa cualquier rasgo, se comete algún error, que puede ser grande o pe-
queño. Cuanto menor sea este error, más fiable es el instrumento de medida. La fia-
bilidad hace referencia a las diferencias entre las puntuaciones obtenidas y las pun-
tuaciones verdaderas. Estas diferencias son las puntuaciones erróneas, o mejor, la
parte de las puntuaciones obtenidas que son debidas a los errores de medida que se
cometen. Por tanto, la puntuación empírica se descompone en dos partes: una ver-
dadera y otra errónea.
VES
S=82+8
Principios psicométricos de la evaluación psicológica 181
Sev mEQUA
2 6 2 31
Xx 26:
7) 206
ES
xx
- 37 = 1, por lo que
Sr +S=8S
pS e
2
Es
SIS,
S=S (L>r_.),
$.35 Vir,
Para saber entre qué valores se encuentra el parámetro o estadístico referido a la po-
blación, es decir, la fiabilidad de un estadístico, es fundamental averiguar el error
muestral máximo, que es igual a la zeta crítica (Z,) multiplicada por el error típico.
La Z_ viene determinada por el nivel de confianza con el que se decide trabajar. Los
límites entre los que se encontrará el parámetro se obtienen sumando y restando el
error muestral máximo al estadístico en cuestión.
Veamos un ejemplo:
dos, la media ha tenido un valor de 18 (X= 18), la desviación típica de 5 (S, =5) y el
coeficiente de fiabilidad de 0,90 (7, =0,90). Nos interesa saber entre qué límites esta-
ría el verdadero parámetro de la población, teniendo en cuenta que se decide trabajar
al nivel de confianza del 5% (NC =5%).
1.2 Se mira el valor de la Z_: NC=5% => Z,= 1,96. La Z, se obtiene a través de
las tablas de la curva normal.
2.2 Se obtiene el error típico (S,):
IC=X+E
IC =18 +3,10=21,10 y 14,90
Por tanto, puede afirmarse a un nivel de confianza del 5% (es decir, teniendo un
95% de probabilidades de acertar) que la media de la población está entre 14,90 y
21,10:
En este caso, la estrategia consiste en averiguar la razón crítica, que es igual al estadís-
tico en cuestión dividido por el error típico. García-Cueto (1993) distingue entre las
diferencias interindividuales, las diferencias intraindividuales y las diferencias entre
puntuaciones. El procedimiento para estudiar unas y otras es el mismo; la única dife-
rencia estriba en la forma de estimar el error típico en cada caso.
Diferencias interindividuales
e x
Lia xx
12 NC=5%>Z =1,9
SS 10,90 0,10 2=5x0,31x1,41
=2,23
Principios psicométricos de la evaluación psicológica
183
2,24 > 1,96, por tanto las diferencias son significativas al nivel de confianza del 5%.
Diferencias intraindividuales
SS IS O
SF (2 t 1 0)
S¿=5, x V A
O
des
d
184 Mariano Álvaro
S; 3 Si, + da =2 Y, So Sa
Consiste en aplicar a los mismos sujetos dos versiones diferentes, aunque equivalen-
tes, del mismo test, llamadas formas paralelas. Después de aplicadas, se dispone de
dos grupos de puntuaciones referidas al mismo grupo de individuos. Para estimar el
coeficiente de fiabilidad en este caso, se aplica la fórmula de la correlación de Pearson:
_ XX, -X)(Y,-Y)
o NSS, ;
en donde X, X y $, son las puntuaciones directas, la media y la desviación típica, res-
pectivamente, que corresponden a una de las formas paralelas del test; Y, Y y $ son
las puntuaciones directas, la media y la desviación típica de la otra forma del test, y N
hace referencia al número de sujetos a los que se les ha aplicado el test.
* Se considera que dos grupos o muestras están “relacionadas” cuando: a. A una misma muestra se le
aplica el mismo test en dos momentos diferentes; b. Las dos muestras se han confeccionado de tal forma
que a un sujeto de una muestra le corresponde otra con las mismas características en la otra muestra.
Principios psicométricos de la evaluación psicológica
185
a. Spearman-Brown
kr 0
da Y AáAN<A<>
>>
2 1+(kD)r,”
as 2r 0
e
SB >
de
siendo “r,” la correlación de Pearson entre las dos mitades del test.
La primera de estas dos fórmulas de Spearman-Brown fue propuesta para estu-
diar cuál es el coeficiente de fiabilidad de un test cuando aumenta o disminuye su
longitud, es decir, su número de ítems. Por consiguiente, no sólo es aplicable al caso
del método de las dos mitades.
b. Guttman
Consistencia interna
terna, aunque también puede considerarse como tal el método de las dos mitades.
Con él se analizan los datos de todos y cada uno de los ítems, asumiendo que todas
las preguntas del test evalúan el mismo rasgo. Por tanto, puede afirmarse que, mien-
tras que los métodos y fórmulas anteriores establecen la correlación entre dos mita-
des de un único test, el de consistencia interna y las correspondientes fórmulas, que
se presentan a continuación, tienen en cuenta todas las posibles mitades que pudie-
ran construirse con el grupo de ítems en cuestión. En este caso se analizan los datos
de cada ítem respecto a los del total del test.
Los coeficientes de fiabilidad denominados por antonomasia de consistencia in-
terna son los siguientes:
tf
e
N-1 San
en donde N es el número de ítems del test, S?es la varianza de las puntuaciones de
cada ítem y $?es la varianza de todo el test.
Analizando la fórmula, puede observarse que si las preguntas o ítems individua-
les no están correlacionados con los demás, el coeficiente alfa será cero. A mayor in-
tercorrelación entre las preguntas, mayor coeficiente alfa. De ahí que este coeficiente
sea considerado como un índice de consistencia interna.
N
YUIAPAO] HR q ee Bi a
NA $?
en donde p,es la proporción de sujetos que responde correctamente una pregunta o
ítem. E
(EdesaN yLU
Np (1- y
N-1 S
en donde p es la proporción media de respuestas correctas para todos los ítems del
test.
Principios psicométricos de la evaluación psicológica 187
de SE?
Via 2 >
SE2+ SW. +SP
en donde SE? es la varianza debida a las diferencias entre sujetos, SV? es la varianza
debida a los distintos momentos de aplicación y S1? es la varianza debida a la interac-
ción entre sujetos y momentos de aplicación.
Por último, una tercera fuente de error puede ser la persona o juez que otorga las
puntuaciones. Esta fuente es propia de las preguntas que se plantean de manera
abierta, es decir, de manera que los sujetos no tienen que elegir una respuesta entre
varias, sino que tienen que escribir su respuesta completa. En este caso, es conve-
niente hacer una distinción entre la puntuación de las respuestas con una escala de
intervalos o continua y la clasificación de los sujetos en aptos y no aptos.
Fiabilidad de los tests cuya calificación resulta ser una variable continua
En este caso, la forma más habitual de hallar la fiabilidad consiste en estimar la corre-
lación de Pearson entre las puntuaciones otorgadas por dos jueces para, posterior-
mente, aplicar la fórmula de Spearman-Brown, con el fin de conocer la fiabilidad de
toda la prueba, de forma que la k será igual al número de jueces que califica a cada su-
jeto.
Igual que ocurría con el método test-retest, la fórmula de Pearson no tiene en
cuenta la variación sistemática entre jueces, que en aquel caso era entre momentos.
Por consiguiente, es recomendable utilizar la fórmula basada en el modelo de va-
rianza:
PL SE?
ASELESPASP.
188 Mariano Álvaro
en donde SE? es la varianza debida a las diferencias entre sujetos, $]? la debida a las
diferencias de puntuación entre jueces y 5? la debida a la interacción entre sujetos y
jueces.
En esta tabla, A, hace referencia a los sujetos clasificados como aptos por el juez
1 o en el momento 1, A, a los sujetos clasificados como aptos por el juez 2 o en el
momento 2, N, alos sujetos clasificados como no aptos por el juez 1 o en el momen-
to 1, y N, a los sujetos catalogados como no aptos por el juez 2 o en el momento 2.
El índice de fiabilidad más simple es el siguiente:
a+d
ES a+b+c+d”
en donde a y d comprenden a los sujetos que son clasificados de la misma forma por
ambos jueces o en los dos momentos, y b y c, por contra, incluyen a los individuos
respecto a los cuales no hay coincidencia en la clasificación entre un juez y otro o en-
tre un momento y otro.
Esta fórmula no tiene en cuenta los efectos aleatorios en el grado de coinciden-
cia, por lo que es preferible utilizar el coeficiente Kappa (k) de Cohen:
=
k=
mera
Po
donde
Principios psicométricos de la evaluación psicológica 189
usimarid
Pa a+b+c+d
A modo de conclusión acerca de la fiabilidad de los tests pueden hacerse las si-
guientes reflexiones:
una validez funcional, en cuyo caso se dice que un test es válido si cumple de manera
adecuada los fines para los que ha sido diseñado y construido. Si se ha confeccionado
un test para seleccionar a un grupo de sujetos que deberán desempeñar determinadas
tareas, el test será válido si efectivamente los individuos seleccionados obtienen un
alto nivel de rendimiento en el desempeño de las tareas encomendadas.
Henerson (1987) resalta dos facetas en la validez de un test; una descriptiva, que
indica cuál es el nivel de posesión de un rasgo por parte de un sujeto, y otra predicti-
va que indica que a raíz de los resultados obtenidos con la aplicación de un test pue-
den predecirse otros de cara al futuro. Si los resultados predichos se confirman, se
está avalando la validez del test.
Este tipo de validez se refiere a la relevancia del contenido del test, a la representati-
vidad de los ítems que lo componen, respecto a la totalidad del campo o rasgo objeto
de evaluación. Un test tendrá validez de contenido si el conjunto de preguntas en él
incluido constituye una muestra suficientemente extensa y representativa del rasgo
al que hacen referencia. No existe un índice de validez de contenido, pues éste viene
avalado por la forma o procedimiento utilizado para construir el test y por las perso-
nas que lo construyen, por su grado de conocimiento del área o rasgo evaluado.
Respecto al procedimiento a seguir para construir un test, cabe decir que el pri-
mer paso ha de consistir en una clara definición del universo a evaluar; sólo así podrá
obtenerse una muestra representativa del mismo. A continuación, deberían redac-
tarse las preguntas o ítems que formarán parte del test. La validación del ajuste entre
las preguntas que constituyen el test y el universo a que pertenecen se consigue me-
diante una validación experimental, que consiste en repetir el proceso de escribir
revisar las preguntas representativas con dos grupos de trabajo (Cronbach, 1971).
Por lo que respecta a la redacción de los ítems, es recomendable que en ella parti-
cipen distintos especialistas del área, dominio o rasgo que se pretende evaluar, ade-
más de un experto en psicometría.
a. Validez concurrente. Indica hasta qué punto las puntuaciones en un test co-
relacionan con una variable criterio, que generalmente es otro test que evalúa lo
mismo. En este caso sí existe un coeficiente de validez, que se obtiene averiguando la
correlación de Pearson entre las puntuaciones de ambos tests.
b. Validez predictiva. Indica hasta qué punto las puntuaciones en una variable
criterio futura se correlacionan con las puntuaciones predichas según los resultados
obtenidos en un test aplicado con anterioridad. Ahora, el índice de validez viene ex-
presado por la regresión de la puntuación predicha sobre la variable criterio.
Un test tiene validez de constructo si evalúa realmente el rasgo que pretende evaluar.
Por tanto, coincide esta definición con la definición clásica de validez de un test. La
validez de constructo hace referencia al grado de concordancia entre los resultados
obtenidos al aplicar un test y los planteamientos o hipótesis teóricas existentes sobre
el campo o rasgo evaluado. Por consiguiente, la validez de constructo de un test pue-
de contrastarse mediante la confirmación o no de que determinada estructura sub-
yacente existe y mediante la confirmación o no de determinadas hipótesis. Por ejem-
plo, si se parte del supuesto de que el constructo “personalidad” se articula en dos o
tres factores, y después de aplicado un test y hacer un análisis factorial se confirma la
existencia de esos factores, puede afirmarse que el test de personalidad aplicado tiene
validez de constructo. Asimismo, si se han pronosticado ciertas diferencias significa-
tivas entre distintos grupos y con los resultados obtenidos se confirma la existencia
de tales diferencias, puede asegurarse que el test tiene validez de constructo. Real-
mente, la validez de constructo está implícita en cualquier aplicación que se haga de
un test, ya que siempre que se clasifican situaciones, personas o respuestas se hace
basándose en constructos que los datos empíricos han de confirmar.
A lo largo de la historia del desarrollo de los tests, la validez más utilizada ha sido
la de criterio externo, debido a que los tests se han usado prioritariamente para estu-
diar las aptitudes mentales y la personalidad. Sin embargo, desde que se comenzaron
a emplear para evaluar el rendimiento académico, la situación ha cambiado radical-
mente, siendo recomendable, en este caso, hacer uso de la validez de contenido y de
la validez de constructo. Para evaluar las aptitudes mentales y los rasgos de persona-
lidad se disponía de tests suficientemente contrastados, que servían de criterio exter-
no de comparación. En cambio, es difícil encontrar pruebas de rendimiento genera-
lizables en el tiempo y en el espacio, teniendo en cuenta la concepción dinámica de
los currícula que impera en la actualidad. La idea de un currículo abierto, que se
adapta a las circunstancias contextuales, está muy extendida, por lo que los tests de
rendimiento necesitan renovarse continuamente. En consecuencia, no es aconsejable
utilizar un test anterior como criterio respecto al cual se compara el “test del mo-
”
mento .
192 Mariano Álvaro
REFERENCIAS BIBLIOGRÁFICAS
LECTURAS COMPLEMENTARIAS
Il. INTRODUCCIÓN
- Así, sten las medidas físicas el mayor problema consiste en la precisión de la me-
dida en términos de coincidencia de puntos, en la medida psicológica la cuestión más
delicada parece ser la de la teoría que fundamenta la legitimidad de la operación.
presentar ciertos parámetros psicométricos, tanto las cuestiones de una forma indi-
vidual como la escala en su conjunto. elo
Las cuestiones o preguntas deben poseer al menos cuatro parámetros: unidi-
mensionalidad, dificultad, discriminabilidad y control del azar (respuesta aleatoria).
La técnica más moderna de verificación de los tres últimos parámetros es la curva ca-
racterística del ítem dentro de los modelos de la teoría de la respuesta al ítem. La uni-
dimensionalidad de la cuestión es supuesta por esta teoría y es determinada por el
análisis de la estructura de toda la escala a través del análisis factorial.
La teoría de la respuesta al ítem (Lord, 1980) (véase en este mismo manual el ca-
pítulo de García-Cueto) parte del supuesto de que el desempeño en la pregunta está
relacionado con la propiedad psicológica o “trazo latente” que el sujeto presenta, es
decir, con un nivel de magnitud que el sujeto posee de esta propiedad. La determina-
ción de los parámetros de las cuestiones a través de la teoría de la respuesta al ítem si-
gue sofisticados procedimientos estadísticos. Existen varios modelos de esta teoría:
modelo logístico de un parámetro (Rasch, 1960) que evalúa solamente la dificultad
de las preguntas, asumiendo igual nivel de discriminación para todas las cuestiones y
la ausencia de respuestas al azar; modelo logístico de dos parámetros (Birnbaum,
1968) para evaluar la dificultad y la discriminabilidad de las cuestiones; modelo lo-
gístico de tres parámetros (Lord, 1980) para evaluar la dificultad, la discriminabili-
dad y la respuesta al azar que sustituye al modelo de ogiva normal (Lord, 1952). A
pesar de que estos modelos han sido desarrollados para el análisis de las cuestiones
en escalas de aptitudes dicotómicas, dado que existen solamente respuestas ciertas o
erróneas, se están también empezando a utilizar en escalas politómicas (Molenaar y
Sijtsma, 1988), existiendo inclusive programas de ordenador para análisis de escalas
politómicas para datos no paramétricos (Debets y cols., 1989). Los diferentes mode-
los, a pesar de partir de presupuestos diferentes, dan lugar básicamente a los mismos
resultados (Albanese y Forsyth, 1984).
Una escala constituye un instrumento psicológico que pretende evaluar un
constructo o “trazo latente” —propiedad psicológica— de una forma unívoca, ade-
cuada y constante. Así, dado que el constructo psicológico es concebido como un
continuo que presenta una cantidad con magnitudes desde cero (arbitrario) a un má-
ximo, la escala debe cumplir los siguientes requisitos: evaluar este constructo y no
otra cosa, referirse únicamente a ese constructo en todas sus cuestiones (unidimen-
sionalidad), las cuestiones de la escala deben cubrir toda la extensión del continuo de
una manera equilibrada y, por último, dar lugar a los mismos resultados en diferen-
tes evaluaciones de los mismos sujetos.
El primer requisito se refiere al concepto de validez de la escala. El criterio más
importante de validez es aquel que garantiza que de hecho la escala está midiendo el
constructo para el cual fue creada; ésta es la validez de constructo. Así, si se constru-
ye una escala para evaluar un constructo psicológico sin una teoría sólida previa de
este constructo, dificilmente llegaremos a resultados satisfactorios. El análisis facto-
rial es una de las técnicas más utilizadas para establecer la validez de constructo de
una escala, aunque una validación de hipótesis es de hecho más decisiva. Ésta consis-
te en determinar si la escala es capaz de discriminar grupos-criterio definidos exclu-
sivamente en términos de la magnitud del constructo en cuestión (por ejemplo, gru-
po de mínima aptitud y grupo de máxima aptitud). El problema de esta técnica es la
Medidas escalares
197
Las medidas escalares, tal como son aquí concebidas, se confunden con el propio
concepto de psicometría: toda medida que resulta de una escala de números es una
medida escalar. Este concepto incluiría desde la psicofísica hasta los tests psicológi-
cos. Esta concepción probablemente deba ser mantenida, aunque las escalas hayan
surgido dentro de la evaluación de constructos de la psicología social y de la perso-
nalidad. Una distinción que aún parece tener sentido es la que se hace entre la escala
psicofísica y la escala psicométrica. La escala psicofísica tiene como objetivo escalo-
nar estímulos físicos a través de la medida fundamental, correspondiéndose con la
escala psicológica de intervalos (escala de respuesta), estando las dos relacionadas
por alguna ley psicofísica. La escala psicométrica propone escalonar estímulos que
expresan un constructo psicológico; el concepto de escala se usa más comúnmente
para referirnos a este segundo concepto. Sin embargo, estas distinciones se hacen
muy tenues, porque al final siempre se ordenan estímulos (cuestiones) observables.
cepción de un estímulo dado: el nivel de estímulo que es percibido un 50% de las ve-
ces es considerado el umbral absoluto o nivel cero (cero inicial) de la escala de res-
puesta. Para determinar los umbrales diferenciales surgieron varias leyes en la histo-
ria de la psicología. :
Al presentar los diferentes tipos de escalas de tipo psicométrico debemos tener
en cuenta los procedimientos teóricos, los procedimientos empíricos o experimenta-
les y los procedimientos analíticos, los cuales discriminarán diferentes tipos de esca-
las psicológicas.
más concuerda, siendo la media de los valores escalares de estas tres cuestiones
la
medida de su actitud.
La construcción de escalas a partir de esta ley de Thurstone es extremadamente
laboriosa; en realidad, se convierte en una tarea casi imposible con un número eleva-
do de cuestiones, dado que la comparación de las preguntas dos a dos aumenta geo-
métricamente. Para diez estímulos tenemos 45 comparaciones [(10 x 9) / 2] y para
100 cuestiones tenemos 4 950 [(100 x 99) / 2]. Por ello, Thurstone desarrolló otras
técnicas de construcción de escalas de actitud; una de ellas es el método de los inter-
valos aparentemente iguales (Thurstone y Chave, 1929). En este caso, las afirmacio-
nes —cerca de cien— sobre un objeto de interés son impresas en tarjetas que los su-
jetos deben distribuir en once montones según el grado de favorabilidad que, en su
opinión, la afirmación presenta en relación al objeto psicológico. Los once monto-
nes son erigidos sobre un continuo de tarjetas etiquetadas de A a K, donde A está se-
ñalado con la expresión “desfavorable”, K con “favorable” y F (tarjeta situada en
medio de A y K) con “neutro”. El valor escalar de las cuestiones se hace a través del
cálculo de la mediana, teniendo como coeficiente de variabilidad el intervalo semiin-
tercuartílico.
Se propusieron diversas variantes de este método (Edwards y Kilpatrick, 1948;
Webb, 1951). El propio Thurstone presentó una variante denominada método de los
intervalos sucesivos.
cierto nivel de actitud con respecto al constructo, estará también de acuerdo con to-
das las cuestiones que tienen un nivel menor. De esta forma una serie de cuestiones
(según Guttman, cerca de diez) se ordenan de la más débil hasta la más extrema, con-
figurando una escala, al menos, ordinal. Si esto es verdad, basta saber la cuestión más
extrema con la que el sujeto está de acuerdo para poder reproducir perfectamente
sus respuestas en las otras cuestiones. Pero, en la realidad, esto no sucede así, dado
que las respuestas de los sujetos nunca son perfectas. Entonces la pregunta que surge
es cuál es el mínimo aceptable de reproductibilidad de las respuestas para poder de-
cir que una escala satisface el criterio de acumulatividad. Para ello, Guttman desarro-
lló procedimientos analíticos para determinar un índice de reproductibilidad que re-
sulta de la comparación entre las respuestas correctas e incorrectas; este coeficiente
de reproductibilidad debe ser al menos de 0,90 para que la escala pueda ser conside-
rada adecuada.
Este tipo de escalas tiene la ventaja de evaluar la unidimensionalidad, presentan-
do una garantía de que la amplitud del continuo del constructo es cubierta, sobre
todo si el número de cuestiones es elevado (al menos diez, sugiere Guttman). Sin
embargo, es relativamente raro encontrar en la literatura este tipo de escalas debido a
que no todos los constructos psicológicos permiten el escalonamiento; por ejemplo,
al evaluar la actitud política, un sujeto puede estar de acuerdo con una posición de un
determinado candidato y no con otra, lo que podría estar indicando una falta de uni-
dimensionalidad de la escala.
Dado el gran uso que se hace de las escalas tipo Likert vamos a presentar un esquema
resumido de los procedimientos y de las etapas más relevantes para la elaboración y
la validación de este tipo de escalas. La mayoría de los procedimientos nos sirven
también para la elaboración de cualquier instrumento psicométrico. Existen alme-
nos tres grandes aspectos a tener en cuenta a la hora de elaborar escalas: el teórico, el
empírico y el analítico.
El aspecto teórico hace referencia a la teoría que debe fundamentar cualquier
procedimiento científico; en este caso la teoría sobre el constructo u objeto psicoló-
gico para el cual se quiere desarrollar un instrumento de medida y la operacionaliza-
ción del constructo en cuestiones. El aspecto empírico o experimental define las eta-
pas y técnicas de aplicación del instrumento piloto y de recogida de información. El
aspecto analítico establece los procedimientos de análisis estadísticos de los datos
para llegar a un instrumento válido, preciso y, si fuera el caso, normalizado. Los pro-
cedimientos teóricos se deben elaborar para cada escala, dependiendo, por tanto, de
la literatura existente sobre el constructo psicológico en cuestión. Los procedimien-
tos analíticos se encuentran en la literatura psicométrica y estadística. El
La construcción y elaboración de las cuestiones debe seguir ciertos requisitos
que se resumen en los siguientes criterios:
no una abstracción o constructo. Según Mager (1981) la cuestión debe permitir al su-
jeto una acción clara y precisa.
b. Criterio de objetividad o de deseabilidad. En el caso de las escalas de aptitu-
des, las cuestiones deben cubrir comportamientos, permitiendo una respuesta cierta
o errónea. En el caso de las aptitudes y de la personalidad en general, las cuestiones
deben cubrir comportamientos deseables (aptitud) o característicos (personalidad).
En este caso, el sujeto debe poder estar de acuerdo o en desacuerdo u opinar si tal
comportamiento es conveniente o no para él; es decir, las cuestiones deben expresar
deseabilidad o preferencia.
c. Criterio de simplicidad. Una cuestión debe expresar una única idea.
d. Criterio de claridad. La cuestión debe ser inteligible hasta para los estratos
más inferiores de la población objetivo. Se deben utilizar frases cortas con expresio-
nes simples e inequívocas.
e. Criterio de relevancia (pertinencia, correspondencia o unidimensionalidad).
La expresión debe ser consistente con el atributo o propiedad psicológica; es decir, la
cuestión no debe insinuar un atributo diferente al definido.
f. Criterio de precisión. La cuestión debe poseer una posición definida en el
continuo del atributo y ser distinta de las demás cuestiones que cubren el mismo
continuo. Este criterio supone que la cuestión pueda ser localizada en una escala de
estímulos; en términos de Thurstone, diríamos que la cuestión debe tener una posi-
ción escalar modal definida y una desviación típica mínima. En términos de la teo-
ría de respuesta al ítem este criterio representa el parámetro b (dificultad) y única-
mente puede ser evaluado después de la recogida de datos empíricos sobre las
cuestiones.
g. Criterio de la amplitud. Este criterio se refiere a la escala total y afirma que el
conjunto de cuestiones referidas al mismo atributo debe cubrir toda la extensión del
continuo del atributo. Este criterio también es evaluado por el parámetro b de la teo-
ría de respuesta al ítem.
h. Criterio del equilibrio. Las cuestiones del mismo continuo deben cubrir
proporcionalmente todos los segmentos o sectores del continuo, debiendo existir,
por tanto, cuestiones fáciles, difíciles e intermedias en el caso de las aptitudes, y cues-
tiones débiles, moderadas y extremas en el caso de las actitudes.
1. Criterio de la variedad. Este criterio tiene en cuenta dos aspectos:
— Cambiar el lenguaje. Usar los mismos términos en todas las cuestiones con-
funde las frases y dificulta su diferenciación, además de provocar monotonía, can-
sancio y aburrimiento.
— En el caso de las escalas de preferencias se debe formular la mitad de las cues-
tiones en términos favorables y la otra mitad en términos desfavorables para evitar
respuestas estereotipadas a la izquierda o a la derecha de la escala de respuestas.
V. CONCLUSIONES
A pesar de los muchos problemas que aún existen en la teoría de la medida en las
ciencias sociales y de la conducta, el uso de las escalas, especialmente en psicología
social y psicología de la personalidad, está muy difundido. Este hecho puede ser
consecuencia de que las medidas escalares ofrecen un conocimiento válido en las
ciencias del comportamiento.
Las diferentes técnicas descritas (Likert, Thurstone y Guttman) presentan una
razonable consistencia, tanto en su estructura interna como en los resultados que se
obtienen por medio de ellas. En realidad, todas estas técnicas ofrecen procedimien-
tos estadísticos que permiten evaluar esa consistencia interna. En cuanto a la consis-
tencia de los resultados obtenidos con las escalas y las técnicas propuestas para su
construcción no son todavía lo suficientemente robustas. Es posible que esto se deba
en gran parte a la falta de definiciones más precisas de estas mismas técnicas.
Aunque existe una gran preocupación sobre la adecuación de los procedimien-
tos estadísticos, el verdadero problema de las escalas es construir un instrumento vá-
lido que evalúe algo psicológicamente relevante. Sin una buena teoría psicológica
que la fundamente, la escala puede parecer estadísticamente perfecta y consistente y,
en cambio, no estar evaluando nada relevante.
REFERENCIAS BIBLIOGRÁFICAS
Albanese, M. A. y Forsyth, R. A. (1984). The one-, two- and modified two parameter latent
trait models: An empirical study of relative fit. Educational and Psychological Measure-
ment, 44, 229-246. >
Birnbaum, A. (1968). Some latent trait models and their use of inferring an examinee's ability.
En F. M. Lord y R. M. Novick (dirs.), Statistical theories of mental test scores. Reading.
Addison-Wesley.
Campbell, N. R. (1938). Symposium: Measurement and its importance for philosophy. Pro-
ceedings Aristot Society Supplementum, 17, 121-142.
Debets, P. y Brouwer, E. (1989). MSP: A program for Mokken Scale analysis for polychoto-
mous items. Groningen. IEC ProGAMMA.
Debets, P., Brouwer, E., Sijtsma, K. y Molenaar, 1. W. (1989). MSP: Acomputer program for
item analysis according to a nonparametric IRT aproach. Educational and Psychological
Measurement, 49, 609-613. ; ]
Edwards, A. L. y Kenny, K. C. (1946). A comparison of the Thurstone and Likert techniques
of attitude scale construction. Journal ofApplied Psychology, 53, 72-83.
Edwards, A. L. y Kilpatrick, F. P. (1948). A technique for the construction of attitude scales.
Journal ofApplied Psychology, 32, 374-384. : ]
Goldsamt, M. R. (1971). Effects of scoring method and rating scale length in extreme response
style measurement. Tesis doctoral inédita. Universidad de Maryland. mat
Guttman, L. (1944). A basis for scaling qualitative data. American Sociological Review, 9,
139-150.
204 Luiz Pasquali y J. Carlos Sierra
LECTURAS COMPLEMENTARIAS
EDUARDO GARCÍA-CUETO
1. INTRODUCCIÓN
En las últimas décadas, aun sin olvidar la teoría clásica de los tests, cada vez se viene
prestando más atención a aquellos modelos conocidos como modelos del rasgo la-
tente, teoría del rasgo latente, teoría de la curva característica del ítem o teoría de la
respuesta al ítem (o a los ítems) (TRI). Estos modelos constituyen un nuevo enfoque
en la teoría de los tests que permite resolver ciertos problemas de evaluación psico-
lógica intocables desde la teoría clásica de los tests (Muñiz, 1990). Aunque el térmi-
no “curva característica del ítem” haya sido acuñado por Tucker (1946), se puede de-
cir que los verdaderos antecesores de las curvas características de los ítems y los
primeros que las utilizaron, aunque no lo denominasen así, fueron Simon y Binet en
1916. Estos autores consideraban que el rendimiento de los niños en tareas de tipo
cognitivo mejora con la edad y utilizaban diagramas en los que representaban la pro-
babilidad de éxito de los sujetos examinados en una tarea o en un ítem en función de
la edad, obteniendo curvas semejantes a la que muestra la figura 9.1.
Algo muy parecido es lo que en los modelos de la teoría de la respuesta a los
ítems se denomina curva característica del ítem. Tal vez el primero en introducir en
la literatura psicológica el término rasgo latente (en un sentido no freudiano) haya
sido Lazarsfeld (1950); sin embargo, es el trabajo de Lord «A theory of test scores»,
publicado en 1952 en un número monográfico de la revista Psychometrika, el consi-
derado como origen y consolidación de la teoría del rasgo latente o teoría de la res-
puesta al ítem. Otros nombres importantes dentro de este campo son Birnbaum
(1968), Lord y Novick (1968) y Samejima (1974), quienes extienden la teoría del aná-
lisis de ítems dicotómicos al de ítems policotómicos y continuos. También conviene
destacar los trabajos de Rasch (1960), cuya obra marca un hito en la historia de estos
modelos, siendo su modelo logístico el que, tal vez, más trabajos e investigaciones
dentro de esta área haya desarrollado. Quizás se entienda mejor el porqué del estu-
dio de la teoría de la respuesta al ítem si se comienza por conocer los problemas y las
limitaciones que presenta la teoría clásica de los tests.
Uno de los problemas fundamentales de la teoría clásica de los tests es que el resulta-
do de una medición realizada sobre una variable dependa, por un lado, del test utili-
Universidad de Oviedo.
206 Eduardo García-Cucto
FIGURA 9.1. Probabilidad de éxito de los sujetos examinados en una tarea o en un item en
función de la edad
0,75
5U
DO!
OD
ONO
DERE
0,50
DITA
TD
EIN
0,25
DH
0.0
==
0D
Edad
zado y, por otro lado, del grupo normativo a partir del cual se estimaron los distintos
parámetros de los ítems y del test. Es algo así como si el peso de una persona depen-
diera del tipo de báscula en donde se pesara y si además las cualidades y característi-
cas de la balanza se establecieran en función del sujeto al que se pesa. Además, los su-
puestos en los que se basa la teoría clásica de los tests no son suficientemente
consistentes. En definitiva, podemos señalar las siguientes limitaciones de la teoría
clásica (limitaciones que los modelos de la TRI prometen subsanar):
Cualquier modelo matemático incluye un conjunto de supuestos sobre los datos a los
que se ha aplicado dicho modelo. Cuando dichos supuestos son violados se obtienen
resultados de dudoso valor y las conclusiones que de ellos sean extraídas serán pobres y.
difícilmente interpretables. La teoría de la respuesta al ítem supone que una conducta
individual puede ser explicada, en buen grado, definiendo ciertas características huma-
nas (no observables) denominadas rasgos, estimando cuantitativamente la posición del
individuo en cada uno de estos rasgos y utilizando los valores numéricos obtenidos de
dicha estimación para predecir o explicar la conducta individual en situaciones perti-
nentes. Se trata de especificar las relaciones entre las puntuaciones observables obteni-
das por un sujeto en un test y los rasgos latentes que se supone que han de subyacer para
poder explicar dichas puntuaciones, es decir, la habilidad que dicho individuo ha de po-
seer para poder explicar sus respuestas a los ítems del test. Si un test está compuesto por
un número determinado de ítems y dicho test se utiliza para evaluar las características
de un individuo, la unidad básica de medida utilizada es obviamente el ítem. En general,
las personas poseerán la habilidad que pretenda evaluar el test en diverso grado, es decir,
su posición en el rasgo latente que se va a medir será diferente y consecuentemente no
presentarán todos los individuos un mismo patrón de respuestas a un mismo test. Por
consiguiente, las respuestas de las personas a los ítems dependen, por un lado, de la ha-
bilidad de dichas personas y, por otra parte, de las propias características de los ítems. El
objetivo fundamental de cualquiera de los modelos de la respuesta al ítem es proporcio-
nar los procedimientos adecuados para estimar la habilidad de cada individuo que res-
ponde al test y estimar al mismo tiempo las características de los ftems según las res-
puestas manifiestas y observables de dichas personas. A continuación vamos a describir
los supuestos más importantes de la teoría de la respuesta al ítem.
A=(Op Oe di0):
en donde 0es la variable latente que se desea estimar, siendo sus límites —0co < 9< + oo,
La teoría de respuesta al ítem 209
ser independiente del rendimiento de cualquiera de los otros sujetos que respondan
o puedan responder al test.
A partir de este momento se asumirá que todos los ítems de cualquier test que se es-
tudie bajo los supuestos de la teoría de respuesta al ítem son dicotómicos o están di-
cotomizados y que las respuestas dadas por cualquier sujeto al test se explican por la
posesión de una habilidad única y unidimensional o un rasgo latente 6. Además se
asume que la probabilidad de acertar un ítem es una función monotónica creciente
de 6.
IV1. Parámetro a
OS
0)
b
a
b
¡
nOs
fo
a
d
d
e
2 o
C
|
e
ñ
t
y 02
0
1 2 3 4 5) 6 7 8 9 10 ¿Lil de 13 14
Puntuación en el test
punto de máxima inflexión, en donde 0 = bh. Su valor teórico está comprendido entre
menos infinito y más infinito (- eo < a < + 09), si bien todos los ítems con valores de a
negativos se eliminan de los tests. Tanto los ítems con valores muy próximos a cero o
muy altos en este parámetro deben ser eliminados.
En este caso la probabilidad de acertar un ítem es independiente del valor de 6, lo
cual es absurdo y está en claro conflicto con los supuestos del modelo.
Así pues, <[...] el modelo es poco plausible para modelizar conducta humana
real, en la que el paso fallar-acertar un ítem no se produce tan sistemáticamente en un
punto concreto y siempre el mismo, más bien se da una transición probabilística»
(Muñiz, 1990, p. 20).
212 Eduardo García-Cueto
0,8
0,6
0,4
02
Iv2. Parámetro b
IV3. Parámetro c
IV4. Parámetro p
Este es el parámetro que contempla la posibilidad que existe cuando sujetos de alta
competencia en el rasgo que se está midiendo fallan un ítem. En cierto modo, sería lo
opuesto a acertar el ítem por azar. Puede darse este caso debido a mínimas deficien-
cias no trascendentales del sujeto si el test contempla aspectos que tal vez no tienen la
relevancia debida, o a que el constructor del test por descuido omitió información a
la hora de elaborar los ítems. De cualquier forma este parámetro, tal vez más que te-
nerlo en cuenta, al construir el test habrá que cuidar que su valor sea cero. No parece
que dicho parámetro añada mucha más información sobre la habilidad de los sujetos
que la proporcionada por los otros tres.
La CCI queda definida cuando se especifican estos cuatro (o tres) parámetros y se
adopta una determinada función matemática para dicha curva. Según el tipo de fun-
ción que se adopte tendremos los diversos modelos de CCI.
La finalidad de este apartado es hacer una somera introducción a los modelos más
comúnmente utilizados en la TRI. Todos los modelos que se exponen a continuación
asumen independencia local de ítems y sujetos, ítems binarios, dicotómicos o dico-
tomizados, unidimensionalidad del rasgo o de la habilidad sometida a medida y, ade-
más, todos los modelos son probabilísticos.
La mayoría de las investigaciones realizadas hasta la fecha se ha centrado en dos
tipos de funciones matemáticas para las CCI por un lado, la función logística y, por
otro, la curva normal acumulada, lo que puede dar lugar a ocho modelos distintos,
según se tengan en cuenta uno, dos, tres o cuatro parámetros. Dada la poca utilidad
del cuarto parámetro y la mayor tratabilidad de la función logística sobre la curva
normal acumulada, los tres modelos más utilizados dentro de la TRI son los modelos
logísticos de uno, dos y tres parámetros.
da por supuesto que los sujetos no contestarán a ningún ítem alazar. Esto hace muy
restrictivo el modelo, ya que ambos supuestos son muy difíciles de mantener en la
realidad. La experiencia nos dice que los sujetos, cuando no están muy seguros de
una respuesta, pueden fácilmente arriesgarse a contestar el ftem a ver si aciertan, y
además es muy difícil encontrar un conjunto de ítems suficientemente grande como
para constituir tests, si se exige que todos esos ítems tengan idéntico poder discrimi-
nante. De cualquier forma, este modelo es uno de los más utilizados por su sencillez
y para salvar los inconvenientes antes mencionados se acude a la explicación de la ro-
bustez del modelo frente a las violaciones de sus propios supuestos básicos.
de forma verbal (insultos), agresiones físicas contra los demás o contra uno mismo
(mutilaciones), etc. Clarificado todo esto se puede pensar en cómo evaluar estas con-
ductas, estas manifestaciones externas de la agresividad. De esta forma se pasaría a la
siguiente fase.
¡e |óln L ]
50
La teoría de respuesta al ítem
Dz
1(0)= Pi(0)
= P(6)Q(6)
siendo P?(0) la derivada primera de P(0) respecto a Oy Q|(0) = 1-P(0). Puesto que
los ítems del test son dicotómicos, puede demostrarse que la función de información
para un determinado valor de 0 es la inversa de la varianza de los errores de medida
para ese valor de 0, ya que el error típico de medida no es único e invariable para cada
test, sino que depende del valor de 9 (Gruijter y Van der Kamp, 1984). Esto implica
que es difícil interpretar el valor de la función de información como valor absoluto.
Tiene mucho más sentido hacerlo en relación con otros tests; esta comparación se
hace posible mediante el concepto de eficiencia relativa del test. La eficiencia relativa
de o el A y el B, cuando ambos evalúan la misma habilidad o el mismo rasgo
0 se define:
IX. CONCLUSIONES
Parece claro que si los datos se ajustan a los modelos estudiados, la TRI presenta cla-
ras ventajas sobre los tests tradicionales de la teoría clásica. Esto no significa que la
TRI sea la panacea que venga a solucionar todos los problemas de la medida en las
ciencias de la conducta. Tampoco todo son ventajas. El problema de la unidimensio-
nalidad es una seria objeción a estos modelos. Primero, porque muchas conductas
humanas son claramente complejas y difíciles de analizar en todas sus dimensiones
primarias aislando unas de otras; en segundo lugar, en muchas ocasiones la variable
tiempo es importante en la medida de la velocidad y de algo más, lo cual es incompa-
tible desde el mismo punto de partida con el supuesto de la unidimensionalidad, ya
que el tiempo es por sí mismo una clara dimensión. No es fácil la construcción de
grandes bancos de ítems ni las muestras todo lo numerosas que serían de desear para
calibrar dichos ítems, sobre todo cuando las poblaciones de interés tienen caracterís-
ticas muy peculiares, como poblaciones con ciertas patologías. La dificultad para
trabajar con ítems continuos o categoriales es otro inconveniente que puede resultar
insalvable en ciertas áreas de interés para el psicólogo. De cualquier forma es un ins-
trumento más en las manos del profesional de la psicología que puede ayudarle a ser
más objetivo y cometer menos errores en su toma de decisiones; bien utilizado pue-
de ser de gran utilidad y ayuda en numerosas ocasiones en el ejercicio de la profe-
sión.
La teoría de respuesta al ítem 219
REFERENCIAS BIBLIOGRÁFICAS
Birnbaum, A. (1968). Some latent trait models and their use in inferring a examinee's ability.
En F. M. Lord y M. Novick (dirs.), Statistical theories in mental test scores. Reading.
Addison-Wesley.
Grujter, D. N. M. y Van der Kamp, L. J. T. (1984). Statistical models in psychological and
educational testing. Lisse. Swets and Zeitlinger.
dbisan R. K. y Swaminathan, H. (1991). Fundamentals of item response theory. Lon-
res. Sage.
Hatue, J. A. (1985). An empirical study of various indices for determining unidimensionality.
Multivariate Behavioral Research, 19, 49-78.
Lazarsteld, P. F. (1950). The logical and mathematical foundation of latent structure analysis.
lnS. A. Stoufer (dir.), Measurement and prediction. Princeton. Princeton University
ress.
Lord, F. M. (1980). Applications of item response theory to practical testing problems. Nueva
York. Academic Press.
E a M. y Novick, M. (1968). Statistical theories in mental test scores. Reading. Addison-
esley.
Muñiz,J.(1990). Teoría de respuesta a los ítems. Madrid. Pirámide.
Rasch, G. (1960). Probabilistic models for some intelligence and attainment tests. Copenha-
gue. The Danish Institute for Educational Research.
Samejima, F. (1974). Normal ogive model on the continuous response level in the multidi-
mensional latent space. Psychometrika, 39, 11-121.
Santisteban, C. (1990). Psicometría. Madrid. Norma.
Tucker, L. R. (1946). Maximum validity of a test with equivalent items. Psychometrika, 11,
1213.
Whitely, S. E. (1980). Multicomponent latent trait models for ability tests. Psychometrika, 45,
479-494,
Wright, B. D. y Panchapakesan, N. (1969). A procedure for samplefree ¡tem analysis. Educa-
tional and Psychological Measurement, 29, 23-48.
LECTURAS COMPLEMENTARIAS
"ms -
E RAE A
e $ Goin. 1 o
e
LA a -á Y o
$ 4
a e
Ad DS
1 SII RA SE
td, se” UN OA Ar 2 A pr, 5
cosipinasydices
e E E, cdi
pl IL HO US 4
o mid
FERNANDO JIMÉNEZ
L INTRODUCCIÓN
Universidad de Salamanca.
222 Fernando Jiménez
Cuando nos planteamos el concepto del informe psicológico acabamos siempre re-
flexionando sobre las diferentes teorías que sustentan su propia definición. Tallent
(1983) define el informe como un documento escrito que sirve para comprender
algunas características de la persona y sus circunstancias, con el fin de tomar deci-
siones y de intervenir positivamente en su vida. Quizás la definición de Heiss
(1964) muestre más interés en la síntesis de los datos entendiendo el informe como
la representación integradora obtenida a partir de nuestra investigación. Para Fer-
nández-Ballesteros (1983) el informe supone un documento escrito a través del
cual se presentan los resultados de las exploraciones efectuadas, a partir de las que
se realizan unas recomendaciones concretas o se derivan determinados tratamien-
tos, dando con todo ello respuesta a los objetivos planteados por el sujeto o por
el remitente. Ávila, Ortiz y Jiménez (1992) consideran que el informe es la co-
municación (oral o escrita) a través de la cual se informa de los resultados de las
exploraciones efectuadas, a partir de los cuales se realizan diferentes observacio-
nes (diagnóstico y tratamiento más adecuado), dando con ello respuesta a los obje-
tivos planteados (motivo de la consulta) por el sujeto, entidad u organismo remi-
tente.
Por tanto, podemos apreciar la existencia de cuatro factores comunes en todo in-
forme psicológico:
En definitiva, el objetivo del informe es dar respuesta a los interrogantes que fue-
ron planteados por el sujeto o remitente; por tanto, éste debe estar centrado en el
mismo sujeto, orientado a las pruebas aplicadas, no debiendo obtener más informa-
ción que la estrictamente necesaria para la finalidad que fue solicitado.
Cuando nos planteamos cómo realizar esta entrevista de devolución, ¿por dón-
de hemos de comenzar? La “devolución” debe comenzar por los aspectos más adap-
tativos y positivos del sujeto e ir incluyendo los aspectos patológicos y menos posi-
tivos para la persona en la medida en que el sujeto pueda tolerarlos. Hay autores que
recomiendan comenzar por los aspectos intelectuales y cognitivos, pensando que és-
tos generan menos ansiedad que los factores emocionales. Sin embargo, dependería
de cada caso y, fundamentalmente, del motivo de la consulta. Respecto al lenguaje
que debemos emplear al comunicar los resultados, es importante no emplear un len-
guaje demasiado técnico que pudiera dificultar su comprensión e interpretación.
Ante todo, creemos necesario hacernos entender y adaptarnos a la persona destina-
taria del informe para que la comunicación resulte comprensible e interpretada en
sus términos concretos.
¿Quiénes pueden ser los destinatarios de la entrevista de devolución? Cuando el
sujeto es un niño o un adolescente es imprescindible realizar la entrevista de devolu-
ción con los padres porque son los que han pedido la consulta y porque comprende-
rán mejor la información transmitida (Wiener y Kohlert, 1986) y porque son los res-
ponsables del tratamiento a seguir con el niño. Si se trata de un adolescente, es
necesario explicarle de alguna manera (adaptándose a sus capacidades y facilidad de
comprensión) los puntos fundamentales del informe, haciéndole comprender que es
una tarea de todos, de él (para que tome parte activa) y de sus padres. Cuando los pa-
dres no acuden por iniciativa propia a la consulta, sino que son enviados por un ter-
cero (maestro, médico, etc.) la entrevista de devolución posibilita la toma de con-
ciencia del conflicto. En el caso de una persona adulta no suele ser necesario la
devolución de información a ningún familiar, excepto en los casos cuya gravedad lo
requiera o cuando es solicitado por el propio sujeto; en cualquier caso, no se debe
hacer sin el conocimiento y consentimiento del propio sujeto.
Los informes basados en la teoría son aquellos que eligen y ordenan su exposición
según los postulados teóricos que se derivan de la teoría de la personalidad. Por con-
siguiente, un informe no será el mismo desde una perspectiva dinámica que desde
una perspectiva psicométrica o conductual. El enfoque, las técnicas, la terminología
y el lenguaje van a ser propios de la teoría que profesa el evaluador. Estos tipos de in-
forme tienden a utilizar una forma más literaria, presentando un relato organizado y
con coherencia interna. Quizás el inconveniente mayor que puedan presentar es la
tendencia a utilizar afirmaciones demasiado genéricas y ambiguas atribuibles a la
mayoría de las personas.
Los informes fundamentados en las técnicas de exploración utilizadas suelen estar ba-
sados en la descripción de los resultados ofrecidos por las pruebas psicológicas em-
pleadas. Estos tipos de informe han sido, y continúan siendo, los más extendidos, y
en particular en España en los ambientes clínicos y psicopedagógicos. Los informes
mecanizados, elaborados por un programa de ordenador, utilizan este modelo to-
mando como método para la interpretación o valoración final la adscripción de pro-
posiciones generales para las puntuaciones más destacadas. Como puede deducirse, el
valor de este tipo de informes tiende a ser casi nulo. Quizás el inconveniente mayor
que presentan es la impersonalización del informe, la confección de un inventario
atomista de respuestas sin foco alrededor de las cuales se sitúa el peso más importante
de la información (Pelechano, 1976), la redundancia de datos (a veces pueden hasta
resultar contradictorios) y el tecnicismo superfluo que puede llegar a hacer inteligible
un determinado informe si la persona destinataria del mismo no se encuentra adecua-
damente experimentada para su comprensión correcta (Tallent, 1987).
El informe redactado bajo esta perspectiva está diseñado en función de los objetivos
o problemas objeto de estudio (motivo de la consulta) planteados por el sujeto remi-
tente. Son informes altamente específicos, orientados a facilitar la toma de decisiones
o la intervención. Su ventaja más importante estriba en la posibilidad de construir un
modelo psicológico funcional y dinámico de la persona sobre la que se ha realizado
la evaluación psicológica (Pelechano, 1976).
Un ejemplo de este tipo de informe es el elaborado por Weed (1970) con la deno-
minación de Problem Oriented Record (POR) cuya ventaja principal es la de consti-
tuir una pauta que puede ser utilizada por diversos profesionales. El POR consta de
cuatro apartados:
El informe técnico
El informe personal
El certificado
Por último, el informe pericial sería un informe técnico con las matizaciones
concretas, dado que su destinatario no suele ser un profesional de la psicología, con
las dificultades que supondría un uso abusivo del lenguaje técnico. Por otro lado, en
nuestra opinión, el informe psicopedagógico se encontraría entre el informe técnico
y el certificado, dado que debe informar fundamentalmente acerca del rendimiento
y capacitación escolar, pero al mismo tiempo debe ser conciso y excluir todas las for-
mulaciones que no sean específicas. Los niños detectados con algún “problema” o
cuando los padres solicitan un informe escrito de su hijo, deben ser acompañados de
una entrevista de “devolución” en la que participen los mismos padres con el permi-
so expreso del propio alumno explorado.
Las características básicas que ha de reunir todo informe psicológico, con indepen-
dencia de su contexto, deben ser las siguientes:
Son muchas las propuestas formuladas por los diversos autores para la presentación
de los resultados de una exploración a través de un informe escrito. Á continuación,
vamos a presentar los modelos más representativos de los autores que se han dedica-
do más intensamente al estudio de este tema. Los esquemas que vamos a referir son
los de Maloney y Ward (1976), Pelechano (1976), Sattler (1982) y Fernández-Balles-
teros (1983). Posteriormente, expondremos los puntos básicos que debe cumplir
cualquier informe. Podemos observar que no existen disparidades sustanciales entre
los diversos autores.
El modelo que proponen Maloney y Ward (1976) está dentro de un enfoque
conductual y racional de la organización del material de evaluación (véase cuadro
10.1).
El modelo propuesto por Pelechano (1976) presenta características muy seme-
jantes a las de Maloney y Ward, tanto en su línea teórica como en sus respectivos
apartados (véase cuadro 10.2).
Los modelos de Sattler (1982) y Fernández-Ballesteros (1983) se recogen en los
cuadros 10.3 y 10.4, respectivamente.
En el cuadro 10.5 se presenta una guía con los puntos básicos que deben aparecer
en todo informe.
a. Datos de identificación:
—Nombre, apellidos, edad, sexo, estado civil, nivel de escolaridad y/o pro-
fesión del sujeto evaluado.
—Nombre, apellidos y número de colegiado del psicólogo evaluador.
—Fecha de la evaluación.
b. Motivo de la consulta:
c. Técnicas empleadas:
CUADRO 10.1. Modelo de informe psicológico propuesto por Maloney y Ward (1976)
Nombre y apellidos del evaluador: Fecha de la evaluación
—Nombre:
—Edad:
DATOS PERSONALES: | —Sexo:
—Estado civil:
—Profesión:
DATOS BIOGRÁFICOS:
:
PROCEDIMIENTOS DE EVALUACIÓN:
an | —Técnicas empleadas
Dato blendss
—Habilidades intelectuales
— Aptitudes
—Afectividad
RESULTADOS E INTEGRACIÓN: | —Contacto social
— Motivación
—Nivel de aspiración
—Otros resultados
RESUMEN FINAL:
—Nombre y apellidos
—Sexo
—Estado civil
—Lugar y fecha de nacimiento
—Fecha de la evaluación
—Datos biográficos
1. DATOS DE IDENTIFICACIÓN Y A na NI
RAZÓN DE LA EVALUACIÓN:
—Padres
—Nivel socioeconómico —Familiares
—Propio sujeto
—Nivel cultural
—El examinador
—Actitudes hacia: —La situación de la prueba
—Sí mismo
—Hábitos de trabajo:
—Área visomotora:
: —Precisión
NIVEL DE FUNCIONAMIENTO INTELECTUAL: alidez
Ñ —Positivos
ASPECTOS DE LA PRUEBA: — Negativos
—Nombre y apellidos
—Fecha de nacimiento
DATOS DE IDENTIFICACIÓN: ¿Edad cronológica
—Fecha del examen
—Grado escolar
—Pruebas administradas
—Actitudes hacia el
examinador
ye, —Actitudes hacia la situación
—Características de la prueba
OBSERVACIONES actitudinales: —Actitud hacia sí mismo
GENERALES DE —Hábitos de trabajo
LA CONDUCTA: —Reacción al fracaso
—Reacción al elogio
RECOMENDACIONES:
RESUMEN:
e. Resultados obtenidos:
f.. Integración de los resultados junto con la historia del sujeto de modo que
podamos tener una comprensión completa del caso.
232 Fernando Jimenez
—Nombre y apellidos
—Edad
—Sexo
1. DATOS PERSONALES: LEEN
—Profesión
—Escolaridad
—Lejano
—En su contexto: des
—Próximo
3. DATOS BIOGRÁFICOS RELEVANTES:
—Datos sociodemográficos
—Área de la motricidad
5. CONDUCTA OBSERVADA: —Area verbal
—Actitudes inferidas
—Exploraciones
psiconeurológicas
—Condiciones biológicas: —Exploraciones
psicofisiológicas
—Exámenes físicos
(resumen)
—Área de la motricidad
—Conductas problemas: —Area fisiológica
—Area cognitiva
Relaciones socioambientales:
8. VALORACIÓN DE INTERVENCIONES:
El informe psicológico 233
1. DATOS DE IDENTIFICACIÓN
2. MOTIVO DE LA CONSULTA
3. TÉCNICAS EMPLEADAS
HH
4. CONDUCTA OBSERVADA
5. RESULTADOS OBTENIDOS
7. DIAGNÓSTICO Y PRONÓSTICO
8. RECOMENDACIONES TERAPÉUTICAS
234 Fernando Jiménez
g. Diagnóstico y pronóstico:
—El diagnóstico final sugerido por el psicólogo debe ser una conclusión ba-
sada en una integración de las declaraciones formuladas en cada apartado.
—Se deben evitar “etiquetas diagnósticas” que reducen la realidad de la
complejidad de la conducta humana a una definición “estática” (Marto-
rell, 1988).
—En función de los resultados obtenidos y de la historia del sujeto se harán
las predicciones que el psicólogo considere acerca de la evolución que
puede presentar el sujeto, tanto en el caso de que siga un tratamiento
como en el caso contrario.
h. Recomendación terapéutica o de intervención:
Cuando nos disponemos a elaborar un informe son muchos los interrogantes que
nos planteamos: ¿cuál es el enfoque que debo emplear?, ¿qué material debe de ser in-
cluido en el informe?, ¿qué terminología empleo?, las pruebas aplicadas, ¿las refiero
por sus iniciales o por el contrario hago una breve exposición de cada una de ellas?,
¿qué extensión debe tener un informe?, ¿el informe debe analizar todo lo relaciona-
do con las habilidades y personalidad del paciente además de los datos cuantitativos
obtenidos del rendimiento de éste?, ¿debo razonar todas las deducciones o conclu-
siones obtenidas proponiendo un ejemplo?, ¿hago un resumen final?, etcétera.
Tallent (1983) solicitó a una muestra de 1400 sujetos formada por psicólogos,
psiquiatras y asistentes sociales, siguiendo la técnica de Rotter, que completasen la
siguiente frase: «el problema de los informes psicológicos es que...». Los resultados
de la encuesta señalaron que los principales problemas de los informes psicológicos
se centraban en tres aspectos: la terminología técnica empleada (tanto psicológica
como psiquiátrica), la ambigitedad de los términos y la falta de organización y preci-
sión del informe.
Como norma general es necesario tener muy claro cuál es el objetivo del informe
y dar respuesta a los interrogantes planteados en el momento en que el sujeto fue re-
querido para la evaluación. Los criterios prácticos que señala Sattler (1982), tomados
de Sargent (1951), para saber apreciar cuál es el material que se debe incluir en un in-
forme, son referidos por la naturaleza del problema que indujo a la evaluación, fina-
lidad de las pruebas y características de las personas para las que escribe el informe.
Pueden incluirse datos que, aunque aparentemente se aparten del tema esencial, pue-
den tener implicaciones importantes. En los informes no es conveniente siempre es-
pecificar los diferentes “pasos” que nos han conducido a las inferencias, conclusio-
nes, recomendaciones y formulaciones diagnósticas; sin embargo, es necesario
El informe psicológico 235
referirse a los datos originales sobre los que se basan las inferencias (Sattler, 1982;
Martorell, 1988).
Con respecto al grado de certeza que debemos utilizar en el informe, quizás este-
mos demasiado acostumbrados a emplear con bastante frecuencia las palabras “pro-
bablemente”, “tal vez”, “parece que” o semejantes cuando no estamos completa-
mente seguros de nuestras predicciones, deducciones o conclusiones. Cuando
tengamos la seguridad de datos fiables, seguros y definitivos, démosle convicción
presentándolos con toda confianza.
En la elaboración del informe es importante ofrecer e insistir en la presencia de
datos o rasgos de comportamiento más que en su ausencia. Podríamos hacer una lis-
ta de aspectos que no posee el paciente y no tiene nada que ver con el motivo de la
consulta, ya que éste no es nuestro objetivo. No obstante, sería interesante hacer alu-
sión a algunas características ausentes cuando el foco del informe coincide con el
motivo de la consulta. Es conveniente citar siempre la fuente de información cuando
se afirma algo que no ha podido verificarse directamente. Por ejemplo: «según la
maestra ...», «de acuerdo con el informe presentado por el psicólogo del colegio....».
Con respecto al lenguaje y terminología que debemos emplear, hemos de tener
como norma general que el destinatario del informe llegue a entender lo que noso-
tros le queremos decir. En consecuencia, es necesario ajustar la terminología y el len-
guaje según el remitente. En el caso de que no nos pudiera entender, se hace necesa-
rio una entrevista para su mejor comprensión (Fernández-Ballesteros, 1983). Con
un lenguaje abstracto, con frases e ideas excesivamente generales o una terminología
demasiado específica o profesional, sin tener en cuenta el nivel cultural o la profesio-
nalidad del destinatario, lo único que conseguimos es hacer inútil nuestro trabajo. El
lenguaje debe ser claro, sencillo, preciso y sin ambigúedades. Un informe lleno de
ambigúedades y generalidades seguramente va a producir una interpretación erró-
nea. Lo mismo ocurre cuando el informe se encuentra elaborado con frases deducti-
vas incorrectas e inexactitudes. No obstante, tampoco sería correcto emplear un len-
guaje chabacano y excesivamente vulgar que reste seriedad y rigurosidad científica al
informe.
Como regla general no deben usarse abreviaturas en el informe. No obstante,
Sattler (1982) admite el uso de CI (cociente intelectual), EM (edad mental) y EC (edad
cronológica). Probablemente, en el ámbito cultural español, y no siendo el destina-
tario un profesional de la psicología, podemos encontrarnos con problemas al no es-
pecificar incluso estas mismas siglas aludidas por Sattler.
A modo de resumen exponemos los principios normativos para la elaboración
del informe de Emerick y Hatten (1974):
REFERENCIAS BIBLIOGRÁFICAS
Appelbaum, S. A. (1970). Science and persuasion in the psychological test report. Journal of
_ Consulting and Clinical Psychology, 35, 349-355.
Avila, A., Ortiz, P. y Jiménez, F. (1992). El informe psicológico en la clínica. En A. Ávila
(dir.), Evaluación en psicología clínica I: proceso, método y estrategias psicométricas. Sala-
manca. Amarú.
Bringmann, W. G., Pakula, C. y Balance, W. D. (1978). Acceptance of oral and writen psy-
chological reports by clients. Perceptual and Motor Skills, 46, 1022.
Cameron, R. y Shepel, L. (1981). Strategies for preserving the confidentiality of psychologi-
cal reports. Canadian Psychology, 22, 191-193.
Colegio Oficial de Psicólogos (1987). Código deontológico del psicólogo. Madrid. COP.
Dana, R. (1982). An human science model for personality assessment with projective techni-
que. Springtield. Charles C. Thomas.
Emerick, L. L. y Hatten, J. T. (1974). Diagnosis and evaluation in speech pathology. Nueva
York. Prentice-Hall.
Fernández-Ballesteros, R. (1983). Comunicación de los resultados del proceso: el informe.
En R. Fernández-Ballesteros (dir.), Psicodiagnóstico (vol. 1). Madrid. UNED.
Foster, A. (1951). Writing psychological reports. Journal of Clinical Psychology, 7, 195.
Hammond, K. R. y Allen, J. M. (1953). Writing clinical reports. Nueva York. Prentice-Hall.
Heiss, R. (1964). Methodik and problematik des psychologischen Gutachtens. Gotinga. Hogrefe.
Huber, J. T. (1961). Report writing in psychology and psychiatry. Nueva York. Harper and Row.
Kipnowski, A. (1981). Hinweise fur die gestaltung psychologischer Gutachten. Psychologie
und Praxis, 25, 183-190.
Maloney, M. P. y Ward, M. P. (1976). The psychological report. En M. P. Maloney y M. P.
Ward (dirs.), Psychological assessment. A conceptual approach. Nueva York. Oxford Uni-
versity Press.
Martorell, M. C. (1988). Técnicas de evaluación psicológica (vol. 1). Valencia. Promolibro.
Pelechano, V. (1976). Psicodiagnóstico. Madrid. UNED.
Sargent, H. D. (1951). Psychological test reporting: An experiment in comunication. Bulletin
of the Menninger Clinic, 15, 175-186.
Sattler, J. M. (1982). Evaluación de la inteligencia infantil y habilidades especiales. México. El
Manual Moderno.
Silva, F. (1985). Cuestiones deontológicas en el diagnóstico psicológico. En F. Silva (dir.). Psi-
codiagnóstico: teoría y aplicación. Valencia. CESPU. )
Tallent, N. (1980). Report writing in special education. Nueva Jersey. Prentice-Hall.
Tallent, N. (1983). Psychological report writing. Nueva Jersey. Prentice-Hall.
Tallent, N. (1987). Computer-generated psychological reports: A loock at the modern psy-
chometric machine. Journal of Personality Assessment, 51, 95-108.
Weed, 1. B. (1970). Medical records, medical evaluation and patien care. Cleveland. Western
Herserve University.
Wiener, ]. y Kohlert, S. (1986). Parent's comprehension of psychological reports. Psychology
in the Schools, 23, 265-270.
LECTURAS COMPLEMENTARIAS
I. INTRODUCCIÓN
En este capítulo se pretende mostrar una serie de ideas generales sobre aquellas con-
ductas más deseables a la hora de realizar una evaluación psicológica. Una informa-
ción más específica (sobre todo acerca del uso de los tests psicológicos) se puede en-
contrar en códigos elaborados para tal efecto por las asociaciones de psicología en
los diferentes países. Un ejemplo de estos códigos lo constituyen las sucesivas revi-
siones de los Standards for educational and psychological tests elaboradas y publica-
das por la American Psychological Association (APA) (American Psychological
Association, 1985).
Sin caer en un discurso demasiado moralista o legalista, procuraremos a través
del texto expresar algunas ideas u orientaciones generales y no principios o normas
de conducta. Sin duda, consideramos al propio psicólogo como parte significativa de
la responsabilidad del carácter científico de su práctica y, en este caso concreto, de la
evaluación psicológica que realiza. Sin embargo, este margen de libertad del psicólo-
go no puede ir en contra de valores universalmente aceptados. Estos valores forman
parte de la práctica psicológica y justifican la elaboración de códigos de conducta
por parte de los psicólogos. Por otro lado, se trata de ideas y orientaciones generales
que por sí mismas poco dicen acerca de la utilización concreta de las pruebas psico-
lógicas y del procedimiento de evaluación. El lector debe buscar esta información
más técnica y específica en manuales técnicos de las diferentes técnicas de evaluación
psicológica (observación, registros psicofisiológicos, tests psicológicos, etcétera).
Por último, tomaremos como punto de referencia el empleo de las pruebas psi-
cológicas. A pesar de que la evaluación psicológica es un concepto mucho más am-
plio, abarcando toda la conducta inherente a la apreciación de las características de
las personas o grupos, consideramos que las cuestiones de tipo deontológico se ilus-
tran mejor y se hacen más fácilmente comprensibles si nos limitamos al uso de prue-
bas o tests psicológicos.
En las últimas décadas, la evaluación psicológica no ha recibido las mejores refe-
rencias por parte del público y el mejor aprecio posible por parte de los propios psi-
cólogos. Se puede establecer una diferencia clara del papel de la evaluación psicoló-
gica, y en concreto de los tests psicológicos, entre las décadas de los años treinta y
cuarenta y las décadas de los años setenta y ochenta. No sólo las pruebas psicológi-
cas son menos usadas en la actualidad, sino que también se han formulado varias crí-
ticas a su empleo. La asociación realizada entre tests psicológicos y decisiones discri-
minatorias que no respetan los derechos de las minorías constituye el origen
TI. CONCLUSIONES
mitir la venta y el uso de las pruebas psicológicas por otros que no sean psicólogos;
en estos casos, es el profesor el responsable del uso de las pruebas. Un problema fre-
cuente que nos encontramos aquí es el de la reproducción (fotocopiado) del mate-
rial. Aparte de los derechos editoriales, esta práctica estudiantil da lugar a la vulgari-
zación de algunas pruebas entre el público, quitándoles cualquier significado en usos
futuros (y más grave todavía es cuando el psicólogo no tiene conocimiento de ello).
En segundo lugar, es importante analizar el empleo de los ordenadores en laeva-
luación psicológica. No habría mayores problemas cuando su empleo se asocia a la
generación de ítems y su presentación a los sujetos, y a la corrección y puntuación de
los resultados. En nuestra opinión, si la elaboración y aplicación de ítems se hace
de una forma sensata y encontrándose el sujeto en condiciones normales frente al
ordenador, no habría problemas en su empleo en tareas de evaluación. La corrección
y puntuación de los resultados por vía informática no nos merece comentarios nega-
tivos; normalmente, la frecuencia de error en comparación al factor humano es me-
nor. No obstante, es importante que las condiciones de aplicación estén estandariza-
das. Un uso de los ordenadores en evaluación psicológica menos frecuente, pero no
por ello menos importante, es la elaboración de perfiles psicológicos y, especialmen-
te, la síntesis interpretativa de los resultados. Si ya la elaboración del perfil nos ofrece
algunas dudas, puesto que no siempre el softawvare da lugar a un análisis minucioso de
la interacción necesaria entre las características del sujeto y los resultados obtenidos,
la interpretación de los resultados, la interpretación del perfil y la elaboración de las
conclusiones nos merece las mayores reservas. Hasta el momento podemos afirmar
que el ordenador no consigue integrar e interrelacionar los resultados obtenidos, no
siempre convergentes entre sí. Las disonancias momentáneas verificadas en pruebas
y momentos de la evaluación requieren de la formación básica y específica del psicó-
logo, además de su experiencia e intuición. Sólo así, y siempre relativamente, pode-
mos interrelacionar y describir coherentemente una individualidad psicológica eva-
luada. Un ejemplo de ello es la importancia que tiene la entrevista o la anamnesis que
el psicólogo debe incluir siempre como medio de evaluación psicológica. Otras in-
terpretaciones de este asunto, o la defensa de la evaluación psicológica “vía ordena-
dor”, proporcionaría más pronto o más tarde nuevos reveses o confusiones en la in-
vestigación y práctica de la psicología.
Por último, cabe analizar la actuación asumida por las universidades y por las
asociaciones científicas y profesionales de psicología. En nuestra opinión, estas insti-
tuciones deberían tener una opinión más fundamentada y una posición más incisiva
y pública acerca de los aspectos deontológicos de la evaluación psicológica, en una
lógica defensa tanto de la psicología y de los psicólogos como del público usuario.
Así, un aspecto que urge clarificar es el concepto de prueba psicológica. Varios ins-
trumentos de evaluación clínica, educacional y social son empleados en la actualidad
de modo indiscriminado por psicólogos y otros técnicos. Al mismo tiempo se verifi-
ca una gran proximidad entre evaluación psicológica y evaluación educacional, por
ejemplo, a nivel de infancia o en lo que respecta al desarrollo psicológico, o qué sig-
nifica en varios países su uso indiscriminado por los psicólogos, consejeros o profe-
sores (señálese que los standards de la APA cubren estos dos grupos de pruebas y es-
tos diferentes profesionales). Sería relevante distinguir aquí cuáles son pruebas
psicológicas y cuáles no, puesto que las primeras —por lo que hemos dicho a lo lar-
Deontología y evaluación psicológica 247
go del texto— sólo deben ser empleadas por el psicólogo. Las asociaciones científi-
cas y profesionales deben asumir respecto a la evaluación psicológica actitudes de
garantía de su calidad técnica y deontológica, incluyendo la penalización de los abu-
sos. Lo antes posible, los instrumentos de evaluación psicológica deberían estar de-
bidamente identificados, exigiendo el título de psicólogo para su empleo. Al mismo
tiempo deben asegurarse estudios de validación de las pruebas y de los procedimien-
tos de evaluación que mantengan actualizados sobre todo los parámetros normati-
vos de interpretación de sus resultados. La falta de tales preocupaciones respecto a la
mejoría técnica o a la ausencia de procedimientos de investigación más claros en re-
lación a la evaluación psicológica ha dado lugar a la aparición de prácticas desacredi-
tadoras de la psicología en general. Sin estudios de “control de calidad” como sucede
en otras áreas de la vida social (por ejemplo, el área de salud) se deteriorá la imagen
de la psicología y de los psicólogos. La evaluación psicológica es todavía una de las
referencias más sensibles e importantes de la práctica psicológica para que pueda ser
abandonada.
REFERENCIAS BIBLIOGRÁFICAS
LECTURAS COMPLEMENTARIAS
American Psychological Association (1985). Standards for educational and psychological tes-
ting. Washington, D.C. APA. e es
Colegio Oficial de Psicólogos (1988). Código deontológico del psicólogo. Evaluación Psico-
logica/Psychological Assessment, 4, 113-121.
50%
me cal 4) ?
a y eri 4 007 usd
sí tl ia CP Mi.ea
DN ny:
pu
AE o ile ie—
aba e ya ed lana)
- pts -. pde
"IO 0 a S
1) 4 onertolaT
«F ,
A
4
í y 2 í 15
Y ' j: 120 H4
Lao! = 5
54 Ñ ”d 2
>
(
EA a
>
j
>
va7 i
L- - l
Li + ¿ a] )
34 Et
z y >
»
SEGUNDA PARTE
CARMEN GARCÍA-MONTALVO
I. INTRODUCCIÓN
Universidad de Murcia.
252 Carmen García-Montalvo
otro). Por tanto, se trataría de «[...] aquellos procedimientos que, derivados de las
técnicas metódicas, permiten la obtención concreta de información y de datos» (Fer-
nández-Ballesteros, 1992, p. 41); de hecho, esta autora nos habla de «procedimientos
de recogida de información», al igual que otros autores utilizan la expresión «estra-
tegias de exploración». En esta misma línea, Pelechano (1988) define las técnicas de
evaluación psicológica como procedimientos utilizados tanto en el laboratorio
como en el mundo social para la realización de una evaluación psicológica. Esta acla-
ración está dirigida a diferenciar de forma coherente las técnicas de evaluación, vistas
así de forma general, de los tests, un tipo de técnica concreta, restringida por una se-
rie de características determinadas (todas ellas relacionadas con la estandarización
del material, administración y corrección...). Por su parte, Keller y cols. (1990) nos
ofrecen la siguiente definición: <[...] se caracterizan [los tests] por la naturaleza es-
tructurada y estandarizada de sus estímulos, de las opciones de respuesta que se pre-
sentan al sujeto y de las estrategias de puntuación e interpretación».
Junto a lo anterior, también resulta de interés establecer una distinción, porque
así parece haberse establecido en la realidad, entre aplicación de tests y evaluación.
En efecto, este último es ahora un concepto más amplio. En la actualidad los psicó-
logos no se limitan a administrar tests sino que realizan evaluaciones. Keller y cols.
(1990), autores de uno de los capítulos del Handbook of psychological assessment
[Manual de evaluación psicológica], afirman que el título de la obra se escogió deli-
beradamente y pretendía transmitir la idea de que no es simplemente un libro sobre
tests psicológicos —como tampoco lo es el que el lector tiene en sus manos. El tér-
mino evaluación implica que hay muchas formas de evaluar las características y dife-
rencias individuales. La aplicación de tests es una de las formas posibles, pero tam-
bién están las entrevistas, la observación y los registros psicofisiológicos, por citar
algunas.
La identificación entre psicodiagnóstico y tests se produjo inicialmente por ra-
zones históricas. El término psicodiagnóstico se enraizó en dos “orientaciones” cla-
ramente diferenciadas; una cualitativa, iniciada a partir de la propuesta de H. Rors-
chach sobre su test, y otra que pretendía paliar la fuerte carga cualitativa de la
anterior, la psicométrica. A partir del fuerte desarrollo que a lo largo de la historia de
esta disciplina adquirió esta segunda corriente se produjo pronto un olvido de cual-
quier otro aspecto relacionado con el psicodiagnóstico que no fueran los tests y, por
ende, una correspondencia entre ambos términos. Así, el psicodiagnóstico era y se
reducía a la “testología”, y ésta se convirtió en la única instrumentación “respetada”
dentro de aquélla.
Como ya hemos adelantado, y de forma afortunada a nuestro juicio, la evalua-
ción psicológica y/o el psicodiagnóstico (considerado el término en su acepción más
amplia) han logrado finalmente reconvertirse en un proceso bastante más amplio,
completo y exhaustivo que el mero “testar”, teniendo a su disposición una “tecnolo-
gía” que a su vez no se reduce al uso de tests, por más que éstos sigan considerándose
como técnicas de uso muy común dentro de nuestro ámbito y por más que un buen co-
nocimiento de ellos y de sus fundamentos técnicos y teóricos facilite en muchos
casos la tarea de evaluación.
Una vez comentado todo lo anterior como estrategia para ubicar al lector en es-
te capítulo y como toma de postura del autor frente al mismo, pasamos a describir
Clasificación de las técnicas de evaluación psicológica 253
a continuación algunas de las clasificaciones más habituales y los criterios que las
sustentan para finalizar después con un comentario acerca del estatus actual de las
mismas.
mediante otros instrumentos (los pertenecientes a la otra categoría que vamos a co-
mentar), estudiarlo en profundidad y operativizarlo para que sea tratado.
b. Estrategias específicas: van dirigidas al estudio y análisis de aquellos proble-
mas específicos que se han detectado a través de técnicas más generales y/o de otros
concomitantes que puedan estar determinándolos; se trata de autoinformes, inven-
tarios sobre variables concretas (miedos, temores, asertividad, ansiedad, depre-
sión...) que nos permiten evaluar de forma más fina y minuciosa lo que se ha deter-
minado como problemático en un primer acercamiento.
Como vemos claramente, se trata de una clasificación muy amplia que única-
mente nos aclara a grandes rasgos que a lo largo del proceso general de evaluación el
psicólogo dispone de dos tipos de estrategias que podrá utilizar según el momento
del proceso en que se encuentre.
Estas pruebas exigen al sujeto que las cumplimenta que rinda al máximo de sus posi-
bilidades (Pelechano, 1988). Por tanto, se pretende evaluar «la capacidad máxima de
ejecución por parte del sujeto» (Cronbach, 1972, p. 56); son usualmente pruebas de
inteligencia —Cronbach las denomina “tests de habilidad” o que pretenden evaluar
variables cognitivas como la atención, las aptitudes espaciales, verbales, mecánicas,
musicales, etc. Además, son pruebas en las que el sujeto puede rendir menos de lo
que le permiten sus capacidades pero nunca más que su propio límite (Pelechano,
1988). A su vez, esa falta de rendimiento puede estar motivada por multitud de fac-
tores (motivación, atención, fatiga...) que son ajenos al propio instrumento, ya que
éste no los puede controlar. Normalmente, estas pruebas incluyen tareas en las que
lo importante es el nivel de dificultad de los problemas.
Según Cronbach (1972), estas técnicas intentan precisar la conducta típica del sujeto
o, lo que es lo mismo, lo que acostumbra a hacer en una determinada situación o en
una amplia gama de circunstancias.
Por tanto, el nivel de exigencia en ellas es mucho menor que en las anteriores, ya
que la tarea solicitada a los sujetos es que encuentren la respuesta que primero se les
ocurra, que les parezca más habitual para ellos o para la persona que están enjuician-
do o que consideren verdadera (Pelechano, 1988). Normalmente, incluyen la evalua-
ción de rasgos temperamentales, emocionales o afectivo-actitudinales. Por otro
lado, la finalidad de la aplicación de este tipo de instrumentos que pretenden evaluar
Clasificación de las técnicas de evaluación psicológica 255
Tipo de material
Cuando uno analiza las técnicas de evaluación psicológica desde la perspectiva del
tipo de material que utilizan es frecuente encontrarse con dos categorías: pruebas de
papel y lápiz, y pruebas ejecutivas o de “actuación” que generalmente implican el
uso de aparatos u objetos a manipular. Ahora bien, esta clasificación inicialmente di-
cotómica no lo es tanto, o al menos no lo es necesariamente. Así, Pelechano (1988)
—retomando a nuestro juicio la opinión de Cronbach (1972)— afirma que una clasi-
ficación más próxima a la realidad sería la siguiente: tests de papel y lápiz, man1pula-
tivos de objetos y de aparatos. Entre los primeros estaríamos incluyendo únicamen-
te aquellos tests en los que se utiliza de forma exclusiva material impreso, que el
sujeto tiene que leer y/o señalar con un lápiz o cualquier otro objeto; cuestionarios
de personalidad, pruebas de inteligencia (del tipo aptitudes), con series de números
y/o letras serían ejemplos de esta categoría. En segundo lugar, tendríamos las técni-
cas “ejecutivas”, que incluyen problemas en los que se utilizan distintos tipos de ma-
teriales (rompecabezas, historietas, construcción de bloques...). Finalmente, nos
quedarían todos aquellos instrumentos en los que se utilizan específicamente apara-
tos, como por ejemplo el taquistoscopio, el polirreactígrafo, lasilla vibrátil, eltorno
con receptor de trazado, etc., dirigidos a la evaluación de variables como el tiempo
de reacción, movimientos oculomotores, fenómenos perceptivos, etc. En la actuali-
dad resulta obligado incluir en esta categoría al ordenador, ya que éste ha traído con-
256 Carmen García-Montalvo
Modo de aplicación
Se trata, tal vez, de uno de los criterios de clasificación cuyo uso da como resultado
las dos categorías más evidentes y, probablemente, también las mejor definidas: tests
individuales y tests colectivos. Simplificando al máximo su definición, en el primer
caso un sujeto realiza el test y en el segundo un grupo de sujetos lleva a cabo el test
durante la misma sesión. Sin embargo, debemos enumerar, pese a la claridad de la di-
cotomía, algunas otras características de ambos tipos de pruebas (Pelechano, 1988):
a. Tests individuales:
b. Tests colectivos:
Esta es también una categorización muy obvia en la mayoría de los casos, que
tradicionalmente divide los instrumentos de evaluación según los criterios que se
han utilizado en la elaboración, distribución y validación de los mismos, tales
como el nivel evolutivo o si se trata de poblaciones especiales (Pelechano, 1988).
De este modo, se habla de pruebas infantiles, pruebas de adultos y pruebas di-
rigidas a poblaciones especiales (ciegos, sordos, personas con deficiencias psí-
quicas...).
Construcción racional
Construcción empírica
Los ejemplos más representativos de técnicas construidas según este tipo de es-
trategia son el Inventario multifásico de personalidad de Minnesota, el Inventario
psicológico de California de Gough y el Inventario de intereses vocacionales de
Strong. En el capítulo dedicado a la evaluación de rasgos de personalidad se analiza-
rán muy detenidamente al menos la primera de estas pruebas que, por otro lado, sue-
le ser punto de referencia obligado para ejemplificar esta estrategia de construcción.
Se trata, sin lugar a dudas, de la estrategia que ha generado una mayor productividad
en el campo de la evaluación de la personalidad. No obstante, hay que aclarar que en
este enfoque intervienen implícitamente las estrategias anteriormente expuestas: teó-
rico-racional (selección de reactivos, denominación de los factores...) y empírica. Es el
empleo del análisis factorial el que define de forma diferencial este tipo de instrumen-
tos frente a los analizados hasta ahora. Mediante él, se agrupan los reactivos en torno a
ciertos factores o, lo que es lo mismo, lo que hace el análisis factorial es agrupar los re-
activos que tienen relación entre sí en unidades más generales. Con ello pretendía lle-
garse a la obtención de un número lo más exhaustivo posible de ítems que nos permi-
tiera obtener la totalidad de rasgos de nuestra personalidad. Sin embargo, el
planteamiento anterior, aparentemente sencillo, ha provocado multitud de contro-
versias, entre otras cosas porque la naturaleza completa del significado de un factor
no es posible aclararla por procedimientos estadísticos (Lanyon y Goodstein, 1977) y
porque, más allá de todo ello, aún cabría la pregunta considerada por Lanyon y Go-
odstein como la esencia psicológica de la personalidad: ¿son los factores rasgos reales?
La respuesta a esta pregunta ha provocado diversidad de posturas teóricas y, conse-
Clasificación de las técnicas de evaluación psicológica 259
Este autor nos ofrece una clasificación basada en cuatro ejes, dentro de los cuales
aparece, a su vez, una serie de subcategorías. Veamos:
— Directas-indirectas.
— Respuesta libre o de elección.
— Con o sin influencia cultural.
— Rendimiento máximo.
— Rendimiento típico.
Este autor plantea una serie de alternativas que pasamos a exponer; tal vez su mayor
aportación es el reconocimiento de que las dicotomías planteadas son más bien po-
260 Carmen García-Montalvo
los de continuos, idea que aparece también en la clasificación de Cone que comenta-
remos más adelante.
a. Enrelación con el criterio: directas e indirectas.
b. Según el material: papel y lápiz, y rendimiento.
c. Según la finalidad: tests de velocidad y de potencia.
La propuesta de este autor se centra en las respuestas que la persona da ante distintos
estímulos referidos a diferentes aspectos de la conducta, ya que ello requiere proce-
dimientos diferentes e independientes entre sí; es decir, cada procedimiento evalúa
una variable dada de forma distinta. Consecuentemente, Fiske propone las siguien-
tes categorías de clasificación:
A poco que nos fijemos, nos daremos cuenta de que la propuesta de Fiske parece
incluir las diferentes posibilidades en cuanto a instrumentos que completarían una
valoración exhaustiva y global de un sujeto.
Clasificación de las técnicas de evaluación psicológica
261
Según Martorell (1988), Cone también relaciona, a su vez, los distintos procedi-
mientos con el grado de subjetividad (indirecto) u objetividad (directo), y de hecho
la ubicación de la autobservación en un lugar medio del continuo ejemplifica lo ante-
rior (Silva, 1982). Otra de las características del trabajo de Cone es que a partir de la
base clasificatoria anteriormente planteada, complica su continuo con un sistema or-
togonal que atiende por un lado a la fuente de información (uno mismo-otros) y por
otro a la “accesibilidad” a la conducta (privado-público). Añadiendo estos nuevos
criterios resulta que los autoinformes se encuentran en el cuadrante uno mismo-pri-
vado; la autobservación en el de uno mismo-público, las evaluaciones (estimaciones
y calificaciones) por otros en el cuadrante otros-privado y las observaciones directas
en el de otros-público.
262 Carmen García-Montalvo
Este autor utiliza para agrupar las técnicas de evaluación tres criterios dicotómicos
básicos:
Voluntario-indirecto-respuesta libre.
Voluntario-indirecto-respuesta estructurada.
Voluntario-directo-respuesta libre.
Voluntario-directo-respuesta estructurada.
Objetivo-indirecto-respuesta libre.
Objetivo-indirecto-respuesta estructurada.
Objetivo-directo-respuesta libre.
309
HP
SA
AP Objetivo-directo-respuesta estructurada.
Clasificación de las técnicas de evaluación psicológica 263
_ Las seis primeras categorías son más apropiadas para evaluar la personalidad,
mientras que las dos últimas son más adecuadas para evaluar habilidades y rendi-
miento (Silva, 1982; Martorell, 1988).
a. Técnicas proyectivas. Son definidas como instrumentos que han sido consi-
derados como especialmente sensibles para revelar aspectos inconscientes de la con-
ducta, permitiendo provocar una amplia variedad de respuestas subjetivas; además,
son altamente multidimensionales y evocan respuestas y datos inusualmente ricos
con un mínimo de conocimiento por parte del sujeto del objetivo del test. Tal defini-
ción describe de manera implícita el marco teórico en el que han descansado este
tipo de instrumentos: las teorías dinámicas de la personalidad y su conceptualiza- -
ción de la misma como algo global, que se infiere a partir del comportamiento explí-
cito. Además, podemos caracterizarlas como enmascaradas y no voluntarias, aun-
que el material de estímulo es muy variado, lo que da lugar a diversas clasificaciones:
estructurales, temáticas, expresivas, CONStructivas y asociativas.
b. Técnicas psicómetricas. Se caracterizan por ser estructuradas, voluntarias y
asociadas con teorías de base empírica, que aceptan el informe verbal y se conocen
genéricamente bajo la denominación de tests. Fernández-Ballesteros (1980, p. 166)
las define como «tests que han sido elaborados a través de procedimientos estadísti-
cos altamente sofisticados, con material rigurosamente estandarizado y tipificado en
sus tres fases fundamentales: aplicación, corrección e interpretación».
c. Técnicas subjetivas. Sus característivas fundamentales son:
Este apartado incluye gran diversidad de pruebas, con enfoques teóricos subya-
centes también muy variados. De entre ellas, tal vez sea la entrevista la más utilizada,
la de más amplia tradición y la de un espectro mayor —téngase en cuenta que su uso
no se encuentra restringido a nuestra disciplina, sino que desempeña un papel pri-
mordial en otras ciencias: medicina, investigación social, pedagogía, industria, etc.
Además de la entrevista, se consideran pruebas subjetivas las listas de adjetivos, la
técnica Q, la “rejilla” de Kelly, el diferencial semántico de Osgood y el análisis de
documentos personales. Las listas de adjetivos (por ejemplo, la ACL de Gough, la
DACL de Lubin) permiten una evaluación tanto cualitativa como cuantitativa, califi-
cando, describiendo o clasificando a los sujetos en función de diferentes adjetivos
que le son propios, en tanto que le son asignados por sí mismos o por otros. En este
mismo sentido se orientan las técnicas “Q” (California Q-set, Evaluación del auto-
concepto, Ajuste personal), basadas todas ellas en la técnica original de Stephenson.
Por su parte, Osgood, a partir de la década de los años cincuenta, propone el Dife-
rencial semántico como técnica de evaluación de las valoraciones de estímulos se-
mánticos que hacen los sujetos a través de escalas de estimación, definidas por adjeti-
vos bipolares, con finalidades tan diversas como evaluación de percepciones,
investigación o valoración de programas de intervención. Finalmente, no sería justo
relegar de estas líneas los trabajos de Kelly, dirigidos a evaluar las construcciones que
los sujetos utilizan para definir y clasificar su entorno, para ordenar la realidad y las
relaciones interpersonales.
d. Técnicas objetivas. Estas pruebas tienen las siguientes características:
Por otro lado, las técnicas psicofisiológicas han aumentado su estatus de forma
muy significativa en los últimos años. Tal vez es por eso que, en muchos casos, apa-
recen separadas de la categoría que inicialmente las incluía: las técnicas objetivas. En
efecto, es obvio que en la actualidad no tienen la misma relevancia diagnóstica Otras
pruebas objetivas (por ejemplo, las dirigidas al estudio de variables cognitivas o mo-
toras) que éstas. Y esto era algo que ya se preveía desde que resurgió en nuestro ám-
bito un creciente interés por las variables biológicas. Este interés fue puesto de relie-
ve de forma clara en un trabajo de Carbonell, Carpintero y Silva (1988),en el que
recogían las opiniones de los autores más relevantes dentro de nuestra disciplina res-
pecto a las perspectivas futuras de la misma. En la actualidad se insiste en la necesi-
dad de integración de diferentes niveles de evaluación, necesidad en la que no pue-
den ni deben quedar excluidas las variables fisiológicas. Ni que decir tiene que una
toma de postura como la anterior provoca consecuentemente el desarrollo de técni-
cas que puedan evaluar esas variables de interés.
266 Carmen García-Montalvo
profesional pensó que las reivindicaciones que se hacían para estos tests no se podían
justificar.
b. Los avances en procedimientos alternativos, especialmente el Minnesota
multiphasic personality inventory (MMPI) y otros tests objetivos, convencieron a
muchos clínicos de que la información que antes se conseguía con los tests proyecti-
vos se podía obtener con mayor eficacia y menores costos utilizando los métodos
objetivos. En concreto, la voluminosa literatura de investigación sobre el MMPI ha
demostrado su utilidad en una variedad sumamente amplia de contextos clínicos y
de investigación. Cuando el MMPI y otras técnicas objetivas afines se confrontaron
con los tests proyectivos durante los días de la controversia “vidente versus signo”,
se demostró de forma generalizada que el signo era igual de bueno o de malo que el
vidente en la mayoría de los estudios realizados (Meehl, 1954).
Cc. En general, las técnicas proyectivas no son ateóricas y, de hecho, se suelen
ver como asociadas a una u otra rama de la teoría psicoanalítica.
Justo sería decir en este punto que tal vez el único superviviente del naufragio
descrito es el Rorschach. Muchos clínicos siguen usándolo y el trabajo de Exner y
sus colaboradores le ha dado una creciente respetabilidad científica.
En resumen, éste es el panorama que presenta el campo de la tecnología de eva-
luación psicológica en el momento actual. Ni que decir tiene que el análisis podría
hacerse desde otros puntos de vista y que es más que probable que existan perspecti-
vas que aquí no se han contemplado; sin embargo, pese a ello, creemos haber cum-
plido con el objetivo básico que un capítulo sobre clasificación de técnicas de evalua-
ción psicológica debe cubrir: que el lector, evaluador o futuro evaluador termine con
una visión ordenada de las principales posibilidades técnicas que tiene a su alcance
en la actualidad para realizar su trabajo; el resto, es decir, el conocimiento más dete-
nido de las distintas estrategias y la elección de las más adecuadas para cada tarea son
objetivos a cumplir por la totalidad de este manual.
REFERENCIAS BIBLIOGRÁFICAS
Carbonell, E. ]., Carpintero, H. y Silva, F. (1988). La evaluación psicológica vista por los eva-
luadores: una encuesta de sus perspectivas futuras. Evaluación Psicológica/Psychological
Assessment, 4, 259-414.
Cone, J. D. (1978). The behavioral assessment grid (BAG): A conceptual framework and a ta-
xonomy. Behavior Therapy, 9, 882-888. Las
Cronbach, L. ]. (1972). Fundamentos de la exploración psicológica. Madrid. Biblioteca Nueva.
Delis, D. C., Kramer, J. H., Kaplan, E. y Ober, B. A. (1987). CVLT: California verbal lear-
ning test: Research edition, manual. San Antonio. The Psychological Corporation Har-
court Brace Jovanovich.
Drenth, P.J. (1969). Der psychologische test. Múnich. Barth. 122980
Fernández-Ballesteros, R. (1980). Psicodiagnóstico. Concepto y metolología. Madrid. Cincel-
Kapelusz.
Hd Ban R. (1992). Conceptos y modelos básicos. En R. Fernández-Balleste-
ros (dir.), Introducción a la evaluación psicológica (vol. 1). Madrid. Pirámide.
Fiske, D. W. (1971). Measuring the concepts ofpersonality. Chicago. Aldine.
Golden, G. (1981). The Luria-Nebraska children's battery: Theory and formulation. En
G. W. Hynd y J. E. Obrzut (dirs.), Nexropsychological assessment and the school-aged
child: Issues and procedures. Nueva York. Grune and Stratton.
Golden, C. J., Hammeke, T. A. y Purisch, A. D. (1980). The Luria-Nebraska battery
manual. Los Ángeles. Western Psychological Services.
Golden, C. J., Purisch, A. D. y Hammeke, T. A. (1985). Luria-Nebraska neuropsychological
battery: Forms I and II, manual. Los Angeles. Western Psychological Services.
Goldstein, G. y Hersen, M. (1990). Historical perspectives. En G. Goldstein y M. Hersen
(dirs.), Handbook ofpsychological assessment. Nueva York. Pergamon Press.
Hiltmann, H. (1966). Kompendium der psychodiagnostischen tests. Berna. Huber.
Irle, M. (1956). Die klassifikation von tests. Diagnostika, 4, 61-66.
Keller, L. S., Butcher, J. N. y Slutske, W. S. (1990). Objetive personality assessment. En
G. Goldstein y M. Hersen (dirs.), Handbook of psychological assessment. Nueva York.
Pergamon Press.
Lanyon, R. 1. y Goodstein, L. D. (1977). Evaluación de la personalidad. México. El Manual
Moderno.
Lienert, G. A. (1961). Testaufbau und testanalyse. Weinheim. Beltz.
ad T. e Ingelkamp, K. (1968). Literatur úiber tests im bereich der schule. Weinheim.
Beltz.
Martorell, M. C. (1988). Técnicas de evaluación psicológica. Introducción (vol. 1). Valencia.
Promolibro.
Meehl, P. E. (1954). Clinical vs. statistical prediction. Minneápolis. University of Minnesota
Press.
Mitchell, J. V. (dir.) (1985). The ninth mental measurements yearbook. Lincoln. University of
Nebraska Press.
Pelechano, V. (1988). Del psicodiagnóstico clásico al análisis ecopsicológico (vols. 1 y 11). Valen-
cia. Alfaplús.
Pervin, L. A. (1980). Personality: Theory, assessment, and research. Nueva York. Wiley.
Reitan, R. M. y Wolgson, D. (1985). The Halstead-Reitan neuropsychological test battery:
Theory and clinical interpretation. Tucson. Neuropsychology Press.
Silva, F. (1982). Introducción al psicodiagnóstico. Valencia. Promolibro.
Speck, D. y Speck, R. (1973). Klassifications-und darstellungsproblematik psychologischer
testvenfahren. Tesina de licenciatura. TV Berlín.
Swensen, C. H. (1957). Empirical evaluations of human figure drawings, 1957-1966. Psycho-
logical Bulletin, 54, 431-466.
Swensen, C. H. (1968). Empirical evaluations of human figure drawings. Psychological Bulle-
tin, 20, 20-44.
Clasificación de las técnicas de evaluación psicológica 269
LECTURAS COMPLEMENTARIAS
SU
¿P9U A EN ft
> E 1011307 Ms A E
» Abire a ed 1, metro. 1.35Acgpcles, Webs
huir ries, M. CPARS EOrie
1 4
E í + , A
> o
¿ , h e As AAA:
sy mm AE Weihe 4
- Ñ A 5d. Y
of Minneñots.
ds
pr web .
L mn, TEM
f ' y
Vucns
Ñ mn.
o
, , ¡
á
d »
o
. A A
7
'
Ñ F
O. Le
.
13. LA ENTREVISTA
L INTRODUCCIÓN
De todas las técnicas de evaluación psicológica es la entrevista la que tiene una ma-
yor aplicación. De ella se ha dicho que es la espina dorsal de todas las profesiones de
la salud mental (Shea, 1990), la piedra angular del psicodiagnóstico (Wiens y Mata-
razzo, 1983) o la herramienta por excelencia para lograr el diagnóstico (Zubin,
1989). Su importancia va más allá del ámbito de la psicología, como afirma Kerlinger
(1975), ya que es el método principal cuando se trata de obtener información acerca
de las personas. El abogado, el médico, el periodista o el profesor la utilizan cotidia-
namente, aunque cada uno con su propia finalidad. Volviendo a la psicología, si re-
corriéramos sus ámbitos de aplicación, desde los más consolidados como el clínico,
el de las organizaciones o el escolar, a otros más recientes como la psicología del de-
porte o los servicios sociales, podríamos observar que en todos ellos es, de hecho,
una de las técnicas indispensables.
Por otra parte, los distintos enfoques teóricos han ido generando formas espe-
cíficas de intervención pero es difícil encontrar alguno que se haya propuesto, con
éxito, prescindir de la entrevista. Más bien resulta precisamente una de las grandes
complejidades de la misma el hecho de que las distintas posturas teóricas y metodoló-
gicas hayan ido desarrollando una gran diversidad de aplicaciones. A esto se debe
añadir la variabilidad de tipos de entrevista debida a los distintos ámbitos de interven-
ción (entrevista clínica, de selección...) e incluso a las distintas formas de intervenir
(entrevistas de evaluación, terapéuticas, de orientación...), lo que convierte la tarea de
realizar una clasificación exhaustiva de sus variantes en una labor realmente ardua.
Esta dispersidad de concepción y aplicación de la entrevista hace muy difícil rea-
lizar atribuciones de calidad para esta técnica en general. De hecho, su evolución his-
tórica está marcada por el tránsito desde su propuesta como herramienta básica e in-
discutible tomada del modelo médico, a una fuerte crítica cuando fue comparada
con las técnicas psicométricas, los estudios rigurosos de observación y otras medidas
más objetivas. Su falta de estandarización, la subjetividad del evaluador y su dificul-
tad de cuantificación la convirtieron en fácil blanco de muy diversos enfoques teóri-
cos (Maloney y Ward, 1976). Habrá que esperar hasta la década de los años sesenta
para que comiencen a explorarse rigurosamente los fundamentos de fiabilidad y va-
lidez de la entrevista como técnica de evaluación, logrando recuperar su valor como
tal (Zubin, 1989).
A pesar de sus avatares históricos, en los que llegó a ser desechadapor su carácter
subjetivo y mentalista, lo cierto es que en la actualidad algunos estudios muestran el
Universidad de Oviedo.
272 Jorge Fernández del Valle
Desde este punto de vista de la ayuda o el consejo se han elaborado importantes ma-
nuales (Cormier y Cormier, 1979).
Recientemente, la técnica de la entrevista ha sido impulsada desde dos enfoques
diferentes que se revisarán en posteriores apartados de este capítulo. El primero bus-
ca la clasificación diagnóstica y se desarrolla a partir de los sistemas diagnósticos
como el Research diagnostic criteria (RDC) de Spitzer, Endicott y Robins (1978) o los
Diagnostic and statistical manual of mental disorders (DSM) (American Psychiatric
Association, 1956, 1968, 1980, 1987, 1994). La entrevista adopta aquí formatos alta-
mente estructurados y sacrifica la libertad del evaluador en aras de una mayor fiabili-
dad en la conclusión diagnóstica. El segundo enfoque se refiere a la evaluación con-
ductual y la importancia que dentro de ella tiene la entrevista como medio de
focalizar las conductas problema y formular las primeras hipótesis de intervención.
cas. Ciertamente, en muchas ocasiones se va a hacer muy difícil diferenciar una en-
trevista de evaluación de una entrevista terapéutica ya que el efecto del cambio se fil-
tra de manera muy sutil a través de todo el proceso de intervención. En ocasiones,
incluso en una entrevista inicial, muchos sujetos abandonan la consulta del profesio-
nal con una sensación de alivio, aunque “Únicamente” han facilitado información.
Lógicamente, cabe pensar en otras finalidades que vienen clasificadas por el área de
intervención como es el caso de la entrevista de selección de personal, la entrevista clí-
nica, la entrevista de orientación escolar, o bien por su grado de compromiso para el
entrevistador (directivas, no directivas...). A continuación utilizaremos el criterio de
áreas de intervención para comentar algunas peculiaridades de los dos ámbitos de ma-
yor aplicación de la entrevista de evaluación: el clínico y el de la selección de personal.
Molestias principales.
Historia del trastorno que presenta actualmente.
Historia social.
Historia familiar.
Historia médica.
SS Estado mental.
$50
La entrevista 277
Esta primera delimitación de contenidos nos puede servir para realizar algunos
comentarios. Se podría decir que en la entrevista con fines diagnósticos la parcela-
ción de áreas de exploración perseguía en primer lugar la explicación, en los propios
términos del paciente, de la causa de su petición de ayuda mediante una descripción
verbal del problema. Es difícil concebir una mejor aproximación inicial en evalua-
ción y de ahí que este proceder sea habitual en diferentes enfoques de tratamiento.
En segundo lugar, se resaltan los aspectos del cuadro temporal que enmarca el
problema, lo que a su vez se hace a dos niveles. El primero de ellos referido a la histo-
ria del propio problema (comienzo, desarrollo, intermitencias, continuidad, agudi-
zaciones...). El segundo aspecto hace referencia al marco histórico del propio sujeto,
su evolución en las áreas más relevantes como la familiar, social y médica (desde una
tradición psiquiátrica organicista la importancia de lo médico era evidente). También
en este caso es difícil concebir otra técnica de evaluación que nos permita trazar me-
jor los aspectos más importantes de la evolución personal del sujeto. Desde el auge
de los enfoques ecopsicológicos en la actualidad, diríamos que la entrevista cobra
enorme importancia por su capacidad potencial para situar al sujeto en las coordena-
das ambientales (dentro de las cuales el tiempo es un factor de primer orden). Po-
dríamos señalar que la misión de la entrevista desde esta perspectiva sería la explora-
ción de los contextos relevantes del sujeto y de su comportamiento a través de ellos.
Un tercer aspecto del contenido es lo que se ha expresado como el estado mental
y que revela, a nuestro juicio, la intención de aprovechar la entrevista no sólo como
una exploración histórica y situacional del problema y del propio sujeto, sino tam-
bién como contacto personal para observar y evaluar aspectos psicológicos del suje-
to, que a la postre se constituían en el principal elemento de evaluación, antes del
desarrollo de otras técnicas diagnósticas. Siguiendo a Wiens (1990), en la exploración
del estado mental se pretende observar una serie de aspectos generales del funciona-
miento psicológico del paciente tales como:
te, Vizcarro y cols. (1986) realizaron un estudio en España en el que el uso de esta en-
trevista no mejoró la fiabilidad interjueces en el diagnóstico en comparación con una
entrevista libre. En cualquier caso, hasta el momento, en España su uso está muy res-
tringido, sin que exista alguna versión de amplia difusión. Por tanto, la valoración de
sus garantías científicas requiere aún mucho tiempo e investigación.
otras posibilidades (Peiró, 1987). Por otra parte, la selección de personal ha evolu-
cionado cada vez más hacia la exigencia de técnicas más complejas que la entrevista
(análisis de tareas, profesiogramas...), aunque ésta no pierde su importancia en mo-
mentos cruciales de la toma de decisiones acerca de los candidatos.
La situación de entrevista en selección de personal presenta unas características
muy peculiares que se deben tener en cuenta y que comentamos muy brevemente
inspirándonos en el clásico trabajo de Nahoum (1961):
Algunos aspectos tradicionales a evaluar en este tipo de entrevista son los si-
guientes (Morgan y Cogger, 1982):
cuestionario que a la propia entrevista ya que se pierde una parte esencial de la defi-
nición como es el encuentro cara a cara de dos o más personas (y con ello la posibili-
dad de registrar conducta no verbal). Por ello, a pesar de su interés desde otros crite-
rios, las versiones por ordenador de entrevistas estructuradas pierden una parte
esencial de la definición de esta técnica.
Sin embargo, en las entrevistas menos estructuradas es donde elpapel del evalua-
dor se convierte en algo crítico; es lo que se ha denominado el “estilo” de entrevista,
es decir, la forma específica que caracteriza la conducta de un entrevistador concreto,
lo que se convierte en fuente de error muy importante, pero también (y esto no deja
de ser relevante) en posibilidad de desarrollar especiales habilidades para obtener in-
formación, motivar al sujeto e impulsar el cambio de conducta. y
Ante esto cabe preguntarse ¿cuáles son las conductas o estrategias que suele uti-
lizar el entrevistador? A continuacón examinamos de modo ilustrativo algunas es-
trategias que puede adoptar el profesional para desarrollar sus objetivos de evalua-
ción.
Foley y Sharf (1981) señalan cinco criterios para el desarrollo de una buena en-
trevista: lograr que el sujeto se encuentre cómodo, obtener información, mantener el
control, mantener el rapport y concluir adecuadamente. Pasaremos a comentarlos
brevemente.
Para que el sujeto se encuentre cómodo es importante tener en cuenta una serie
de cuestiones. Con frecuencia el entrevistado se encuentra ansioso ante el hecho de
la consulta profesional y cualquier tiempo de espera adicional puede resultar espe-
cialmente molesto. Asimismo, las interrupciones de teléfono durante la entrevista o
una incorrecta disposición del mobiliario que no favorezca la interacción o sea ma-
nifiestamente incómodo pueden provocar efectos indeseados. Cuando el sujeto se
encuentra cómodo entra en disposición de colaborar más eficazmente y confiar en el
profesional.
Para obtener información de modo eficaz es importante que el entrevistador
permita en algunos momentos al sujeto expresar en sus propias palabras en qué con-
siste el problema o algunos aspectos de su historia, sin interrupciones innecesarias.
Como atirman Maloney y Ward (1976), esto permite evaluar la ambigijedad o los
conflictos que subyacen a la peculiar perspectiva de cada sujeto. No obstante, el en-
trevistador avezado ayuda al sujeto cuando éste no es capaz de aportar información
relevante o lo hace de un modo poco aprovechable. Se hace necesario entonces reali-
zar aclaraciones sobre aspectos confusos o inconsistente, repitiendo las cuestiones
o reformulándolas de modo más específico. Otra habilidad importante es la adapta-
ción del lenguaje a la edad y educación del sujeto. Tal como señalan Wiens y Mata-
razzo (1983), es importante tener en cuenta que si bien el evaluador es el experto en
el diagnóstico y el tratamiento, el sujeto es el experto en sí mismo y es él quien posee
la información relevante (al menos inicialmente) para la correcta orientación del
caso.
El mantenimiento del control supone aspectos como llevar el ritmo de la entre-
vista en función de las limitaciones de tiempo que existan. Un exceso de rapidez
puede convertir el encuentro en un brusco tiroteo de cuestiones que desanime a los
sujetos para expresarse libremente. Por el contrario, un ritmo excesivamente lento
La entrevista
285
Otros autores (por ejemplo, Maloney y Ward, 1976) también enuncian una serie
de acciones indispensables para el desarrollo del papel de entrevistador que nos pue-
den servir de complemento a lo expuesto. En primer lugar, y basándose especial-
mente en las preguntas iniciales más abiertas tales como «dígame qué le ocurre» o
«¿cuál es el problema?», el profesional debe dedicarse fundamentalmente a escuchar
y observar al sujeto, al mismo tiempo que combina estos datos para ir realizando al-
gún tipo de inferencias. A esta función básica se añaden tres actividades fundamenta-
les a desplegar: facilitación, clarificación y confrontación.
Más expresamente, Wiens (1990) expone varios aspectos del entrevistador que
pueden actuar como fuentes de error en la entrevista, de los cuales exponemos los
más significativos:
Deseabilidad social.
Falta de comprensión.
Lapsus de memoria.
Experimentar la situación de ser interrogado como algo estresante.
Ocultar las verdaderas opiniones.
OSO
SS La variabilidad de percepciones sobre la situación y el propósito de la entre-
vista.
En síntesis, la conducta del entrevistado es mucho más compleja que una simple
aportación de información, especialmente por el efecto que el entrevistador y la si-
tuación misma puede tener sobre él. Se hace necesario por parte del evaluador el
control de estos efectos como una parte esencial de la técnica, incluso en formatos al-
tamente estructurados.
Es un tanto desolador el panorama que presenta la entrevista cuando uno mira “de-
bajo de la alfombra” y se pregunta acerca de sus garantías científicas. Ciertamente,
esta técnica encierra tal cantidad de aplicaciones, finalidades, formatos y encuadres
teóricos que probablemente sea imposible, tal como ya señaló Sundberg (1977), rea-
lizar generalizaciones sobre su fiabilidad y validez. Sin embargo, la cuestión es de-
masiado importante como para posponerla ya que está en juego nada menos que el
estatus científico de la técnica de más amplia aplicación en evaluación psicológica. Se
intentarán exponer brevemente algunos aspectos del estado de la cuestión, tanto en
relación a la fiabilidad como a la validez.
vii. Fiabilidad
vIL2. Validez
VII CONCLUSIONES
La entrevista es una técnica de evaluación, pero también es mucho más que esto.
Para la psicología es el marco en el que se desenvuelve la mayoría de sus intervencio-
nes, de modo que difícilmente puede convertirse en opción como instrumento y más
bien cabe hablar de una herramienta imprescindible. Su versatilidad y flexibilidad
permiten moldear una entrevista para cada finalidad y adaptarla incluso al marco
teórico del evaluador lo que le confiere gran ventaja respecto al resto de las técnicas
de evaluación psicológica. La facilidad y la economía de costes con que recoge as-
pectos como las coordenadas ambientales (temporales y espaciales) en las que se si-
túa la conducta a evaluar (aspectos biográficos, desarrollo, contexto familiar, laboral,
escolar, social...) suponen una ventaja reconocida en muy diversos enfoques de eva-
luación y sin demasiada competencia por parte de otras técnicas alternativas.
La entrevista 293
REFERENCIAS BIBLIOGRÁFICAS
American Psychiatric Association (1956). Diagnostic and statistical manual of mental disor-
ders (1* ed.). Washington DC. APA.
American Psychiatric Association (1968). Diagnostic and statistical manual of mental disor-
ders (2* ed.). Washington DC. APA.
American Psychiatric Association (1980). Diagnostic and statistical manual of mental disor-
ders (3* ed.). Washington DC. APA.
American Psychiatric Association (1987). Diagnostic and statistical manual of mental disor-
ders (3* ed. rev.). Washington DC. APA.
American Psychiatric Association (1994). Diagnostic and statistical manual of mental disor-
ders (4* ed). Washington DC. APA.
Balleweg, B. (1990). The interviewing team: An exercise for teaching assessment and concep-
tualization skills. Teaching of Psychology, 17, 241-243.
Barker, R. G. (1968). Ecological psychology: Concepts and methods for studying the environ-
ment of human behavior. Stanford. Stanford University Press.
Bermúdez, J. (1986). Teorías de la personalidad. Madrid. UNED.
Brewin, C., Veltro, F., Wing, J. K. y McCarthy, B. (1990). The assessment of psychiatric disa-
bility in the community: A comparison of clinical, staff, and family interviews. British
Journal of Psychiatry, 157, 671-674.
Cannel, C. F. y Kahn, R. L. (1968). Interviewing. En G. Lindzey y E. Aronson (dirs.), The
handbook of social psychology. Reading. Addison-Wesley.
Cone, J. D. (1987). Consideraciones psicométricas en la evaluación conductual. En R. Fer-
nández-Ballesteros y J. A. Carrobles (dirs.), Evaluación conductual. Metodología y apli-
caciones (2* ed.). Madrid. Pirámide.
Cormier, W. H. y Cormier, L. S. (1979). Interviewing strategies for helpers: A guide to assess-
ment, treatment, and evaluation. Monterrey. Brooks/Cole.
Dreher, G. F., Ash, R. A. y Hancock, P. (1988). The role of the traditional research design in
underestimating the validity of the employment interview. Personnel Psychology, 41, 315-
324.
Edelbrock, C. y Costello, A. J. (1990). Structured interviews for children and adolescents. En
G. Goldstein y M. Hersen (dirs.), Handbook of psychological assessment. Nueva York.
Pergamon Press.
294 Jorge Fernández del Valle
LECTURAS COMPLEMENTARIAS
F. JAVIER PÉREZ-PAREJA
Il. INTRODUCCIÓN
Un autoinforme «supone un mensaje verbal que una persona emite sobre cualquier
tipo de manifestación propia» (Fernández-Ballesteros, 1992, p. 218); es decir, los
autoinformes son producto de la introspección o la autoobservación que una per-
sona realiza sobre su propia conducta. Como podemos comprobar, la propia defi-
nición de autoinforme contiene implícitamente una gran heterogeneidad concep-
tual sobre las posibles propiedades de los contenidos autoinformados. A esta
heterogeneidad en el contenido se suman las distintas elaboraciones que el evalua-
dor pueda realizar. El evaluador puede considerar la información obtenida a través
de un autoinforme como una simple respuesta verbal o como expresión verbal de
un evento encubierto o, incluso, como signo de un atributo interno. Por otra parte,
en cuanto a los contenidos, el autoinforme permite conocer y evaluar conductas
manifiestas y fisiológicas, las cuales son contrastables, así como conductas encu-
biertas a través de la autoobservación del sujeto. Asimismo, en muchos casos el in-
forme verbal es la única vía de transmisión de determinadas respuestas (pensamien-
tos, sentimientos...), de forma que a través de los autoinformes lo inobservable se
hace observable, es decir, se puede poner de manifiesto lo encubierto. De aquí sur-
ge la polémica en torno a los autoinformes, pues, como señala Lieberman (1979),
éstos han sido considerados como una manera de presentar renovadamente la in-
trospección. Así, como es de sobra conocido, la introspección supuso el método
por excelencia a la hora de elaborar la primera psicología científica, siendo poste-
riormente enormemente criticado y rechazado por enfoques más modernos de la
misma.
Sin embargo, dichos autores igualmente indican que a pesar de las críticas recibi-
das, los autoinformes son utilizados en la formulación y análisis de gran cantidad de
problemas conductuales, tales como la falta de asertividad, problemas de interacción
social, ansiedad, ingesta de sustancias, hábitos de vida inadecuados, etc. Si bien, tal
como señala Fernández-Ballesteros (1992), no podemos generalizar la bondad ni la
inadecuación de dicha técnica, dado que el grado de adecuación de la misma vendrá
determinado por el tipo de manifestación o actividad a la que se refiera el informe,
así como a la forma de conceptualizarlo. Sin embargo, los autoinformes presentan
toda una serie de ventajas potenciales que han incrementado su uso; entre dichas
ventajas podríamos destacar las siguientes:
Por otra parte, el reconocimiento de las ventajas, así como el extenso uso que de
los autoinformes se realiza desde la perspectiva conductual, no ha hecho más que in-
crementar la aparición de los problemas que se derivan del mismo y que fundamen-
talmente se centran en los siguientes aspectos:
Por otra parte, las clases de variables a las que hacen referencia los autoinformes
pueden ser (Fernández-Ballesteros, 1992):
Autoinformes 301
— Gran parte de los mismos han sido desarrollados para explorar problemas
psicológicos de naturaleza clínica; la mayoría de ellos consta de un repertorio de res-
puestas cognitivas, fisiológicas y motoras seleccionadas en función de su frecuencia
de aparición en un determinado trastorno de conducta.
— Los datos conductuales obtenidos son considerados como muestra de con-
ducta y no como signo de otro tipo de variable encubierta.
— Las conductas están referidas a situaciones específicas.
— Su utilidad dependerá del tipo de datos que se pretendan evaluar; así, tanto
para especificar inicialmente un problema como para explorar las respuestas de na-
turaleza cognitiva, resultan imprescindibles.
Las características comunes a este tipo de autoinformes se pueden resumir del si-
guiente modo:
— Las respuestas a los mismos son consideradas tanto como muestra como sig-
no o indicador de supuestas variables o atributos internos; en el primer caso, la res-
puesta se evalúa en función de la situación problema propuesta y, en el segundo, no
se establecen referencias situacionales.
— Algunos de estos autoinformes no presentan suficientes garantías científicas
para su uso fuera del ámbito experimental.
— Este tipo de autoinforme es útil cuando el problema a evaluar es de naturale-
za, cuando los repertorios cognitivos se supone que explican trastornos motores o
fisiológicos, por lo que en estos casos dichos repertorios son utilizados como varia-
ble independiente que habrá de manipularse, y para evaluar ciertas habilidades re-
queridas en el tipo de intervención como el caso de la capacidad imaginativa en trata-
mientos encubiertos.
Por otro lado, otro factor a tener en cuenta son las condiciones bajo las cuales
tiene lugar el autoinforme; entre éstas merecen especial atención las siguientes:
Autoinformes 303
Por último, cabría destacar que la exactitud del autoinforme parece ser directa-
mente proporcional al período de tiempo existente entre la ocurrencia del hecho in-
formado y su producción. Así, los autointormes concurrentes parecen presentar
mayores garantías que los retrospectivos, a pesar de los posibles problemas de reac-
tividad que pueden suscitar en las personas evaluadas.
304 F. Javier Pérez-Pareja
c. Las preguntas. Las preguntas, es decir, las instrucciones para realizar los auto-
informes, presentan múltiples posibilidades. Todas las posibles formas de recoger in-
formación a través de autoinformes implican distintos grados de estructuración en las
preguntas formuladas. Por ello, los autoinformes pueden ser considerados en fun-
ción del grado de estructuración de las preguntas.
Entre las preguntas estructuradas y las no estructuradas podríamos situar las se-
miestructuradas. Un autorregistro o una “escala de miedos” podrían considerarse
como instrumentos de autoinforme con preguntas semiestructuradas; en ellos es la
propia persona la que especifica la situación y no el evaluador.
d. Las respuestas. Como resulta evidente, las respuestas son función de los estí-
mulos, en este caso, de las preguntas. A veces, las preguntas más o menos estructuradas
pueden contestarse de forma abierta; en otras ocasiones, las respuestas son forzadas.
ciertas dificultades, ya que éste debe ser tanto cuantitativo como cualitativo y no
existe una vía normalizada de análisis. No obstante, Fernández-Ballesteros (1992)
señala algunas sugerencias al respecto:
En resumen, al buscar las garantías científicas de los tres primeros tipos de auto-
informe «estaremos, en el mejor de los casos, examinando la veracidad de la infor-
mación suministrada por el sujeto», mientras que en los otros casos estaremos
«comprobando la validez del constructo propuesto por la teoría» (Fernández-
Ballesteros, 1991, p. 283).
A lo anteriormente expuesto se suman los problemas producidos por la “ten-
dencia de respuesta”, que constituye uno de los factores distorsionantes de los resul-
tados de los autoinformes. Se han intentado eliminar dichas distorsiones mediante
variables correctoras, así como a través de modificaciones en la formulación de las
instrucciones o en los elementos del autoinforme. De forma paralela, los estilos de
respuesta se pueden considerar como variables de personalidad, es decir, como pa-
trones conductuales que provocan respuestas consistentes en los individuos. Entre
las principales fuentes de distorsión destacan las siguientes:
Asimismo, es importante hacer notar que si bien existen estadísticos para anali-
zar y controlar dichas distorsiones en diseños de grupo y dentro de los que podría-
mos denominar autoinformes psicométricos tradicionales, esto no es así en el caso
de los autoinformes conductuales. En efecto, Fernández-Ballesteros (1991) informa
que en una búsqueda bibliográfica de trabajos realizados sobre autoinformes, el
33% de los publicados entre 1977 y 1987 se dedicaba al estudio de la incidencia que
las distintas fuentes de error (entre las que cabe destacar la deseabilidad y la sincer1-
dad) tenían sobre este procedimiento de evaluación. Sin embargo, entre estos traba-
jos son mucho menos frecuentes los que se dirigen a estudiar dichos problemas me-
todológicos en autoinformes construidos desde la perspectiva conductual. Entre las
razones que podrían explicar esta laguna cabrían destacarse, tal como señalan Fer-
nández-Ballesteros, Pérez-Pareja y Maciá (1981), las siguientes:
Sin embargo, si bien todos estos supuestos son perfectamente asumibles, si-
guiendo a los mismos autores, hemos de señalar que esto no justifica la ausencia de
investigaciones al respecto; ello responde a los siguientes motivos:
En todo caso, y con independencia de lo indicado hasta aquí, estamos ante una
polémica abierta y de difícil solución a lo largo de estas páginas.
Por otra parte, tal como hemos expuesto en los párrafos anteriores, si bien se ha
investigado con cierta profusión sobre autoinformes desde una perspectiva correla-
cional o psicométrica, los trabajos realizados desde una perspectiva experimental
han sido muy escasos. Es definitiva, se ha tratado de garantizar y estudiar los proble-
mas de validez y fiabilidad de los autoinformes, se ha intentado conocer y controlar
sus fundamentales fuentes de error, pero poco se ha hecho a través de la manipula-
ción y control de las distintas variables que influyen en los autoinformes. Entre los
pocos trabajos de corte experimental realizados con autoinformes cabe señalar el de
Fernández-Ballesteros y cols. (1981). En dicho trabajo se pone de manifiesto, por un
lado, la falta de consistencia en los autoinformes de los sujetos antes y después de la
situación experimental sobre la que informan, lo que demostraría la importancia de
la temporalidad en la realización de los autoinformes; por otro lado, se destaca la es-
casa relación entre los tres métodos de evaluación utilizados (observación, autoin-
forme y registro psicofisiológico) para evaluar una misma conducta, lo cual eviden-
cia la dificultad de comparación de tales métodos, que cuentan con fuentes de error
muy diversas e incluso es posible que para una misma conducta se estén evaluando
cosas distintas en función del método de evaluación utilizado.
312 F. Javier Pérez-Pareja
Por otra parte, no podemos olvidar que la utilidad y bondad de los autoinformes
dependen en gran medida, no sólo de la conducta o de los eventos que se evalúan,
sino también de cómo se evalúan. Tradicionalmente, la mayoría de los datos para
cuestiones clínicas que preceden y siguen a la intervención terapéutica, consiste en
autoinformes (informes verbales y cuestionarios). Así por ejemplo, la Sexual expe-
riencie scale (SES) [Escala de Experiencias Sexuales] de Derogatis y Melisaratos
(1979), tal como indican Andersen y Broffitt (1988), presenta grandes problemas en
la identificación de cambios conductuales, en la ocurrencia de disfunciones sexuales
y en la evaluación de la satisfacción de la vida sexual. Igualmente, esta escala presenta
poca estabilidad en su estructura factorial entre grupos y a lo largo del tiempo. Entre
las principales causas de estos problemas hay que destacar que la SES evalúa la ocu-
rrencia de conductas, más que su frecuencia, de forma que su medida podría ser más
sensible si se utilizaran escalas de frecuencia más que evaluar la presencia-ausencia
de determinadas conductas. Así, podemos nuevamente destacar que los aspectos
formales en la construcción de los autoinformes resultan de gran importancia ya que
de ellos dependerá, en gran medida, la bondad de los datos obtenidos.
En esta línea se encuentran los trabajos realizados por Borrás Sansaloni (1992)
sobre el síndrome premenstrual (SPM), quien utilizando el Inventario de cambios
premenstruales (ICP) encontró diferencias significativas respecto a los resultados ob-
tenidos por Logue y Moos (1986) usando el Mestrual distress questionnaire (MDQ)
de Moos (1968). Como concluye dicha autora, estas diferencias serían únicamente
atribuibles al instrumento, pues mientras el /CP presenta las respuestas en forma es-
calar, el MDQ tan sólo evalúa presencia o ausencia de respuesta.
En conclusión, podemos inferir que gran parte de las diferencias que se encuen-
tran al comparar resultados de distintas investigaciones realizadas con el uso de auto-
informes podría atribuirse a sesgos relativos a los propios instrumentos. Así, desde
nuestro punto de vista, parece más adecuado el uso de inventarios y escalas frente al
de cuestionarios, al menos en cuanto al tipo de resultados que presentan.
En los estudios en los que se han comparado los efectos del tratamiento y del
placebo generalmente se han aceptado sin ningún tipo de reserva los datos obtenidos
mediante autoinformes, si bien, tal como señala Shapiro (1981), el placebo influye
Autoinformes 313
principalmente en los informes subjetivos. Por lo cual, se puede afirmar que los auto-
informes presentan ciertas dificultades de interpretación asociadas a la mejora tera-
péutica. En cualquier caso, hay que señalar que los efectos placebo sobre los auto-
informes acerca de la terapia pueden variar según la naturaleza y severidad de la
conducta problema, por lo que los problemas señalados no son del todo generaliza-
bles. Sin embargo, esta preocupación por la mejora terapéutica nos llevaría a lo que
Nelson y Hayes (1979) denominan validez de tratamiento. Sin embargo, la validez
de tratamiento no es un tipo fundamentalmente diferente de validez. Además, tal se-
paración hay que entenderla en el marco de algunas tradiciones diagnósticas donde
evaluación y tratamiento aparecen como dos procesos independientes. En esta línea,
tal como señala Silva (1989, p. 172) «será necesario un replanteamiento de los instru-
mentos de evaluación». Sin entrar en la polémica sobre la utilidad de la evaluación en
función de la validez del tratamiento pensamos, tal como indican Hayes y cols.
(1986), que la validez de tratamiento se aplica a todos y cada uno de los aspectos y
etapas de la evaluación y que evidentemente incluye a los procedimientos e instru-
mentos utilizados en los mismos. En todo caso, y tal como concluye Silva (1989,
p. 181), se necesitaría de los criterios (psico)métricos de calidad «si se quiere evitar
entrar en el callejón, sin salida, de intentar juzgar la calidad de una evaluación en fun-
ción de la utilidad de tratamiento, cuando esta última debe a su vez estimarse a través
de una evaluación que ofrezca garantías de calidad».
Por último, parece oportuno señalar que además de las garantías de validez y fia-
bilidad que han de poseer los autoinformes, así como el control de aspectos tales
como sinceridad, deseabilidad social o tendencia de respuesta, creemos que también
se han de tener en cuenta los aspectos relativos a su construcción formal, debido a
que dichos aspectos afectan a la validez y fiabilidad del instrumento en cuestión.
REFERENCIAS BIBLIOGRÁFICAS
Andersen, B. L. y Broffitt, B. (1988). Is there a reliable and valid self-report measure of sexual
behavior? Archives ofSexual Behavior, 17, 509-525.
Baker, T. B. y Brandon, T. H. (1990). Validity of self-reports in basic research. Behavioral
Assessment, 12, 33-51. 0
Bellack, A. S. y Hersen, M. (1977). Self-report inventores in behavioral assessment. En D. T.
Cone y R. P. Hawkins (dirs.), Behavioral assessment. Nueva York. Brunner-Mazel,
Borrás Sansaloni, C. (1992). Respuestas de ansiedad, ciclo menstrual y síndrome premenstrual
(spM). Algunos aspectos conceptuales, metodológicos y de evaluación. Memoria de licencia-
tura inédita. Universidad de Las Islas Baleares. hb TON
Brown, A. L. (1978). Knowing when, where, and how to remember. Illinois. University ot
lllinois. 159
Derogatis, L. B. y Melisaratos, N. (1979). The DSFI: A multidimensional measure of sexual
functioning. Journal ofSex Marital Therapy, 5, 244-281.
aa elos R. (1979). Los métodos en evaluación conductual. Madrid. Pablo del
Río.
314 F. Javier Pérez-Pareja
LECTURAS COMPLEMENTARIAS
Universidad de Barcelona
316 Vicenc Quera y Júlia Behar
Como mínimo, una de las variables entre las cuales se establece relación en las hi-
pótesis debe ser una variable conductual. Por ejemplo:
La observación 317
a. «¿Lloran más los bebés de madres primíparas que los de madres no primípa-
ras?». Una variable conductual, “el bebé llora”, y una variable de sujeto,
“primiparidad”.
b. «¿Disminuye la probabilidad de que el bebé llore después de que la madre le
hable?». Dos variables conductuales, «el bebé llora» y «la madre habla».
c. «¿La disminución de la probabilidad de que el bebé llore después de que la
madre le hable es mayor cuando el padre está ausente que cuando está pre-
sente?». Las mismas variables conductuales que en el ejemplo anterior, más
una variable ambiental, “presencia del padre”.
Es necesario que todas las variables estén operativizadas, lo que implica que sean
medibles de forma totalmente objetiva. Por lo tanto, es de capital importancia que
las variables o códigos conductuales que se emplean en la investigación estén defini-
dos de manera que los observadores no puedan efectuar interpretaciones subjetivas
o idiosincrásicas de las mismas. Ello requiere una especial atención cuando los códi-
gos son de naturaleza molar e inferencial (por ejemplo, códigos como “agrede”, “in-
teracción positiva”, etc.). Por tanto, la codificación de la conducta a observar es una
etapa no sólo necesaria sino crucial en cualquier investigación observacional, puesto
que, junto con los observadores entrenados, constituye el instrumento de medida en
la metodología observacional (Behar, 1991).
Diversos autores (Hawkins, 1982; Suen y Ary, 1989; Bakeman, 1997; Bakeman Mi
Gottman, 1997) coinciden en considerar que los objetivos de la investigación COnsti-
tuyen un criterio importante en el que basarse para proceder a la segmentación de la
conducta de forma adecuada y disponer así de unidades conductuales. La respuesta a
318 Vicenc Quera y Júlia Behar
Desde una perspectiva histórica los sistemas verbales fueron los primeros en ser
utilizados en la observación, en una época en que la metodología observacional care-
cía de la entidad actual. En la actualidad, los sistemas verbales son una forma de re-
gistro inicial y casi imprescindible en toda investigación observacional, pues facilitan
un primer abordaje de las conductas que serán objeto de estudio.
a. Eltipo de conducta a observar. La duración de las sesiones tiene que ser su-
ficientemente larga para que en ellas tenga lugar una variabilidad aceptable en el
comportamiento observado, es decir, para que ocurra un número grande de transi-
ciones entre ocurrencias de categorías de conducta. Ello depende a su vez del grado
de molaridad de las categorías y de sus duraciones medias. La duración total de la
sesión ha de ser mucho mayor que las duraciones medias de las categorías conduc-
tuales.
b. La fatiga del observador. La atención constante repercute en un aumento de
la fatiga y un descenso de la calidad de los datos. Sin embargo, la utilización del vídeo
en la observación sistemática permite grabar sesiones de larga duración que después
pueden ser observadas durante sesiones de trabajo de menor duración. En laobser-
vación en vivo de sujetos humanos en interacción social una duración de sesión indi-
cativa oscila entre 30 y 60 minutos.
La cantidad total de sesiones ha de ser suficiente para que el volumen de datos re-
cogidos permita poner a prueba las hipótesis de investigación (Yarrow y Waxler,
1979). Cuantas más categorías de conducta se hayan definido y cuanto menor tasa
tengan, más largas habrán de ser las sesiones y/o mayor número de ellas deberá ha-
ber para que las medidas de las categorías obtenidas sean aptas para realizar los análi-
en E averiguar si la.
: e ASinteresados
sis estadísticos pertinentes. Así por : ejemplo, si estamos
categoría “interacción verbal positiva de la madre” (A) activa secuencialmente la ca
324 Vicens Quera y Júlia Behar
tegoría “interacción verbal positiva del hijo” (B), necesitaremos observar el número
de sesiones suficiente para que, en la pareja o en la totalidad de la muestra, las fre-
cuencias totales de A y de B sean grandes para poder estimar adecuadamente la pro-
babilidad de que a A siga B y compararla con la probabilidad no condicionada de
que ocurra B. Las técnicas estadísticas mediante las que se compararán dichas esti-
maciones de probabilidad exigirán que las frecuencias aludidas alcancen un mínimo,
que puede ser 30 aproximadamente. Para que la conducta registrada en una sesión
sea representativa de toda la conducta restante que ocurre fuera de lasesión y no es
observada, deben programarse adecuadamente los inicios y finalizaciones de las se-
siones que van a realizarse con el fin de que no dependan de las preferencias del ob-
servador. Ello significa que los inicios han de ser seleccionados de forma que todos
los puntos temporales del período de estudio tengan la misma probabilidad de ser
inicios de sesiones, siempre que haya transcurrido un tiempo determinado desde el
inicio de la sesión anterior. El muestreo intersesional de tiempo suele adoptar una de
estas formas (Altmann, 1974):
a. Registro activado por transiciones (RAT). El observador anota todas las ocu-
rrencias de las categorías del individuo focal o de los individuos que son multifocali-
zados, en la secuencia en que se producen; además el observador puede anotar en
qué momento termina una categoría y se inicia la siguiente. Decimos que el registro
está activado por transiciones porque el observador únicamente anota en aquellos
momentos en que se produce una transición entre ocurrencias de categorías, efec-
tuando por consiguiente una segmentación conductual del flujo. El RAT permite ob-
tener información completa y precisa acerca de la frecuencia, la duración y la secuen-
cia u orden temporal de las categorías de conducta.
b. Registro activado por unidades de tiempo (RAUT). El observador anota las
coocurrencias de las categorías de conducta del individuo focal o de cada uno de los
individuos multifocalizados rigiéndose por unidades de tiempo llamadas intervalos.
Mientras que en el RAT es la unidad de conducta la que determina la anotación, en el
326 : Vicens Quera y Júlia Behar
M+ M- Mo H+ H= Ho
Es 2 1 0 1 1 z
ls 19 4 0) 3 5 9
FIGURA 15.1. (a) Un registro activado por transiciones de las categorías de conducta A, B, C,
D en una sesión de 120 unidades de tiempo. Los trazos gruesos indican ocu-
rrencias de las categorías. En la parte inferior se indican las unidades de tiempo
en que tienen lugar las transiciones. (b) Muestreo de intervalo parcial efectua-
do simultáneamente en la misma sesión de observación que el registro de (a),
empleando intervalos de 5 unidades de tiempo
a)
E —— E ln e
b)
Puntos de
muestreo
La observación 329
tud 7=5 s. Las frecuencias y duraciones verdaderas de las conductas que habría su-
ministrado un RATy las seudofrecuencias y frecuencias modificadas que proporcio-
na el muestreo realizado se observan en el cuadro 15.1.
CUADRO 15.1.
Medidas conductuales obtenidas para las categorías A, B, C, D, según los re-
gistros presentado en la figura 15.1
.
S _AE I A s T A E9 OA
Categorías
a A B E D
Frecuencias 6 4 4 5
Duraciones 49 24 22 25
Seudofrecuencias 6 4 3 4
Frecuencias modificadas 3 Y TÍ 9
Ivi. Fiabilidad
Aun en el caso de que los registros observacionales se realicen con la ayuda de vídeo
y computadores portátiles, en último término la intervención del observador es in-
dispensable para determinar si se ha producido o no una cierta categoría de conduc-
ta, por lo que la tarea a desempeñar por el mismo es sumamente importante. Del ob-
servador depende en gran medida el grado de calidad de los datos. Es necesario que
la observación la realicen como mínimo dos observadores con objeto de comparar
sus registros y poseer así un control del grado de subjetividad incorporado al regis-
tro por cada uno de ellos y conseguir de este modo datos sin sesgo. Tal como indican
Suen y Ary (1989, p. 100), «la evidencia de fiabilidad en los datos de observación con-
ductual es necesaria para demostrar públicamente que los datos reflejan la realidad».
En la metodología observacional se define la fiabilidad como el grado de concordan-
cia entre los datos proporcionados por dos o más observadores cuando registran in-
dependientemente la misma conducta en la misma ocasión (fiabilidad interobserva-
dores); o bien, como la concordancia entre dos registros de una misma sesión
obtenidos por el mismo observador en dos momentos diferentes, gracias a la graba-
ción en vídeo (fiabilidad intraobservador o consistencia del observador) (House y
House, 1979).
Existe una amplia gama de índices estadísticos empleados como coeficientes de
fiabilidad. La elección de cualquiera de ellos debe venir marcada por el objetivo de la
investigación y por la escala de medida a la que pertenecen los datos (Hartmann,
1977). Pueden distinguirse tres clases de coeficientes de fiabilidad:
relaciones temporales entre unidades de tiempo ocupadas por las categorías, dentro
de la sesión de observación. Estos coeficientes son más estrictos que los de las dos
clases anteriores. Para calcularlos es necesario construir una tabla o matriz de confu-
sión cuyas filas corresponden a las categorías tal como son registradas por uno de los
observadores, y cuyas columnas corresponden a las categorías tal como son registra-
das por el otro. En las casillas de la matriz se incluyen segmentos temporales, de
modo que cada unidad de tiempo de la sesión se asigna a una casilla de la tabla. En el
cuadro 15.2 se muestra una hipotética matriz de confusión.
CUADRO 15.2. Matriz de confusión entre dos observadores simultáneos para ciertas catego-
rías A, B, C. Los efectivos de la tabla son unidades de tiempo
o ts e A es e ia e e A A NT a is tn
Observador2
A biie uimomacina
Observador 1 E o a b É
Total 13 4 5 22
En dicha matriz, de las siete unidades de tiempo que, según el observador 1, han
estado ocupadas por la categoría B, dos unidades fueron ocupadas por la categoría A
según el observador 2. Cuando la concordancia es perfecta, todas las casillas de la ta-
bla que no pertenecen a su diagonal principal contienen valores nulos. De entre los
numerosos coeficientes existentes para la evaluación de la fiabilidad punto por pun-
to, resumidos por Frick y Semmel (1978) o Wallace y Elder (1980), destaca el coefi-
ciente Kappa de Cohen (1960), que es una proporción de concordancia en la que se
corrige la concordancia que es posible lograr por azar. Para su cálculo se utilizan la
proporción de concordancia total obtenida y la proporción de concordancia aleato-
ria esperada. Esto lo hace preferible a los diversos tipos de porcentajes de acuerdo
ampliamente utilizados en metodología observacional (Hanley, 1987). El coeficiente
Kappa se calcula así: k = (P, - P)/(1 - P,), donde P, es la proporción de concordan-
cia observada y P, es la proporción de concordancia aleatoria. En el ejemplo del
cuadro 15.2, P._= (10+4+4)/22 = 0,818, P. = (10x13+7x4+5x5)/22* = 0,378,
ls (0,818-0,378)/(1-0,378) =0,707. El grado de concordancia es mayor cuanto más
próximo a la unidad es el valor del coeficiente obtenido.
Iv2. Precisión
dores (Foster y Cone, 1980; Johnston y Pennypacker, 1980). Sin embargo, la dificul-
tad de disponer de registros estándar lleva a que se calcule elcoeficiente de precisión
en pocas ocasiones. Para el cálculo de la precisión pueden utilizarse las mismas técni-
cas que en la evaluación de la fiabilidad, con la única diferencia de que en lugar de
evaluar la concordancia entre dos observadores con igual grado de adiestramiento,
se evalúa la concordancia entre un observador considerado falible y un observador
estándar. Además, existen coeficientes de precisión punto por punto específicos para
la evaluación de la precisión:
1v3. Validez
ejemplo, «¿las parejas problemáticas tienen más reciprocidad negativa que positiva,
al contrario de las no problemáticas, que tienen más reciprocidad positiva que nega-
tiva?». La reciprocidad negativa puede definirse como la tendencia de cada miembro
de la pareja a intervenir negativamente después de que el otro miembro haya interve-
nido negativamente, y la reciprocidad positiva, como la tendencia a intervenir positi-
vamente después de una intervención positiva. Para contrastar dichas hipótesis de-
beríamos obtener las frecuencias de transición entre los códigos conductuales
definidos para el hombre y la mujer, en nuestras parejas problemáticas y no proble-
máticas a lo largo de un conjunto de sesiones de observación. Estas frecuencias po-
drían disponerse en una tabla de contingencia de tres dimensiones: A (“tipo de pare-
ja”) x B (“tipo de conducta antes de la transición”) x C (“tipo de conducta después
de la transición”), donde cada una de estas dos últimas variables tiene dos valores,
“intervención positiva (del hombre o de la mujer)” o “intervención negativa (del
hombre o de la mujer)”. Por tanto, se trataría de una tabla de contingencia con
2x2 x 2 =8 casillas, con la que es posible evaluar el ajuste de un modelo log-lineal
acorde con la hipótesis, mediante un contraste chi-cuadrado. El análisis secuencial es
pues la técnica adecuada cuando las variables implicadas en la hipótesis son códigos
conductuales registrados en secuencia. Se trata de una técnica que ha sido objeto de
una atención especial por parte de los investigadores durante los últimos años. El
lector interesado tanto en los fundamentos metodológicos y estadísticos del análisis
secuencial como en el tratamiento informático de los datos secuenciales puede con-
sultar los textos de Van Hooff (1982), Gottman y Roy (1990), Bakeman y Quera
(1992, 1995a, 1995b), Quera (1993), Bakeman, Robinson y Quera (1996) y Bakeman
y Gottman (1997).
Las áreas de aplicación de la metodología observacional son tantas como los ámbitos
de actuación de la psicología. En tanto que la metodología observacional se ocupa de
la conducta espontánea tal como ésta se produce, los únicos límites vienen marcados
por el propio repertorio conductual, humano o animal y por la privacidad de deter-
minadas conductas. Existen investigaciones en el marco familiar, como la de Bake-
man y Brown (1977) que analiza la interacción madre-hijo, o la de Noack (1992) que
estudia las relaciones que se establecen durante la primera adolescencia con los pa-
dres y con los iguales; en el marco escolar, sobre el rendimiento académico (Huston-
Stein, Friedrick-Coffer y Susman, 1977), sobre el desarrollo del lenguaje, la adapta-
ción escolar en niños de preescolar (Zazzo, 1978), la interacción con iguales en la
adolescencia durante la hora de recreo (Behar, 1987); en instituciones penitenciarias
se ha utilizado para evaluar la evolución individual y grupal en un programa para
tratar conductas adictivas (Pleite e Ibern, 1991). Abikoff, Gittelman y Klein (1980)
desarrollaron un sistema de codificación para la observación en el aula de la conduc-
ta de niños hiperactivos entre 6 y 12 años. Se consideraron hiperactivos aquellos ni-
ños alos que el maestro y los padres valoraban como tales y que no presentaban nin-
gún otro diagnóstico psiquiátrico. En total fueron observados 57 chicos y 4 chicas
La observación
337
con estas características, con una media de edad de 8 años, 4 meses y una desviación
upo de 1 año y 4 meses. Asimismo, se observó un número igual de niños no hiperci-
néticos del mismo nivel escolar, para proceder a la comparación con los anteriores.
Se utilizó un sistema de codificación de 11 categorías conductuales y la observación
se realizó durante situaciones estructuradas de explicación del profesor y durante
períodos de trabajo académico independiente bajo la supervisión del profesor. Cada
niño fue observado al menos en tres sesiones de 16 minutos cada una. Los datos fue-
ron recogidos por cuatro observadores que desconocían el objetivo de la investiga-
ción y las características clínicas de los sujetos estudiados. Para evitar la reactividad,
los observadores se situaban siempre al final del aula, en ángulo con los sujetos a ob-
servar, para disponer de una vista de perfil de los mismos, pero estar fuera de su área
de visión. Se obtuvo una mayor frecuencia en los niños hiperactivos que en el grupo
control de todas las categorías de observación consideradas, como agresión verbal a
los compañeros, agresión verbal al profesor o permanecer fuera de la silla.
Para dar respuesta a la pregunta de si los padres proporcionan diferente sociali-
zación a niños y niñas, Fagot y Hagan (1991) realizaron una investigación observa-
cional. La muestra estaba formada por 50 niños y 42 niñas de 12 meses, al inicio de la
observación, y 42 niños y 40 niñas de 18 meses, también al iniciar la observación.
Diez de los niños de 12 meses y doce de los niños de 18 meses vivían sólo con la ma-
dre, y el resto pertenecía a familias con padres casados o que vivían juntos, en pro-
medio, desde hacía 4 años. Los datos se recogieron en casa de las familias, al volver el
niño de la guardería, y cuando todos los miembros de la familia estaban presentes. A
éstos se les pedía que no miraran la televisión, que atendieran al teléfono con la ma-
yor brevedad posible, y que actuasen con la máxima normalidad. Para cada niño se
realizaron cuatro sesiones de observación de una hora cada una. El sistema de cate-
gorías incluía cinco secciones diferenciadas: categorías de contexto o de actividades,
categorías interactivas, receptores, reactores y reacciones. El niño era siempre el ob-
jetivo de la observación. Se codificaba la actividad del niño y su interacción, y a con-
tinuación el receptor de dicha interacción, el sujeto que reaccionaba y el tipo de reac-
ción. Los observadores fueron adiestrados en el sistema de categorías durante un
período antes de iniciar la recogida de datos, y para ser considerados fiables debían
alcanzar un grado de concordancia del 90% (proporción de concordancia no corre-
gida por el efecto del azar). Debido a la baja frecuencia de algunas de las conductas
observadas en los niños se hicieron agrupaciones de las mismas: conductas motrices
amplias, juegos típicos de niños y de niñas, comunicación con los adultos y conduc-
tas agresivas. Por su parte, las categorías de reacciones se agruparon en respuestas
instructivas, respuestas positivas y respuestas negativas. Asimismo, se realizaron
agrupaciones empíricas de aquellas conductas que ofrecían diferencias significativas
entre niños y niñas. De entre los resultados que se obtuvieron cabe destacar los si-
guientes. Los padres tenían reacciones diferentes ante niños y niñas, con reacciones
más positivas ante los niños cuando éstos desarrollaban conductas agresivas y cuan-
do jugaban con juguetes típicamente masculinos. Las madres presentaban reaccio-
nes más positivas que los padres hacia los juguetes típicamente femeninos. Ásimis-
mo, los niños recibían reacciones más negativas que las niñas cuando intentaban
comunicarse; los niños recibían reacciones más positivas al jugar con juguetes típica-
mente masculinos, y al realizar conductas agresivas. Las niñas recibían respuestas
338 Vicens Quera y Júlia Behar
REFERENCIAS BIBLIOGRÁFICAS
Abikoff, H., Gittelman, R. y Klein, D. F. (1980). Classroom observation code for hyperactive
children: A replication of validity. Joxrnal of Consulting and Clinical Psychology, 48, 555-
565.
Altmamn, J. (1974). Observational study of behavior: Sampling methods. Behaviour, 49, 227-
267.
Anguera, M. T. (1981). La observación (I): Problemas metodológicos. En R. Fernández-Ba-
lesteros y J. A. Carrobles (dirs.), Evaluación conductual: metodología y aplicaciones. Ma-
drid. Pirámide.
Anguera, M. T. (1985). Metodología de la observación en las ciencias humanas (3* ed.). Ma-
drid. Cátedra.
Anguera, M. T. (1991). Proceso de categorización. En M. T. Anguera (dir.), Metodología ob-
servacional en la investigación psicológica (vol. 1). Barcelona. PPU.
Ary, D. y Suen, H. K. (1983). The use of momentary time sampling to assess both frequency
and duration of behavior. Journal of Behavioral Assessment, 5, 143-150.
Bakeman, R. (1997). Behavioral observations and coding. En H. T. Reis y C. K. Judd (dirs.),
Handbook of research methods in social psychology. Nueva York. Cambridge University
Press.
Bakeman, R. y Brown, J. V. (1977). Behavioral dialogues: An approach to the assessment of
mother-infant interaction. Child Development, 48, 195-203.
Bakeman, R. y Gottman, J. M. (1987). Applying observational methods: A systematic re-
o En J. D. Osofsky (dir.), Handbook of Infant Development (2* ed.). Nueva York.
Wiley.
Bakeman, R. y Gottman, J. M. (1997). Observing interaction: An introduction to sequential
analysis (2* ed.). Nueva York. Cambridge University Press.
Bakeman, R. y Quera, V. (1992). SDIS: A sequential data interchange standard. Behavior Re-
search Methods, Instruments, E Computers, 24, 554-559.
Bakeman, R. y Quera, V. (19954). Analyzing interaction: Sequential analysis with SDIS and
GSEQ. Nueva York. Cambridge University Press.
Bakeman, R. y Quera, V. (1995b). Log-linear approaches to lag-sequential analysis when
consecutive codes may and cannot repeat. Psychological Bulletin, 118, 272-284.
Bakeman, R., Robinson, B. F. y Quera, V. (1996). Testing sequential association: Estimating
p values using sampled permutations. Psychological Methods, 1, 4-15.
Barrett, B. H., Johnston, J. M. y Pennypacker, H. S. (1986). Behavior: Its units, dimensions,
and measurements. En R. O. Nelson y S. C. Hayes (dirs.), Conceptual foundations of be-
havioral assessment. Nueva York. Guilford Press.
La observación
339
Kaye, K. (1982). The moral philosophy of microanalysis. En T. Field y A. Fogel (dirs.), Emo-
tion and early interaction. Hillsdale. Lawrence Erlbaum. : EA
Kazdin, A. E. (1977). Artifact, bias and complexity of assessment: The ABC's of reliability.
Journal ofApplied Behavior Analysis, 10, 141-150. ce
Kent, R. N. y Foster, S. L. (1997). Direct observational procedures: Methodological issues in
naturalistic settings. En A. R: Ciminero, K. S. Calhoun y H. E. Adams (dirs.), Handbook
of behavioral assessment. Nueva York. Wiley. ' . ,
Klesges, R. C., Woolfrey, J. y Vollmer, J. (1985). An evaluation of time sampling versus con-
tinous observation data collection. Journal of Behavioral Therapy and Experimental Psy-
chiatry, 16, 303-307.
Landis, J. R. (1975). A general methodology for the measurement of the observer agreement
when the data are categorial. (Institute of Statistics, Mimeo Series No. 1022). Chapel Hill.
University of North Carolina. ;
León, O. G. y Montero, 1. (1995). Diseño de investigaciones: introducción a la lógica de la in-
vestigación en psicología y educación. Madrid. McGraw-Hill.
Martin, P. y Bateson, P. (1986). Measuring behaviour: An introductory guide. Londres. Cam-
bridge University Press.
Mash, E. J. yMcElwee,J.M. (1974). Situational effects on observer accuracy: Behavioral pre-
dictability, prior experience and complexity of coding categories. Child Development, 45,
367-377.
McRae, S. (1995). Modelos y métodos para las ciencias del comportamiento. Barcelona. Ariel.
Mehm, J. G. y Knutson, J. F. (1987). A comparison of event and interval strategies for obser-
vational data analysis and assessment of observer agreement. Behavioral Assessment, 9,
151-167. 1
Muchielli, R. (1974). L'observation psychologique et psychosociologique. Librairies Techni-
ques Les Editions ESF.
Noack, P. (1992). Parent-child relationships in early adolescence: Interpersonal interactions
and perceived relationship quality. Comunicación presentada en el Third European
Workshop on Adolescence. Bolonia, Italia.
Noldus, L. P. J. J. (1992). The Observer: A software system for collection and analysis of ob-
servational data. Behavior Research Methods, Instruments, and Computers, 23, 415-429.
Pleite, A. e Ibern, 1. (1991). Registro de evaluación de hechos. Un modelo de evaluación e in-
tervención conductual en prisiones. Comunicación presentada en el II Congreso Interna-
cional Latini Dios. Sitges, Barcelona.
Powell, J., Martindale, A. y Kulp, S. (1975). An evaluation of time sampling measures of be-
havior. Journal ofApplied Behavior Analysis, 8, 463-469.
Quera, V. (1986). Micro-análisis de la conducta interactiva: una aplicación a la interacción
materno-filial en chimpancés. Tesis doctoral inédita. Universidad de Barcelona.
Quera, V. (1989). Estimación de frecuencia y duración en el muestreo temporal de la conduc-
ta. Anuario de Psicología, 43, 33-62.
Quera, V. (1990). A generalized technique to estimate frequency and duration in time sam-
pling. Behavioral Assessment, 12, 409-424.
Quera, V. (1991). Muestreo y registro observacional. En M. T. Anguera (dir.), Metodología
observacional en la investigación psicológica (vol. 1). Barcelona. PPU.
Quera, V. (1993). Análisis secuencial. En M. T. Anguera (dir.), Metodología observacional en
la investigación psicológica (vol. 11). Barcelona. PPU.
Rosenblum, L. A. (1978). The creation of a behavioral taxonomy. En G. P. Sackett (dir.), Ob-
seas behavior (vol. 11): Data collection and analysis methods. Baltimore. University
ark Press.
Rosenthal, R. (1967). Covert communication in the phsychological experiment. Psychologi-
cal Bulletin, 67, 357-367.
Sackett, G. P. (1978). Measurement in observational research. En G. P. Sackett (dir.), Obser-
La observación 3%
e behavior (vol. 11): Data collection and analysis methods. Baltimore. University Park
ress.
Sackett, G. P., Ruppenthal, G. C. y Gluck, J. (1978). An overview of methodological and sta-
tustical problems is observational research. En G. P. Sackett (dir.), Observing behavior
(vol. 11): Data collection and analysis methods. Baltimore. University Park Press.
Schleidt, W. M. (1982). Stereotyped features variables are essential constituents of behavior
patterns. Behaviour, 69, 231-238.
Suen, H. K. (1988). Agreement, reliability, accuracy, and validity: Toward a clarification. Be-
havioral Assessment, 10, 343-366.
Suen, H. K. y Ary, D. (1986). A post hoc correction procedure for systematic errors in time
sampling duration estimates. Jonrnal of Psychopathology and Behavioral Assessment, 8,
31-38.
Suen, H. K. y Ary, D. (1989). Analyzing quantitative behavioral observation data. Hillsdale.
Lawrence Erlbaum.
Sulzer-Azarof, B. y Reese, E. P. (1982). Analyzing behavior analysis: A program for develo-
ping professional competence. Nueva York. Rinehart and Winston.
Van Hooff,J.A. R. A. M. (1982). Categories and sequences of behavior: Methods of descrip-
tion and analysis. En K. R. Scherer e L Vine (dirs.), Handbook of methods in nonverbal
behavior research. Cambridge. Cambridge University Press.
Wallace, C. P. y Elder, J. P. (1980). Statistics to evaluate measurement accuracy and treate-
ment effects in single subject research designs. En M. Hersen, R. M. Eisler y P. M. Miller
(dirs.), Progress in behavior modification (vol. 10). Nueva York. Academic Press.
Weick, K. E. (1968). Systematic observational methods. En G. Lindzey y E. Aronson (dirs.),
Handbook of social psychology (vol. 2). Reading. Addison-Wesley.
Weiss, R. L. (1985). MICS-111. Marital Interaction Coding System. Oregón. University of
Oregon.
Wright H. F. (1960). Observational child study. En P. H. Mussen (dir.), Handbook of re-
search methods in child development. Nueva York. Wiley.
Yarrow, W. R. y Waxler, C. Z. (1979). Observing interaction: Confrontation with methodo-
logy. En R. B. Cairns (dir.), The analysis of social interactions. Hillsdale (NJ). Lawrence
Erlbaum.
Zazzo, B. (1978). La adaptación escolar: un estudio experimental. Infancia y Aprendizaje, 1,
41-65.
LECTURAS COMPLEMENTARIAS
j pa
a id
AS, a
o e
TS
A
pp edo
A
An pREDIZA
n 4 >.
Pie IDEA A
pt
w AA A
ATA,
E
ao e pone Comunica ida pressenada Mega Ñ
La castusnoo Ote o
ce
ts Anal) brainCAAd
TA
CON
MOTO ÚS ¡aer Aaci AA
o a SA man
L INTRODUCCIÓN Y DEFINICIONES
Hahnemann University (EE UU) y University of North Carolina at Greensboro (EE UU).
1 Tal como se usa en este capítulo, el término autorregistro se refiere al procedimiento asociado al
enfoque conductual de la evaluación clínica, que consiste en discriminar y registrar la presencia de una
conducta propia. En los últimos quince años, los psicólogos sociales han empleado el término “autorre-
gistro” de forma muy distinta para describir un tipo de personalidad asociado a una gran preocupación
por adaptar el modo de presentación de uno mismo a las situaciones sociales (Snyder y Gangestad, 1986;
Gangestad y Snyder, 1991).
344 James D. Herbert y Rosemery O. Nelson-Gray
El autorregistro es útil tanto para la evaluación como para fines terapéuticos. Con
respecto a la evaluación, el autorregistro puede emplearse para obtener datos duran-
te dos fases del contacto terapéutico. Durante la primera fase, es importante deter-
minar las conductas y sus variables dominantes. Se pide al paciente que realice un
diario de conductas, anotando los sucesos problemáticos y las circunstancias que los
rodean. A partir de esta información, se pueden establecer patrones consistentes que
conduzcan a la selección de conductas y posibles técnicas de tratamiento. En la fase
siguiente de contacto terapéutico, el autorregistro se vuelve a emplear en la línea base
e intervención para registrar la frecuencia de las conductas seleccionadas para eva-
luar el éxito o fracaso del tratamiento.
La autoobservación
345
m.1. Narraciones
m7. Gráficos
Con independencia del procedimiento de autorregistro empleado, una forma ade-
cuada de resumir los datos del autorregistro es un gráfico de la conducta. General-
mente, las unidades de tiempo aparecen en la abscisa, mientras que la ordenada refle-
ja unidades de medida de la conducta (por ejemplo, frecuencia, porcentaje o tiempo).
Kanter (1976) sugirió a los sujetos realizar autorregistros menos exactos de con-
ductas con valencia negativa que de conductas con valencia positiva. Puesto que la
atención a conductas negativas puede producir una autoevaluación negativa, los
pacientes pueden evitar atender a conductas no deseadas, produciendo entonces
datos inexactos. La sugerencia de Kanfer ha recibido algún apoyo científico. Por
ejemplo, Nelson y cols. (1976) encontraron un mayor índice de acuerdo entre auto-
informadores adultos retardados y observadores en la conducta positiva de la con-
versación social que en la conducta negativa de tocarse la cara. Resultados similares
obtuvieron Nelson y cols. (1977) y Nelson y cols. (1980). En cambio, Willis y Nel-
son (1982) encontraron que las conductas con valencia negativa se autorregistraban
con mayor exactitud que las de valencia positiva en el caso de estudiantes univers1-
tarias.
En un intento por aumentar la escasa exactitud con la que sus sujetos registraban la
frase you know, Peterson y cols. (1975) les pidieron que practicaran el autorregistro
en vídeo. Mientras que este procedimiento era eficaz para elevar la exactitud aun
62% en el autorregistro, el entrenamiento no se extendió a la conversación en vivo,
donde la exactitud descendió al 20%. Para el entrenamiento de sujetos adolescentes
retardados, Nelson y cols. (1978) emplearon tanto práctica de vídeo como práctica
en situación de clase; cuatro sujetos entrenados autorregistraron con mayor exacti-
tud sus intervenciones de clase apropiadas (0,91) que cinco sujetos menos entrena-
dos (0,78). Hamilton y Bornstein (1977) también encontraron que la práctica en el
autorregistro de faltas de fluidez en el habla de cinta de audio y situaciones en vivo
producía mayor exactitud del autorregistro que una condición de control. Sin em-
354 James D. Herbert y Rosemery O. Nelson-Gray
Una cuestión más importante aún que inducir a los pacientes para que produzcan
datos de autorregistro exactos es persuadirlos para el autorregistro mismo. Algunas
sugerencias prácticas para asegurar la recogida consistente de datos han sido aporta-
das por Mahoney (1977). Una de sus sugerencias es proporcionar al sujeto un instru-
mento simple y fiable que sea compatible con la conducta. Igualmente, el procedi-
miento de medida, esto es, registro de frecuencias o de duración, debe ser adecuado
para la conducta. Un paciente puede dejar el autorregistro si el procedimiento de
medida no es apropiado para la conducta o si no se adecua al procedimiento de me-
dida y la conducta. Los terapeutas han de ser creativos e ingeniosos para hacer frente
a las necesidades de los pacientes. Por ejemplo, un magnetófono puede emplearse
para mejorar el autorregistro de pacientes a los que disgusta escribir.
Otra cuestión es determinar qué pacientes son adecuados para los procedimien-
tos de autorregistro. En nuestra experiencia, la mayoría de los pacientes es capaz de
proporcionar datos útiles por medio de algún tipo de autorregistro, en tanto que se
adapte la estrategia de evaluación al paciente. A algunos pacientes hay que analizar-
los cuidadosamente antes de iniciar el autorregistro. Por ejemplo, puede ser poco
acertado prescribir el autoinforme en pacientes cuya cuantificación es sospechosa.
Igualmente, algunos pacientes con trastornos obsesivo-compulsivos pueden emplear
demasiado tiempo en el autorregistro, hasta el punto de que la tarea se convierta en
un problema. Tras determinar que un paciente es apto para el autorregistro, debe en-
La autoobservación
355
Tal como hemos visto, la acción misma del autorregistro tiende a producir cambios
en la conducta misma, proceso conocido como reactividad. Aunque este fenómeno
presenta evidentes problemas cuando la exactitud de los datos está en juego, la reac-
tividad del autorregistro es útil en terapia puesto que la dirección del cambio es nor-
malmente positiva, esto es, las conductas deseables tienden a aumentar en frecuencia
cuando se autorregistran, mientras que las no deseables tienden a disminuir. En este
apartado revisaremos brevemente varios estudios que muestran el fenómeno de la
reactividad y a continuación examinaremos las variables que influyen en ella.
Los efectos de reactividad del autorregistro han sido refutados en numerosas
ocasiones por medio de estudios de casos, en diseños experimentales intra e inter-
sujeto. Las siguientes conductas relevantes clínicamente han sido alteradas por el
autorregistro: alucinaciones (Rutner y Bugle, 1969), tricotilomanía (Bayer, 1972),
morderse los labios (Ernst, 1973), consumo de alcohol (Sobell y Sobell, 1973), con-
ductas motoras repetitivas (Maletzky, 1974), pensamientos obsesivos (Frederiksen,
1975), insomnio (Jason, 1975), ideas paranoides (Williams, 1976) y consumo de an-
fetaminas y pensamientos relacionados con las drogas (Hay, Hay y Angle, 1977).
Los diseños experimentales de N= 1 incluyen la demostración B-A-B de Leiten-
ber y cols. (1968) en la que un paciente con claustrofobia aumentaba el tiempo que
estaba en una pequeña habitación cuando usaba un cronómetro para determinar el
tiempo transcurrido en cada prueba. Usando un diseño inverso, Herbert y Baer
(1972) hallaron que el autorregistro aumentaba la atención materna dependiente
y conductas infantiles apropiadas. Por su parte, McKenzie y Rushall (1974) infor-
man de dos experimentos, uno empleando un diseño de línea base múltiple y otro un
diseño inverso; ambos estudios demostraron que los nadadores podían emplear
autorregistros para mejorar varios aspectos de la natación. Usando diseños de línea
de base múltiple en varias conductas de dos personas con tics motores, Thomas,
Abrams y Johnson (1971) y Hutzell, Platzek y Logue (1974) demostraron que la fre-
cuencia de éstos se reducía eficazmente por medio de su autorregistro. Finalmente,
un diseño de lína base múltiple en distintas situaciones fue empleado por Seymour y
Stokes (1976) para demostrar que el autorregistro aumentaba la frecuencia de las
conductas de trabajo en chicas delincuentes.
Los diseños experimentales entresujeto han demostrado también los efectos re-
activos del autorregistro. Así, estudiantes universitarios que autorregistraron sus ac-
tividades de estudio obtenían mejores calificaciones que los sujetos de un grupo
control y los sujetos que autorregistraban sus salidas (Johnson y White, 1971). Var-
gas y Adesso (1976) encontraron una longitud de uñas mayor en onicófagos que auto-
registraban el comerse las uñas que en aquellos que no se autorregistraban.
Finalmente, una serie de estudios ha comparado los efectos reactivos del
autorregistro con cambios de conducta producidos por otras técnicas terapéuticas.
Nelson y cols. (1976) hallaron que el autorregistro de adultos retardados era más efi-
caz que la economía de fichas para incrementar la frecuencia de tres conductas desea-
bles: conversación social, limpieza de la habitación y participación en actividades re-
creativas. En otro diseño entresujeto, se demostró que el autorregistro en pacientes
La autoobservación
007
Peterson y cols. (1975) sugirieron que el autorregistro es más reactivo cuando la con-
ducta es no verbal que cuando es verbal. En su estudio, el autorregistro produjo ma-
yores cambios en la frecuencia de tocarse la cara que en la frecuencia de dos expre-
siones verbales. Similares resultados fueron obtenidos posteriormente por Hayes y
Cavior (1977). Otros estudios han demostrado que la reactividad depende de la con-
ducta específica que se asigne para el autorregistro. Romanczyk (1974) encontró que
el registro del peso diario y de la ingestión de calorías producía mayor pérdida de
peso que únicamente el registro del peso. Por su parte, Gottman y McFall (1972) de-
mostraron que el autorregistro de la participación en clase aumentaba la frecuencia
de la conducta, mientras que el autorregistro de impulsos no realizados de participar
disminuía su frecuencia.
tión de comida antes de comer. Sin embargo, con niños pequeños, Nelson y cols.
(1977) hallaron que el autorregistro previo o posterior a las intervenciones en clase
no afectaba diferencialmente a la reactividad de las intervenciones apropiadas o ina-
propiadas.
Como resulta obvio de la discusión anterior, muchos de los factores que afectan
a la exactitud del autorregistro también influyen en el grado de reactividad produci-
do por el procedimiento. Esto plantea la cuestión de si la reactividad es estrictamente
dependiente de la exactitud. Nelson y McReynolds (1971) sugieren que aunque el
autorregistro pueda ser inexacto, puede no obstante producir efectos reactivos con-
sistentes. Esta sugerencia fue confirmada experimentalmente por Broden y cols.
(1971), Fixsen y cols. (1972), Herbert y Baer (1972) y Lipinski y Nelson (1974), de-
mostrando todos ellos que el autorregistro producía efectos reactivos aunque fuera
inexacto con respecto a las observaciones externas. Además, Hayes y Cavior (1977)
concluyeron que la exactitud del autorregistro no se correlacionaba con la magnitud
La autoobservación
361
X. CONCLUSIONES
El autorregistro sigue siendo uno de los pilares del enfoque conductual de la evalua-
ción y tratamiento de una amplia gama de fenómenos conductuales y clínicos. Se ha
identificado una serie de variables que afecta a la exactitud y reactividad de los datos
autorregistrados, pero es necesaria más investigación a este respecto. Aunque la in-
vestigación básica de los mecanismos que subyacen al autorregistro ha ido disminu-
yendo en la última década, las aplicaciones clínicas del autorregistro se han extendi-
do ampliamente. En relación con los comienzos de la evaluación conductual, en los
que el autorregistro se aplicaba principalmente a conductas discretas y observables,
ha habido una tendencia a la aplicación del procedimiento a una amplia gama de
conductas que son importantes clínicamente aunque difíciles de evaluar. Por ejem-
plo, el autorregistro se emplea cada vez con más frecuencia para evaluar simultá-
neamente conductas múltiples que covarían (por ejemplo, síndromes clínicos), así
como para evaluar cogniciones. La llegada del ordenador personal ha comenzado a
dejar su marca en el procedimiento a medida que se desarrollan procedimientos de
autorregistro. Es probable que éstos y otros avances den lugar al aumento de popu-
laridad del autorregistro como importante instrumento clínico y de investigación.
REFERENCIAS BIBLIOGRÁFICAS
Agras, W. S., Taylor, C. B., Feldman, D. E., Losch, M. y Burnett, K. I-. (1990). Developing
computer-assisted therapy for the treatment of obesity. Behavior 1herapy, 21, 99-109.
Azrin, N. H. y Powell, J. (1968). Behavioral engineering: The reduction of smoking behavior
by a conditioning apparatus and procedure. Journal of Applied Behavior Analysis, 1, 193-
200.
Azrin, N. H. y Powell, J. (1969). Behavioral engineering: The use of response priming to im-
prove self-medication. Journal ofApplied Behavior Analysis, 2, 39-42. des
Azrin, N. H., Rubin, H., O'Brien, F., Ayllon, T. y Roll, D. (1968). Behavioral engineering:
Postural control by a portable operant apparatus. Journal ofApplied Behavioral Analysis,
1,99-108.
Bailey, M. 1 y Peterson, G. L. (1977). Reactivity and accuracy of self-monitored verbal res-
ponses. Manuscrito inédito.
Barlow, D. H., Cohen, A. S., Waddell, M. T., Vermilyea, B. B., Klosko, J. S., Blanchard, E. B.
y DiNardo, P. A. (1984). Panic and generalized anxiety disorders: Nature and treatment.
Behavior Therapy, 15, 431-449.
362 James D. Herbert y Rosemery O. Nelson-Gray
ic, 5;yay Snyder, M. (1991). Taxonomic analysis redux: Some statistical considerations
or testing a latent class model. /:ournal ofPersonality and Social Psychology, 61, 141-146.
Goldstein, A. y Brown, B. W. (1970). Urine testing schedules in methadone maintenance treat-
3 of q a Journal of the American Medical Association, 214, 311-315.
MA a eee> toES
logy, 39, 273-281.
Hamilton, S. B. y Bornstein, P. H. (1977). Increasing the accuracy of self-recording in speech
anxious undergraduates through the use of self-monitoring training and reliability enhan-
cement procedures. Journal of Consulting and Clinical Psychology, 45, 1076-1085.
Hannunm, J. W., Thoresen, C. E. y Hubbard, D. R. (1974). A behavioral study of self-esteem
with elementary teachers. En M. J. Mahoney y C. E. Thoresen (dirs.), Self control: Power
to the person. Monterrey. Brooks-Cole.
Hasher, L. y Zacks, R. T. (1979). Automatic and effortful processes in memory. Journal of
Experimental Psychology: General, 108, 356-388.
Hasher, L. y Zacks, R. T. (1984). Automatic processing of fundamental information. Ameri-
can Psychologist, 39, 1372-1388.
Hay, L. R., Hay, W. M. y Angle, H. V. (1977). The reactivity of self-recording: A case report
of a drug abuser. Behavior Therapy, 8, 1004-1007.
Hayes, S. C. y Cavior, N. (1977). Multiple tracking and the reactivity of self-monitoring; L.
Negative behaviors. Behavior Therapy, 8, 819-831.
Hendricks, C. G., Thoresen, C. E. y Hubbard, D. R. (1973). Effects of behavioral self-obser-
vation on elementary teachers and students. Manuscrito inédito.
Herbert, E. Y. y Baer, D. M. (1972). Training parents as behavior modifier: Self-recording of
contingent attention. Journal ofApplied Behavior Analysis, 5, 139-149.
Horan, J. J. y Johnson, R. G. (1971). Coverant conditioning through a self-management ap-
plication of the Premack principle: Its effect on weight reduction. Journal of Behavior
Therapy and Experimental Psychiatry, 2, 243-249.
Hutzell, R. R., Platzek, D. y Logue, P. E. (1974). Control of symptoms of Gilles de la Tou-
E Syndrome by self-monitoring. Journal of Behavior Therapy and Experimental
Psychiatry, 5, 71-76.
Jackson, B. (1972). Treatment of depression by self-reinforcement. Behavior Therapy, 3,
298-307.
Jason, L. (1975). Rapid improvement in insomnia following self- monitoring. Journal of Be-
havior Therapy and Experimental Psychiatry, 6, 349-350,
Johnson, S. M. y White, G. (1971). Self-observation as an agent of behavioral change. Beha-
vior Therapy, 2, 488-497.
Kanfer, F. 11-976) The many faces of self-control, or behavior modification changes its fo-
cus. Comunicación presentada en The Eighth International Banff Conference.
Kazdin, A. E. (1974a). Reactive self-monitoring: The effects of response desirability, goal set-
ting, and feedback. Journal of Consulting and Clinical Psychology, 42, 704-716.
Kazdin, A. E. (1974b). Self-monitoring and behavior change. En M. J. Mahoney y C. E. Tho-
resen (dirs.), Self-control: Power to the person. Monterrey. Brooks-Cole.
Kirby, K. C., Fowler, S. A. y Baer, D. M. (1991). Reactivity in self-recording: Obtrusiveness
of recording procedure and peer comments. Journal of Applied Behavior Analysis, 24,
487-498.
Kolb, D. A., Winter, S. K. y Berlew, D. E. (1968). Self-directed behavior change: Two stu-
dies. Journal ofApplied Behavior Science, 4, 453-471.
Komaki,].y Dore-Boyce, K. (1978). Self-recording; Its effects on individuals high and low in
motivation. Behavior Therapy, 9, 65-72. )
Kubany, E. S. y Sloggett, B. B. (1973). Coding procedures for teachers. Journal of Applied
Behavior Analysis, 6, 339-344.
364 James D. Herbert y Rosemery O. Nelson-Gray
McNamara, J. R. (1972). The use of self-monitoring techniques to treat nail biting. Behavionr
Research an Therapy, 10, 193-194.
Miller, P. M., Hersen, M., Eisler, R. M. y Watts, J. G. (1974). Contingent reinforcement of
lo-
wered blood alcohol levels in an outpatient chronic alcoholic. Behaviour Research and
Therapy, 12, 261-263.
Nelson, R. O., Hay, L. R. y Hay, W. M. (1977). Cue versus consequence functions of high
probability behaviors in the modification of self-monitored study coverants and study
time. Psychological Record, 3, 589-599.
Nelson, R. O., Hay, L. R., Hay, W. M. y Carstens, C. B. (1977). The reactivity and accuracy
ice self-monitoring of positive and negative classroom verbalizations. Behavior
erapy, 8, 972-985.
Nelson, R. O., Hay, L. R., Devany, ]. y Koslow-Green, L. (1980). The reactivity and accu-
racy of children's self-monitoring: Three experiments. Child Behavior Therapy, 2, 1-24.
Nelson, R. O., Lipinski, D. P. y Black,].L. (1975). The effects of expectancy on the reactivity
of self-recording. Behavior Therapy, 6, 337-349.
Nelson, R. O., Lipinski, D. P. y Black, J. L. (1976). The relative reactivity of external observa-
tions and self-monitoring. Behavior Therapy, 7, 314-321.
Nelson, R. O., Lipinski, D. P. y Boykin, R. A. (1978). The effects of self-recorders” training
and the obtrusiveness of the self-recording device on the accuracy and reactivity of self-
monitoring. Behavior Therapy, 9, 200-208.
Nelson, C. M. y McReynolds, W. T. (1971). Self-recording and control of behavior: A reply
to Simkins. Behavior Therapy, 2, 594-597.
Nelson-Gray, R. O., Herbert, D. L., Herbert, J. D., Farmer, R., Badawi, I. y Lin, K. (1990).
The accuracy of frequency estimation as compared with actual counting 1n behavioral as-
sessment. Behavioral Assessment, 12, 157-178.
Nietzel, M. T., Bernstein, D. A. y Russell, R. L. (1988). Assessment of anxiety and fear. En
A. S. Bellack y M. Hersen (dirs.), Behavioral assessment: A practical handbook (3.2 ed.).
Nueva York. Pergamon Press. 4
Orne, M. T. (1970). From the subject's point of view, when is behavior private and when is it
public: Problems of inference. Journal of Consulting and Clinical Psychology, 35, 143-147.
Peterson, A. L. y Azrin, N. H. (1992). An evaluation of behavioral treatments for Tourette
syndrome. Behaviour Research and Therapy, 30, 167-174.
Peterson, G. L., House, A. E. y Alford, H. F. (1975). Self-monitoring: Accuracy and reacti-
vity in a patients's recording of three clinically targeted behaviors. Comunicación presen-
tada en The Sutheastern Psychological Association. Atlanta, EEUU.
Richards, C. S., McReynolds, W. T., Holt, S. y Sexton, T. (1976). Effects of information feed-
back and self-administered consequences on self-monitoring study behavior. Journal of
Counseling Psychology, 23, 316-321.
Romanczyk, R. G. (1974). Self-monitoring in the treatment of obesity: Parameters of reacti-
vity. Behavior Therapy, 5, 531-540. e a
Rutner, 1. T. y Bugle, C. (1969). An experimental procedure for the modification of psycho-
tic behavior. Journal of Consulting and Clinical Psychology, 33, 651-653. 12
Samo, J. A., Tucker, J. A. y Vuchinich, R. E. (1989). Agreement between self-monitoring, re-
call, and collateral observation measures of alcohol consumption in older adults. Beha-
vioral Assessment, 11, 391-409. bil
Santogrossi, D. A. (1974). Selfereinforcement and external monitoring of perfomance on an
academic task. Comunicación presentadaenThe Fifty Annual Conference on Applie
Behavior Analysis in Education, Kansas City, EE UU. as
Schlundt, D. G. (1988). Self-monitoring analysis system. En M. Hersen y A.S. Bellack (dirs.),
Dictionary of behavioral assessment techniques. Nueva York. Pergamon Press. pá
o
Schlundt, D. G., Johnson, W. G. y Jarrell, M. P. (1985). A naturalistic functional analysis
eating behavior in bulimia. Advances in Behavior Research and Therapy, 7, 149-162.
366 James D. Herbert y Rosemery O. Nelson-Gray
LECTURAS COMPLEMENTARIAS
X AS 8 dJ> me EEN
Ú ha me e A Topas EY
NE » á = 50 al $
1] Z ú pa sra] ST
a mputera a
, ¡LÓ Fe ME E »
¿d.C Hd ki LA
] de AN
22 0On sad walírien vé
aseo Cinicas á
17. TÉCNICAS DE REGISTRO DE LA ACTIVIDAD MOTORA
WARREN W. TRYON
IL INTRODUCCIÓN
a. Los datos obtenidos son objetivos ya que los aparatos no están influidos por
las características raciales, de sexo o sociales.
b. Lafiabilidad de los aparatos de registro de la actividad motora se ha demos-
trado en condiciones de laboratorio (Tryon, 1985, 1991).
c. Los registros han sido validados en condiciones de laboratorio (Tryon,
1985, 1991).
d. A diferencia de las escalas de estimación, que confunden actividad con agre-
sión (Hinshaw, 1987), los datos instrumentales de la actividad motora son
unidimensionales.
e. Los aparatos de registro son portátiles y por consiguiente permiten obtener
datos útiles del colegio, la casa y/o el trabajo.
f.. Las características de operación de los aparatos son más estables en el tiem-
po que los observadores.
g. Los aparatos no violan la intimidad de los sujetos como sucede con los ob-
servadores.
h. Los datos instrumentales de la actividad motora constituyen en la actualidad
una buena inversión (Tryon, 1991).
13. ElDSM
Tryon (1986, 1989, 1991) ha revisado el importante papel que juega la actividad mo-
tora en los manuales de diagnóstico DSM-I, DSM-II, DSM-I11 y DSM-IIER en niños y
adultos. La lista más completa que considera a la actividad motora como criterio de
inclusión y exclusión aparece en Tryon (1989), llegando a identificar 46 categorías en
el DSM-II1-R (American Psychiatric Association, 1987) que incluyen la actividad mo-
tora en sus criterios de inclusión. Esta lista puede ampliarse considerando los crite-
rios de diagnóstico diferencial.
La actividad en el sueño merece una especial atención. Actígrafos basados en la
variable tiempo obtienen y registran medidas de la actividad a intervalos prefijados
(épocas). La vigilancia (o insomnio) puede determinarse registrando la actividad de
la muñeca (Tryon, 1991). Por tanto, es posible determinar el tiempo en que el movi-
miento se reduce a niveles afines al sueño. La vigilancia periódica durante la noche se
detecta por el incremento de la actividad de la muñeca. Tales datos pueden detectar
también los trastornos del ritmo sueño-vigilia, el sonambulismo, la ansiedad durante
el sueño y los terrores nocturnos.
11. Podómetros
La unidad de Large scale integrated (LSI) [Gran escala integrada '] contiene un único
interruptor de mercurio que responde a una inclinación de 5 grados a partir del pla-
no horizontal (McPartland, Kupfer y Foster, 1976; McPartland y cols., 1976). Schul-
man, Stevens y Kupst (1977) describen un sistema tridimensional basado en tres in-
terruptores situados a 120 grados uno de otro. Estos dispositivos son también
contadores de frecuencia de movimiento y son insensibles a la intensidad del mismo.
Si un medidor de la inclinación de un solo eje se ajusta a la cintura de forma que res-
ponda al movimiento vertical, funcionará como los contadores de pasos. El ajuste a
la muñeca o al tobillo permite registrar el movimiento en otros planos puesto que el
lugar de ajuste pasa por estos planos en el movimiento.
Los medidores del movimiento son relojes automáticos modificados de forma que el
rotor que da cuerda mueve directamente el minutero. Schulman y Reisman (1959)
describieron el medidor de movimiento por primera vez, y Tryon (1985) describe el
mecanismo de funcionamiento con detalle. Los movimientos fuertes en los dos pla-
nos en que opera el rotor harán que se mueva más que movimientos suaves o mode-
rados. Su único inconveniente reside en que no están disponibles comercialmente.
' GMM Electronics, Inc., 1200 Riverview Drive, Verona (Pa). 15147.
Técnicas de registro de la actividad motora
373
En la era de los relojes digitales, los relojes automáticos son difíciles de encontrar y
han de ser modificados por un relojero o por uno mismo.
III. FIABILIDAD
Los intentos por establecer la fiabilidad de los aparatos de medida del movimiento
por métodos de ensayo y reensayo están condenados a fallar ya que no se puede es-
perar que los sujetos respondan dos veces con movimientos idénticos de los miem-
bros y del tronco. Una consecuencia deseable de la utilización de equipos para regis-
trar el movimiento es que se puede evaluar su fiabilidad en condiciones de
laboratorio bien controladas, independientes de la conducta del sujeto de estudio.
Este es el único método fiable para evaluar las características de respuesta de un ins-
trumento. A menudo se confunde la fiabilidad con la replicabilidad. A continuación
intentamos aclarar la diferencia.
La consistencia con la que un monitor del movimiento responde puede ser evaluada
mejor sometiéndolo repetidamente al mismo estímulo bien definido. Tal ensayo
debe realizarse en condiciones de laboratorio y con un equipo de precisión.
111.11. Podómetros
91% de los podómetros estaba dentro del 5% de 6 millas tras 30 minutos de vibra-
ción. Tryon, Pinto y Morrison (1991) hicieron oscilar 7000 veces 19 podómetros di-
gitales en siete pruebas con el resultado de un 4,75% de error de media; para 1-7
igual a 0,0475, r debe ser igual a 0,98.
Debido a que la unidad Large scale integrated (LS1) descrita anteriormente incre-
menta el registro en una unidad cada 15 registros, existe una imprecisión adicional de
15 unidades. McGowan y cols. (1984) hicieron oscilar dos unidades LS7 a 160 movi-
mientos horizontales por minuto en dos pruebas de 30 minutos. El primer aparato
dio unos registros de 4896 y 4864 en las dos pruebas. La diferencia de 32 registros
proporciona una fiabilidad de 99,34% [1-32/((4896 + 4864)/2)]; el segundo aparato
dio registros idénticos de 4768 en ambas pruebas con un 100% de fiabilidad.
Unas poblaciones de sujetos son más variables que otras. La variación de con-
ducta de niños hipercinéticos y retardados es bien conocida. Se pueden obtener me-
didas de actividad refutables de tales sujetos de dos modos. El primero es colocarlos
en circunstancias muy poco representativas que requieran un nivel de movimiento
específico. La escasa validez de este enfoque es problemática. El segundo es extender
la muestra de conducta en proporción directa a la variación observada y consiguien-
temente producir un resultado medio de refutación. La investigación previa y/o los
datos piloto determinarán mejor la duración del intervalo de muestra necesario para
producir resultados refutables. Tryon (1991) presenta datos que indican que mues-
tras de conducta del movimiento de muñeca de una semana y especialmente de dos
empleando medidores del movimiento coinciden con muestras de conducta de un
mes de forma consistente.
IV. VALIDEZ
Iv.1. Podómetros y contadores de pasos
Como los podómetros responden al movimiento vertical asociado a la locomoción,
el caminar distancias mayores siempre producirá valores más altos que caminar dis-
tancias más cortas. Los dos aspectos más importantes son la escala y la sensibilidad.
a. Escala. Los podómetros tienen ajustes del paso que determinan cuánto cam-
biará el contador en respuesta a cada movimiento vertical. Se puede hacer caminar al
sujeto repetidamente y ajustar el índice del paso hasta lograr el grado de precisión
deseado, o bien se puede ajustar el índice del paso al máximo y determinar una cons-
tante de conversión empírica para cada sujeto. Si caminar un kilómetro produce una
lectura de 1,4 kilómetros, todos los valores siguientes se dividen por 1,4 para obtener
los kilómetros caminados. Con los contadores de pasos se puede determinar directa-
mente los pasos/millas caminando una distancia fija (1/4 ó 1/2 milla) y extrapolando.
Caminar una sola vez es suficiente, cuanta más distancia mejor.
b. Sensibilidad. Aquí nos interesa la diferencia de movimiento más pequeña
que puede registrar cada aparato. Los contadores de pasos son extremadamente sen-
sibles porque muestran digitalmente cada movimiento que detectan. Los podóme-
tros varían en el grado en que sus indicadores cambian perceptiblemente en respues-
ta al movimiento. Es probable que dos personas lean los indicadores de los
podómetros de forma diferente. Esto no ocurre con los contadores de pasos y cons-
tituye una razón de peso para preferirlos a los podómetros.
muy próximosa los valores esperados de 30 min x 160 movim. horiz/min = 4800
re-
gistros de movimiento. Sin embargo, los interruptores de mercurio de los medidores
de la inclinación no pueden determinar si el movimiento fue más de 5 grados o si fue
rápido o lento (Tryon, 1985, 1991).
V. PROCEDIMIENTO
Algunos niños y adultos realizan autorregistros de hasta dos semanas con preci-
sión. También se puede emplear personal entrenado. La mayoría de los padres y
profesores aporta datos útiles. Los sujetos con grandes depresiones a menudo fraca-
san en las pruebas más simples de autorregistro del movimiento. El movimiento du-
rante el sueño y el despertar de madrugada es especialmente difícil de registrar con
exactitud sin una base temporal.
Los datos basados en el tiempo permiten posteriormente localizar períodos de
especial interés, en combinación con los datos de la actividad diaria, y hacer compa-
raciones cuantitativas entre dichos intervalos. El análisis de series temporales presu-
pone períodos iguales a lo largo de toda la duración del estudio. Sólo los aparatos
que se basan en el tiempo pueden satisfacer con rigor este requisito metodológico.
Los aparatos que se basan en el tiempo no son necesarios cuando sólo se requiere
una única medida acumulada del movimiento por día. Por ejemplo, se registra el
tiempo y los pasos de un sujeto desde que se viste por la mañana hasta que se desvis-
te para acostarse. Se pueden calcular los pasos por minuto del tiempo que pasa vest1-
do y así distinguir con claridad los días más activos de los menos activos.
A veces el precio constituye el factor primordial de elección; bien porque se dis-
pone de un presupuesto limitado o por el riesgo de desperfectos en el aparato. Los
podómetros y contadores de pasos con pantallas de cuarzo líquido Micronta tienen
un precio aproximado de 2000 pesetas, y están protegidos por una funda de plástico
que se ajusta a la cintura y se lleva con comodidad.
Mientras que los investigadores se pueden permitir errores sustanciales porque estu-
dian grupos de sujetos y hacen sus razonamientos a partir de medias de resultados, los
psicólogos clínicos son responsables de dar el mejor cuidado posible a cada cliente. Si
una correlación significativa se establece entre la evaluación de actividad análoga y
natural, el clínico debe interesarse por su magnitud. La significación estadística no
implica gran importancia. Normalmente, la proporción de error de varianza (1-7)
excede la cifra proporcional de varianza previsible (»?). Obtener una medida de la ac-
tividad exacta mientras se administran psicoestimulantes es especialmente importante
dado sus potenciales efectos secundarios a nivel cognitivo (Swanson y cols., 1991).
Las medidas del movimiento de la muñeca basadas en el tiempo tomadas durante
la noche pueden documentar el momento del inicio y del fin del sueño (y por tanto
la duración) además de los despertares nocturnos.
VI. APLICACIONES
Los trastornos de la infancia podrían agruparse en dos tipos: el tipo que se exte-
rioriza y el que se hace interno; la hiperactividad está asociada al último (Tryon,
1993), pero la hipoactividad también puede asociarse al primero. Trastornos de la
conducta en el sueño pueden asociarse a ambas categorías.
VI... CONCLUSIONES
REFERENCIAS BIBLIOGRÁFICAS
American Psychiatric Association (1987). Diagnostic and statistical manual of mental disor-
ders (3* ed. rev.). Washington. APA.
- Borbely, A. A. (1986). New techniques for the analysis of the human sleep-wake cycle. Brain
Development, 8, 482-488.
Buss, A. H. y Plomin, R. (1984). Temperament: Early developing personality traits. Hillsdale,
Erlbaum.
Cole, R. J., Kripke, D. J. y Gruen, W. (1990). Ambulatory monitoring of light exposure:
Comparison of forehead and wrist. Sleep Research, 19, 364.
Conners, C. K. (1969). A Teacher Rating Scale for use in drug studies with children. Amer:-
can Journal of Psychiatry, 126, 884-888.
Edelbrock, C. S. y Achenbach, T. M. (1984). The teacher version of the Child Behavior Pro-
file: 1. Boys age 6-11. Journal of Consulting and Clinical Psychology, 52, 207-217.
Gehardsson, M., Norell, S. E., Kiviranta, H., Pedersen, N. L. y Ahlbom, A. (1986). Sedentary
jobs and colon cancer. American Journal of Epidemiology, 123, 775-780.
Goyette, C. H., Conners, C. K. y Ulrich, R. F. (1978 ). Normative data on revised Conners
Parent and Teacher Rating Scales. Journal of Abnormal Child Psychology, 6, 221-236.
Heiser, J. R., Epstein, L. H. y Wing, R. R. (1981). Technical reliability of pedometers. The
Behavior Therapist, 4, 21-22. :
Hinshaw, S. P. (1987). On the distinction between attentional deficit/hyperactivity and con-
duct problems/aggression in child psychopathology. Psychological Bulletin, 101, 443-
463.
Hinshaw, S. P. (1992). Externalizing behavior problems and academic underachievement in
childhood and adolescence: Causal relationships and underlying mechanisms. Psycholo-
gical Bulletin, 111, 127-155.
Kagan, J. y Snidman, N. (1991). Temperamental factors in human development. American
Psychologist, 46, 856-862.
Kripke, D. F., Mullaney, D. J., Messin, S. y Wyborney, V. G. (1978). Wrist actigraphic mea-
ES e sleep and rhythms. Electroencephalography and Clinical Neurophysiology, 44,
drug studies with children: An empirical study. Jomrnal ofAbnormal Child Psychology, 3,
217-229,
Zuckerman, M. (1991). Psychobiology of personality. Cambridge. Cambridge University
Press.
LECTURAS COMPLEMENTARIAS
1. INTRODUCCIÓN
a. Detección
b. Transformación o transducción
c. Amplificación
d. Registro
e. Conversión
Este proceso puede verse de forma gráfica, y con algo más de detalle, en la figu-
ra 18.1.
En la primera de estas fases, tiene lugar la detección o captación de la señal o acti-
vidad procedente del organismo por medio de las sondas o sensores adecuados, en-
cargados de transmitir la señal al instrumento que habrá de procesar la misma.
En la fase siguiente, la señal captada es transformada o transducida, en caso nece-
sario, a señales eléctricas por medio de los transductores apropiados. Sin embargo,
no es necesario transformar todas las señales psicofisiológicas, pues de los tres tipos
básicos en que suelen dividirse éstas, uno de ellos adopta la forma directa de un po-
tencial eléctrico al ser registrada en la periferia del organismo, merced al proceso
previo de traducción que ha tenido lugar internamente en el mismo a través del pro-
ceso metabólico, al convertir los procesos físicos o químicos subyacentes en poten-
ciales eléctricos. Esta señal, por tanto, sólo ha de ser captada y conducida directa-
387
JOPNu39AUOY
10peoyduy
ozv
091/8160
JoperBaju]
e JOSu9s
epelua ap O
E: JOJONPSUBA | 0po/]993/3
e)
mente desde los electrodos detectores hasta el sistema de amplificación. A este tipo
de fenómenos psicofisiológicos pertenece la actividad eléctrica generada directa-
mente por el corazón, la musculatura estriada periférica, el estómago, la piel o el pro-
pio cerebro. : '
Un segundo tipo de fenómeno psicofisiológico lo constituyen los fenómenos
bioeléctricos transformados o transducidos que, sin ser una actividad eléctrica direc-
ta de un órgano o de un tejido, constituyen propiedades eléctricas de los mismos que
pueden ser medidas de forma indirecta. Ejemplos de fenómenos bioeléctricos trans-
formados son la resistencia eléctrica de la piel, la impedancia eléctrica de la piel, o el
pletismograma, reoencefalograma y neumograma de impedancia. :
Un tercer y último tipo de fenómeno psicofisiológico son los fenómenos bio-
lógicos físicos, o propiedades físicas o mecánicas de los mismos, y que como tales
pueden ser cuantificados o analizados por los mismos métodos utilizados por las
ciencias físicas. Dentro de este tipo de fenómenos, que han de ser igualmente trans-
ducidos de forma diversa, se cuentan la temperatura corporal, la presión sanguínea o
el movimiento, entre otros.
La fase tercera de amplificación de la señal es la fase más importante en el proce-
so de registro de variables fisiológicas. El proceso de amplificación se lleva a cabo
normalmente en dos etapas, o a través de dos tipos básicos de amplificadores: el pre-
amplificador y el amplificador. En la primera de estas etapas, la de preamplificación,
tiene lugar el incremento del nivel de la baja señal de entrada procedente del organis-
mo procurando la mínima distorsión de la misma. El preamplificador opera sobre
los dos parámetros básicos de toda función fisiológica, la magnitud y la frecuencia,
regulando, por un lado, el grado de amplificación o de ganancia de la señal a través de
los controles de sensibilidad con que normalmente van equiparados, y modulando,
por otro, el espectro de frecuencias de la señal de entrada, filtrando las frecuencias
que no alcancen o que sobrepasen (bajas o altas frecuencias) el nivel de frecuencia en
el que el preamplificador opera, según su diseño, con un máximo de eficacia. Otra
característica importante del preamplificador es el acoplamiento o conexión al mis-
mo de la señal, y que determina el tipo de respuesta que recibe. Este acoplamiento de
entrada puede ser directo, permitiendo entonces la entrada y amplificación de seña-
les de frecuencia muy bajas, como las señales unidireccionales de la corriente conti-
nua (CC); o, por el contrario, el acoplamiento puede realizarse a través de un con-
densador, en cuyo caso la frecuencia de respuesta no desciende hasta la de corriente
continua, siendo filtrados estos componentes de la señal, y permitiéndose sólo el
paso de los componentes bidireccionales de elevada frecuencia. El acoplamiento de
entrada del amplificador es un factor fundamental a tener en cuenta en el registro de
toda respuesta, pues en uno u otro caso puede cambiar el significado de la misma.
Algunas respuestas fisiológicas, como la electrodérmica, participan de ambos com-
ponentes: lentos o tónicos (CC), y rápidos o fásicos (CA), que pueden ser registrados
a través de los mismos electrodos. En estos casos, el amplificador suele estar equipa-
do con un tipo especial de interruptor electrónico o electromecánico que permite
cambiar el acoplamiento de la señal de un amplificador de CC (que registra las seña-
les de baja frecuencia, como el nivel de resistencia eléctrica de la piel) a otro de CA,
que posibilita la obtención de señales de mayor frecuencia, como la respuesta de re-
sistencia eléctrica de la piel. En la segunda etapa de amplificación la señal es única-
Técnicas psicofisiológicas 389
mente incrementada aún más a través del amplificador de potencia hasta alcanzar un
nivel suficientemente elevado como para accionar el transductor de salida o registra-
dor gráfico, que normalmente es un oscilógrafo.
La cuarta fase en el proceso de registro de variables psicofisiológicas la constitu-
ye la fase de registro propiamente dicha, en la cual tiene lugar la reconversión, a tra-
vés del transductor de salida, de la señal eléctrica previamente amplificada en otra se-
ñal de modalidad distinta para que pueda ser registrada de forma observable,
normalmente gráfica, a través de un oscilógrafo o aparatos similares, con una pluma
móvil que traza la señal sobre una lámina de papel que se desplaza a una velocidad
constante (registrador x-t). Este gráfico así registrado de forma permanente permite
el análisis posterior de la señal.
Normalmente, el proceso de registro de respuestas psicofisiológicas incluye una
última fase, estrechamente vinculada a la anterior, de conversión de la señal gráfica
registrada en otras formas que faciliten el análisis posterior de la misma. Entre las
principales transformaciones a que habitualmente se somete la señal, están la inte-
gración de la misma en conjuntos temporales de la señal individual y la conversión
de la misma de forma gráfica análoga a la respuesta fisiológica registrada (continua) a
forma digital (discontinua), a través de un convertidor analógico-digital para facilitar
su análisis posterior estadístico o computarizado.
Los avances tecnológicos alcanzados en los ultimos años han permitido facilitar
el registro de las variables psicofisiológicas mediante el sistema computarizado, el
cual es utilizado en la actualidad tanto a nivel clínico como de investigación. Este sis-
tema de registro está basado en el empleo de una computadora como dispositivo de
salida del polígrafo. El uso de un microcomputador en los registros psicofisiológicos
exige previamente la transformación de la señal analógica procedente del polígrafo
en una señal digital comprensible al computador. Por ello, es necesario conectar un
interfaz o conversor analógico-digital entre el polígrafo y el microcomputador; éste
a su vez puede incluir como posibles salidas una impresora o cinta magnética.
Existen diversas clasificaciones para agrupar las variables psicofisiológicas. Sin em-
bargo, los criterios más utilizados para clasificar han sido las características de la se-
ñal y los sistemas biológicos en los que se agrupan las variables. Según el primer cri-
terio, el de la naturaleza de las respuestas fisiológicas registradas, autores como
Brown (1972) clasifican éstas en las tres categorías de señales bioeléctricas directas,
fenómenos bioeléctricos transducidos y fenómenos biológicos físicos que necesitan
igualmente ser tansducidos. Aunque nosotros, por las razones que expondremos
posteriormente, no seguiremos en nuestra descripción de las variables esta clasifica-
ción, vamos, no obstante, a incluirla (véase el cuadro 18.1) por lo que de clarificador
pueda tener respecto a la indicación de la naturaleza de cada variable. Una ventaja im-
discutible, por otro lado, de este tipo de clasificación es el agrupamiento que ofrece
de las señales en función de los instrumentos utilizados para medirlas, lo que permite
una mejor comprensión de la función y utilización de los mismos.
390 José A. Carrobles y Gualberto Buela-Casal
CUADRO 18.2. Sistema clasificatorio de las variables psicofisiológicas según los sistemas bio-
A
lógicos que las producen
e A II A, BAG
A. Variables del sistema somático
—Actividad electromiográfica (EMG).
—Actividad electrooculográfica (E0G).
—Actividad respiratoria.
En este apartado se incluyen aquellas variables en las que el sistema muscular esque-
lético es el principal sistema biológico implicado, como en el caso de la actividad
EMG y EOG, o su intervención es especialmente notable, como ocurre con la respira-
ción. Estas variables son susceptibles, en gran parte, de control voluntario por parte
del sujeto a través de la inervación directa del sistema muscular periférico por el sis-
tema nervioso central.
392 José A. Carrobles y Gualberto Buela-Casal
Entre las señales incluidas en esta categoría, tenemos, en primer lugar, la señal elec-
tromiográfica o electromiograma, cuya abreviatura es EMG. Ésta consiste en el regis.
tro de la actividad eléctrica asociada con la contracción muscular o, más específica
mente, que precede a la contracción muscular, procedente de los potenciales de
acción generados por las unidades motoras. La forma típica de registro utilizada en
Psicofisiología es a través del registro bipolar con electrodos de superficie que detec-
tan simultáneamente la actividad de múltiples unidades motoras, dependiendo la
amplitud y la frecuencia del registro electromiográfico (EMG) del número de unida-
des motoras activadas. Para más detalle véase Carretié e Iglesias (1995).
La actividad muscular corporal también es influida por factores emocionales y
motivacionales, y por tanto su medida puede servir igualmente como evaluación del
nivel de relajación o activación de un sujeto. La zona de registro normalmente elegi-
da en estos casos suele ser el músculo frontal. Otras actividades musculares, como el
temblor muscular de algunas zonas como los dedos, o las variaciones rítmicas de pe-
queña amplitud son, asimismo, de gran interés como medida de la actividad motora
(vease el capítulo de Tryon en este mismo libro).
El sistema cardiovascular está formado por el corazón, los vasos sanguíneos y el tej1-
do linfático. A través de los vasos sanguíneos tiene lugar la aportación de oxígeno a
los diferentes tejidos y la eliminación de los productos de desecho de órganos y tej1-
dos por medio de la sangre que circula por ellos impulsada por el corazón, que actúa
como una bomba. La función cardiovascular puede ser evaluada a través de diferen-
tes parámetros. Para la psicofisiología, las medidas más relevantes son la tasa cardía-
ca, la presión sanguínea y el flujo sanguíneo: volumen sanguíneo, pulso del volumen
sanguíneo y velocidad de tránsito del pulso sanguíneo (véase Carretié e Iglesias,
1995, para más detalle).
a. Tasa cardíaca
la oreja, al tiempo que una célula fotoconductora detecta los cambios producidos en
la densidad óptica del tejido, bien por medio de la transmisión de la luz a través del
dedo o de la oreja, o bien a través de la reflexión de la misma por el tejido.
b. Presión sanguínea
La presión sanguínea depende de varios factores, de los cuales los más importantes
son la fuerza o la frecuencia de las contracciones del corazón y la elasticidad de los
vasos sanguíneos. La eyección de sangre producida por el corazón al contraerse da
lugar a una elevación en el nivel de presión dentro del sistema arterial (presión sistó-
lica), sobreimpuesta a un determinado nivel de presión medio mínimo (presión dias-
tólica), mantenido dentro del sistema por la elasticidad del mismo, que hace que se
almacene parte de la energía movilizada en cada ciclo cardíaco. La diferencia entre
los dos tipos de presión se denomina presión de pulso.
La presión sanguínea puede medirse directamente, a través de la inserción de un
transductor de presión en forma de cánula dentro de la arteria, como se realiza en la
evaluación de pacientes cardíacos, pero por las dificultades y riesgos que entraña no
es muy aconsejable su uso en psicofisiología, recurriéndose en este caso a medidas
indirectas que no suponen traspasar la barrera corporal. Entre estas medidas indirec-
tas, el procedimiento más comúnmente utilizado es el clásico esfigmomanómetro,
consistente en un manguito de goma inflable unido por medio de un tubo flexible a
un manómetro de mercurio. El manguito se coloca alrededor del antebrazo y es in-
flado por medio de una bomba manual por encima de la presión sistólica, interrum-
piendo la circulación sanguínea por la arteria branquial. La presión del manguito se
reduce entonces lenta y gradualmente abriendo una válvula que deja salir el aire con-
tenido en el manguito, al tiempo que se aplica un estetoscopio sobre la arteria bra-
quial por debajo del manguito en la parte interior del codo, hasta oír unos sonidos
característicos (sonidos Korotkoff) producidos por el paso de la sangre a través de la
arteria. La presión indicada por el manómetro, en el momento en que empiezan a
oírse los sonidos, es la presión sistólica (aproximadamente, de unos 120 mm de mer-
curio). La presión diastólica viene indicada por un ensordecimiento brusco del soni-
do, al continuar desinflando lentamente el manguito (unos 80 mm de mercurio,
aproximadamente).
Actualmente se dispone de métodos automáticos para la obtención de la presión,
consistente en un dispositivo que infla y desinfla el manguito a intervalos regulares,
al tiempo que un micrófono de contacto (normalmente de tipo piezoeléctrico) de-
tecta los sonidos Korotkoff y los transfiere a un aparato de registro. Otro procedi-
miento automático de registro, utilizado también como dispositivo de biofeedback,
consiste en el ajuste de la presión del manguito hasta un punto intermedio entre la
presión sistólica y la diastólica, para la detección del 50% de los sonidos Korotkoff.
c. Flujo sanguíneo
sudor en un momento determinado; sin embargo, por las desventajas que entrañan
éstos, son más utilizados los métodos eléctricos indirectos, que probablemente sean
indicadores psicofisiológicos más sensibles y reflejen mejor distintos fenómenos
psicológicos. ad
Recientemente Freixa iBaqué (1993) ha propuesto una nueva clasificación y no-
menclatura de la actividad electrodérmica; ésta se recoge en los cuadros 18.3 y 18.4.
CUADRO 18.3. Componentes electrodérmicos
A A A
Componentes Notación Notación
general específica
Los tres pares de glándulas salivares existentes (las parótidas, las submaxilares y las
submandibulares) son inervadas de forma compleja tanto por fibras simpáticas
como parasimpáticas. Los métodos de obtención de esta respuesta van desde el em-
pleo de las clásicas torundas dentales, que después de empapadas en saliva pueden
ser pesadas para obtener la medida de la saliva segregada, hasta las distintas técnicas
de succión directa de la saliva y el correspondiente cálculo de la cantidad segregada.
logía, sin sal puede tener cierto interés. Existen pocos instrumentos para registrar
esta variable; no obstante, elmás conocido es la “cámara de Roy”, que consiste en una
pequeña cámara que permite medir el cambio de resistencia de un elemento sensible a
lahumedad del aire contenido en la cámara. Dicha cámara se fija a la piel y el aire seco
circula con un caudal que permite mantener constante el nivel de humedad elegido.
Así, cualquier cambio en la sudoración modifica el nivel y éste es restablecido me-
diante un servomecanismo que actúa sobre el flujo de aire. Por tanto, las variaciones
del caudal de aire que circula son indicativas de los cambios en el nivel de sudoración.
Presentación
del estímulo
uV
Nz (135)
10
N;5 (300)
(3) N;
2)
=
E
as
>
< P,
Pa (140) Es(325)
P4 (220)
P> (120)
-10
LATENCIA
Vamos a hacer algún comentario a los dos primeros tipos de aplicaciones por su
importancia en el tema de la evaluación psicofisiológica que aquí estamos conside-
rando.
La primera aplicación se refiere al registro de funciones psicofisiológicas no ase-
quibles directamente con las técnicas poligráficas normales, como puede ser el caso
del registro directo de la actividad, la presión o la temperatura de ciertas vísceras in-
ternas, como el estómago o el intestino, a través de endorradiosondas o transmisores
ingeribles (radio pills).
En cuanto a la segunda aplicación, y más importante, hace referencia al uso más
genuino de las técnicas telemétricas, el de obtener registros psicofisiológicos de suje-
tos no limitados en su actividad o que se desenvuelven en su medio natural. Esta po-
sibilidad, por otra parte, es de una importancia fundamental, pues permite resolver
algunas de las más importantes limitaciones que afectan a la Psicofisiología, como
son, por un lado, la obtención de registros en sujetos que por su condición patológi-
ca no se prestan a una evaluación en condiciones de inmovilidad como los niños hi-
peractivos, los psicóticos o los pacientes con lesiones cerebrales, y, por otro lado, el
poder comparar las respuestas psicofisiológicas con las demás modalidades de res-
puesta, objetivo primordial de la Psicofisiología, al permitir obtener registros más
prolongados y en situaciones naturales, lo cual, sin duda, aumenta considerablemen-
te su validez ecológica.
La telemetría, no obstante, presenta aún serios problemas que podemos al me-
nos enumerar. Entre estos problemas se encuentra el radio de transmisión de la se-
ñal, aún limitado y muy dependiente de las condiciones físicas, atmosféricas y geo-
gráficas del medio, e, igualmente, las múltiples causas de interferencia en la recepción
de la señal, procedentes de las variadas fuentes de emisión de ondas eléctricas presen-
tes en el medio en que tiene lugar el registro. Un problema también importante es el
Técnicas psicofisiológicas
407/
Loselectrodos, al estar en contacto con una solución salina (bien sea la piel o la
sustancia conductora), alteran su polaridad produciendo artefactos en el registro.
Por ello, cuando se trate de registros prolongados se recomienda utilizar electrodos
de oro o en su defecto de plata clorurada.
La pasta o gel conductor debe ser el adecuado según la duración del registro y el
tipo de variable psicofisiológica registrada. Así, en registros prolongados (por ejem-
plo, los registros polisomnográficos) se debe utilizar una pasta conductora lo sufi-
cientemente densa para que no sea absorbida por la piel, como ocurriría en el caso de
utilizar un gel conductor muy acuoso. También es importante utilizar la cantidad
exacta de gel o pasta conductora, lo cual está en función del tamaño, tipo y morfolo-
gía del electrodo.
La colocación adecuada de los electrodos se refiere tanto a la situación anatómica
adecuada, según esté especificado en las normas internacionales, como a la adecuada
fijación bien por anillos adhesivos, cintas de velcro, elementos elásticos, o el clásico
sistema del colodión. Por último, no hay que olvidar que es imprescindible una pre-
paración adecuada del lugar donde será colocado el electrodo, para lo cual se reco-
mienda su limpieza con un algodón humedecido en alcohol o acetona.
circadianas pueden estar modificadas por un ritmo ultradiano (de mayor frecuencia)
que se superpone a las variaciones circadianas (para más información véase Buela-
Casal y Sierra, 1994b). Por ello, es fundamental que en los registros psicofisiológicos
se controle la hora del día en la que se realizan.
sario mirar con cautela los resultados hasta que no dispongamos de datos más siste-
máticos sobre la sensibilidad diferencial de estas medidas.
En relación con la sincronía entre factores cognitivos y psicofisiológicos, cabe
mencionar, asimismo, los ya clásicos trabajos en forma de libros publicados por Mc-
Guigan (1978, 1979) sobre la utilización de medidas psicofisiológicas en el registro y
evaluación directa de conductas de dimensiones sumamente pequeñas (conductas
encubiertas), como el registro electromiográfico de la lengua o los labios, y que al
constituir correlatos directos de actividades cognitivas pueden permitirnos la eva-
luación objetiva de éstas.
Para finalizar este apartado podemos concluir que el principal resultado deriva-
do de estos estudios ha sido el considerable énfasis que ha adquirido la evaluación
multimodal de amplio espectro, que utiliza diferentes procedimientos de medida
para la evaluación de los distintos componentes de respuesta, con el fin de identificar
y comprender lo más adecuadamente posible las conductas-problema presentes en
un determinado sujeto y poder diseñar, en función de ello, el plan de intervención
más adecuado.
vI3.1. La observación
Una forma de evaluar variables psicofisiológicas puede tener lugar a través de la ob-
servación directa de manifestaciones físicas o conductuales externas, relacionadas
con una determinada variable o problema. Este procedimiento sólo es aplicable, evi-
dentemente, cuando existen manifestaciones externas discriminables, como suele ser
el caso, por ejemplo, de los tartamudos en estado crónico, que presentan una con-
tracción bastante generalizada de los músculos de la cara y cuello. Los principios por
los que se ha de regir esta observación son los mismos descritos ampliamente en el
capítulo de la técnica de observación en este libro.
vI3.2. El autorregistro
En el autorregistro de respuestas psicofisiológicas debe diferenciarse entre el regis-
tro de los síntomas asociados a una determinada respuesta psicofisiológica y el re-
gistro de la respuesta en sí misma. Mientras que los síntomas asociados a determina-
dos estados fisiológicos pueden ser fácilmente detectables para un sujeto y, por
tanto, son susceptibles de evaluación a través del autorregistro, no ocurre lo mismo
con la evaluación del propio estado fisiológico respecto al cual diferentes estudios
(véase Epstein, 1976, para una revisión del tema) han demostrado la existencia de ba-
jas correlaciones entre los autorregistros y los registros directos de las variables psi-
cofisiológicas. La detección por parte de los sujetos de estos estados fisiológicos
puede mejorarse a través de un entrenamiento adecuado de los mismos, como han
demostrado varios autores, en variables tales como la tasa cardíaca, las ondas cere-
brales y la actividad electrodérmica (Epstein, 1976).
VL3.3. Autoinformes
Otro procedimiento que también puede utilizarse para evaluar variables psicofisio-
lógicas es a través de la confección de cuestionarios o inventarios, bien generales o
bien específicos, en los que se enumera una serie de manifestaciones psicofisiológicas
y se pide al sujeto con determinados problemas que lasconsidere y señale las que se
aplican a su caso. Aunque no existen muchos cuestionarios de este tipo, principal-
mente por los problemas que entraña esta forma de evaluación, relacionado con las
medidas de autoinforme, agravados en el caso de las variables psicofisiológicas por
las dificultades de discriminación de estos estados por parte de los sujetos. Sin em-
bargo, en las dos últimas décadas han aparecido algunos cuestionarios relacionados
principalmente con determinados problemas clínicos, como la ansiedad. Una rela-
ción de los principales cuestionarios se facilita, a continuación, en el cuadro 18.5.
416 José A. Carrobles y Gualberto Buela-Casal
pita dicha respuesta. Para muchos autores esto no puede considerarse un refuerzo en
el sentido estricto, por lo que este procedimiento ya no puede ser explicado en tér-
minos del modelo operante, ajustándose más a un modelo cibernético de control de
sistemas. Este tipo de procedimiento es el que actualmente se considera específica-
mente como biofeedback.
REFERENCIAS BIBLIOGRÁFICAS
Bancroft, J. H., Jones, J. G. y Pullan, B. B. (1966). A simple transducer for measuring penile
erection with comments an its use in the treatment of sexual disorder. Behaviour Re-
search and Therapy, 4, 230-241.
Barlow, D. H., Becker, R., Leitenberg, H. y Agras, W. S. (1970). A mechanical strain gauge
for recording penile circunference change. Journal ofApplied Behavior Analysis, 3, 73-76.
Brown, C. C. (1972). Instruments in psychophysiology. En N. S. Greenfield y R. A. Stern-
bach (dirs.), Handbook of psychophysiology. Nueva York. Holt, Rinehart and Winston.
Buela-Casal, G. y Navarro, J. F. (1989). Evaluación psicofisiológica de la inteligencia. En
H. Marrero, G. Buela-Casal, L. Fernández y J. F. Navarro (dirs.), La inteligencia huma-
na: más allá de lo que miden los tests. Barcelona. Labor.
Buela-Casal, G. y Navarro, J. F. (1990). Avances en la investigación del sueño y sus trastornos.
Madrid. Siglo XXT.
Buela-Casal, G. y Sierra, J. C. (1994a). Los trastornos del sueño en la infancia y adolescencia.
Madrid. Piramide
Buela-Casal, G. y Sierra, J. C. (1994b). Ritmo circadiano de la activacion psicofisiológica. Ar-
chivos de Neurobiología, 58, 82-96.
Cáceres, J. (1990). Evaluación psicofisiológica de la sexualidad humana. Barcelona. Martínez-
Roca.
Carretié, L. e Iglesias, J. (1995). Psicofisiología. Fundamentos metodológicos. Madrid. Pirá-
mide.
Carrobles, J. A. (1987). Registros psicofisiológicos. En R. Fernández-Ballesteros y J. A. Ca-
rrobles (dirs.), Evaluación conductual. Madrid. Pirámide.
Carrobles, J. A. (1990). Biología y psicofisiología de la conducta sexual. Madrid. Fundación
Universidad-Empresa.
Carrobles, J. A. y Sanz, A. (1991). Terapia sexual. Madrid. Fundación Universidad-Empresa.
Epstein, L. H. (1976). Psychophysiological measurement in assessment. En M. Hersen y
A. S. Bellack (dirs.), Behavioral assessment: A practical handbook. Oxford. Pergamon
Press.
Freixa i Baqué, E. (1993). Nueva clasificación y nomenclatura de la actividad electrodérmica.
Psicología Conductual, 1, 157-170.
Haynes, S. N. (1978). Principles of behavioral assessment. Nueva York. Gardner Press.
Haynes, S. N. y Wilson, C. C. (1979). Behavioral assessment. Recent advances in methods,
concepts and implications. San Francisco. Jossey-Bass. ña,
Kallman, W. M. y Feuerstein, M. (1977). Psychophysiological procedures. En A. R. Cimine-
ro, K. S. Calhoun y H. E. Adams (dirs.), Handbook of behavioral assessment. Nueva
York. Wiley.
Kamiya, J. (1962). Conditional discrimination of the EEG alpha rhythminhumans. Comuni-
cacion presentada en el Western Physiological Association. San Francisco (EE UU).
420 José A. Carrobles y Gualberto Buela-Casal
LECTURAS COMPLEMENTARIAS
L INTRODUCCIÓN
Generalmente los pacientes con lesión cerebral suelen presentar alteraciones neuro-
psicológicas, siendo importante que estos aspectos sean evaluados. Actualmente,
aunque existen técnicas de neuroimagen cada vez más sofisticadas, como la Tomo-
grafía Axial Computarizada (TAC), la Resonancia Nuclear Magnética (RNM) o la
Tomografía por Emisión de Positrones (TEP), la evaluación neuropsicológica en mu-
chos casos es determinante. Por otro lado, una topografía lesional concreta delimita-
da por técnicas de neuroimagen no implica una obligada manifestación neuropsico-
lógica, mi en estructura ni en intensidad. Sin embargo, en ciertos casos el objetivo de
la exploración neuropsicológica puede ser la colaboración en la realización de un
diagnóstico topográfico (Peña-Casanova, 1991). Más aún, la evaluación neuropsico-
lógica de los cambios cognitivos y de la personalidad en ocasiones resulta ser más
sensible, por ejemplo en la detección de manifestaciones tempranas de ciertos tras-
tornos neurológicos (Incagnoli, Goldstein y Golden, 1986).
En suma, aunque los avances tecnológicos han modificado y modifican constan-
temente la evaluación de los trastornos del sistema nervioso central, la evaluación
neuropsicológica conserva su importancia en los siguientes aspectos:
e. Enel plano legal, ayuda a tomar decisiones acerca del grado de responsabili-
dad de los acusados en un delito, probar incapacidad intelectual para ejercer ciertos
derechos, etcétera.
f. Tiene un papel fundamental en la investigación y estudio científico de la or-
ganización y el funcionamiento del sistema nervioso y del comportamiento humano
(Lezak, 1987).
a. Acerca del estado neuropsicológico del paciente y, cuando sea posible, pro-
porcionar un diagnóstico (Lezak, 1983; Peña-Casanova, 1987, 1991). Aunque es
poco probable concluir un diagnóstico topográfico únicamente a partir de la evalua-
ción neuropsicológica, ésta aporta datos valiosos. Hasta ahora se han utilizado cate-
gorías diagnósticas para concluir que el paciente presenta determinado trastorno; sin
embargo, la práctica clínica muestra que pocos pacientes coinciden exactamente con
la descripción de los cuadros clásicos. La evaluación neuropsicológica actual tiende
al estudio detallado del caso individual y su evolución.
b. Facilitar la toma de decisiones en cuanto al pronóstico, tratamiento y reha-
bilitación del paciente (Lezak, 1983; Peña-Casanova, 1987, 1991).
c. Proporcionar datos cualitativos y cuantitativos obtenidos sistemáticamente
con finalidad investigadora.
tras que Lezak (1983) considera que es indispensable utilizar ambas dimensiones.
Las líneas generales para la evaluación se pueden resumir según Lezak (1983) en
construir la evaluación neuropsicológica de acuerdo a las necesidades, habilidades y
limitaciones de cada paciente y no al revés, con esto se busca obtener datos realmen-
te más significativos del paciente y proponer enfoques de tratamiento que realmente
le beneficien. En suma, la evaluación neuropsicológica implica la integración de las
evaluaciones cuantitativas y cualitativas realizadas desde el primer contacto con el
paciente. Esto requiere flexibilidad y experiencia por parte del examinador (Peña-
Casanova, 1991).
manía, somatizar, tener conductas inapropiadas, psicosis. En estos casos, los datos
obtenidos en la exploración pueden resultar inválidos. Para evaluar los resultados de
estos pacientes es indispensable un evaluador flexible que utilice, como parámetro
de comparación y control, el estado premórbido del paciente y la evolución que ha
tenido (Peña-Casanova, 1991). Es relativamente frecuente que pacientes atendidos
en neuropsicología presenten limitaciones sensoriales y/o motoras; en estos casos el
acceso a las funciones mentales superiores por vía convencional está limitado. Sin
embargo, un problema sensorial y/o motor no debe predisponer alexaminador a
pasar por alto la evaluación de aquellas variables que no dependan directamente de
las modalidades afectadas (Lezak, 1983). Hay pruebas que ya están estandarizadas
para la población con determinados defectos; por ejemplo, a pacientes hipoacúsicos
se les pueden administrar pruebas escritas para evaluar funciones verbales y aritmé-
ticas, razonamiento abstracto y comprensión de relaciones espaciales. Si no existen,
el neuropsicólogo ha de crearlos.
Este tipo de lesiones altera distintas funciones mentales superiores y en diversas in-
tensidades. Sus principales manifestaciones clínicas parecen afectar la memoria, la
atención, la concentración, las capacidades abstractas y la esfera emocional. En la
evaluación neuropsicológica se aprecia un decremento global en las funciones men-
tales superiores evaluadas. Estas alteraciones pueden ser agudas, como un estado
confusional, o crónicas, como la demencia tipo Alzheimer. Un estado confusional
agudo puede evolucionar hacia un deterioro crónico, pudiendo ser éste irreversible
(Peña-Casanova, 1987, 1991).
a. Historia clínica
b. Observaciones conductuales
les, etc. Es imposible conocer las funciones mentales superiores sin saber si hay alte-
raciones a niveles funcionales más básicos. Datos neurológicos pueden dar sentido a
ciertos hallazgos neuropsicológicos. También son importantes los datos aportados
por las técnicas de neuroimagen como la TAC, la RNM, etc., así como los resultados
de evaluaciones psicológicas y neuropsicológicas anteriores (Orsini, Van Gorp y
Boone, 1988).
CUADRO 19.1. Áreas evaluadas en el examen del estado mental (Strub y Black,
1985, 1988)
con su correspondiente fuente tradicional de información
.
Áreas Fuente
. Nivel de conciencia Medicina clínica (neurología y neuroci-
rugía)
Memoria
concepto muy amplio que no especifica el problema cognitivo concreto del paciente,
ni aporta ningún conocimiento sobre su fisiopatología. La mayoría de los síndromes
neuropsicológicos clásicos constituye categorías arbitrarias que se fundamentan más
en características anatómicas que afectan a una serie más o menos amplia de procesa-
dores neuropsicológicos que en principios fisiopatológicos funcionales cognitivos
específicos. A pesar de esta crítica, una fase de exploración clásica es necesaria por in-
tereses clínicos y por representar una primera aproximación para establecer qué acti-
vidades están preservadas y qué actividades están alteradas y fundamentar la siguien-
te fase de evaluación. En esta fase se seleccionan y aplican diversos métodos e
instrumentos para la evaluación neuropsicológica. Se cuenta con baterías neuropsi-
cológicas y/o pruebas específicas. La selección y combinación de estos instrumentos
se decide a partir del estado concreto del paciente, del objetivo de la exploración y de
las hipótesis diagnósticas planteadas en el transcurso de la exploración cualitativa
inicial y la historia clínica. En el cuadro 19.2 se presenta un resumen de las pruebas
específicas más utilizadas en la actualidad (Spreen y Strauss, 19917
432 Jordi Peña-Casanova, M. T. Hernández y Adolf Jarne
CUADRO 19.2. Pruebas neuropsicológicas específicas por áreas (referencias detalladas en Le-
zak, 1983 y en Spreen y Strauss, 1991). Las fechas que aparecen en el cuadro
no se corresponden necesariamente con la primera publicación de laprueba.
Las pruebas se han clasificado de acuerdo con la finalidad u objetivo prina-
pal con que fueron creadas; sin embargo, de algunas de ellas se pueden obte-
ner otros datos ya que, por lo general, una prueba suele requerir diversas fun-
ciones básicas y superiores para su realización satisfactoria
1. ACTIVIDADES MENTALES BÁSICAS Y DE EJECUCIÓN Y CONTROL
USE Orientación
a) Temporal orientation test (Prueba de orientación temporal) (Benton y cols.,
1983).
b) Subtests de orientación en persona, espacio y tiempo del test Barcelona
(Peña-Casanova, 1990, 1991).
c) Time estimation test (Prueba de estimación temporal de Benton).
a) Dibujo del reloj (Clock drawing) (Strub y Black, 1985). Objetivo específico:
detección clínica de trastornos visoespaciales, planificación y secuencia.
b) Porteus maze test (Prueba de laberintos de Porteus). Objetivo específico: pla-
nificación y secuencia.
c) Subprueba de cubos (WAIS, WAIS-R y WAIS-R NI). Objetivo específico: planifica-
ción y secuencia. Construcción tridimensional. Capacidad abstracta.
d) Three-dimensional block construction (3-D) o Three-dimensional constructio-
nal praxis test (Construcción tridimensional de bloques) (Benton y cols.,
1983). Objetivo específico: evaluar la habilidad visoconstructiva copiando
construcciones tridimensionales.
e) Test de copie d'une figure complexe. Rey-Osterrieth complex figure test (Test
de copia de una figura compleja) (Rey, 1941; Osterrieth, 1944).
f) Copia de un cubo, una margarita, una bicicleta y una casa: prueba clásica en
neurología (normas en Lezak, 1983).
4. MEMORIA Y APRENDIZAJE
a)
Benton visual retention test-revised (BvaT-R) (Prueba de retención visual de
Benton) (Benton, 1974). Objetivo específico: evaluar la memoria y percepción
visual y habilidades visoconstructivas.
x_——_
a e
Técnicas neuropsicológicas
435
5. LENGUAJE Y AFASIAS
CUADRO 19.2.
A (Continuación.)
A AS A A A LS AA
f) Porch index of communicative ability (PICA) (Porch, 1981). Objetivo: estudio
de la capacidad comunicativa oral, lectura, escritura y comprensión.
g) Communicative abilities in daily living (CADL) (Prueba de habilidades de comu-
nicación en la vida diaria) (Holland, 1980). Objetivo específico: evaluar las ha-
bilidades comunicativas cotidianas en pacientes afásicos o con trastornos de
lenguaje similares.
h) Prueba de evocación categorial (animales y palabras iniciadas con la letra
“o” o similares). Se puede usar en el contexto de la evaluación de una afasia
o en una evaluación general (incluido en el test de Boston para el diagnóstico
de la afasia y en el PlEN-Test Barcelona). Objetivo específico: evaluar la aten-
ción y concentración. También evalúa la capacidad de léxico, capacidad de
mantenimiento en una tarea y memoria a corto plazo.
i). Peabody picture vocabulary test-revised (PPvT-R) (Prueba de vocabulario re-
ceptivo de Peabody) (Dunn y Dunn, 1981). Objetivo específico: evaluar la
comprensión auditiva de nombres de animales o cosas.
j) Token test (Prueba de fichas). Objetivo específico: evaluar la comprensión de
órdenes de complejidad creciente.
k) Bilingual aphasia test (Test para la afasia en bilingúes). Objetivo específico:
estudio de la afectación diferencial de las lenguas en bilingúes y políglotas.
Disponible en más de 50 lenguas, entre ellas en castellano, catalán, vasco y
gallego.
ll) Psycholinguistic assessments of language processing in aphasia (PALPA), Eva-
luaciones psicolinguísticas del procesamiento del lenguaje en la afasia. Objeti-
vo: estudio psicolingúístico del lenguaje oral, la lectura y la escritura, siguiendo
un modelo teórico psicolingúístico contrastado.
V. BATERÍAS NEUROPSICOLÓGICAS
(1983) los objetivos principales de una batería neuropsicológica deben ser su capaci-
dad diagnóstica (predicción) y su capacidad para facilitar la comprensión de las altera-
ciones orgánicas. Asimismo, debe ser idónea (adecuarse a las necesidades del pacien-
te), factible (práctica, sencilla y posible de aplicar) y útil (para el paciente y para el
explorador). No existe “la batería ideal” que abarque y evalúe sin error todas las fun-
ciones mentales superiores, de manera que la creatividad y la experiencia del examina-
dor entran constantemente en juego al rediseñarla en cada caso. Las baterías neuro-
psicológicas pueden ser de tres tipos (véase Tarter y Edwards, 1986).
Se administra en siete u ocho horas, siendo una de las baterías más utilizadas en
Estados Unidos, tanto en investigación como en práctica clínica. Fue creada con la
idea de discriminar entre organicidad y no organicidad. Ha sido criticada básica-
mente porque sus estándares de medida son cuantitativos y estrictos, incluso para la
población americana, por lo tanto puede resultar poco adecuada para Otro tipo de
poblaciones, sobre todo aquéllas con desventajas educativas y socioculturales. Di-
versos investigadores han añadido o suprimido y modificado sus pruebas y su forma
de puntuación (Matthews, 1981). Algunas pruebas pueden ser útiles en forma aisla-
440 Jordi Peña-Casanova, M. T. Hernández y Adolf Jarne
Funciones motoras
Organización acústico-motora
Funciones cutáneas y cinestésicas superiores
Funciones visuales superiores
Lenguaje receptivo
SS Lenguaje expresivo
SS
Técnicas neuropsicológicas
441
Escritura y lectura
Habilidades aritméticas
Procesos mnésicos
nm Procesos intelectivos
=>
5508
Esta versión ha sido especialmente criticada por omitir pruebas de atención, con-
centración, seguimiento mental y evocación de la información, y evalúa pobremente la
memoria no verbal y la formación de conceptos no verbales (Lezak, 1983); asimismo,
algunas pruebas son lo suficientemente difíciles como para captar alteraciones sutiles.
A pesar de ello, fue una de las primeras baterías que hizo ver la necesidad de la integra-
ción de aspectos cuantitativos y cualitativos en una evaluación neuropsicológica.
La Batería Luria-Nebraska (Golden y cols., 1980) constituye un segundo inten-
to de sistematización. Incluye una selección de preguntas y materiales ya descritos
por Christensen (1979). Presenta once apartados, los mismos diez de Christensen
pero separando escritura de lectura. El aspecto más criticado de esta batería es la
confusión entre funciones y sistemas funcionales ya que suma en una misma escala
resultados de pruebas que implican distintos estratos funcionales. Su organización
práctica no sigue las conceptualizaciones de Luria.
a. Orientación
b. Atención y concentración
c. Lenguaje (oral, escritura y lectura)
d. Praxias
e. Gnosias
f. Memoria
g. Abstracción
h. Cálculo y solución de problemas
SUBPRUEBA CARACTERÍSTICAS
A e 5 5 5 5 5
SUBPRUEBA CARACTERÍSTICAS
_ _ ____ A A A SR ER
SUBPRUEBA CARACTERÍSTICAS
A E A A A e E RA
19. Gesto simbólico Estudia la capacidad de evocación y
realización de actos de la comunicación.
Se diferencia entre derecha e izquierda
para detectar alteraciones lateralizadas y
entre orden e imitación para detectar en-
tre nivel simbólico y nivel de ejecución,
así como defectos en la comprensión
verbal.
SUBPRUEBA CARACTERÍSTICAS
SUBPRUEBA CARACTERÍSTICAS
EAS
ir A A
35. Aprendizaje seriado de palabras Prueba utilizada inicialmente por Luria.
Permite estudiar el proceso de memoriza-
ción, las estrategias que utiliza, la curva
de aprendizaje y la actitud ante posibles
errores.
Estas baterías se utilizan para evaluar una modalidad determinada de los procesos
neuropsicológicos (procesos visuales, auditivos, psicomotores, etc.).
FIGURA 19.1. Perfil clínico de afasia nominal de tipo semántico (paciente OMR). Destaca
una pobreza discreta en fluencia y contenido informativo del lenguaje, con un
ritmo y melodía normales. Existe una lentificación discreta en la realización
e series inversas. Los fallos son patentes en la denominación y en la com-
prensión
40 50 60 70 80 9 95
SUBTEST MÁXIMO
CONVERSACIÓN-NARRACIÓN .....
NARRACIÓN TEMÁTICA ............
a
FLUENCIA Y GRAMÁTICA .............
CONTENIDO INFORMATIVO .........
ORIENTACIÓN PERSONA............
ORIENTACIÓN ESPACIO..............
ORIENTACIÓN TIEMPO. .............
DÍGITOS DIRECTOS...
DÍGITOS INVERSOS...................
SERIES ORDEN DIRECTO .............
SERIES ORDEN DIRECTO T.
A
ANL
SERIES:INVERSAS 5. otura:
SERIES INVERSAS T. ............
IA
E [0.2] Eo)
RESPUESTA DENOMINANDO
RESP. DENOMINANDO 7. ......
COMPLETAMIENTO DENOM. .......
COMPLET. DENOMINANDO T. —É
paña
¿E
+oO0mn
o»)
Ho.
[coo
000
FIGURA 19.2. Perfil clínico de una anomia pura en el contexto de una buena comprensión
(paciente MAA). Secuela de un accidente vascular cerebral por malformación
arteriovenosa. La expresión presenta una anomia discreta-moderada. Obsér-
vese la normalidad de la repetición
40 50 60 70 80 9 95
SUBTEST MÁXIMO
CONVERSACIÓN-NARRACIÓN..... | 0.24 5
NARRACIÓN TEMÁTICA ............. OEI ME
DESCRIPCIÓN. cocotero E
SOS
00
O
ORIENTACIÓN PERSONA...
ORIENTACIÓN ESPACIO............
ORIENTACIÓN TIEMPO ................ 10]
pa
|
DÍGITOS DIRECTOS...................
DÍGITOS INVERSOS................... 00
Y [o.Kco)
IO
E
RESP. DENOMINANDO T. ......
COMPLETAMIENTO DENOM. .......
COMPLET. DENOMINANDO T. Mo»)
[ooo
00000
REFERENCIAS BIBLIOGRÁFICAS
Albert, M. L. (1973). A simple test for visual neglect. Nexrology, 23, 658-664.
Annett M. (1970). A classification of hand preference by association analysis. British Journal
of Psychology, 61, 303-321.
Técnicas nenropsicológicas
451
Aransanz Latorre, C. y Dueñas, C. (1987). La exploración del lenguaje y las afasias. Ponencia
presentada en el VII Congreso de la Sociedad Española de Neurología. Oviedo, España.
Badock, H. (1930). An experiment in the measurement of mental deterioration. Archives of
Psychology, 117-125.
Badock, H. y Levy, L. (1940). The measurement of efficiency of mental functioning (revised
examination). Test and manual of directions. Chicago. C. H. Stoelting.
Bender, L. (1955). Visnal motor gestalt test. Nueva York. American Orthopsychiatric Cor-
poration.
Benton, A. L. (1971). Introducción a la neuropsicología. Barcelona. Fontanella.
Benton, A. L. (1974). The revised Visual retention test. Nueva York. Psychological Corporation.
Benton, A. L., Levin, H. S. y Van Allen, M. W. (1974). Geographic orientation in patients
with unilateral cerebral disease. Neuropsychología, 12, 183-191.
Benton, A. L., Hamsher, K., Varney, N. R. y Spreen, O. (1983). Contributions to nNEeuropsy-
chological assessment. Nueva York. Oxford University Press.
pa pd (1990). Malingering following minor head trauma. Clinical Neuropsychology,
Peña-Casanova, ]. (en prensa a). Limitaciones de los grupos y de los síndromes neuropsico-
lógicos clásicos en neurología. Neurología
Peña-Casanova, J. (en prensa b). Introducción a la exploración de las afasias (De la cabecera
del paciente a la exploración idiográfica). Revista SeNeurología, 20.
Petersen, A. C. y Witting, M. A. (1979). Sex-related differences in cognitive functioning.
Nueva York. Academic Press.
Porch, B. E. (1981). Porch index of communicative ability (vol. 11): Administration, sCoring
and interpretation (3* ed.). Palo Alto. Consulting Psychologists Press.
Raven, J. C. (1947). Colored progressive matrices. Londres. K. H. Lewis.
Raven, J. C. (1960). Guide to use standard progressive matrices. Londres. K. H. Lewis.
Reitan R. M. y Davison, L. A. (1974). Clinical neuropsychology: Current status and applica-
tions. Washington, D.C. V.H. Vinston.
Reitan R. M. y Woltfson, D. (1985). The Halstead-Reitan neuropsychological test battery:
Theory and interpretation. Tucson. Neuropsychology Press.
Rey, A. (1941). L'examen psychologique dans les cas d'encéphalopathie traumatique. Archi
ves de Psychologie, 28, 286-340.
Rey, A. (1959). Test de copie et de reproduction de mémoire de figures geométriques comple-
xes. París. Les Editions du Centre de Psychologie Appliquée.
Rourke, B. P., Costa, L. C., Adams, K. M. y Plasterk, K. J. (1991). Methodological and biosta-
tistical foundations of clinical neuropsychology. Amsterdam. Swets and Zeitlinger.
Rusell, E. W. (1984). Theory and development of pattern analysis method related to the
Halstead-Reitan Battery. En P. E. Logue y J. M. Schear (dirs.), Clinical neuropsycholog).
A multidisciplinary aproach. Springfield. Charles C. Thomas.
Semmes, J., Weinstein, S., Ghent, L. y Teuber, H. L. (1960). Somatosensory changes after pe-
netrating head wounds in man. Cambridge. Harvard University Press.
Signoret,J.L. (1991). Batterie d'efficience mnésique BEM 144. París. Elsevier.
Signoret, J. L. y North, P. (1979). Les apraxies gestuelles. Comunicación presentada en el
Congrés de Psychiatrie et de Neurologie de Langue Frangaise. París.
Smith, A. (1981). Principles underlying human brain functions in neuropsychologic sequelae
of different neuropathological processes. En S. B. Filskov y T. J. Boll (dirs.), Handbook of
clinical neuropsychology. Nueva York. Wiley.
Spreen, O. y Benton, A. L. (1969). Neurosensory center comprehensive examination ofApha-
sia. Victoria BC. University of Victoria Neuropsychology Laboratory.
Spreen, O. y Strauss, E. (1991). A compendium of neuropsychological tests. Administration,
norms and commentary. Nueva York. Oxford University Press.
Stroop, J. R. (1935). Studies of interference in serial verbal reaction. Journal of Experimental
Psychology, 18, 643-662. :
Strub, R. L. y Black, F. W. (1985). The mental status examination in neurology. Filadelfia.
F. A. Davis and Company.
Strub, R. L. y Black, F. W. (1988). The bedside mental status examination. En F. Boller y
F. Grafman (dirs.), Handbook of neuropsychology (vol. 1). Nueva York. Elsevier Sciences
Publishers, B. V.
Tarter, R. E. y Edwards, K. L. (1986). Neuropsychological batteries. En T. Incagnoli,
G. Goldstein y C. J. Golden (dirs.), Clinical application of nenropsychological test batte-
ries. Nueva York. Plenum Press.
Tiffin J. (1968). Purdue pegboard: Examiner manual. Chicago. Science Research Associates.
Tunks, E. (1976). Nenropsychiatric examination procedures: A criterion-sensivity problem.
Ponencia presentada en el IV Encuentro Anual de la International Neuropsychological
Society. Toronto, Canadá. Fara
Walsh, K. W. (1991). Understandin g brain damage. Londres. Churchill Livingstone.
Wechsler, D. A. (1955). Wechsler adult intelligence scale. Nueva York. Psychological Corporation.
Weinsenburg, T. S. y McBride, K. L. (1935). Aphasia. Nueva York. Commonwealth Fund.
454 Jordi Peña-Casanova, M. T. Hernández y Adolf Jarne
LECTURAS COMPLEMENTARIAS
Il. INTRODUCCIÓN
Universidad de La Laguna.
456 Wenceslao Peñate y Pilar Matud
Il. CARACTERÍSTICAS
Como se ha señalado más atrás, las características definicionales de las técnicas subje-
tivas serían las de no enmascaramiento, no estructuración y voluntariedad, lo que les
daría señas de identidad diferenciada frente a otro tipo de procedimientos de análisis.
Técnicas subjetivas
457
De acuerdo con Block (1978), cuando en 1953 William Stephenson propone la me-
todología de análisis Q, lo hace con la finalidad de ofertar una alternativa a la meto-
dología correlacional (metodología R) dominante en la época. La metodología Q
pretendía ofertar un análisis de personas frente al análisis de ítems de la metodología
R, ala vez que ofertaba una técnica de evaluación para el estudio del caso individual.
En síntesis, la técnica de clasificación Q consiste en que una persona se autoeva-
lúe o evalúe a otros de acuerdo con una serie de ítems, normalmente comprendidos
Técnicas subjetivas
459
entre 60 y 120, conteniendo cada uno de ellos frases, afirmaciones, juicios, etc. El
evaluado deberá indicar en qué medida esos referentes verbales son aplicables a la
persona enjuiciada, normalmente de acuerdo con una escala de nueve puntos, aun-
que pueden ir de siete a once, que van desde la ausencia de aplicabilidad (1) a la máxi-
ma aplicabilidad (9) (Kerlinger, 1973). No se trata de acertar en la elección ni de dar
con la respuesta correcta, sino de ofrecer la versión que un individuo tiene de sí mis-
mo o de cómo percibe a otras personas allegadas.
Hasta aquí la metodología Q no se diferenciaría de la metodología R en la cons-
trucción de tests. Sin embargo, hay que hacer tres precisiones:
Uno de los fundamentos de la teoría clásica de tests consiste en aceptar que las
características psicológicas se distribuyen según un modelo de curva normal. Así, si
evaluamos cualquier característica, aproximadamente el 68% de la población se si-
tuará a una desviación típica, en cualquier dirección, con respecto de la puntuación
media en esa característica; el 95% deberá situarse a dos desviaciones típicas y el
99% se situará a tres desviaciones típicas. En el caso de la metodología Q, la lógica
indica que de un número determinado de juicios valorativos sobre una persona, la
mayoría de ellos será medianamente aplicable a ella y sólo un pequeño grupo de esos
juicios será, por un lado, de total aplicación, y, por otro, no lo será en absoluto.
Tomando como ejemplo una prueba Q sobre cualquier dimensión personal (auto-
concepto, neuroticismo, estilo de vida, etc.) compuesta por 100 declaraciones verba-
les, donde la persona evaluada deberá responder en una escala de nueve puntos, que
van desde el máximo acuerdo con la declaración hasta el total desacuerdo, la distri-
bución de las respuestas debería seguir un modelo como el que se presenta en la fi-
gura 20.1. : ADELA
Observando la gráfica, se puede encontrar la misma distribución señalada antes
para los individuos en la metodología R, sólo que en este caso la distribución corres-
ponde a los ítems. Así, la persona evaluada deberá situar la mayoría de ellos entre
las puntuaciones intermedias (4, 5 y 6), lo que deberá equivaler al 68% sobre el total
de los ítems (una desviación típica); una menor cantidad de ítems (26) deberá res-
+60 Wenceslao Peñate y Pilar Matud
25
do 20
>
1)
AE
u 15
E
O
mm 10
>
y)
za
ALTERNATIVAS DE RESPUESTA
linger, 1973). En este segundo modo, la calificación de otros significativos puede ha-
cerse mediante un informe valorativo a través de la relación o conocimiento que se
tenga de ellos, o como un sistema de observación y registro de conductas, donde las
tarjetas son descripciones de conductas observables (Smith-Wampler y cols., 1989).
ltems
E Cr AAA 1 RANGO-CATEGORÍA
A AN O 9 E
(e o VI o 3 »
AEREO
Adell MB AAA N S
Técnicas subjetivas
4653
Una vez ordenados por rangos, de acuerdo con la categoría elegida para cada tar-
Jeta-ítem, se puede aplicar un estadístico de correlación para datos ordenados por
rangos (coeficiente rho), donde los sujetos son sustituidos por ítems, relacionándose
a personas en dos tiempos distintos. En este caso los coeficientes positivos indican
consistencia en las respuestas y los negativos cambios en las respuestas dadas por un
mismo individuo en dos ocasiones distintas (para el caso del perfil-modelo en el pri-
mer caso se habla de ajuste y en el segundo de desajuste). Además, como también se
ha señalado para los análisis descriptivos, se pueden realizar análisis similares cuan-
do la prueba Q evalúe más de una dimensión o factor. Evidentemente, el análisis es-
tadístico puede ir mucho más allá del análisis correlacional, pudiendo ampliarse a
otros procedimentos más complejos, y que escapan alos propósitos de este capítulo.
Por último, este procedimiento inferencial también puede utilizarse en diseños
no ipsativos, permitiendo comparaciones intersujetos, utilizándose como un sistema
de E más dentro de la metodología experimental (Kerlinger, 1973; Stephen,
1985).
caso de utilizarse como perfil-modelo, donde una clasificación se hace coincidir con
una clasificación predeterminada, donde la mayor o menor coincidencia indicaría el
ajuste con el perfil-criterio, como pueden ser los casos de su utilización en el análisis
de puestos de trabajo; donde, además, esa coincidencia-correlación sería un predic-
tor de buen-mal desempeño del puesto (Caldwell y O'Reilly, 1990).
Sin querer agotar las posibilidades de validación con este resumen (existen datos
sobre validez aparente, discriminante, de tratamiento, etc.), sirve para ilustrar cómo
una técnica denominada subjetiva se puede someter con el mayor rigor a análisis de-
nominados objetivos, con lo que el carácter oscurantista con el que en alguna oca-
sión se ha querido ver a estas técnicas carece de sentido en clasificaciones bien esta-
blecidas y validadas.
las posiciones que ocupa cada uno en esas variables; el modelo de constructos perso-
nales no asume esa distribución normal de los constructos, no presuponiendo que
los que una persona haya sido capaz de construir tengan que ser compartidos por
otros, así como el modo en cómo organiza cada persona los constructos tampoco
tiene por qué serlo. Se huye de los planteamientos nomotéticos y se defiende la un:-
cidad ideográfica.
Ante este estado de la cuestión, la teoría de tests no da respuesta a la evaluación
de los repertorios de constructos de una persona, y es aquí donde Kelly propone el
REP-test (Role construct repertory test), del que se deriva la técnica de rejilla (Grid
test). Con esta técnica el autor oferta un procedimiento de evaluación que posibilita
poner a prueba su teoría de los constructos personales.
Los fundamentos de esta técnica son los siguientes:
Con estos presupuestos básicos en mente, veamos cómo se elabora una prueba
con la técnica de rejilla, conocimiento que el lector puede profundizar en obras
como las de Beail (1985), Fransella y Bannister (1977) o Bannister y Maier (1968).
Una vez determinados los elementos (que, para ilustrar el texto, podemos supo-
ner que se trata de 10 personas significativas en la vida del evaluado), se continúa con
el segundo paso. La tarea ahora consiste en elegir tríadas de elementos e ir estable-
ciendo constructos a través del procedimiento citado de similitud-contraste. Con-
cretamente, consiste en pedirle que de los tres elementos de la tríada indique en qué
se parecen (similitud) dos de ellos frente al tercero (contraste), tal ycomo el evaluado
quiera agruparlos. "Tanto la similitud como el contraste debe requerírsele que los
haga sobre cualidades psicológicamente significativas, no accesorias. De esa forma
obtenemos el primer constructo que ha de ser bipolar. En nuestro ejemplo, si le faci-
litáramos una tríada con los roles de “padre”, “terapeuta” y “amigo” la persona po-
dría agrupar a los dos últimos como personas que comparten flexibilidad frente a la
figura paterna que representa la autoridad. Con ello tendríamos el primer construc-
to “flexibilidad-autoridad” (normalmente, en el proceso terapéutico los constructos
y su bipolaridad no tienen por qué ser lógicos y racionales como el ejemplo citado).
Una vez elicitado el primer constructo continuaríamos de igual forma con una se-
gunda tríada (donde pueden volver a formar parte elementos de la primera), elicitan-
do el segundo constructo. Y así hasta completar el número de constructos deseado,
que normalmente se sitúan en 10.
Lo relatado para el segundo paso es el procedimiento propuesto usualmente
(Kelly, 1955; Pervin, 1975), sin embargo, puede eliminarse el procedimiento de tría-
das de elementos, sustituyéndose por díadas, previamente decididas por el terapeuta
(Menasco y Curran, 1978; Neimeyer y Neimeyer, 1981). En estos casos se le pide a
la persona evaluada que indique en qué se parecen o diferencian ambos elementos de
la díada. Siguiendo las instrucciones propuestas por Neimeyer y Neimeyer (1981),
el procedimiento sería de esta forma:
Bien, [nombre del evaluado-a], quiero que pienses en [primer elemento de la díada] y en
[segundo elemento de la díada]. ¿Los ves parecidos u opuestos en algún aspecto importan-
te? La similitud o diferencia puede ser cualquier cosa. Podría tener que ver con la clase de
personas que ellos son o con la forma de sentir, actuar, mirar, o pensar [...], cualquier cosa
en la que se parezcan uno a otro o se diferencien, tanto como te parezca importante para tl
[p. 196].
tructo. Si la persona nos dice que los dos elementos son muy parecidos en que «tie-
nen mucha fuerza de voluntad», ahora se le pediría cuál sería para ella la idea contra-
ria a “fuerza de voluntad”. Supongamos que dice “timidez”, con lo que tenemos el
primer constructo “fuerza de voluntad-timidez”.
Sea un procedimiento (tríada) u otro (díada), con el segundo paso se deben te-
ner elicitados la cantidad de constructos bipolares deseados. El tercer paso consiste
en pedirle que enjuicie de forma positiva, negativa o neutra (algunos modelos su-
primen el valor neutro) los polos de cada constructo. Así, para los ejemplos cita-
dos, en el constructo “flexibilidad-autoridad” la persona puede evaluar positiva-
mente el primer polo y negativamente el segundo, y en caso del constructo “fuerza
de voluntad-timidez” ha podido enjuiciarlo también en el mismo sentido anterior.
Esta valoración es de suma importancia a la hora de enjuiciar cualitativamente el
tipo de repertorio presentado, así como para facilitar el análisis cuantitativo del
mismo.
CONSTRUCTOS
C1 C2 C3 C4 C5 C6 C7 C8 C9 Cc10
a EAA N
AA A
Son ire oc bota alda lla a Li E
Eoceno. parcado de[2co0s|ves]sa ue q
¿dcoclicacdo Przaleddelnerto [coco delmec memo
YN
Ai ico AU A Ml ll la IA
=
tá
uy
lc MS CE [SD [E [E PS
A ICI PEA O E
soba] [O Lo a cal rl
ER PO Ae
tante fuerza de voluntad). Con ello tenemos puntuadas las casillas C1 x El (22) y
C2 x El (+2). El resto de las casillas se continúan rellenando de esta forma hasta
completarlas, finalizando así el proceso de elaboración de un REP-test, a través de la
técnica de rejilla.
Este es un proceso de elaboración general; sin embargo, la técnica puede tener
otras expresiones y modificaciones que pueden ser consultadas en las obras de refe-
rencia citadas. Aquí sólo se comentarán algunas a modo de ejemplo.
A
Roles (elementos).
Tú mismo
Persona que te disgusta
Madre
Persona a la que te gustaría ayudar
Padre
Amigo del mismo sexo
Amigo de distinto sexo (puede ser esposo-a)
Persona con la que te sientes más incómodo
NS
SS
ES El jefe
10. Persona a la que te cuesta comprender.
1. Interesante =3 27 1 0 +1 +2 +3 Aburrido
2. Independiente —3+-=2 A E +2 +3 Dependiente
3. Extrovertido 3 2 A 0 +1 +2 +3 Tímido
4. Desajustado 3 2 -1 O +1 +2 +3 Ajustado
5. Autoabsorbido E 0 +1 +2 +3 Interesado en otros
6. Decidido 3 2 -—1 0 +1 +2 +3 Indeciso
7. Desconsiderado 3 2 A O —-+1 +2 +3 Considerado
8. Malhumorado 3 2 A OPTA +2 +3 Alegre
9. Irresponsable 3 2 -— O +1 +2 +3 Responsable
10. Tranquilo 3 2 0 +1 +2 +3 Excitable.
El primer análisis de una rejilla pasa lógicamente por un análisis cualitativo de los
contenidos de los constructos. Aspectos tales como la diversidad de los constructos,
su recurrencia temática, su complejidad o simpleza pueden ser formas de análisis,
ue podrían ser sistematizadas utilizando modelos de codificación como el ya citado
de Landfield (1971), u otros sistemas (Neimeyer, 1989).
Por otro lado, si se le ha pedido que señale el grado de centralidad o importancia
de cada constructo, podemos tener información sobre su sistema jerarquizado de
análisis, así como identificar las situaciones o los hechos más amenazantes (aquellos
que cuestionan a los constructos más centrales), o menos amenazantes (los que cues-
tionan a los constructos más accesorios). Además, si el sistema para completar la re-
472 Wenceslao Peñate y Pilar Matud
CUADRO 20.2. Ejemplo ficticio (parcial) de una rejilla ordenada por rangos, según los ele-
mentos y constructos de Bieri y cols. (1966)
CONSTRUCTOS
ELEMENTOS
1. Túmismo
2. Persona que te
disgusta
3. Madre
4. Persona a la que te
gustaría ayudar
5. Padre
7. Amigo de distinto
sexo
9. Eljefe
jilla ha sido el de ordenación por rangos, obtendríamos perfiles de los elementos ele-
gidos.
Claro está que un análisis cualitativo tiene tanto de valioso como de cuestiona-
ble, por lo que el análisis se debe orientar hacia su cuantificación, aunque, como es
obvio, ambos acercamientos no son excluyentes. Existen varios paquetes estadísti-
cos que analizan los datos de una rejilla (por ejemplo, el Circumgrids de Chambers y
Grice, 1986), facilitando la tarea de evaluación, así como permitir realizar análisis
más complejos.
El análisis cuantitativo más sencillo consiste en calcular porcentajes. Como se re-
cordará, la persona evaluada debía indicar cuál era para ella el polo positivo y el polo
negativo de cada constructo. Una vez completada la rejilla (teniendo en cuenta que
hemos balanceado la posición de los polos positivos y negativos) podemos contar el
número de casillas con valoraciones positivas frente a las negativas y hallar el por-
Técnicas subjetivas
473
centaje sobre el total de casillas (que si se utiliza una rejilla de 10 x 10, lógicamente
el
cálculo es directo). Con ello tenemos un índice muy genérico de cómo
construye,
que se puede especificar más si se realiza para cada elemento. Esto es realmente va-
lioso cuando existen problemas (conflictos) y dentro de ésos está la propia persona
evaluada y personas significativas (como debe ser, por otro lado).
- Otro indicador cuantitativo sencillo podría denominarse significatividad [mea-
ningfulness]. La significatividad se obtiene analizando las puntuaciones extremas, vi-
niendo a ser una versión cuantitativa de la ordenación que el propio evaluado puede
hacer de los constructos, según la importancia o centralidad. A grandes rasgos, con-
siste en elanálisis de las puntuaciones extremas, entendiendo que una persona utiliza
puntuaciones extremas para calificar un elemento en la medida en que considera el
constructo como significativo, mientras que los constructos donde aparecen pun-
tuaciones intermedias son menos relevantes para su análisis de los elementos. La sig-
nificatividad se expresa en valores absolutos y puede ir desde O (no significatividad)
hasta N (total significación), donde N es la puntuación máxima del sumatorio de
cada constructo por los valores absolutos de su calificación. En una rejilla de 10 x 10
y una escala de (3) a (+3) el valor máximo sería 30 (3 x 10). Existen datos que avalan
este indicador y que pueden ser consultados en las monografías de referencia ya ci-
tadas.
Otro indicador, también sencillo, es el denominado complejidad cognitiva de
Bieri, entendida como la cantidad de constructos diferentes utilizados en la evalua-
ción de un número determinado de elementos. La complejidad cognitiva de un indi-
viuo es mayor cuanto más constructos utiliza, o, más específicamente, cuantas más
puntuaciones distintas sea capaz de generar frente a un número de elementos. Una
forma de cuantificarlo consiste en contar el número de calificaciones idénticas hechas
sobre un mismo elemento. Las puntuaciones posibles son una función de la cantidad
de constructos y de la escala utilizada para calificar. Si de nuevo tomáramos el ejem-
plo de la rejilla de 10 x 10 y una escala de 7 puntos, sabemos que hay que calificar
cada elemento en diez constructos según una escala de 7 puntos. Ello hace que exis-
tan, obligatoriamente, tres coincidencias en la calificación, con lo que la puntuación
mínima por elemento sería 3, lo que hace una puntuación mínima de 30 para el total
de los 10 elementos. Por otro lado, la puntuación máxima por elemento sería de 10
(calificar en el mismo nivel a los 10 constructos), lo que hace una puntuación máxi-
ma total de 100. A medida que las puntuaciones son más elevadas, menor es la com-
plejidad cognitiva del individuo, ya que ello representaría su incapacidad para discri-
minar un elemento en unas dimensiones representadas por los constructos. Una
forma más elaborada de evaluar la similitud-diversidad de las respuestas ha sido di-
señada por Landfield y Cannell (1988) a través del programa de Construcciones fun-
cionalmente independientes (FIC, Functionally independent constructions). Este pro-
rama analiza agrupaciones (clusters) de patrones de calificaciones, lo que hace
posible el análisis de equivalencia funcional de los constructos, en la medida en que
se observen patrones de respuestas similares entre diferentes clusters. lo
En el caso de la ordenación por rangos, se pueden determin ar los coeficien tes de
correlación por rangos, lo que permite agrupar construc tos funciona lmente equiva-
lentes para clasificar distintos elementos. Una forma más compleja consiste en deter-
la matriz de co-
minar el “índice de intensidad”. Para ello se obtiene la totalidad de
474 Wenceslao Peñate y Pilar Matud
relaciones, se eleva al cuadrado cada una de ellas y se multiplican por 100. El índice
de intensidad se obtiene sumándolas todas, como una medida de varianza común ex-
plicada. A medida que los índices son más elevados (sistema integrado) la ordena-
ción de los constructos se hace más predictiva, mientras que los índices bajos (siste-
ma diferenciado) son indicadores de una gran dispersión, disminuyendo la
capacidad predictiva. De alguna forma los índices elevados permiten predecir la or-
denación de unos constructos, conociendo cómo han sido ordenados otros; sin em-
bargo, ese conocimiento no permite hacer predicciones cuando los índices son bajos
(lo que significa que los índices de correlación han sido bajos). Nuevamente, con es-
tos datos se pueden obtener agrupaciones de constructos que nos proporcionan una
suerte de componentes principales en su ordenación.
Evidentemente, son muchos más los análisis que se pueden hacer. Serán las nece-
sidades de evaluación clínica o experimentales las que orientarán el tipo de análisis a
realizar. Por lo demás, el lector tiene a disposición las referencias para profundizar
en este cometido.
V. EL DIFERENCIAL SEMÁNTICO
Para aumentar la sensibilidad del instrumento de medida, se incluye entre cada par de
términos una escala de siete puntos que permita que el examinado pueda indicar la in-
tensidad de cada juicio. Por tanto, el diferencial semántico es una combinación de aso-
ciaciones controladas y procedimientos de escala (Osgood y cols., 1957) y consiste en
presentar al sujeto un determinado concepto y un conjunto de escalas de adjetivos bi-
polares, debiendo indicar la dirección y la intensidad de su asociación en una escala de
siete puntos. Uno de los aspectos claves del método es la selección de la muestra de
los términos polares descriptivos, que debería ser lo más representativa de todas las
formas posibles en que los juicios de significación puedan variar (pero manteniendo
una magnitud adecuada) e insensible a otras fuentes de variación.
Osgood y sus colaboradores postulan la existencia de un espacio semántico mul-
tidimensional y suponen que cada escala semántica (definida por un par de adjetivos
de significado opuesto) representa una función lineal directa que pasa por el origen
de este espacio, estando mejor definido el espacio semántico cuanto más amplia y re-
presentativa sea la muestra de escalas. Los juicios realizados de un determinado con-
cepto podrán ser operacionalizados mediante su localización como un punto en este
espacio semántico, que además permitirá la reproducción de los juicios originales
mediante su proyección ortogonal sobre una línea que pasa por el origen del espacio.
La diferencia en el significado de dos conceptos será una función de las diferencias
entre sus localizaciones respectivas dentro del mismo espacio.
Respecto a la dimensionalidad del espacio semántico, realizaron varios análisis
factoriales que les permitieron concluir:
que se aplica, no existiendo conceptosni escalas típicas, sino que los conceptos y las
escalas utilizadas dependerán de los propósitos del investigador. Si bien es posible
realizar formas particulares de diferencial semántico con conceptos y escalas norma-
lizadas para algunas áreas de medida como la psicoterapia o las actitudes, no existe
ningún “test” del diferencial semántico, sino que su normalización y su comparabi-
lidad se basan en la colocación de los conceptos en un espacio semántico común, de-
finido por un conjunto de factores generales comunes, pese a la variabilidad de los
conceptos y escalas particulares utilizadas (Osgood y cols., 1957).
El contenido de un diferencial semántico consta del estímulo que provocará en el
sujeto la respuesta terminal (al que los autores de la técnica denominan concepto) y
las escalas de medida.
Los conceptos variarán ampliamente dependiendo de los intereses del investiga-
dor, pudiendo ser estímulos lingúísticos (hablados o —con mayor frecuencia— es-
critos) tales como verbos, sustantivos, adjetivos..., frases (por ejemplo «mi yo ideal»)
o de otro tipo, tal como láminas de tests como el TAT o el Rorschach, cuadros o es-
culturas. Dado que las limitaciones de tiempo y sujetos no permiten cubrir comple-
tamente los conceptos relevantes de una determinada área, deberá realizarse un
muestreo, debiendo ser los objetos del juicio representativos del área de interés y re-
levantes teóricamente. Además, la selección de conceptos deberá realizarse teniendo
en cuenta que se esperen diferencias individuales considerables, que tengan un signi-
ficado unitario para el individuo (es decir, que no varíe en lo que está juzgando) y
que los conceptos sean familiares para todos los sujetos del caso.
Respecto a la selección de escalas, aunque deberá realizarse en función de los pro-
pósitos de la evaluación, Osgood y sus colaboradores recomiendan utilizar una pe-
queña muestra de escalas muy relacionadas con cada uno de los factores del espacio
semántico (típicamente EPA, aunque también podrán incluirse otras si se considera
adecuado), sin olvidar la relevancia de las escalas para los conceptos que se juzgan.
Además, señalan otro criterio más difícil de cumplir y para el que no existen aún da-
tos adecuados: las escalas deben ser lineales, estar ancladas en polos opuestos y pasar a
través del origen, suponiendo sus autores que las escalas definidas por opuestos fami-
liares y comunes cumplen estas propiedades. En cuanto al número de escalas a utili-
zar, Anastasi (1988) afirma que suelen utilizarse un mínimo de 15 para cada concepto.
El emparejamiento de un determinado concepto y una escala lo denominan
ítem, siendo el número de ítems de un determinado diferencial semántico igual al
número de escalas por el número de conceptos. Respecto al tiempo de aplicación,
sugieren que se deben dar de 10 a 15 minutos para una prueba de 100 ítems, si bien el
tiempo varía en función de los sujetos, conceptos y escalas utilizadas.
Hay varias formas de diferencial, utilizándose mayoritariamente dos formas grá-
ficas, que parecen no ofrecer resultados significativamente distintos. En la primera,
se sitúa el concepto escrito en mayúscula en la misma línea de la escala según la que
se va a juzgar, combinando los conceptos y las escalas tal como se ve en el siguiente
ejemplo:
justo injusto
fuerte 3 Ñ ; : E : débil
bueno ; 3 : : a : malo
justo DE E a E E : injusto
fuerte : : E E IO débil
bueno E A OE: : y : malo
Activo : a iS z 4 Pasivo
A cada una de las siete posiciones sobre las escalas se les asigna un dígito de forma arbi-
traria, pudiendo ser 1, 2, 3, 4, 5, 6 y 7 ó bien +3, +2, +1, 0,1, 2 y 3, siendo el centro
del espacio semántico el O ó el 4 en la primera forma de puntuación, que corresponde a
la posición neutral sobre las escalas. Las escalas asociadas a las categorías factoriales de
evaluación, potencia, actividad u otras que se hayan considerado relevantes deberán
sumarse y promediarse, obteniéndose puntuaciones de los factores para cada concepto
Juzgado por cada sujeto. Si estamos interesados más que en personas en grupos, se
promediarán los datos de los sujetos, utilizando la media o la mediana como represen-
tativa del grupo y alguna medida de dispersión o variabilidad como índice de la consis-
tencia del significado de ese concepto en el grupo citado. De este modo, se obtienen las
Técnicas subjetivas 479
Héroe 8 3 3
Destino 1 0 —2
Sueño 2 0 2
Vida S E) 3
Fracaso 3 2 —2
FIGURA 20.2. Perfiles correspondientes a los juicios de tres conceptos, A (amor), B (destino) y
C (sueño), evaluados sobre cinco escalas
Activo ; : z ; ; o Pasivo
Relajado
480 Wenceslao Peñate y Pilar Matucl
D;= 2d,
donde D, es la distancia lineal entre los puntos del espacio semántico que representa
los conceptos i y j y d, es la diferencia algebraica entre las coordenadas 2 y ¡ sobre la
misma dimensión, sumándose posteriormente las k dimensiones. Así, en el ejemplo
anterior, la D entre héroe y destino se hallaría calculando la diferencia entre las pun-
tuaciones de los dos conceptos en cada uno de los factores, elevando al cuadrado esta
diferencia (3 — 1) + (3 — 0) + (3 — 2)?, sumando estos cuadrados y calculando la raíz
cuadrada de esta suma, siendo en este ejemplo 7,07 la distancia encontrada.
Además de servir para indicar la distancia (y la semejanza) entre conceptos juz-
gados por un individuo o grupo, también sirve para comparar dos personas, dos
grupos de individuos o los juicios realizados en dos momentos distintos, así como
para determinar la distancia entre pares de individuos o escalas, tratando los concep-
tos como un conjunto de variables y permitiéndonos —por ejemplo— encontrar
agrupaciones de individuos que tienen juicios semejantes de esos conceptos. Otras
aplicaciones de D incluyen el análisis simultáneo de todos los pares de conceptos (o
de personas), que permite el encontrar una matriz de (m) x (m) distancias entre to-
dos los conceptos enjuiciados (siendo m el número de conceptos), que a su vez —si
los juicios de la persona no son superiores a tres factores— podrá ser representado
espacialmente, obteniéndose un modelo de su estructura conceptual, en el que las
agrupaciones de conceptos, sus distancias relativas y su ordenación pueden visuali-
zarse de forma directa y simultánea. Además, Osgood y sus colaboradores también
ofrecen otras posibilidades de análisis y de relaciones de D con otros estadísticos,
que pueden ser consultados en el manual de 1957 citado.
VL ELLISTADO DE ADJETIVOS
Esta técnica de evaluación surgió dentro del área de estudio de la personalidad, ha-
biéndose utilizado ya en los años treinta en los estudios de Hartshorne y May para la
calificación por los profesores de la conducta de los niños, siendo posteriormente
utilizada por otros autores como Allport y Odbert (1936) o Cattell (1943), existien-
do actualmente múltiple bibliografía y aproximaciones un tanto distintas. Ejemplo
de ello es el recuento de aproximadamente 50 listados diferentes citados por Master-
son en una revisión de la técnica realizada en 1975.
Como en el caso de las otras técnicas subjetivas, los listados de adjetivos más que
una prueba concreta es un procedimiento general de evaluación, consistiendo bási-
camente en la presentación de un listado de adjetivos que sean capaces de describir la
conducta o conductas que se pretende evaluar, conductas que a su vez pueden ser ca-
lificadas en términos generales, o referirse a situaciones específicas. Además, este lis-
tado puede ser cumplimentado por la misma persona evaluada o bien por un obser-
vador externo.
Aunque sintetizar en unas pocas páginas una técnica tan prolífica no es tarea fá-
cil, presentaremos algunas características generales de la técnica, describiendo poste-
riormente de forma breve aquellos listados que aparecen con mayor frecuencia en la
bibliografía.
puntuación también varía en buena medida en los diferentes listados, lo que invita a
una reflexión acerca de la equivalencia de las puntuaciones obtenidas. En cuanto al
tiempo de aplicación suele ser muy breve, no soliendo durar más de 15 minutos.
En cuanto a la frabilidad de la técnica, los coeficientes de fiabilidad test-retest
obtenidos suelen ser moderados. Por ejemplo, Gough y Heilbrun (1965) encontra-
ron en un intervalo temporal de 6 meses índices que oscilaron entre 0,01 y 0,86 y una
media de 0,54, pero estos datos pueden ser interpretados tanto como una caracterís-
tica del método de medida como un índice de su sensibilidad al cambio. Por ello, al
juzgar los índices test-retest como una medida de la fiabilidad de la prueba, habrá
que tener en cuenta si ésta pretende la evaluación de características poco estables (en
cuyo caso se deberán obtener bajos coeficientes) o pretende evaluar rasgos estables
de personalidad, en cuyo caso los coeficientes deberán ser elevados. Respecto a la
consistencia interna, son varios los estudios que muestran inconsistencias en las res-
puestas de los evaluados, no señalando de forma coherente adjetivos que se presen-
tan de forma repetida y habiendo encontrado que en algunos casos los sujetos seña-
lan antónimos (Parker, 1969). Estos problemas de consistencia han llevado a
cuestionarse una asunción básica de la escala: que cada adjetivo-estímulo tiene un
significado común, existiendo la posibilidad de connotaciones distintas tanto en
función de la interpretación idiosincrásica como del contexto donde se desarrolle la
interpretación (Parker, 1969; Parker y Veldman, 1969), de variables situacionales
(buen ejemplo de ello es el estudio de Jacobs, Capek y Meehan en 1959, que encon-
traron correlación entre el número de adjetivos señalados y la exposición a diferen-
tes situaciones experimentales) e incluso de la estructura concreta de una determina-
da lista de adjetivos, cuestiones que aún no han sido convenientemente analizadas.
Respecto a la validez, difiere en gran medida en función del listado de adjetivos
analizado, si bien parece existir cierta evidencia acerca de menor capacidad discrimi-
nante que otras medidas de personalidad (Masterson, 1975).
para la evaluación del autoconcepto. Además de ser una técnica utilizada para la eva-
luación del autoconcepto de una persona determinada, las listas de adjetivos también
han sido empleadas para la evaluación del autoconcepto de grupos de personas,
como por ejemplo personas alcohólicas (Vanderpool, 1969), y de las percepciones
que tienen unas personas de otras, como por ejemplo, los padres de sus hijos, los
clientes de sus terapeutas o los empleados de sus jefes.
Dada la facilidad de aplicación de la técnica, ha sido muy utilizada para la com-
paración de medidas, tanto entre diferentes conceptos como del mismo concepto a
lo largo del tiempo, en diferentes situaciones o de las percepciones de distintas per-
sonas (por ejemplo, es posible comparar la percepción de uno mismo y cómo lo per-
cibe su jefe) y para evaluar los efectos de diferentes intervenciones, permitiendo la
evaluación a lo largo de todo el proceso terapéutico, ya que el listado de adjetivos pa-
rece ser particularmente útil en la evaluación del cambio (Masterson, 1975), aunque
también se ha cuestionado su sensibilidad al cambio cuando el formato de respuesta
únicamente es de presencia-ausencia, pudiendo darse cambios en la gradación de la
característica que no podría recoger este tipo de formato.
Otras aplicaciones incluyen la medida de las conceptualizaciones que una perso-
na tiene acerca de objetos inanimados, percepciones de ciudades, estereotipos ocu-
pacionales, personajes históricos o percepción de roles.
Además de las citadas, son varias las técnicas de evaluación que pueden englobarse
dentro de la categoría de subjetivas, haciendo imposible poner límites. Técnicas
como las de Autocaracterización (Kelly, 1955), procedimientos como el de Frases in-
completas de Rotter, o los propios cuestionarios biográficos pueden ser incluidos en
un apartado sobre técnicas subjetivas. Sin embargo, existe un material de análisis psi-
cológico, posiblemente el más subjetivo de todos, que apenas ha sido tratado y al
que le vamos a dedicar sucintamente este espacio: el análisis de los documentos per-
sonales. :
Allport (1942, 1963) entiende por Documento personal todo escrito O manifesta-
ción verbal del propio individuo que nos proporcione (de forma intencionada O no)
información relativa a la estructura y dinámica de su vida, incluyendo las autobio-.
grafías, ya sean generales o limitadas a un aspecto de la vida, los diarios personales y
otras anotaciones, los cuestionarios libres, las manifestaciones verbales provenientes
486 Wenceslao Peñate y Pilar Matud
a. Cuál fue el motivo que llevó al autor a producir ese documento. Motivos
como la justificación de algo, aclaración, interés científico, por dinero, exhibicionis-
mo, búsqueda de la inmortalidad o “necesidad de comunicarse” son muy útiles a la
hora del análisis e interpretación de los datos.
b. A quién va dirigido el documento. Los diarios personales normalmente es-
tán escritos para uno mismo (o para un “lector imaginario”). Las cartas suelen tener
un destinatario restringido. En cambio, las biografías se escriben posiblemente pen-
sando en unos lectores más heterogéneos. En cualquier caso, dependiendo del desti-
natario, el autor tenderá a dar una versión u otra (análisis introspectivo, buena ima-
gen, darse a conocer en sus aficiones, etc.).
c. Lo mediato-inmediato del documento. Lógicamente no se pueden interpre-
tar y no pueden llevar a las mismas conclusiones documentos personales recientes
que documentos producidos hace bastante tiempo. Así como tampoco tienen una
misma interpretación un documento que se ha redactado día a día, que uno que se
basa en el recuerdo más o menos lejano de una serie de acontecimientos o de com-
portamientos.
REFERENCIAS BIBLIOGRÁFICAS
Adams-Webber, ]. (1979). Personal construct theory: Concepts and applications. Nueva York.
Wiley. ,
a DO ]. y Davidson, D. (1979). Maximum contrast between self and others in per-
sonal judgment: A repertory grid study. British Journal of Psychology, 70, 517-518.
Allport, G. (1942). The use of personal documents in psychological science. Social Science
Research Council Bulletin, 49,
Allport, G. W. (1963). Pattern and growth in personality. Nueva York. Holt, Rinehart and
Winston.
Allport, G. W. y Odbert, H. (1936). Trait names: A psycho-lexical study. Psychological Mo-
nographs, 47, 1-211.
Anastasi, A. (1988). Psychological testing. (6* ed.) Nueva York. McMillan. '
Aronson, D. y Akamatsu, J. (1981). Validation of a Q-sort task to assess MMPI skills. Journal
of Clinical Psychology, 37, 831-837.
Bannister, D. y Maier, ]. (1968). The evaluation of personal construct. Londres. Academic
Press.
Barrios, B. (1988). On the changing nature of behavioral assessment. En A. Bellack y M. Her-
sen (dirs.), Behavioral assessment. A practical handbook. (3* ed.) Nueva York. Pergamon
Press.
Beail, N. (dir.) (1985). Repertory grid techniques and personal constructs. Cambridge. Broo-
kline Books.
Bem, D. y Funder, D. (1978). Predicting more of the people more of the time: Assessing the
personality situation. Psychological Review, 85, 485-501.
Bentler, P. M. y Lavoie, A. L. (1972). A nonverbal semantic differential. Journal of Verbal
Learning and Verbal Behavior, 11, 491-496.
Bieri, J., Atkins, A., Briar, S., Leaman, R., Miller, H. y Tripodi, T. (1966). Clinical and social
judgments. Nueva York. Wiley.
Block, J. (1978) The Q-sort method in personality assessment and psyquiatric research. Palo
Alto. Counseling Psychologist Press.
Bovet, J., Spagnol;, J. y Gillieron, E. (1991). Psychotherapeutic treatments evaluated with
two instruments: Clinical questionnaire and semantic differential. Psychotherapy and
Psychosomatics, 55, 9-23.
Caldwell, D. y O'Reilly (1D), C. (1990). Measuring person-job fit with a profile-comparison
process. Journal ofApplied Psychology, 75, 648-657.
Cattell, R. B. (1943). The description of personality: 2. Basic traits resolved into clusters.
Journal of Abnormal and Social Psychology, 41, 374-394.
Chambers, W. y Grice, J. (1986). Circumgrids: A repertory grid packcage for personal com-
puters. Behavioral Research Methods, Instruments, and Computer, 28, 468.
Clarke, W. U. (1956). The construction of an industrial selection personality test. Journal of
Psychology, 41, 374-394.
Crockett, W. H. y Nidorf, L. J. (1967). Individual differences in response to the semantic dif-
ferential. Journal of Social Psychology, 73, 211-218.
Everett, A. V. (1973). Personality assessment at the individual level using the semantic diffe-
rential. Educational and Psychological Measurement, 33, 837-844.
Feixas, G. (1990). Evaluación de textos autobiográficos. Aplicación de un diseño metodoló-
gico basado en la teoría de los constructos personales de Kelly: el caso de Pablo Neruda.
Evaluación Psicológica/Psychological Assessment, 6, 289-326.
Fernández-Ballesteros, R. (1983) Técnicas subjetivas. En R. Fernández-Ballesteros (dir.). Psi-
codiagnóstico. Madrid. UNED.
Fierro, A. (1982). Técnicas de investigación de la personalidad. Salamanca. ICE.
Técnicas subjetivas
489
Fish, T. (1986). Semantic differential assessment of benign, threat, and challenge appraisals of
life events. Canadian Journal of Behavioral Science, 18, 1-14.
o E. y Bamnister, D. (1977). A manual for repertory grid technique. Londres. Acade-
mic Press.
French, P. L. (1977). Nonverbal measurement of affect: The graphic differential. Journal of
Psycholinguistic Research, 6, 337-347.
Gardner, A. y Gibson, S. (1989). Semantic differential techniques in the identification of indi-
viduals assessment of health state: A case study of a patient within a homeopathic regime.
Counselling Psychology Quarterly, 2, 273-288.
Goldfried, M. y Kent, R. (1972). Traditional versus behavioral assessment: a comparison of
methodological and theoretical assumptions. Psychological Bulletin, 77, 409-420.
Gough, H. G. y Heilbrun, A. B. (1965). The Adjective Check list Manual. Palo Alto. Consul-
tng Psychologists Press.
Gough, H. G. y Heilbrun, A. B. (1983). The Adjective Check list Manual (edición revisada).
Palo Alto. Consulting Psychologists Press.
Graham, J. (1967). Q-sort study of the accuracy of clinical descriptions based on the MMPL.
Journal of Psychiatry Research, 5, 297-305.
Hunsley, J. (1990). Dimensionality of the multiple affect adjective check list-revised: A com-
parison of factor analytic procedures. Journal of Psychopathology and Behavioral Assess-
ment, 8, 103-117.
Jacobs, A., Capek, L. y Meehan, J. P. (1959). The development of an adjective check list to
measure affective states. Psychological Newsletter, 12, 515-520.
Kelly, G. (1955). The psychology ofpersonal construct. Nueva York. Norton.
Kerlinger, F. (1973). Foundations of behavioral research (2* ed.). Nueva York. Holt, Rinehart
and Winston [trad. castellana, México. Interamericana. 1975].
Lackson, D. y Minton, H. (1963). A forced-choice adjective preference scale for personality
assessment. Psychological Reports, 12, 515-520.
LaForge, R. y Suczek, R. (1955). The interpersonal dimension of personality: HI. An inter-
personal checklist. Journal of Personality, 24, 94-112.
Landfield, A. (1971). Personal construct systems in psychotherapy. Chicago. Rand-McNally.
Landfield, A. y Cannell, J. (1988). Ways of assessing functionally independent construction,
meaningfulness and construction in hierarchy. En J. Mancuso y M. Shaw (dirs.), Cogn:-
tion and personal structure. Nueva York. Praeger.
Leitner, L. y Cado, S. (1982). Personal constructs and homosexual stress. Journal of Persona-
lity and Social Psychology, 43, 869-872.
Lipsitt, L. P. (1958). A self-concept scale for children and its relationship to the children's
form of the manifest anxiety scale. Child Development, 29, 463-472.
Masterson, S. (1975). The adjective checklist technique; a review and critique. En P. McRey-
nolds (dir.), Advances in Psychological Assessment. (Vol. 111). San Francisco. Jossey-Bass.
Menasco, M. y Curran, D. (1978). An assessment of the Role Construct Repertory Test. Ap-
plied Pocboligrad Measurement, 2, 361-369. ici : :
Neimeyer, G. (1988). Cognitive integration and differentiation in vocational behavior. The
Counseling Psychologist, 16, 440-475.
Neimeyer, G. (1989). Application of repertory grid technique to vocational assessment.
Journal ofCounseling and Development, 67, 585-589. e
Neimeyer, G. y Neimeyer, R. (1981). Personal construct perspectives On cognitive assess-
ment. En T. Merluzzi, C. Glass y M. Genest (dirs.), Cognitive assessment. Nueva York.
Guilford Press.
Neimeyer, G. y Neimeyer, R. (comps.) (1989). Advances in personal construct theory. (Vol1).
Greenwich. JAI Press.
+90 Wenceslao Peñate y Pilar Matud
Osgood, C. E. (1952). The nature and measurement of meaning. Psychological Bulletin, 49,
226-233.
Osgood, C. E. (1964). Semantic Differential Technique in the comparative study of cultures.
American Anthropologist, 66, 171-200.
Osgood, C. E., Suci, G. y Tannenbaum, P. (1957). The measurement of meaning. Urbana.
University of Illinois Press.
Parker, G. V. (1969). Sex differences in self-description on the adjective check list. Educatio-
nal and Psychological Measurement, 29, 99-113.
Parker, G. V. y Veldman, D. J. (1969). Item factor structure of the adjective check list. Educa-
tional and Psychological Measurement, 29, 605-613.
Pelechano, V. (1988). Del psicodiagnóstico clásico al análisis ecopsicológico. (Vol. 1). Valencia.
Alfaplús.
PS V. (dir.) (1991). Habilidades interpersonales en ancianos. Conceptualización y
evaluación. Valencia. Alfaplús.
Pervin, L. (1975). Personality. Theory, assessment and research. Nueva York. Wiley.
Piotrowski, C. (1983). Factor structure on the semantic differential as a function of method
of analysis. Educational and Psychological Measurement, 43, 283-288.
Piotrowski, C. y Dunham, F. Y. (1984). Stability of factor structure on the semantic differen-
tial: retest data. Educational and Psychological Measurement, 44, 449-454.
Rogers, C. y Dymond, R. (dirs.) (1954). Psychotherapy and personality change. Chicago.
University of Chicago Press.
Schlicht, W/. (jr.), Carlson, H., Skeen, D. y Skurdal, M. (1969). Self-images without awareness
and projective methods of personality assessment. Journal of Projective Techniques and
Personality Assessment, 33, 419-423.
Sciortino, R. (1968). Analysis of factor variance of motivational self-ratings by male and fe-
male subjects. Journal of Psychology, 69, 169-174.
Smith-Wampler, K., Halverson, C., Moore, J. y Henley-Walters, L. (1989). The Georgia Fa-
mily Q-sort: an observational measure of family functioning. Family Process, 28, 223-238.
daa J. G. y Osgood, C. E. (1959). Semantic differential technique: a sourcebook. Chicago.
Aldine.
Stephen, T. (1985). Q-methodology in communication science: an introduction. Communi-
cation Quarterly, 33, 193-203.
Stephen, T. y Harrison, T. (1986). Assessing communication style: a new measure. The Ame-
rican Journal of Family Therapy, 14, 213-234.
Stephenson, W. (1953). The study of behavior: A-technique and its methodology. Chicago.
University of Chicago Press.
Stephenson, W. (1983). Against interpretation. Operant Subjetivity, 6, 109-125.
Strack, S. (1987). Development and validation of an Adjective check list to assess the Millon
personality types in a normal population. Journal of Personality Assessment, 51, 572-587.
rs Eió Measurement of activation through self-report. Psychological Reports,
, -678.
Thayer, R. E. (1986). Activation-Deactivation adjective check list: current overview and
structural analysis. Psychological Reports, 58, 607-614.
Thompson, B. (1980). Comparison of two strategies for collecting Q-sort data. Psychological
Reports, 47, 547-551.
Vanderpool, J. A. (1969). Alcoholism and the self-concept. Quarterly Journal of Studies on
Alcoholism, 30, 59-77.
Welsh, G. S. (1975). Adjective check list descriptions of Freud and Jung. Journal of Persona-
lity Assessment, 39, 160-168.
Zuckerman, M. (1960). The development of an affect Adjective check list for the measure-
ment of anxiety. Journal of Consulting Psychology, 24, 457-462.
Técnicas subjetivas 491
Zuckerman, M. y Lubin, B. (1965). Manual for the multiple affect adjective check list. San
Diego. EITS.
Zuckerman, M,, Lubin, B. y Rinck, C. (1983). Construction of new scales for the multiple af-
fect adjective check list. Journal of Behavioral Assessment, 5, 119-128.
LECTURAS COMPLEMENTARIAS
NM 0 vs bi A san O) SEN 14
o ru Doddoy Ciiéagos
/ MACUTVONTE OTTO vd
X y EN HI CILA
A A VEO cad
L
paar Ol AISIOs 0%
7
A 3 o á E l
aid. z. formal ol Persona
21. ANÁLISIS FUNCIONAL DE LA CONDUCTA
Il. INTRODUCCIÓN
Con frecuencia se recurre a los analistas de conducta 'con el objetivo de diseñar tra-
tamientos individualizados para pacientes que presentan un amplio espectro de tras-
tornos conductuales, cognitivos y psicofisiológicos. El análisis funcional, básica-
mente derivado de la evaluación previa al tratamiento, es un modelo conceptual que
resume la información sobre los factores situacionales y conductuales que controlan
varios aspectos topográficos? de las conductas en cuestión. A su vez, esta informa-
ción puede emplearse para diseñar una intervención que altere la topografía de las
conductas analizadas modificando los factores determinantes. De este modo, el aná-
lisis funcional es uno de los mayores determinantes de los tratamientos conductuales
1diográficos (Evans, 1985; Kanfer, 1985; Nelson y Hayes, 1986; Nelson, 1988; Hay-
nes y O'Brien, 1990; Haynes, 1992; Krasner, 1992).
Aunque se reconoce generalmente que el análisis funcional es un componente
importante del diseño del tratamiento, parece que los analistas de conducta lo reali-
zan con poca frecuencia. En una revisión de 127 estudios de evaluación y tratamien-
to de trastornos de conducta N= 1 publicados entre 1985 y 1987 en prestigiosas re-
vistas conductuales (Behavioral Assessment, Behavior Modification, Behaviour
Research and Therapy, Behavior Therapy y Journal of Applied Behavior Analysis),
Haynes y O'Brien (1990) encontraron que sólo el 20,5% reflejaba haber usado aná-
lisis funcionales para orientar su diseño de tratamiento. Una segunda revisión de es-
tas publicaciones entre los años 1990 a 1992 (otros 132 estudios de caso) mostró que
el uso del análisis funcional previo al tratamiento descendió a un 18% ?. Estos por-
centajes, aunque bajos, son significativamente mayores que el 6% indicado por
Singh y cols. (1991) en su revisión de 17 estudios de intervención conductual en es-
tudiantes con trastornos emocionales. Por ello, es razonable suponer que sólo unas
pocas de las mejor diseñadas intervenciones conductuales emplean análisis funcio-
nales para guiar el diseño del tratamiento, y que no hay pruebas acerca de una ten-
dencia de aumento de su uso a pesar de la reiterada recomendación por parte de los
autores conductuales. A A da
Hay muchas explicaciones posibles de la escasa realización de análisis funciona-
les por parte de los analistas de conducta. En nuestra opinión existen dos motivos
University of Bowling Green Ohio (EE UU) y University of Hawai (EE UU). UA
1 “Analista de conducta” es el término general referido al investigador o persona en ejercicio que se
dedica al estudio y tratamiento de los trastornos de conducta.
2 “Topografía” se refiere a la forma de la conducta en cuestión. ;
3 Los autores desean agradecer los esfuerzos de Rachel Cheyne y James Toth por su completa revi-
sión bibliográfica.
+94 William H. O'Brien y Stephen N. Haynes
Debido a este uso ambiguo del término, hace poco que propusimos que el análi-
sis funcional fuera definido formalmente como «la identificación de relaciones fun-
cionales causales, controlables e importantes aplicables a un conjunto específico de
conductas de un paciente individual» (Haynes y O'Brien, 1990, p. 654). Esta defini-
ción de análisis funcional lleva consigo varios aspectos implícitos y explícitos. En
primer lugar, una relación funcional implica sólo que una fórmula matemática (por
ejemplo, y = a + bx + e) puede describir la asociación entre dos o más variables (Bla-
lock, 1964, 1969; James, Mulaik y Brett, 1982; Haynes, 1992). En la mayoría de las
aplicaciones de la evaluación conductual, la presencia de una relación funcional se
basa en una observación de covariación y/o elevada probabilidad condicional (Ar-
kes, 1981). Algunas de estas relaciones funcionales son causales mientras que otras
están estrictamente correlacionadas.
Un análisis funcional que haga énfasis en las relaciones funcionales causales ge-
nera información de total relevancia para el diseño del tratamiento (Haynes y
O'Brien, 1990; Haynes, 1992). Esto se debe a que las conductas con distintas topo-
grafías pueden estar controladas por distintos factores causales. Por ejemplo, las esti-
maciones subjetivas de dolor y depresión de un paciente pueden correlacionarse con
fiabilidad. No obstante, la correlación estre estas conductas de distinta topografía
puede deberse a factores causales comunes tales como niveles reducidos de actividad
y refuerzo social de “conducta de dolor” (por ejemplo, hacer muecas, expresiones
frecuentes de estados negativos físicos y emocionales, posturas...). En este caso, un
tratamiento diseñado para reducir el dolor consistente en la modificación de la de-
presión subjetiva no sería tan eficaz como otro que modifique los niveles de activi-
dad y reorganice las contingencias del refuerzo (Feurstein, Labbe y Kuczmierczyk,
1986). Alternativamente, una única conducta como la reactividad cardiovascular
puede estar asociada a sucesos determinantes de mala adaptación en ciertas ocasio-
nes (por ejemplo, exposición a factores de estrés) y sucesos determinantes de adapta-
Análisis funcional de la conducta
497
Las conductas y sus factores determinantes son los dos conjuntos más importantes
de variables que se incluyen en los análisis funcionales. En una descripción topográ-
fica, el analista produce organizaciones precisas y cuantificables de conductas y fac-
tores determinantes. La evaluación y organización precisa de la topografía de estas
variables es el primer paso hacia la identificación y cuantificación de las relaciones
causales funcionales (Blalock, 1964, 1969; Cook y Campbell, 1979; James y cols.,
1982). En esta sección se revisarán las principales dimensiones topográficas de los
trastornos de conducta y sus factores determinantes.
Tras realizar una descripción topográfica de las conductas y los factores determinan-
tes, el analista de conducta ha de tratar de identificar la presencia y grado de relacio-
nes funcionales causales. Como se observa en la figura 21.1, existen al menos 126
modos en los que los factores determinantes y las conductas interactúan. Es alta-
mente improbable que el analista de conducta pueda evaluar sistemáticamente todas
las interacciones posibles e incorporarlas a un análisis funcional. De este modo, las
decisiones apriorísticas deben tomarse considerando cuáles de las interacciones po-
tenciales tienden a ser más importantes, controlables y causales. Estas decisiones ini-
ciales son análogas al concepto de «presuposiciones del campo causal» descritas por
Einhorn (1988).
Las presuposiciones causales empleadas por los analistas de conducta para redu-
cir la complejidad de los datos de la evaluación han sido poco investigadas y, por tan-
to, poco comprendidas (Hayes y Follette, 1992; Krasner, 1992). No obstante, hay al
menos dos fuentes de influencia en estos procesos de decisión. En primer lugar, el
entrenamiento del analista y su experiencia clínica, esto es, la historia del refuerzo en
ambientes clínicos, ejercerán influencia en los tipos de variables que se incorporan
en el análisis funcional (Hayes y Follette, 1992). Por ejemplo, un analista de conduc-
ta con entrenamiento y experiencia en evaluación psicopatológica puede presuponer
que los síntomas de ansiedad de un paciente están causados con una mayor probabi-
Análisis funcional de la conducta
501
FIGURA 21.1. Modelo de interacciones potenciales entre las distintas dimens
iones topográfi-
cas de las variables determinantes y conductas
[99]
[UY]
5 Motora
= .
=||5
E _Afectiva/
E [pa Fisiológica
=
y Ez
Z A
Nivel de reducción
Y Cognitiva/ Variabilidad
En Verbal
Nivel de cambio
ge ea
F
Sl Ade Intervalo entre
2 É A ODAna respuestas / estímulos
Es os
> Física
dolo ió
Duración
O humana .
E Ml $ Frecuencia
ES Física/
2 =)
E ¡
Inanimada a
Magnitud
emplear la literatura publicada para guiar parcialmente sus decisiones sobre qué va-
riables deben organizarse e incorporarse en un análisis funcional. ura.
Mientras que las presuposiciones en el campo causal son necesarias para simplifi-
car una tarea de evaluación extraordinariamente compleja, los analistas de conducta
deben evitar desarrollar un conjunto demasiado estrecho o inflexible de presupues-
tos porque las búsquedas inadecuadas de relaciones causales o los análisis funciona-
les incorrectos son más probables en estas condiciones. Se recomienda entonces una
serie de precauciones. Primero, es importante que los analistas de conducta evalúen
de forma rutinaria sus conductas de evaluación (por ejemplo, revisar cintas de audio
y vídeo) y guarden los datos sobre la exactitud y utilidad para el tratamiento de sus
predicciones y decisiones clínicas (Arkes, 1981; Garb, 1989); segundo, los analistas
de conducta deben discutir con frecuencia los casos con los colegas y supervisores
para obtener puntos de vista alternativos; tercero, se recomienda la lectura de la lite-
ratura sobre el tema; y, finalmente, los analistas de conducta deben actualizar regu-
larmente su conocimiento de la literatura sobre la investigación clínica y realizar in-
vestigaciones, asistir a convenciones, congresos y talleres.
la conducta observada (por ejemplo, frecuencia o magnitud) junto con uno o más
factores del entorno que se crea que ejercen una influencia causal en la conducta
(Bornstein, Hamilton y Bornstein, 1986). Alternativamente, la observación directa
de la interacción puede ser realizada por observadores entrenados u observadores
que participen en situaciones naturales (por ejemplo, la casa del paciente, su lugar de
trabajo...) y/o situaciones análogas (por ejemplo, el despacho del terapeuta, el labo-
ratorio...) (Foster y Cone, 1986; Foster y cols., 1988; Hartman y Wood, 1990).
Los métodos de autorregistro y observación directa pueden proporcionar datos
que permitan sólidas inferencia causales (Saris y Stronkhorst, 1984; Gottman y Roy,
1990). Sin embargo, estas técnicas tienen dos limitaciones prácticas; primero, los pa-
cientes u observadores han de entrenarse bien para que registren las conductas y fac-
tores determinantes con precisión y fiabilidad; y, segundo, a medida que aumenta el
número y/o complejidad de las variables observadas, la exactitud y fiabilidad suele
disminuir (Paul, 19864, 1986b; Foster, Bell Dolan y Burge, 1988; Hartmann y
Wood, 1990). En conjunto, estas limitaciones sugieren que los métodos de observa-
ción sistemática son más apropiados para situaciones en las que la conducta y varia-
bles determinantes son pocas y fácilmente cuantificables.
CUADRO 21.1. Datos hipotéticos de autorregistro evaluando la relación entre nivel de activi-
dad física y presión sanguínea.
Día de observación Nivel de actividad (M/P) Presión sanguínea (H/N)
Lunes 1
Martes 2 > s
Miércoles 3 M N
Jueves 4 E H
Viernes :S) M H
Sábado 6 E H
Domingo 7 M H
Lunes 8 M N
Martes 9 M N
Miércoles 10 M H
Jueves 11 P H
Viernes 12 R N
Sábado 13 M H
Domingo 14 M N
Lunes 15 M H
Martes 16 P N
Miércoles 17 M H
Jueves 18 M N
Viernes 19 P H
Sábado 20 M H
Domingo 21 M H
Lunes ES M N
Martes 23 Pp H
Miércoles 24 M H
Jueves 25 a H
Viernes 26 M H
Sábado 27 Ea H
Domingo 28 M H
Lunes 29 M de
Martes 30 M 4
Miércoles 31 e E
Jueves 32 M E
Viernes 33 M y
Sábado 34 y hi
Domingo 35 M +
Lunes
SAA
36 A
M: mucho nivel de actividad; P: poco nivel de actividad; H: hipertenso, N: normotenso.
puede resultar muy útil para generar hipótesis; y, tercero, los procesos de juicio hu-
mano pueden ser buenos para discernir patrones de relaciones complejas cuando se
proporcionan reglas de toma de decisiones (Meehl, 1986; Nezu y Nezu, 1989). Sin
embargo, una importante limitación del juicio clínico está relacionada con la estima-
ción errónea de la covariación (Arkes, 1981; Kleinmuntz, 1990; Matyas y Green-
wood, 1990). Consideremos los datos de autorregistro hipotéticos del cuadro 21.1;
en este ejemplo, el paciente registra sólo dos niveles de actividad física diaria (M = mu-
cha actividad, P =poca actividad) y presión sanguínea (H = nivel hipertenso, N = ni-
vel normotenso). Estime intuitivamente la magnitud de la relación entre actividad fí-
sica y presión sanguínea (emplee una escala de O = sin relación a 10 = correlación
perfecta). ¿Hasta qué grado está seguro de su estimación (emplee una escala de
0 = sin seguridad, a 10 = seguridad absoluta)?
Elaborando una tabla de 2 x 2 de contingencia de los datos del registro (véase
cuadro 21.2), se puede determinar fácilmente que la probabilidad (P) de obtener un
nivel de presión sanguínea hipertenso en un día de mucha actividad [P (H:M)] es
0,67. Igualmente, la probabilidad de obtener un nivel de presión sanguínea hiperten-
so en un día de poca actividad [P (H:E)] es 0,67; entonces, la relación entre actividad
física y nivel de presión sanguínea es cero: no se relacionan estadísticamente.
CUADRO 21.2. Tabla de contingencia de dos direcciones entre nivel de actividad física y pre-
sión sanguínea
H N
M 16 8
Actividad (16) (8)
P 8 4
Nota: Los números entre paréntesis son las frecuencias esperadas de las casillas dada la inexistencia de
relación entre estrés e hipertensión.
M: mucha; P: poca; H: hipertenso; N: normotenso.
Probabilidades condicionales: probabilidad de presión sanguínea alta con mucha actividad
[P (H:M)] = 16/24=0,67; probabilidad de presión sanguínea alta con poca actividad [P (H:P)] = 8/12 =0,67;
probabilidad de presión sanguínea normal con mucha actividad [P (N:M)] = 8/24 = 0,33; probabilidad
de presión sanguínea normal con poca actividad [P (N:P)] =4/12=0,33
Análisis de Chi-cuadrado:
Chi-cuadrado: 0,00; D.F.: 1; Significación: 1,00.
casos en los que la variable causal y el efecto hipotético ocurren o [P (H:M)] son so-
brevalorados en una toma de decisiones intuitiva relativa a descartar información
como los falsos positivos [P (N:M)] o fallos [P (H:E)].
Se ha identificado otra serie de prejuicios o limitaciones del juicio humano
(Chapman y Chapman, 1969; Einhorn, 1988; Elstein, 1988; Kanfer y Schefft, 1988;
Kleinmuntz, 1990; West, Finney y Ollendick, 1992). No obstante, un resultado es-
pecialmente problemático es que la confianza de un analista en sus juicios de cova-
ración aumenta con la experiencia, mientras que la exactitud permanece casi igual
(Arkes, 1981; Garb, 1989).
En conclusión, los enfoques intuitivos de evaluación de datos pueden ser ade-
cuados y útiles para formular hipótesis. Sin embargo, surgen problemas cuando los
analistas tratan de estimar intuitivamente la magnitud de la covariación entre las va-
riables determinantes hipotéticas y las conductas. Este problema se agrava cuando al
considerar el hecho de que en una evaluación conductual normal se encuentran con-
ductas múltiples, causas múltiples e interacciones múltiples. Por ello, es recomenda-
ble la realización de pruebas estadísticas siempre que sea posible para evaluar la soli-
dez de las relaciones funcionales causales hipotéticas.
Presente 8 2 1 5
(5) (5) (5) (5)
Conducta
Ausente 2 8 5 5
(5) 5555 55
(5) ———————— (5) A _
(5)
___———————
e
Nota: Los números entre paréntesis son los valores esperados de la casilla dado que no hay relación en-
tre la conducta y la consecuencia.
secuencia, los analistas han de ser capaces de identificar y evaluar muchas relaciones
funcionales entre factores determinantes y conductas. Parte de la habilidad para reali-
zar esta tarea se basa en un buen conocimiento de las distintas dimensiones de la topo-
grafía que pueden ser cuantificadas, de las formas múltiples en que las variables deter-
minantes y conductas interactúan en un trastorno de conducta, y de los presupuestos
y estrategias de decisión propias empleadas para determinar los campos causales.
Además del conocimiento, para identificar empíricamente las relaciones funcio-
nales causales han de emplearse métodos de evaluación específicos como la estrate-
gia de variables distintivas, aplicación combinada de distintos procedimientos de
evaluación conductual, observación y autorregistro de interacciones en entornos na-
turales, y controles experimentales. Cada método tiene ventajas y limitaciones rela-
cionadas con la solidez de las inferencias causales derivadas de los datos y del grado
de aplicación clínica. En general, los métodos que permiten inferencias causales más
sólidas (observación y autorregistro de interacciones y control experimental) son
costosos y limitados en su aplicación. Por el contrario, los métodos menos costosos
y de mayor aplicación (estrategias de variables distintivas y aplicación combinada de
distintos procedimientos de evaluación) tienden a permitir sólo inferencias causales
débiles. De este modo, al principio del proceso de evaluación previo al tratamiento,
el uso de estos últimos puede ser más apropiado. Más tarde, tras concretar el espec-
tro de relaciones funcionales causales hipotéticas, se recomiendan las estrategias de
evaluación que permiten relaciones causales más seguras. Una vez que se han obte-
nido los datos básicos de evaluación de las relaciones funcionales causales hipotéti-
cas, se pueden emplear procedimientos intuitivos y estadísticos para evaluar la mag-
nitud de la asociación. Los enfoques intuitivos son más apropiados para la
formulación de hipótesis, si bien la intuición humana es a menudo inexacta como
método para estimar la magnitud de la covariación entre variables. Por el contrario,
los enfoques estadísticos pueden proporcionar información sin prejuicios sobre la
seguridad de la relación funcional. Los análisis de probabilidad condicional pueden
ser particularmente útiles ya que sólo requieren una pequeña cantidad de datos, y se
entienden y se aplican fácilmente.
ticos funcionales (Haynes, 1988, 1992; Haynes y O'Brien, 1990). Los modelos cau-
sales analíticos funcionales son diagramas de vectores que representan las relaciones
causales, controlables e importantes entre los distintos grupos de factores determi-
nantes y conductas para un paciente (Haynes, 1988; Haynes y O'Brien, 1990). La fi-
gura 21.2 es un ejemplo de modelo causal de un paciente que buscaba tratamiento
conductual para síntomas hemiparéticos (parálisis parcial de un brazo) acentuados
por el estrés.
FIGURA 21.2. Modelo causal analítico funcional de un paciente que presenta síntomas hemi-
paréticos en un brazo. Dimensiones topográficas de las variables determinan-
tes y conductas
Daños en
el sistema
nervioso
seal Activación
p del SNS
Tensión /
disfunción
creciente
del brazo
"Situaciones estresantes"
Autorregistro
reducido de
Encuentros sociales conducta y
y tareas difíciles pensamientos
Autocríticas
negativas
Relación causal
unidireccional
—» Relación causal
bidireccional
Relación de
correlación
Relación débil
Relación fuerte
particular, se observó que cuando el cliente discutía temas “estresantes” (por ejem-
plo, encuentros sociales embarazosos) su cara se sonrojaba, su conversación se hacía
tangencial, su mano se cerraba y su brazo se cerraba sobre su pecho. El paciente tam-
bién decía que cuando se “estresaba” tendía a “perder el hilo” de sus pensamientos y
a “olvidar” el control de su mano y brazo afectados.
Tras completar la entrevista, se dieron instrucciones al paciente para que autorre-
gistrara la tensión/disfunción del brazo, los niveles de estrés y los sentimientos agra-
dables en una escala de O a 10 cuatro veces al día. Asimismo, el paciente registraba su-
cesos de la situación externa e interna que ocurrían antes, durante y después de un
aumento significativo de la tensión/disfunción del brazo. “Tras dos semanas se eva-
luaron los datos del autorregistro con análisis de probabilidad condicional (véase
cuadro 21.4). Los resultados de este análisis indicaban que la tensión/disfunción del
brazo estaba asociada significativamente con los niveles de estrés registrados. El pa-
ciente también recogía en el impreso de autorregistro que las tareas difíciles, interac-
ciones sociales y autocríticas (por ejemplo, anticipar el rechazo social o fracaso en ta-
reas importantes) se asociaban a los mayores niveles de estrés y tensión/disfunción
del brazo.
CUADRO 21.4. Tabla de contingencia en dos direcciones entre nivel de estrés y síntomas he-
miparéticos
mucha poca
elevado 23 3 26
(18) (8)
Nivel de estrés
reducido 6 6 12
(8) (4)
26 12
Nota: Los números entre paréntesis son las frecuencias esperadas de las casillas dado que no hay relación
entre estrés e hipertensión.
Probabilidad condicional: Probabilidad de mayor disfunción dado estrés elevado = 23/26 = 0,88; proba-
bilidad de mayor disfunción dado estrés reducido = 6/12 =0,50; probabilidad de menor disfunción dado
estrés elevado = 3/26 = 0,12; probabilidad de menor disfunción dado estrés reducido = 6/12 = 0,50.
Las medidas de la actividad del SNS (tasa cardíaca, conductancia de la piel y am-
plitud del pulso del volumen sanguíneo) y niveles de tensión muscular se obtuvieron
en un laboratorio de psicofisiología bajo las siguientes condiciones: línea base en re-
poso, globo hinchable (factor de estrés físico), globo que estallaba (sobresalto), sus-
tracción seriada (tarea difícil) e imágenes controladas de interacciones sociales gene-
radoras de ansiedad. Un examen visual de los datos psicofisiológicos indicaba que
los niveles de tensión muscular del brazo afectado eran significativamente mayores y
más variables durante las condiciones de estrés e imágenes negativas. Un análisis de
probabilidad condicional de estos datos confirmó la presencia de una relación esta-
dísticamente significativa entre la presentación de factores de estrés en laboratorio y
el aumento de la activación de las medidas fisiológicas.
Se diseñó un tratamiento para el paciente basado en el modelo causal analítico
funcional. Utilizando el principio de «variación compartida» (Haynes, 1986), se se-
leccionó para modificación el subgrupo de relaciones funcionales que se consideraba
responsable de la mayor variación en la conducta. En este caso, las relaciones funcio-
nales entre niveles de tensión muscular, actividad del sistema nervioso simpático,
conciencia de la tensión/posición del brazo y autocríticas negativas fueron el objeto
del cambio. La intervención consistió en biorretroalimentación de tensión muscular
(para facilitar la conciencia de la tensión del brazo), entrenamiento de relajación
(para mejorar el control de la activación del sistema nervioso simpático), y entrena-
miento en autoinstrucción (encaminado a reducir la frecuencia y “credibilidad” de
las autocríticas negativas).
VI. CONCLUSIONES
REFERENCIAS BIBLIOGRÁFICAS
Arkes, H. R. (1981). Impediments to accurate clinical judgement and possible ways to mini-
mize their impact. Journal of Consulting and Clinical Psychology, 49, 323-330.
Axelrod, S. (1987). Functional and structural analyses of behavior: Approaches leading to the
reduced use of punishement procedures? Research in Developmental Disabilities, 8, 165-
178.
Bandura, A. (1981). In search of pure unidirectional determinants. Behavior Therapy, 12, 30-
40.
Barker, R. G. (1968). Ecological psychology: Concepts and methods for studying the environ-
ment of human behavior. Stanford. Stanford University Press.
Barlow, D. H. (1988). Anxtety and its disorders. Nueva York. Guilford.
Análisis funcional de la conducta 517
Barlow, D. H., Hayes, S. C. y Nelson, R. O. (1984). The scientist practitioner: Research and
accountability in clinical and educational settings. Nueva York. Pergamon Press.
Barlow, D. H, y Hersen, M. (1984). Single case experimental designs: Strategies for studying
behavior change (2 ed.). Nueva York. Pergamon Press.
Barrios, B. (1988). On the changing nature of behavioral assessment. En A. S. Bellack y
m0 Hersen (dirs.), Behavioral assessment: A practical handbook. Nueva York. Pergamon
ress.
Beach, S., Sandeen, E. y O'Leary, K. D. (1990). Depression in marriage. Nueva York. Guil-
ford Press.
Bellack, A. S. y Hersen, M. (1988). Behavioral assessment: A practical handbook. Nueva
York. Pergamon Press.
Blalock, H. M. (1964). Causal inferences in nonexperimental research. Chapel Hill. Univer-
sity of North Carolina Press.
Blalock, H. M. (1969). Theory construction: From verbal to mathematical formulations. En-
glewood Cliffs. Prentice-Hall.
Bornstein, P. H., Hamilton, S. B. y Bornstein, M. T. (1986). Self-monitoring procedures. En
A. R. Ciminero, C. S. Calhoun y H. E. Adams (dirs.), Handbook of behavioral assessment
(2.* ed). Nueva York. Wiley.
Bornstein, D. A., Borkovec, T. D. y Coles, M. G. H. (1986). Assessment of anxiety. En A. R. Cimi-
nero, C. S. Calhoun y H. E. Adams (dirs.), Handbook of behavioral assessment. Nueva
York. John Wiley and Sons.
Burish, T. G., Carey, M. P., Krozely, M. G. y Greco, F. A. (1987). Conditioned side effects
induced by cancer chemotherapy: Prevention through behavioral treatment. Journal of
Consulting and Clinical Psychology, 55, 42-48.
Carey, M. P. y Burish, T. G. (1988). Etiology and treatment of the psychological side effects
associated with cancer chemotherapy. Psychological Bulletin, 104, 307-325.
Carr, E. G. y Durand, V. M. (1985). Reducing behavior problems through functional com-
munication training. Journal ofApplied Bolado Analysis, 18, 111-126.
Chapman, L. J. y Chapman, J. P. (1969). Illusory correlation as an obstacle to the use of valid
psychodiagnostic signs. Journal of Abnormal Psychology, 74, 271-280.
Ciminero, A. R., Calhoun, C. S. y Adams, H. E. (1986). Handbook of behavioral assessment.
Nueva York. John Wiley and Sons.
Clark, D. M., Salkovskis, P. M. y Chalkey, A. J. (1985). Respiratory control as a treatment for
panic attacks. Journal of Behavior Therapy and Experimental Psychiatry, 16, 23-30.
Cone, J. D. (1988). Psychometric considerations and the multiple models of behavioral as-
sessment. En A. S. Bellack y M. Hersen (dirs.), Behavioral assessment: A practical hand-
book. (3.? ed). Nueva York. Pergamon Press.
Cook, T. D. y Campbell, D. T. (1979). Quasi-experimentation: Design and analysis issues for
field settings. Chicago. Rand McNally.
Correa, E. 1. y Sutker, P. B. (1986). Assessment of alcohol and drug behaviors. En A. R. Ci-
minero, K. S. Calhoun y H. E. Adams (dirs.), Handbook of behavioral assessment
(2.* ed.). Nueva York. John Wiley and Sons.
Cowdery, G. E., Iwata, B. A. y Pace, G. M. (1990). Effects and side effects of DRO as a treat-
ment for self-injurious behavior. Journal ofApplied Behavior Analysis, 23, 497-506.
Craighead, W. E., Kazdin, A. E. y Mahoney, M. ]. (1981). Behavior modification: Principles,
issues, and applications (2.* ed.). Boston. Houghton Mifflin. de RAN
Delprato, D. J. y McGlynn, F. D. (1988). Interactions of response patterns and their implica-
tions for behavior therapy. Journal of Behavior Therapy and Experimental Psychiatry, 19,
199-205.
Delprato, D. J. y Midgley, B. D. (1992). Some fundamentals of B. F. Skinner's behaviorism.
American Psychologist, 47, 1507-1520. á.
Durand, V. M. y Carr, E. G. (1991). Functional communication training to reduce challen-
518 William H. O'Brien y Stephen N. Haynes
sing behavior: Maintenance and application in new settings. Journal ofApplied Behavior
Analysis, 24, 251-264. 1 mx LO
Durand, V. M. y Crimmins, D. (1988). pi the variables maintaining self-injurious
behavior. Journal ofAutism and Developmental Disorders, 18, 99-117.
Einhorn, H. J. (1988). Diagnosis and causality in clinical and statistical prediction. En D. C. Turk
y P. Salovey (dirs.), Reasoning, inference, and judgment in clinical psychology. Nueva York.
The Free Press. Pa :
Elstein, A. S. (1988). Cognitive processes in clinical inference and decision making. En
D. C. Turk y P. Salovey (dirs.), Reasoning, inference, and judgment in clinical psychology.
Nueva York. The Free Press. loc lod
Evans, IL. M. (1985). Building systems models as a strategy for target behavior selection in cli-
nical assessment. Behavioral Assessment, 7, 21-32. :
Eysenck, H. J. (1988). Psychotherapy to behavior therapy: A paradigm shift. En D. B. Fish-
man, F. Rotgers, C. M. Franks (dirs.), Paradigms in behavior therapy: Present and promi-
se. Nueva York. Springer.
Feurstein, M., Labbe, E. E. y Kuczmierczyk, A. R. (1986). Health psychology: A psychobiolo-
gical perspective. Nueva York. Plenum Press.
Foster, S. L., Bell-Dolan, D. J. y Burge, D. A. (1988). Behavioral observation. En A. S. Be-
llack y M. Hersen (dirs.), Behavioral assessment: A practical handbook (3.* ed). Elmstord.
Pergamon Press.
Foster, S. L. y Cone, J. D. (1986). Design and use of direct observation systems. En A. R. Ci-
minero, C. S. Calhoun y H. E. Adams (dirs.), Handbook of behavioral assessment.
(2. ed.). Nueva York. Wiley.
Fredrikson, M. y Matthews, K. A. (1990). Cardiovascular responses to behavioral stress and
hypertension: A meta-analytic review. Annals of Behavioral Medicine, 12, 30-39.
Garb, H. N. (1989). Clinical judgement, clinical training, and professional experience. Psy-
chological Bulletin, 105, 387-396.
Goodwin, F. K. y Jamison, K. R. (1990). Manic-depressive illness. Nueva York. Oxford Uni-
versity Press.
Gottman, J. M. y Roy, A. K. (1990). Sequential analysis: A guide for behavioral researchers.
Nueva York. Cambridge Press.
Guevremont, D. C. y Spiegler, M. D. (1990). What do behavior trerapists really do? A survey
of the clinical practice of AABT members. Comunicación presentada al 24th Annual Con-
vention of the Association for Advancement of Behavior Therapy. San Francisco, EE UU.
Gump, P. V. (1977). Ecological psychologists: Critics or contributors to behavior analysis.
En A. Rogers-Warren y S. F. Warren (dirs.), Ecological perspectives in behavior analysis.
Baltimore. University Park Press.
Hartmann, D., Gottman, J., Jones, R., Gardner, W., Kazdin, A. y Vaught, R. (1980). Inte-
rrupted time-series analysis and its application to behavioral data. Journal of Applied Be-
havior Analysis, 13, 543-559,
Hartmann, D. P. y Wood, D. D. (1990). Observational methods. En A. S. Bellack, M. Hersen
y A. E. Kazdin (dirs.), International handbook of behavior modification and therapy
(2.* ed.). Nueva York. Plenum Press.
Hawkins, R. P. (1986). Selection of target behaviors. En R. O. Nelson y S. C. Hayes (dirs.),
Conceptual foundations of behavioral assessment. Nueva York. Guilford Press.
Hayes, S. C. y Follette, W. C. (1992). Can functional analysis provide a substitute for syn-
dromal classification? Behavioral Assessment, 14, 345-365.
Hayes, S. C., Nelson, R. O. y Jarret, R. B. (1987). The treatment utility of assessment: A
functional approach to evaluate assessment quality. American Psychologist, 42, 963-974.
Haynes, S. N. (1978). Principles of behavioral assessment. Nueva York. Gardner Press.
Haynes, S. N. (1986). The design of intervention programs. En R. O. Nelson y S. C. Hayes
(dirs.), Conceptual foundations of behavioral assessment. Nueva York. Guilford Press.
Inálisis funcional de la conducta 519
Levey, A. B., Aldaz, J. A., Watts, F. N. y Coyle, K. (1991). Articulatory suppression and the
treatment of insomnia. Behaviour Research and Therapy, 29, 85-89.
Maisto, S. A. (1985). Behavioral formulation of cases involving alcohol abuse. En IL. D. Turkat
(dir.), Behavioral case formulation. Nueva York. Plenum Press.
Mash, E. J. y Hunsley, J. (1990). Behavioral assessment: Á contemporary app roach. En A.S. Be-
llack y M. Hersén (dirs.), International handbook of behavior modification and therapy
(2 ed). Nueva York. Plenum Press. |
Matyas, T. A. y Greenwood, K. M. (1990). Visual analysis of single-case time series: Effects
of variability, serial dependence, and magnitude of intervention effect. Journal of Applied
Behavior Analysis, 23, 341-351. : Wat
Matyas, T. A. y Greenwood, K. M. (1991). Problems in the estimation of autocorrelation in
brief time series and some implications for behavioral data. Behavioral Assessment, 13,
137-157.
McCleary, R. y Hay, R. (1980). Applied time series analysis for the social sciences. Beverly
Hills. Sage.
Meehl, P. (1986). The causes and effects of my disturbing little book. Journal of Personality
Assessment, 50, 370-375.
Miller, D. J. (1991). Simple phobia as a symptom of posttraumatic stress disorder in a former
prisoner of war. Behavior Modification, 15, 250-260.
Morrison, R. L. (1990). Interpersonal dysfunction. En A. S. Bellack y M. Hersen (dirs.), In-
ternational handbook of behavior modification and therapy. Nueva York. Plenum Press.
Nelson, R. O. (1988). Relationships between assessment and treatment within a behavioral
perspective. Journal of Psychopathology and Behavioral Assessment, 10, 155-169.
Nelson, R. O. y Hayes, S. C. (1986). The nature of behavioral assessment. En R. O. Nelson y
S. C. Hayes (dirs.), Conceptual foundations of behavioral assessment. Nueva York. Guil-
ford Press.
Nezu, A. M. y Nezu, C. M. (1989). Clinical decision making in behavior therapy: A problem
solving perspective. Champaign. Research Press.
O”Brien, W. H. y Haynes, S. N. (1996). Behavioral assessment in the psychiatric setting. En
A.S. Bellack y M. Hersen (dirs.), Handbook of behavior therapy in the psychiatric setting.
Nueva York: Plenum Press.
Paul, G. L. (19864). Assessment in residential settings: Principles and methods to support cost-
effective quality operations. Champaign. Research Press.
Paul, G. L. (1986b). The time sample behavioral checklist: Observational assessment instru-
mentation for service and research. Champaign. Research Press.
Peterson, L., Homer, A. L. y Wonderlich, S. A. (1982). The integrity of independent varia-
bles in behavior analysis. Journal of Applied Behavior Analysis, 15, 477-492.
Pickering, G. T. y Gerin, W. (1990). Cardiovascular reactivity in the laboratory and the role
of behavioral factors in hypertension: A critical review. Annals of Behavioral Medicine,
123-163
Saris, W. E. y Stronkhorst, L. H. (1984). Causal modeling in nonexperimental research: An
introduction to the LISREL approach. Amsterdam. Sociometric Research Foundation.
Schlundt, D. G. (1985). An observational methodology for functional analysis. Bulletin for
the Society of Psychologists in Addictive Behaviors, 4, 234-249.
Schlundt, D. G. y Donahoe, C. P. (1983). Testing for independence between pairs of autoco-
rrelated binomial data sequences. Journal of Behavioral Assessment, 5, 309-316.
Schoggen, P. (1989). Behavior settings: A revision and extension of Roger G. Barker's ecologi-
cal psychology. Stanford. Stanford University Press.
Schwartz, G. E. (1986). Emotion and psychophysiological organization: Á systems approach.
En M. G. H. Coles, E. Donchin y S. W. Porges (dirs.), Psychophysiology: systems, processes,
and applications. Nueva York. Guilford Press.
Scott, $. P. (1978). Critical periods. Stroudsburg. Dowden, Hutchinson y Ross.
Análisis funcional de la conducta 521
Singh, N. N., Deitz, D. D., Epstein, M. H. y Singh, J. (1991). Social behavior of students who
are seriously emotionally disturbed: A quantitative analysis of intervention studies. Beha-
vior Modification, 15, 74-94.
Smith, R. G., Iwata, B. G., Vollmer,T.R. y Pace, G. M. (1992). On the relationship between
a behavior and self-restraint. Journal of Applied Behavior Analysis, 25, 433-
0%
Strosahl, K. D. y Linehan, M. M. (1986). Basic issues in behavioral assessment. En A. Cimi-
nero, K. S. Calhoun y H. E. Adams (dirs.), Handbook of behavioral assessment (2.2 ed).
Nueva York. Wiley.
Tavare, S. y Altham, M. E. (1983). Serial dependence in observations leading to contingency
tables, corrections to chi-squared statistics. Biometrika, 70, 139-144.
Taylor, J. C. y Carr, E. G. (1992a). Severe problem behaviors related to social interaction 1:
Attention seeking and social avoidance. Behavior Modification, 16, 305-335.
Taylor, J. C. y Carr, E. G. (1992b). Severe problem behaviors related to social interaction 2: A
systems analysis. Behavior Modification, 16, 336-371.
Turkat, I. D. y Maisto, S. A. (1985). Application of the experimental method to the formula-
tion and modification of personality disorders. En D. H. Barlow (dir.), Clinical handbook
ofpsychological disorders. Nueva York. Guilford.
Voeltz, L. M. y Evans, L M. (1982). The assessment of behavioral interrelationships in child
behavior therapy. Behavioral assessment, 4, 131-165.
Vrana, S. R., Constantine, J. A. y Westman, J. S. (1992). Startle reflex modification as an aut-
come measure in the treatment of phobia: Two case studies. Behavioral Assessment, 14,
279-291.
Wei, W. S. (1990). Time series analysis: Univariate and multivariate methods. Redwood
City. Addison-Wesley.
Weist, M. D., Finney, J. W. y Ollendick, T. H. (1992). Cognitive bias in child behavior the-
rapy. The Behavior Therapist, 15, 249-253.
Willems, E. P. (1977). Steps toward an ecobehavioral technology. En A. Rogers-Warren y
S. F. Warren (dirs.), Ecological perspectives in behavior analysis. Baltimore. University
Park Press.
LECTURAS COMPLEMENTARIAS
| e
pr
$ 5 0% ponnes
1 de _
1 e
; Hez
SA vi >, | TUE EE 2%bi2 a
%
da »
E DUNA
ES DA VITA
E Y DA
r El >
y ) y nie e Mi e ? Ni a. )
A má
) A No q e
, . PA PE oriol e
'
,
n mn y 5 ¿ino HE DUO EZ Ne VE PAS
' va, he Í Y
a) e e; E! La ib)AUT
a d ME. , - , LA YA Y ¿ME po Roj
$ p
*
Ñ pla, o !
pon a
PARUTORA
¿HL MUST >
: de
]
.. q
3
; |
,
E Y
TERCERA PARTE
EVALUACIÓN DE LA INTELIGENCIA
ES
— AOVADIIITVILATAIG MOIDAUJAVS
3 Ñ ] Ñ E A O Ted Y
/ dt PS, e e :
day
22. EVALUACIÓN DE LA INTELIGENCIA GENERAL
Il. INTRODUCCIÓN
Las primeras concepciones de inteligencia, incluso a finales del siglo pasado, hacían
referencia a la capacidad asociada a la discriminación sensorial, al control motor, al
uso de los sentidos, al tiempo de reacción y a la coordinación sensoriomotriz. La ca-
pacidad intelectual del sujeto refleja la destreza y el grado de complejidad asociativa
que el sujeto conseguía desempeñar en esas funciones básicas (Almeida, 1988). Auto-
res formados en la Escuela de Psicología Experimental alemana, apoyándose en esta
concepción de la inteligencia, elaboraron pruebas sensoriales y motoras; es el caso de
Cattell en Estados Unidos y de Galton en Inglaterra; sin duda, son conocidos algu-
nos de los instrumentos usados para la medida de la discriminación de tamaños, pe-
sos y colores.
cación de las diferencias individuales en los múltiples tests. Spearman (1927) defien-
de una perspectiva unitaria de la inteligencia. En su opinión, la inteligencia humana
se debería definir a través de un factor simple subyacente a todo tipo de actividad in-
telectual, responsable de la mayor parte de la varianza encontrada en los tests (fac-
tor g). Acumulativamente, en cada tarea existiría un pequeño factor específico
(factor 5), aunque no sería generalizable a otras tareas (de ahí, que a veces se defina la
teoría de Spearman como la teoría de los dos factores).
Spearman no definió de una forma clara el factor g; éste tendría componentes or-
ganísmicos (energía nerviosa, cortical) y psicológicos. En este último caso el factor
general de inteligencia se describe operacionalmente a través de tres leyes de produc-
ción de conocimiento: adquisición de la experiencia, establecimiento de relaciones y
aplicación de las relaciones inferidas a nuevas situaciones. Por tanto, los tests pro-
puestos para su evaluación deberían tener en cuenta estas tres leyes; de ahí que se aso-
cie el factor g a la información recogida a través de tests de razonamiento con cuestio-
nes analógicas. Progresivamente, tales tests fueron teniendo en cuenta las siguientes
consideraciones: el carácter abstracto de las cuestiones (evitar recurrir al conocimien-
to, el aprendizaje escolar, la cultura y la experiencia del individuo), el formato analó-
gico de las cuestiones (razonamiento inductivo y deductivo) y la novedad de las tareas
(imposibilidad de entrenamiento o de memorización de una evaluación a otra).
El concepto de factor g permanece todavía actualmente en psicología. Tanto las
teorías jerárquicas de la inteligencia (como veremos a continuación) como los traba-
jos experimentales en psicología cognitiva, encuadrados o no en la teoría del proce-
samiento de la información, atribuyen una gran importancia al factor g en la defini-
ción y en la evaluación de la inteligencia. Varios autores recuperaron este concepto
de Spearman en las últimas décadas (Snow, 1980; Sternberg, 1981, Undheim, 1981).
tor general surgen dos factores de gran grupo (factor verbal-educativo y factor per-
ceptivo-mecánico). Descendiendo en la jerarquía de importancia y de generalización
de los factores aislados, siguen factores de pequeño grupo (¿segundo orden?) (próxi-
mos a los factores de Thurstone) y los factores específicos inherentes a cada tarca
(próximos a la noción de factores específicos de Spearman). Cattell (1971) sugiere
que la inteligencia se subdivide en inteligencia fluida (Gf) e inteligencia cristalizada
(Gc). La primera está relacionada con la capacidad mental más básica y asociada al
razonamiento, y la segunda con el aprendizaje y los conocimientos adquiridos por
los sujetos (por ejemplo, tests de vocabulario o de información). Siguiendo la línea
de Vernon (1965), Cattell (1971) defiende la importancia decisiva del factor general
en la descripción de la inteligencia tal como fue definido por Spearman, para quien es
importante asociar los factores de grupo más ligados a los contenidos o a las opera-
ciones cognitivas de los conjuntos más o menos amplios de tareas.
Como conclusión podemos afirmar que los tests de inteligencia general existen-
tes están asociados a diferentes concepciones teóricas y necesidades prácticas de este
constructo psicológico. Así, la primera concepción unitaria y global de la inteligen-
cia como un conjunto de diversas funciones está representada en los tests de Binet,
en sus revisiones y en las escalas de Wechsler. La definición de inteligencia en térmi-
nos de factor g aparece reflejada en las Matrices progresivas de Raven, en el Test de
los dominós de Pichot y en los tests de Cattell. Las teorías multifactoriales de la inte-
ligencia (Thurstone y Guilford) dieron origen a baterías de aptitudes múltiples, las
cuales serán objeto de otro capítulo en este manual. Finalmente, la teoría de la inteli-
gencia fluida e inteligencia cristalizada propuesta por Cattell está presente en el test
K-ABC (Kaufman y Kaufman, 1983); el modelo jerárquico propuesto por Vernon se
encuentra en la cuarta edición de la escala Stanford-Binet (Thorndike, Hagen y Sat-
tler, 1986), donde además de un factor general se apuntan dos factores principales en
función de que las tareas tengan que ver más con conocimientos educativo-verbales
o con las capacidades perceptivo-analíticas de los sujetos.
Si términos como “inteligencia”, “aptitud” y “coeficiente intelectual (C1)” han
sido retirados de los tests, incluso en aquellos a los que estaban tradicionalmente
asociados, y si expresiones como “aptitud escolar” o “aptitud cognitiva” están ocu-
pando su lugar (Reschly, 1990), podemos afirmar que continuamos usando los tests
anteriores y que este cambio refleja una preocupación o intento de una nueva inter-
pretación de los resultados en tales tests. Posiblemente, después de algunos años de
uso, estas nuevas “interpretaciones” puedan llevar a nuevas formas de definir y, so-
bre todo, de evaluar la inteligencia. En nuestra opinión, la evaluación de la inteligen-
cia está separada temporalmente de los avances de la investigación, asumiendo las
formas que en cada momento se presentan como más fiables y relevantes para res-
ponder a las necesidades sociales de la práctica psicológica (diagnóstico de ladefi-
ciencia, selección de personal, orientación escolar y profesional...). Los cambios se
produjeron esencialmente en los nombres de los productos y en las ideas sugeridas
para la interpretación de las puntuaciones. Varios ejemplos ilustran esta concepción.
El w7SC-R, manteniendo el término “inteligencia”, denomina al CI school functio-
ning level (SEL) (nivel de funcionamiento escolar); el Lorge-Thorndike intelligence
test cambió su nombre a Cognitive ability test, y el Ot1s-Lennon mental ability test
pasó a llamarse Otis-Lennon school ability test. En este último caso, el autor preten-
530 Leandro S. Almeida y Gualberto Buela-Casal
Los tests colectivos de inteligencia tienen una larga tradición en los países occidenta-
les; en algunos de ellos estos tests sirvieron a propósitos militares (reclutamiento); en
otros, su uso se centró en el ámbito escolar (clasificación, orientación escolar y pro-
fesional), y en otros se utilizaron para la selección de personal.
Se trata de un test cuyo origen se puede situar en el Army alpha examination. En sus
revisiones sucesivas se construyeron escalas aplicables desde preescolar hasta laedad
adulta. El test constituye una medida del factor g. En preescolar, la evaluación se
534 Leandro S. Almeida y Gualberto Buela-Casal
Se trata de una coversión del W/SC-R para aplicación colectiva, con cuestiones de
elección múltiple. La versión incluye tanto tests verbales (información, compren-
sión, aritmética, semejanza y vocabulario), como manipulativos (código, comple-
mento de imágenes, arreglo de imágenes, composición de imágenes y visualización
espacial). En cuanto a los parámetros psicométricos los valores son parecidos al
WISC-R (Vernon, 1985), encontrándose un coeficiente de correlación de 0,91 entre
las dos escalas (Jackson, 1984).
Se trata de una versión de 1977 del California test of mental maturity (CTMM) (1963).
Su objetivo es evaluar las aptitudes cognitivas de los alumnos en período de enseñan-
za básica y secundaria (téngase en cuenta que el CTMM incluía también la edad prees-
colar). El test incluye cuestiones de vocabulario, analogías, secuencias y memoria,
posibilitando el cálculo de un CI verbal y de un CI no verbal; según Cronbach (1975),
los valores obtenidos en este test parecen más elevados que en otras escalas de CI por
problemas de normalización. Más recientemente, el SFTAA fue objeto de revisión,
dando lugar al Test of cognitive skills.
sa, la evaluación de aptitudes cognitivas, el GRE incluye tres secciones: una sección
verbal (analogías, completar frases y comprensión lectora), una sección cuantitativa
(problemas simples de álgebra y geometría, comparaciones cuantitativas e iterpre-
tación de datos) y una sección de razonamiento analítico (silogismos, anagramas ló-
gicos y abstracción de reglas para grupos de datos relacionados). La consistencia 1n-
terna de los resultados (con una media de 500 y una desviación típica de 100 puntos)
se sitúa en torno a 0,90, y los coeficientes de correlación con las clasificaciones esco-
lares son similares a los del $A7.
Se trata de tests de lápiz y papel que supuestamente evalúan la inteligencia sin la in-
terferencia de factores culturales por medio de figuras abstractas. Las cuestiones, in-
cluyendo series progresivas, clasificación, matrices y descubrimiento de propiedades
comunes, están agrupadas en tres escalas por orden de dificultad. La escala 1 (incluye
ocho subtests) va dirigida a niños de 4 a 8 años, aunque también se usa con sujetos de
más edad pero con retraso cognitivo; la escala 2 se aplica en el período de 8 a 13 años;
y la escala 3 a alumnos de enseñanza secundaria, enseñanza superior y adultos. Más
allá del nombre y del objetivo perseguido con su construcción (se piensa que aunque
estas escalas disminuyen la interferencia de factores culturales, no los elimina), los
coeficientes de correlación con las calificaciones escolares no son muy elevados (en-
tre 0,20 y 0,50). Aunque el manual permite la conversión del resultado en Cl, no es
una prueba muy utilizada, y no parece tener ventajas con respecto a la evaluación to-
mando partes no verbales de otros tests disponibles (Cronbach, 1972).
Evaluación de la inteligencia general
537
«Matrices progresivas de Raven» (Raven, 1941, 1981 ; Raven, Court y Raven, 1985)
Es una versión americana de la Escala de Binet-Simon que tuvo una evolución pro-
pia a lo largo de las diferentes revisiones y actualizaciones. En la actualidad esta es-
cala se usa incluso fuera de Estados Unidos, y lo que la liga a Binet es especialmen-
te el modelo (test compuesto de inteligencia). La primera versión de la Escala
Stanford-Binet aparece en 1916 a través de los trabajos de Terman y colaboradores
(Terman, 1916). En relación a la escala de 1911, los cambios fueron tan grandes que
se podría asumir estar ante un nuevo test (Anastasi, 1988). Una primera revisión la
realizaron en 1937 Terman y Merrill, pasando a disponer de dos formas paralelas
(forma L y forma M) baremadas en una muestra de 3 184 sujetos entre año y medio
y 18 años. En 1960 se realiza una nueva revisión que consiste en una selección de
las mejores cuestiones de las dos formas paralelas anteriores, haciendo una forma
única (Terman y Merrill, 1960). En su revisión más reciente, O sea la cuarta,
(Thorndike, Hagen y Sattler, 1986; Delaney y Hopkins, 1987) se intenta integrar la
escala en un modelo jerárquico de la inteligencia, donde junto a un factor general
de inteligencia (el más importante) se puede hablar de tres factores primarios, tales
como la aptitud cristalizada (razonamiento verbal y razonamiento cuantitativo), la
aptitud fluida o analítica y la memoria a corto plazo. Así, los quince subtests que
componen la escala aparecen agrupados en cuatro áreas cognitivas: aptitud verbal
540 Leandro S. Almeida y Gualberto Buela-Casal
sión de la escala. Los niveles de validez externa de los resultados, aun no siendo tan
elevados como los de la Stanford-Binet, son satisfactorios; este hecho puede expli-
carse por la mayor correlación de estos resultados con el rendimiento escolar que
con el rendimiento profesional, y por la mayor correlación en niños que en adultos.
El análisis factorial de la WA/S-R pemite según Leckliter, Matarazzo y Silverstein
(1986) hablar de un importante factor g, al que sigue un factor verbal (sobre todo en
los subtests de vocabulario, información y comprensión), un factor de organización
perceptiva (cubos y puzzles) y un factor de memoria-atención (memoria, código y
aritmética); este último factor es menos importante y no siempre se encuentra
(Murphy y Davidshofer, 1988).
Wechsler desarrolló dos escalas para la evaluación intelectual de los niños: la Wechs-
ler intelligence scale for children (WISC) y la Wecbsler preschool and primary scale of
intelligence (WPPSI). La primera se aplica especialmente a niños de 6 a 16 años, y la
segunda de los 4 alos 6 años o 6 años y medio.
La WISC se construyó en 1949 y fue revisada en 1974 (WISC-R). La estructura de
la escala, sus fundamentos y procedimientos de utilización son prácticamente simi-
lares a los de la WA7S. Así, la escala está formada por 12 subtests, siendo seis de ellos
verbales (información, semejanzas, aritmética, vocabulario, comprensión y memo-
ria de números) y seis manipulativos (completar figuras, historietas, composición de
objetos, cubos, códigos y laberinto); el subtest de memoria, el de números y el de la-
berinto son opcionales. En la estandarización de 1974 se emplearon 2 200 sujetos,
100 por cada sexo y para cada nivel de edad entre los 6 años y medio y los 16 años y
medio. Además, en el muestreo se tuvo en cuenta la región, el tipo de comunidad y la
profesión del padre; los niños con retraso intelectual o con problemas emocionales
graves se descartaron. El cálculo del CI se realiza únicamente con cinco subtests ver-
bales y cinco subtests manipulativos. Como en la WA/S las puntuaciones brutas se
convierten en puntuaciones estándar (media de 10 y desviación típica de 3 puntos),
las cuales darán lugar al CI verbal, al CI manipulativo y al CI global (media de 100 y
desviación típica de 15 puntos). En el W/SC-R se puede calcular la edad de test del
niño que se aproxima a la edad mental de la Stanford-Binet.
Los coeficientes de fiabilidad de los resultados se sitúan generalmente por enci-
ma del 0,91 para las puntuaciones de Cl; si tomamos los subtests de forma individual
los coeficientes oscilan entre 0,68 y 0,88. En cuanto a la validez, las correlaciones con
la Stanford-Binet sobrepasan el 0,70, y con las calificaciones escolares varían entre
0,50 y 0,60. El análisis factorial de los resultados en los subtests parece confirmar
más allá de un importante factor general, una estructura próxima de división entre
un CI verbal y un CI manipulativo (Kaufman, 1975; Marques, 1975). Los subtests
que menos correlacionan con los CI calculados son la memoria de dígitos, el código
y el laberinto (Marques, 1969). En algunos estudios, más allá de esos dos factores
complementarios aparece otro factor más ligado a las pruebas que requieren una es-
pecial atención (Anastasi, 1988).
La WPPSI se desarrolló en 1968, y es muy similar al W/SC. Su parte verbal incluye
subtests de información, vocabulario, aritmética, semejanzas, comprensión y me-
544 Leandro S. Almeida y Gualberto Buela-Casal
gida a niños entre 2,5 y 12,5 años, la escala considera la división entre inteligencia
fluida (Gf) e inteligencia cristalizada (Gc) propuesta por Cattell (1971) en la organi-
zación de dos secciones: sección de procesamiento mental para la medida de Gf, y
sección de rendimiento para la medida de Gc o conocimiento adquirido.Laprimera
sección se organiza en tests para la evaluación del procesamiento secuencial de infor-
mación (resolución paso a paso) y simultáneo (varias unidades informativas deben
ser consideradas al mismo tiempo). Las escalas de rendimiento evalúan vocabulario,
comprensión lectora, conocimiento general y conocimiento aritmético. La aplica-
ción de la escala es flexible, adecuándose a las características culturales del niño. Por
ejemplo, las primeras cuestiones en cada subtest se deben explicar claramente para
que el niño entienda perfectamente la tarea a realizar. Los subtests permiten calcular
cinco puntuaciones globales (media de 100 y desviación típica de 15 puntos) con una
interpretación cognitiva específica. Así, se obtiene una puntuación de rendimiento o
nivel de inteligencia cristalizada y cuatro puntuaciones de inteligencia fluida: pun-
tuación no verbal para las pruebas en las que no se requiere ningún lenguaje por par-
te del evaluador o del niño, puntuación de procesamiento secuencial de la informa-
ción, puntuación de procesamiento simultáneo de la información y puntuación
compuesta de procesamiento mental (formada por las dos anteriores), y que se iden-
tifica con el nivel de inteligencia fluida del niño. En términos del fundamento teóri-
co, las cuestiones parecen meticulosamente elaboradas y seleccionadas tomando
como referencia el procesamiento cognitivo implicado. Según Anastasi (1988), se
trata de una escala innovadora y con aspectos técnicos de calidad. La consistencia in-
terna de los subtests está en 0,80 y en las puntuaciones globales en torno a 0,90. En
cuanto a la validez externa, sus resultados correlacionan con el W/SC-R en torno a
0,70, y el análisis factorial de los resultados de los subtests corroboran su división en
un procesamiento secuencial frente a un procesamiento simultáneo de información.
En tercer lugar, se pueden hacer algunas consideraciones con respecto a las con-
clusiones obtenidas con estas pruebas. Los resultados de los tests discriminan los in-
dividuos en función de su origen social, dando lugar a un porcentaje más elevado de
sujetos de las minorías étnicas en aulas especiales y en los peores empleos. Según al-
gunos autores, los tests de inteligencia serían únicamente fieles y válidos para indi-
viduos escolarizados de raza blanca (Williams, 1974). La cuestión de la validez nos
parece más pertinente y, en el fondo, consiste en saber si el test evalúa el mismo pará-
metro en diferentes grupos. Los tests, cuyas cuestiones se aproximan o reflejan los
conocimientos y la experiencia escolar, no son socialmente neutros, pues tales aspec-
tos no se encuentran distribuidos de forma igualitaria. Las cuestiones verbales son
las afectadas con más facilidad. Jensen (1980) considera que los tests de lápiz y papel,
al requerir lectura, respuestas escritas, velocidad, contenido verbal y memoria de in-
formación aprendida, son más fácilmente influenciados por los aspectos culturales
que los tests manipulativos, figurativos, de respuestas orales, de contenidos no ver-
bales, potencia y resolución de problemas. Las implicaciones de estas consideracio-
nes pueden conducir a serios problemas. El valor incuestionable de los tests puede
perpetuar medidas socialmente discriminativas. Los profesores pueden intentar ex-
plicar el bajo rendimiento en la escuela de algunos grupos de escolares tomando
como referencia su bajo desempeño en los tests de CI (Mercer, 1973). Al mismo
tiempo, la concepción de que ciertos grupos son superiores y otros inferiores en los
tests de inteligencia puede sugerir una determinación genética en tales diferencias
(Jensen, 1969; Herstein, 1971). La verdad es que uno de los mitos que no puede ser
compartido por los psicólogos, aunque permanezca entre el público, los profesores
y otros profesionales, es que el CI está determinado por factores genéticos, siendo
por eso una buena medida de la inteligencia.
VI. CONCLUSIONES
Alo largo de este capítulo, y más concretamente al presentar algunos de los tests in-
dividuales y colectivos más usados en la investigación y en la práctica clínica, se ha
hecho referencia a los valores obtenidos en estudios de fiabilidad y validez de sus re-
sultados. Podríamos decir que los tests de inteligencia, sin tener una cientificidad ab-
soluta del 100% en su información, muestran confianza y ayudan a tomar decisio-
nes. El margen de error en las estimaciones y en las decisiones es menor con su uso
que sin él. Evidentemente, este margen de error aumenta cuanto más se aproximen a
un individuo la evaluación y las decisiones (caso individual), siendo menor cuando
hacemos referencia a grupos.
vas del éxito del sujeto en la escuela, en el trabajo o en la vida social. No disponemos,
al menos hasta el momento, de sustitutos adecuados para los tests de inteligencia
cuando el objetivo de la evaluación psicológica es el conocimiento del nivel y capaci-
dad de funcionamiento mental o la predicción de su rendimiento posterior. Claro
está que, retomando algunas de las críticas realizadas a los tests, podemos estar utili-
zando información redundante. Es previsible que los tests correlacionen con el ren-
dimiento escolar, pues surgen en cierta medida de situaciones que implican aprendi-
zajes y actividades curriculares (Detterman, 1979). Esto no quita nada del valor
informativo del test y de los resultados obtenidos en términos de diagnóstico y pre-
visión, igual que aceptamos lo importante que sería que el test permitiese una infor-
mación prescriptiva, o sea, dar información relevante para orientar la educación, la
enseñanza y el aprendizaje (Perlman y Kaufman, 1990).
REFERENCIAS BIBLIOGRÁFICAS
Cronbach, L. J. (1975). Five decades of public controversy over mental testing. American
Psychologist, 3, 1-14.
Cronbach, L. J. (1978). Review of the BITCH Test. Eighth mental measurements yearbook
(vol. 1). Highland Park. Gryphon. ' a
Delaney, E. y Hopkins, T. (1987). Stanford-Binet Intelligence Scale: Examiner's handbook;
An expanded guided for fourth edition users. Chicago. Riverside Pubs.
Detterman, D. K. (1979). A job half done: The road to intelligence testing in the year 2000.
EnR.]. Sternberg y D. K. Detterman (dirs.), Human intelligence. Norwood. Ablex.
Els, K. (1951). Intelligence and cultural differences. Chicago. University Chicago Press.
Flynn, J. R. (1984). The mean 1Q of americans: Massive gains 1932 to 1978. Psychological Bu-
lletin, 95, 29-51.
Gesell, A., Ilg, F.L. y Ames, L. B. (1974). Infant and child in the culture of today. Nueva
York. Harper and Row.
Guilford, J. P. (1959). Three faces of intellect. American Psychologist, 14, 469-479.
Guilford, J. P. (1982). Cognitive psychology”s ambiguities: Some suggested remedies. Psy-
chological Reviezw, 89, 48-59. dd
Harnqvist, K. (1968). Relative changes inintelligence from 13 to 18. Scandinavian Journal of
Psychology, 9, 50-82.
Herstein, R. (1971). 1Q. Atlantic-Monthly (septiembre), 43-64.
Hollenbeck, G. P. y Kaufman, A. S. (1973). Factor analysis of the Wechsler Preschool and
Primary Scale of Intelligence (WPPS1). Journal of Clinical Psychology, 29, 41-45.
Horn, J. L. (1979). Trends in the measurement of intelligence. En R. J. Sternberg y D. K. Det-
terman (dirs.), Human intelligence. Norwood. Ablex.
Jackson, D. A. (1984). Multidimensional Aptitude Battery (MAB): Manual. Port Huron. Re-
search Psychologists Press.
Jackson, G. (1975). On the report of the ad hoc committee on educational uses of tests with
disadvantaged students. American Psychologist, 30, 88-92.
Jensen, A. R. (1969). How much can we boost I1Q and scholastic achievement? Harvard Edu-
cational Review, 39, 1-123.
Jensen, A. R. (1980). Bras in mental tests. Nueva York. The Free Press.
Jensen, A. R. (1981). Straight talk about mental tests. Londres. Methuen.
Jones, R. y Wilderson, F. (1976). Mainstreaming and the minority child. An overwiew of is-
sues and a perspective. En R. Jones (dir.), Mainstraiming and the minority child. Reston.
Council for Exceptional Chidren.
Kaufman, A. S. (1975). Factor structure of the McCarthy Scales at five age levels between 2
1/2 and 81/2. Educational and Psychological Measurement, 35, 641-656.
Kaufman, A. S. (1979). Intelligent testing with the WISC-R. Nueva York. Wiley.
oia A. S. (1982). Psicometría razonada con el WISC-R. México D. F. El Manual Mo-
erno.
Kaufman, A. S. y Hollenbeck, G. P. (1973). Factor analysis of the standardization edition of
the McCarthy scales. Journal of Clinical Psychology, 29, 358-362.
Kaufman, A. y Kaufman, N. (1983). Kaufman Assessment Battery for Children (K-ABC). Cir-
cle Pines. American Guidance Service.
Knobloch, H. y Pasamanick, B. (dir.) (1974). Gesell and Amatruda's developmental diagno-
sis. Nueva York. Harper and Row.
Leckliter, IL. N., Matarazzo, J. O. y Silverstein, A. B. (1986). A literature review of factor
analytic studies of the WA7S-R. Journal of Clinical Psychology, 42, 332-342.
Lennon, R. (1980). The anatomy of a scholastic aptitude test. NCME Measurement in Edu-
cation, 11, 1-8.
Lindemanmn, J. E. y Matarazzo, J. D. (1990). Assessment of adult intelligence. En G. Golds-
Es y M. Hersen (dirs.), Handbook of psychological assessment. Nueva York. Pergamon
ress.
Evaluación de la inteligencia general
555
LECTURAS COMPLEMENTARIAS
I. INTRODUCCIÓN
San Diego State University (EE UU) e Iowa State University (EE UU). )
Agradecemos a la doctora Vera Gutiérrez-Clellan y a Elizabeth Freedman las innumerables horas
dedicadas a la traducción de este trabajo.
560 Carol Robinson-Zañartu y Daniel J. Reschly
Los diversos modelos de aptitud que se utilizan con niños y adolescentes tienen una
serie de características comunes. Quizás el factor común más básico es el de mejorar
las conclusiones que se derivan del diagnóstico y que determinan la orientación edu-
cativa y terapéutica de niños y adolescentes con diferentes problemas de aprendi-
zaje.
1981, 1986, 1992). En contraposición están quienes argumentan que las aptitudes se
pueden cambiar por medio del tratamiento; usan los resultados iniciales de la evalua-
ción como punto de partida para el diseño de experiencias que modificarán la mane-
ra básica de pensar del individuo. Aquí, la meta es nada menos que la modificación
del pensamiento y, de ahí, el desarrollo de aptitudes no observadas previamente.
Desde este punto de vista, la expansión del repertorio cognitivo es visto como posi-
ble y como esencial. Es difícil pensar en una diferencia entre los modelos más básica
que la idea de que los modelos son cambiables. Esta cuestión tan fundamental con-
duce a otras diferencias.
Tal cambio positivo sugiere que los procesos cognitivos se han modificado al menos
para esa clase de tareas. Sin embargo, la modificación cognitiva es limitada a menos
que la transferencia distante pueda también demostrarse. La transferencia distante
hace referencia a la cuestión de si las modificaciones cognitivas del individuo lo lle-
van a un mejor desempeño en la resolución de problemas diferentes y con tareas O
propiedades de estímulo distintas. Por último, la mayoría de los modelos de modi-
ficabilidad cognitiva busca una mejor actuación en la generalización de soluciones
a problemas y en el aprendizaje, incluyendo la adquisición de destrezas escolares.
Por razones obvias, es bastante más fácil producir transferencia proximal que dis-
tante.
Las reglas que se han establecido para una evaluación válida y confiable difieren sus-
tancialmente de acuerdo a los modelos de aptitud. En los modelos de modificabili-
dad, el examinador entabla una interacción compleja con el alumno donde el propó-
sito es establecer cómo el individuo piensa y qué estrategias usa para resolver los
problemas. Para lograr este propósito, se requiere necesariamente de un formato
que sea, en el mejor de los casos, parcialmente estructurado. La evaluación es “diná-
mica” en el sentido de que lo que el examinador hace está determinado por la clase
de procesos de pensamiento usados por el estudiante, interactuando con el estudian-
te para explorar las razones de las soluciones dadas, correctas o incorrectas, y modi-
ficando los procedimientos de administración para que los procesos cognitivos sub-
yacentes puedan ser observados completamente. Aunque los terapeutas en los
modelos de modificabilidad pueden usar una gama limitada de tareas en la solución
de problemas, la presentación de tareas y la interacción con el estudiante casi siem-
pre varía de acuerdo al caso.
Por lo general, los modelos que creen en la estabilidad de las aptitudes, usan pro-
cedimientos estandarizados convencionales con el propósito de lograr la mayor uni-
formidad en la presentación de tareas, evaluación de respuestas, resumen de puntua-
ciones e interpretación de éstas. La relación entre terapeuta y estudiante también se
asume que es estandarizada y similar a la relación en la evaluación de la inteligencia o
rendimiento.
APTITUD
ya
O.
T
F *” Adecua el método Él No adecua el método
AOS a las destrezas ú a las destrezas
cues ;
é * Presupone Presupone
D t * un beneficio e un efecto
E e máximo á mínimo
eo ;
Emiient De hecho-Sin efectos ; De hecho-Sin efectos
N *k
S Z Adecua el método
FE G* Noadecua el método
Ñ Patas taestezas 3 a las destrezas
A dd »
Ab Presupone Presupone
eZ añ un efecto á un beneficio
A (0 mínimo ' máximo
,
máximos.
Supuesto: adecuar el tratamiento (enseñanza) a la aptitud produce beneficios
o destrezas y deficiencias
Base empírica: es débil con respecto a los procesos de base
neuropsicológicas.
570 Carol Robinson-Zañartu y Daniel J. Reschly
Existen varios modelos de “evaluación dinámica”, cada uno de los cuales se ocupa de
la evaluación de las diferencias en el individuo, diferenciándose desde la medida en
que se prueban los límites (Carlson y Wiedl, 1976, 1978) hasta la teoría de modifica-
bilidad estructural cognitiva de Feuerstein (Feuerstein, 1970; Feuerstern y cols.,
1987). Tanto las suposiciones teóricas como el tratamiento de la evaluación, eltipo
de examen, los objetivos de cambio, el número y tipos de parámetros identificados
para terapia y los supuestos acerca de los resultados de la transferencia varían enor-
memente de acuerdo con los distintos modelos y pueden conceptualizarse como un
continuo (véase el cuadro 23.2). sE
Budoff (1967) y Budoff y Friedman (1964) crearon una evaluación del potencial
de aprendizaje que incluye la instrucción o entrenamiento entre los ensayos de la
prueba. Campione y Brown (1987), fuertemente influenciados por Vigotski, formu-
572 Carol Robinson-Zañartu y Daniel J. Reschly
tado acerca del potencial, los retos, y las posibles complicaciones y dificultades de
estos métodos (Lidz, 1987; Jensen y cols., 1988; Reschly y Wilson, 1990; Haywood
y Tzuriel, 1992). f ; Ao
Las primeras investigaciones de los modelos de evaluación dinámica (también
llamados pruebas del potencial de aprendizaje, capacidad para aprender tareas mue-
vas o capacidad para aprovechar la enseñanza) se abocaron a la posibilidad de identi-
ficar estudiantes malcategorizados, es decir, estudiantes categorizados como de bajo
nivel en las pruebas estandarizadas tradicionales de inteligencia debido a factores so-
cioeconómicos y culturales (Budoff y Friedman, 1964; Budoff, 1967). A pesar de
que el objeto preponderante de las evaluaciones dinámicas es la diferencia en el indi-
viduo, también estos métodos se han usado —de modo limitado— para comparar
diferencias entre individuos. En estudios hechos en Israel (Feuerstein y cols., 1980)
se usó el método de Feuerstein con un grupo de potencial medio, pero supuesta-
mente debajo de la media de acuerdo a los resultados de pruebas de inteligencia es-
tandarizada; este grupo se combinó con otro grupo de “coeficiente intelectual me-
dio” (de acuerdo a las pruebas estandarizadas) y de potencial similar con el
propósito de brindarles adiestramiento. Después de un año de enseñanza, los dos
grupos mejoraron y no se observaron diferencias con las pruebas estandarizadas de
inteligencia.
bales. Por ejemplo, Carlson y Wiedl (1976, 1978, 1979, 1980) descubrieron que los
niños alemanes de edad escolar, usando verbalizaciones y estrategias de retroalimen-
tacion o feedback, obtuvieron beneficio de la terapia según una prueba de inteligen-
cia no verbal. En Estados Unidos se demostró que las diferencias de nivel entre los
diversos grupos étnicos se anulan estadísticamente usando estos procedimientos
(Dillon y Carlson, 1978). Budoff y Friedman (1964) y Budoff (1967) agregaron con-
diciones de entrenamiento a los resultados de la primera evaluación del potencial de
aprendizaje de los sujetos con el objeto de evaluar el efecto de éstas sobre las diferen-
cias significativas socioeconómicas; descubrieron que después de recibir entrena-
miento, el funcionamiento de los niños de “bajo coeficiente intelectual” se equipara-
ba al otro grupo. De la misma manera, Thickpenny y Howie (1990) evaluaron el
efecto de la enseñanza de destrezas de pensamiento con adolescentes sordos y halla-
ron incrementos significativos en dos subpruebas de la escala de Weschler, así como
en el Matching familiar figures test (MFFT) [Prueba de apareamiento de figuras faml-
liares]. Campione y Brown (1987), en un resumen de tres grupos de estudios, halla-
ron que la transferencia proximal era sustancial para los estudiantes de “bajo nivel”,
pero que las pruebas tradicionales son capaces de diferenciar con más precisión
“srupos de distinto nivel” en lo que respecta a la transferencia distante. En uno de
los análisis más rigurosos sobre este tema, Jensen y Singer (1987) evaluaron el efecto
del programa de Feuerstein, durante sus tres años de duración, con 234 adolescentes
en el grupo experimental y 164 en el grupo de control, todos de bajo nivel, y encon-
traron indicios claros de la adquisición de nuevas funciones cognitivas y transferen-
cia proximal. Además, Jensen (1990) halló que el análisis factorial de estas funciones
se distribuía entre cuatro categorías. Las tres primeras, que llamó entrada, transfor-
mación y comunicación, tenían una relación estrecha con los agrupamientos clínicos
de entrada, elaboración y salida de Feuerstein, contribuyendo así a la validez de la
teoría; la cuarta categoría, llamada control cognitivo, se asociaba con el papel de la
impulsividad y control sobre el “tempo” del acto mental. Sin embargo, no se halló
transferencia distante a una mejora escolar significativa (Jensen y Singer, 1987). Poco
después, Jensen (1990, 1992) postuló que las reseñas de investigación nos llevan a la
conclusión de que los programas de desarrollo instrumental cognitivo por sí mismos
no han sido efectivos en lograr resultados escolares.
Los modelos de estabilidad (por ejemplo, la medida del cociente intelectual) dan
por supuesto que las diferencias individuales en el organismo humano son estables,
pueden ser evaluadas, dan una indicación válida del funcionamiento actual y un pro-
nóstico de futuros niveles o aptitudes de desarrollo. De esta manera, presuponiendo
que el funcionamiento humano tiene un límite y una naturaleza invariables, se po-
nen límites a las expectativas dirigidas al individuo que se evalúa, produciendo hábi-
tos como el de dar rótulos, la categorización y la orientación diferencial en aulas de
clases, en las que a menudo se modifica el medio ambiente para acomodar esas ex-
pectativas (por ejemplo, la simplificación del currículo). Los modelos estables están
caracterizados por presentar una orientación hacia los productos (por ejemplo, los
pronosticadores numéricos) y una aceptación pasiva de los niveles bajos de funcio-
namiento. Su influencia ha sido particularmente fuerte en el área de la psicometría,
donde la búsqueda de diferencias individuales estables ha producido métodos de
identificación y categorización de individuos basados en la ejecución de pruebas ba-
remadas y estandarizadas (Jensen, 1992). La eficacia de este paradigma está ahora en
discusión en los campos de la psicología donde los indicios empíricos apuntan al
contexto como variable crítica para entender el funcionamiento humano (Bowlby,
1960; Harlow y Harlow, 1966; Kaufman y Rosenblum, 1967; Sackett, 1967).
Los modelos de cambio aplicados a la modificabilidad y aprendizaje humanos
operan basados en el supuesto de que el contexto es una variable crítica que debe ser
aplicada a la evaluación del funcionamiento humano. Aunque estos modelos varían
en su atención hacia factores como la edad, etiología y severidad del trastorno, tie-
nen en común la idea de que el organismo humano es un sistema abierto y, por lo
tanto, que la evaluación debe abordar la posibilidad de su enriquecimiento (Jensen,
1992). Proponen que la naturaleza humana es cultural y que el aprendizaje implica la
elaboración de símbolos contextualmente significantes (por ejemplo, culturalmen-
te). Más aún, estos modelos proponen que el aprendizaje es un proceso dinámico y
abierto en el que la modificación activa puede dedicarse al aumento del funciona-
miento (Jensen, 1992; Robinson-Zañartu y Cook-Morales, 1992).
del contexto de su cultura e idioma. Esta persona es el primer mediador del aprendi-
zaje; presenta al niño los elementos con finalidad del medio ambiente, entabla
una
relacion recíproca con él, ayuda a encuadrar y formar conductas asociadas con el
aprendizaje, y otorga significado y motivación a las interacciones y al aprendizaje
que se desarrolla. Estas acciones constan de características esenciales de mediación.
Estas características de mediación, en las que el examinador engendra la intención y
reciprocidad, los sentimientos de capacidad, la regulación de la conducta o ritmo
cognitivo, el valor transcendental de la experiencia inmediata y la idea de lo que sig-
nifica el cambio a medida que ocurre son lo que caracteriza el tipo de interacción en-
tre el examinador y el examinado en la evaluación dinámica.
estudiante en el siglo XX1. En Estados Unidos, los mandatos para reformar la educa-
ción ahora recalcan que las metas educativas deben ir más allá del rendimiento esco-
lar. La atención se dirige hacia el desarrollo de las destrezas de pensamiento (Car-
negie Council on Adolescent Development, National Educational Goals Report) y
al logro de resultados que capaciten al aprendiz para aprovechar la enseñanza (Yssel-
dyke y Thurlow, 1992).
Las investigaciones con estos modelos hasta la fecha no han corroborado elsu-
puesto de transferencia al aumento de rendimiento escolar, aunque las nuevas orien-
taciones deberían dejarlo abierto para revisión. Dado el interés de Jensen en las
dimensiones múltiples del aumento de la aptitud, su trabajo teórico en el desglosa-
miento del conocimiento parece ser especialmente merecedor de un examen científi-
CO riguroso.
VI. CONCLUSIONES
Reflexionando acerca de las corrientes de la última década, hemos examinado las ap-
titudes desde una perspectiva que incluye cualquier medida destinada a pronosticar
diferencias individuales en futuros aprendizajes. Específicamente, nos hemos con-
centrado en tres modelos de evaluación de las aptitudes cognitivas dirigidos a mejo-
rar el diagnóstico, la orientación y/o el tratamiento de niños y adolescentes con pro-
blemas de aprendizaje: los modelos psicolingúísticos y perceptivomotores, los
modelos de interacción entre la aptitud y el tratamiento y los modelos de cambio de
la evaluación dinámica y la reeducación del aprendizaje mediado. Todos estos mo-
delos tienen en común la idea de que existe un repertorio de procesos cognitivos de
base en el proceso de aprendizaje, que el examen de las diferencias en elindividuo
mismo en lugar de las diferencias entre individuos debe reflejar datos importantes
acerca del plan de adiestramiento o de enseñanza, y que el aumento del funciona-
582 Carol Robinson-Zañartu y Daniel J. Reschly
miento cognitivo y del rendimiento escolar deben ser las metas finales de la rehabili-
tación basada en estas evaluaciones.
Las diferencias significativas entre los modelos conducen a diferentes conclu-
siones acerca de sus utilidades. Los modelos de interacción entre las aptitudes y el
tratamiento presuponen que las aptitudes son características estables del individuo,
relativamente resistentes al tratamiento. Los modelos psicolingúísticos y percepti-
vomotores presuponen que las funciones deficientes pueden identificarse y cam-
biarse con tratamientos. Los modelos de estabilidad se basan en productos o res-
puestas como la unidad principal de observación y en procedimientos tradicionales
de evaluación estandarizada; mientras, los modelos de evaluación dinámica presu-
ponen que las funciones cognitivas no son sólo modificables, sino que están in-
terrelacionadas de manera que su desarrollo puede conducir al aumento de la es-
tructura cognitiva global. Conforme con los modelos de cambio, la unidad de
observación son los procesos de pensamiento que se usan para producir una va-
riedad de respuestas en lugar de los productos, en los procedimientos en la evalua-
ción dinámica son dinámicos e interactivos, guiados por los procesos de pensa-
miento del estudiante.
Cada modelo se diferencia en el supuesto de la transferencia de los resultados.
En los modelos de interacción, aptitud y tratamiento se presupone que el tratamien-
to o la enseñanza deben desarrollar las destrezas o habilidades estables, produciendo
así el aumento del funcionamiento. Los modelos psicolingúísticos y perceptivomo-
tores presuponen que las funciones deficientes pueden entrenarse, llevando así a un
aumento del funcionamiento. La toma de decisiones de acuerdo a estos modelos de
estabilidad se relaciona normalmente con el tipo de enseñanza que debe usarse o con
la categorización del estudiante para una futura orientación diferencial basada en la
existencia de ciertas deficiencias cognitivas o de elaboración. Los modelos dinámi-
cos de cambio presuponen que la transferencia puede lograrse a través de los proce-
sos reeducativos que se identifican durante la evaluación y que son parte de la mis-
ma. La toma de decisiones se relaciona con los métodos de enseñanza encaminados
al aumento del funcionamiento global. Las reeducaciones son conductas interactivas
(mediaciones) efectuadas por los maestros, padres o especialistas que se aplican a las
funciones cognitivas en el contexto del currículo.
En la actualidad, los tres modelos se quedan cortos en cuanto se aplica el están-
dar de validez de tratamiento que se basa en la mejora de los resultados escolares.
Aunque las causas de los indicios negativos pueden deberse a debilidades en la teoría
básica, en la evaluación de las aptitudes o en las reeducaciones que se disponen, las
investigaciones con el modelo de interacción aptitud-tratamiento indican en el me-
jor de los casos interacciones bastante débiles. Con respecto al modelo perceptivo-
motor, las reeducaciones parecen tener efectos limitados sobre los procesos percep-
tivomotores. Las reeducaciones del modelo psicolingúístico parecen tener algún
efecto mínimo sobre los procesos psicolingúísticos, pero no resultados certeros en el
rendimiento escolar. Las reeducaciones de los modelos de evaluación dinámica pare-
cen tener un efecto claro sobre el aumento cognitivo, pero no hay indicios claros de
transferencia al desarrollo escolar. Los adelantos recientes en las teorías e investiga-
ciones en este campo son promisorios y deben continuarse. Los experimentos que
intencionadamente equiparan las destrezas de aprendizaje y el contenido de la ense-
Evaluación de las aptitudes
583
ñanza están comenzando a producir indicios de transferencia. Con una atención cre-
ciente en el campo educativo hacia el papel que Juegan las destrezas de pensamiento
los métodos de evaluación y reeducación que provean indicios del desarrollo mental
y del desenvolvimiento escolar llegarán a ser notables.
REFERENCIAS BIBLIOGRÁFICAS
Kirk, S. A., McCarthy, J. y Kirk, W. (1968). /llinois Test of Psycholingwistic Abilities. Cham-
paign (Il). University of Illinois Press. :
Klauer, K. J. (1989). Teaching for analogical transfer as a means of improving problem-
solving, thinking and learning. Instructional Science, 179-192. AZ, : :
Kreigler, S. M. y Kaplan, M. E. (1990). Improving inattention and reading in inattentive chil-
dren through MLE: A pilot study. International Journal of Cognitive Education and Me-
diated Learning, 1, 185-192.
Lidz, C.S. (1987). Dynamic assessment: An interactional approach to evaluation learning po-
tential. Nueva York. Guilford Press.
Lipman, M., Sharp, A. M. y Oscayen, F. S. (1990). Philosophy in the classroom. Filadelfia.
Temple University Press.
Lund, K., Foster, G. y McCall-Pérez, F. (1978). The effectiveness of psycholinguistic trai-
ning: A reevaluation. Exceptional Children, 44, 310-321.
Luria, A. R. (19664). Higher cortical functions in man. Nueva York. Basic Books.
Luria, A. R. (1966b). Human brain and psychological processes. Nueva York. Harper and
Row.
Mandl, H. y Schnotz, W. (1987). New directions in text comprehension. En E. De Corte
(dir.), Learning and Instruction (vol. 1). Oxford Leuvens. Pergamon/Leuven University.
Mercer, C. D., King-Sears, P. y Mercer, A. R. (1990). Learning disabilities definitions and cri-
teria used by state education departments. Learning Disability Quarterly, 13, 141-152.
Minskoff, E. (1975). Research on psycholinguistic training: Critique and guidelines. Excep-
tional Children, 42, 136-144.
Minskoff, E. H., Wiseman, D. E. y Minskoff,J.G. (1972). The MWM Program for Developing
Language Abilities. Ridgeway. Educational Performance Associates.
Moll, L. C. (1991). Social and instructional issues in literacy instruction for “disadvantaged”
students. En M. S. Knapp y P. M. Shields (dirs.), Better schooling for children ofpoverty:
alternatives to conventional wisdom. Berkeley. McCutchan.
Naglieri, J. A. (1989). A cognitive processing theory for the measurement of intelligence.
Educational Psychologist, 24, 185-206.
Newcomer, R., Larsen, S. y Hammill, D. (1975). A response to Minskoff. Exceptional Chil-
dren, 42, 144-148.
Nisbet,J. y Shucksmith,J.(1986). Learning strategies. Londres. Routledge.
Osgood, C. E. (1957). Motivational dynamics of language behavior. En M. R. Jones (dir.),
Nebraska Symposium on Motivation. Lincoln. University of Nebraska Press.
Penrose, L. S. (1934). Mental defect. Nueva York. Farrar and Rinehart.
Perkins, D. N. (1987). Thinking frames: An integrative perspective on teaching cognitive
skills. En J. B. Baron y R. J. Sternberg (dirs.), Teaching thinking skills: Theory and practi-
ce. Nueva York. Freedman and Co.
Haga (1952). The origins of intelligence in children. Nueva York. International Universi-
ties Press.
Reschly, D. J. y Gresham, F. M. (1989). Current neuropsychological diagnosis of learning
problems: Á leap of faith. En C. R. Reynolds y E. Fletcher-Janzen (dirs.), Handbook of
Clinical Neuropsychology. Nueva York. Plenum Press.
Reschly, D. J. y Wilson, M. S. (1990). Cognitive processing versus traditional intelligence:
Diagnosuc utility, intervention implications, and treatment validity. School Psychology
Review, 19, 443-458.
Rey, A. (1934). D'un procédé pour évaluer Péducabilité (quelques applications en psycho-
pathologie). Archives de Psychologie, 24, 297-337. )
Reynolds, C. R. (1981). Neuropsychological assessment and the habilitation learning: Consi-
derations in the search for aptitude x treatment interaction. School Psycholo gy Reviero, 10,
343-349.
Evaluación de las aptitudes
587
LECTURAS COMPLEMENTARIAS
R. Reynolds
Kavale, K. (1990). The effectiveness of special education. En T. B. Gutkin y C.
(dirs.), The handboo k of school psycholog y (2% ed.). Nueva York. Wiley.
588 Carol Robinson-Zañartu y Daniel J. Reschly
Il. INTRODUCCIÓN
El Sternberg triarchic abilities test (STAT) se ha diseñado para evaluar las tres sub-
teorías. Las habilidades generales que se han incluido en algunos de los subtests son
parecidas a las que aparecen en los tests convencionales, pero laforma interactiva de
evaluarlas es diferente. Se tiene en cuenta la capacidad del individuo para aprender,
más que los conocimientos previos. Los procesos de la subteoría contextual se han
dividido en dos partes que evalúan desde los procesos para hacer frente a la solución
de problemas completamente nuevos (novedad o insight) hasta procesos de rapidez
para interiorizar la información (automatización) (Sternberg, 1985, 1991a).
der a hacer las cosas, componentes de rendimiento que ayudan a planificar qué cosas
hay que hacer y componentes de conocimiento-adquisición que nos dicen cómo ha-
cerlas. Los componentes especifican el conjunto de mecanismos mentales que fun-
damentan la conducta inteligente de un individuo.
1.1.1. Metacomponentes
Los metacomponentes son los procesos de orden superior o ejecutivos que se usan
para planificar, dirigir y evaluar la conducta, entre los que se incluye:
Son procesos no ejecutivos que se emplean para aprender cómo resolver un proble-
ma y están controlados por los metacomponentes. Se trata de procesos individuales
que se usan para adquirir información nueva, recordar la información adquirida pre-
viamente y transferir lo aprendido a otro contexto. Estos componentes son esencia-
les para el aprendizaje, el uso del lenguaje y para el funcionamiento intelectual. Los
componentes de adquisición-conocimiento proporcionan los mecanismos mediante
los cuales se desarrolla el conocimiento básico. El aumento del conocimiento básico
permite aprender procedimientos más sofisticados y complejos para adquirir infor-
mación y esto a su vez ayuda a utilizar con mayor facilidad los componentes de ad-
quisición-conocimiento. Estos componentes facilitan el aprendizaje del vocabula-
rio. El hecho de tener un vocabulario cada vez más amplio, hace que se aumente el
598 Robert Sternberg y María Dolores Prieto
vas (Sternberg, 19864). El insight consiste en saber utilizar tres procesos psicológicos
mutuamente relacionados: codificación selectiva, combinación selectiva y compara-
ción selectiva (Davidson y Sternberg, 1986). La codificación selectiva implica enfo-
car el problema hacia lo relevante, ignorando los datos irrelevantes para la solución.
La combinación selectiva consiste en saber coordinar todas las unidades de informa-
ción disponibles para resolver el problema o la situación novedosa. La comparación
selectiva supone saber relacionar la información nueva con la ya disponible en el co-
nocimiento; el resultado de dicha comparación nos lleva a la solución creativa del
problema.
En este apartado hemos incluido los ítems recogidos en el $747, el cual pretende eva-
luar los mecanismos de la inteligencia individual del sujeto.
Si un perro pusiera huevos, ¿cuál de las alternativas siguientes podría ser la más
cierta?
Los ítems de este apartado evalúan la capacidad para hacer frente a situaciones nove-
dosas en una modalidad numérica. Los problemas que se usan son matrices con nú-
meros y símbolos. >. w
Ejemplo de un ítem para evaluar la novedad-modalidad cuantitativa en niños/as
de 6-7 años.
Los números de la tabla guardan una cierta relación. Abajo se te da algún tipo de in-
formación que te ayudará a completar la casilla que aparece con interrogante.
602 Robert Sternberg y María Dolores Prieto
AMIGAS
K "URI.
HSCIKSZ
Los ítems de este subtest exigen al examinando realizar juicios rápidos sobre la per-
tenencia o no de una serie de números a dos categorías (par e impar).
Evaluación de las habilidades de la inteligencia: teoría triárquica de la inteligenc
ia 603
Los problemas del test requieren que el examinando compare pares de figuras y diga
si el número de lados es igual o diferente.
A continuación aparece cierta información sobre una situación que se puede dar en tu
vida. Léela cuidadosamente y elige la solución que podría ser la verdadera.
1. Laestación de servicio del Sr. García cobra más que la del Sr. Sánchez.
2. Ningún garaje cobra menos que el del Sr. Sánchez.
3. El garaje del Sr. Sánchez es el más ocupado de la ciudad.
Le has prometido a una amiga hacerle unas galletas para su cumpleaños. La receta
dice que para dos docenas de galletas necesitas los siguientes ingredientes:
1 pastilla de mantequilla, 1 taza de azúcar, 1 huevo, 1 taza de harina y 1 taza de
nueces.
604 Robert Sternberg y María Dolores Prieto
cia depende del individuo y del marco sociocultural en el que viva; es decir, un com-
portamiento inteligente para unos puede no serlo para otros. De acuerdo con esta
subteoría el individuo puede elegir entre las siguientes alternativas: adaptarse o cam-
biar para enfrentarse mejor a las exigencias del ambiente, configurar o cambiar el
ambiente para adaptarlo mejor a las necesidades de uno y optar por un ambiente que
responda mejor a las necesidades. La elección inteligente dependerá de las aptitudes,
necesidades y relación con la situación de cada persona. Además, la subteoría prácti-
ca propone que el contexto afecta a la cognición en el sentido que apuntaba Vigotski.
Esto significa que, aunque los mismos procesos componenciales se apliquen a dis-
tintos tipos de contenidos con resultados diferentes, el rendimiento en un campo de-
terminado depende de la experiencia, motivación e interacción del individuo con ese
campo.
Hay un test de papel y lápiz que pretende evaluar cuatro áreas (componentes O
habilidades generales, procesos para enfrentarse a situaciones y problemas novedo-
sos, procesos de automatización de la información e inteligencia práctica) del proce-
samiento de la información en las tres formas diferentes en las que el individuo re-
presenta dicha información (verbal, cuantitativa y figurativa). Las habilidades
generales o componentes son similares a las recogidas en los tests convencionales de
inteligencia y evalúa la relación de la inteligencia con el mundo interno del sujeto.
Las tareas recogidas en el área referente al procesamiento de la información de ma-
nera novedosa evalúan la relación de la inteligencia del individuo con experiencias
nuevas (2nsight). Los problemas del área o dominio de la automatización evalúan la
relación de la inteligencia con situaciones muy familiares. Y las situaciones y proble-
mas recogidos en el área de la inteligencia práctica evalúan la relación de la inteligen-
cia con el mundo externo del individuo (inteligencia experiencial). La contextual se
evalúa en dos secciones separadas porque el individuo emplea procesos distintos
cuando se encuentra con situaciones completamente nuevas a cuando se encuentra
con situaciones totalmente familiares (Sternberg, 19914). El STAT puede ser una gran
aportación para evaluar más ampliamente la inteligencia y pensamos que ayudará a
predecir y diagnosticar las funciones de la inteligencia de los estudiantes dentro de su
ambiente escolar.
REFERENCIAS BIBLIOGRÁFICAS
Beltrán, J., Pérez, L. y Prieto, M. D. (1992). La inteligencia práctica aplicada a la escuela (ver-
sión experimental). Murcia. ICE Universidad de Murcia.
Binet, A. y Simon, T. (1905). Methodes nouvelles pour le diagnostic du niveau intellectuel des
anormaux. L”Année Psychologie, 11, 191-244.
Binet, A. y Simon, T. (1916). The development of intelligence in children. Baltimore, M. D.
Williams y Wilkins.
Charlesworth, W. R. (1979). Ethology: Understanding the other half of intelligence. En
Evaluación de las habilidades de la inteligencia: teoría triárquica de la inteligencia 607
M. Cranich, K. Koppa, W. Lepenies y D. Ploog (dirs.), Human ethology: Claims and li-
mits of a new discipline. Cambridge. Cambridge University Press.
Davidson, J. E. y Sternberg, R. (1986). The role of insight in intellectual giftedness. Gifted
Child Quarterly, 28, 58-64. ]
Feuerstein, R. (1978). The Learning Potential Assessment Device (LPAD). Ulinois. Scott, Fo-
resman and Co.
Feuerstein, R. (1980). Instrumental Enrichment Program. Vlinois. Scott, Foresman and Co.
ee H. (1983). Frames of mind: The theory of multiple intelligences. Nueva York. Basic
ooks.
Guilford, J. P. (1967). The nature of human intelligence. Nueva York. MacGraw-Hill [La
naturaleza de la inteligencia humana, Barcelona, Paidós, 1986].
Guilford,J.P. (1982). Cognitive psychology”s ambiguities: Some suggested remedies. Pycho-
logical Revier, 89, 48-59.
Hunt, E. B., Frost, N. y Lunnenborg, C. E. (1973). Individual differences in cognition. En
G. Bower (dir.), The psychology of learning and motivation (vol. VII). Nueva York. Aca-
demic Press.
Keil, F. C. (1984). Transition mechanisms in cognitive development and the structure of
AS En R. Sternberg (dir.), Mechanisms of cognitive development. San Francisco.
reeman.
Lawson, A. (1975). Developing formal thought through biology teaching. American Biology
Teacher, 37, 411-429.
Mayer, R. y Greeno, J. G. (1972). Structural differences between learning outcomes produ-
ced by different instructional methods. Journal of Educational Psychology, 63, 165-173.
McDermott, P. (1985). Multidimensional assessment of children. Cleveland. The Psychologi-
cal Corporation.
Newell, A. y Simon, A. $. (1972). Human problem solving. Englewood Cliffs. Prentice Hall.
Piaget, J. (1936). La naissance de l'intelligence chez P'enfant. Neuchátel. Delachaux y Niestlé
[El nacimiento de la inteligencia en el niño, Barcelona, Crítica, 1990].
Piaget, J. (1947). La psychologie de l'intelligence. París. Librairie Armand Collin [La psicolo-
gía de la inteligencia, Barcelona, Crítica, 1989].
Rose, A. M. (1980). Information processing abilities. En R. E. Snow, P. A. Federico y W. E.
Montague (dirs.), Aptitude, learning and instruction (vol. 1). Hillsdale. Lawrence Erl-
baum Associates.
Schank, R. (1980). How much intelligence is there in artificial intelligence. [ntelligence, 4,
1-14.
Siegel, L. S. y Brainerd, C. J. (1978). Alternatives to Piaget: Critical essays on the theory. Nue-
va York. Academic Press [Alternativas a Piaget: ensayos críticos sobre la teoría, Madrid,
Pirámide, 1982].
Spearman, C. (1904). General intelligence, objectively determined and measured. American
Journal of Psychology, 15, 201-293.
Spearman, C. (1927). The abilites of man. Nueva York. MacMillan. :
Sternberg, R. (1977). Intelligence, information processing, and analogical reasoning: The com-
ponential analysis of human abilities. Hiillsdale. Lawrence Erlbaum Associates.
Sternberg, R. (1984). What cognitive psychology can (and cannot) do for test development.
En B.S. Blake y J. Mitchell (dirs.), Social and technical issues in testing: implications for test
construction and usage. Hillsdale. Lawrence Erlbaum Associates.
Sternberg, R. (1985). Beyond IQ: A triarchic theory of human intelligence. Nueva York.
Cambridge University Press. sa
Sternberg, R. (19864). The future of intelligence testing and training. £ ducational Measure-
ment: Issues and Practice, 5, 19-22.
Sternberg, R. (19865). Intelligence applied. Nueva York. Harcourt brace Jovanovich, Pu-
blishers.
608 Robert Sternberg y María Dolores Prieto
LECTURAS COMPLEMENTARIAS
Prieto, M. D. y Sternberg, R. (1990). Dos caras de una misma moneda: la inteligencia. Boletín
de Psicología, 28, 29-58.
Prieto, M. D. y Sternberg, R. (1991). La teoría triárquica de la inteligencia: un modelo que
ayuda a entender la naturaleza del retraso mental. Revista Interuniversitaria de Forma-
ción del Profesorado, 11,77-93.
Sternberg, R. (1985). Beyond IQ: A Triarchic Theory of Human Intelligence. Nueva York.
Cambridge University Press (traducción al castellano DDB, 1990).
Sternberg, R. y Salter, W. (1982). Concepciones de la inteligencia y su medición. En R. Stern-
berg (dir.), La naturaleza de la inteligencia y su medición. Madrid. Paidós
25. EVALUACIÓN DEL POTENCIAL DE APRENDIZAJE
Il. INTRODUCCIÓN
Universidad de Murcia.
610 María Dolores Prieto
trumentos del modelo, clasificándolos según el nivel de dificultad de los procesos que
pretenden evaluar y la complejidad que encierran. La selección de los instrumentos
más adecuados para un sujeto determinado supone una gran especialización en el
modelo de evaluación, para elegir sólo aquellos que mejor respondan a las caracterís-
ticas propias del sujeto.
jeto. Éste recibe dos tipos de estimulaciones; por una parte, todos los estímulos (E)
que le vienen desde el exterior y, por otra, las experiencias de aprendizaje estructura-
das y organizadas que le proporciona el evaluador (M). Como resultado de esta esti-
mulación tenemos la conducta o respuestas (R). Cuando éstas son inadecuadas, la
función del mediador (M) consiste en proporcionar el feedback necesario durante la
evaluación para que el sujeto considere sus errores o respuestas no adecuadas. En di-
cha evaluación el profesor —como facilitador de aprendizaje— ayudará al alumno a
desarrollar su potencial a través de la organización y secuenciación de las experien-
cias de aprendizaje o problemas y actividades de los tests.
Así pues, desde la perspectiva de la evaluación dinámica, el sujeto es considerado
como un ser activo con capacidad para registrar, seleccionar, procesar y comunicar
los estímulos de su medio interno y externo; el individuo es un sistema abierto y sus-
ceptible a las influencias que pueden producir cambios estructurales en su funciona-
miento cognitivo (Jensen y Feuerstein, 1987). Por tanto, el verdadero sentido de la
EDPA es evaluar la susceptibilidad del cambio de la estructura cognitiva. El resultado
de la evaluación dinámica no es un repertorio de respuestas a la manera de los tests
de inteligencia clásicos, sino más bien trata de identificar las causas por las cuales el
sujeto no puede acceder a los procesos superiores de la inteligencia; simultáneamen-
te, se evalúa el tipo, cantidad y cualidad de la intervención necesarios para lograr la
modificabilidad de la estructura cognitiva del sujeto.
— Usar un plan para no olvidar algo importante: hacerlo explícito incluso repitiendo
los pasos en voz alta (exploración sitemática).
II. Usar la información que hemos recogido en la fase anterior (FASE DE ELABORACIÓN)
— Usar sólo la información que es pertinente para la solución de los problemas (in-
formación relevante).
— Pensar en alguna otra solución diferente a la dada y tratar de imaginar qué ocurri-
ría si se eligiera una u otra (pensamiento hipotético).
— Diseñar un plan que incluya todos los pasos necesarios para lograr los objetivos
(conducta de planificación).
— Usar las mejores palabras para expresar adecuadamente los elementos de las fi-
guras pedidas en el test (lenguaje exacto y preciso).
La Experiencia del Aprendizaje Mediado (EAM) es el principal vehículo del que dis-
pone el evaluador para conseguir la interacción del individuo con el aprendizaje. En
esta interacción el mediador juega un papel fundamental, consistente en ofrecer al
sujeto un conjunto de estímulos y experiencias que le permiten evaluar y enriquecer
su funcionamiento cognitivo durante la prueba. En la evaluación dinámica del po-
tencial de aprendizaje esta interacción viene determinada por una serie de paráme-
tros orientados a estimar el potencial oculto del sujeto para beneficiarse del aprendi-
zaje proporcionado en la situación misma de la evaluación. Los parámetros se
pueden resumir en los siguientes puntos.
Los materiales para la evaluación dinámica del potencial de aprendizaje se han cons-
truido de tal forma que ofrecen al sujeto una serie de instrumentos en diferentes mo-
dalidades de lenguaje; además, permiten al examinador acceder a la estructura cogn1-
618 María Dolores Prieto
¿Qué ves aquí? Se le pide que haga uso Un cuadrado y algún El mediador debe orien-
de los conocimientos punto tar al sujeto a una res-
previos puesta precisa y com-
pleta
A A A A
¿Qué crees que podrías Pedir definición del pro- Trazar un cuadrado
hacer con estos pun- blema
tos?
———
5 e A——Á
¿Cómo justificarías que Se trabaja el uso del ra- Cuatro puntos forman un Sólo usa un criterio o
es un cuadrado? zonamiento analítico cuadrado fuente de información
e
(El mediador dibuja un Se usa la comparación- El análisis de las dos fi- El uso adecuado de la di-
rectángulo) ¿Cuál es la diferencia entre longitud guras y de los errores ferencia en longitud y la
diferencia entre un cua- de lados y la igualdad hace que el alumno con- igualdad de los ángulos
drado y un rectángulo? entre los ángulos entre trole sus respuestas ¡im- indica que el sujeto ha
ambas figuras pulsivas dado una definición co-
rrecta del problema
¿Por qué crees que es un Ayudar al sujeto a analizar El triángulo es una figura La respuesta idónea es
triángulo? el origen de su error. Se de tres lados y tres ángu- aquella en la que se indi-
fomentan los procesos de los can las características
insight exactas de los lados y
ángulos del triángulo.
Además, dos triángulos
forman un cuadrado
¡ A 0 _A<A<<<< <<>—>—>—m%2%464+
Fíjate bien cómo apare- Explicar las reglas de la El alumno puede realizar El mediador orienta la
cen las dos figuras. tarea. Se exigen proce- la tarea con excesiva ra- atención hacia la super-
sos de flexibilidad para pidez, cometiendo erro- posición de figuras.
cambiar la estrategia y res al no planificar su Hace que el niño use los
controlar los errores por conducta metacomponentes ense-
la superposición de las ñados previamente
figuras
¡€xK_x— _—_—_—QCo— o + ++ ++ e O QO0gQQ
— Mediar el significado de la tarea: las relaciones implícitas en los puntos —formar cua-
drados y/o triángulos de acuerdo al modelo establecido— también las empleamos
para organizar cosas según el objetivo que queramos lograr. Quizás la forma más im-
portante de aprender a aprender es considerar los errores y ver la forma de corregir-
los. Errores parecidos a los de puntos los podemos cometer en otras situaciones.
— Las tareas de la evaluación han de trascender a la situación misma del examen. Por
ejemplo, organizamos la ropa, el tiempo, las actividades escolares, etc. porque quere-
mos imponer un orden para ser más eficaces.
tiva y controlar el tipo de intervención, así como los aspectos intelectuales y los
emotivo-motivacionales. En la construcción de los materiales de la EDPA se han con-
siderado tres dimensiones de la inteligencia: el grado de complejidad y novedad de la
tarea, el lenguaje o modalidad de presentación y las operaciones mentales. Feuers-
tein ha introducido la novedad —definida por el grado de familiaridad o no que se
tenga con el problema— como ingrediente esencial para favorecer la solución de
problemas en situaciones nuevas y fomentar la transferencia. El lenguaje de la tarea
consiste en presentar los problemas en las diferentes modalidades en las que se puede
procesar la información (numérica, verbal, gráfica, pictórica, simbólica, figurativa O
espacial). Las operaciones mentales se definen como un conjunto de estrategias en
función de las cuales el sujeto organiza, transforma y controla la información proce-
dente de las fuentes externas e internas (Feuerstein, 1986). La selección de los distin-
tos tests de la batería se ha hecho considerando los siguientes criterios: cada uno re-
620 María Dolores Prieto
quiere unas funciones cognitivas específicas; todos ellos exigen tareas y materiales
empleados anteriormente en clínica; la solución de los problemas implica utilizar
procesos de orden inferior y superior de pensamiento y las tareas se han organizado
de tal forma que permiten detectar microcambios en la misma situación de examen
(Prieto, 1988).
Los tests del modelo se han clasificado en tres grupos según el tipo de procesos
que evalúan y la dificultad de los mismos (véase cuadro 25.4).
A A a
ME EEES
Ejemplo de Test organizador
OBJETIVOS OBJETIVOS
— Evaluar la capacidad del sujeto para — Evaluar la capacidad del sujeto para
organizar figuras en un campo percep- estructurar y organizar los elementos
tivo desorganizado. de una figura, considerando sus ele-
mentos y detalles internos y externos.
— Evaluar la capacidad para utilizar habi-
lidades de planificación. — Evaluar la memoria a corto y largo
plazo.
— Evaluar la capacidad para usar estrate-
gias metacognitivas. — Evaluar procesos de discriminación.
MATERIALES MATERIALES
HABILIDADES HABILIDADES
— Hoja con veinte diseños — Pretest con 15 proble- — Pretest con 10 tareas
en color mas :
— Hoja de entrenamiento
— Hoja de aprendizaje — Test con 45 problemas con cuatro tareas
y Memoria de palabras (Feuerstein y cols., 1985). Los tests de este grupo permiten
establecer una curva de aprendizaje en donde se observan el ritmo y la eficacia del
sujeto para enfrentarse a una serie de situaciones, en donde se contemplan procesos
similares a los aprendizajes escolares. En la práctica, el examinador selecciona los
tests idóneos para el sujeto, estableciendo la línea base sobre la que se fundamenta la
intervención. Los perfiles se diseñan en función de cuatro dimensiones: áreas de
cambio, magnitud del cambio, naturaleza cualitativa de los cambios y naturaleza de
la intervención (Prieto, 1987).
624 María Dolores Prieto
1. Objetivos
3. Funciones cognitivas
— Transporte visual
— Proyección de relaciones entre las figuras
— Controlar la impulsividad
— Evitar el ensayo-error
— Utilizar un lenguaje preciso para dar la respuesta correcta
Materiales
— Cuatro bande- — Cuadros con re- Test con 20 di- Test con 20 con-
jas superpues- jillas en donde bujos de obje- ceptos
tas. Una lleva se han de situar tos
un botón fijo puntos al ritmo Hoja entrena-
que marca el Test entrena- miento 20 con-
evaluador miento con otros ceptos
20 objetos
Postest paralelo
ferencias entre la situación pretest y postest sirven para hallar la zona de distancia o
potencial de aprendizaje. También se ha producido otro cambio consistente en con-
siderar el proceso versus producto utilizado por el sujeto para llegar a la solución del
problema. Esto significa que la evaluación del potencial se centra más en el procedi-
miento (cómo) que el sujeto utiliza para acceder al aprendizaje, que en la cantidad de
conocimientos que adquiere. El modelo de evaluación dinámica se fundamenta en
una teoría de la inteligencia que permite evaluar los puntos débiles y fuertes de los
sujetos con problemas de aprendizaje.
626 María Dolores Prieto
REFERENCIAS BIBLIOGRÁFICAS
Arthur, G. (1947). Manual of directions for the Stencil Design Test I. Nueva York. Psycholo-
gical Corporation.
Bougés, S. (1979). Tests para el psicodiagnóstico infantil. Madrid. Cincel.
Bucckingham, B. R. (1921). Intelligence and its measurement: A symposium. Journal of Edu-
cational Psichology, 12, 271-275.
Budoff, M. (1967). Learning potential among institutionalized young adults retardates. Ame-
rican Journal of Mental Deficiency, 72, 404-411.
Budoff, M. (1969). Learning potential: A supplementary procedure for assessing the ability
to reason. Seminars in Psychiatry, 1, 278-290.
Budoff, M. (1974). Learning potential and educability among the educable mentaly retarded.
Cambridge. Research Institute for Educational Problems, Cambridge Mental Health As-
sociation.
Budoff, M. y Friedman, M. (1964). Learning potenttial as an assessment approach to the ado-
lescent mentally retarded. Journal of Consulting Psychology, 28, 434-439.
Campione, J. C. y Brown, A. L. (1987). Linking dynamic assessment with school achieve-
ment. En C. S. Lidz (dir.), Dynamic assessment. An interactional approach to evaluating
learning potential. Nueva York. Guilford Press.
Carlson,J.5. y Wield, K. H. (1978). Use of testing-the-limits procedures in the assessment of
intellectual capabilities im children with learning difficulties. American Journal of Mental
Deficiency, 82, 559-564.
Carlson, J. S. y Wield, K. H. (1979). Toward a differential testing approach: Testing-the-li-
mits employing the Raven Matrices. Intelligence, 3, 323-344.
Corman, L. y Budoff, M. (1973). A comparison of group and individual training procedures
on dERaven Learning Potential measure. Cambridge. Research Institute of Educational
Problems.
Dearbon, W. F. (1921). Intelligence and its measurement. Journal of Educational Psychology,
12, 210-212.
Dempster, J. J. B. (1954). Symposium on the effects of coaching and practice intelligence tests
(ID. British Journal of Educational Psychology, 24, 547-557.
Evaluación del potencial de aprendizaje 627
DeWeerdt, E. H. (1927). A study of the improbability of fifth grade school children in cer-
tain mental functions. Journal of Educational Psychology, 18, 547-557.
Feuerstein, R. (1968). Learning Potential Assessment Device. En B. W. Richards (dir.), Pro-
ceedings of the First Congress of the International Association for the Scientific Study of
Mental Deficiency. Surrey, Inglaterra. Michael Jackson Publishing Co. Ltd.
Feuerstemn, R. (1970). A dynamic approach to the causation, prevention and alleviation of re-
tarded performance. En H. C. Haywood (dir.), Sociocultural aspects of mental retarda-
tion. Nueva York. Appleton-Century-Crofts.
Feuerstei, R. (1978). The dinamic assessment of retarded performers: The learning potential
assessment device. Baltimore. University Park Press.
Feuerstein, R. (1980). Instrumental enrichment: A intervention program for cognitive modi-
frability. Baltimore. University Park Press.
Feuerstein, R. (1986). Mediated learning experience. Jerusalén. WIZO-Canadá Research Insti-
tute.
Feuerstein, R., Haywood, H. C., Rand, Y., Hoffman, M. B. y Jensen, M.R. (1985). Learning
Potential Assessment Device: Manual. Jerusalén. Hadassah-WIZO-Canada Research Insti-
tute.
Feuerstein, R. y Rand, Y. (1977). Redevelopment of cognitive functions of retarded adoles-
cents: Instrumental Enrichment. Jerusalén. WIZO-Canadá Research Institute.
Gimon, A., Budoff, M. y Corman, L. (1974). Learning potential measurement with spanish-
a youth as an alternative to 1Q tests: A first report. Interamericam Tettmalof Psy-
chology, 8, 233-246.
James, W. S. (1953). Symposium on the effects of coaching and practice in intelligence tests.
British Journal of Educational Psychology, 23, 155-163.
Jensen, M. R. y Feuerstein, R. (1987). The Learning Potential Assessment Device: From philo-
sophy to aractice. En C. Lidz (dir.), Dynamic assessment: An interactional approach to
evaluating learning potential. Nueva York. Guilford Press.
Khos, (1923). Intelligence measurement. Nueva York. MacMillan.
Penrose, L. S. (1934). Mental defect. Nueva York. Farrar and Rinehart.
Prieto, M. D. (1987). El potential de aprendizaje: un modelo y un sistema aplicado de evalua-
ción. Murcia. Instituto de Ciencias de la Educación (ICE), Universidad de Murcia.
Prieto M. D. (1988). Manual de la evaluación dinámica del potencial de aprendizaje (EDPA).
Murcia. Instituto de Ciencias de la Educación (ICE), Universidad de Murcia.
Prieto, M. D., Rodríguez, A. y Bermejo, M. R. (1991). Diseño e investigación de un programa
de habilidades, procesos y estrategias de aprendizaje en una muestra de sujetos con necesi-
dades educativas especiales. Anuario Español e Iberoamericano de Investigación en Edu-
cación Especial, 131-162.
Prieto, M. D. y Arnaiz, P. (1991). La evaluación dinámica de la inteligencia: un modelo para
evaluar los procesos metacognitivos. Ponencia presentada en el Simposium Internacional
sobre Evaluación Diagnóstica y Entrenamiento Cognitivo del Niño Deficiente Mental.
Zaragoza. '
Raven, ]. C. (1947, 1956, 1958). Tests de matrices progresivas. Escala especial. Buenos Aires.
Paidós.
Rey, A. (1934). D'un procédé par evaluer Peducabilité: quelques applications en psychopa-
thologie. Archives de Psychologie, 24, 297-337. de
Rey, A. (1950). Six épreuves au service de la psychologie clinique. Bruselas. Etablissements
Bettendorf.
Rey, A. (1958). L'examen clinique en psychologie. París. PUF. E Dire
Rulon, P. y Schweiner, R. (1953). Validation of a non-verbal test of military trainability. De-
partamento de la Armada.
Schuman, H. (1960). Evaluating the educability of the severely mentally retarded child. Ps)-
chological Monographs, 74 (número monográfico).
628 María Dolores Prieto
Vernon, P. E. (1954). Symposium on the effects of coaching and practice in intelligence tests (V).
British Journal of Educational Psychology, 24, 57-63.
Vigotski, L. S. (1978). Mind in society: The development of higher psychological processes.
Cambridge. Harvard University Press. [El desarrollo de los procesos psicológicos superio-
res, Barcelona, Crítica, 1995.] FUE A
Yates, A. (1953). Symposium on the effects of coaching and practice in intelligence tests (1).
British Journal of Educational Psychology, 23, 47-162.
Wiseman, S. (1954). Symposium on the effects of coaching and practice in intelligence tests (IV).
British Journal of Educational Psychology, 24, 5-8.
Zigler, E. y Butterfield, E. C. (1968). Motivational aspects of changes in IQ test performance
of culturally deprived nursery school children. Child Development, 39, 1-14.
LECTURAS COMPLEMENTARIAS
nc joa
IVA 110 VOI
. a ») hs
o . ed Le
0 0%
y - mis > LAA de «HA
í AT "RA A MS ,
5 . A e A >
ñ ] > -. mi qe me>
.q
A Micra
A Ñ
en 1ra paMuda Ñ de sucios dos YTE PA RA
nl sa? » 0 e ps qe7 dp Nod a
aj O » Le RIO
bas" E
0
“ 3 E
ey SN
«
EUA SA
26. EVALUACIÓN DE LA MEMORIA Y LA ATENCIÓN
L. LA MEMORIA Y SU EVALUACIÓN
Las primeras pruebas de memoria (Wells y Martin, 1923; Babcock y Levy, 1940) se
caracterizaron por una excesiva carga de medidas de inteligencia. Ello llevó a Ey-
senck y Haldstead (1945) a proponer una serie de criterios de elaboración de pruebas
de memoria que se mantienen hoy en día: evaluar adquisición y retención, no ser
molestas para el sujeto y no correlacionar excesivamente con la inteligencia. Después
de las recomendaciones de estos autores se desarrollaron multitud de escalas de tipo
psicométrico que evalúan la capacidad de memoria a partir de la acumulación de da-
tos sobre su funcionamiento sin defender hipótesis previas (Weschler, 1945; Benton,
1945, 1974). De hecho, la proliferación de teorías experimentales sobre el funciona-
miento de la memoria (Atkinson y Shiffrin, 1968; Craik y Lockhart, 1972; Baddeley
y Hitch, 1974) apenas afectó al área de la evaluación. A partir de los años setenta se
produce un movimiento que trata de centrar la evaluación de la memoria en datos
ecológicamente relevantes (Neisser, 1978) y que da lugar a la aparición de multitud
de cuestionarios de memoria y metamemoria, pero que aleja, sobre todo en el caso
de estos últimos, la evaluación de la memoria del ámbito de la ejecución. Última-
mente han aparecido pruebas que combinan el ámbito de la ejecución con la relevan-
cia ecológica (Wilson, Cockburn y Baddeley, 1985).
Universidad de Sevilla.
632 J. García-Martínez, J. M. Rodríguez-González y Alfonso Blanco-Picabia
se también el estado afectivo y cognitivo general del sujeto (Thompson, 1980). Una
vez definido el problema como puramente mnésico o, al menos, que este tipo de
deterioro también está presente, se ha de elegir una serie de instrumentos según la si-
guiente sistematización:
a. Una batería de memoria para explorar el nivel de ejecución general del su-
jeto.
b. Una serie de pruebas de tipo específico que pormenoricen la ejecución para
ese tipo de material, ya que ciertos déficit de memoria suelen alterar únicamente el
recuerdo de cierto tipo de información, fundamentalmente cuando el problema se
relaciona con lesiones cerebrales unilaterales (Milner, 1958; Speedie y Heilman,
1982). Las pruebas de tipo verbal son sensibles a problemas situados en el hemisferio
izquierdo y las no verbales a las lesiones del hemisferio derecho.
c. Una exploración de la memoria primaria; por ejemplo, mediante pruebas de
amplitud. Este tipo de tareas es preferible administrarlas si se sospechan problemas
en la atención, depresión o demencia (Stenberg y Jarvik, 1976; Ericksonn y Howie-
son, 1986).
d. Quela aplicación de las pruebas incluya, al menos, una prueba de recuerdo
diferido del material aprendido y comparar esta ejecución con la habida para el re-
cuerdo inmediato, ya que este tipo de recuerdo es más sensible a los efectos del dete-
rioro en la memoria secundaria (Milner, 1958).
e. Administrar tests de memoria remota tanto semántica como episódica ya
que esto puede ayudar a establecer un diagnóstico pormenorizado, al menos para al-
gunos síndromes que cursan con problemas de amnesia (Schacter y cols., 1982), ade-
más de dar datos cualitativos sobre los recuerdos intactos o dañados en el sujeto y su
extensión temporal.
f. Administrar alguna escala de evaluación de la metamemoria para conocer as-
pectos subjetivos del daño y la opinión del paciente al respecto, además de centrar el
tipo de quejas que importan a éste.
La característica común a todas las pruebas que evalúan este tipo de memoria es que
se hace de modo diferido. Los tipos de técnicas que suelen utilizarse para la medida
de la memoria secundaria son las de recuerdo libre de palabras, recuerdo de frases y
de párrafos, entre las que se emplean estímulos verbales, y técnicas de recuerdo de
rutas y lugares, entre las no verbales. En el recuerdo de listas de palabras se puede
proporcionar la categoría semántica a la que pertenecen éstas para facilitar la recupe-
ración. Una tarea ecológica asimilable a éstas es el recuerdo de listas de la compra
que discrimina problemas de memoria (McCarthy y cols., 1981).
636 ]. García-Martínez, J. M. Rodrígnez-González y Alfonso Blanco-Picabia
Todas las tareas de memoria asociativa, tanto verbal como no verbal, son aconse-
jables también para evaluar la memoria secundaria. Entre ellas nos encontramos con
pruebas de pares asociados (que se suelen incluir también en todas las baterías), re-
cuerdo de nombres y apellidos que discrimina grupos con patologías y de edad
(Clark y cols., 1982), recuerdo de caras y recuerdo de la asociación cara-nombre. Las
tareas de frases o párrafos evalúan también este tipo de memoria, aunque algunos
autores opinan que los instrumentos construidos con párrafos evalúan también me-
moria episódica. El gran problema de las pruebas de párrafos es su puntuación, ya
que las reproducciones no suelen ser literales. Los errores más comunes que se co-
meten son sustituciones, omisiones y alteraciones del contenido. Rapaport, Gill y
Schaffer (1968) recomiendan puntuar como correcto todo recuerdo que no altere el
significado de la historia. Las aplicaciones en diferido discriminan muy bien entre
normales y amnésicos (Milner, 1958; Stenberg y Jarvik, 1976). Entre las pruebas es-
tandarizadas la NYU y el RBMT son adecuadas para evaluar este tipo de memoria.
Al margen de las diversas pruebas de ejecución que evalúan los diversos almacenes
de la memoria y del valor de los trabajos sobre memoria cotidiana, se han desarrolla-
do multitud de cuestionarios de metamemoria. No son pruebas de ejecución, sino
pruebas de metamemoria que evalúan el conocimiento que una persona tiene acerca
del funcionamiento de sus propios procesos de memoria (Flavell, 1977). Todas estas
pruebas exploran diversos aspectos de la memoria que van desde la autopercepción
de la bondad de la ejecución de tareas de memoria a rasgos de personalidad asocia-
dos a la memoria pasando por el uso de mnemónicos (Herrmann, 1984; Gilewski y
Zelinski, 1986). Se diferencian también en los tipos de escala de medida que utilizan.
La fiabilidad (estabilidad temporal) es adecuada, oscilando alrededor de 0,80 (Herr-
mann, 1984), pero su validez es muy baja. Sólo excepcionalmente se encuentran gra-
Evaluación de la memoria y la atención
637
Es la batería de memoria más utilizada y la que ha merecido mayor interés por parte
de los investigadores. Incluye siete subescalas: información general, orientación in-
mediata (ambas tratan de evaluar el estado de confusión del examinado), control
mental (incluye ítems de rastreo y reproducción de tareas automáticas), memoria ló-
gica (recuerdo inmediato de párrafos), amplitud de dígitos (en el orden de presenta-
ción y en el inverso), reproducción visual de estímulos visuales y aprendizaje verbal
de pares asociados. Cada escala es puntuada en función del número de aciertos si-
guiendo criterios rigurosos y la suma de las puntuaciones de cada subescala da la
puntuación total que luego es traducida a un cociente de memoria en función de la
edad.
La estandarización inicial de la prueba se realizó con 200 sujetos adultos (no an-
cianos) y normales. Más tarde se han realizado baremaciones para poblaciones de
otras edades (Hulicka, 1966; Meer y Baker, 1965; Ivinskis, Allen y Shaw, 1971). No
existen baremaciones para muestras de España, aunque las subescalas de memoria
lógica, amplitud de dígitos y pares asociados fueron adaptadas por Cordero (1978)
para la realización del Test de memoria auditiva inmediata. De igual manera, existe
una adaptación de los subtests de pares asociados y memoria lógica (Montorio,
1990). Dada la inexistencia de baremos generales para la población española se sue-
len utilizar los de la edición francesa (Centro de Psicología Aplicada de París).
Existe una forma paralela del test (Stone y Weschler, 1946) con una correlación
con la primera de 0,80 (Stinnet y Digtacomo, 1970), aunque no ha sido baremada,
Hay datos ambiguos acerca de la estabilidad temporal de la prueba, encontrándose
alta en unos estudios (Caldwell y Watson, 1954; Caldwell, 1954) e ínfima en Otros
(Struckett, 1953). La consistencia interna sólo alcanza niveles medios lo que indica
que está compuesta por varios factores (Hall y Toal, 1957; Ivinskis y cols., 1971). Los
análisis factoriales suelen ser muy estables, encontrando normalmente dos o tres di-
638 J. García-Martínez, J. M. Rodrígnez-González y Alfonso Blanco-Picabia
Esta escala ha sido construida específicamente para pacientes con daño moderado o
severo en funciones de almacenamiento o recuperación de la información. Contiene
siete subtests: información general, que pide al sujeto evaluado que responda a una
serie de ítems de orientación; recuerdo de palabras; recuerdo de dígitos en el orden
de presentación y en el inverso; recuerdo de pares asociados verbales; recuerdo de
párrafos; reconocimiento de dibujos de objetos comunes, y aprendizaje incidental
de los nombres de los subtests. Las pruebas de recuerdo de párrafos, palabras, pares
asociados y reconocimiento de dibujos tienen tres ensayos, uno inmediato y dos di-
feridos, el segundo de éstos al cabo de 24 horas. La aplicación de toda la prueba re-
quiere un tiempo de aplicación breve (sobre 20 minutos). El orden de presentación
permite diferenciar la recuperación del almacenamiento separando tareas de recuer-
do inmediato y diferido utilizando distractores. Posee cinco formas paralelas. Ex-
cepto el test de información general, la prueba es sensible al efecto de la edad y del
daño de memoria en los grupos patológicos. Permite obtener medidas de aprendiza-
je y recuerdo en múltiples tareas, permite la evaluación del recuerdo diferido (me-
moria a largo plazo) y considera el efecto del aprendizaje incidental, por lo que, se-
gún Ericksonn y Howieson (1986), es una buena alternativa a la WMSs. Al estar
excesivamente cargado de pruebas verbales penaliza a los sujetos con déficit limgúís-
tico y puede ser insensible al déficit de la memoria no verbal (Lezak, 1983). Todavía
no se han realizado estudios sobre su validez y fiabilidad.
Esta prueba se diferencia de las típicas baterías y tests de laboratorio en que está
constituida por análogos de situaciones de olvido de la vida diaria con alta validez
ecológica por lo que el test se incluye dentro del enfoque de la memoria cotidiana. Es
un test con una gran orientación práctica y construido para contribuir a la compren-
sión y rehabilitación del déficit de memoria. Se inscribe dentro de laslíneas marcadas
por Ericksonn, Poon y Walsh-Sweeney (1980) para la construcción de un test obje-
tivo de evaluación del déficit amnésico. Ningún otro test cumple estas características
640 J. García-Martínez, J. M. Rodríguez-González y Alfonso Blanco-Picabia
y se trata de un intento por salvar las distancias entre las pruebas de laboratorio y los
tests con validez ecológica. Tiene un amplio apoyo teórico de datos experimentales
y neurológicos. Las once tareas que componen la batería cubren las siguientes áreas:
recuerdo de un nombre y un apellido, recuerdo de la localización de un objeto, re-
cuerdo de un compromiso, reconocimiento de dibujos, recuerdo inmediato y diferi-
do de un párrafo, recuerdo de un recorrido inmediato diferido, recuerdo de la reali-
zación de un recado, reconocimiento de caras, aprendizaje de una tarea nueva,
introducir fecha y hora en un reloj digital y preguntas de orientación.
El test resulta discriminativo para pacientes amnésicos (Wilson, 1987) y ancianos
(Cockburn y Smith, 1988; Sánchez-Cánovas y García Martínez, 1991). Tiene una
alta correlación con otras pruebas de memoria como la WMS y los subtests de párra-
fos del NYU y las pruebas de elección forzosa de caras y palabras de Warrington
(1984), así como con listados de problemas de memoria realizados por los terapeutas
e informados por los sujetos (Wilson, 1987; Sánchez-Cánovas y García Martínez,
1991). Posee una alta fiabilidad interjueces (1,00) y test-retest (0,96) con un lapso de
una semana (Wilson, 1987). Su consistencia interna es mediocre (alfa = 0,59) lo que
parece indicar que las tareas que lo componen son diferentes entre sí (Sánchez-
Cánovas y García Martínez, 1991). El test dispone de cuatro formas paralelas que
correlacionan significativamente entre ellas (Wilson, 1987).
Es la prueba de memoria no verbal más conocida, existiendo una edición con barema-
ciones para la población española. La prueba posee tres formas paralelas (C, D, E),
aunque parece que la forma D presenta mayor dificultad para los sujetos (Benton,
1974). Todas las formas consisten en diez láminas que representan uno o tres dibujos
geométricos más o menos complejos. El test puede administrarse de cuatro formas
diferentes que implican memoria inmediata (dos de ellas), recuerdo diferido y copia.
A través de este procedimiento se evalúa memoria visual inmediata, aunque las lámi-
nas que disponen de tres diseños son una medida primaria de la amplitud de memo-
ria. El test pone también de manifiesto ciertos problemas de desorganización visoes-
pacial evidenciados en los diversos tipos de errores que pueden cometerse. Se puntúa
atendiendo a la cantidad de aciertos y a la cantidad de errores y tipo de éstos (omisio-
nes, distorsiones, perseveraciones, rotaciones y desplazamientos), tanto en el sector
izquierdo como en el derecho. La interpretación de las puntuaciones tiene en cuenta
la inteligencia y la edad del sujeto.
La fiabilidad del test —con procedimientos test-retest— es muy alta (0,77 a los
12 meses según Lezak, 1983). La fiabilidad por el procedimiento de las dos mitades
es de 0,76. La fiabilidad entre las distintas formas del test oscila entre 0,81 y 0,90. La
tasa de acuerdo entre distintos jueces llega a 0,90-0,94 (Egeland, Rice y Penny, 1967).
El problema de esta prueba parece ser que no está totalmente libre de efectos
verbales ya que muchas láminas pueden ser recodificadas verbalmente (Snow, 1979;
Zubrick y Smith, 1979). Discrimina entre pacientes orgánicos y psiquiátricos (Ben-
ton, 1974; Heaton, Baade y Jonhson, 1978), aunque no todos los estudios apuntan
en esta dirección (Burgess y cols., 1970). También es sensible al deterioro debido a la
Evaluación de la memoria y la atención
641
edad. Algunos estudios sugieren que evalúa más percepción visoespacial o funciones
visomotoras que memoria visual inmediata (Silverstein, 1962; Chansky, 1967).
Este inventario publicado por Herrmann y Neisser (1978) constituye uno de los
cuestionarios de metamemoria que más desarrollo ha experimentado. Los autores
suponen que la memoria es un proceso pluridimensional y que cada una de esas di-
mensiones ha de ser evaluada de modo independiente; por ello, el test se divide en
dos partes: una que pregunta acerca de experiencias de olvido y otra que se ocupa de
experiencias de recuerdo. La parte relativa a olvidos está compuesta por ítems agru-
pados en ocho dimensiones concretas confirmadas factorialmente (Herrmann y
Neisser, 1978). La subsección de recuerdos se compone de tres partes. La fiabilidad
es mayor para la parte de olvidos que para la de recuerdos. El test no correlaciona
con pruebas de ejecución. Existe una versión abreviada.
1L1. Introducción
Resulta curioso comprobar cómo, aun cuando la gran mayoría de los procesos y
funciones cognitivas ha merecido un gran interés por parte de los profesionales de la
evaluación, la atención ha sido relegada en muchas ocasiones a un segundo plano. El
motivo que a menudo se ha alegado para justificar esta acción ha sido afirmar que la
atención se constituía en un requisito imprescindible previo y mantenido durante la
realización de una tarea, circunstancia por la que cualquier prueba que precisase una
ejecución en un tiempo determinado facilitará información sobre la atención (Ro-
dríguez-González y Mesa, 1987, 1990). En la investigación básica y experimental es
posible hallar un interés creciente por el estudio de la atención, cuyo inicio puede si-
642 ]. García-Martínez, J. M. Rodríguez-González y Alfonso Blanco-Picabia
Años más tarde, Kidd y Greenwald (1988) indican que estas cuestiones conti-
núan preocupando y que aún no existe una respuesta definitiva. Ante este panorama
resulta casi comprensible y lógico que las aportaciones que desde el ámbito de la
evaluación psicológica se han realizado sean breves, raras y escasas. Entiéndase aquí
que hacemos referencia a pruebas o tests estandarizados, baremados y con unas ga-
rantías psicométricas mínimas, ya que en la investigación han sido y son muy fre-
cuentes lo que podríamos llamar “tareas experimentales”, éstas carecen de los requi-
sitos más básicos y necesarios para ser incluidas bajo la denominación de tests.
Esta prueba, creada por Thurstone (1944) y adaptada por Yela (1979) a la población
española, sigue un patrón de ejecución similar al 77, variando únicamente los estí-
mulos. Los datos psicométricos españoles se centran en el análisis de su fiabilidad y
validez. En el primer caso, mediante la técnica de test-retest (con un intervalo de un
año), el coeficiente de estabilidad alcanzó 0,60, mientras que con la división en dos
mitades se lograron unos valores que oscilaban entre 0,94 y 0,97. En cuanto a la vali-
dez de criterio, ésta fue bastante reducida (0,38).
Este test de 1944 es el resultado de los estudios iniciados por Thurstone, presentan-
do una dinámica de funcionamiento similar a los casos anteriores. Presenta unas al-
tas correlaciones con instrumentos que evalúan visualización estática, rapidez per-
ceptiva, orientación y velocidad. Existe baremación española (TEA, 1979), y se
encuentra especialmente recomendado para la orientación escolar y profesional y la
selección de personal. Resulta interesante comprobar cómo en los análisis factoriales
en niños mayores y adultos se independiza esta prueba de aquellas otras que ponen
de manifiesto el factor g.
El Test de ejecución continua es la prueba más utilizada y la más versátil. Con la pre-
tensión de evaluar la atención mantenida y con la finalidad inicial de servir en el diag-
nóstico diferencial de lesión cerebral, Rosvold y cols. (1956) elaboran una tarea que
con el paso del tiempo y diversos estudios psicométricos ha adquirido una gran rele-
vancia en este ámbito. La versatilidad de este instrumento hace que sea posible apli-
carlo con y sin distractores y en versiones tanto auditivas como visuales. Asimismo,
ha sufrido distintas modificaciones; no obstante, tal y como informan Halperin,
Wolf y Pascualvaca (1988), la forma más utilizada es la original y la más difícil, la ver-
sión de Erlenmeyer-Kimling y Cornblatt (1978). La tarea a realizar por los sujetos
examinados consiste en presenciar la aparición de 680 estímulos (de los que 84 son
considerados diana) mediante la pantalla de un ordenador. Cada uno de ellos perma-
nece 0,53 segundos, con un intervalo interestímulos de un segundo. A pesar de que
este sistema de aplicación es más complicado y requiere un mayor procesamiento a
nivel cognitivo, tiene a su favor el hecho de que los resultados finales son más discri-
minativos. Suelen tenerse en cuenta dos cuestiones fundamentales: errores de omi-
sión y errores de comisión. En este caso, mientras autores como Halperin y cols.
(1988) opinan que se ponen de manifiesto tanto la impulsividad como la inatención,
Sykes, Douglas y Weiss (1971) y Sostek, Buchsbaum y Rapoport (1980) se inclinan
exclusivamente por la impulsividad.
Evaluación de la memoria y la atención
647
Vocales
Esta prueba elaborada por Seisdedos data de 1976, planteándose como objetivo eva-
luar el grado de atención y resistencia a la fatiga en una tarea monótona con material
desconocido y distractivo (Seisdedos, 1976). El material de trabajo lo constituye el
alfabeto ibérico primitivo, proporcionando siempre y a la vista las claves correspon-
dientes con el fin de evitar cualquier sesgo motivado por el posible mal estado de la
memoria.
Consonantes
Seisdedos (1980) elabora este instrumento con el objetivo de evaluar aspectos tanto
perceptivos como atencionales. No obstante, el autor ha intentado vincular el test a
tareas académicas o escolares, motivo por el que para su realización se requiere una
formación básica.
Palabras-1 (TO-1)
Este instrumento elaborado por Rosel (1990) intenta evaluar la capacidad de obser-
vación, considerada ésta como una dirección intencional de la atención voluntaria
aplicada a un objeto externo, con la finalidad de percibirlo o aprehenderlo en su to-
talidad y darnos cuenta de alguno de sus aspectos o cualidades. La prueba la compo-
nen 60 elementos formados por cuatro palabras que es necesario contrastar con un
modelo. Uno de los principales problemas de la prueba, reconocido por el autor, ra-
dica en que es fácil que pueda aparecer el factor cansancio, lo que supone un impor-
tante sesgo de los resultados.
De las seis partes que constituyen esta prueba elaborada por Cruz (1986), y aun
cuando todas ellas miden aspectos relacionados con la evaluación, la autora ha ais-
lado dos apartados que se ocupan de detección de errores y codificación. Los estu-
dios de fiabilidad (test-retest) señalan unos valores de 0,94 y 0,97 respectivamente
para cada uno de los subtests. Asimismo, la covariación con la puntuación total al-
canza 0,76 en ambos casos.
Este instrumento está formado por ocho pruebas de las que comprobación y codifi-
cación se relacionan directamente con atención y atención concentrada.
por el que se ha optado por denominarlas tareas. Aunque los estudios se iniciaron
recurriendo a tareas auditivas, el desarrollo posterior supuso la inclusión de las vi-
suales, las cuales han tendido a convertirse en tests. En cuanto a las tareas auditivas,
generalmente se han centrado en la escucha dicótica (por ejemplo, Ruiz y Bermúdez
[1992] con pacientes depresivos) o la tarea de Strub y Black [1985]) y escucha selecti-
va en modalidad dicótica. Por lo que respecta a las tareas visuales, éstas suelen glrar
alrededor de las siguientes acciones: identificación rápida, discriminación, aptitudes
espaciales y trazado. De esta forma encontramos la Operación de curva de trazado
de Jolicoeur, Ullman y Mackay (1986), empleada últimamente por McCormick y
Jolicoeur (1992) como estímulo para captar la atención visual, y la Tarea de elección
con tiempo de reacción. Cabe también la posibilidad de emplear las denominadas
Pruebas de control mental, consistentes en pedir al sujeto que cuente, por ejemplo,
desde 100 hacia atrás en series de 7, repetir el abecedario en sentido inverso, etc. Ac-
tualmente es posible hallar la agrupación de diversas tareas que analizan otras tantas
modalidades sensoriales; éste es el caso de las investigaciones de Ellis (1991) y Fein-
berg y Mcllvried (1991). Ellis (1991) utiliza completamiento de sentencias, audición
selectiva, tiempo de reacción motor utilizando la mano no dominante (para facilitar
la focalización de la atención), cálculo numérico y recuerdo de palabras a corto pla-
zo. Por su parte, Feinberg y Mcllvried (1991) conforman lo que denominan una Ba-
tería de tareas atencionales con tarea de resta en series de tres y en sentido inverso
(Lezak, 1983), repetición de sentencias, tachado de letras y la prueba de atención
SOA de la Batería de diagnóstico cognitivo de Kay (1982).
REFERENCIAS BIBLIOGRÁFICAS
Albert, N. S., Butters, N. y Levin, J. (1979). Temporal gradients in the retrograde amnesia of
patients with alcoholic Korsakoff's disease. Archives ofNeurology, 36, 211-216.
Ash, R. C. (1977). Memory: Clinical assessment and behavior measures. Á short study of the
Weschler memory scale. Tesis doctoral inédita. Universidad de Londres. |
Atkinson, R. C. y Shiffrin, R. M. (1968). Human memory: A proposed system and its control
processes. En K. W. Spence y J. T. Spence (dirs.), The psychology of learning and motiva-
tion: Advances in research and theory (vol. 11). Nueva York. Academic Press.
Babcock, H. y Levy, L. (1940). Test and manual of directions: The revised examination of the
measurement of efficiency of mental functioning. Chicago. Stoelting.
Baddeley, A. D. (1979). The limitations of human memory: Implications for the design of re-
trospectives surveys. En L. Moss y H. Goldstein (dirs.), The recall methods in social scien-
ces. Londres. Educational Institute, Universidad de Londres.
Baddeley, A. D. y Hitch, G. (1974). Working memory. En G. H. Bower (dir.), Recent ad-
vances in learning and motivation (vol. VI11).
Bahrick, H. P. (1979). Maintenance of knowledge: Questions about memory we forget to
ask. Journal of Experimental Psychology: General, 108, 296-308.
Babrick, H. P. y Karis, D. (1982). Long-term colegial memory. En C. R. Puff (dir.), Hand-
book of research methods in intelligence, memory and cognition. Nueva York. Academic
Press.
Bennett-Levy, J. y Powell, G. E. (1980). The subjective memory questionnaire: Án investiga-
tion into the self-reporting of real-life memory skills. British Journal of Social and Clinical
Psychology 19, 177-188.
Benton, A. L. (1945). A visual retention test for clinical use. Archives of Neurology and Psy-
chiatry, 54, 212-216.
Benton, A. L. (1974). The revised visual retention test. Nueva York. Psychological Corpora-
tion.
Benton, A. L. (1981). Test de retención visual. Madrid. TEA.
Benton, A. L. y Hamsher, K. S. (1976). Multilingual aphasia examination. Manual. lowa
City. University of Iowa.
Botwinick, J. y Storandt, M. (1974). Memory related functions and age. Springfield. Charles
Thomas.
Botwinick, J. y Storandt, M. (1980). Recall and recognition of old information in relation to
age and sex. Journal of Gerontology, 35, 70-76.
Broadbent, D. E. (1958). Perception and communication. Londres. Pergamon Press.
Broadbent, D. E. (1971). Attention and stress. Londres. Academic Press.
Broadbent, D. E., Cooper, P. E., Fitzgerald, P. y Parkes, K. R. (1982). The cognitive failures
questionnaire and ¡ts correlates. British Journal of Clinical Psychology 21, 1-16.
Brooks, D. N. y Baddeley, A. D. (1976). Whar can amnesics learn? Neuropsychologia, 14,
111-122,
Burgess, M., Kudanz, A., Ziegler, D. y Greenberg, H. (1970). Prediction of brain damage in
the clinica populations. Perceptual and Motor Skills, 30, 523-534.
Caldwell, B. M. (1954). An evaluation of psychological efects of sex hormona administration
in aged women. Journal of Gerontology, 8, 168-174.
Caldwell, B. M. y Watson, R. L. (1954). An evaluation of sex hormona replacement in aged
women. Journal of Genetic Psychology, 85, 181-200.
Chansky, N. (1967). Validity of the Benton visual retention test. Perceptual and Motor Skills,
24, 1126.
Clark, E., Ferris, S. H., Crook, T. y McCarthy, M. (1982). Paired-associate span and learning
in aging and dementia. Documento inédito.
Evaluación de la memoria y la atención
651
Cockburn, J. y Smith, P. T. (1988). Effects of age and intelligence on everyday memory tasks.
En M. M. Grunenberg, P. E. Morris y R. N. Sykes (dirs.), Practical aspects of memory:
Current research and issues. Nueva Jersey. Wiley.
Cohen, N. J. (1984). Preserved learning capacity in amnesia: Evidence for multiple memory
systems. En L. R. Squire y N. Butters (dirs.), Nexropsychology of memory. Nueva York.
Guilford Press.
Cohen, N. J. y Squire, L. R. (1981). Retrograde amnesia and remote memory impairment.
Neuropsychologia, 19, 337-356.
Cordero, A. (1978). Test de memoria auditiva inmediata. Madrid. TEA.
Craick, E. L M. y Lockhart, R. S. (1972). Levels of processing: A framework for memory re-
search. Journal of Verbal Learning and Verbal Behavior, 11, 671-684.
Cronholm, O. y Molander, L. (1957). Memory disturbances after electroconvulsive therapy.
Acta Psychiatrica Scandinava, 32, 280-306.
Cronholm, O. y Ottoson, J. O. (1963). Reliability and validity of a memory test battery. Acta
Psychiatrica Scandinava, 39, 218-234.
Crook, T., Ferris, S. H. y McCarthy, M. (1979). The mispaled object task: A brief test for me-
mory dusfunction in aged. Journal of the American Geriatrics Society, 27, 284-287.
Crook, T., Ferris, S. H., McCarthy, M. y Rae, D. (1980). The utility of digit recall tasks for as-
sessing memory in the aged. Journal of Consulting and Clinical Psychology, 48, 228-233.
Cruz, M. V. (1986). ABI. Aptitudes básicas para la informática. Madrid. TEA.
Cunningham, W. R. (1986). Psychometric prespectives: Validity and reliability. En L. W.
Poon (dir.), Handbook for clinical memory asessment of older adults. Washington, DC.
American Psychological Association.
Davis, L. J. y Swenson, W. M. (1970). Factor analysis of WMS. Journal of Consulting and Cli-
nical Psychology, 35, 430.
Delis, D. C., Kramer, J. H., Kaplan, E. y Ober, B. A. (1987). The California verbal learning
test. Research Edition. Nueva York. Psychological Corporation.
Deutsch, J. A. y Deutsch, D. (1963). Attention: Some theoretical considerations. Psychologi-
cal Review, 70, 80-90.
Dixon, R. A. y Hultsch, D. F. (1983). Structure and development of metamemory in adult-
hood. Journal of Gerontology, 38, 682-688.
Dujovne, B. E. y Levy, B. 1. (1971). The psychometric estructure of the Weschler memory
scale. Journal of Clinical Psychology, 27, 351-354. |
Egeland, B., Rice, J. y Penny, J. (1967). Inter-scores reliability on the Bender gestalt test and
the revised visual retention test. Journal of Mental Defiency, 72, 96-99.
Egeth, H. y Bevan, W. (1979). La atención. En B. B. Wolman (dir.), Mannal depsicología ge-
neral. Bases orgánicas de la conducta y percepción (vol. 11).Barcelona. Martínez Roca.
Ellis, H. C. (1991). Focused attention and depressive deficits in memory. Journal of Experi-
mental Psychology: General, 120, 310-312. : :
Ericksonn, R. C. y Howieson, D. (1986). The clinicians perspective: Measurmg change and
treatment effectiveness. En L. W. Poon (dir.), Handbook for clinical memory asessment of
older adults. Washington, DC. American Psychological Association.
Ericksonn, R. C., Poon, L. W. y Walsh-Sweeney, L. (1980). Clinical memory testing of the
elderly. En L. W. Poon, J. L. Fozard, L. S. Cermack, D. Arenberg y L. W. Thompson
(dirs.), New directions in memory and aging. Hillsdale. Erlbaum. — a
Ericksonn, R. C. y Scott, M. 1. (1977). Clinical memory testing: Ás review. Psychological Bu-
lletin, 84, 1130-1149. : : bread
of children
Erlenmeyer-Kimling, L. y Cornblatt, B. (1978). Attentional measures in a study
ee
at high risk for schizophrena. Journal of Psychiatric Research, 14, 93-98.
y Haldstead, H. (1945). The memory function. American Journal of Psi-
Eysenck, H. ].
chiatry, 102, 174-180.
652 J. García-Martínez, J. M. Rodríguez-González y Alfonso Blanco-Picabia
Howard, A. R, (1954). Further validation of The WMS with selected groups of institucionali-
zed patients. Journal of Consulting Psychology, 10, 164-167.
He o Mel Gs; Minds $ey Comen, A. (1978). The hyperactive child at adolescence:
E A emotional and social functioning. Journal of Abnormal Child Psychology, 6,
Hughes, H. C. y Zimba, L. D. (1985). Spatial maps of directed visual attention. Jonrnal of Ex-
perimental Psychology: Human Perception and Performance, 11, 409-430.
Hughes, H. C. y Zimba, L. D. (1987). Natural boundaries for the spatial spread of directed
visual attention. Nenropsychología, 25, 5-18.
o Ba M. (1966). Age differences in WMS scores. Journal of Genetic Psychology, 109,
Ivinskis, A., Allen, S. y Shaw, E. (1971). An extension of WMS norms to lower age groups.
Journal of Clinical Psychology, 27, 354-357.
Ivnik, R. J., Malec, J. F., Tangolos, E. G., Petersen, R. C., Kukmen, E. y Kurland, L.T. (1990).
The auditory verbal learning test (AVLT). Psychological Assessment, 2, 304-312.
Johnston, N. A. y Heinz, S. P. (1978). Flexibility and capacity demands of attention. Journal
of Experimental Psychology: General, 102, 420-437.
Jolicoeur, Ullman, S. y Mackay, M. (1986). Curve tracing: A posible basic operation in the
perception of spatial relations. Memory and Cognition, 14, 129-140.
Kahneman, D. (1973). Attention and effort. Nueva Jersey. Prentice Hall.
Kaufman, A. S. (1979). Intelligent testing with the WISC-R. Somerset. Wiley.
Kay, S. (1982). Manual for the cognitive diagnostic battery. Odessa. Psychological Assess-
ment Resources.
Kear-Colwell, J. J. (1973). The structure of WMS and its relationship to brain damage. British
Journal of Social and Clinical Psychology, 12, 384-392.
Keenan,J.M., MacWhinney, B. y Mayhew, D. (1977). Pragmatics in memory: A study of na-
tural conversation. Journal of Verbal Learning and Verbal Behavior, 16, 549-560.
Kidd, G. R. y Greenwald, A. G. (1988). Attention, rehearsal, and memory for serial order.
American Journal of Psychology, 101, 259-279.
Kimura, D. (1963). Right temporal lobe damage. Archives of Neurology, 8, 264-271.
Lezak, M. D. (1979). Recovery of memory and learning functions following traumatic brain
injury. Cortex, 15, 63-70.
Lezak, M. D. (1983). Neuropsychological assessment. Nueva York. Oxford University Press.
Lindsay, P. H. y Norman, D. A. (1983). Introducción a la psicología cognitiva (2* ed.). Ma-
drid. Tecnos.
Longman, R.S., Inglis,J.y Lawson, J. S. (1991). WISC-R patterns of cognitive abilities in beha-
vior disorded and learning disabled children. Psychological Assessment, 3, 239-246.
Malec, J. F., Ivnik, R. y Hinkeldey, N. S. (1991). Visual spatial learning test. Psychological As-
sessment, 3, 82-88.
McCarthy, M., Ferris, S. H., Clarck, E. y Crook, T. (1981). Acquisition and retention of cate-
gorized material in normal aging and senile dementia. Experimental Aging and Research, 7,
127-135.
McCormick, P. A. y Jolicoeur, P. (1992). Capturing visual attention and the curve tracing
operation. Journal of Experimental Psychology: Human Perception and Performance, 18,
72-89.
ng of geria-
Meer, B. y Baker,J.A. (1965). Reliability of measurement of intellectual functioni
tric patients. Journal of Gerontology, 20, 410-414... ;
M. (1960). Defects of learning ability with massive lesions of the tem-
Meyer, V. y Falconer,
poral lobe. Journal of Mental Sciences, 106, 472-477.
654 J. García-Martínez, J. M. Rodríguez-González y Alfonso Blanco-Picabia
Milner, B. (1958). Psychological defects produced by temporal lobe excision. Research Ner-
vous and Mental Disorders, 36, 244-257. ,
Milner, B. (1971). Interhemispheric differences in the localization of psychological proceses
in man. British Medical Bulletin, 27, 272-277.
Mitchell, D. B. (1989). How many memory systems? Evidence from aging. Journal of Expe-
rimental Psychology: Learning, Memory and Cognition, 15, 31-49.
Montorio, C. (1990). Evaluación psicológica en la vejez: instrumentación desde un enfoque
multidimensional. Tesis doctoral inédita. Universidad Autónoma de Madrid.
Mordkoff, J. T. y Yantis, S. (1991). An interactive race model of divided attention. Journal of
Experimental Psychology: Human Perception and Performance, 17, 520-538.
Morris, P. E., Grunenberg, M. M., Sykes, R. y Merrick, A. (1981). Football knowledge and
the acquisition of new recall. British Journal of Psychology, 72, 479-484.
Neisser, U. (1978). Memory: What are the important questions. En M. M. Grumenberg,
P. E. Morris y R. N. Sykes (dirs.), Practical aspects of memory. Londres. Academic Press.
Newcombe, F. (1969). Missile wounds of the brain. Londres. Oxford University Press.
Nideffer, R. (1973). Preliminary manual for the test of attentional and interpersonal styles.
Rochester. University of Rochester.
Niederehe, G., Nielsen-Collins, K. E., Volpendesta, D. y Woods, A. M. (1981). Metame-
mory processes in perception: Depression and age effects. Comunicación presentada en la
reunión de la Gerontological Society of America. Toronto, Canadá.
Osterreith, P. A. (1944). Le test du copie d'une figure complexe. Archives de Psychologie, 30,
206-256.
Pashler, H. (1991). Shifting visual attention and selecting motor responses: Distinct attentio-
nal mechanisms. Journal of Experimental Psychology: Human Perception and Perfor-
mance, 17, 1023-1040.
Perlmutter, M. (1978). What is memory aging the aging of? Developmental Psychology, 88,
3-32.
Peterson, M. R. y Peterson, M. J. (1959). Short-term retention of individual items. Journal of
Experimental Psychology, 58, 193-198.
Posner, M., Sandson, J.. Dhawan, M. y Shulman, G. (1989). Is word recognition authomatic?
A cognitive anathomical approach. Journal of Experimental Psychology: Human Percep-
tion and Performance, 5, 522-526.
Randt, C. T., Brown, E. R. y Osborne, D. P. (1980). A memory test for longitudinal measu-
rement of mild to moderate defficits. Clinical Neuropsychology, 2, 184-194.
Rapaport D., Gill, M. M. y Schafer, R. (1945). Diagnostic pychological testing. Nueva York.
International Universities Press.
Reason, J. T. (1981). Lapses of attention. En R. Parasuraman, R. Daves y J. Bentty (dirs.), Va-
rietes of attention. Londres. Academic Press.
Riege, W. H. (1982). Self-reports and test of memory aging. Clinical Gerontologist, 1, 23-26.
Rizzolatti, G., Riggio, L., Dascola, I. y Umilta, C. (1987). Reorienting attention across the
horizontal and vertical meridians: Evidence in favor a premotor theory of attention. Neu-
ropsychologta, 25, 31-40.
Rodríguez-González, J. M. y Mesa, P. ]. (1987). Planteamientos clínicos en la valoración de
las actividades intelectuales, los procesos cognitivos y sus alteraciones. En A. Blanco
(dir.), Apuntes de diagnóstico clínico. Valencia. Promolibro.
Rodríguez-González,J.M. y Mesa, P. J. (1990). Planteamientos clínicos en la valoración de la
inteligencia, los procesos cognitivos y sus alteraciones. En A. Blanco (dir.), Apuntes de
diagnóstico clínico (2* ed.). Valencia. Promolibro.
Rosel, E. (1990). Palabras 1 (Test de observación). Manual. Madrid. TEA.
Rosvold, H. E., Mirsky, A. F., Saranson, I., Bransome, E. D. y Beck, L. H. (1956). A. conti-
nous performance test of brain damage. Journal of Consulting Psychology, 20, 343-350.
Evaluación de la memoria y la atención
655
Stone, C. P. y Weschler, D. (1946). Weschler memory scale manual. Nueva York. Psycholo-
gical Corporation.
Strub, R. L. y Black, F. W. (1985). Mental status examination in neurology (2* ed.). Filadelfia.
F. A. Davis. :
Struckett, P. B. (1953). Effect of prefrontal lobotomy on intellectual functioning 1 cronic
schizophrenia. Archives of Neurology and Psichiatry, 69, 293-304. ;
Suárez-Noguerol, M. I. (1990). Activación automática y errores cometidos en tareas atencio-
nales. Revista de Psicología General y Aplicada, 43, 463-467.
Sunderland, A., Harris, J. E. y Gleave, S. (1984). Memory failures in everyday memory follo-
wing severe head injury. Journal of Clinical Neuropsychology, 6, 127-142.
Sykes, D. H., Douglas, V. L y Weiss, G. (1971). Attention and hyperactive children and the
effects of methylphenidate. Journal of Child Psychology and Psychiatry, 2, 129-139.
Taylor, E. M. (1959). The appraisal of children with cerebral deficits. Cambridge. Harvard
University Press.
TEA (1975). C.L. Cuadrados de letras. Manual. Madrid. TEA.
TEA (1979). Formas idénticas. Madrid. TEA.
TEA (sin fecha). BTA. Batería de tareas administrativas. Manual. Madrid. TEA.
Thompson, L. W. (1980). Testing and mnemonic strategies. En L. W. Poon, J. L. Fozard,
S. L. Cermack, D. Arenberg y L. W. Thompson (dirs.), New directions in memory and
aging: Procedings of G A Talland memorial conference. Hillsdale. Erlbaum.
Thurstone, L. L. (1944). A factorial study of perception. Psychometrics Monograp»s, 4.
Tsal, Y. (1983). Movements of attention across the visual field. Journal of Experimental Psy-
chology: Human Perception and Performance, 9, 523-530.
Tulving, E. (1985). How many memory systems are there? American Behavior and Brain
Sciences, 7, 223-238.
Vega, M. (1984). Introducción a la psicología cognitiva. Madrid. Alianza.
Victor, M., Talland, G. A. y Adams, R. D. (1959). Psychological studies of Korsakoff's psy-
chosis. I. General intellectual function. Journal of Nervons and Mental Disesases, 128,
528-537.
Walton, D. (1958). The diagnostic and predictive accuracy of WMS in psychiatrics patients
over 65. Journal of Mental Sciences, 104, 1111-1118.
Walton, D. y Black, D. A. (1957). The validity of psychological test of brain damage. British
Journal ofMedical Psychology, 30, 270-279.
Wang, P., Kaplan, J. y Rogers, E. (1959). Memory functioning in hemiplegics: A neuropsy-
chological analysis of WMS. Archives of Physical Medicine and Rehabilitation, 32, 213-
220.
Warrington, E. K. (1984). The recognition memory test. National Foundation for Educational
Research. Windsor. Inglaterra.
Warrington, E. K. y James, M. (19674). Disorders of visual perception in patients with locali-
zed cerebral lesions. Neuropsychología, 5, 253-366.
Warrington, E. K. y James, M. (19675). An experimental investigation of facial recognition in
patients with unilateral cerebral lesions. Cortex, 3, 317-326.
Warrington, E. K. y Sanders, H. 1. (1971). The fate of old memories. Quarterly Journal of Ex-
perimental Psychology, 23, 432-442.
Wells, F. L. y Martin, A. (1923). A method of memory examination suitable for psychotic ca-
ses. American Journal of Psychiatry, 3, 243-258.
hi3 D. (1945). A standarized memory scale for clinical use. Joxrnal of Psychology, 19,
Williams, M. (1958). The measurement of memory in clinical practice. British Journal of So-
cial and Clinical Psychology, 7, 19-34.
Wilson, B. A. (1987). Rehabilitation ofmemory. Londres. Guilford Press.
Evaluación de la memoria y la atención 657
Zarit, J. H., Cole, K. D. y Guider, R. C. (1981). Memory training strategies and subjetive
compliments of age in the aged. The Gerontologist, 21, 158-164.
Zelinsk1, E. M., Gilewski, M. J. y Thompson, L. Y. (1980). Do laboratoy test relate to self as-
sessment of memory ability in the young and old? En L. W. Poon, J. L. Fozard, L. S. Cer-
mack, D. Arenberg y L. W. Thompson (dirs.), New directions in memory and aging.
Hillsdale. Erlbaum.
Zimmermann, Í. L. y Woo-Sam,J.M. (1976). WA/s. Interpretación clínica de la escala de inte-
ligencia de Wechsler para adultos. Madrid. TEA.
Zubrick, J. y Smith, A. (1979). Minnesota test for differential diagnosis in aphasia (revision).
En F. 1. Darley (dir.), Evaluation of appraisal techniques in speech and language patho-
logy. Minnesota. Addison-Werley Readings.
LECTURAS COMPLEMENTARIAS
- 1 pa
+ A A y
le - A a
>, £ ¿ y as |y
ts Za e »
FS] CAME LA
Po q ., Pdf”
e Ti AA
SS
Er
AN
¿lr
INS
Eel ho Tit We aa,
sd ÑLe 5177 J 1.1| bnrspal Mi
7 pp opseN h
la ciAa un
y.
G
27. EVALUACIÓN DEL DESARROLLO SENSORIOMOTOR
CARMEN MAGANTO
L INTRODUCCIÓN
El indudable interés que este tema despierta deriva de la importancia que la evalua-
ción psicológica de los bebés ha adquirido para el diagnóstico precoz de los retrasos,
con las consiguientes intervenciones preventivas y/o terapéuticas. Esto ha sido posi-
ble merced a los progresivos desarrollos de la psicología evolutiva, la psicopatología,
la pediatría, las investigaciones en etología y metodología del desarrollo, entre otras
ciencias, que han dotado de rigor a la evaluación del desarrollo sensoriomotor en la
primera etapa de la vida humana. Dos aspectos han sido determinantes en la consoli-
dación de la citada evaluación:
a. La toma de conciencia por parte de una serie de autores como Piaget, Wa-
llon, Spitz, Gesell, Bowlby, etc. de que el valor de estos años va a ser de una impor-
tancia capital para el desarrollo de la persona; así, estos autores elaboran diferentes
teorías explicativas del desarrollo infantil.
b. El surgimiento de inventarios de conducta, de los cuales se van a derivar las
escalas evolutivas más actuales. Surgen, como veremos seguidamente, registros com-
portamentales y escalas de desarrollo que propiciarán la evaluación del desarrollo
infantil.
En 1916 se crea una escala integrada por un conjunto de pruebas, cuyos auto-
res son Izard y Simon, con un rango de aplicación desde los 3 a los 24 meses, en
la que se fijan diferentes etapas evolutivas determinadas por el desarrollo percep-
tivo. En función de los tests realizados se indicaba el desarrollo intelectual que
tenía el niño. El estudio minucioso y detallado sobre el desarrollo de niños nor-
males se debe a Gesell. La Escala de desarrollo por él creada con algunas varia-
ciones ha llegado hasta nuestros días. Utilizando tanto una metodología longitu-
dinal como transversal, sistematiza las etapas evolutivas desde el nacimiento hasta
la adolescencia. A través de los registros de observación comportamental com-
pendia cuatro tipos de conductas: motora, adaptativa, verbal y personal-social.
Para algunos autores le corresponde el mérito de haber refrendado la psicología
evolutiva. Su influencia en el campo del diagnóstico es de máxima relevancia. Las
derivaciones de la influencia de este autor llevaron a Brunet-Lezine a publicar la
Escala de desarrollo de la primera infancia. Otra escala construida en 1933 por
Bayley ha dado lugar posteriormente a las Bayley scales of infant development
[Escalas de desarrollo infantil] de amplia utilización en el ámbito clínico y en la
investigación, especialmente en comparaciones de muestras transculturales.
Piaget en su libro El nacimiento de la inteligencia en el niño pequeño plantea un
método clínico-experimental de exploración. Las pruebas desarrolladas en la teoría
plagetiana tienen como finalidad conocer en qué estadio de la inteligencia se encuen-
tra el niño: sensoriomotor, operatorio, etc. Las pruebas más representativas basadas
en la teoría del investigador suizo son las de Casati y Lezine (1968) publicadas en
Erancia y las de Uzgiris y Hunt (1975) desarrolladas en Estados Unidos.
La importancia concedida a los factores biológicos y al desarrollo neurológico
llevan a Brazelton a explicar el comportamiento infantil desde el análisis de los
mismos, partiendo de la comprobación experimental de las competencias del re-
cién nacido. La evaluación se basa en el estudio de las respuestas cualitativas del
niño en un proceso de interacción y adaptación, realizada a través de la Neonatal
behavioral assessment scale [Escala para la evaluación del comportamiento neona-
tal]. En otra línea de investigación, Butterbaugh (1988) se interesa por los aspectos
psicométricos y clínicos de los tests de desarrollo neurológico infantil, abogando
por continuar trabajando con los mismos hasta dotarlos de las garantías necesa-
rias. Es un ámbito de la evaluación infantil realizado en colaboración con los equi-
pos asistenciales de salud y que debe ir tomando primacía en el diagnóstico del
desarrollo.
La evaluación sensoriomotora debe contemplar el desarrollo personal global
en la consideración del sujeto como totalidad y debe situarlo dentro de un contex-
to y en un proceso continuo de aprendizaje en el que el niño es a la vez receptor y
actor del mismo, sujeto activo y pasivo, en una continua interacción con el am-
biente donde se desenvuelve. Asimismo, debe estudiar el sujeto infantil que evolu-
ciona, madura y se desarrolla, así como las condiciones para lograrlo. Abordar el
concepto de desarrollo, las características del mismo, la significación de patrón de
desarrollo y su incidencia en la evaluación sensoriomotora, es requisito previo
para situar adecuadamente la comprensión de las escalas de evaluación en el pri-
mer período de la vida.
Evaluación del desarrollo sensoriomotor
661
La idea matriz de la evaluación del desarrollo parte del presupuesto de que el creci-
miento de cada Persona corresponde a categorías esenciales únicas, pero la vida de
los diversos individuos sigue un patrón general de desarrollo. «La psicología del de-
sarrollo es el estudio científico de los cambios conductuales, cognoscitivos y de la
personalidad que ocurren durante los ciclos de vida de los organismos» (Sarafino y
Armstrong, 1988, p. 14). Esta definición contiene tres ideas básicas en las que se debe
sustentar la evaluación del desarrollo sensoriomotor: la idea de cambio, las diferen-
tes áreas en las que éste se opera y el aspecto longitudinal de dicho cambio. Los psi-
cólogos del desarrollo coinciden en afirmar la necesidad fundamental de un cuadro
preciso del patrón de desarrollo para poder comprender a los niños. Reconocen
también que el conocimiento de lo que provoca variaciones en el desarrollo es esen-
cial para entender a cada niño individualmente. Los patrones del desarrollo se rigen
por leyes con características de continuidad, direccionalidad, irreversibilidad, dife-
renciación e integración.
El desarrollo es un proceso continuo, pero esto no significa que deba ser consi-
derado como una sucesión simple y rígida de etapas. Significa que la secuencia en las
adquisiciones es la misma para todos los niños, pero el grado de desarrollo varía con
cada uno de ellos. Sin embargo, puesto que el desarrollo es continuo, lo que sucede
en una etapa influye en la siguiente. Por otro lado, el desarrollo se refiere a cambios
cualitativos y cuantitativos. Se puede definir como una serie progresiva de cambios
ordenados y coherentes. Progresivo significa que los cambios son direccionales y
que avanzan, en lugar de retroceder. Que sea direccional sugiere que sigue un curso
coherente hacia la madurez. Aquí radica la posibilidad de predecir el desarrollo y la
evaluación. Por ejemplo, todos los bebés siguen la misma secuencia direccional de
vocalización hasta lograr las primeras palabras, se ponen de pie antes de caminar y
trazan círculos antes que cuadrados. Normalmente, en ningún caso se invierte ese
orden. El ritmo de desarrollo es diferente según las áreas y según los individuos,
pero en todas las edades es irreversible. Tanto en las respuestas mentales como en las
motoras, la actividad general precede siempre a la específica.
Las diferencias individuales en el ritmo de maduración evolutiva, así como las di-
ferencias en las diversas áreas en un mismo individuo, explican los desajustes evolu-
tivos. Los psicólogos del desarrollo han comprobado repetidamente que existen va-
riaciones en la conducta de los niños en diferentes edades, pero que no se deben
pasar por alto las variaciones notables que se dan en sujetos de la misma edad. La
evaluación de las diferencias individuales encuentra aquí su justificación. El patrón
de diferenciación hace relación a la progresiva complejidad en la adquisición evoluti-
va de la individuación y especialización, a nivel biopsicofisiológico. La diferencia-
ción cobra sentido gracias a otro patrón de integración que regula eldesarrollo; éste
organiza los componentes diferenciados en adquisiciones madurativas que precisan
estructuras más complejas. La idea de totalidad expresada por Sroufe y Rutter (1984)
va en la misma línea. Cada conducta está determinada y entendida como una totali-
dad globalizadora y significativa de adquisiciones más simples. En concordancia con
662 Carmen Maganto
llo social o emocional. Puesto que el patrón de desarrollo para todos los niños nor-
males es aproximadamente el mismo, es posible evaluar a cada sujeto en función de
las normas para su grupo de edad. En tercer lugar, conocer que un bebé está capaci-
tado, por ejemplo, para aprender a caminar, sugiere que debemos facilitarle oportu-
nidades para practicarlo. La falta de oportunidad y estímulo puede retrasar el de-
sarrollo normal.
Aun cuando el patrón de desarrollo es similar para todos los niños, todos si-
guen un patrón predecible a su propio modo y su ritmo. Algunos niños se desarro-
llan de una manera suave, gradual, etapa por etapa, mientras que otros lo hacen de
forma brusca. Algunos tienen oscilaciones ligeras, y otros amplias. Por tanto, no
todos los niños llegan en todas las áreas al mismo punto de desarrollo a la misma
edad. Precisamente una de las dificultades en la evaluación del desarrollo sensorio-
motor de un niño radica aquí en delimitar la diferencia entre normalidad y patolo-
gía. Los logros motrices, lingúísticos, las conductas de adaptación personal y so-
cial, la adquisición de procesos y estrategias cognitivas implican áreas globales y
específicas de evaluación, a fin de identificar, con prudencia y con rigor, el nivel de
desarrollo de un niño, y decidir en qué y cuándo es necesario intervenir, bien para
prevenir o para remediar.
Para efectuar un eficaz examen se debe poseer ante todo un buen conoci-
miento del desarrollo del niño, de las técnicas a emplear en la evaluación, pero sobre
todo una probada experiencia en el trato con bebés. pen:
h. La exploración debe realizarse con el máximo rigor y con la flexibilidad que
se precise para obtener la cooperación de la madre y/o sustitutos, así como del lac-
tante, a fin de obtener los resultados esperados. ' '
¿. La experiencia profesional con niños en edades tempranas aconseja sugerir
los siguientes aspectos:
Las escalas para la evaluación del desarrollo sensoriomotor pueden agruparse funda-
mentalmente atendiendo a dos criterios. Por un lado, el criterio estadístico de fre-
cuencia de una conducta a una determinada edad, estableciendo como normativo y
esperable lo más usual y común, es decir, la adquisición, autonomía y dominio por
parte de los sujetos de conductas acaecidas a determinada edad; estas escalas obedecen
al modelo psicométrico de evaluación, entre las que destacan las Escalas de desarrollo
de Gesell, la Escala para evaluar el desarrollo psicomotor de la primera infancia y las
Escalas Bayley de desarrollo infantil. También dentro de esta categoría de clasificación
hay que referir las escalas de selección, entre las que está la Escala de desarrollo de
Denver y la Escala observacional del desarrollo. Por otro lado, otras escalas siguen
criterios más cualitativos y responden al modelo genetista-cognitivo planteando la
evaluación en términos de procesos. En estas escalas cobra importancia la evaluación
cognitiva al observar la utilización de estrategias en la resolución de los problemas
que se plantean a través de los reactivos del test. Entre éstas merecen destacarse la Es-
cala para la evaluación de las etapas de la inteligencia sensoriomotriz y la Escala ordi-
nal del desarrollo psicológico infantil. Se ofrece seguidamente una síntesis de la des-
cripción, finalidad de evaluación y valoración crítica de cada una de las pruebas.
nistrar, el manual es preciso y claro. Suele ser recibida de buen grado por elniño.
Exige conocimiento de la teoría de Piaget. La utilidad de la escala en el ámbito
educativo ha tenido especial relevancia en Francia. En el ámbito clínico (Calvo y
cols., 1981), las escalas derivadas de la teoría piagetiana han estado al servicio del
establecimiento de diagnósticos diferenciales del desarrollo y de precisar retrasos
significativos en el mismo. No obstante, su utilidad, según Dunst (1982), deviene
principalmente de los aspectos cualitativos que propician la observación del sujeto
ante los reactivos del estímulo. Es una limitación que al finalizar el período senso-
riomotor no exista una prueba de seguimiento que permita evaluar los estadios
posteriores de desarrollo.
Las escalas que se han expuesto posibilitan una evaluación comparativa de las habili-
dades y del grado de desarrollo global y específico que muestran los niños. Se utili-
zan con la finalidad de identificar tempranamente deficiencias en el desarrollo e in-
tervenir desde una perspectiva preventiva más que de tratamiento. La capacidad
predictiva de las escalas de tipo psicométrico se basa en el supuesto de que sólo es
posible una predicción razonable sobre el progreso futuro del niño conociendo los
valores promedio del desarrollo, identificando los factores que pueden afectar al
curso del mismo y realizando exámenes y registros sistemáticos. Por ello, parece jus-
tificado afirmar que, cuanto más lejos se encuentre un niño del promedio normal en
cualquier aspecto, es menos probable que sea normal. Las pruebas de desarrollo per-
miten predecir, en términos generales, el nivel de funcionamiento medio de un niño,
pero no con la precisión que desearíamos. Las escalas de tipo psicométrico tienen un
valor predictivo razonable, pero limitado en cuanto a la futura capacidad intelectual
del sujeto, puesto que, por una parte, infravaloran la amplitud de las transformacio-
nes de las habilidades cognitivas durante estadios subsecuentes del desarrollo; por
otra, es también limitado en cuanto que ignoran el gran papel que «juega la persona-
lidad en el progreso posterior del niño, y este aspecto es el responsable de que mu-
chos de los esfuerzos que hacemos para predecir el futuro progreso del desarrollo
del niño nos resulten fallidos» (Illingworth, 1985, p. 225). No obstante, prosigue
este autor, si se hicieran observaciones detalladas del curso del desarrollo en pobla-
ciones infantiles amplias, registrando edades de adquisición de habilidades y efec-
tuando seguimientos sistemáticos, sería posible establecer criterios predictivos en
función de las correlaciones halladas, así como identificar factores de riesgo en las
desviaciones del patrón de desarrollo. En la actualidad, la capacidad predictiva nega-
tiva es mayor, es decir, es mejor predictora de los déficit de funcionamiento que de
los posibles logros intelectuales del sujeto. No hay que olvidar que las discrepancias
en las investigaciones sobre la capacidad predictiva derivan, en parte, del objetivo y
contenidos de la evaluación, es decir, las diferencias entre lo que se evalúa en los exá-
menes de desarrollo y en las pruebas de inteligencia. En los primeros, se evalúa prin-
cipalmente el desarrollo sensoperceptual, sensoriomotor y la conducta de adapta-
ción social del bebé, mientras que en las segundas se hace hincapié en los aspectos
verbales.
La capacidad predictiva de las pruebas de selección ha sido ampliamente cuestio-
nada. Se han diseñado pocos instrumentos de selección y sólo algunos de ellos —sobre
todo, la Escala Denver— han sido sometidos a una rigurosa estandarización y re-
visiones periódicas (Dworkin, 1989; Meisels, 1989). Los resultados concordantes
obtenidos de repetidas investigaciones sobre sensibilidad y especificidad de la Escala
Denver permiten concluir que deja sin identificar niños expuestos al riesgo en rela-
ción a su desarrollo, dando un elevado número de falsos negativos. La sensibilidad
de la prueba es por tanto baja y poco adecuada su capacidad predictiva negativa. La
especificidad es más alta, lo que significa que identifica pocos sujetos como falsos
positivos, siendo, por consiguiente, más satisfactoria su capacidad predictiva posi-
tiva. No obstante, la eficacia o validez predictiva de una escala de selección de de-
672 Carmen Maganto
REFERENCIAS BIBLIOGRÁFICAS
Brunet, O. y Lezine, 1.(1983). Batería de Tests para medir el Desarrollo Psicomotor y la Escala
de Visión de la 1* Infancia. Madrid. MEPSA.
Butterbaugh, G. J.(1988). Selected psychometric and clinical review of neurodevelopmental
infant tests. Clinical-Nenropsychologist, 4, 350-364.
Cadman, D., Chambers, L. W. y Walter, S. D. (1984). The usefulness of the Denver Develop-
mental Tscreening Test to predict Kindergarten problems in a general community popu-
lation. American Journal Public Health, 74, 1093-1097.
Calvo, M., Figueras, J., Picorel, M. F. y Wanger, D. (1981). Valoración de un test abreviado
para determinar el desarrollo psicomotor e intelectual del niño. Archivos de Pediatría, 53,
33-63,
Casati, I. y Lezine, 1. (1968). Les etapes de lintelligence sensori-motrice. París. Les Éditions
du Centre de Psychologie Appliquée.
Diamond, K. E. (1987). Predicting school problems form preschool developmental scree-
ning: A four-year folow-up of the Revised Denver Developmental Screening Test and the
role of parent report. Journal Developmental Early Child, 11, 242-253.
Doll, E. A. (1965). Vineland social maturity scale (3* ed.). Minnesota. American Guidance.
Doménech, E. (1982). Signos de alarma en el examen psicológico del neonato. Anales Espa-
ñoles de Pediatría, 17, 131-145.
Dworkin, P. H. (1989). Screening del desarrallo ¿esperando lo imposible? Pediatrics, 27, 186-
188.
Dunst, C. J. (1982). The clinical utility of Piagetian-based scales of infant development. In-
fant Mental Health Journal, 3, 259-275. E e
Flehmig, 1. (1988). Desarrollo normal del lactante y sus desviaciones. Buenos Aires. Médica
Panamericana. a
Frankenburg, W. K., Camp, B. W. y Van Natta, P. A. (1971). Validity of the DDST. Primary
Care, 11,535-547.
Frankenburg, W. K., Fandal, A. W., Sciarillo, W. y Burgess, D. (1981). The newly abbrevia-
ted and revised Denver Developmental Screening Test. Journal of Pediatrics, 99, 995-999.
Frankenburg, W. K., Dodds, J., Fandal, A. W., Kazuk, EN Cohrs, M. (1975). Denver Deve-
lopment Screening Test-Revised. Colorado. University of Colorado Medical Center.
Frankenburg, W. K. y Dodds, J. (1990). Denver 11 Screening Manual. Denver. Denver Deve-
lopmental Materials, Inc.
ems W. K., Dodds, J., Archer, P., Shapiro H. y Bresnick, B. (1992). The Denver Il:
A Major Revision and Restandarization of the Denver Developmental Screning Test. Pe-
diatrics, 89, 91-97. 5
Gesell, A. y Amatruda, C. (1981). Diagnóstico del desarrollo normal y anormal en el niño.
Evaluación y manejo del desarrollo nenropsicológico normal y anormal del niño pequeño y
preescolar. Buenos Aires. Paidós. A
Gratch, G. y Schatz, J. A. (1987). Cognitive development: The relevance of Piaget's a
books. En J. D. Osofsky (dir.), Hanbook of infant development (2* ed.). Nueva York.
Wiley.
llingworth, R. S. (1985). El niño normal. México. El Manual Moderno.
+ E ls Le O Preschool screening programs for children with a de A da
gitudinal analysis. cien a a la Annual Convention of the Council for
¡ ildren. Washington, Pda 3
RECON ¿Las pruebas a screening de desarrollo pueden identificar a los niños ex-
puestos a riesgo con respecto a su desarrollo? Pedtatrics, 27, iiO O
Meisels, S. J. y Margolls, L. H. (1988). ls EPSDT effective with developmen tal disa
dren? Pediatrics, 81, 262-271. a : pe
: cimiento de la inteligencia en el niño. Madrid. Aguilar. 5
ee ca J. W. (1988). Desarroll o del niño y del adolescent e. México. Tri-
dd
llas.
676 Carmen Maganto
LECTURAS COMPLEMENTARIAS
1 mes:
2 meses:
4 meses:
5 meses:
6 meses:
7 meses:
8-9 meses:
10-11 meses:
12-14 meses:
15-17 meses:
— Lo explora todo
— Construye torres de dos dados con cierta precisión
— Tira los objetos
— Se quita los zapatos
18-21 meses:
— Corre de puntillas
— Sube escaleras con ayuda
— Empuja cosas con el pie
— Maneja la cuchara sin volcarla
— Garabatea de forma espontánea
— Se quita solo calcetines, guantes y baja cremallera
21-24 meses:
— Llanto y gritos del recién nacido que significan hambre, dolor, incomodidad, etc.
— Alerta al sonido
— Progresivamente pequeños gritos guturales
2-5 meses:
6-12 meses:
12-18 meses:
19-24 meses:
0-2 meses:
3 meses:
— Reconoce a la madre y a otros miembros de la familia, mostrando temor ante los descono-
cidos
— Llora cuando se le deja solo y deja de hacerlosise le habla o entretiene con un objeto
— Hace gestos de anticipación ante la alimentación
4 meses:
5-6 meses:
7-9 meses:
10-14 meses:
15-17 meses:
— Muestra un interés creciente por los adultos y desea estar con ellos e imitarlos
— Se interesa por otros bebés, sonríe imitándolos y comienzan los juegos
24 meses:
1 mes:
— Observa a su madre cuando le habla y se queda quieto, también abre y cierra la boca y
mueve la cabeza
— Responde a estímulos como los sonidos del sonajero
2-3 meses:
4 meses:
5-6 meses:
7-9 meses
10-11 meses:
12-17 meses:
21-24 meses:
MATEU SERVERA
IL. INTRODUCCIÓN
Los estilos cognitivos son uno de los temas más investigados en psicología puesto
que desde hace más de cuatro décadas no han dejado de aparecer publicaciones so-
bre ellos. Sin embargo, a pesar del tiempo transcurrido, todavía hoy en día se discute
con profusión sobre cómo clasificarlos, cómo definirlos e incluso cómo evaluarlos.
En cualquier caso, muchos autores estarían de acuerdo en que las repercusiones que
algunos de estos estilos cognitivos han demostrado tener sobre el rendimiento cog-
nitivo y el comportamiento social de las personas justifica sobradamente todos los
esfuerzos y las polémicas que han generado.
Tal y como se ha señalado reiteradamente (Carretero y Palacios, 1982; García
Ramos, 1989) los estilos cognitivos surgieron de la necesidad de establecer un puente
entre ciertas dimensiones cognitivas fundamentalmente relacionadas con el campo
de la percepción y algunos aspectos de la personalidad. A finales de los años cuarenta,
por la influencia de las teorías gestálticas de Kurt Lewin y Heinz Werner, surgió un
descontento con el atomismo sensorial de Wundt entonces en boga, así como por la
falta de atención que recibía el sujeto en las teorías de la percepción (Witkin y Goo-
denough, 1985). Casi al mismo tiempo que ocurría esto, algunos psicólogos de la
personalidad, especialmente los que formaban parte del movimiento psicoanalista,
empezaron a cuestionarse el papel que podría jugar la percepción en la configura-
ción de sus teorías.
El objetivo de los trabajos iniciales enmarcados en lo que se conoce como psico-
logía diferencial era la definición de rasgos estables y diferenciados en pruebas de
percepción que presentaran altas correlaciones con factores de personalidad. Esta lí-
nea de investigación de los estilos cognitivos dio lugar a lo que Huteau (1985) deno-
mina la «corriente extensiva» en la exploración de los estilos cognitivos; esta corrien-
te se caracteriza por desarrollar modelos explicativos globales del fenómeno de las
diferencias individuales intentando relacionar e integrar componentes cognitivos
con teorías de la personalidad muy ligadas a concepciones dinámicas. Los trabajos
de la Fundación Menninger, centrados en los controles cognitivos, y la teoría de la
diferenciación psicológica de Herman Witkin, basada en los trabajos sobre el estilo
dependencia-independencia de campo, son un buen ejemplo de esta corriente.
Sin embargo, con el paso del tiempo otros enfoques se acercaron al estudio de los
estilos cognitivos. Así, el interés que mostraron algunos psicólogos cognitivos y del
procesamiento de la información por el problema de las diferencias individuales alo
largo de la década de los años setenta fue decisivo para reorientar el término (Carre-
tero y Palacios, 1982). En esta corriente, a la que en términos de Huteau (1985) po-
demos llamar “intensiva”, el objetivo se ha centrado en estudiar los estilos cogniti-
vos básicamente desde la óptica del funcionamiento cognitivo, relacionándolos con
el tema del procesamiento de la información y las estrategias de resolución de pro-
blemas. Ello ha supuesto, por una parte, la incorporación de la metodología experi-
mental al estudio de los estilos cognitivos y, por otra, el abandono de las «cuestiones
motivacionales de raíz psicoanalítica» (Carretero y Palacios, 1982, p. 25) presente en
las primeras concepciones. Los trabajos de Kagan con el estilo cognitivo reflexivi-
dad-impulsividad y los trabajos de investigación en estrategias cognitivas de Bruner
y Pask son un buen ejemplo de esta línea que ha tenido sus principales implicaciones
en el campo de la educación. :
En cualquier caso, es evidente que la coexistencia de ambas corrientes e incluso
de otras surgidas dentro de la psicología social y de la psicología educativa ha influ1-
do a la hora de configurar un mapa confuso de los estilos cognitivos. Algunos esti-
los cognitivos han surgido exclusivamente a partir de constructos teóricos o de ex-
periencias puntuales y no disponen de pruebas de evaluación fiables que puedan
atestiguar sus supuestas áreas de influencia. Otros, en cambio, como la dependen-
cia-independencia de campo y la reflexividad-impulsividad, surgieron a partir de
planteamientos experimentales más rigurosos y se sustentan sobre pruebas de eva-
luación más sólidas, aunque no exentas de problemas. A lo largo del presente capí-
tulo vamos a abordar la problemática en general de la evaluación de los estilos cog-
nitivos, centrándonos fundamentalmente en las pruebas de evaluación de la
dependencia-independencia de campo y la reflexividad-impulsividad.
vos como unavariable mediadora (pero no integradora) que está involucrada en los
aspectos cualitativos de la cognición (Kagan, Moss y Siegel, 1963; Goldestein y
Blackman, 1978). En el segundo grupo se encuentran las que también se inclinan por
una concepción mediadora de los estilos cognitivos, aunque además consideran que
están implicados en todo el funcionamiento del individuo (Witkin, 1969; Kogan,
1976). Por último, en el tercer grupo están las definiciones que conceptualizan a los
estilos cognitivos como una variable integradora de aspectos cognitivos y no cogni-
tivos con una amplia influencia en todo el funcionamiento del individuo. Como
ejemplo de este grupo se encontraría la definición que han presentado las propias auto-
ras según la cual los estilos cognitivos son «un constructo hipotético superordinal,
desarrollado para describir y, en su caso, explicar las diferencias individuales obser-
vadas en alguno de los procesos que medían entre el estímulo y la respuesta, inte-
grando los aspectos cognitivos y no cognitivos de la persona» (Quiroga y Sánchez,
1987, p. 62).
En cualquier caso y pese a las evidentes divergencias en la forma de definirlos, en
nuestra opinión es posible destacar una serie de características de los estilos cogniti-
vos en las cuales coincidiría la mayoría de los autores. Tal vez la principal de estas ca-
racterísticas es que los estilos cognitivos intentan describir formas o modos del pen-
samiento en lugar de describir el producto del mismo; es decir, al contrario de lo que
ocurre con la evaluación de la inteligencia o las aptitudes en general, la evaluación de
los estilos cognitivos pretende definir estrategias de actuación de los individuos sin
que obligatoriamente ello deba implicar diferencias en su rendimiento. Otra caracte-
rística de los estilos cognitivos es que al ser evaluados acostumbran a definir un rasgo
bipolar relativamente consistente ante pruebas similares y estable a lo largo del de-
sarrollo de la persona. Este rasgo se establece a lo largo de un continuo sin que ello
implique juicios de valor ya que ambos polos son adaptativos en función de los con-
dicionantes del medio. Por otro lado, a pesar de que la mayoría de los estilos cognit1-
vos se centra en el área de la educación, es habitual que también mantengan relacio-
nes con aspectos de la conducta social de la persona (Witkin y Goodenough, 1977).
Por último, aunque no tiene por qué descartarse un sustrato biológico, los estilos
cognitivos hacen referencia a dimensiones principalmente aprendidas desde la pri-
mera infancia y susceptibles de modificación. Si bien, como señala Kogan (1971,
p. 346), esta propiedad puede variar según se trate de dimensiones que hagan más re-
ferencia a la “calidad de la capacidad” (como la dependencia-independencia de cam-
po) —en este caso su modificabilidad es más difícil— o según se refieran más a “pro-
¡edades estratégicas” (como la reflexividad-impulsividad) —en este caso serán más
fáciles de modificar.
A la hora de determinar cuáles son las dimensiones que forman parte de los estilos
io-
cognitivos nos encontramos con serios problemas ya que las múltiples clasificac
n entre sí, sino que se han elaborad o a partirde
nes que existen no sólo no coincide
criterios diferentes. Podemos encontra r clasifica ciones basadas en criterios descrip-
686 Mateu Servera
La DIC se puede definir como «el grado en que la persona percibe una parte del
campo perceptivo como separado del contexto que lo rodea, en vez de hacerlo como
si estuviera incluido en él [...]; o por decirlo en palabras más corrientes, el grado en
que la persona percibe de forma analítica» (Witkin y cols., 1977, pp. 6-7). Así pues, la
DIC es un continuo con dos polos: la independencia de campo que hace referencia a
la elevada capacidad para reestructurar un campo perceptivo, es decir, la percepción
muestra una cualidad analítica, y la dependencia de campo que se refiere auna baja
capacidad de reestructuración del campo perceptivo, es decir, existen dificultades
para separar los elementos que configuran un contexto. En definitiva, siguiendo a
Witkin y cols. (1977) podemos resumir las características de la DIC señalando que se
trata de una dimensión con una gran estabilidad a lo largo del desarrollo, que influye
directamente en la forma en que las personas perciben y procesan la información del
medio, y que también tiene importantes repercusiones sobre gran parte de su activi-
dad espontánea.
1v.1.2. El Rod and frame test (RFT) [Test del marco y la varilla]
locan la varilla vertical tomando como eje de referencia su propio cuerpo (IC), mien-
tras que Otras personas se rigen por pautas externas y ajustan la varilla al grado de in-
clinación del marco (DC).
Esta prueba en contraste con las anteriores pretende modificar la fuerza gravitacio-
nal mientras el campo visual permanece estable en posición vertical. Para ello se sien-
ta al sujeto en una silla móvil que se encuentra dentro de una pequeña habitación la
cual es impulsada a lo largo de un carril circular, de este modo la fuerza que actúa so-
bre el sujeto es el resultado de los efectos de la fuerza centrífuga y de la fuerza de gra-
vedad. Al final se pide al sujeto que coloque su cuerpo en la posición en la que consi-
dere que está derecho. Curiosamente, en este caso se pudo verificar que los sujetos
que se regían por pautas internas tenían muchas más dificultades en adoptar una
postura correcta que los que se regían por pautas externas. Ello es lógico ya que las
referencias de los IC han sido alteradas por el efecto de la fuerza centrífuga mientras
la referencia de los DC (el campo visual) en este caso no ha sufrido ninguna altera-
ción.
Es importante remarcar acerca de estas tres pruebas de laboratorio que la DIC
demostró tener un alto grado de estabilidad ya que los sujetos independientes de
campo en el BAT también acostumbraban a ser clasificados como tales en las otras
dos pruebas y lo mismo sucedía con los dependientes de campo (Witkin y Goode-
nough, 1985).
en cuenta que sólo dispone de cinco minutos para cada una de las dos secciones. La
puntuación final es el número total de formas simples trazadas correctamente con
un máximo de 18 puntos. Una puntuación elevada siempre indica una tendencia ha-
cia la independencia de campo.
El Children embedded figures test (CEFT) es una versión infantil del test de apli-
cación individual que se puede utilizar entre los 6 y los 12 años. Consta de dos figu-
ras simples recortadas (un triángulo o tienda india y una casa) que corresponden a
las dos series de evaluación del test; la serie tienda está formada por 11 figuras sim-
ples y la serie casa por 14. El niño, tras superar las series de demostración y de entre-
namiento, debe encontrar la figura simple correspondiente en cada una de las figuras
complejas sin que exista límite de tiempo —aunque en algunas ocasiones se ha pro-
puesto el límite de dos minutos por ítem. La puntuación final del test es el número
de ítems correctamente resueltos y, lógicamente, una puntuación elevada indica una
tendencia hacia la independencia de campo.
El Preschool embedded figures test (PEFT) es una versión de Coates (1972) para
ser utilizada con niños entre 3 y 5 años. Consta de una serie de actividades y figuras
de entrenamiento y la evaluación se efectúa sobre 24 figuras complejas. La tarea del
niño consiste en encontrary señalar una figura simple (un triángulo recortado) so-
bre cada uno de los 24 ítems obteniendo un punto por cada respuesta correcta. De
nuevo una puntuación elevada es considerada como indicativa de un estilo cognitivo
independiente de campo.
Por último, hay que señalar que existen baremaciones estadounidenses para to-
das estas versiones e incluso el manual del EF7, del GEFT y del CEFT se halla traduci-
do por TEA (1981). En el caso del GEFT también disponemos de algunas baremacio-
nes con muestras españolas (Fernández-Ballesteros y Maciá, 1981; Roda, 1982;
Amador, Forns y Kirchner, 1988).
polémico, es habitual que hasta los 10-11 años o bien no aparezcan diferencias por
sexos en la puntuación de la DIC o bien las niñas sean algo superiores (Kogan, 1976);
sin embargo, en la preadolescencia y en la edad adulta los varones acostumbran a ser
más independientes de campo que las mujeres (Witkin y Goodenough, 1985; García
Ramos, 1989).
Aunque actualmente la mayor influencia de la DIC se centre en el campo cogniti-
vo, desde siempre se ha destacado su influencia sobre otras áreas; por ejemplo, desde
elpunto de vista dinámico de la personalidad se ha encontrado que la DIC correla-
ciona con los mecanismos de defensa, de control y con el esquema corporal (Fernán-
dez-Ballesteros, 1980; Beltrán, 1985; García Ramos, 1989). Por otra parte, también
se han señalado importantes relaciones de la dimensión con el comportamiento so-
cial; así, se considera que las personas dependientes de campo tienden a buscar más
el contacto social y son percibidas por los demás como más amables y de fácil trato,
mientras los independientes de campo son considerados individualistas y más insen-
sibles a las influencias sociales (Witkin y Goodenough, 1977; Witkin y cols., 1979).
Desde otra óptica, como ya señalaron Witkin y cols. (1977), Kogan (1976), y Pa-
lacios y Carretero (1982), algunas de las implicaciones más importantes de la DIC se
dan en el ámbito educativo. Palacios y Carretero (1982) distinguen entre dos tipos
de estudios: los estudios de laboratorio centrados sobre aspectos básicos del apren-
dizaje y los estudios de desempeño escolar en ambientes naturales. Dentro del pri-
mer grupo de estudios, Goodenough (1976) encontró dos características básicas de
los DC: son mucho más susceptibles al refuerzo negativo aplicado en forma de crítica
verbal y realizan un mejor aprendizaje en condiciones de motivación extrínseca; por
su parte, los IC trabajan mejor en situaciones de motivación intrínseca.
Los experimentos sobre adquisición de conceptos y sobre memoria (Witkin y
cols., 1977) señalan diferencias importantes entre dependientes e independientes de
campo en el modo de actuación. Los primeros tienden a utilizar estrategias globales
y poco estructuradas, mientras los segundos se decantan por el uso de una articula-
ción estructurada y por el sistema de hipótesis-refutación. De todos modos, ello no
quiere decir que necesariamente un estilo sea superior al otro en tareas de resolución
de problemas, ya que parece evidente que el rendimiento depende en última instan-
cia del tipo de tarea que utilicemos.
En cuanto al rendimiento académico, resulta evidente que los IC siempre mues-
tran una clara superioridad en las asignaturas “científicas”, así como en capacidad y
comprensión lectora (véase la revisión de Palacios y Carretero, 1982). Por contra, en
algunos trabajos se ha pretendido demostrar que los DC son superiores en asignatu-
ras de contenido social (Ruble y Nakamura, 1972), aunque Witkin y cols. (1977)
aconsejan ser prudentes en este tema puesto que no todos los resultados son coinci-
dentes y además no está claro que la mayor inclinación social de los DC sea equipara-
ble al contenido de asignaturas como historia o geografía. En cualquier caso, lo que
sí parece comprobado es que los DC se inclinan más por carreras de “letras” y los IC
or carreras de “ciencias” y en los casos en que ello no es así existen bastantes más
probabilidades de fracaso (Witkin, 1976; Shade, 1983).
Por otra parte, también se han podido comprobar los interesantes efectos que
produce la relación entre el estilo cognitivo del alumno y del profesor. Profesores y
alumnos que comparten el mismo estilo cognitivo garantizan un aprendizaje más
692 Mateu Servera
eficaz y una percepción mutua más positiva, pero, cuando ello no es así, la tendencia
es que ambos realicen una evaluación más negativa del proceso de enseñanza-apren-
dizaje (Goodenough, 1976; Witkin y cols., 1977). cae
Un tema de gran importancia y que siempre ha estado envuelto en lapolémica es
la relación entre la DIC y la inteligencia. Vernon (1972) realizó un ambicioso trabajo
del cual se concluía que el cociente intelectual (CI) era capaz de explicar casi toda la
variabilidad atribuida a las puntuaciones de la DIC. En esta misma línea, Satterly
(1976) también encontró correlaciones muy elevadas entre la DIC y el CI. En res-
puesta a estos trabajos, Witkin y Goodenough (1977) explicaron dicha relación ba-
sándose en el hecho de que algunos tests de inteligencia y las pruebas de la DIC po-
drían compartir un mismo factor de capacidad; en concreto, se referían al factor
analítico, pero, por contra, otros factores de inteligencia (por ejemplo, el verbal y el
atencional) no guardaban ninguna relación con la DIC. Por otra parte, en otro traba-
jo de Satterly (1979) se ofrecen datos que apoyan la existencia de una cierta indepen-
dencia entre el CI y la DIC. La conclusión a este tema es que parece lógico que las per-
sonas independientes de campo obtengan mejores puntuaciones sobre algunos tests
de inteligencia que las dependientes, pero de ahí no se deduce que unas sean más in-
teligentes que las otras (Witkin, 1962).
Por último, hay que referirse a las implicaciones de la DIC dentro del mundo la-
boral. Las principales líneas de investigación establecidas se centran en la conduc-
ción de automóviles (en general, los DC parecen más propensos a sufrir accidentes),
la congruencia entre estilo cognitivo y trabajo que se realiza (en determinadas profe-
siones como, por ejemplo, en las de controlador aéreo, la influencia de este estilo pa-
rece decisiva), y las relaciones entre la DIC y el comportamiento del consumidor.
V. REFLEXIVIDAD-IMPULSIVIDAD (R-D
CUADRO 28.2. Sistema de clasificación basado en la doble división por las medianas de erro-
res y latencias
+
REFLEXIVOS LENTOS-
INEXACTOS
LATENCIAS
RÁPIDOS- IMPULSIVOS
EXACTOS
ERRORES
principio debía ser muy elevada solamente estaba alrededor de 0,50 y, por otra
par-
te, sus índices de fiabilidad a pesar de su fluctuación y de que fueran algo más eleva-
dos en muestras de sexo femenino en general demostraron ser bastante bajos. Por
ejemplo, utilizando el método del test-retest, los índices estaban alrededor de 0,50
para los erroresysobre 0,54 para las latencias, mientras que los índices de consisten-
cia interna se situaron sobre 0,90 en el caso de las latencias, pero solamente sobre
0,64 en el caso de los errores (Servera, 1992).
Respecto al sistema de clasificación de cuadrantes descrito anteriormente, ha si-
do reiteradamente calificado como arbitrario y poco fiable (Ault y cols., 1976; Ege-
land y Weinberg, 1976). En principio, con este sistema se dicotomizan artificialmen-
te los errores y las latencias que son dos variables continuas y además se pierde cerca
de un tercio de las muestras. Por otra parte, al utilizar un estadístico como la media-
na, se magnifican las diferencias causales hasta el punto que, según Ault y cols. (1976,
p. 228), «la confusión entre, por una parte, reflexivos y lentos-inexactos y, por otra
parte, impulsivos y rápidos-exactos acontecerá en el 24% de los casos». Las solucio-
nes a los problemas del MFFTy al sistema de evaluación tradicional aparecerán a fina-
les de los años setenta con el test MFF-20 de Cairns y Cammock (1978) y el sistema de
clasificación de Salkind y Wright (1977).
El MFF-20 de Cairns y Cammock (1978) es una versión muy mejorada del ori-
ginal MFFT que mantiene una estructura idéntica y que se caracteriza tanto por el
hecho de tener 20 ítems en lugar de 12 como por el sustancial aumento que se ob-
serva en la correlación entre errores y latencias, y en sus índices de fiabilidad
cuando se trabaja con niños entre 6 y 12 años. Este aumento, aunque fluctúe en
función de la edad de la muestra con la que se trabaje (Cairns y Cammock, 1978;
Navarro, 1987; Quiroga y Forteza, 1988; Servera, 1992), sitúa la correlación erro-
res-latencias alrededor de -0,68 y la fiabilidad por consistencia interna de los erro-
res y las latencias respectivamente sobre 0,70 y 0,94. Por su parte, el sistema de
clasificación de Salkind y Wright (1977) (véase cuadro 28.3) se basa en una rota-
ción de los cuatro cuadrantes de la distribución original de forma que para cada
sujeto se definen dos puntuaciones o índices totalmente independientes: la pun-
tuación de impulsividad (PI) que se obtiene restando sus puntuaciones típicas de
errores y latencias y la puntuación de eficacia (PE) que se obtiene sumando estas
mismas puntuaciones.
La interpretación de las puntuaciones en lo que respecta a la R-1 se hace del si-
guiente modo: cuanto mayor es la PI positiva, mayor es la tendencia hacia la impulsi-
vidad, y, cuanto mayor es la PI negativa, mayor es la tendencia hacia la reflexividad.
Las puntuaciones alrededor del 0,00 indican un estilo flexible y poco definido. Entre
las ventajas de este sistema destaca el hecho de que, contrariamente a lo que había-
mos visto anteriormente, no es necesario prescindir de ningún sujeto de la muestra
puesto que todos tienen una puntuación de estiloyotra de eficacia que podemos uti-
lizar por separado en función de nuestros objetivos de evaluación. Por otra parte,
este nuevo sistema no supone ningún cambio drástico respecto al anterior puesto
que prácticamente todos los sujetos claramente impulsivos y reflexivos enel sistema
de cuadrantes continúan manteniendo este estatus en el sistema de Salkind y Wright
(1977). En España, los trabajos de Quiroga y Forteza (1988) y Servera (1992) apor-
tan datos en favor de la utilización de este sistema; sin embargo, todavía quedan pen-
696 Mateu Servera
PI negativas + REFLEXIVIDAD
Respecto alnivel de rendimiento sobre estas tareas, los niños reflexivos han mos-
trado su superioridad sobre sus compañeros impulsivos en tareas de tipo perceptivo
O perceptivo-motor (Messer, 1976), en tareas que implican el funcionamiento de la
memoria a corto y a largo plazo (Siegel, Kirasic y Kilburg, 1973), en tareas de razo-
namiento analógico (Cameron, 1984), en tareas de capacidad atencional (Quay y
Weld, 1980), en algunas tareas piagetianas (Brodzinsky, 1982) e incluso en tareas que
en principio deberían favorecer la aproximación holística de los impulsivos (Smith y
Kemler-Nelson, 1988). Evidentemente, la cuestión está en discernir si las diferencias
entre impulsivos y reflexivos pueden ser conceptualizadas en función de distintas es-
trategias de actuación o, por el contrario, se deben a que los dos grupos presentan
distintos valores en el Cl,
Las relaciones de la impulsividad con la inteligencia es un tema que se ha aborda-
do con profusión sin que todavía dispongamos de un marco explicativo definitivo
(Kogan, 1976; Messer, 1976; Palacios, 1982; Quiroga y Forteza, 1988). De todos mo-
dos, existe una serie de aspectos que están suficientemente contrastados y que deben
ser tenidos en cuenta a la hora de evaluar la R-I. En primer lugar, sabemos que en
edad preescolar la R-I y el CI mantienen elevadas correlaciones incluso por encima
de 0,60, de forma que, como señala Kogan (1976), la puntuación de errores del MEFT
puede entenderse como una forma alternativa de evaluación de la inteligencia, mien-
tras las latencias presentan correlaciones mucho más bajas. En edad escolar, las co-
rrelaciones descienden bastante, aunque siguen siendo significativas (especialmente
en el caso de las niñas), si bien de nuevo son atribuibles casi exclusivamente a la pun-
tuación de errores. Por último, dicha relación siempre estará en función del tipo de
test de inteligencia que utilicemos, si éste contiene un alto grado de incertidumbre de
respuesta (las Matrices progresivas de Raven, el PMA de Thurstone, el Otis-Lennon,
etc.) cabe esperar correlaciones mucho más elevadas que en caso contrario.
En nuestra opinión, como ya apuntó Kogan (1976), es evidente que la R-I (tal
vez en mayor grado que la DIC) está hasta cierto punto en función del CI; sin embar-
go, el hecho de que las correlaciones se centren fundamentalmente en la puntuación
de errores y no en la de latencias nos obliga a considerar tal influencia como limitada.
De hecho, al igual que ocurre con los niños con dificultades de aprendizaje, en mu-
chas ocasiones es posible observar cómo el CI de los niños impulsivos no predice
adecuadamente su nivel de rendimiento. Precisamente, es dentro del ámbito del ren-
dimiento académico y de los problemas de aprendizaje donde la evaluación de la R-I
adquiere su máxima relevancia. Kogan (1971) ya indicó que la R-l era el estilo cogni-
tivo con más implicaciones en el campo del aprendizaje y posteriormente toda una
serie de trabajos (Messer, 1976; Palacios y Carretero, 1982) lo han confirmado. En
general, los niños reflexivos acostumbran siempre a presentarun mejor rendimiento
académico que los niños impulsivos, especialmente en matemáticas y en lectura; ade-
más, los niños impulsivos padecen con más frecuencia dificultades de aprendizaje
(Palacios y Carretero, 1982). A partir delos trabajos de Bornas y cols. (1990) y Ser-
vera (1992), se puede concluir que las diferencias de rendimiento entre impulsivos y
reflexivos siempre son estadísticamente significativas y favorables a estos últimos
prácticamente a lo largo de todos los cursos de la enseñanza primaria, tanto si eva-
luamos el rendimiento a través de la evaluación del profesor como a través de prue-
bas objetivas.
698 Mateu Servera
La constatación de los problemas que afectaban a los niños impulsivos llevó a los
investigadores a la búsqueda de procedimientos de modificación del estilo tendentes
a instaurar una estrategia reflexiva. Entre los procedimientos que han obtenido algu-
nos éxitos, pero que han tenido problemas en el mantenimiento y la generalización
de los resultados, destacan aquéllos basados en el condicionamiento operante, en el
entrenamiento en discriminación visual y en la técnica del modelado y las autoins-
trucciones. Actualmente, como señalan Moore y Hughes (1988), se considera que
los procedimientos que ofrecen más garantías son los programas cognitivo-conduc-
tuales multicomponentes (que incluyen, entre otras técnicas, auto1mstruccionesyso-
lución de problemas) combinados con un entrenamiento en estrategias cognitivas y
metacognitivas (Meichenbaum, 1985).
Por último cabe destacar que los trabajos que intentan relacionar la R-I con ras-
gos de personalidad y con el comportamiento social han obtenido resultados con-
trovertidos (Milich y Kramer, 1984; Quiroga y Forteza, 1988); en cualquier caso, pa-
rece evidente que la influencia de la R-I en estos ámbitos es bastante limitada y en
todo caso inferior a la DIC.
La aparición del Test de figuras enmascaradas (EFT) supuso una solución al pro-
blema en principio sin tener que renunciar a las garantías en la evaluación de la DIC,
ya que se observó que mantenía elevadas correlaciones con las pruebas de percep-
ción de la verticalidad en unos valores por encima de 0,65, aunque algo inferiores en
el caso de las mujeres (Tyler, 1978). Como ya se ha comentado anteriormente, TEA
(1981) ha traducido el manual del EFT que incluye este test, el CEFT y el GEFT. Los
índices de fiabilidad de estas pruebas, así como del PEFT de Coates (1972), acostum-
bran a ser superiores a 0,80 y van acompañados de una contrastada validez de criterio
y de contenido. Los resultados con muestras españolas universitarias de Fernández-
Ballesteros y Maciá (1981) y Amador y cols. (1988) y con alumnos de 7 de EGB de
Roda (1982) también avalan los buenos índices psicométricos del GEFT.
Por otra parte, el tema de la validez de constructo de la DIC siempre ha sido muy
controvertido, si bien en un principio se pensó que la DIC era un constructo unitario,
los trabajos de Linn y Kyllonen (1981) y de García Ramos (1989) aportan datos para
pensar lo contrario. Según García Ramos (1989), hay una serie de hechos que justifi-
ca que la DIC es una dimensión inespecífica compuesta por al menos dos subcons-
tructos: “percepción de la verticalidad” y “reestructuración cognitiva”. Entre estos
hechos destaca, en primer lugar, la constatación de que la capacidad de reestructura-
ción cognitiva no es independiente del contenido de las tareas; mientras el GEFT (de
contenido geométrico) es capaz de distinguir a sujetos IC y DC, otras pruebas de en-
mascaramiento de contenido verbal no detectan diferencias entre los mismos suje-
tos. En segundo lugar, a pesar de que las pruebas de verticalidad y el test EFT evalúan
dimensiones relacionadas, difícilmente pueden considerarse como equivalentes ya
que, como indica García Ramos (1989), sólo comparten en el mejor de los casos un
35% de la variancia. Por último, los estudios factoriales también han contribuido al
reconocimiento de los dos subconstructos dentro de la DIC.
En definitiva, el psicólogo interesado en evaluar la DIC para fines aplicados, ya
sea en el área educativa, clínica o laboral, debe saber que dispone de unos excelentes
instrumentos de evaluación de este estilo cognitivo. Tal vez la única recomendación
que se puede hacer es que, al aplicar a adultos el GEF7, es posible reducir a cuatro mi-
nutos el tiempo asignado a las dos series para lograr un aumento en la capacidad de
discriminación del test. Por otra parte, el psicólogo que trabaje en el campo de la in-
vestigación debe tener muy presente las cuestiones esbozadas respecto a la posibili-
dad de distinguir diferentes subconstructos en las pruebas de evaluación de la DIC.
precaución, ya que, por ejemplo, Ancillotti (1982), con una muestra de niños france-
ses, encontró bastante similitud en la puntuación de latencias pero diferencias signi-
ficativas en casi todos los niveles de edad en la puntuación de errores. En la revisión
de Messer (1976) ya se pudo constatar el gran margen de variabilidad que presentan
muestras de edades similares sin una causa evidente, aunque probablemente el ori-
gen de los sujetos (clase alta-baja, medio urbano-rural, etc.) es una variable a tener en
cuenta.
El test MEF-20 no dispone, al menos que conozcamos, de ninguna baremación
definitiva aunque en el trabajo de Cairns y Cammock (1978) aparecen datos de
muestras de 7, 9 y 11 años y en la revisión de Palacios (1982) se cita un trabajo no pu-
blicado de los mismos autores con una muestra de 600 niños norirlandeses. En Es-
paña, se pueden consultar datos de muestras entre 6 y 14 años en los trabajos de Na-
varro (1987), Quiroga y Forteza (1988) y Servera (1992). En general, se puede
afirmar que con niños entre 7 y 12 años los índices de fiabilidad de las latencias y los
errores son aceptables, en el primer caso están por encima de 0,90 y en el segundo
por encima de 0,70.
Otro problema más complejo es el del sistema de clasificación que se debe utili-
zar. De nuevo debemos decir que, aunque el sistema de cuadrantes ha sido el más
utilizado, en los últimos años parece que las ventajas que supone el sistema de Sal-
kind y Wright (1977) van a conseguir que se imponga definitivamente. Con este sis-
tema se superan gran parte de los problemas de arbitrariedad que existían y además
ofrece la posibilidad de trabajar con técnicas de análisis de regresión ya que se obtie-
ne una puntuación continua en impulsividad. Sin embargo, todavía quedan bastan-
tes dudas respecto a la validez de este sistema debido al papel distinto que se atribuye
a la PI y a la PE; en diversos estudios se ha podido comprobar que, contrariamente a
lo que en principio sería de esperar, la PI muestra correlaciones más elevadas con
pruebas de rendimiento y con tests de inteligencia que la PE, que, en teoría, es la pun-
tuación de capacidad (Miyakawa, 1981; Servera, 1992).
A estas cuestiones hay que añadir los problemas de validez de constructo de la
R-I. Milich y Kramer (1984) y Oas (1985) realizaron dos amplias revisiones de las
cuales se puede concluir que, por una parte, la evaluación de la R-I requiere necesa-
riamente el perfeccionamiento de los tests derivados del MFF y, por otra parte, hay
bastantes indicios de que la impulsividad cognitiva o R-I sea un constructo diferente
a lo que se conoce como impulsividad motora.
Desde un punto de vista correlacional, las medidas de impulsividad motora o so-
cial (registros de observación, cuestionarios de personalidad, cuestionarios para pa-
dres y maestros...) guardan relaciones muy bajas con las versiones del MEF. Por otra
parte, los estudios de carácter más experimental han podido constatar que mientras
cabe esperar que un niño hiperactivo también se muestre impulsivo sobre el MFF, la
probabilidad de que se dé el caso contrario es mucho más baja. Por lo tanto, hay que
tener muy presente que con la evaluación de la R-I lo que se pretende evaluar son es-
trategias de actuación ante tareas de solución de problemas o, si se prefiere, lo que se
pretende es detectar déficit en los procesos de solución de problemas, pero en caso
de que estemos interesados en analizar el comportamiento social del niño o en reali-
zar un diagnóstico clínico es necesario utilizar otros procedimientos complemen-
tarios.
Evaluación de los estilos cognitivos
701
REFERENCIAS BIBLIOGRÁFICAS
Amador, J., Forns, M. y Kirchner, T. (1988). Perfil del GEFT en la población universitaria ca-
talana. Evaluación Psicológica/Psychological Assessment, 4, 89-110.
Ancilloti, J. P. (1982). Dimension réflexive-1mpulsive de la personnalité et processes cognitifs
chez Penfant. Cahiers de Psychologie Cognitive, 2, 71-90.
Ancilloti, J. P. (1985). Dimension réflexive-impulsive de la personnalité et fonctionnement
cognitif. Cahiers de Psychologie Cognitive, 5, 667-686.
Ault, R. L. (1973). Problem-solving strategies of reflexive, impulsive, fast-accurate, and slow-
inaccurate children. Child Development, 44, 259-266.
Ault, R. L., Mitchell, C. y Hartman, D. (1976). Some methodological problem in reflection-
impulsivity research. Child Development, 47, 227-231.
Beltrán, J. (1985). Estilos cognitivos. En Psicología Educacional (vol. 1) (3* ed.). Madrid.
UNED.
Berry, J. W. (1976). Human ecology and cognitive style. Nueva York. Wiley.
Block,
J.,Block, J. H. y Harrington, D. M. (1974). Some Misgivings about the Matching Fa-
miliar Figures Test as a Measure of Reflection-Impulsivity. Developmental Psychology,
10,611-632.
Bornas, X., Servera, M., Serra, F. y Escudero, J. T. (1990). El tratamiento de la impulsividad
infantil: autoinstrucciones versus solución de problemas. Estudios de Psicología, 43-44,
61-71.
Brodzinsky, D. M. (1982). Relationship between cognitive styles and cognitive development:
A 2-year longitudinal study. Developmental Psychology, 18, 617-626.
Bruner, J. S., Goodnow, J. J. y Austin, G. A. (1952). A study of thinking. Nueva York. Wiley.
Cairns, F. D. y Cammock, J. (1978). Development of a more reliable version of the Matching
Familiar Figures Test. Developmental Psychology, 5, 555-560.
Cameron, R. (1984). Problem-solving inefficiency and conceptual tempo: A task analysis of
underlying factors. Child Development, 55, 2031-2041. re,
Carretero, M. (1982). El dessarrollo del estilo cognitivo dependencia-independencia de cam-
po. InfanciayAprendizaje, 18, 65-82. da 06 SS
Carretero, M. y Palacios, J. (1982). Los estilos cognitivos: introducción al problema de las di-
ferencias cognitivas individuales. Infancia y Aprendizaje, 17, 20-28.
Coates, S. (1972). Preschool Embedded Figures Test. Palo Alto. Consulting Psychologist
Press. erratas]
psy-
Egeland, B. y Weinberg, R. A. (1976). The Matching Familiar Figures Test: A look to its
chometric credibility. Child Development, 47, 483-491.
702 Mateu Servera
Pettigrew, T. E. (1958). The measurement and correlation of category width as a cognitive va-
riable. Journal of Personality, 26, 532-544.
Quay, L. y Weld, G. L. (1980). Visual and auditory selective attention and reflection-impul-
sivity in normal learning-disabled boys at two age levels. Journal of Abnormal Child Psy-
chology, 8, 117-125.
Quiroga, M. A. (1988). El estilo cognitivo dependencia-independencia de campo: un estudio
diferencial a través de los perfiles del Rorschach. Tesis doctoral inédita. Universidad Com-
plutense de Madrid.
Quiroga, M. A. y Forteza, J. A. (1988). La reflexividad-impulsividad. Estado de la cuestión y
análisis de las características psicométricas del test MFF-20. Investigaciones Psicológicas, 5,
97-125.
Quiroga, M. A. y Sánchez, M. P. (1987). Lecturas para las prácticas de psicología diferencial.
Madrid. Universidad Complutense de Madrid.
Roda, F. (1982). La dependencia-independencia de campo como variable diferencial en los
procesos de enseñanza. Studia Pedagogica (Salamanca), 10 (número monográfico).
Ruble, D. N. y Nakamura, C. Y. (1972). Task orientation vs. social orientation youngs chil-
dren and their attention to relevant social cues. Child Development, 43, 471-480.
Salkind, N. J. (1978). Development of norms the Matching Familiar Figures Test. JSAS Cata-
log of Selected Documents in Psychology, 8, 61.
Salkind, N. J. y Schlecter, T. (1982). Comparability of the Kansas reflection impulsivity scale
for preschoolers and the Matching Familiar Figures Test in kindergarten children. Child
Study Journal, 12, 1-5.
Salkind, N. J. yWright, J. C. (1977). The Development of Reflection-Impulsivity and Cogni-
tive Efficiency. (An Integrat ed. Model). Human Development, 20, 377-387.
Santostefano, S. G. (1964). A developmental study of the cognitive control “leveling-sharpe-
ning”. Merrill-Palmer Quarterly, 10, 343-360. A
Santostefano, S. G. y Paley, E. (1964). Development of cognitive controls in children. Child
Development, 68, 36-42. :
Satterly, D. J. (1976). Cognitive styles, spatial ability and school achievement. Journal of
Educational Psychology, 68, 36-42. Po al
Satterly, D. J. (1979). Covariation of cognitive styles, intelligence and achievement. British
Journal Educational Psychology, 49, 179-181. la meo y
Servera, M. (1992). La modificación de la reflexividad-impulsividad y el rendimiento acadé-
mico en la escuela a través de la instrucción en estrategias cognitivas. Tesis doctoral inédita.
Universidad de las Islas Baleares.
Shade, B. J. (1983). Cognitive strategies as determinants of school achievement. Psychology in
the Schools, 20, 488-493. 7 :
Siegel, A. W., Kirasic, K. C. y Kilburg, R. R. (1973). Recognition memory in reflective and
impulsive preschool children. Child Development, 44, 651-656. e
Smith, J. D. y Kemler-Nelson, D. G. (1988). Is the more impulsive children a more holistic
processor? A reconsideration. Child Development, 59, 719-727.
TEA (1981). Test de Figuras Enmascaradas: EFI, GEFTyCEFT. Madrid. TEA.
704 Maten Servera
Tyler, L. (1978). Psicología de las diferencias humanas (3? ed.). Madrid. Marova.
Vernon, P. E. (1972). The distinctiveness of field independence. Journal of Personality, 40,
366-391.
Wallach, A. y Caron, A. J. (1959). Attribute criteriality and sex-linked conservatism as deter-
mints of psychological similarity. Journal of Abnormal and Social Psychology, 59, 43-50.
Witkin, H. A. (1954). Personality through perception. Nueva York. Harper and Brothers.
Witkin, H. A. (1962). The problem of individuality in development. En S.Wapner y B. Ka-
plan (dirs.), Perspectives in psychological theory. Nueva York. International Universities
Press.
Witkin, H. A. (1969). Social influences in the development of cognitive style. En D. A. Gos-
lin (dir.), Handbook of socialization theory and research. Chicago. Rand McNally.
Witkin, H. A. (1976). Cognitive style in academic performance and in teacher-student rela-
tions. En S. Messick (dir.), Individualtiy in learning: Implications of cognitive styles and
creativity. San Francisco. Jossey-Bass.
Witkin, H. A., Dyk, R. B., Faterson, H. F., Goodenough, D. R. y Karp, S. A. (1962). Psycho-
logical differentiation. Nueva York. Wiley. '
Witkin, H. A. y Goodenough, D. R. (1977). Field dependence and interpersonal behavior.
Psychological Bulletin, 4, 661-689.
Witkin, H. A. y Goodenough, D. R. (1985). Los estilos cognitivos: naturaleza y orígenes. Ma-
drid. Pirámide.
Witkin, H. A., Goodenough, D. R. y Oltman, P. K. (1979). Psychology differentiation: Cu-
rrent status. Journal of Personality and Social Psychology, 37, 1127-1145.
Witkin, H. A., Moore, C. A., Goodenough, D. R. y Cox, P. W. (1977). Field-dependent and
field-independent cognitive styles and their educational implications. Review of Educa-
tional Psychology, 47, 1-64.
Wright, J. C. (1971). The Kansas Reflection-Impulsivity Scale for Preschoolers (KRISP). St.
Louis. CHMREL. Inc.
Wright, J. C. (1978). The KRISP: A normative evaluation. Lawrence. Center for Research in
Early Childhood Education (University of Kansas).
Yando, R. M. y Kagan, J. (1968). The effect of teacher tempo on the child. Child Develop-
ment, 39, 27-34.
Zelniker, T. y Jeffrey, W. E. (1979). Attention and cognitive styles in child. En G. A. Hale y
M. Lewis (dirs.), Attention and cognitive development. Nueva York. Plenum Press.
LECTURAS COMPLEMENTARIAS
García Ramos, J. M. (1989). Los estilos cognitivos y su medida: estudios sobre la dimensión de-
pendencia-independencia de campo. Madrid. CIDE.
Kirchner, T. (1988). Lectura: estilos y estrategias. Barcelona. PPU.
Kogan, N. y Saarni, C. (1989). Cognitive styles in children: Some evolving trends. Early
Child Development and Care, 43, 101-128.
Miller, A. (1987). Cognitive style: An integrated model. Educational Psychology, 7, 251-268.
Quiroga, M. A. (1988). Los estilos cognitivos y los controles cognitivos: panorama actual. ln-
vestigaciones Psicológicas, 5 (número monográfico).
Shipman, S. y Shipman, V. (1985). Cognitives styles: Some conceptual methodological and
applied issues. Review of Research in Education, 12, 229-291.
Witkin, H. A. y Goodenough, D. R. (1985). Los estilos cognitivos: naturaleza y orígenes. Ma-
drid. Pirámide.
29. EVALUACIÓN DE LAS HABILIDADES DE AUTORREGULAC
IÓN
XAVIER BORNAS
I. INTRODUCCIÓN
pueda tener y la importancia, también intuitiva, que se le pueda conceder, no son su-
ficientes para diseñar y poner en práctica procedimientos educativos concretos que
favorezcan la formación de alumnos capaces de aprender autónomamente, de resol-
ver problemas sociales por sí mismos, etcétera. pu d y e
Por tanto, en el siguiente apartado se ofrecerá un significado y dotará de conteni-
do al concepto clave de autorregulación para salir de la nebulosa en que parece mo-
verse el concepto y encontrar aspectos concretos y evaluables en la práctica educati-
va. Este significado lo extraeremos del ámbito de la psicología conductual que, a
_ nuestro modo de entender, es el que puede aportar un contenido más concreto y útil
para la práctica educativa. Una vez tengamos definido el concepto de AR, en eltercer
apartado se examinará el significado y la importancia que se da en la investigación
educativa a conceptos y términos similares, reseñando los aspectos comunes y tam-
bién las diferencias que hay entre éstos y el de autorregulación tal como aquí la en-
tendemos. Con todo esto podremos entrar ya en el tema de la evaluación de las habi-
lidades de autorregulación con algunas garantías de que no nos perderemos durante
el trayecto.
pueda ser visto como un sistema. En la definición anterior se recogen ambas caracte-
rísticas; por una parte, hablamos de las habilidades como elementos que conforman
el sistema y de cuya interacción depende, y, por otra parte, que la función teleológica
enunciada (la optimización) se cumpla. Referirnos a la autorregulación como siste-
ma y no como capacidad obedece a la connotación dinámica del primer término, que
contrasta con la más estática del segundo. Un sistema (abierto en este caso) se entien-
de más fácilmente como algo modificable de una capacidad y esto es importante en
el marco de la intervención conductual, sea preventiva o terapéutica. Pero, además
de este aspecto de significado, hablar del sistema de autorregulación permite, como
veremos más tarde con detenimiento, identificar y definir las características que la
evaluación de la AR debe tener. Por así decirlo, la conceptualización que hacemos de
la AR conduce directamente a las pautas generales de evaluación de la misma.
En cuanto a la función del sistema debemos hacer también algunos comentarios.
Si nos centramos en los contextos educativos, una demanda típica de tales contextos
puede ser que el alumno aprenda a leer. Satisfacer esta demanda puede lograrse de
muchas maneras, algunas muy lentas, costosas y poco eficaces, y otras más rápidas,
económicas y eficaces. Pues bien, el sistema de autorregulación funciona para en-
contrar éstas y evitar las primeras, optimizando el proceso (en sentido general) que
conduce a —en este ejemplo— aprender a leer (o a leer, en definitiva). Sin embargo,
por otra parte el sistema de autorregulación no debería entenderse únicamente como
un mecanismo que permite reaccionar de forma más eficaz a las demandas externas.
Del buen funcionamiento del sistema de AR depende también el grado de autonomía
personal del sujeto en cuanto a las demandas internas, es decir, de las que él mismo se
plantea (por ejemplo, ser menos tímido, aprender a cocinar, practicar un deporte...;
estas demandas pueden ser a veces internas y a veces externas). En pocas palabras,
del sistema de autorregulación dependen no sólo las reacciones sino también las ac-
ciones.
A modo de conclusión, veamos cuál es la estructura del sistema de AR tal como
aquí lo entendemos. En otros trabajos hemos presentado un modelo teórico, de ca-
rácter prescriptivo más que descriptivo, de dicho sistema (Bornas, 1991; Bornas, Ser-
vera y Soler, 1992). Aunque aquí ampliaremos algo dicho modelo, de momento nos
servirá para ilustrar lo dicho hasta ahora y para que el lector se haga una idea más
precisa de las habilidades de autorregulación a que nos referimos. En el cuadro 29.1
se puede ver dicho modelo.
El sistema se compone básicamente de dos grandes grupos de habilidades: las
que tradicionalmente conforman lo que llamamos autocontrol y que pueden verse
en la parte izquierda (desde la autodeterminación de objetivos y criterios hasta el auto-
rreforzamiento) y las que suelen conformar los modelos de solución de problemas,
que se encuentran en la parte derecha del cuadro 29.1 (desde la generación de al-
ternativas hasta la elaboración de la solución). Las flechas indican las relaciones entre
estas habilidades, es decir, el modo en que opera el sistema. Éste es activado por una
demanda, frente a la cual lo primero que el sistema hace es identificarla, reconocerla
o definirla. A continuación establece unos objetivos y unos criterios de autoevalua-
ción y planifica el mejor modo de satisfacer la demanda (esto es, de conseguir los
objetivos propuestos) mediante un proceso de resolución de problemas. Una vez
planificada la acción, se ejecuta bajo el control permanente ejercido por los procesos
Evaluación de las habilidades de autorregulación 709
Identificación de la demanda/problema
Autodeterminación de objetivos
y criterios
Planificación de la acción
Puesta en práctica
Generación de alternativas
Autoobservación
Previsión de consecuencias
(E
90) Autorregistro
(9)
5a)(09)
.
Elaboración de la solución
E
9O>)
<
Autoevaluación
Atribución
Autorreforzamiento
710 Xavier Bornas
Al desarrollo social del niño se le da cada vez más importancia en las escuelas. A pe-
sar de que el uso de programas específicos para el desarrollo de lashabilidades socia-
les es escaso, la práctica educativa tiene en cuenta y procura que éste se consiga. Des-
de enfoques cognitivo-conductuales se han aportado datos sobre la necesidad de
favorecer aquel desarrollo con vistas a prevenir futuros problemas de adaptación so-
cial (Michelson y cols., 1983; Kirschenbaum y Ordman, 1984), así como programas
específicos de intervención (Shure y Spivack, 1974; Spivack y Shure, 1974; Allen y
cols., 1976; Michelson y Mannarino, 1986) e instrumentos de evaluación y modelos
teóricos sobre el tema (Gresham, 1986, 1988). Sin embargo,loque ahora nos interesa
destacar es que en todo ello ocupa un lugar más o menos privilegiado la autorregula-
chos trabajos realizados especialmente en los años ochenta parece existir una eviden-
cia considerable acerca de la conveniencia de que aquélla sea intrínseca en lugar de
extrínseca. De forma muy simplificada podríamos indicar que es mejor fomentar el
deseo de aprender que la necesidad de hacerlo (por miedo a una calificación o por
ganar algún premio). Este es un tema complejo y polémico tanto a nivel científico
como de política educativa y no podemos adentrarnos en él ahora. Bastará conside-
rar laexistencia de una línea importante de investigación que aboga por la motiva-
ción intrínseca y que entronca, de acuerdo con Ryan, Connell y Deci (1985), con la
tradición educativa que pone el acento en el desarrollo del niño de dentro hacia fuera
y que supone una práctica educativa basada en ayudar, orientar y guiar dicho de-
sarrollo frente a la otra gran tradición, que enfatiza el control externo, mayores san-
ciones y disciplina y, en definitiva, marcar más al alumno. Según estos autores, esta
segunda gran tradición sintonizaría con los modelos de motivación extrínseca.
Como señalan Corno y Rohrkemper (1985), la motivación no puede entenderse
prescindiendo de los procesos cognitivos y metacognitivos (en sus propias palabras,
autorreguladores) y, más concretamente, afirman que la motivación intrínseca por
aprender dependerá del desarrollo de unas habilidades cognitivas particulares. Esta-
blecen así un nexo claro y bastante concreto entre motivación, aprendizaje y auto-
rregulación. En la medida en que un alumno posea estrategias de aprendizaje ade-
cuadas es más probable que esté motivado para aprender. Claro está que el mero
hecho de disponer de estas estrategias (que podemos entender como habilidades o
conjunto de habilidades encaminados a un fin determinado) no garantiza un nivel
óptimo de motivación, y así sería peligroso cognitivizar en exceso el tema; el valor de
los reforzadores externos es un factor igualmente importante en la determinación de
la motivación y no conviene olvidarlo. Pero parece claro que la falta de aquellas es-
trategias representa una merma considerable para la motivación y el aprendizaje en
sí. Alguien que no sepa sacar el máximo provecho de lo que lee, es decir, alguien sin
estrategias de comprensión lectora y/o de memorización, es poco probable que esté
motivado por leer (que desee leer). Entonces, lo que sugieren Corno y Rohrkemper
(1985) es la posibilidad de aumentar y mantener la motivación mediante la adquis1-
ción y el desarrollo de dichas estrategias y habilidades.
Estas habilidades guardan una estrecha relación con lo que hemos denominado
sistema de autorregulación. Por supuesto, existen unas estrategias y habilidades es-
pecíficas para determinadas actividades (microestrategias, de acuerdo con Nisbett y
Shucksmith, 1986) que no quedarían representadas en dicho sistema precisamente
por ser tan específicas; es el caso de las estrategias de memorización. Pero hay otras
estrategias más generales o macroestrategias que se pueden utilizar en una amplia va-
riedad de actividades y para la realización de aprendizajes en dominios muy diversos
que sí están cerca de aquel sistema. Buscar más de una solución ante un problema
podría ser un ejemplo de tales habilidades, también denominada “pensamiento di-
vergente” o “generación de alternativas” (en los programas de entrenamiento en so-
lución de problemas ya citados) y que, como vimos, queda recogida en el sistema de
AR justo al comienzo de la fase de planificación de la acción. Existen finalmente los
estilos de aprendizaje (siguiendo con la terminología de Nisbett y Shucksmith,
1986), de los que ahora nos interesa destacar uno: el autorregulado (Corno y Rohr-
kemper, 1985), que en cierta medida sería equiparable al estilo que Ryan, Connell y
714 Xavier Bornas
tor es el nivel de reto que supone una tarea determinada, y que de acuerdo con di-
chos autores no puede ser ni excesivamente alto ni demasiado bajo. En el primer
caso, el alumno puede experimentar sentimientos de incompetencia contradictorios
con la motivación intrínseca; en el segundo, a pesar del reforzamiento por la buena
ejecución, el nivel de motivación no crece porque no existe percepción de compe-
tencia al tratarse de una tarea que el alumno ya domina (Ryan y cols., 1985). La ter-
cera proposición es algo más compleja y se refiere al significado funcional de los
acontecimientos. Se trata de una propiedad fenomenológica y de mucho más difícil
evaluación. Ryan y cols. (1985) distinguen entre acontecimientos informativos, con-
troladores y amotivadores, siendo los primeros los que mejoran la motivación in-
trínseca al ser vistos como proporcionadores de feedback relevante en contextos de
elección o autonomía; los segundos son percibidos como presiones para actuar, pen-
sar o sentir de una forma determinada, y los terceros se experimentan como carentes
de relevancia.
Por su parte, Ames y Ames (1991) resumen de manera menos formal, pero qui-
zás más clara, los siguientes factores que contribuyen a crear o mantener un patrón
motivacional negativo (es decir, opuesto a la motivación intrínseca y a la autorregu-
lación): la competición y la comparación social en clase, la evaluación pública, el re-
forzamiento de la capacidad en lugar del esfuerzo, comunicar bajas expectativas,
permitir a los alumnos que no participen en los procesos de aprendizaje, reforzar el
rendimiento en lugar del aprendizaje, el énfasis excesivo en las notas y el éxito, la fal-
ta de reconocimiento y las malas condiciones físicas de aprendizaje (espacio, ruidos,
etc.). La lista de Ames y Ames (1991) no es incompatible con la presentación de
Ryan y cols. (1985). De hecho, muchos de los factores de esta lista pueden operar, en
teoría, por los mecanismos relativos a causalidad, competencia y significado funcio-
nal enunciados por estos autores. En cualquier caso, hemos querido simplemente
ilustrar con algo más específico las referencias a la necesidad de dirigir la evaluación
de la autorregulación también al ambiente educativo, referencias que hemos reitera-
do alo largo de todo el texto.
REFERENCIAS BIBLIOGRÁFICAS
Allen, G. J., Chinsky, J. M., Larcen, S. W., Lochman,].E. y Selinger, H. V. (1976). Commu-
nity psychology and the schools. A behaviorally oriented multilevel preventive approach.
Hillsdale. Erlbaum.
Ames, C. y Ames, R. (dirs.) (1985). Research on motivation in education (vol. 2). The class-
room milien. Orlando. Academic Press.
Ames, R. y Ames, C. (1991). Motivation and effective teaching. En L. Idol y B. F. Jones
(dirs.), Educational values and cognitive instruction: Implications for reform. Hillsdale.
(PTAS
Avia, M. D. (1984). Técnicas cognitivas y de autocontrol. En J. Mayor y F. J. Labrador (dirs.),
Manual de modificación de conducta. Madrid. Alhambra
Evaluación de las habilidades de autorregulación
725
LECTURAS COMPLEMENTARIAS
Il. INTRODUCCIÓN
guaje que han permitido analizar y reajustar muy precozmente algunos de sus pro-
blemas. Por otra parte, las lesiones cerebrales producidas en las dos últimas guerras
mundiales proporcionaron mútiples ocasiones para estudios empíricos sobre la rela-
ción entre las afasias en todas sus formas y su localización cerebral, lo que produjo
una ampliación de los conocimientos sobre las bases físicas del lenguaje y el desarro-
llo paralelo de las técnicas de evaluación neuropsicológica. Otras perturbaciones
asociadas a minusvalías físicas, como la hipoacusia, espastias o parálisis cerebrales
han representado un poderoso acicate en cuanto a la búsqueda de estrategias para la
evaluación de formas de comunicación alternativas al lenguaje fonético, tales como
el lenguaje gestual o pictográfico. Por su parte, la psicología comparada, debido
principalmente a su intento por mostrar las posibilidades de utilización del lenguaje
por parte de los animales, ha generado una nueva fuente de información y de preci-
siones en los registros de comunicación.
Cada una de estas ciencias utiliza generalmente un modelo peculiar como marco
teórico de su investigación. La psicología utiliza preferentemente modelos conduc-
tuales o cognitivos, donde la adquisición y el uso del lenguaje son sus problemas
fundamentales; la psicopatología recurre al modelo médico y la psicolingúística si-
gue el modelo estructural que se centra en el análisis de sus categorías fundamentales
(fonología, gramática, sintáctica, semántica y pragmática). Así, resulta que la evalua-
ción del lenguaje siempre se ha solapado con el estudio de la inteligencia, de los tras-
tornos orgánicos y el de los aspectos sociales relacionados con el aprendizaje de la
lengua. El retraso mental, las afasias, las hipoacusias, los entornos sociales, los siste-
mas educativos, la estructura de cada lengua son todos ellos factores que están ínti-
mamente relacionados con la cuestión de la evaluación del lenguaje. Por ello, la eva-
luación interdisciplinar y global del lenguaje es una meta para los especialistas en el
tema (Aimard y Abadie, 1992). Esta evaluación tiene que considerar un extenso
campo, con considerable cantidad de dificultades, problemas y escollos. Entre ellos
se pueden enumerar los siguientes: complejidad del lenguaje, heterogeneidad de sus
trastornos, falta de consenso en las teorías sobre el desarrollo del lenguaje, diversidad
de marcos teóricos en la elaboración de instrumentos de evaluación y peculiares difi-
cultades debidas al propio proceso de evaluación. A todo ello hay que añadir que
dado que la evaluación del lenguaje se realiza fundamentalmente en población infan-
til salvo en caso de lesiones traumáticas o mórbidas que se dan más habitualmente
en adultos— aún son mayores las dificultades en el proceso de evaluación, puesto
que se plantean los problemas típicos en toda evaluación infantil: lograr la colabora-
ción del sujeto evaluado, completar los déficit de información debidos a la inmadu-
rez recurriendo a distintas fuentes, la naturaleza cambiante de los elementos que han
de ser evaluados por evolución característica del sujeto, etcétera.
Sujetos
Humanos Animales
Vehículo sensorial
Verbal Auditivo Visual Táctil Olfativo Gustativo
Canal de comunicación
Expresión Comprensión Proxemia
Habla Lenguaje Gestos
Lectura
Escritura
III IO AAN e ESE ES ECU POCA A AAA
Estructura linguística
Fonología
Forma Morfología
Sintaxis
Contenido Semántica
Uso
++(q
Pragmática =— KK
Si los sujetos son niños y, por tanto, están en el período preverbal o carecen de
cualquier tipo de lenguaje se evalúan:
Forma
Contenido
Uso
nombra uno de ellos para que el niño lo señale), categorización (el evaluador
proporciona distintos términos a incluir en categorías O distintas categorías para
las que buscar términos), denominación —lenguaje expresivo— (el evaluador
presenta dos o más objetos y señalando uno de ellos pregunta «¿esto qué es?»),
ejecución (el evaluador da una orden que el sujeto debe ejecutar), relación (el
evaluador presenta oral o visualmente un objeto y pide al niño que diga el
opuesto), completamiento (se da una frase incompleta que el sujeto debe termi-
nar) y sentido de refranes (se presentan al niño refranes a los que tiene que bus-
car el sentido).
d. Estrategia para evaluación de la sintaxis: elicitación —lenguaje expresivo—
(se presenta una lámina con una escena dinámica y se pregunta al niño «¿qué pasa
aquí?») y narración (se le demanda al niño que cuente un cuento). y
e. Estrategias para evaluación de la pragmática (uso): necesidad —lenguaje ex-
presivo— (se retira un objeto deseado para provocar su petición).
En resumen, se han presentado las distintas perspectivas desde las que se pue-
de contemplar el lenguaje, qué es lo que se evalúa y cómo se hace, cubriendo así
las recomendaciones que hacen los expertos que se enfrentan con este tema como
Kent (1974) y Miller (1981), si añadimos el porqué se evalúa a un sujeto, o sea, el
objetivo de la evaluación que condicionan a su vez el qué y el cómo de la misma
(Miller, 1976). Los objetivos fundamentales de la evaluación del lenguaje pueden
ser la determinación del desarrollo del lenguaje, los estudios epidemiológicos que
cuantifican la incidencia y prevalencia de los problemas y la evaluación y diagnós-
tico de problemas específicos. Para su consecución ha de seguirse un proceso
determinado.
Formulación de hipótesis
— Selección de métodos y procedimiento
2. Evaluación de la ejecución específica del lenguaje
Verificación
1. Análisis de los datos
2. Reformulación o mantenimiento de hipótesis
Resultados
Interpretación de los datos
Cuestiones adicionales derivadas
Predicción
Recomendaciones
EInforme
Intervención
Mantenimiento
Seguimiento
Información
¿Cuál es el problema?
¿Qué expectativas se tienen?
¿Hay diferencias entre test y vida real?
¿Qué factores ambientales pueden ayudar el cambio?
¿Cuáles son los patrones de comunicación del sujeto?
Metas
¿Qué es lo que el sujeto necesita aprender?
Mantenimiento
¿Qué ayuda hay en el entorno que pueda mantener los logros?
¿Cómo se puede estructurar esa ayuda?
¿Cuál es el sistema de revisión? de »
¿Es necesaria una ayuda exterior para el mantenimie nto”
Dado el problema, ¿es posible la intervención?
¿Cuándo hay que hacer una reevaluaARA ción?
tt ri E Bt EM
AA A
cc
740 Victoria del Barrio
Las técnicas de evaluación han ido evolucionando paralelamente a las del estudio del
lenguaje. Siguán (1984) hace un recorrido histórico del tema mostrando esta evolu-
ción; Valle Arroyo (1991) sub: 21 « cómo el área de la comprensión del lenguaje ha sido
la que más atención ha acaparado a lo largo del tiempo y ello ha repercutido en la eva-
luación; por su parte, Forns (1989) recoge la información específica sobre la evolución
de los instrumentos de evaluación. La década de los años cincuenta marca cuatro gran-
des líneas de investigación. La primera busca el establecimiento de niveles evolutivos
normativos y basaba la evaluación en la posesión del lenguaje desde una perspectiva
semántica, frecuentemente asociada a la evaluación de la inteligencia; una segunda se
centra en los elementos lingiiísticos y usa la observación del lenguaje en ambientes na-
turales, con una especial atención a los aspectos gramaticales y sintácticos; la tercera se
centra especialmente en la evaluación fonológica, fonética y en las funciones del len-
guaje; la cuarta atiende a los aspectos patológicos. En los años sesenta se produce la
gran emergencia de las pruebas estandarizadas en donde se exploran plurales aspectos
del lenguaje, además de iniciarse una preocupación por la evaluación de los cambios
producidos por la intervención; es también típico de esta década la diversificación de
técnicas en función del marco teórico de partida. En los años setenta comienza el pro-
tagonismo del contexto y la influencia más marcada de la psicolingúística que aporta el
esquema de forma, contenido y uso a la evaluación. Los años ochenta se caracterizan
por el interés que cobran los aspectos interactivos de la comunicación.
Se podría resumir el panorama diciendo que la evaluación del lenguaje ha evolu-
cionado desde una primera época donde preocupaba el individuo desde un punto de
vista evolutivo, una segunda en la que el protagonismo lo adquiere el grupo y, por
último, se imponen los aspectos sociales del lenguaje. Ajustándose a estas necesida-
des, existen fundamentalmente cuatro vías clásicas para la evaluación del lenguaje:
escalas de desarrollo, observación directa de la conducta lingúística de un sujeto,
pruebas estandarizadas y pruebas no estandarizadas. Las escalas de desarrollo y la
observación del lenguaje se usan más frecuentemente en los primeros estadios (0-5
años), las pruebas estandarizadas son más frecuentes a partir de los 6 años y las prue-
bas no estandarizadas se usan en todos los niveles de edad. Ninguna de estas meto-
dologías es excluyente, es decir, un sujeto puede ser evaluado con todas ellas simultá-
neamente y los datos obtenidos serán complementarios si en cada proceso se han
cuidado las características científicas de la evaluación.
Existe una homogeneidad en las líneas básicas de desarrollo del lenguaje entre las
distintas lenguas en los primeros estadios. Otra cuestión diferente son los estadios
el
más detallados de desarrollo lingúístico que está ya mucho más condicionado por
que el niño aprende y las diferenci as se hacen más y más
tipo de modelo de lenguaje
avances
importantes a partir de los 18 meses. Muchos expertos han estudiado estos
en morfolog ía, fonología , sintaxis, semántica y pragmáti ca que
específicos y precisos
744 Victoria del Barrio
se producen entre los 18 y los 50 meses; estos trabajos se han abordado desde un
marco teórico distinto y con una metodología diferente: observación del lenguaje
espontáneo.
La observación directa del lenguaje infantil puede realizarse sin ninguna estructura-
ción y en ambientes naturales anotando o registrando todo lo que elniño dice, pero
este método es especialmente costoso desde todos los puntos de vista. Por ello, los
expertos en observación del lenguaje han propuesto una serie de estrategias que li-
mitan el tiempo de la evaluación sin que por ello se pierda la riqueza ni la espontanei-
dad de la evaluación, más aún la facilitan. En estas estrategias se plantean los proble-
mas de quién, cuándo, dónde y cómo hacer los registros de lenguaje para conseguir
la máxima calidad con el mínimo costo (Miller, 1976).
a. Seguir las directrices que marca el niño: hablar de lo que el niño está hacien-
do, comentar el contenido de lo que dice, seguirle, oírle, focalizar la conversación so-
bre cosas familiares y cotidianas y usar un lenguaje del mismo nivel.
Evaluación del lenguaje
745
e Todo lo que dice el niño, se le dice u oye se escribe en un papel dividido por
una línea vertical. Lo que dice el niño aparece en el lado derecho. lo que dicen
otros hablantes en el izquierdo. Las distintas personas se identifican por su
inicial (M = mamá, P = papá). La información referida al contexto se recoge en
el lado izquierdo entre paréntesis.
(M: le da un pastel a A)
M: mira lo que tengo/
A: coge el pastel —pastel/
Sn Las emisiones que se suceden unas a otras sin cambio de situación se ponen
en la misma /ínea.
4.2 El signo de terminación es (/). Su uso está determinado por la longitud de una
pausa antes de que aparezca la próxima emisión. Es un juicio difícil de hacer
en etapas tempranas.
5.2 Las pausas se indican mediante un punto (.). Las pausas largas por varios (...).
6.2 Las dicciones ininteligibles se indican por (----).
7.2 Los cortes abruptos se indican por ( ).
8.2 Las páginas se numeran en la parte superior derecha.
9.2 En el margen izquierdo se registra de 50 en 50 las vueltas de la cinta.
10.2 Se registra al comienzo de la grabación la fecha de la toma.
Como se puede apreciar, todas estas normas, a pesar de que introducen un cierto
orden y organización homogénea en los que las siguen, pretenden en todo momento
no ser directivas y conservar al máximo la espontaneidad del lenguaje infantil. Se
pretende que el evaluador logre el máximo lenguaje posible con el mínimo de inter-
vención. Existen también pruebas no estandarizadas que suponen un grado mayor
de estructuración en la elicitación del lenguaje; éstas se verán más adelante en el apar-
tado correspondiente.
746 Victoria del Barrio
Los materiales pueden estar referidos a los equipos de grabación o a los que se usan
para la interacción con el niño.
Aparatos de grabación
Materiales de trabajo
Suelen emplearse diferentes tipos de juguetes, que se seleccionan en función del de-
sarrollo cognitivo de cada sujeto, entre los objetos habituales e inhabituales para la
determinación de diferencias entre unos niños y otros. Brown (1973) indica una se-
rie de recomendaciones en función de los distintos estadios de desarrollo verbal:
a. Del estadio Tal estadio III: pelotas, muñecas, vasos, tazas, coches y camiones.
b. Estadio III: conversación sobre vacaciones, actividades escolares, abuelos,
niños y juguetes favoritos.
c. Estadio IV: contar historias acerca de una actividad pasada o futura.
Algunos autores prefieren las situaciones menos formales sin materiales concre-
tos, puesto que en su opinión facilitan más el lenguaje espontáneo y alargan la longi-
tud media de la frase.
Iv2.5. La duración
El tiempo de duración varía con la edad y también con las recomendaciones de dife-
rentes autores. El término medio de una sesión se estima entre 15 y 30 minutos. Sin
embargo, como han de tomarse registros en diferentes lugares, de distintas activida-
des a lo largo del día, se estima una duración media global de dos horas. Si la graba-
ción estuviese movida por el deseo de establecer la eficacia de un tratamiento, el tera-
peuta es el que debe estimar, según el ritmo del progreso, la periodicidad, duración y
el calendario de los registros.
Los datos obtenidos con esta metodología son muy numerosos y de una gran pre-
cisión y utilidad. Expondremos los más conocidos ante la imposibilidad de pre-
sentarlos todos. Prather, Hedrick y Kern (1975) estudiaron la aparición de distintos
fonemas colocados al principio o al final de emisiones lingúísticas, otros como Stoel-
Gammon (1985) precisaron los porcentajes de esta aparición en los distintos niveles
de edad. Véase cuadro 30.7.
Brown (1973) en el estudio de tres niños proporcionó datos minuciosos sobre la
longitud media de la emisión (Mean utterance length, MLU) en los que basó sus cin-
co estadios evolutivos del lenguaje. Véase el cuadro 30.8. ,
También se ha estudiado el proceso de aprendizaje y el papel que juega la interac-
ción con la madre en el desarrollo de las habilidades lingúísticas (Villiers y Villiers,
1978), que precisa no sólo la implantación de sonidos elementales sino los procesos
de generalización de los primeros términos, las diferentes funciones de los mismos y
las reglas gramaticales específicas del primer año. Más recientemente, comienzan a
evaluarse los aspectos interactivos como la secuencialización en la conversación
748 Victoria del Barrio
Estadios MLU
is
!! AO)
mI LS
IV 3,50
V 4,00
(Jose, 1988). En España, y con metodologías muy diversas, también se han realizado
estudios sobre el desarrollo del lenguaje. Uno de los primeros ha sido realizado por
Gili Gaya (1972) con “recuentos” de la frecuencia de uso de nombres, adjetivos, ver-
bos, adverbios, pronombres, preposiciones y conjunciones en edad preescolar y es-
colar. López Ornat (1975) estudió el uso de determinadas preposiciones en su acep-
ción temporal y espacial en niños de 3 a 6 años. "También existen muchos trabajos
realizados en población mexicana; entre ellos se encuentran los de Melgar de Gon-
zález (1976), cuya investigación proporciona un estudio muy completo sobre el do-
minio de los fonemas en español y los errores más frecuentes desde los 3 hasta los
6 años y medio. El grupo Rosa Sensat (1978) ha construido un vocabulario básico de
niños entre 8-9 años ordenado en función de 26 categorías diferentes. Cabrejo-Parra
(1978), en un estudio longitudinal de diez niños de 18 a 36 meses, localiza a la edad
de 19 meses la aparición de la contestación a la pregunta «¿dónde está ?» ante
la presencia visual del objeto que se nombra. Bosch (1984) ha estudiado el desarrollo
fonológico de niños españoles. Triandó (1982) ha realizado observaciones sobre los
intentos de comunicación gestual y verbal en niños de 11 a 30 meses, mostrando el
desarrollo fonológico y gramatical de los sujetos observados. Clemente (1982) ha es-
tudiado la MLU, el número y tipo de verbos de cada emisión y el tipo y número de
estructuras sintácticas en niños de 2 a 7 años; sus datos proporcionan un listado de
porcentajes medios en cada nivel de edad. Soler (1984) ha estudiado la instalación del
artículo en niños de 3 a 6 años y la evolución de su uso en sus distintas formas, géne-
ros y números. Pérez y Singer (1984) han realizado un estudio de adquisición de
morfemas en niños entre 3 y 6 años, con una secuencialización de los mismos en or-
Evaluación del lenguaje
749
V. PRUEBAS ESTANDARIZADAS
Como su nombre indica, el objetivo de esta prueba es discriminar con rapidez suje-
tos con problemas de desarrollo del lenguaje. Evalúa forma, contenido y uso del len-
guaje, además de discriminación auditiva y visual, tanto por el canal comprensivo
como expresivo. Es aplicable a niños con edades entre 4 y 8 años. Los subtests de la
prueba para la evaluación de la semántica son: partes del cuerpo, objetos comunes,
nombres de acciones, categorías, funciones, mostración, adjetivación y opuestos. La
evaluación de la forma se aborda mediante los subtests: formas pronominales, for-
mas verbales, uso de plurales y sintaxis; este último a su vez evalúa la concordancia
verbo-sujeto y capacidad de repetición y discriminación de oraciones con compleji-
dad estructural. En cuanto a la evaluación de la percepción visual, se hace mediante
emparejamiento incluyente o excluyente de dibujos, y la percepción auditiva me-
diante memoria auditiva y retención de conceptos básicos de una historieta y dis-
criminación de dibujos por su sonido básico. La fiabilidad test-retest con intervalo
de una semana es de 0,96; la validez concurrente con el subtest de vocabulario del
Boehm es de 0,82. Existe una forma española de la prueba (Forns y cols., 1987).
Es una de las pruebas más conocidas y de uso más generalizado. Se centra específica
mente en la evaluación del lenguaje comprensivo mediante la recepción funcional de
las palabras presentadas verbalmente por el evaluador apoyadas por imágenes. Su
primera forma es del año 1959 y ha tenido una revisión importante en 1981. Los
objetivos que se plantea son la localización precoz de problemas de lenguaje, la eva-
luación del rendimiento escolar y, ya en el campo clínico, el diagnóstico y segui-
miento de la eficacia de las intervenciones. Es aplicable a sujetos normales y retrasa-
dos de dos años y medio a 18 años de edad, pero no se aconseja su uso en sujetos con
mala discriminación auditiva o visual. Su duración aproximada es de 15 minutos. Se
compone de 150 láminas con tres imágenes para elección múltiple y cinco láminas de
ejemplo. La tarea consiste en seleccionar y señalar la imagen correspondiente a un
único reactivo verbal que emite el evaluador ante una lámina que presenta varios ob-
jetos o acciones. La respuesta es gestual, lo que hace innecesario que el sujeto posea
lenguaje verbal o escrito para poder contestar a los reactivos. La dificultad de las
imágenes es gradual, por lo que la prueba puede iniciarse en distintos niveles de difi-
cultad. Para la estimación del nivel de comienzo existen unas tablas basadas en la
edad cronológica y en las respuestas correctas que determinan el intervalo crítico de
cada sujeto; este intervalo es la zona del test donde los reactivos resultan más discri-
minativos para cada individuo (el elemento inferior del intervalo se llama elemento
base y el superior elemento techo). La corrección de la prueba se hace dando como
positivos todos los elementos previos al elemento base y negativos todos los ítems
por encima del elemento techo, por tanto la puntuación directa se obtiene restando
el número de errores a la puntuación máxima de cada elemento techo. La hoja de
respuesta facilita la corrección. Las puntuaciones directas se pueden transformar en
puntuaciones deciles, centiles y estaninas; también se proporciona un baremo evolu-
tivo que permite obtener la edad equivalente de un sujeto en función de las puntua-
ciones obtenidas en la prueba.
754 Victoria del Barrio
Se trata de una prueba específica para el análisis de las estructuras sintácticas. Es aplica-
ble a niños con edades entre nueve meses y seis años. Su aplicación tiene un aprendizaje
costoso, pero existe un perfil informatizado que facilita la tarea. Permite la obtención de
Evaluación del lenguaje
755
esquemas sintácticos del sujeto que efectúa la prueba; también proporciona una
escala
evolutiva media que permite situar a un sujeto concreto en la escala de desarrollo que
le
corresponde. Existe una adaptación al español de esta prueba (Serra, 1979).
Se trata de pruebas de evaluación del lenguaje que pretenden una cierta estructura-
ción de los reactivos de elicitación del mismo, pero no están sujetas a una objetividad
estricta de presentación ni de evaluación. Se van a exponer aquí algunas de estas
pruebas, aunque no todas tienen adaptación española.
El test consta de tres partes: test de objetos comunes, con objetos de uso cotidia-
no aplicable a niños de 11 a 20 meses; test de juguetes en miniatura, que permite ac-
ceder a objetos no domésticos como coches, aviones, etc., aplicable desde los 21 me-
ses a los 5 años y medio; y test del libro de los dibujos, que permite extender el
campo de los reactivos a situaciones complejas (escenas, secuencias, acciones, histo-
rias...) y es aplicable a niños de 3-6 años. La corrección de la prueba se hace recon-
tando los aciertos, con los que se elabora para cada sujeto un perfil de desarrollo del
lenguaje. Existe una traducción de esta prueba al español (MEPSA, 1984).
luación son variados, pero hay una tendencia a asumir puntos de vista integradores
que consideran la lectura y la escritura como un complejo sistema de elementos es-
tructurados en una función dinámica. Estos elementos serían los estímulos visuales,
la actividad cerebral asociada a la percepción e intelección de la significación de los
signos (codificación y decodificación) y la actividad motora; también se analizan ele-
mentos que se han relacionado etiológicamente con los problemas lectores tales
como la dominancia lateral, el control del equilibrio, el control binocular, el control
ocular motor, la discriminación perceptiva, las destrezas auditivas y visuales, las es-
trategias lectoras, los procesos cognitivos complejos como categorización, recupera-
ción de información, etc. Todos estos elementos colaboran en la conducta lectora,
que consiste fundamentalmente en lograr que unos estímulos visuales se conviertan
en un estímulo discriminativo de determinados sonidos que pertenecen a un código
lingúístico y, por tanto, permiten la significación y la comunicación. La evaluación
del lenguaje escrito asume la evaluación de todos estos elementos.
a. Que el test evalúe las habilidades que sean útiles para proporcionar pistas
para una posible intervención.
b. Que la validez sea alta en aplicación individual (0,90).
c. Que la correlación entre subescalas sea suficientemente baja (0,65).
tuación global se obtiene a partir de la suma de los puntos de cada prueba. Las pun-
tuaciones permiten la obtención de un perfil individual o un perfil colectivo útiles
para agrupar sujetos en función de sus distintas habilidades. La fiabilidad de la prueba
mediante test-retest es adecuada. La validez predictiva obtenida a través de su correla-
ción con calificaciones escolares es de 0,75. El análisis factorial del ABC ha proporcio-
nado tres factores: X (espacial), Y (velocidad) y Z (memoria). La validez concurrente
con el Reversal es sólo significativa (0,24) en velocidad lectora e irrelevante en todas
las demás subpruebas; con el Test de rendimiento lector, la correlación es más alta; sin
embargo, su validez predictiva presenta problemas (González Portal, 1984).
Es una prueba de carácter preventivo que parte del presupuesto de una habilidad es-
pecífica y evalúa por tanto lo que se considera prerrequisitos para la lectura; preten-
de determinar el momento adecuado para comenzar el aprendizaje de la lectura y
evitar desajustes que originan las dificultades. Consta de dos partes: batería predicti-
va, muy próxima a la de Lourenío Filho, y batería de lectura aplicable a niños que ya
han iniciado el aprendizaje. La primera explora organización del espacio, lenguaje y
organización temporal; la segunda, lectura de palabras familiares, dictado de pala-
bras familiares, lectura de palabras extrañas y comprensión de lectura silenciosa. Es
aplicable a niños de 5-7 años y su validez predictiva es de 0,83.
Esta prueba tiene un marco teórico que subraya los aspectos neurológicos implica-
dos en la lectura; se señalan unos factores neuropsicológicos básicos para la madurez
lectora: estructuración espacial, estructuración rítmica, lenguaje oral (comprensivo y
expresivo) y lateralización. Se ha hecho una selección de pruebas ya existentes para
cubrir la evaluación de esos factores: organización perceptiva de Hilda Santucci
(OP), reproducción auditivo-manual de estructuras rítmicas de Mira-Stambak
(RER), seriación óculo-manual de estructuras rítmicas de Mira-Stambak (RER), con-
creción-abstracción lexical tomado del vocabulario del W7PPSI de Wechsler (CAL),
memoria auditivo-vocal tomado de la repetición de frases del WIPPS7 de Wechsler
(CAL), reconocimiento de diferencias espaciales entre dibujos semejantes tomado de
Horts (RDE) y orientación derecha-izquierda tomado de Piaget-Head en la adapta-
ción de Galifret Grajon (ODI). Está elaborado para niños entre 5 y 6 años de edad; la
aplicación es individual y la duración de unos 30 minutos. Cada reactivo tiene unas
normas de corrección para su calificación; a su vez, cada subprueba tiene una pun-
tuación directa que se convierte luego en estándar. La puntuación global se obtiene a
partir de la suma de las puntuaciones estándar de las subpruebas. El punto de corte
para hacer un buen pronóstico en el aprendizaje de la lectura lo ha estimado el autor
en 72 puntos, y el punto de corte de un mal pronóstico se estima en 49puntos; las
puntuaciones intermedias suponen dificultades en la lectura. La fiabilidad de la
prueba por el método de las dos mitades es de 0,94; su validez concurrente con
la prueba de lectura de De la Cruz (1980) es de 0,69.
tuación correcta viene dada por el número de aciertos. La estandarización está reali-
zada en puntuaciones centiles.
Dentro del mismo marco teórico que la anterior, esta prueba pretende evaluar la ca-
pacidad para abstraer la información relevante de un texto. Consta de dos partes di-
ferenciadas: identificación de ideas principales e identificación del resumen más ade-
cuado. La consistencia interna de la prueba es de 0,75 en identificación de ideas
principales y 0,65 para la totalidad de la prueba.
VI. CONCLUSIONES
REFERENCIAS BIBLIOGRÁFICAS
Aguirre, G. y Beiras, T. (1976). Datos para una investigación sobre comunicación no verbal.
Anuario de Psicología, 2, 37-60.
Aimard, P. y Abadie, C. (1992). Intervención precoz en los trastornos del lenguaje del niño.
Barcelona. Masson.
Ajuriaguerra,
J Ne 1 ]., Auzias, M. yyDenner, A. (1964). L'écriture de Penfant. Neuchátel. Delachaux
y Niestlé.
Alonso Tapia, J., Carriedo, N. y Mateos, N. (1992). Evaluación de la supervisión y compren-
sión: la batería SURCO. En A. Alonso-Tapia (dir.), Metacognición, comprensión lectora y
pensamiento crítico: desarrollo de estrategias y técnicas de evaluación. Madrid. Servicio de
Publicaciones del Ministerio de Educación y Ciencia.
Alonso Tapia, J., Carriedo, N. y González, A. (1992). Evaluación de la comprensión lectora:
la batería IDEPA. En A. Alonso-Tapia (dir.), Metacognición, comprensión lectora y pensa-
miento crítico: desarrollo de estrategias y técnicas de evaluación. Madrid. Servicio de Pu-
blicaciones del Ministerio de Educación y Ciencia.
Alonso Tapia, J. y González Alonso, A. (1988). Escalas de desarrollo lingúístico de Reynell.
Madrid. MEPSA.
Bankson, N. W. (1977). Bankson's Language Screening Test. Nueva York. Psychological
Corporation.
Belinchón, M. (1985). Adquisición y evaluación de las funciones pragmáticas del lenguaje: un
estudio evolutivo. Estudios de Psicología, 19-20, 35-49. ei
Belinchón, M., Riviére, A. e Igoa, J. M. (1992). Psicología del lenguaje. Investigación y teoría.
Madrid. Trotta.
Bellugi, U. (1978). How children say no. Cambridge. MIT Press.
Blagden, C. y McConnell, N. (1985). Interpersonal language skill assessment. Moline. Lin-
ulsystems.
osea (1970). Language development: Form and function in emerging grammars. Cam-
bridge. MIT Press. y
Eo y Lahey, M. (1978). Language development and language disorders. Nueva York.
Wiley. q
Boada, HL(1986). El desarrollo de la comunicación en el niño. Barcelona. Anthropos.
Bosch, L. (1984). Desarrollo fonológico infantil: una prueba para su evaluación. En M. Si-
guán (dir.), Estudios sobre psicología del lenguaje infantil. Madrid. Pirámide. :
Bosch, L. (1987). Avaluació del desenvolupament fonologic en nens catalano-parlants de 3 a 7
anys. Barcelona. PPU. ;
aid B. A. (1984). Bracken Basic Concept Scale. San Antonio. Psycholog ical Corporati on.
768 Victoria del Barrio
Brown, R. (1973). A first language. The early etage. Cambridge. Harvard University Press.
Brown, R. y Bellugi, U. (1964). Three process in the child”s acquisition of syntax. Harvard
Educational Review, 34, 133-151.
Buhler, C. (1930). The first year of live. Nueva York. Day. la.
Cabrejo-Parra, E. (1978). Álgunos aspectos comparativos de la adquisición del lenguaje. En
J. P. Bronckart, P. Malrieu, M. Siguán, H. Sinclair, T. Slama-Cazacu y A. Tabouret-Keller
(dirs.), La génesis del lenguaje. Su aprendizaje y desarrollo. Madrid. Pablo del Río. ;
Capman, R. (1981). Exploring children's communication intents. En J.Miller (dir.), Assessimg
language production in children: Experimental procedures. Baltimore. University Park
Press.
Carrow-Woolfolk, E. (1970). Test for Auditory Comprehension of Language. Austin. Lear-
ning Concepts. .
Clemente, A. M. (1982). Variaciones en el lenguaje espontáneo infantil. En M. Siguán (dir.),
Estudios sobre psicología del lenguaje infantil. Madrid. Pirámide.
Cone, J. D. (1981). Psychometric considerations. En M. Hersen y A. S. Bellack (dirs.), Beha-
vioral assessment (2.* ed.). Nueva York. Pergamon Press.
Cordero, C., González, M., Seisdedos, N., De la Cruz, M. V. (1988). COE. Comprensión de
órdenes escritas. Madrid. TEA.
Critchley, M. (1970). Developmental dislexia. Heiman. Medical Books.
Crystal, D. (1979). Working with LARPS. Londres. Edward Arnold.
Crystal, D. (1982). Profiling lingustic disability. Londres. Edward Arnold.
Darwin C. R. (1877). A biographical sketch of an infant. Mind, 2, 285-294.
De la Cruz, M. V. (1980, 1988). Pruebas de lectura (Niveles 1 y 2). Madrid. TEA.
De la Cruz, M. V. y Cordero, A. (1991). VCLC. Método visual para la estimulación del len-
guaje. Guía para la aplicación. Adaptación española. Madrid. TEA.
Dunn, L. M. (1959). Peabody Picture Vocabulary Test: Original edition. Circle Pines. Ameri-
can Guidance Service.
Dunn, L. M. (1981). Peabody Picture Vocabulary Test-Revised. Circle Pines. American Gui-
dance Service.
Edelfeldt, A. W. (1975). Manual del Reversal Test. Barcelona, Herder.
Faw, T. (1981). Psicología del niño. Bogotá. McGraw Hill.
Fernández Pozar, F. (1983, 1988). Batería pedagógica 3. Evaluación de la lengua castellana en
el ciclo medio BP-3. Madrid. TEA.
Forns, M. (1989). Consideraciones acerca de la evaluación del lenguaje. En C. Triadó y
M. Forns (dirs.), La evaluación del lenguaje. Barcelona. Anthropos.
Forns, M., Triadó, C., Berdie, A. y Mondelo, P. (1987). Evaluación del conocimiento semán-
tico mediante el Bankson's Language Screening Test. Revista de Logopedia, Foniatría y
Audiología, VII, 213-224.
García-Albea, J. E., Sánchez Bernardos, M. L. y Del Viso Pabón, S. (1986). Test de Boston
para el diagnóstico de la afasia. Adaptación española. En H. Goodglass y E. Kaplan (dirs.),
Evaluación de la afasia y trastornos relacionados. Madrid. Médica Panamericana.
García Núñez, J. A. y León García, O. (1989). Test de habilidades grafomotoras (THG). Ma-
drid. García Núñez.
Gerard, K. A. y Carson, E. R. (1990). The decision-making process in child language assess-
ment. British Journal of Disorders of Comunication, 25, 61-75.
Gili Gaya, S. (1972). Estudios de lenguaje infantil. Barcelona. Biblograf.
González Portal, M. D. (19844). Dificultades en el aprendizaje de la lectura. Madrid. Servicio
de Publicaciones del Ministerio de Educación y Ciencia.
González Portal, M. D. (1984b, 1989). EDIL-1. Exploración de las dificultades individuales de
lectura (Nivel 1). Madrid. TEA.
Gray, W. S. (1957). La enseñanza de la lectura y la escritura. París. Unesco.
Gregoire, A. (1937). L'apprentissage du langage. París. Éditions les Belles Lettres.
Evaluación del lenguaje
769
Howlin, P. (1980). Language training. En W. Yule y J. Carr (dirs.), Behavior modification for
the mentally handicapped. Londres. Croom Helm.
Inizan, A. (1976). Cuándo enseñar a leer. Madrid. Pablo del Río.
Ireton, H. y Thwing, E. (1974). Manual for the Minnesota Child Development Inventory.
Minneapolis. Behavior Science Systems.
Irwin, O. C. (1949). Infant speech. Scientific American, 18, 22-24.
Jose, P. E. (1988). Sequentality of speech acts in conversationnal structure. Journal of Psycho-
linguistic Research, 17, 65-88.
a E., Goodglass, H. y Weintraub, S. (1983). Boston Naming Test. Filadelfia. Lea and
ebiger.
Kent, L. R. (1974). Language adquisition program for the retarded or multiply impaired. Re-
search Press.
Kirk, S. A. y Kirk, W. (1976). Psycholinguistic learning disabilities: Diagnosis and remedia-
tion. Urbana. University of Illinois Press.
Kirk, S. A., McCarthy, J. J. y Kirk, W. (1968). Examiner's Manual: Illinois Test of Psycholin-
guistic Abilities-R. Urbana. University of Illinois Press.
Leopold, W. (1939). Speech development of a bilingual child (4 vols.). Evanston. Northwes-
tern University Press.
Lewis, M. M. (1936). Infant speech: A study of the beginnings of language. Nueva York.
Harcourt Brace.
López Ornat, S. (1975). Dinámica de la adquisición verbal. Revista de Psicología General y
Aplicada, 137, 1059-1068.
Lourenío Filho, M. B. (1928). Testes para clasificao de analfabetos. Sao Paulo. Sociedade de
Educacao.
Lourenío Filho, M. B. (1937). Test ABC. Madrid. Kapelusz.
Lugo, D. E. (1980). Adaptación española de ITPA Prueba de Illinois de habilidades psicolin-
gúísticas. Board of Trustees of the University of Illinois.
Luria, A. R. (1966). Higer cortical functions in man. Nueva York. Basic Books.
Machado Álvarez, A. (1887). Tintín. Boletín de la Institución Libre de Enseñanza, XI, 319-320.
Mayor,J.y Pinillos, J. L. (dirs.) (1991). Comunicación y lenguaje. Madrid. Alhambra Univer-
sidad.
McCarthy, D. (1957). Desarrollo del lenguaje en los niños. En L. Carmichael (dir.), Manual
de psicología infantil. Barcelona. Ateneo.
McCarthy, D. (1959). Research in language development: Retrospect and prospect. Mono-
graphs of Social Research in Child Development, 24, 3-24.
McNeill, D. (1966). The creation of language for children. En J. Lyons y R. ]. Wales (dirs.),
Psycholinguistics papers. Edimburgo. University Edinburgh Press. E
MeNeill, D. (1970). The adquisition of language: the study of developmental psycholinguis-
tics. Nueva York. Harper and Row. to,
Melgar de González, M. (1976). Cómo detectar a un niño con problemas del habla. México.
Trillas.
MEPSA (1984). Stycar Languaje de Sheridan. Madrid. MEPSA.
Miller]. E. (dir.) (1976). Procedures for assessing children's language: Á developmental process
approach. Waisman Center on Mental Retardation and Human Development, University
of Wisconsin, Madison.
770 Victoria del Barrio
LECTURAS COMPLEMENTARIAS
Alonso Tapia, A., De la Cruz, A. y Carriedo, N. (1992). Evaluación del desarrollo del lengua-
je. En R. Fernández-Ballesteros (dir.), Introducción a la evaluación psicológica. Madrid.
Pirámide.
Carranza, J. A. y Brito, A. G. (dirs.) (1991). Adquisición y desarrollo del lenguaje [Número
especial]. Anales de Psicología, 2. 0 que :
Gerard, K. A. y Carson, R. E. (1990). The decision-making in child language assessment. Bri-
tish Journal of Disorders of Communication, 25, 61-75.
Mayor, M. A. y Rivas, R. M. (1996). Evaluación de los trastornos del lenguaje. En G. Buela-
Casal, V. E. Caballo y J. C. Sierra (dirs.), Manual de evaluación en psicología clíncia y de la
salud. Madrid. Siglo XXI. ,
Triandó, C. y Forns, M. (1989). La evaluación del lenguaje. Barcelona. Anthropos.
Valle Arroyo, F. (1991). Psicolinguística. Madrid. Morata.
he d-Joer
>
=$ A -
Pro der $ 3
0 MN 4
pla pcs
$ Ano
;h E
A OY:yISR,
POMTTOnA 200 E A Os
y o a.
; CA
+ Dis han
E :
3 e. .
31. EVALUACIÓN DEL DESARROLLO PSICOSOCIAL
TERESA KIRCHNER
IL. INTRODUCCIÓN
El ser humano vive y se desarrolla dentro de un contexto social; pasa la mayor parte
de su vida en contacto con los demás, cooperando con otras personas, aprendiendo,
trabajando y estudiando con otros, en suma, viviendo y sintiendo en común. Esta
convivencia exige y potencia el desarrollo progresivo de una serie de comportamien-
tos específicos y habilidades de interrelación personal que constituyen el proceso de
socialización. Se ha podido comprobar que los aspectos sociales de la conducta tie-
nen importantes repercusiones en amplias áreas de la actividad humana, desde la
cognitiva a la afectiva, redundando tanto en procesos de aprendizaje como en la pro-
pia integración personal. Asimismo, esta influencia se extiende a contextos muy va-
riados, especialmente al escolar, al familiar, al laboral y, en general, a todos aquellos
ámbitos donde se requiera interrelación personal. Por tanto, es lógico que los psicó-
logos se hayan interesado por evaluar esta importante dimensión social de la con-
ducta y se hayan diseñado numerosos instrumentos que hagan factible este análisis.
Efectuando una breve revisión histórica, se observa que el interés por evaluar
factores de tipo social es relativamente temprano, pudiéndose señalar la década de
los años treinta como punto de partida inicial, y aún antes incluso. En efecto, como
el lector recordará, la mayoría de las pruebas clásicas de inteligencia infantil —como
la Escala de Binet-Simon— incluía ítems destinados a calibrar la capacidad de adap-
tación social de un determinado sujeto. Generalmente, estos ítems se englobaban
bajo el epígrafe de “inteligencia social”, concebida como la modalidad relacional de
la capacidad intelectual. Otras escalas clásicas de desarrollo intelectual que incluyen
una dimensión de socialización entre sus reactivos son la de Brunet-Lezine y las de
Gesell. Las mismas escalas de Wechsler participan de esta tradición mediante la in-
clusión de los subtests de comprensión que exploran la capacidad del sujeto para
comprender y seguir pautas sociales establecidas.
Con todo, en este capítulo se hará referencia exclusiva a todas aquellas pruebas
concebidas explícitamente desde su construcción como escalas básicas de soctaliza-
ción. El objetivo común de todas ellas se ha centrado, y se centra, en explorar de-
ficiencias en alguna de las áreas básicas de socialización a fin depoder implantar pro-
gramas de intervención adecuados, o bien en calibrar las posibilidades educativas de
sujetos con retraso mental. También han permitido efectuar estudios evolutivos de
los diferentes estadios de desarrollo de patrones sociales.
Es de referencia obligada, al hablar de los orígenes de esta evaluación, la Escala
de madurez social de Vineland, publicada originalmente por Doll en 1935 y de la
Universidad de Barcelona.
774 Teresa Kirchner
por descontado, de una época a otra. Así, mientras para unas perspectivas la madu-
rez social sería la capacidad para adaptarse y aceptar las normativas de un grupo,
desde otros puntos de vista sería la capacidad del sujeto para ser asertivo y destacarse
en el grupo social, pudiendo desarrollar de pleno sus intereses, emociones y necest-
dades, sin interferir en las de los demás. Adams (1975) nos ofrece una serie de carac-
terísticas de los sujetos con una buena adaptación personal-social que abarcaría mu-
chos de los aspectos comentados:
Ya hemos adelantado que el interés por evaluar esta dimensión relacional de la acti-
vidad humana es relativamente reciente y que ha experimentado un incremento pro-
gresivo a lo largo de las dos últimas décadas. Esto ha dado lugar a una gran prolifera-
ción de técnicas e instrumentos, que si bien tienen en común el análisis de ejes
comportamentales que se suponen claves en la conducta de interrelación personal,
presentan entre ellas diferencias conceptuales y/o estructurales importantes. En este
apartado se presentará, en primer lugar, una clasificación de las principales técnicas
para evaluar el desarrollo psicosocial; en segundo lugar, se tratarán las dimensiones
que suelen explorar estos instrumentos, es decir, qué se evalúa; finalmente, en un ter-
cer apartado, se analizarán con cierto detalle, a modo de ejemplo, dos escalas que
778 Teresa Kirchner
m1. Clasificación
Al igual que sucede con otros instrumentos de evaluación, como por ejemplo los
tests de inteligencia, las clasificaciones admiten diversas variantes según el eje refe-
rencial que se escoja. Así, puede elegirse como variable aglutinadora el modelo teóri-
co subyacente, el tipo concreto de variables de socialización que se priman, o la es-
tructura formal de la técnica que se ha elegido, etc. Por ejemplo, McFall (1982), tras
una exhaustiva revisión del concepto, llega a identificar dos grandes modelos: el mo-
delo de rasgos y el modelo molecular. El primero concibe las habilidades sociales
como una predisposición subyacente de respuesta que se da transituacionalmente, es
decir, se da un mismo patrón de conducta social a lo largo de diversos ámbitos. Por el
contrario, el modelo molecular concibe la socialización como una serie de conductas
discretas específicas a la situación, no vinculadas a rasgos ni a estructuras de persona-
lidad subyacentes. El problema que presentan los instrumentos de evaluación desde
esta segunda perspectiva es la selección apropiada de unidades de conducta social y
la clasificación de las situaciones sociales. Por su parte, las técnicas vinculadas al pri-
mer modelo presentan como mayor limitación su poca validez ecológica. Otros auto-
res han efectuado una clasificación según el tipo de tecnología o estrategia utilizada
para analizar esta dimensión relacional de la conducta. Este es el caso de Michelson y
cols. (1987), para quienes la mayoría de las pruebas que evalúa a esta conducta y ha-
bilidades sociales puede incluirse en tres grandes bloques: técnicas de observación de
la conducta, heteroinformes y autoinformes.
111.2. Heteroinformes
Puede afirmarse que constituyen el material de evaluación con mayor tradición his-
tórica en este campo. Un agente social conocedor del sujeto de evaluación emite una
valoración sobre determinados aspectos de su conducta social. Estas personas alle-
gadas suelen ser los padres, los maestros y los propios compañeros. Estos heteroin-
formes pueden adoptar diferentes modalidades; por ejemplo, cuestionarios, escalas
de estimación o sociogramas. Por supuesto, también es factible la información ver-
bal directa por parte de los agentes sociales. Las primeras escalas para evaluar la ma-
durez en el desarrollo psicosocial, como las ya comentadas de Vineland o la Escala
de desarrollo psicosocial de Hurtig y Zazzó, pertenecen a esta categoría de heteroin-
formes a través de escalas de estimación. A partir de la década de los años setenta se
aprecia una auténtica proliferación de cuestionarios y escalas destinados a ser cum-
plimentados por profesores, padres o compañeros. Cast todos ellos son de habla in-
glesa y adaptados al contexto norteamericano en su mayoría. Podría destacarse, por
[In-
su amplia utilización, la Walker problem behavior inventory checklist (WPBIC)
1970), que explora cinco di-
ventario de la conducta problema de Walker] (Walker,
mensiones del comportamiento social: comportamiento manifiesto, retrarmiento,
780 Teresa Kirchner
111.13. Autoinformes
zación. Algunos autores han intentado una clasificación de las diferentes dimensio-
nes que componen la mayoría de los instrumentos de evaluación de esta faceta com-
portamental. Es indispensable efectuar una referencia a la obra de Spivack y Swift
(1973) sobre las escalas de socialización elaboradas en los años sesenta; estos autores
encuentran cuatro dimensiones esenciales de exploración:
Por otro lado, Khon (1977) propuso una teoría bifactorial, según la cual en la
mayoría de los instrumentos de evaluación de factores psicosociales pueden identifi-
carse dos grandes dimensiones que explicarían buena parte del funcionamiento so-
cial en distintos contextos: retralmiento versus participación, y agresividad y con-
ducta antisocial versus cooperación. Por su parte, Matson, Rotatori y Helsel (1983)
factorializaron el Matson evaluation of social skills with youngster (MESSY), obte-
niendo los siguientes datos independientemente para cada una de las dos escalas que
componen la prueba (escala de autoevaluación y escala de heteroevaluación). En la
escala de autoevaluación encontraron cinco factores esenciales: habilidades sociales
apropiadas, asertividad inapropiada, impulsivo/recalcitrante, autoconfiado y envi-
dia/retirada. Por lo que respecta a la escala para el profesor, emergen dos factores
fundamentales: asertividad/1mpulsividad inapropiadas y habilidades sociales apro-
piadas.
Finalmente, nos gustaría hacer referencia a algunos trabajos efectuados en Espa-
ña, entre los que destacan, por pioneros, los de Pelechano (1975, 1976). Este autor
elaboró dos escalas (AHS-1 y ETC-1) para calibrar los procesos de socialización de los
sujetos con retraso mental. Con posterioridad, construyó dos escalas (ESE-1 y ES£-2)
para evaluar aspectos positivos y negativos respectivamente de la socialización (Pe-
lechano y Barreto, 1979; Pelechano y Báguena, 1980). La escala ESE-1 incluye cuatro
factores de potenciación de la socialización: colaboración, respeto y responsabili-
dad, popularidad y liderazgo y actitud diferencial positiva entre actividades escola-
res y extraescolares. Por su parte, la escala £SE-2 está conformada básicamente por
dos factores diferenciales: hiperactividad y/o agresividad, e inseguridad y retral-
miento. > l :
En resumen, puede observarse que con mayor o menor número de dimensiones,
la mayoría de los instrumentos ideados para evaluar el nivel de desarrollo psicosocial
ha identificado una serie de parámetros y conductas prototípicas, que repercuten fa-
vorable o desfavorablemente tanto en las interrelaciones personales como en el ajus-
te personal y escolar. Estos parámetros aparecen en distintos marcos transculturales.
782 Teresa Kirchner
' Esta prueba ha sido traducida y aplicada a población española por Forns y Amador de la Universi-
dad de Barcelona.
Evaluación del desarrollo psicosocial
785
El examinador puede aplicar las cuatro subescalas o, según sus objetivos, únicamen-
te una o dos. Tres de estas escalas tienen estructura de encuesta o cuestionario: la es-
cala de evaluación del estudiante, la escala de evaluación del profesor y la escala de
evaluación de padres; la cuarta es una medida sociométrica. Analizaremos breve-
mente cada una de estas escalas y sus componentes esenciales.
La escala de evaluación del estudiante se compone de 30 ítems a los que el niño
deberá responder “sí” o “no”. Una característica diferencial con respecto a otros
cuestionarios similares es que el examinador lee al alumno cada uno de los ítems, lo
cual, según Hresko y Brown (1984), contribuye a aumentar la validez y fiabilidad de
la prueba, especialmente en el caso de niños muy pequeños o con dificultades mani-
fiestas para la lectoescritura. El objetivo de esta escala es calibrar la percepción que
tiene el niño de su propia conducta, cómo se relaciona con las figuras de autoridad y
con los demás compañeros. Algunos ejemplos del tipo de pregunta que se formula
son: ¿Te gusta jugar con otros niños?, ¿Tienes muchos amigos?, ¿El trabajo en la es-
cuela es demasiado duro?, ¿Te molesta que las personas mayores te digan lo que debes
hacer?, ¿Tienes muchos dolores de estómago o de cabeza?, etcétera.
La escala de evaluación del profesor consta de 36 frases que el profesor u otras
personas que conozcan a fondo la conducta escolar del sujeto evaluado deben com-
pletar. Se les ofrece cuatro alternativas de respuesta (“Mucho”, “Bastante” “Algo” o
“Nada”). Al igual que en el caso anterior, los ítems van referidos tanto a la conducta
personal del alumno, como a su relación con profesores y otras figuras de autoridad,
como también a las relaciones que establece con sus compañeros. Algunos ejemplos
de esta escala son: El alumno es perezoso, Intimida a otros niños, No se separa fácil-
mente de sus padres, etcétera.
La escala de evaluación para padres consta de 34 ítems que deben completar pa-
dres o, en su caso, tutores que conozcan a fondo al niño. Cada frase presenta cuatro
alternativas de respuesta (“Mucho”, “Bastante” “Algo” o “Nada”). También como
en casos anteriores, pretende evaluar el comportamiento personal del niño, su rela-
ción con las figuras de autoridad en casa y con otros niños en casa o con los vecinos.
Algunos ejemplos de los ítems que se incluyen son: Mi hijo no sigue las normas esta-
blecidas por nosotros, Llora excesivamente, Interrumpe el juego de otros niños, etcé-
tera. ,
El sociograma del TOESD, a diferencia de las tres anteriores escalas, constituye
una técnica de nominación por parte de los compañeros del niño evaluado. Su obje-
tivo es averiguar el puesto que ocupa el sujeto dentro de su grupodecompañeros. Se
compone de tres preguntas, de las cuales el examinador debe elegir una: 57 celebraras
una fiesta, ¿a quién invitarías?, ¿quién querrías que estuviera en ellas, ¿qué amigos te
gustaría tener en tu fiesta de cumpleaños? De todos los chicos de tu clase, ¿quiénes son
tus amigos? La pregunta elegida por el examinador será formulada a todos los niños
de la clase (se necesitan un mínimo de veinte participantes). Es importante que cada
uno delos niños participantes en el sociogramadéun mínimo de tres nombres como
respuesta a la pregunta inicial; en caso contrario, el examinador puede seguir inda-
gando hasta conseguirlo. 2
En relación a la puntuación e interpre tación del TOESD, a partir de las notas bru-
tas, fáciles de calcular sumando las respuest as consider adas críticas en el sentido que
marca la escala, se obtienen dos tipos de puntuaci ones normativas: puntuaciones es-
786 Teresa Kirchner
Una reflexión final para concluir este capítulo nos lleva a observar que la evaluación
psicológica, desde una perspectiva diacrónica, ha ido centrándose progresivamente
desde la exploración de rasgos individuales y aparentemente fuera de su contexto
ambiental, a contemplar dimensiones relacionales o patrones de conducta dentro de
su contexto ecológico. De aquí que la evaluación de la socialización, en tanto que
conjunto amplio de conductas que posibilitan la autonomía personal y la interrela-
ción con los demás, haya ido tomando fuerza progresiva. De un buen desarrollo so-
cial y socioemocional van a depender aspectos tan importantes como el sentido de la
cooperación, el respeto mutuo, la sensibilidad interpersonal y, de hecho, como
apuntan numerosos autores, la calidad interrelacional va a incidir en posteriores
conductas de vulnerabilidad, inestabilidad y falta de dominancia, así como los pro-
pios procesos de aprendizaje.
De aquí la necesidad de efectuar un seguimiento del desarrollo de los patrones
sociales de conducta de un determinado sujeto, desde los tempranos estadios evolu-
tivos. Es por este motivo que muchas pruebas y tests elaborados para evaluar esta
variable comportamental van dirigidos a población infantil y están adaptados a sus
contextos de máxima significación (familiar y escolar), con énfasis especial en este
último donde, cabe señalar, se está dando un proceso curioso: la dificultad de apren-
dizaje, o el fracaso escolar, si se quiere, ha pasado de interpretarse desde una óptica
puramente del déficit cognitivo, a calibrarse como fruto de desadaptaciones psicoso-
ciales y socioemocionales. Incluso para algunos autores, esta tendencia actual ha im-
primido un giro al papel tradicional desempeñado por el psicólogo escolar, que pasa
de estar ceñido a la evaluación de deficiencias cognitivas, a abarcar un campo más
amplio de detección precoz, prevención y desarrollo de habilidades o conductas so-
ciales y afectivas a fin de lograr una mayor integración personal, escolar e interperso-
nal de los niños.
REFERENCIAS BIBLIOGRÁFICAS
LECTURAS COMPLEMENTARIAS
Álvarez, A., Álvarez-Monteserín, M. A., Cañas, A., Jiménez, S. y Petit, M. J. (1990). Desarro-
llo de las habilidades sociales en niños de 3-6 años. Madrid. Visor.
Evaluación del desarrollo psicosocial 789
pla del
ya $
Y
LR da A
ES
4
. A sl ins
+
pecasa de oc
Mbs a pc. AS y PAGAR ade Corina, 55, eN
Ñ A ] + WE Ps 8 eN "LE e cala nod on E] ole* me
, F
ME
¿
Row peta 02 pad
1p99485
CHINET> y A MS HAS Y
eta de war e vd Madrid A
y Le 317 A : [Mad ¿ÑTEA: Y
t. Los Angeles.
; > AS
> > mu
3
32. EVALUACIÓN DE LOS PROBLEMAS EMOCIONALES
Y CONDUCTUALES EN NIÑOS
ALAN E. KAZDIN
I INTRODUCCIÓN
Varios avances han hecho aumentar la atención hacia los trastornos y su evalua-
ción. Entre éstos han destacado los progresos en diagnósticos psiquiátricos. Histór1-
camente, el diagnóstico en la práctica e investigación clínica se ha centrado principal-
mente en trastornos evidentes en la edad adulta. Pocos tipos de trastornos se
reconocían como evidentes en la infancia. En los últimos quince años, los sistemas
de diagnóstico han destacado aquellos trastornos que surgen en la infancia, niñez y
adolescencia. Las últimas versiones del Diagnostic and statistical manual of mental
disorders (DSM) (American Psychiatric Association, 1987, 1994) y la International
classification of diseases (ICD) (World Health Organization, 1988) reconocen un
gran número de trastornos que experimentan los niños. La especificación de múlti-
ples trastornos y los esfuerzos para emplear términos descriptivos en lugar de etioló-
gicos para identificarlos ha conducido a la investigación de los trastornos infantiles.
Naturalmente, el interés en una amplia variedad de trastornos ha requerido el de-
sarrollo de métodos de evaluación. En la última década han aparecido numerosas
técnicas para la evaluación de gran cantidad de problemas emocionales y conductuales
en niños.
El propósito del presente capítulo es describir la evaluación de los problemas
emocionales y conductuales en niños. El capítulo presenta los campos de evaluación
y los principales tipos de medidas empleados en la actualidad. Las estrategias e ins-
trumentos de evaluación específicos se ilustran con medidas de muestra de la litera-
tura sobre el tema. También se tratarán cuestiones y obstáculos que se presentan al
evaluar a niños junto con recomendaciones para la evaluación con fines clínicos y de
investigación.
existen datos de una norma, se puede examinar su posición en cada escala en relación
con sus compañeros. Así, los resultados de una escala general aportan mucha infor-
mación. | :
Tanto en la práctica clínica como en la investigación es muy útil la evaluación de
áreas múltiples de problemas emocionales y de conducta. La razón es que la investi-
gación ha demostrado que muchos problemas están relacionados (Jessor y Jessor,
1977; Elliot, Huizinga y Menard, 1988). De este modo, los individuos con trastor-
nos clínicos en un área son proclives a mostrar trastornos en otras (Caron y Rutter,
1991). Por ejemplo, los niños que muestran signos de depresión, a menudo presen-
tan ansiedad. Las baterías de evaluación que muestrean distintos campos identifican
un conjunto de áreas que pueden ser problemáticas y requieren atención. En el tra-
bajo clínico, estas baterías ayudan a comprobar que no se pasan por alto parcelas del
funcionamiento, aunque referidas al caso pueden estar basadas en un grupo particu-
lar de síntomas.
Los instrumentos de evaluación que se centran en campos de funcionamiento
específicos tales como la depresión o ansiedad infantiles evalúan áreas de problemas
específicas. Estos instrumentos pueden incluir subescalas de interés. Por ejemplo, el
autoconcepto se ha considerado y evaluado generalmente como una única dimen-
sión general de la autoestima; sin embargo, recientemente se han desarrollado eva-
luaciones adicionales que se centran en múltiples áreas de autoestima, tal como
aparecen reflejadas en las esferas más específicas de las relaciones sociales, el rendi-
miento académico, la apariencia física y las relaciones familiares (Offer, Ostrov y
Howard, 1984; Harter, 1990). Aunque los instrumentos se centren en un único cam-
po (el autoconcepto o la autoestima), otras subáreas son delimitadas. El hecho de
distinguir entre subcampos permite análisis más precisos y la distinción entre jóve-
nes en relación al autoconcepto.
de conducta, tal
1 El término “síntoma” se emplea para hacer referencia a una característica O rasgo
se reflej 2 en el afecto, conducta o cognición. En a
consonanci a con su uso actual en diagnóstico,
como resultado de
“síntoma” no implica un modelo de enfermedad d ene el quee elel síntoma se considere
“ínte
causas subyacentes (por ejemplo, primordialmente intrapsíquicas).
3 Alan E. Kazdin
una de estas áreas representa un ámbito destacado por sí mismo. En situaciones clí-
nicas, así como en investigación de trastornos infantiles, se presta frecuente atención
a las entrevistas, cuestionarios y observaciones directas. Por ello, se incluyen en el
presente capítulo (véanse las lecturas sugeridas que incluyen todas las modalidades
empleadas con niños).
En los últimos años, las entrevistas para evaluar psicopatologías se han empleado
a menudo para identificar de forma sistemática la variedad de síntomas y trastornos
que experimentan los niños. Diversos estudios con pacientes y comunidades han de-
mostrado la utilidad de las entrevistas de diagnóstico (Orvaschel, Ambrosini y Rabi-
novich, 1993). En los procedimientos de diagnóstico, el padre o la madre son entre-
vistados y preguntados sobre los síntomas del niño, el cual es entrevistado aparte
para solicitar información similar. Las discrepancias entre los informes de los padres
y los de los niños se resuelven en reuniones con ambos o buscando una tercera fuen-
te, como puede ser el maestro.
Los cuestionarios, inventarios, escalas de evaluación y otros tests de lápiz y papel
son los instrumentos más utilizados en la evaluación de los trastornos infantiles. Al-
gunos de éstos son accesibles a padres, maestros y niños, tal como se ilustra más ade-
lante. Las ventajas de los cuestionarios son que abarcan una diversidad de campos de
funcionamiento y se administran con relativa facilidad. Estas ventajas también facili-
tan una normalización a gran escala para obtener datos normativos de las medidas y
evaluar propiedades psicométricas. De este modo, los tests de lápiz y papel son los
instrumentos más válidos y estudiados en la evaluación de problemas emocionales y
conductuales de los niños.
La observación directa se aplica ocasionalmente para la evaluación infantil. Exis-
ten distintos tipos de métodos de observación directa. Algunas medidas directas
consisten en presentar tareas al niño y registrar respuestas características. Por ejem-
plo, en los tests de inteligencia estándar (por ejemplo, la escala de inteligencia
Wechsler para niños) se pueden presentar varias tareas y observar la actuación. La
observación directa en evaluación clínica se refiere a menudo a la observación de la
conducta en la vida diaria. Las observaciones se pueden realizar en casa, en el cole-
gio, en la comunidad o en la clínica. Además, la conducta en casa puede evaluarse en-
viando a un observador al domicilio. Los códigos de observación se han desarrolla-
do para calificar las conductas del niño (por ejemplo, rabietas o peleas), así como las
de los padres (por ejemplo, elogios o reprimendas). Igualmente, las observaciones se
realizan en el colegio para evaluar el comportamiento del niño en clase y la interac-
ción social en el juego. En trabajos clínicos con niños individuales se desarrollan ins-
trumentos para que los padres completen la evaluación en casa registrando campos
conductuales de interés (por ejemplo, obediencia o interacción social).
IIL.4. Situación
IV.1.1. Diagnóstico
En los últimos quince años se ha producido una serie de avances enel diagnóstico de
los trastornos en niños y adolescentes encaminados a una mejor delimitación y espe-
cificación de una amplia gama de problemas clínicos que surgen en estas edades. Los
esfuerzos en desarrollar criterios para una gran cantidad de trastornos ha dado lugar
al desarrollo de instrumentos para su diagnóstico. Entre éstos la entrevista se ha con-
vertido en una herramienta central de investigación. $
El diagnóstic o se suele completar con una entrevista en la que se obtiene infor-
mación sistemática de varios grupos de síntomas. Para niños entre 6 y 18 años de
edad se han desarrollado diversos instrumentos de diagnóstico entre los que desta-
can la Schedule of affective disorders and schizophrenia for school-age children [Pro-
tocolo para trastornos afectivos y esquizofrenia para niños en edad escolar], la Diag-
nostic interview for children and adolescents [Entrevista Coen ds niños y
adolescentes] y la Diagnostic interview schedule for children [Protocolo de entrevis-
798 Alan E. Kazdin
ta diagnóstica para niños] (Edelbrock y Costello, 1988; Hodges y Zeman, 1993; Or-
vaschel y cols., 1993). Los instrumentos difieren en el marco temporal que abarcan,
esto es, si evalúan diagnósticos del momento presente, pasado o ambos. Las técnicas
también varían en su estructura o formato. Las entrevistas estructuradas proporcio-
nan preguntas y respuestas alternativas en formatos fijos que permiten poca o nin-
guna variación en la presentación de los ítems al niño. Los formatos semiestructura-
dos aportan una mayor flexibilidad en la administración; las formas alternativas se
dan al entrevistador para que obtenga información. Para la mayoría de las entrevistas
de diagnóstico se hace uso de fuentes de información múltiples. Típicamente, padres
e hijos se entrevistan de forma separada preguntándoseles acerca de la gama comple-
ta de síntomas requeridos para obtener un diagnóstico.
El formato y método del diagnóstico puede ilustrarse con el Schedule for affecti-
ve disorders and schizophrenia for school-age children (K-SADS) [Protocolo para tras-
tornos afectivos y esquizofrenia para niños en edad escolar] (Chambers y cols.,
1985). Este instrumento se configura según el formato de la Schedule for affective di-
sorders and schizophrenia [Protocolo para trastornos afectivos y esquizofrenia] de
Endicott y Spitzer (1978) que se ha aplicado para el diagnóstico de trastornos en
adultos. En el X-SADS se examina un gran número de síntomas para permitir un diag-
nóstico basado en el criterio del DSM-111. Las revisiones de la entrevista han incorpo-
rado cambios en el diagnóstico basándose en el DSM-I11-R (American Psychiatric
Association, 1987) que han alterado algunos de los criterios de diagnóstico (Ambro-
sini y cols., 1989). Existen versiones separadas del K-SADS, así una de las versiones
evalúa trastornos crónicos y agudos (versión epidemiológica), considerando sólo la
presencia o ausencia de cada síntoma; otra versión se centra en trastornos agudos
(versión de los episodios actuales), evaluando la gravedad de cada uno de los sín-
tomas.
La evaluación diagnóstica basada en el K-SADS empieza con una entrevista no es-
tructurada en la que se hacen preguntas generales sobre el funcionamiento del niño
en casa, en el colegio, sus relaciones con los demás, sus dificultades emocionales y
conductuales, y el motivo para el tratamiento clínico. Tras completar la entrevista no
estructurada comienza la sección semiestructurada. Durante ésta se evalúa una am-
plia gama de síntomas específicos. Para cada síntoma, el entrevistador hace pregun-
tas que determinan si el síntoma está presente, y de ser así, en qué grado. Un ejemplo
del tipo de preguntas que pueden plantearse aparece en el cuadro 32.1; las preguntas
reflejan sondeos que el examinado puede realizar para identificar la presencia y gra-
vedad del síntoma. No se hacen todas las preguntas. Más bien las preguntas sirven de
guía para ayudar al entrevistador a obtener la información requerida. La evaluación
continúa con un gran número de cuestiones para identificar la presencia, gravedad y
duración de los síntomas específicos. La prueba se administra separadamente a pa-
dres e hijos, proceso que requiere entre una y dos horas para completarse. Las dis-
crepancias se resuelven para llegar a un consenso sobre la presencia de síntomas es-
pecíficos.
La fiabilidad y validez del diagnóstico es un tema de considerable interés. En ge-
neral, las propiedades psicométricas varían en función de los distintos trastornos y
con las diferentes versiones del K-SADS. En la última revisión, el acuerdo entre los en-
trevistadores indica que los diagnósticos pueden ser consistentes en diferentes tras-
Evaluación de los problemas emocionales y conductuales en niños
799
CUADRO 32.1. EA del Schedule for affective disorders and schizophrenia for school-age
c q (K-SADS) [Protocolo para trastornos afectivos y esquizofrenia en edad
escolar,
AUTOIMAGEN NEGATIVA
sin información
nada
ligeramente, sentimientos esporádicos de insuficiencia
en cierta medida, con frecuencia se siente inadecuado, o le gustaría cambiar su as-
pecto, su mente o su personalidad.
moderadamente, con frecuencia se siente fracasado o le gustaría cambiar a 2
SU
AE
O gravemente, sentimientos frecuentes de inutilidad, o querría cambiar todo a 3. En
Ocasiones dice que se odia.
tornos para información proporcionada por padres e hijos (kappa media = 0,86 y
0,79, respectivamente). La consistencia interna (alfa de Cronbach) para varios tras-
tornos y calificación de síntomas también es alta, alcanzando o superando el valor de
0,90 (Ambrosini y cols., 1989). La base primaria para la validez del K-SADS viene de
estudios de trastornos específicos y sus correlaciones, en particular el estudio de los
trastornos afectivos. Los niños deprimidos, identificados por el K-SADS e instrumen-
tos de diagnóstico similares, muestran diferencias de fiabilidad en una serie de carac-
terísticas (por ejemplo, marcas biológicas, otras medidas de depresión...) (Kazdin,
19904). Además, las observaciones de la gravedad de los síntomas en el K-SADS re-
flejan cambios terapéuticos después del tratamiento de niños con depresión (Puig-
Antich y cols., 1987). : aloe
El K-SADS y otros instrumentos similares de diagnóstico se aplican cada vez
más en la investigación clínica. Sin embargo, hay que hacer varias consideracio-
nes en la selección de los instrumentos de diagnóstico como parte de la batería
de evaluación. En primer lugar, entre los estudios disponibles, bien con el k-
SADS o instrumentos similares, el diagnóstico no proporciona una fiabilidad con-
sistente (test-retest, consistencia interna) entre los trastornos. En muchos estu-
800 Alan E. Kazdin
dios, el acuerdo en la interestimación para varios trastornos está muy por deba-
jo de los niveles aceptables (Orvaschel y cols., 1982; Kashani y cols., 1985;
Ivens y Rehm, 1988). Diagnósticos más específicos (por ejemplo, tipo de tras-
torno de ansiedad) se asocian con fiabilidades más bajas que la categoría más
amplia (por ejemplo, trastornos de ansiedad). En segundo lugar, los padres y
los niños son entrevistados por separado y con frecuencia proporcionan infor-
mación discrepante. PUPTET
Los sistemas de diagnóstico continúan su evolución y las limitaciones tanto de
fiabilidad como de validez pueden deberse en cierta medida a ambigúedades de las
propias categorías del diagnóstico. Por ello, es probablemente más útil discutir la fia-
bilidad y validez de los instrumentos de diagnóstico en relación con los tipos con-
cretos de trastornos en los que los datos apoyan una combinación de síntomas, que
aplicar los instrumentos a todo tipo de trastornos. Existen consideraciones prácticas
para emplear instrumentos de diagnóstico estándar. Las pruebas requieren un tiem-
po considerable para su administración. Al final, el resultado de muchos instrumen-
tos es la mera presencia o ausencia de diagnósticos alternativos. En muchas situacio-
nes, la necesidad de invertir demasiado tiempo para la evaluación del diagnóstico en
relación con los resultados limita su utilización. Otras pruebas administradas de for-
ma más práctica como las escalas de evaluación aportan a menudo información clíni-
camente útil y más fiable.
das están los cuestionarios generales que muestrean una gran variedad de conceptos.
Un gran número de cuestionarios para padres y maestros han sido desarrollados y
normalizados con muestras clínicas. Ejemplos destacados de escalas de evaluación
para padres son el Child behavior checklist [Cuestionario de conducta infantil], el
Revised behavior problem checklist [Cuestionario revisado de problemas de con-
ducta], el Personality inventory for children [Inventario de personalidad para niños]
y la Connors parent rating scale [Escala Connors de evaluación para padres); ejem-
plos de escalas de evaluación para maestros son el Child behavior checklist-teacher
report form [Informe del profesor de la conducta infantil), el School! behavior chec-
klist [Cuestionario de conducta escolar] y la Connors teacher rating scale [Escala
Connors de evaluación para profesores] (Barkley, 1988; Piacentini, 1993; Kazdin y
Buela-Casal, 1994).
Por ejemplo, el Child behavior checklist (CBCL) [Cuestionario de conducta in-
fantil] de Achenbach y Edelbrock (1983) que completan los padres incluye 118
ítems, cada uno puntuado en una escala de O a 2 dependiente del grado en que un sín-
toma (problema de conducta) caracteriza a un niño. Tres de estos ítems son los si-
guientes:
Los ítems forman varias escalas de problemas de conducta que se han derivado
del análisis de factores de primer orden realizados por separado para niños y niñas
y para distintos grupos de edad (4-5, 6-11 y 12-16 años). Las escalas incluyen áreas
tales como aislamiento social, agresión, depresión, hiperactividad y delincuencia,
entre otras. Debido a los análisis de factores independientes, las escalas y los ítems
de una escala dada varían según la edad y el sexo. Escalas amplias de análisis de fac-
tores de segundo orden evalúan áreas más generales que pueden emplearse para to-
dos los grupos de edades y ambos sexos. Estas escalas de banda ancha incluyen la
interiorización, exteriorización y problemas de conducta globales. La escala de in-
teriorización incluye áreas hipercontroladas de trastornos (ansiedad, depresión o
aislamiento); la escala de exteriorización incluye áreas infracontroladas (agresión,
delincuencia o hiperactividad). La puntuación total es la suma de todas las áreas de
síntomas.
Además de las escalas de problemas de conducta, el Cuestionario de conducta in-
fantil incluye tres escalas apriorísticas (en lugar de derivadas de análisis factoriales)
que pertenecen a conductas sociales positivas en niños. Éstas incluyen escalas de ac-
tividades (participación en actividades), sociales (interacción con iguales) y escolares
(progresos académicos), todas ellas evaluadas por los padres. El resultado de la suma
de todas estas escalas proporciona el nivel de competencia social para evaluar el fun-
cionamiento de adaptación positiva. Las habilidades prosociales permiten el examen
del funcionamiento infantil en modos positivos de adaptación y constituyen un ras-
go importante de la escala. Antes de comentar las propiedades psicométricas del
Evaluación de los problemas emocionales y conductuales en niños 803
evaluación de las escalas y recogida de datos de amplia validación. Para evaluar los
problemas conductuales y emocionales de niños se recomienda el uso de uno de los
cuestionarios. Las puntuaciones en muchas variables permiten la comparación del
niño con otros de grupos no clínicos (no enviados a especialistas).
CUADRO 32.2. Muestra de ítems que ilustran un formato para seleccionar a compañeros
Nombre de todos los alumnos de clase
Pregunta O
característica
1. ¿Con quién te
gustaría jugar?
2. ¿Quién se pelea
a menudo?
3. ¿Quién es un
buen amigo?
Marcar con una X la casilla significa que la pregunta se aplica al niño. La puntua-
ción de un niño es el número (o proporción) de veces que es seleccionado en cada ca-
racterística.
Por otro lado, un ejemplo de escala es el Peer nomination inventory for depres-
sion (PNID) [Inventario de selección de compañeros para la depresión] de Lefkowitz
y Tesiny (1980). La escala consta de 20 ítems que abarcan tres escalas: depresión (por
ejemplo «¿Con qué frecuencia parece triste?»), felicidad (por ejemplo, «¿Con qué
Evaluación de los problemas emocionales y conductuales en niños 805
Las conductas específicas del niño en casa, en el colegio o en la clínica pueden obser-
varse directamente. Los elementos clave de las observaciones directas son la defini-
ción de la conducta, la identificación de las situaciones en que la conducta será obser-
vada, el empleo de observadores entrenados para registrar la conducta y la
comprobación de que la conducta se observa con exactitud y fiabilidad. Los requisi-
tos de la observación directa varían en función de la complejidad de los procedi-
mientos de evaluación. El procedimiento puede referirse a una conducta única O
múltiple. Igualmente, los códigos pueden variar desde observaciones de los padres,
maestros u otra persona disponible en situaciones de la vida diaria del niño a obser-
vadores entrenados que se introducen en las situaciones. Finalmente, las evaluacio-
nes pueden variar si son realizadas en el laboratorio, la clínica o entornos más natu-
rales.
Como ilustración de los métodos de observación directa, el Family interaction
coding system (FICS) [Sistema de codificación de la interacción familiar] ha sido em-
pleado para registrar conductas de niños antisociales en su interacción con padres y
hermanos en casa (Patterson y cols., 1975; Reid, 1978). Más concretamente, esta
prueba está diseñada para evaluar las conductas agresivas y los antecedentes y conse-
cuencias (interacción familiar) con que están asociadas. Entre los sistemas de obser-
vación directa, el FICS es relativamente elaborado. Los observadores codifican vein-
tinueve conductas distintas como presentes o ausentes en cada uno de los diferentes
intervalos breves (por ejemplo, 30 segundos) de un período de una hora aproxima-
damente. La conducta se observa durante varios días para obtener estimaciones de la
actuación. Se incluyen conductas infantiles prosociales y desviadas (por ejemplo,
obededer a requerimientos, atacar a alguien o gritar) y conductas de los padres (por
ejemplo, mostrar aprobación, jugar con el niño o humillarle). Cada miembro de la
familia es evaluado durante un breve período (por ejemplo, cinco minutos), con el
fin de valorar la interacción de este miembro de la familia con los otros. Tras este pe-
ríodo, las observaciones cambian a otro miembro de la familia y así se continúa hasta
completar la sesión de observación. La medida primaria que se ha empleado para
evaluar la actuación del niño es la conducta aversiva total, que se refiere al número
total de conductas no deseables por minuto.
El FICS ha de cumplir varios requisitos importantes. En primer lugar, los obser-
vadores han de ser entrenados cuidadosamente y controlados estrechamente para
asegurar que los códigos son calificados con fiabilidad. Por otro lado, las situaciones
en las que los observadores completan su evaluación han de ser parcialmente contro-
ladas para limitar la variabilidad del entorno. Por ejemplo, cuando el FICS se emplea
en casa, se instruye a las familias para que estén en un número reducido de habitacio-
nes durante el período en que se realizan las observaciones y para que no vean la tele-
visión ni realicen llamadas telefónicas, para que todo ayude a los observadores a re-
gistrar las interacciones padres-hijos.
La fiabilidad y la validez del FICS han sido obtenidas primordialmente en rela-
ción con la conducta aversiva total del niño. El acuerdo entre observadores es relati-
vamente elevado (de 0,70 a 0,80). La estabilidad de la actuación de 1 a 3 semanas has-
Evaluación de los problemas emocionales y conductuales en niños 807
ta más de un año también es estable (Patterson, 1982). Los datos de validez proceden
de estudios que comparan niños bajo tratamiento y sin tratamiento y sus familias
(Reid, 1978; Patterson, 1982). Del mismo modo, otros estudios han mostrado que el
tratamiento de problemas conductuales en niños y los cambios en la conducta de los
padres están asociados a reducciones en las puntuaciones totales de conducta aversi-
va (Patterson, 1982; McMahon y Forehand, 1988). El FICS y otros sistemas de obser-
vación similares han sido empleados frecuentemente en investigación (McMahon y
Forehand, 1988; Reid y cols., 1988). Los métodos son algo complejos, requieren ob-
servadores bien entrenados y no son fáciles de usar en trabajos clínicos. Los sistemas
de observación directa no tienen por qué llevar consigo tanta formalización y com-
plejidad como el F/CS. En ocasiones, los códigos de observación son preparados para
casos individuales tratando de observar una o más conductas en casa o en la escuela
(Kazdin, 1989a). Con definiciones relativamente simples y sólo uno o unos pocos
códigos, padres y maestros pueden sustituir a observadores entrenados. La sencillez
de la preparación en tales casos, en relación con sistemas más complejos, acarrea una
reducción proporcional en el ámbito de la información. Los códigos más complejos
evalúan conductas infantiles múltiples y normalmente proporcionan información
acerca de los intercambios padres-hijos; los códigos más simplificados tienden a cen-
trarse en una o dos conductas del niño.
No todos los procedimientos de observación que incluyen conductas infantiles
múltiples requieren que haya observadores entrenados en casa. Una medida única
diseñada para evaluar conductas domésticas es el Parent daily report (PDR) [Informe
diario de los padres] (Patterson, 1982; Chamberlain y Reid, 1987) realizado por los
padres, a quienes se llama por teléfono a diario durante un período de varios días
(por ejemplo, de 6 a 10 días). Cada día se examina una lista de problemas de conduc-
ta con los padres. Se les pregunta si alguna de las conductas ha ocurrido en el período
de 24 horas anterior. De las respuestas se extraen dos puntuaciones: el número total
de conductas y el número total de conductas señaladas. La puntuación total de con-
ductas es la suma de las que se observaron ese día y la puntuación de conductas seña-
ladas es la suma de los casos del subgrupo de conductas que los padres habían identi-
ficado previamente como problemáticas. El Informe diario de los padres presenta las
ventajas de la observación directa, incluyendo la especificación de las conductas y
observaciones restringidas a un período específico. Este procedimiento también
toma las muestras de conducta en situaciones diarias sin las limitaciones artificiales
que los observadores externos pueden imponer. Finalmente, el informe diario de los
padres puede evaluar conductas menos relevantes (peleas, rotura de objetos...) que
aparecen con menor probabilidad en períodos de observación breves, de una o dos
horas. No obstante, la medida se basa en impresiones y no en lo que realmente ocu-
rrió. La correspondencia entre lo que los padres dicen que el niño hizo y lo que éste
realmente hizo puede variar mucho. :
Se ha demostrado que el informe diario de los padres es fiable, como reflejan las
medidas de acuerdo entre evaluadores, consistencia interna, fiabilidad entre test y re-
test (en períodos de dos a cuatro semanas). La observación se correlaciona modera-
damente con las observaciones directas (Sistema de codificación de la interacción fa-
miliar) y refleja el cambio asociado a las intervenciones diseñadas para reducir las
conductas agresivas y antisociales (Patterson, 1982; Chamberlain y Reid, 1987; Kaz-
808 Alan E. Kazdin
din y cols., 1989). Hay algunos datos disponibles sobre ejemplos normativos que fa-
cilitan la interpretación de los resultados (Chamberlain y Reid, 1987). No obstante,
la baja concordancia entre los padres y las bajas correlaciones ocasionales con las ob-
servaciones directas producen ambigúedades en este procedimiento. Igualmente, la
observación no ha sido normalizada y las distintas versiones usadas varían en núme-
ro y contenido de categorías de conducta (Chamberlain y Reid, 1987; McMahon y
Forehand, 1988). Como tal, la observación se refiere más a un procedimiento o es-
trategia que a una escala específica.
Una ventaja de las observaciones directas es que proporcionan muestras de las
frecuencias reales de una conducta. Como tales, a menudo se consideran como las
evaluaciones más directamente relacionadas con el centro de interés. Las observacio-
nes directas tienen sus propios inconvenientes. Muchas conductas, en especial las ac-
ciones difíciles de detectar (robo, consumo de drogas, piromanía, promiscuidad se-
xual...) no aparecen claramente incluidas en sistemas codificados de observación. En
segundo lugar, y relacionado con lo anterior, las conductas con una baja frecuencia
son difíciles de observar porque por definición es improbable que su presencia sea
detectada en el marco temporal observado. En tercer lugar, puede producirse un
efecto de reacción de la observación (Kazdin, 1992), esto es, que cuando las conduc-
tas se observan directamente, el acto de observación influya en la actuación. En cuar-
to lugar, con códigos complejos, los observadores han de ser entrenados para evaluar
la conducta. La fiabilidad, o el acuerdo, de las observaciones debe evaluarse para ase-
gurar que las observaciones se obtienen de modo consistente. En la práctica es difícil
enviar observadores a los hogares o a los colegios. Otras limitaciones prácticas tales
como el coste de los observadores también pueden interferir en el empleo de obser-
vaciones directas. Finalmente, la mayoría de los métodos de observación directa no
está bien validada. Se parte del presupuesto de que evalúan directamente el problema
de interés. Sin embargo, existen pocos estudios que proporcionen datos sobre áreas
tales como la validez predictiva. Las observaciones de conducta pueden ser útiles en
la evaluación del funcionamiento infantil para identificar la gravedad y frecuencia de
los problemas de conducta. En muchos casos, además de la conducta del niño se ob-
serva la de otros, por ejemplo, padres y maestros. Los datos resultantes pueden iden-
tificar factores (refuerzo de los padres, castigo...) que pueden contribuir a la conduc-
ta. Para más información sobre procedimientos de observación véase Kazdin y
Buela-Casal (1994).
ver la competencia social y evitar la conducta antisocial en niños emplean con fre-
cuencia los informes institucionales para evaluar los resultados. Datos tales como
contacto con la policía, casos de libertad condicional, tipo y gravedad de delitos y
coste monetario del tratamiento son medidas que se emplean para evaluar los efectos
de la intervención (Lally, Mangione y Honig, 1988). Además de otras modalidades
de evaluación, los informes y archivos institucionales reflejan a menudo informa-
ción del impacto social que conciernen extensamente a la sociedad.
La información del impacto social tiene una serie de limitaciones que recomien-
dan la cautela interpretativa. Datos tales como las notas, tasas de delitos o muertes
son relativamente insensibles a los efectos de la intervención o las diferencias de gru-
po. Se trata de informaciones amplias y sujetas a una variedad de influencias. El error
en las estimaciones puede ser relativamente elevado. El error aleatorio puede venir
de variaciones en la consistencia de la recogida de los datos, como es el caso de mu-
chos archivos (por ejemplo, asistencia a clase, informes judiciales...). Damos por sen-
tado que la mayoría de las puntuaciones psicológicas tiene métodos normalizados
de administración. Es más probable que las medidas de impacto social sean tomadas
y valoradas más irregularmente en el tiempo, lo que introduce una variabilidad de
error en los resultados. El error sistemático puede introducirse también por cambios
en el modo en como se recogen los datos en el tiempo. Cambios de política, procedi-
miento, responsables de la evaluación, procedimientos de evaluación y reducciones
presupuestarias pueden operar de modo sistemático para influir en los resultados.
Las estimaciones del impacto social son realizadas con frecuencia por personas
que no son investigadores como reflejo del criterio más importante para evaluar el va-
lor y eficacia de un tratamiento o programa de prevención. Así, si la intervención no
ha mostrado impacto social, esto se considera por los no investigadores como evi-
dencia de que la intervención no establece diferencias, no es importante y quizá ha
fracasado. En un caso dado, en muy posible que la interpretación sea exacta; sin em-
bargo, las estimaciones del impacto social han de ser evaluadas e interpretadas cuida-
dosamente. La ausencia de cambio en una variable, dada la propia naturaleza de mu-
chas de ellas, puede que no sea un índice adecuado, razonable o interpretable del
efecto del programa. El riesgo de la estimación del impacto social se debe a sus dos
características más acentuadas: su elevada verosimilitud y sus pobres propiedades
psicométricas (por ejemplo, tipos alternativos de fiabilidad y validez). Aparte de es-
tas limitaciones, los datos del impacto social pueden ser de gran utilidad en la rela-
ción de los resultados de la investigación psicológica y las medidas de interés social.
dres (por ejemplo, abusos físicos o abandono) pueden ser parte del interés al propor-
cionar cuidados al niño. :
El impacto de las influencias específicas de los padres y la familia varía sin duda
en función de los trastornos infantiles y las características familiares. Por ejemplo, en
el contexto de niños agresivos y antisociales, factores familiares que incluyen psico-
patologías en los padres, problemas socioeconómicos, familias de un solo progeni-
tor, ausencia de apoyo social o estrés de los padres influyen en quien participa en el
tratamiento, el grado en que se benefician del tratamiento y el grado en que los cam-
bios terapéuticos se mantienen entre aquellos que permanecen bajo tratamiento
(Dumas y Wahler, 1983; Webster-Stratton, 1985; Kazdin, 1990b; Kazdin y Buela-
Casal, 1994; Kazdin, Mazurick y Bass, en prensa). Como consecuencia, los factores
de los padres y la familia tienen una importancia crítica en la evaluación clínica de los
niños. Las modalidades de evaluación del funcionamiento de padres e hijos incluyen
las entrevistas, preguntas de lápiz y papel y observaciones directas entre otras. El
propósito de ilustrar las evaluaciones de los padres no es introducir nuevas modali-
dades de evaluación sino ilustrar instrumentos empleados a menudo en la investiga-
ción con niños.
Con frecuencia se evalúa el estrés experimentado por los padres. Entre las prue-
bas existentes para tal fin está el Parenting stress index (PSI) [Índice de estrés de los
padres] (Abidin, 1983; Lloyd y Abidin, 1985). Este índice está diseñado para padres
con hijos de 12 años o menores y consiste en una escala de autoinforme que incluye
101 ítems diseñados para evaluar varias fuentes de estrés para los padres. Cada ítem
se puntúa en una escala de cinco opciones (desde fuerte acuerdo a fuerte desacuerdo)
para reflejar el grado de características concretas propias de ellos. Ejemplos de los
ítems de la escala serían los siguientes:
El ?S7 evalúa el estrés en relación con varias fuentes que incluyen al niño, a los
padres y hechos de la vida. El dominio del niño (47 ítems) relaciona a éste como
fuente de estrés e incluye seis subescalas: adaptabilidad, aceptabilidad, exigencia,
humor, distracción-hiperactividad y refuerzo de los padres. Las subescalas reflejan
áreas específicas en las que el niño puede ser percibido como causante de estrés en
los padres. El dominio de los padres (54 ítems) se relaciona con las opiniones de los
padres de su propio funcionamiento e incluye siete subescalas: depresión, depen-
dencia, restricciones de su papel, sentido de competencia, aislamiento social, rela-
ción con la pareja y salud física. Una parte independiente del índice incluye una es-
cala de estrés vital, consistente en 19 ítems que evalúan los factores de estrés (por
ejemplo, cambio de trabajo o muerte de un pariente) en el entorno. Los padres
marcan estos ítems como presentes o ausentes. Una cuantificación de los ítems in-
dependientes se emplea para obtener una puntuación total basada en investigación
previa del impacto de los factores individuales de estrés en el funcionamiento. El
PSI puede evaluarse por subescalas individuales de tres amplias áreas: dominio in-
Evaluación de los problemas emocionales y conductuales en niños 811
fantil y dominio del padre, estrés total (dominio del padre + dominio del niño) y
estrés vital.
Las propiedades psicométricas del PS7 han sido bien estudiadas (Abidin, 1983).
La fiabilidad para las escalas generales (padres, hijo y total) es alta en la consistencia
de test-retest en períodos de varias semanas y en evaluaciones de consistencia inter-
na. Estudios de validación en la normalización original incluían la evaluación de gru-
pos con criterio alternativo cuyo nivel de estrés se esperaba que fuera diferente, estu-
dios de tratamiento en los que se esperaba que el estrés decreciera y correlaciones
con variables relacionadas. Por ejemplo, el PS7 se relaciona con la insatisfacción ma-
trimontal, insatisfacción del papel de padre y tener un hijo desviado en casa, consis-
tente con la actuación esperada en la escala. También existen datos normativos para
la escala con vías tentativas para niveles de estrés con significación clínica.
Otro autoinforme para padres es el Child abuse potential inventory (CAPI) [In-
ventario de potencial de malos tratos infantiles] de Milner (1986) que se emplea para
seleccionar a adultos sospechosos de malos tratos a niños. Se pregunta al progenitor
si él/ella está de acuerdo con cada uno de los 160 ítems que incluye la escala; de ellos,
77 forman la escala para evaluar los malos tratos de acuerdo con seis factores: angus-
tia, severidad, infelicidad, problemas con el niño y con uno mismo, problemas con la
familia y problemas con otros. Los ítems restantes comprenden escalas de validez
(mentiras, respuestas aleatorias, inconsistencia en las respuestas) diseñadas para eva-
luar las distorsiones de las respuestas y consiguientemente facilitar la interpretación
del resultado. Este instrumento se basa en la opinión de que varias facetas de los pa-
dres, de los hijos y su interacción incrementan el riesgo de malos tratos físicos al
niño. Los ítems están diseñados para evaluar los componentes relevantes. Ejemplos
de las escalas de malos tratos incluyen:
fiable y válido otros problemas tales como detenciones (Elliott, Huizinga y Ageton,
1985). Las razones en favor del autoinforme en la delincuencia son un caso destaca-
do ya que sería de esperar la negación de las conductas antisociales.
Quizá una preocupación mayor sea si los niños son capaces de contestar las pre-
guntas formuladas regularmente en las técnicas de autoinforme infantil y evaluación
del diagnóstico. Se realizan con frecuencia preguntas sutiles sobre la presencia, co-
mienzo, duración, frecuencia, intensidad y otras características de conductas y esta-
dos emocionales. Una pregunta de importancia clave es si los niños de distintas eda-
des son capaces de informar sobre estas facetas del funcionamiento. En el intervalo
de edad entre 6 y 18 años, la investigación ha establecido que tanto niños bajo trata-
miento como sin él informan sobre sus síntomas (por ejemplo, depresión, aislamien-
to social y agresividad) y que la información se relaciona significativamente con
otros criterios y medidas de trastornos (LaGreca, 1990).
Muchas veces los niños proporcionan información sobre menos síntomas que
los padres o los psicólogos clínicos (Orvaschel y cols., 1982; Kazdin y cols., 1983). El
hecho de que los niños informen de que sus síntomas son menos graves o frecuentes
que los de los demás sugiere que los niños infravaloran sus síntomas. No obstante, si
los niños infravaloran o exageran sus síntomas depende de otra norma con la que
pueda compararse el informe del niño. Los informes de otros, en particular el de los
padres, se emplean para esta comparación. La perspectiva de los informes de otros
(padres, psicólogos clínicos...) con los que se comparan los informes de los niños tie-
ne sus propios obstáculos de interpretación y no se debe presuponer que sirve como
criterio “verdadero” para evaluar informes de niños.
Como se ha mencionado, el informe de los padres es la fuente de información
más socorrida en la evaluación infantil. Las evaluaciones de los padres se obtienen
normalmente en escalas de evaluación normalizadas que miden varias áreas del fun-
cionamiento infantil (por ejemplo, agresividad, hiperactividad, ansiedad o depre-
sión). La información que los padres proporcionan sobre el comportamiento de sus
hijos depende de las características de los primeros. Distintos estudios han demos-
trado que el estrés y la psicopatología de los padres se correlacionan de forma baja a
moderada (0,20 a 0,50) con las estimaciones de los padres de los problemas emocio-
nales y conductuales infantiles (Moretti y cols., 1985; Brody y Forehand, 1986; Jen-
sen y cols., 1988; Webster-Stratton y Hammond, 1988; Phares, Compas y Howell,
1989). Las puntuaciones de síntomas más altas hechas por los padres se asocian con
estimaciones más altas de desviación infantil. Las madres, que son empleadas más a
menudo como evaluadoras, han sido más estudiadas que los padres. No obstante, la
relación del conjunto de síntomas de los padres y las estimaciones de trastornos clí-
nicos se ha demostrado que influye también en las evaluaciones del padre sobre los
síntomas del niño (Ivens y Rehm, 1988; Phares y cols., 1989).
También se ha investigado si hijos y padres varían de forma sistemática en sus in-
formes de los problemas conductuales y emocionales infantiles. Los estudios sugie-
ren que los niños tienden a ser mejores informadores de los síntomas relacionados
con experiencias privadas (por ejemplo, desesperación, baja autoestima, depresión,
ansiedad...), mientras que otros, como padres y profesores, son mejores informado-
res en relación a conductas manifiestas del niño (por ejemplo, patrones de sueño y
alimenticios, agresión, hiperactividad...) (para una revisión de estos aspectos véase
814 Alan E. Kazdin
El grado en que las distintas medidas de los trastornos infantiles se correlacionan en-
tre sí se ha estudiado a menudo. Por ejemplo, en la investigación de la depresión in-
fantil, varios estudios han mostrado que medidas alternativas de la depresión realiza-
das por el mismo informador (por ejemplo, medidas de la depresión infantil
realizadas por los padres) se correlacionan de forma moderada a alta (Kazdin y cols.,
1983; Reynolds, Anderson y Bartell, 1985; Rotundo y Hensley, 1985). Igualmente,
medidas de la depresión o aspectos relacionados se correlacionan de modo consis-
tente cuando el mismo informador realiza las medidas. De este modo, las medidas de
la autoestima, desesperación y atributos cognitivos negativos se relacionan con me-
didas de la depresión.
Como método inicial de validación, la convergencia de medidas relacionadas es
un paso importante. Sin embargo, por sí misma la validez convergente no propor-
ciona una base de validación sólida. La característica más destacada aquí es que la va-
lidez convergente se apoya sólidamente cuando el mismo informador completa me-
didas de áreas relacionadas. No obstante, se produce escasa o nula convergencia
cuando distintos informadores completan medidas que se considera que reflejan la
misma área, tema que se considerará a continuación.
VII. CONCLUSIONES
REFERENCIAS BIBLIOGRÁFICAS
vised edition of the K-SADS. Journal of the American Academy of Child and Adolescent
Psychiatry, 28, 723-728.
American Psychiatric Association (1987, 1994). Diagnostic and statistical mannal of mental
disorders-Revised. Washington, DC. APA.
Barkley, R. A. (1988). Child behavior rating scales. En M. Rutter, A. H. Tuma e 1 S. Lann
(dirs.), Assessment and diagnosis in child psychopathology. Nueva York. Guilford Press.
Beck, A. T., Ward, C. H., Mendelson, M., Mock, J. y Erbaugh, J. (1961). An inventory for
measuring depression. Archives of General Psychiatry, 4, 53-63.
Bradley, R. H. y Caldwell, B. (1979). Home observation for measurement of the environment:
A revision of the preschool scale. American Journal of Mental Deficiency, 84, 235-244.
Brody, G. H. y Forehand,R. (1986). Maternal perceptions of child maladjustment as a func-
tion of the combined influence of child behavior and maternal depression. Jomrnal of
Consulting and Clinical Psychology, 54, 237-240.
Caldwell, B. y Bradley, R. H. (1984). Home observation for measurement of the environ-
ment. Homewood. Dorsey Press.
Caron, C. y Rutter, M. (1991). Comorbidity in child psychopathology: Concepts, issues, and
research strategies. Journal of Child Psychology and Psychiatry, 32, 1063-1080.
Chamberlain, P. y Reid, J. B. (1987). Parent observation and report of child symptoms. Be-
havioral Assessment, 9, 97-109.
Chambers, W. J., Puig-Antich, J., Hirsch, M., Páez, P., Ambrosini, P. J., Tabrizi, M. A. y Da-
vies, M. (1985). The assessment of affective disorders in children and adolescents by se-
mistructured interview: Test-retest reliability. Archives of General Psychiatry, 42, 696-
702.
Clarke, G., Hops, H., Lewinsohn, P. M., Andrews,J.,Seeley,J.R. y Williams,J. (1992). Cog-
nitive-behavioral group treatment of adolescent depression: Prediction of outcome. Be-
havior Therapy, 23, 341-354.
Coie,J.D. y Dodge, K. A. (1983). Continuities and changes in children's social status: A five-
year longitudinal study. Merrill-Palmer Quarterly, 29, 261-282.
Dodge, K. A. (1983). Behavioral antecedents of peer social status. Child Development, 54,
1386-1399.
Dumas, J. E. y Wahler, R. G. (1983). Predictors of treatment outcome in parent training: Mo-
ther insularity and socioeconomic disadvantage. Behavioral Assessment, 5, 301-313.
Edelbrock, C. y Costello, A. J. (1988). Structured psychiatric interviews for children. En
M. Rutter, A. H. Tuma e 1. S. Lann (dirs.), Assessment and diagnosis in child psychopatho-
logy. Nueva York. Guilford Press.
Edelbrock, C. S., Costello, A. J., Dulcan, M. K., Conover, N. C. y Kalas, R. (1986). Parent-
child agreement on child psychiatric symptoms assessed via structured interview. Journal
of Child Psychology and Psychiatry, 27, 181-190.
Elliott, D. S., Huizinga, D. y Ageton, S. S. (1985). Explaining delinquency and drug use. Be-
verly Hills (Ca). Sage.
Elliott, D. S., Huizinga, D. y Menard, S. (1988). Multiple problem youth: Delinquency, subs-
tance, abuse, and mental health problems. Nueva York. Springer-Verlag.
Endicott,J.y Spitzer, R. L. (1978). A diagnostic interview: The Schedule for Affective Disor-
ders and Schizophrenia. Archives of General Psychiatry, 35, 837-844.
Finch, A. J., Saylor, C. F. y Edwards, G. L. (1985). Children's Depression Inventory: Sex
and grade norms for normal children. Journal of Consulting and Clinical Psychology, 53,
424-425,
Forehand, R., Lautenschlager, G. J., Faust, J. y Graziano, W. G. (1986). Parent perceptions
and parent-child interactions in clinic-referred children: A preliminary investigation of
the effects of maternal depressive moods. Behaviour Research and Therapy, 24, 73-75.
Graham, J. R. (1990). MMPL-2: Assessing personality and psychopathology. Nueva York. Ox-
ford University Press.
822 Alan E. Kazdin
Kolko, D. ]., Kazdin, A. E., Thomas, A. M. y Day, B. (en prensa). Heightened child physical
abuse potential: Child, parent, and family dysfunction. Journal of Interpersonal Violence.
Kovacs, M. (1981). Rating scales to assess depression in school aged children. Acta Paedopsy-
chiatrica, 46, 305-315.
LaGreca, A. M. (dir.) (1990). Through the eyes of the child: Obtaining self-reports from chil-
dren and adolescents. Needham Heights. Allyn and Bacon.
Lally, R., Mangione, P. L. y Honig, A. S. (1988). The Syracuse University Family Develop-
ment Research Program: Long-range impact on an early intervention with low-income
children and their families. En D. Powell (dir.), Parent education as early childhood inter-
vention: Emerging directions in theory, research, and practice. Norwood. Ablex.
Landau, S. y Milich, R. (1990). Assessment of children's social status and peer relations. En
A. M. LaGreca (dir.), Through the eyes of the child: Obtaining self-reports from children
and adolescents. Boston. Allyn and Bacon.
Lapouse, R. y Monk, M. A. (1958). An epidemiologic study of behavior characteristics in
children. American Journal of Public Health, 48, 1134-1144.
Ledingham, J. E., Younger, A., Schwartzman, A. y Bergeron, G. (1982). Agreement among
teacher, peer, and self-ratings of children's aggression, withdrawal, and likability. Journal
ofAbnormal Child Psychology, 10, 363-372.
Lefkowitz, M. M. y Tesiny, E. P. (1980). Assessment of childhood depression. Journal of
Consulting and Clinical Psychology, 48, 43-50. €
Lefkowitz, M. M. y Tesiny, E. P. (1985). Depression in children: Prevalence and correlates.
Journal of Consulting and Clinical Psychology, 53, 647-656. y cun
Lefkowitz, M. M., Tesiny, E. P. y Gordon, N. H. (1980). Childhood depression, family inco-
me, and locus of control. Journal of Nervous and Mental Disease, 168, 732-735.
Lloyd, B. H. y Abidin, R. R. (1985). Revision of the Parenting Stress Index. Journal of Pedia-
tric Psychology, 10, 169-177. ¡27
Loeber, R., Green, S. M., Lahey, B. B. y Stouthamer-Loeber, M. (1990). Optimal informants
on childhood disruptive behaviors. Development and Psychopathology, 1,317-337.
MacFarlane, J. W., Allen, L. yHonzik, M. P. (1954). A developmental study of the behavior
problems of normal peras between 21 months and 14 years. Berkeley. University of
California Press.
Mahler, M. (1961). On sadness and grief in infancy and childhood. Psychoanalytic Study of
the Child, 16, 332.
Martin, R. P. (1988). Assessment of personality and behavioral problems: Infancy through
adolescence. Nueva York. Guilford Press. | ,
Mash, E. y Terdal, L. (dirs.) (1988). Behavioral assessment of childhood disorders (2* ed.).
va York. Guilford Press.
a R. J. y Forehand, R. (1988). Conduct disorders. En E. J. Mash y Lo LEC
(dirs.), Behavioral assessment of childhood disorders (2* ed.). Nueva York. Gui or A ress.
Milner, J. S. (1986). The Child Abuse Potential Inventory: Manual (2 ed.). Webster. Psytec
10n. P
pe eeTirn Additional cross-validation of the Child Abuse Potential Inventory.
¡cal Assessment, 1, 219-223.
ón egos: and pa of the Child Abuse Potential Inventory.
ld Development and Care, 42, 85-97. |
ra Fine, edHaley, G. y Marriage, K. (1985). Child and ar
Child-report versus parent-report information. Journal of the American Academy
vag ln de td
'
Child Psychiatry, 24, 298-302.
Offer, D., Ostrov, E. y Howard, K. I. (1984). Patterns of adolescent self-image. San Francis-
co (Ca). Jossey-Bass.
Ollendick, T. H. y Hersen, M. (dirs.) (1993). Handbook of child and adolescent assessment.
Needham Heights. Allyn and Bacon. Sin eg€ 2
Orvaschel, H., Ambrosini, P. y Rabinovich, H. (1993). Diagnostic issues in child assessment.
En T. H. Ollendick y M. Hersen (dirs.), Handbook of child and adolescent assessment.
Needham Heights. Allyn and Bacon.
Orvaschel, H., Puig-Antich, J., Chambers, W., Tabrizi, M. A. y Johnson, R. (1982). Retros-
pective assessment of prepubertal major depression with the Kiddie-SADS-E. Journal of
the American Academy of Child Psychiatry, 21, 392-397.
Parker, J. G. y Asher, S. T. (1987). Peer relations and later personal adjustment: Are low-
accepted children at risk? Psychological Review, 102, 357-389.
Patterson, G. R. (1982). Coercive family process. Eugene. Castalia.
Patterson, G. R., Reid,J.B., Jones, R. R. y Conger, R. E. (1975). A social learning approach to
family interaction (vol. 1). Eugene. Castalia. ?
Phares, V., Compas, B. E. y Howell, D. C. (1989). Perspectives on child behavior problems:
Comparisons of children's self-reports with parent and teacher reports. Psychological As-
sessment, 1,68-71.
Piacentini, J. (1993). Checklists and rating scales. En T. H. Ollendick y M. Hersen (dirs.),
Handbook of child and adolescent assessment. Needham Heights. Allyn and Bacon.
Puig-Antich, J., Perel,J.,Lupatkin, W., Chambers, W. J., Tabrizi, M. A., King, J., Davies, M.,
Johnson, R. y Stiller, R. (1987). Imipramine in prepubertal majora depressive disorders.
Archives of General Psychiatry, 44, 81-89.
Putallaz, M. (1983). Predicting children's sociometric status from their behavior. Child De-
velopment, 54, 1417-1426.
Reid, J. R. (1978). A social learning approach to family intervention: Observation in home set-
tings (Vol. 2). Eugene. Castalia.
Reid, J. R., Baldwin, D. V., Patterson, G. R. y Dishion, T. J. (1988). Observations in the as-
sessment of childhood disorders. En M. Rutter, A. H. Tuma e 1. S. Lann (dirs.), Assess-
ment and diagnosis in child psychopathology. Nueva York. Guilford Press.
Reynolds, W. M., Anderson, G. y Bartell, M. (1985). Measuring depression in children: A mul-
ti-method assessment investigation. Journal of Abnormal Child Psychology, 13, 513-526.
Rie, H. E. (1966). Depression in childhood: A survey of some pertinent contributions. Jomr-
nal of the American Academy of Child Psychiatry, 5, 653-685.
Roff, M., Sells, B. y Golden, M. M. (1972). Social adjustment and personality development in
children. Minneapolis. University of Minnesota Press.
Rotundo, N. y Hensley, V. R. (1985). The Children's Depression Scale: A study of its vali-
dity. Journal of Child Psychology and Psychiatry, 26, 917-927.
Saylor, C. F., Finch, A. J., Baskin, C. H., Furey, W. y Kelly, M. M. (19844). Construct vali-
dity for measures of childhood depression: Application of multitrait-multimethod me-
thology. Journal of Consulting and Clinical Psychology, 52, 977-985.
Saylor, C. F., Finch, A. J., Spirito, A. y Bennett, B. (1984b). The Children's Depression In-
ventory: Á systematic evaluation of psychometric properties. Journal of Consulting and
Clinical Psychology, 52, 955-967.
Smucker, M. R., Craighead, W. E., Craighead, L. W. y Green, B. J. (1986). Normative and re-
hability data for the Children's Depression Inventory. Journal of Abnormal Child Psy-
chology, 14, 25-39.
Webster-Stratton, C. (1985). Predictors of treatment outcome in parent training for conduct
disordered children. Behavior Therapy, 16, 223-243.
Webster-Stratton, C. y Hammond, M. (1988). Maternal depression and its relationship to life
stress, perceptions of child behavior problems, parenting behaviors, and child conduct
problems. Journal ofAbnormal Child Psychology, 16, 299-315.
Evaluación de los problemas emocionales y conductuales en niños 825
Weisz, ]. R., Weiss, B., Wasserman, A. A. y Rintoul, B. (1987). Control-related beliefs and
depression among clinic-referred children and adolescents. Journal of Abnormal Psycho-
logy, 96, 58-63.
Williams, C. L., Butcher, J. N., Ben-Porath, Y. S. y Graham,].R. (1992). MMPLA content sca-
e Assessing psychopathology in adolescents. Minneapolis. University of Minnesota
ress.
World Health Organization (1988). International classification of diseases, injuries, and can-
ses of death (10* ed.). Ginebra. World Health Organization.
LECTURAS COMPLEMENTARIAS
4
' “
QUINTA PARTE
EVALUACIÓN DE LA PERSONALIDAD
33. EVALUACIÓN DE LOS RASGOS PSICOLÓGICOS
CARMEN GARCÍA-MONTALVO
Il. INTRODUCCIÓN
Es ésta una cuestión que puede abordarse desde distintos puntos de vista, uno de los
cuales sería analizar, aunque de forma breve, cuál ha sido la evolución del concepto
de rasgo alo largo de la historia de la psicología de la personalidad, desde sus prime-
ras conceptualizaciones hasta las nuevas reformulaciones actuales, que han venido a
aparecer como consecuencia del declive del concepto de rasgo, sucedida a partir de la
obra de Mischel de 1968.
Universidad de Murcia.
830 Carmen García-Montalvo
Por otro lado, los trabajos de Raymond B. Cattell tienen en común con los de
Eysenck el estar enmarcados dentro de la teoría de los rasgos y el utilizar el análisis
factorial como herramienta de trabajo a la hora de aislar los rasgos que explican el
comportamiento humano. Sin embargo, a partir de aquí Cattell, basándose inicial-
mente en dos de los tres tipos de datos que describió (L= basados en calificaciones,
Q= basados en cuestionarios y T= basados en pruebas objetivas) encontró una es-
tructura de la personalidad compuesta por 16 factores primarios (más tarde los des-
cribiremos brevemente al tratar el cuestionario 16PF) representativos de otros tantos
rasgos temperamentales. Á su vez, obtuvo en una segunda factorización ocho facto-
res de segundo orden formados por agrupaciones de los 16 primarios. Además, ob-
tuvo factores de humor o temple (Fransella, 1981), entendidos como estados en el
sentido de conductas afectadas por variables a corto plazo para los que elaboró una
prueba especial (el Erght state questionnaire (ESQ) [Cuestionario de ocho estados]) y
como rasgos motivacionales con el fin de investigar la dinámica de la personalidad,
distinguiendo dos tipos de factores: ergios (impulsos biológicos) y sentimientos (im-
pulsos modelados por la cultura). Algunos de los ergios y sentimientos descritos por
Cattell pueden evaluarse mediante el Motivational analysis test (MAT) [Test de análi-
sis motivacional].
Pero, volviendo a los factores temperamentales, podemos comprobar fácilmente
las diferencias entre la estructura hallada y propuesta por Eysenck y la que nos plan-
tea Cattell. Y es precisamente en la concepción de factores primarios y secundarios
en donde se inician las divergencias entre ambos autores. De este modo, Eysenck
trabaja con una estructura jerárquica en la que sólo interesan los superfactores, de
ahí que proponga sólo tres dimensiones: extraversión, neuroticismo y psicoticismo
de índole claramente superficial que, según él, se bastan para comprender la perso-
nalidad de un sujeto. Cattell, por el contrario, no sólo no desestima los factores pri-
marios sino que los considera igualmente estables y útiles para describir la personali-
dad. Esta controversia ha dado lugar a numerosa bibliografía (Eysenck y Eysenck,
1969; Cattell y Kline, 1977; Krug, 1978) que puso de relieve algunas cuestiones de
interés descritas por Fransella (1981):
Esta última es una apreciación que no sólo afecta a la polémica entre los autores
que nos ocupan, sino que además parece estar en la base de la mayoría de las diver-
gencias existentes a la hora de determinar el número y la variedad de rasgos que con-
832 Carmen García-Montalvo
112. El situacionismo
113. El interaccionismo
tarea nuestra “hacer” psicología de la personalidad en este capítulo. Es por ello que
únicamente nos referiremos a la teoría que resulta más representativa de este marco
conceptual, sin olvidarnos de que la perspectiva integradora que representa el inte-
raccionismo ya había sido intentada mucho antes por autores como Lewin (1935) y
Murray (1938).
El interaccionismo de Endler y Magnusson (1976) descansa sobre las siguientes
premisas:
das como acciones más frecuentes y concebidas como categorías cognitivas de accio-
nes, que sirven para resumir las tendencias generales del comportamiento. Por su
parte, Cantor y Mischel (1977) definen un modelo en el que las categorías represen-
tan tipos de persona y los atributos que se asocian a esas categorías incluyen tanto
rasgos como conductas, y Hampson (1982) —interesada inicialmente en las teorías
implícitas de la personalidad— desarrolla un enfoque que se centra en la representa-
ción de rasgos, a los que considera como categorías cognitivas que hacen referencia a
unidades de acción específicas de las situaciones, es decir, a conductas. Finalmente,
Goldberg (1981) plantea que es el lenguaje la vía a través de la cual podremos descu-
brir las diferencias individuales. Para él, aquellas diferencias individuales que sean
más importantes en las interacciones que diariamente se producen entre las personas
estarán muy probablemente codificadas en su lenguaje. De este modo, cuanto más
significativa sea una característica que diferencia a las personas, mayor número de
lenguajes poseerá un término que la identifique. En sus trabajos concluye que todas
las dimensiones de personalidad se pueden agrupar en cinco: surgencia, simpatía, es-
crupulosidad, estabilidad emocional y cultura. Hay otros muchos autores que com-
parten este planteamiento (Fiske, 1949; Tupes y Cristal, 1961; Norman, 1963) y, en la
actualidad, la búsqueda y comprobación de los llamados “cinco grandes” (big five)
supone una de las fuentes de trabajo de investigación más prolíferas e importantes en
psicología de la personalidad. En este punto, nos gustaría plantear al lector un inte-
rrogante (en el supuesto de que no lo haya hecho ya): ¿tienen los planteamientos an-
teriores alguna implicación en el ámbito de la evaluación de rasgos de personalidad?
Actualmente se piensa que los procesos de categorización pueden ser una vía intere-
sante en este campo y, de hecho, existen algunos métodos de trabajo de gran utilidad
en este contexto. Analizaremos brevemente algunos de ellos, junto a las técnicas más
clásicas, en el apartado siguiente de este capítulo.
m1. Introducción
Una vez efectuada la descripción del rasgo a través de su evolución dentro del ámbi-
to de la psicología de la personalidad, ha llegado el momento de plantearnos a través
de qué instrumentos poder evaluarlo. De hecho, en la evaluación de los rasgos de
personalidad se han empleado diversos métodos más o menos alternativos o com-
plementarios (Sandín y Chorot, 1986), tales como autoinformes, escalas de datos
biográficos, observación de la conducta en situaciones representativas y técnicas
subjetivas como las Q-sort y el diferencial semántico. Sin embargo, a poco que repa-
semos con detalle la investigación sobre el tema y/o la práctica habitual de los eva-
luadores, percibiremos fácilmente que son los autoinformes (inventarios, cuestiona-
rios, escalas...) los instrumentos más ampliamente utilizados para el objeto que nos
ocupa. Y ello tanto desde un punto de vista histórico como desde una perspectiva
ceñida al presente (Keller, Butcher y Slutske, 1990). De este modo, Barton (1986) se-
ñala que en un repaso de cualquier edición del Mental measurement yearbook de
Evaluación de los rasgos psicológicos
835
nz. Autoinformes
La mayor parte de los autoinformes para la evaluación de rasgos se ha construido
mediante tres tipos de estrategias, que han dado lugar a una categorización ya clási-
ca: racionales, empíricas y factoriales. En el capítulo dedicado a la clasificación de las
técnicas de evaluación en general, se ha explicado el fundamento de cada una de estas
estrategias, por lo que es nuestra intención ocuparnos ahora de forma más detallada
de algunas técnicas específicas. No obstante, se utilizarán las tres categorías para di-
ferenciar unas técnicas de otras.
rentes para usos prácticos que llevan consigo la selección o clasificación de indivi-
duos en grupos predefinidos (Burish, 1984). El Minnesota multiphasic personality
inventory (MMPI) [Inventario de personalidad multifásico de Minnesota] de Hat-
haway y McKinley (1940) y su equivalente en personalidad “normal”, el Califor-
nia psychological inventory (CP1) [Inventario psicológico de California] de Gough
(1975) pueden considerarse las pruebas más representativas de las que se han cons-
truido, al menos en gran medida, con métodos empíricos. Por razones relacionadas
con las limitaciones de este capítulo, sólo vamos a describir el primero de ellos con
cierto detalle.
a. Escala «No lo sé» (?): cuantifica el número total de ítems que no se respon-
dieron o que se respondieron en ambas direcciones. yroq
b. Escala de sinceridad (L): detecta la falta de voluntad de un individuo para re-
conocer incluso las faltas más comunes y de menor importancia.
c. Escala de validez (F): evalúa la desviación de las respuestas en comparación
con la muestra normativa.
d. Factor corrector (escala K): identifica la “defensividad” ante la prueba.
manera que únicamente se hará una breve referencia a los cambios más significati-
vos. Al principio se pensaba que las elevaciones escalares simples reflejarían directa-
mente la psicopatología evaluada por las escalas individuales de la prueba. No obs-
tante, pronto se encontró que el MMPI no funcionaba demasiado bien como medio
de clasificación de pacientes en grupos diagnósticos estrictos. De hecho, los pacien-
tes con puntuaciones altas en una escala tendían, asimismo, a tener elevaciones en
otras; también ocurría que algunos pacientes psiquiátricos no tenían elevaciones sig-
nificativas en las escalas “previsibles” o apropiadas e, incluso, que algunos indivi-
duos “normales” sí mostraban puntuaciones altas en una o más escalas. Todo ello
trajo como consecuencia una serie de alternativas de interpretación, que se propo-
nen a partir de un primer cambio de tipo formal: las diez escalas clínicas se suelen de-
nominar actualmente con números en lugar de con sus nombres originales (véase
cuadro 33.1).
1 Hs Hipocondriasis
2 D Depresión
S Hy Histeria
4 Pd Psicopatía
[SS Mf Masculinidad-feminidad
6 Pa Paranoia
Y Pt Psicastenia
8 Sc Esquizofrenia
9 Ma Hipomanía
0 Si Introversión social
El <MMPI-2»
Cyn (Cinismo) Ideas misantrópicas y negativas sobre los motivos de los de-
más, desconfianza generalizada.
Lse (Baja autoestima) Sentimientos abrumadores de caer mal, poco importante, poco
atractivo, inútil.
Fam (Problemas familiares) Discordia familiar, posibles malos tratos durante la infancia, fal-
ta de amor y afecto en la familia.
Wrk (Interferencia laboral) Conductas o actitudes que pueden interferir con el rendimiento
laboral, como baja autoestima, tensión, actitudes negativas ha-
cia la profesión o los compañeros de trabajo.
Trt (Indicadores negat. trat.) Actitudes negativas hacia los médicos y hacia el tratamiento de
salud mental. Preferencia por abandonar antes de intentar un
cambio. Incapacidad para discutir cualquier tema personal.
AA
Fuente: Tomado de Keller y cols. (1990).
842 Carmen García-Montalvo
(véase Strassberg, 1991). En cualquier caso, lo que sí parece claro, como manifiestan
Ben-Porath y Graham (1991), es que un test no se puede modificar sin cambiarlo.
Efectivamente, no está demostrado que el MMP7 original sea un instrumento psico-
métricamente perfecto, por lo que la aportación del MMP1-2 puede resultar de gran
utilidad en el camino hacia una “supuesta perfección”.
Por lo que se refiere a las propiedades de la prueba, tanto las internas (caracterís-
ticas de definición como origen y formato de los ítems, método de construcción, es-
tructura analítica factorial y significado psicológico de las escalas) como las externas
(uso aplicado o potencial del test, validez concreta y relaciones con otros tests) resul-
tan ser bastante satisfactorias (Bouchard, 1972). Concretamente, Barton (1986) nos
describe los siguientes aspectos positivos de la prueba:
Con respecto a este último punto, nos gustaría añadir que se ha comprobado que
el 16PF, pese a ser concebido como un instrumento de evaluación de la personalidad
normal, se muestra muy útil en la descripción de determinados patrones de “anor-
malidad”, como el comportamiento neurótico (García-Montalvo, Nieto y Morales,
1989).
Finalmente, no podemos terminar este epígrafe sin una mínima referencia al Ch-
nical analysis questionnaire (CAQ) [Cuestionario de análisis clínico] desarrollado
para su aplicación a la esfera anormal de la personalidad. Cubre los dieciséis factores
normales y los secundarios del 16PF más doce factores patológicos hallados en el
MMPI, en escalas de depresión y en otros cuestionarios clínicos concretos. En el cua-
dro 33.6 aparecen estos últimos descritos en su polo alto.
Respecto a las relaciones entre MMPI y CAQ, los dos instrumentos que más se
utilizan actualmente para el diagnóstico clínico, podemos decir que la diferencia
fundamental entre ellos es que el primero se construyó para separar tipos y el segun-
Evaluación de los rasgos psicológicos
845
do para evaluar rasgos fuente, algunos de los cuales son iguales tanto en sujetos nor-
males como en muestras clínicas (Barton, 1986).
De este modo, el MCM1-11 (Millon, 1987) incluye dos nuevas escalas de trastorno
de la personalidad, nuevas correcciones de validez y un nuevo sistema de pesos de
los ítems.
Otra alternativa que parece tener futuro, pese a que aún se encuentra en una fase
experimental, es el Central trait-scale kit (CTS) [Conjunto de escalas de rasgo cen-
tral]. Una de las ventajas fundamentales de este instrumento es que permite aislar es-
calas concretas, en el caso de que estemos interesados en evaluar sólo un aspecto de
los que en él se contemplan. Esta prueba contiene cinco escalas de rasgos idénticas a
los cinco factores de segundo orden más estables del 16PF y cinco escalas de estado,
diseñadas para reflejar los cambios en los mismos factores que pueden estar provo-
cados por diferentes situaciones medioambientales u orgánicas. Cada subtest consta
de 25 ítems, tardándose unos cinco minutos en administrarlo.
Por otro lado, no podemos olvidarnos en este apartado de los llamados “tests
automatizados”, que según Keller y cols. (1990) desempeñarán un gran papel en el
futuro de la tecnología de la evaluación de la personalidad. En efecto, se ha empeza-
do a utilizar la flexibilidad y las capacidades de adaptación únicas de los ordenadores
para modificar viejas estrategias de evaluación y crear otras nuevas. La puntuación
automatizada de hojas de respuesta de tests fue una de las primeras aplicaciones clí-
nicas de la tecnología informática; después vino la interpretación computadorizada
de tests psicológicos estándar. Posteriormente, se extiende a la administración de
pruebas. No puede decirse que éste sea un tema que esté libre de polémicas y contro-
versias, tales como la influencia o no de lo impersonal de la interacción con una má-
quina (Erdman y cols., 1981) o la idea de que las versiones administradas por orde-
nador no pueden considerarse formas paralelas de las de «papel y lápiz» (Moreland,
1987). No obstante, parece igualmente evidente que no es una línea de trabajo que
vaya a ser abandonada; muy al contrario, los datos existentes demuestran que la in-
vestigación y los trabajos sobre el tema proliferarán considerablemente en el futuro,
y no sólo por lo que se refiere a la administración estandarizada, recogida de datos o
aplicación de normas de decisión objetivas, sino también en otras aplicaciones como
la creación de sistemas de análisis dinámicos y adaptativos que mejoren la capacidad
humana de toma de decisiones (Keller y cols., 1990).
Se afirmaba en la exposición sobre la conceptualización del rasgo que existía en
la actualidad una serie de planteamientos remodelados respecto a este constructo; de
estos nuevos planteamientos también han surgido formas de evaluación. A modo de
ejemplo, se pueden citar las técnicas de simulación de rasgos. Dentro de las teorías
implícitas de la personalidad existen tres medidas de simulación de rasgos para seña-
lar las expectativas de los sujetos respecto a hasta qué punto ciertos atributos se en-
cuentran en la personalidad de alguien (García Mérita, 1989):
REFERENCIAS BIBLIOGRÁFICAS
Bouchard, J. T. (1972). Review of the 16PF. En O. K. Buros (dir.), Seventh mental measure-
ment yearbook. Highland Park. Gryphon. 8
Bowers, K. S. (1973). Situacionism in psychology: An analysis and a critique. Psychological
Review, 80, 307-336. :
Burish, M. (1984). Approaches to personality inventory construction: A comparison of me-
rits. American Psychologist, 39, 214-227. de ;
Buss, D. M. y Craik, K. H. (1985). Why not measure that trait? Alternative criteria for iden-
tifying dispositions. Journal of Personality and Social Psychology, 48, 4, 934-946.
Butcher, J. N. y Keller, L. S. (1984). Objetive personality assessment. En G. Goldstein y
M. Hersen (dirs.), Handbook ofpsychological assessment. Nueva York. Pergamon Press.
Butcher, J. N. y Owen, P. L. (1978). Objetive personality inventories: Recent research and
some contemporary issues. En B. Wolman (dir.), Handbook of clinical diagnosis of men-
tal disorders. Nueva York. Plenum Press.
Cantor, N. y Mischel, W. (1977). Traits and prototypes: Effects on recognition memory.
Journal of Personality and Social Psychology, 35, 38-48.
Cattell, R. B. (1972). El análisis científico de la personalidad. Barcelona. Fontanella.
Cattell, R. B., Eber, H. N. y Tatsuoka, M. (1970). Handbook for the sixteen personality factor
questionnatre. Champaign. IPAT.
Cattell, R. B. y Kline, P. (1977). The scientific analysis of personality and motivation. Lon-
dres. Academic Press.
Cronbach, L. J. (1975). Beyond the two disciplines of scientific psychology. American Psy-
chologist, 30, 116-117. y
Drake, L. E. (1946). A social I.E. scale for the MMP1. Journal of Applied Psychology, 30, 51-54.
Endler, N. S. y Magnusson, D. (1976). Toward an interactional psychology of personality.
Psychological Bulletin, 5, 956-974.
Erdman, H. P., Greist, J. H., Klein, M. H., Jefferson, J. W. y Getto, C. (1981). The computer
psychiatrist: How far have we come? Where are we heading? How far dare we go? Beha-
vior Research Methods and Instrumentation, 13, 393-398.
Eysenck, H. J. y Eysenck, S. B. G. (1969). Personality structure and measurement. Londres.
Routledge and Kegan Paul.
Eysenck, M. W. y Eysenck, H. J. (1980). Mischel and the concept of personality. British Jonr-
nal of Psychology, 71, 191-204.
a R. (1981). Psicodiagnóstico. Concepto y metodología. Madrid. Cincel-
Kapelusz.
Fiske, D. (1949). Consistency of the factorial structures of personality ratings from different
sources. Journal of Abnormal and Social Psychology, 44, 329-344.
Eransella, F. (comp.) (1981). Personalidad. Madrid. Pirámide.
García Mérita, M. (1989). El qué y el cómo de la evaluación de la personalidad. En E. Ibáñez
y V. Pelechano (dirs.), Personalidad. Madrid. Alhambra.
García-Montalvo, C., Nieto, J. y Morales, J. M. (1989). El cuestionario 16PF de Cattell como
instrumento de discriminación entre sujetos neuróticos y normales. Anales de Psiquiatría,
4, 183-187.
Goldberg, L. R. (1965). Diagnosticians vs. diagnostic signs: The diagnosis of psychosis vs.
neurosis from the MMP1. Psychological Monographs, 79.
Goldberg, L. R. (1972). Review of the CPI. En O. K. Buros (dir.), Seventh mental measure-
ments yearbook. Highland Park. Gryphon.
Goldberg, L. R. (1981). Language and individual differences: The search for universals in
personality lexicons. En L. Wheeler (dir.), Review of Personality and Social Psychology
(vol. 2). Nueva York. Sage Publications.
Gough, H. G. (1975). California Psychological Inventory (revised manual). Palo Alto. Con-
sulting Psychologists Press.
Evaluación de los rasgos psicológicos
849
e J. R. (1987). The MMPI: A practical guide (2* ed.). Nueva York. Oxford Universit
y
Hampson, S. (1982). The construction ofpersonality. Londres. Routlege and Kegan.
Hathaway, S. R. y McKinley, J. C. (1940). A multiphasic personality schedule (Minnesota):
[. Construction of the schedule. Journal of Psychology, 10, 249-254.
Hathaway, S. R. y McKinley, J. C. (1975). Cuestionario de personalidad MMP1. Madrid. TEA.
Heilbrum, A. B. (1972). Review of the EPPS. En O. K. Buros (dir.), Seventh mental measure-
ments yearbook. Highland Park. Gryphon.
Henrichs, T. (1966). A note on the extension of MMPI configural rules. Journal of Clinical
Psychology, 22, 51-52.
Ibáñez, E. y Belloch, A. (1983). Interaccionismo y psicología de la personalidad. Análisis y
Modificación de Conducta, 20, 47-68.
Ibáñez, E. y Galdón, M. J. (1985). Una historia interminable de psicología de la personalidad.
En M. J. Báguena y A. Belloch (dirs.), Extraversión, psicoticismo y dimensiones emociona-
les de la personalidad. Valencia. Promolibro.
Keller, L. S., Butcher, J. N. y Slutske, W. S. (1990). Objetive personality assessment. En
G. Goldstein y M. Hersen (dirs.), Handbook of psychological assessment. Nueva York.
Pergamon Press.
Kleinmuntz, B. (1970). Review of the EPI. Journal of Educational Measurement, 7, 131-133.
a B. (1982). Personality and psychological assessment. Nueva York. St. Martin's
ress.
es Pf od El trabajo de Eysenck y Cattell. En F. Fransella (dir.), Personalidad. Madrid.
irámide.
Krug, S. E. (1978). Reliability and scope in personality assessment: A comparison of the Cat-
tell and Eysenck inventaries. Multivariate Experimental Clinical Research, 3, 195-204.
Lewin, K. (1935). A dinamic theory ofpersonality. Nueva York. McGraw-Hill.
Maddi, S. R. (1968). Personality theortes. The Dorsey Press.
McKee, M. G. (1972). Review of the EPPS. En O. K. Buros (dir.), Seventh mental measure-
ments yearbook. Highland Park. Gryphon.
Millon, T. (1982). Millon Clinical Multiaxial Inventory (3* ed.). Minneapolis. National Com-
uter Systems.
Millon, T-(1987) Manual for the MCMI-11 (2* ed.). Minneapolis. National Computer Sys-
tems.
Moreland, K. L. (1987). Computerized psychological assessment: What's available. En J. N.
Butcher (dir.), Computerized psychological assessment: A practitioner's guide.
Murray, H. A. (1938). Explorations in personality. Nueva York, Oxford. University Press.
Nieto, J., García-Montalvo, C. y Morales-Meseguer, J. M. (1985). Factorización de segundo
orden del cuestionario 16PF. Folia Neuropsiquiátrica del Sur y Este de España, XX, 46-55.
Norman, W. T. (1963). Toward an adequate taxonomy of personality attributes: Replicated
factor structure in peer nomination personality ratings. Journal of Abnormal and Social
Psychology, 66, 574-583.
Norman, Y. T. (1972). Review of the EPI. En O. K. Buros (dir.), Seventh mental measure-
ments yearbook. Highland Park. Gryphon. de 2
Núñez, R. (1987). Pruebas psicométricas de la personalidad. Manual práctico del MMP1. Méxi-
co, D.F. Trillas. Sl
Pelechano, V. (1985). Cognición y personalidad. En J.Mayor (dir.), Actividad humana y pro-
cesos cognitivos (Homenaje a]. L. Pinillos). Madrid. Alhambra.
Prieto, J. M. (1981). Factores de segundo orden en personalidad a partir de datos Q en adul-
tos españoles. Revista de Patología General y Aplicada, 36, 33-52.
Sandín, B. y Chorot, P. (1986). Evaluación de rasgos psicológicos. En R. Fernández-Balleste-
ros (dir.), Psicodiagnóstico (vol. 11). Madrid. UNED.
Seisdedos, N. (1978). 16PF. Monografía técnica. Madrid. TEA.
850 Carmen García-Montalvo
LECTURAS COMPLEMENTARIAS
BERNARDO MORENO-JIMÉNEZ
Hace años Mischel (1981) trazaba la evolución histórica de los grandes modelos de la
psicología de la personalidad. Aunque su perspectiva era voluntariamente teleológi-
ca al basar la historia en el paradigma cognitivo, reflejaba una posible interpretación
del transcurso histórico de los hechos. Anteriormente, Caparrós (1979) había traza-
do una evolución semejante, pero centrando el proceso histórico en el sucesivo de-
sarrollo de los paradigmas hacia un modelo científico-experimental. Según la pers-
pectiva de Mischel, los comienzos de la psicología de la personalidad parten de la
psicología de los rasgos a principios de siglo, cuando no era sino una psicología del
sentido común, allá por las décadas de los años veinte y treinta. La metodología del
análisis factorial (Cattell, 1946; Eysenck, 1947) intentó dar a la psicología de los ras-
gos una base más estadística y establecer una taxonomía mínima de rasgos funda-
mentales. A partir de entonces, y durante largos años, la psicología de la personali-
dad no fue sino una psicología de rasgos.
La formulación del situacionismo (Mischel, 1968) fue un duro golpe, teórico y
empírico, para la teoría de los rasgos. La crítica de Passini y Norman (1966), mos-
trando la importancia del lenguaje en cualquier taxonomía de rasgos, había supuesto
ya anteriormente una importante crítica. Aunque la nueva reformulación de los ras-
gos (Bowers, 1973; Bem y Allem, 1974; Snyder, 1979; Pelechano, 1985) supusiera un
realce para la teoría, su limitación heurística para la psicología de la personalidad ha-
bía quedado fuertemente establecida.
La aparición en 1960 de una teoría del aprendizaje social proporcionó nuevas
perspectivas a la psicología de la personalidad. La nueva corriente se centraba más en
los problemas reales de la vida cotidiana e introducía elementos explicativos explíci-
tamente cognitivos. La obra de Dollard y Miller (1950) ha significado probablemen-
te el primer hito en esta dirección. Las teorías del aprendizaje social han recurrido
paulatinamente al protagonismo de los procesos cognitivos introduciéndolos como
variables mediadoras de la conducta social. Esta tendencia ha provocado un redirec-
cionamiento del objeto de estudio de la psicología de la personalidad dirigiéndolo
hacia procesos tales como las expectativas subjetivas del sujeto (Rotter, 1954; Rotter
y Hochreich, 1975) o las autoinstrucciones, planes y sistemas de autorregulación
(Bandura, 1976, 1986). Este proceso llevó a la conclusión de que la “construcción
del estímulo era decisiva, de forma que un estímulo no sería portador de una valencia
estimular universal, sino que estaría mediado por la estructura cognitiva del sujeto.
A pesar de los diferentes esfuerzos por formular la personalidad desde una perspec-
tiva cognitiva, el intento de Mischel (1973) de reconceptualizar la personalidad desde
un enfoque cognitivo-social sigue siendo una referencia básica. Tras su crítica, inten-
cionalmente demoledora, del valor explicativo de los rasgos en la psicología de la
personalidad (Mischel, 1968), este autor recoge las propuestas de la crítica interac-
Evaluación cognitiva de la personalidad
853
nister y Mair (1968) y Fransella y Bannister (1977). Kelly se centró casi exclusiva-
mente en la determinación de los constructos interpersonales, es decir, en la forma
que tenemos de “construir” a los demás, de percibir cómo son los otros. Para deter-
minar cuáles eran esos constructós interpersonales, Kelly utilizaba una rejilla de do-
ble entrada donde las columnas representaban a los otros significativos en la vida de
la persona. Los ejemplos de Kelly incluían entre 15 y 24 personajes. Posteriormente,
Slater (1977) ha encontrado que el número modal en un millar de rejillas era de
12 elementos.
Los personajes pueden ser directamente propuestos por el investigador, entresa-
cados por el sujeto de una larga lista que se le suministra o elaborados directamente
por el sujeto. Si el interés está en la determinación de los constructos de otro ámbito
distinto al interpersonal hay que proporcionar elementos adecuados para ello: mar-
cas de coches si se quieren determinar los criterios de su compra, personajes políti-
cos si se quiere conocer la construcción cognitiva de los líderes políticos, partidos
políticos si lo que se quiere es establecer las coordenadas de su mundo político (Ji-
ménez, López y Moreno-Jiménez, 1985), las situaciones de tartamudez si lo que se
busca es ver cuándo y por qué tartamudea un sujeto, etc. Además, se puede utilizar
sustituyendo a las palabras, dibujos, fotografías, carteles o símbolos para facilitar o
hacer más ágil la aplicación del instrumento; en determinados casos, con niños pe-
queños o deficientes mentales, éste es el recurso habitual (Honess, 1978).
Establecido el ámbito a estudiar y elegidos los objetos-estímulos correspondien-
tes que figurarán en las columnas se pasa a determinar los constructos correspon-
dientes. Existen varios procedimientos para ello. El primero es el método de la tría-
da, original de Kelly. El método consiste en tener en cuenta tres elementos o papeles,
y decidir en qué se parecen dos de ellos y en qué se diferencian del restante. De esta
forma, el constructo obtenido es bipolar y personal, pudiéndose obtener construc-
tos tales como gentil-detestable o gentil-estúpido. Este tipo de constructos idiográ-
ficos era lo que Kelly originalmente buscaba y lo que diferencia el constructo del
concepto.
Una forma más sencilla de elicitación es la díada, propuesta por Ryle y Lunghi
(1970). Según este método, se comparan sólo dos elementos, estableciendo el sujeto
en qué se parecen y preguntando por el término opuesto al obtenido. Normalmente,
los constructos así obtenidos son bipolares de forma negativa (gentil-no gentil) o de
forma antinómica (gentil-grosero). Una tercera posibilidad es la de utilizar sólo
constructos unipolares, suponiéndose el otro constructo como un constructo su-
mergido o no explicitado. Existe además una cuarta posibilidad que no tiene como
objetivo determinar los constructos del sujeto, sino estudiar la estructura de algunos
constructos supuestamente importantes; consiste en proporcionar al sujeto una lista
de constructos para que evalúe con ella un determinado grupo de elementos, papeles
o personajes. Es un método que facilita la aplicación colectiva. Existen algunas reji-
llas de este tipo con fines específicos; Vacc (1980) ha propuesto un modelo de este
tipo de rejilla que puede aplicarse a niños en edad escolar.
Establecidos los constructos, elicitados o suministrados, el segundo paso es estu-
diar la estructura global de los mismos. Otra tarea posible es determinar la estructura
global de los elementos. Los procedimientos son afines y, en algún caso, con ayuda
de programas de ordenador, simultáneos. La primera operación es determinar qué
856 Bernardo Moreno-Jiménez
.
Se puede encontrar en Internet un excelente servidor sobre el tema de constructos personales en la
siguiente dirección: http//ksi.cpsc.ucalgary.ca:80/PCP/PCP.html. El servidor permite tanto una intro-
ducción teórica como metodológica al tema.
Evaluación cognitiva de la personalidad
857
más importantes que el sujeto humano tiene, una parte importante de esta tarea es
comprender las causas de la conducta de los demás. La exploración de la causalidad
interpersonal determina en gran manera nuestra actitud y conducta en las relaciones
interpersonales. Probablemente, toda acción suscita una interpretación de sus cau-
sas, aunque no todas lo hacen del mismo modo. El análisis causal es especialmente
importante cuando los hechos sorprenden o no coinciden con las expectativas con-
cretas o creencias generalizadas. Nadie hace preguntas ante una conducta banal, to-
dos las hacen frente a una conducta llamativa. La pregunta acerca del porqué está
siempre presente en la vida humana y constituye una parte importante del estilo de
vida y la filosofía del mundo de cada sujeto. De aquí la importancia de las atribu-
ciones.
Las atribuciones rigen, o al menos influyen, una amplia gama de conductas. Los
modelos más clásicos de esta línea de investigación son los de Weiner (1978, 1990)
que muestran la importancia de las atribuciones en la motivación y en la emoción. Si
un mal examen se atribuye a la falta de preparación, la reacción más habitual será la
de prepararlo mejor para la próxima ocasión; por el contrario, si se atribuye a falta de
capacidad lo más probable es el abandono. Algo semejante ocurre con las emocio-
nes, si la atribución ante el éxito es de habilidad, la emoción consecuente será la de
seguridad y competencia personal, si se atribuye a la influencia de otros aparece la
gratitud. De forma parecida se pueden originar la culpa, la sorpresa, la cólera, etc.
(Moreno-Jiménez, 1986). Clásicos en la misma línea de investigación son los estu-
dios de Seligman y cols. (1979).
En áreas más específicas son múltiples los trabajos realizados: la atracción inter-
personal, el conflicto y la separación en la relación de pareja, la conducta altruista, la
tartamudez, la conducta moral, la conducta asertiva, etc. El presupuesto general de
todas las aplicaciones mencionadas es la influencia de las atribuciones sobre la con-
ducta. Consecuencia de ello es el desarrollo de estrategias terapéuticas atributivas
para la modificación de conducta (Antaki y Brewin, 1982). Las causas posibles que
pueden ser atribuidas son múltiples. El estudio de ellas ha obligado a sistematizar-
las para poder controlar sus efectos. Así, hay dos líneas preferentes de investigación:
la primera trata de establecer los factores de atribución más importantes y la segunda
busca establecer las dimensiones en las que pueden resolverse todas las atribuciones.
Heider (1958) se incluye en la primera línea de investigación y trató de establecer
los tipos de causas principales a las que se atribuye la conducta. Según Heider habría
dos tipos de causas: personales e impersonales. Dentro de las primeras cabría distin-
guir la habilidad o la capacidad personal y el esfuerzo o la motivación, dentro de las
segundas se podrían distinguir la dificultad interna de la tarea, alta o baja, y la suerte.
Kelley (1967) ha seguido un modelo de probabilidad estadística y ha formulado el
principio de covariación: un efecto es atribuido a aquel elemento que está presente
cuando se da el efecto, y ausente cuando el efecto notiene lugar. Tres son los elemen-
tos principales sobre los que puede recaer la atribución: el sujeto de la acción, elob-
jeto de la acción y la situación en la que se da la acción. Kelley (1972) ha determinado
los diferentes criterios lógicos por los cuales se rige la atribución a uno u otro delos
elementos mencionados. No obstante, Cunninghan y Kelley (1975) han reconocido
que, a pesar de los criterios lógicos aludidos, en los individuos pueden darse tenden-
cias que favorecen la atribución a uno cualquiera de estos elementos.
858 Bernardo Moreno-Jiménez
¿Por qué cree Ud. que ha tenido éxito en la tarea que se le ha pedido?
Este tipo de evaluación se ha efectuado para determinar si las causas que los suje-
tos exponían se corresponden con las causas teóricamente expuestas. Así, en el ám-
bito del logro académico aparecieron, además de las cuatro citadas, el ánimo del mo-
mento, la personalidad y el interés por la tarea.
Evalúe de uno a nueve la importancia de los siguientes factores en la prueba que Ud.
acaba de pasar :
Su inteligencia :
La facilidad de 1 9
la tarea:
860 Bernardo Moreno-Jiménez
Aprecie Ud. el porcentaje de influencia que ha tenido en su éxito las siguientes cuatro
causas:
Capacidad Esfuerzo
Facilidad _ Suerte
Capacidad 5 + 3 2 1 Esfuerzo
Facilidad Sl 4 3 2 1 Suerte
De cada par de posibles causas rodee con un círculo cuál es más importante para expli-
car el resultado obtenido:
Capacidad-Esfuerzo
Capacidad-Suerte
Esfuerzo-Suerte
Etc.
De todas estas metodologías, Elig y Frieze (1979) consideran que las mejores son
las más estructuradas y, de éstas, las metodologías de porcentajes y de escalas bipola-
Evaluación cognitiva de la personalidad
861
V. LAS EXPECTATIVAS
penden de uno mismo y considerar que obedecen a otros factores externos al sujeto.
Según el primer tipo de creencia, el sujeto considera que su conducta y la línea de ac-
ción que desarrolla interviene decisivamente en las cosas que le pasan, el segundo
tipo de creencia considera que la suerte, el destino, los otros o las instituciones son
los factores decisivos de los hechos que le afectan, de forma que su conducta poco
tiene que ver con los sucesos que le afectan cada día. Rotter (1966), en función del
tipo de creencias mantenidas, distinguía dos tipos de sujetos: internalistas y externa-
listas. Internalistas serían aquellos que mantienen expectativas de que su acción re-
percutirá sobre el medio influyendo en él; por el contrario, los externalistas son
aquellos que sitúan el control de la situación fuera de ellos. La distinción no debe en-
tenderse como una tipología excluyente, sino como los polos de un continuo a lo
largo del cual se distribuyen los sujetos.
Posteriormente al trabajo de Rotter, los estudios e investigaciones sobre el lugar
de control han proliferado vertiginosamente hasta constituir en la década de los años
setenta, y parte de los ochenta, una de las áreas más prolíficas de la psicología (Lef-
court, 1981a, 1983), aunque en los últimos años ha conocido un notorio declive. Lle-
vado de la mano del tema, la investigación acerca de la percepción de control se ha
convertido en un paradigma de investigación básica (Langer, 1983; Fischer, 1984;
Skinner, 1995) y la base de desarrollos como los de causación personal (Decharms,
1968), autoeficacia (Bandura, 1977) o competencia personal (Harter y Connell,
1984).
Los aspectos de la conducta y de la personalidad que han sido puestos en rela-
ción con el lugar de control son múltiples (Lefcourt, 1976; Phares, 1976). Parece
ser que existe una clara relación entre el lugar de control general y diversos tipos de
control específico. Seeman y Evans (1962) observaron que en un hospital de tuber-
culosos los pacientes internalistas poseían mayor información sobre su condición
física y pedían más información a médicos y enfermeras. Seeman (1963) observó en
un reformatorio que los presos con un sistema de creencias interno conocían mu-
cho más sobre la política del reformatorio y sus reglas y regulaciones acerca de la
libertad condicional. El lugar de control también es relevante para determinar la
preferencia por ciertos tipos de actividades. Schneider (1972) encontró que los su-
jetos internalistas prefieren actividades de habilidad, mientras que las actividades de
azar eran preferidas por los sujetos externalistas. Igualmente, los sujetos externalis-
tas parecían más claramente susceptibles de ser influidos en sus apreciaciones y
más aptos para sufrir procesos de conformidad del tipo de los descritos por Asch
(Tolor, 1978). Tolor (1978) encontró que cuando se sugería que una luz estacionaria
se movía, era más probable que fueran los externalistas los que asintieran y vieran
la luz en movimiento. La mayor capacidad de persuasión de los externalistas se re-
fleja igualmente en los estudios de cambio actitudinal. Ritchie y Phares (1969) en-
contraron que los externalistas cambiaban más en respuesta a una fuente de eleva-
do prestigio que de bajo prestigio. Parece contrastado que las creencias de lugar de
control están relacionadas con el bienestar físico (Strickland, 1978). Son múltiples
las investigaciones que sugieren que las relaciones entre lugar de control y desajus-
te y ansiedad son lineales: a mayor externalidad mayor desajuste. Es posible que las
cualidades de mayor actividad, esfuerzo y autoconfianza de los internalistas con-
duzcan a un éxito mayor.
864 Bernardo Moreno-Jiméncz
gar de control fue el establecido por Paulhus (1983), quien se centró en elaborar una
escala que estableciera el lugar de control de forma multidimensional; así, distinguió
tres áreas relevantes (social, personal y sociopolítica), pudiendo el sujeto diferir en
cada una de estas áreas, por lo que podría establecerse un perfil diferencial en fun-
ción de las mismas.
Tras los primeros cuestionarios han aparecido muchos otros, dedicados unos a la
evaluación de expectativas de control generales, otros a expectativas de control espe-
cíficas como el envejecimiento, la salud, el dolor, el alcoholismo o el estrés (Lefcourt,
1981b, 1983). Si bien las primeras escalas solían ser genéricas, la tendencia posterior
ha consistido en hacerlas específicas y propias de los campos a investigar. Así por
ejemplo, Peterson (1985) ha desarrollado una escala relativa al trabajo, Tennenbaum,
Furst y Weingarten (1984) han trabajado sobre el logro deportivo, Furham (1986) ha
desarrollado una basada en la situación económica personal, y Rose y Medway
(1981) en el control de las conductas de los estudiantes por sus profesores. En cual-
quier caso, a pesar de la relevancia del constructo en el desarrollo teórico, la impor-
tancia de la varianza explicada por las diferentes medidas ha distado mucho de ser
óptima y considerable (Lefcourt, 1991). En el cuadro 34.1 se puede encontrar un re-
sumen de algunas de las escalas más utilizadas.
VL EL AUTOCONCEPTO Y LA AUTOESTIMA
Ambos conceptos han recibido en los últimos años una apreciable atención, proba-
blemente como consecuencia del aumento concedido a las actividades y procesos
autorreferenciales, considerados como factores claves en el funcionamiento global
de la personalidad. En su uso, incluso científico y académico, no siempre queda cla-
ramente establecida la diferencia entre autoconcepto y autoestima. No obstante, la
indudable proximidad entre ambos conceptos no debe propiciar su confusión, lo
que en la práctica sucede no pocas veces cuando, de hecho, ambos términos son uti-
lizados como sinónimos. Por autoconcepto se entiende la representación mental que
el sujeto hace de sí mismo, mientras que la autoestima sería la evaluación de esa re-
presentación (Blascovich y Tomaka, 1991). Rosemberg (1965) insistía en la misma
idea de la autoestima como una actitud favorable o desfavorable hacia uno mismo.
Entre los diferentes autores que han estudiado específicamente el autoconcepto cabe
destacar a Epstein (1973, 1980) y su propuesta del autoconcepto como una teoría del
sí mismo que cumple diferentes funciones. Siguiendo su modelo, aunque modifica-
do, el autoconcepto juega tres funciones básicas:
Mental health locus Hill y Bale (1980) | Internalidad ante la Pacientes en tera- 22
of control scale salud mental pia
sibilidades globales que tiene ante sí. Los sujetos poseerían varios autoconceptos
que le permitirían diferentes actuaciones en diferentes situaciones y contextos, de
forma que en cada una de ellas puede estar operando prevalentemente una deter-
minada forma de autoconcepto con sus propias características (Markus y Wurf,
1987).
El estudio y la evaluación de la autoestima han conocido en los últimos años una
notable extensión dada la importancia individual y social que se le ha concedido. La
autoestima baja ha sido asociada a la soledad (Peplau y Perlman, 1982), a la aliena-
ción (Johnson, 1973) y, en general, al síndrome de absentismo social, compañera de
viaje de la mayor parte de los problemas sociales como delincuencia, marginación,
prostitución, toxicomanías, etc.; por otra parte, una autoestima alta suele ir asociada
con elevada motivación de logro, una red social extendida e, incluso, mejores niveles
de defensa inmunológica. De hecho, la autoestima ha sido relacionada con la prácti-
ca totalidad de las variables (Crandall, 1973).
Se ha discutido qué metodos de autoevaluación eran mejores predictores, si los
métodos de evaluación global o los específicos. Mientras algunos autores (Marsh,
Smith y Barnes, 1983) proponen autoevaluaciones específicas de aspectos concretos
del sí mismo, otros prefieren medidas más globales (Rosemberg, 1965). Probable-
mente, la mejor medida corresponde al tipo de predicción que se desea establecer,
global o específico, sin que pueda establecerse una preferencia global por uno u otro
tipo de medidas. El desarrollo de escalas multidimensionales aditivas como la Ten-
nesse self concept scale [Escala Tennesse de autoconcepto] de Roid y Fitts (1988) ha
quitado vigencia al debate.
miento, con cuatro sentencias, el mismo número que en el primero. Fierro (1982) ha
propuesto y explicado la técnica. Su empleo es adecuado en estudios individuales,
pero es inaplicable en estudios de muestras o grupos elevados. Su ejecución no es
sencilla y requiere tiempo y esfuerzo, por lo que su utilización se ha reducido al ám-
bito clínico, siendo especialmente utilizada en el enfoque de la terapia centrada en el
cliente desarrollado por Rogers. González y Tourón (1992) proponen el diferencial
semántico como otra técnica apta para evaluar el grado con el que un sujeto se siente
caracterizado por un atributo particular o forma de ser. Siguiendo la técnica pro-
puesta por Osgood, Suci y Tannenbaum (1957), el sujeto debe evaluar un concepto o
reactivo en función de diversos criterios: cómo me percibo, cómo me ven los demás,
cómo me gustaría ser, etcétera.
Complementariamente a las técnicas descritas, se utiliza la evaluación del auto-
concepto mediante técnicas de reconocimiento de dibujos o viñetas con diferentes
tipos de acciones o conductas en las que el sujeto debe reconocerse. Este tipo de me-
todología es especialmente valiosa cuando al sujeto le faltan competencias léxicas, lo
que sucede en niños pequeños que, según Harter (1988), cuando son menores de
ocho años tienen dificultades para expresar verbalmente sus autoapreciaciones. No
obstante, su uso no tiene por qué limitarse a población infantil. Un ejemplo de esta
metodología es el Pictorial perceived competence scale for young children [Escala
gráfica de competencia percibida para niños] de Harter y Pike (1984). Por técnicas
inferenciales pueden entenderse todas aquellas técnicas en las que la información no
proviene del autoinforme directo del sujeto sino de muestras de conducta del mis-
mo. Para algunos autores (Combs, Soper y Courson, 1963; Savin-Williams y Jac-
quish, 1981) la inferencia a partir de la conducta sería el mejor método para evaluar el
autoconcepto real del sujeto a partir del supuesto de la determinación o influencia
del autoconcepto sobre la conducta. La evaluación de tal conducta pueden efectuarla
observadores avezados, amigos o compañeros del sujeto en cuestión. Este tipo de
metodología evitaría de raíz el sesgo en el autoinforme y ofrecería una perspectiva
complementaria del autoconcepto subjetivo. Ejemplos de este tipo de enfoques se-
rían The behavioral rating form [Forma escalar conductual] de Coopersmith y Gil-
berts (1981) y The self esteem rating scale for children [Escala de autoestima infantil]
de Chiu (1987).
Además de las técnicas mencionadas, en algunos casos se ha utilizado la en-
trevista, aunque su uso es más bien escaso y reducido a una forma de validación
de medidas de autoconcepto estandarizadas (Wells y Marwell, 1976). También se
ha empleado su evaluación a partir de técnicas proyectivas con el objeto de eva-
luar no el autoconcepto fenoménico, sino el inconsciente. La idea fue propuesta
inicialmente por Wylie (1961), aunque posteriormente consideró que el estudio
de este tipo de evaluación no indica mejoras con respecto a lo ofrecido por las
técnicas tradicionales (Wylie, 1974). Wells y Marwell (1976) han corroborado
esta apreciación y consideran que dichas técnicas tienen escasa consistencia pst-
cométrica.
Entre las escalas aditivas mencionadas cabe destacar la Tennesse self-concept scale
[Escala Tennesse de autoconcepto] de Roid y Fitts (1988) por la amplitud de sus
planteamientos y sus buenas características psicométricas. Su objetivo es evaluar
tanto el autoconcepto como la autoestima del sujeto a partir de cien ftems que cu-
870 Bernardo Moreno-Jiménez
bren cinco aspectos específicos: físico, ético, personal, familiar y social. Su formato
de respuesta es tipo Likert de cinco categorías. Su aplicación puede efectuarse a par-
tir de los doce años de edad. El estudio de Roid y Fitts (1988) ha permitido el de-
sarrollo de numerosas medidas complementarias: identidad, satisfacción y conducta,
autocriticismo, adaptación, trastorno de personalidad y otras complementarias has-
ta un total de 29 medidas. Garanto (1984) ha realizado una adaptación experimental
de la misma.
tran una correlación alta con la deseabilidad social. Su formato de respuesta parece
inadecuado y se ha sugerido su transformación en un formato Likert, con ello se
produciría probablemente una disminución de su deseabilidad social y se obtendría
una disminución del sesgo de respuesta.
Otros dos cuestionarios ampliamente utilizados son The feelings of inade-
cuacy scale [Escala de percepción de la imperfeccion] de Janis y Field (1959) y el
Texas social behavior inventory [Inventario Texas de conducta social] de Helm-
reich, Stapp y Erwin (1974). El primero de ellos, el F7S, consta de 36 ítems, ha
sido objeto de diferentes estudios y tiene la ventaja de que puede utilizarse tanto
para una apreciación global como de factores específicos. Los aspectos específi-
cos que considera son: autoconfianza, habilidades escolares, autoconsideración,
apariencia física y habilidad física. Por su parte, el 75B7 tiene la ventaja de contar
con dos versiones paralelas de 16 ítems con lo que facilita su utilización en de-
terminadas investigaciones. Aunque consta de cuatro factores específicos, se cen-
tra en los aspectos y habilidades sociales por lo que se le ha criticado su validez
de constructo.
La evaluación de la autoestima en los niños ha merecido un especial interés dada
su importancia en los aspectos evolutivos y los problemas específicos que entraña.
La escala más utilizada en este contexto ha sido la Piers-Harris children's self concept
scale [Ecalas Piers-Harris de autoconcepto infantil] (Piers, 1984), que evalúa autoes-
tima en niños y adolescentes a pesar de que su título haga referencia al autoconcepto.
Consta de 80 ítems a los que se responde dicotómicamente; factorialmente se han
extraído seis aspectos específicos: conducta, aspectos escolares, apariencia física, an-
siedad, popularidad y satisfacción. Su utilización ha dado mejores resultados con ni-
ños que con adolescentes.
Debido a los problemas léxicos que puede representar la evaluación de la autoes-
tima en los niños más pequeños y la importancia de tener referencias sobre ello se
han elaborado escalas basadas en el dibujo. Una de las más conocidas es el Self-
perception profile for children (SPPC) [Perfil de autopercepción infantil] de Harter
(1985). La SPPC evalúa diferentes aspectos de la autocompetencia y autoaceptación
infantil. Consta de dos formas en función de la edad: preescolar y primeros años es-
colares; ambas proporcionan información sobre cinco aspectos específicos: compe-
tencia escolar, aceptación social, competencia física, apariencia física y conducta. Se
presenta en dos series de dibujos, una representando un aspecto positivo y la otra
uno negativo, debiendo el niño identificarse con uno u otro. Cada una de las escalas
tiene seis ítems o dibujos. Su utilización capta el interés y la colaboración de los ni-
ños. En el cuadro 34.2 se puede encontrar un resumen de los instrumentos más utili-
zados en la evaluación de la autoestima que responden a criterios científicos de ela-
boración.
872 Bernardo Moreno-Jiménez
REFERENCIAS BIBLIOGRÁFICAS
Eransella, F. y Bannister, D. (1977). A manual for the repertory grid technique. Londres. Aca-
demic Press. ]
EFranzo1,S.L. y Shields, S. A. (1984). The Body Esteem Scale: Multidimensional structure and
sex differences in a college population. Journal of Personality Assessment, 50, 24-31.
Furham, M. (1986). Economic locus of control. Human Relations, 39, 29-43.
Garanto, J. (1984). Las actitudes hacia símismo y su medición. Barcelona. Ediciones Universi-
tarias.
González, M. C. y Tourón, J. (1992). Autoconcepto y rendimiento escolar. Pamplona. Edicio-
nes Universidad de Navarra.
Hamilton, V. L. (1983). The cognitive structures and processes of human motivation and per-
sonality. Nueva York. Wiley and Sons.
Harter, S. (1985). Manual for the Self-Perception Profile. Denver. University of Denver.
Harter, S. (1988). Issues in the assessment of the self-concept of children and adolescents. En
A. La Greca (dir.), Chilhbood assessment: Trough the eyes of a child. Nueva York. Allyn
and Bacon ;
Harter, S. y Connell, J. P. (1984). A model of children's achievement and related self-percep-
tions of competence, control and motivational orientation. Advances in Motivation and
Achievement (vol. 3).
Harter, S. y Pike, R. (1984). The Pictorial Perceived Competence Scale for young children.
Child Development, 55, 1969-1982.
Heider, F. (1958). The psychology of interpersonal relations. Nueva York. Wiley.
Helmreich, R., Stapp, J. y Erwin, C. (1974). The Texas Social Behavior Inventory (TSBI): An
objective measure of self-esteem or social competence. JSAS, Catalog of Selected Docu-
ments in Psycholog).
Hensley, W. E. (1977). Differences between males and females on Rosemberg Scale of Self-
Esteem. Psychological Reports, 38, 583-584.
Hensley, W. E. y Roberts, M. K. (1976). Dimensions of Rosemberg's Scale of Self-Esteem.
Psychological Reports, 38, 583-584.
Hill, D. J. y Bale, R. M. (1980). Development of the Mental Health Locus of Control (MHLC)
and Mental Health Locus of Origin (MHLO) Scales. Journal of Personality Assessment, 44,
148-156.
Honess, T. (1978). A comparison of the implication and the repertory grid techniques. Bri-
tish Journal of Psychology, 69, 305-314.
Hutteau, M. (1985). Les conceptions cognitives de la personalité. París. PUF.
Ickes, W. y Layden, M. A. (1978). Attributional styles. En J. H. Harvey, W. S. Ickes y
R. F. Kidd (dirs.), New directions in attributions research (vol. 2). Nueva Jersey. LEA.
James, W. (1890). Principles ofpsychology. Nueva York. Holt.
Janis, 1. S. y Field, P. B. (1959). A behavioral assessment of persuability: Consistency of indi-
vidual differences. En C. 1. Hovland y L. L. Janis (dirs.), Personality and persnability. New
Haven. Yale University Press. Y
Jiménez, A., López, J. y Moreno-Jiménez, B. (1985). La representación cognitiva del mapa
electoral. Estudios de Psicología, 23-24, 99-107.
Johnson, F. (1973). Alienation: Concept, term and word. En F. Johnson (dir.), Alrenation:
Concept term and meanings. Nueva York. Seminar Press. e
Keen, T. R. y Bell, R. (1980). One thing lead to another. A new approach to elicitation in the
repertory grid technique. International Journal Man-Machine Studies [Número mono-
ráfico].
a H. (1967). Attribution theory in social psychology. Nebraska Symposium of Mo-
tivation, 15, 192-238.
Kelley, H. H. (1972). Cansal schemata and the attribution process. Hillsdale. General Lear-
ning Press.
Kelly, G. (1955). The psychology ofpersonal constructs. Nueva York. Norton and Company.
876 Bernardo Moreno-Jiménez
Phares, E. J. (1976). Locus of control in personality. Nueva Jersey. General Learning Press.
Piers, E. V. (1984). Piers-Harris Children's Self Concept Scale: Revised manual. Los Ángeles.
Western Psychological Services. :
Reid, D. W. y Ziegler, M. (1981). The desidered control measure and ajustement among the
elderly. En H. M. Lefcourt (dir.), Research with the locus of control construct (vol. 1).
Nueva York. Academic Press.
Revelle, W. (1995). Personality processes. Annual Review of Psychology, 46, 295-328.
Reynolds, W. M., Ramírez, M. P., Magriña, A. y Allen, J. E. (1980). Initial development and
validation of the Academic Self-Concept Scale. Educational and Psychological Measure-
ment, 40, 1013-1016.
Richtie, D. E. y Phares, E. J. (1969). Attitude change as a function of internal-external control
and comunicator status. Journal of Personality, 37, 429-443. SN
Rivas, F. (1981). La rejilla como técnica psicométrica de medida de la ejecución típica indivi-
dual. Análisis y Modificación de Conducta, 15, 171-246.
Roid, G. H. y Fitts, W. H. (1988). Tennesse Self-Concept. Los Ángeles. Western Psychologi-
cal Services.
Rose, J. S. y Medway, F. J. (1981). Measurement of teachers” beliefs in their control over stu-
dent outcome. Journal of Educational Research, 74, 185-190.
Rosemberg, M. (1965). Society and the adolescent self-image. Princeton. Princeton Univer-
sity Press.
RObEE M. (1986). Self-concept from middle childhood through adolescence. En J. Suls
y A. Greenwald (dirs.), Psychological perspectives on the self (vol. 3). Hillsdale. Lawrence
Erlbaum.
Rosemberg, M. y Simmons, R. G. (1972). Black and white self-esteem: The urban school
child. Washington. American Sociological Association.
Rotter, J. B. (1954). Social learning and clinical psychology. Nueva York. Prentice Hall.
Rotter, J. B. (1966). Generalized expectancies for internal vs. external control of reinforce-
ment. Psychological Monographs, 80, 609.
Rotter, J. B. (1967). A new scale for the measurement of interpersonal trust. Journal of Perso-
nality, 35, 651-665.
Rotter, J. B. (1975). Some problems and misconceptions related to the constructs of internal
vs. external control of reinforcement. Journal of Consulting and Clinical Psychology, 48,
56-67.
Rotter, J. B. (1982). Social learning theory. En N. T. Feather (dir.), Expectations and action.
Hillsdale. Erlbaum.
Rotter,J.B. y Hochreich, D. J. (1975). Personality. Glenview. Scott, Foresman.
Russell, L. (1982). The causal dimensions scale: a measure of how individual perceive causes.
Journal of Personality and Social Psychology, 42, 1137-1145.
Ryden, M. B. (1978). An adult version of the Coopersmith Self-Esteem Inventory: Test, re-
test, reliability and social desirability. Psychological Reports, 43, 1189-1190.
Ryle, A. y Lunghi, M. W. (1970). The dyad grid: A modification of repertory grid technique.
British Journal of Psychiatry, 117, 323-327.
Saltzer, E. B. (1982). The Weight Locus of Control (WLOC) Scale: A specific measure for obe-
sity research. Journal of Personality Assessment, 46, 620-628.
Savin-Williams, R. C. y Jacquish, G. A. (1981). The assessment of adolescent self-esteem:
A comparison of methods. Journal of Personality, 49, 324-335.
Schantz, C. U. (1975). The development of social cognition. En E. M. Hetherington (dir.),
Review of Child Development Research (vol. 5). Chicago. University of Chicago.
Schneider, J. M. (1972). Relationships between locus of control and activity preferences.
Journal of Consulting and Clinical Psychology, 38, 225-230.
Seeman, M. (1963). Alienation and social learning in a reformatory. American Journal of So-
ciology, 69, 270-284.
Evaluación cognitiva de la personalidad 879
Seeman, M. y Evans, J. W. (1962). Alienation and learning in a hospital setting. American So-
ciological Review, 27, 772-783.
Seligman, M. (1995). The optimistic child. Hougthon. Mifflin.
Seligman, M., Abramson, L. Y., Semmel, A. y Von Baeyer, C. (1979). Depressive attributio-
nal style. Journal ofAbnormal Psychology, 88, 242-247.
Sharauger, J. S. (1990). Self-Confidence: Its conceptualization, measurement, and behavior
implications. Buffalo. Sunny.
A M. L. G. (1981). Recent advances in personal construct technology. Londres. Academic
ress.
Simpson, C. K. y Boyal, D. (1975). Esteem construct generality and academic performance.
Educational and Psychological Measurement, 35, 897-907.
Skinner, E. A. (1995). Perceived control, motivation and coping. Londres. Sage.
Slater, P. (1977). Dimensions of intrapersonal space (vol. 2). Londres. Wiley.
Snyder, M. L. (1979). Self-monitoring processes. En L. Berkowitz (dir.), Advances in experi-
mental social psychology. Nueva York. Academic Press.
Soares, A. T. y Soares, L. M. (1979). The affective perception inventory-advanced level,
Trumbell. Also.
Stephenson, W. (1953). The study of behavior, Q technique and its methodology. Chicago.
University of Chicago Press.
Strickland, B. R. (1978). Internal-external expectancies and health-related behavior. Journal
of Consulting and Clinical Psychology, 46, 1192-1211.
Tennembam, G., Furst, D. y Weingarten, G. (1984). Attribution of causality in sport events.
Validation of the Wingate Sport Achievement Responsability Scale. Journal of Sport Psy-
chology, 6, 430-439.
Tolor, A. (1978). Some antecedents and personality correlates of health locus of control. Psy-
chological Reports, 43, 1159-1165.
Tversky, A. y Kahneman, D. (1974). Judgement under uncertainty: Heuristics and biases.
Science, 184, 1124-1131
Vacc, N. A. (1980). Further development of the adapted modified role repertory test. Measu-
rement and Evaluation in Guidance, 12, 216-222.
Wallston, K. A., Wallston, B. S. y Devellis, R. (1978). Development of the multidimensional
health locus of control scales. Health Education Monograpbs, 6, 161-170.
Weiner, B. (1971). Perceiving the canses of success and failure. Hillsdale. General Learning
Press:
Weiner, B. (1974). Achievement motivation and attribution theory. Hillsdale. General Lear-
ning Press.
Weiner, B. (1978). Affective consequences of causal ascriptions. En J. Harvey, W. J. Ickes y
R. F. Kidd (dirs.), New directions in attribution research (vol. 2). Hillsdale. LEA.
Weiner, B. (1990). Attribution processes in personality. En L. A. Pervin (dir.), Handbook of
personality. Theory and research. Nueva York. Academic Press.
Wells, L. E. y Marwell, G. (1976). Self-esteem: Its conceptualization and measurement. Be-
verly Hills. Sage Publications.
Wiggins, J. S. (1971). The psychology of personality. Massachusetts. Addison Wesley.
Wimer, S. y Kelley, H. H. (1982). An investigation of the dimensions of causal attributions.
Journal of Personality and Social Psychology, 43, 6, 1142-1162.
Wylie, R. C. (1961). The self-concept. Lincoln. University of Nebraska Press.
Wylie, R. C. (1974). The self-concept (vol. 1). Lincoln. University of Nebraska Press.
Zuckerman, M. (1979). Attribution of success and failure revisited or the motivational bias 1
alive and well in attribution theory. Journal of Personality, 47, 245-287.
Zumalabe, J. M. (1990). La psicología de la personalidad y las teorías cognitivas y del procesa-
miento de la información. Revista de Psicología General yAplicada, 43, 225-231.
880 Bernardo Moreno-Jiménez
LECTURAS COMPLEMENTARIAS
I. INTRODUCCIÓN
muestra actitudes con mayor o menor compromiso con respecto a otro individuo u
otro grupo, es comprensible la importancia que tiene el conocimiento objetivo de las
actitudes, la previsión de su evolución y, si es posible, su modificación, A l
El término actitud, derivado de la palabra latina aptitudo, que significa disposi-
ción natural para realizar determinadas tareas, hacía referencia a la posición corporal
del modelo de los pintores italianos del renacimiento. Por medio de determinada
posición corporal se expresaba un sentimiento o un deseo. Así, la actitud adquiere
un significado susceptible de ser comprendido por otras personas. Según Kahale
(1984), la introducción del término actitud en la literatura científica se debe a Dar-
win en su libro Expression of the emotions in man and animals publicado en 1872.
Para Darwin este concepto implica respuestas motoras estereotipadas asociadas a la
expresión de una emoción, y que hacen referencia a la postura de todo el cuerpo; las
actitudes se desarrollarían para el restablecimiento del equilibrio. El término actitud
aparece relativamente pronto en la psicología experimental con el alemán Oswald
Kulpe. A principios de siglo, Kulpe habla de que las personas ante una misma esti-
mulación responden de forma diferente según la orientación de su percepción; por
tanto, la actitud permitirá explicar la relación fluctuante entre estímulo y respuesta.
La introducción del concepto de actitud en la literatura sociológica es atribuida a
Thomas y Znaniecki en 1918 con el estudio de los problemas con los que se enfren-
taban los emigrantes polacos en Estados Unidos. Estos autores utilizaron el concep-
to de actitud para referirse al sentimiento mostrado por las personas hacia algún ob-
jeto, como el dinero o el trabajo. Este énfasis en los aspectos psicológicos tuvo un
importante efecto en las ciencias sociales; la mayor parte de los psicólogos sociales
adoptó el constructo de actitud para referirse a acontecimientos mentales. Subya-
cente a la popularidad suscitada por la noción de actitud parece estar la suposición de
muchos psicólogos sociales de que las actitudes son «comportamientos en miniatu-
ra». De esta forma, para poder predecir un determinado comportamiento lo que ha-
bría que hacer es determinar la actitud de las personas hacia el objetivo del compor-
tamiento. Así, surge el problema metodológico, pues era necesario elaborar
instrumentos adecuados para la evaluación de las actitudes; este supuesto contribuye
al incremento de la literatura en la década de los años treinta.
McGuire (1985) señala tres períodos en el estudio de las actitudes. El primero,
correspondiente a los años treinta, se centra en la evaluación de las actitudes; en el se-
gundo período, durante los años cincuenta y sesenta, se desarrolla la mayor parte de
las teorías sobre el cambio de las actitudes; por último, el tercer período está en curso
y se focaliza en los sistemas actitudinales.
111. Definiciones
Las definiciones de las actitudes son casi tan numerosas como los autores que se de-
dican a su estudio. En la revisión de Dawes y Smith (1985) sobre la evaluación de las
actitudes y de la opinión se concluye que en la actualidad existe tanta controversia en
Evaluación de las actitudes 883
ESTÍMULO
Individuos, acontecimientos sociales, grupos
sociales, objetos
ACTITUD
específico a lo más general. Por su parte, Alexandre (1971), con el objetivo de estable-
cer las relaciones entre opiniones y actitudes, distingue dos niveles: nivel genotípico y
nivel fenotípico. El nivel genotípico comprende las actitudes que actuarían como cau-
sas; el nivel fenotípico se manifestaría, de modo privilegiado, pero no exclusivo, a tra-
vés del estudio de las opiniones o comportamientos verbales que serían los efectos.
Eysenck (1954) ya distinguía cuatro niveles: la opinión accidental, la opinión habi-
tual, la actitud y la ideología. La opinión accidental no es una característica del indivi-
duo (una persona puede afirmar hoy algo y al día siguiente lo contrario). La opinión
habitual, relativamente constante, es una característica del individuo (una persona pa-
triótica se comporta siempre del mismo modo cuando su país es criticado). La actitud
como conjunto de opiniones estables interrelacionadas hace referencia a un compo-
nente importante de la personalidad. Finalmente, el nivel de la ideología alude a la in-
terdependencia de las actitudes. De una persona que manifiesta una actitud etnocén-
trica, un modo severo de educar a sus hijos, actitudes prorreligiosas y un gran
patriotismo, se puede decir que posee una personalidad de tipo conservador.
112. Características
Los objetos de las actitudes pueden ser muy diversos; puede tratarse de objetos con-
cretos (caderas, casas, coches deportivos...), personas (padres, presidente del gobier-
no, profesores...) grupos (socialistas, esquimales...), ideas abstractas (democracia,
Justicia, tolerancia...) o comportamientos (beber, fumar, preferencias sexuales...). La
Evaluación de las actitudes 885
no se refiere a un patrón objetivo. Así, puede acontecer que dos sujetos se sitúen
subjetivamente en dos lugares diferentes de la escala, a pesar de que sus actitudes
presenten el mismo grado de intensidad. Los psicólogos sociales intentaron cons-
truir instrumentos de medida más fiables que superaran estas dificultades.
Las escalas de actitudes pueden ser consideradas como la respuesta técnica a las si-
guientes cuestiones: ¿cómo probar de modo objetivo la existencia de actitudes siéstas
son variables inferidas, esto es, no directamente observables?, y ¿cómo determinar la
dirección y la intensidad de una actitud? Sólo se habla de actitud cuando se puede ob-
servar una coherencia lógica en una serie de respuestas o cuestiones puntuales. Se
puede pensar que cuando nos encontramos ante una relación lógica entre opiniones,
éstas son la expresión de una misma variable subyacente. Por tanto, las actitudes van a
ser evaluadas a partir de opiniones lógicamente ordenadas, lo cual constituye una es-
cala de actitud. Para Michelat y Thomas (1966) una escala de actitud es una serie de
cuestiones cuyas respuestas permiten clasificar el conjunto de la población estudiada
en función de la actitud evaluada, desde el grado más bajo hasta el más alto. Una esca-
la de actitud se presenta como un tipo de cuestionario particular, que muestra en cada
cuestión una opinión sobre la que el sujeto se debe pronunciar.
Ejemplos:
— Por naturaleza, los hombres están más capacitados que las mujeres en el cam-
po de las finanzas.
Sí/ No / Sin opinión
— Parece ser una ley de la naturaleza el hecho de que los hombres dominen y
que las mujeres sean totalmente dependientes.
Sí/ No / Sin opinión
— Por naturaleza, las mujeres están menos capacitadas que los hombres en pen-
samiento lógico y científico.
Sí/ No / Sin opinión.
Si una persona del sexo masculino aceptara en conjunto estas afirmaciones po-
dríamos decir que la coherencia de sus elecciones se explicaría por una actitud par-
ticular en relación a las mujeres: una actitud falocrática.
El principio general de las escalas de actitudes es presentar al sujeto una serie de
proposiciones, denominadas preguntas o cuestiones, pidiéndole que indique cuál
aprueba y cuál desaprueba. Estas respuestas serán combinadas, y su resultado deter-
minará la intensidad de la actitud del sujeto. Un problema que se presenta es el de la
construcción inicial de la escala de forma que nos proporcione resultados válidos.
Este aspecto será tratado en el apartado siguiente para cada una de las escalas de acti-
tudes más usuales. Veamos antes la clasificación de las escalas.
plo, es más fácil que no exista riesgo de confusión cuando se dice «Pesa 90 kilogra-
mos» que cuando se afirma «Es un hombre gordo». Existen numerosos tipos de es-
calas que se pueden clasificar en función del nivel de precisión que permiten obtener
en la medida. Estos tipos son por orden creciente de precisión las escalas nominales,
las ordinales, las de intervalo y las de razón.
Son las escalas más elementales, correspondiéndose con el nivel de medida menos
preciso. Permiten una distribución en clases de las observaciones en función de cri-
terios propios a cada una de ellas. Las categorías socioprofesionales no jerarquizadas
constituyen un ejemplo de escala nominal; otro ejemplo sería el sexo.
Ejemplo de escala de evaluación nominal:
Una escala ordinal se caracteriza por la existencia de una relación de orden en dife-
rentes clases. La relación de orden permite colocar las diferentes clases en un conti-
nuo. El estatus económico de una persona (alto, medio o bajo) es un ejemplo de una
medida ordinal. La medida consistente en que una persona esté totalmente de acuer-
do con una afirmación, de acuerdo, en desacuerdo o totalmente en desacuerdo es
considerada por algunos autores como una medida ordinal; para otros constituye
una medida de intervalos.
Ejemplo de una escala de evaluación ordinal:
¿Cuál es su niwel educativo más alto?
Este tipo de escalas ha sido ampliamente utilizado para evaluar actitudes. Vere-
mos más adelante las escalas de Bogardus, de Likert y de Guttman, las cuales pueden
ser consideradas escalas ordinales.
888 Félix Neto y J. Carlos Sierra
En las escalas de intervalos, además de ordenar las categorías, se evalúan las distan-
cias que las separan. El rendimiento anual puede constituir un ejemplo de este tipo
de escala. Las 200 000 pesetas de diferencia entre un millón y un millón doscientas
mil por año significan lo mismo en la diferencia entre dos millones y dos millones
doscientas mil pesetas por año. Sin embargo, si se tiene un ingreso de dos millones de
pesetas no significa automáticamente que uno es dos veces más rico que una persona
que tiene unos ingresos de un millón, pues intervienen muchas variables (número de
personas en la familia, alquiler de la casa...); por ello, hay que ser cautelosos a la hora
de considerar este tipo de escalas.
Ejemplo de escala de evaluación de intervalos:
Peso en kilogramos
El uso de las escalas de razón es infrecuente en psicología, utilizándose eventual-
mente en psicofísica.
Guttman y el Diferencial semántico. Una escala de actitud da lugar a una sola pun-
tuación que indica simultáneamente la dirección y la intensidad de la actitud de la
"persona; no obstante, algunas escalas dan lugar a puntuaciones en diferentes subes-
calas. Por ejemplo, para evaluar las actitudes en relación a la culturización se pueden
incluir cuestiones referidas a la integración, asimilación, separación y marginación
(Neto, 19934); para evaluar las actitudes con respecto al amor se pueden obtener
hasta seis puntuaciones: eros (apasionado y amor romático), ludus (juegos de amor),
storge (amor basado en la amistad), pragma (amor práctico), manía (amor posesivo y
amor dependiente) y agape (amor altruista) (Neto, 19935).
Esta escala fue propuesta por Bogardus en 1925 con el fin de evaluar las actitudes ét-
nicas, siendo revisada en 1933. Este instrumento evalúa el grado de distancia que una
persona desea mantener en las relaciones con personas de otros grupos. La escala se
presenta en forma de un cuadro o tabla de doble entrada, teniendo como abscisa el
nombre de diferentes grupos humanos (estadounidenses, canadienses, franceses...).
A estos grupos se les pueden sumar grupos raciales, grupos culturales, comunidades
religiosas, etc.; incluso, a veces, se incluyen grupos imaginarios (por ejemplo, brom-
binianos) para estudiar las relaciones entre ignorancia y ansiedad. En el eje de orde-
nadas aparecen siete proposiciones que caracterizan el tipo de relaciones que el suje-
to desearía tener con personas pertenecientes a esos grupos.
Ejemplo de preguntas de la Escala de distancia social para la evaluación de acti-
tudes:
Según mis primeras reacciones aceptaría personas de raza negra (como una cate-
goría, sin considerar ni los mejores miembros que he conocido ni los peores) para una
o más de las siguientes situaciones:
Los números colocados a la derecha indican el grado de distancia social que re-
presenta cada proposición; cuanto mayor sea el número, mayor será la distancia so-
cial. Diversos aspectos de esta escala han sido criticados, en particular la cuestionable
linealidad de la escala y sus intervalos desiguales. Para algunos sujetos, la admisión
en el local de trabajo significa una mayor proximidad que la admisión como vecino,
lo cual exigiría un orden de grados. En relación a la suposición de la igualdad de la
distancia entre los puntos de la escala, no es evidente, por ejemplo, que la distancia
entre 2 y 3 sea equivalente a la distancia entre 5 y 6.
890 Félix Neto y J. Carlos Sierra
(1,7) 1. Nose debería autorizar a los negros a asociarse con los blancos de nin-
guna forma.
(4,3) 2... El negro debería disfrutar de libertad, pero nunca debería ser tratado
igual que un blanco.
(7,3) 3. No se puede condenar la totalidad de la raza negra como consecuen-
cia de las acciones de algunos de sus miembros.
(10,3) 4. Considero que el negro merece los mismos privilegios sociales que los
blancos.
Evaluación de las actitudes 891
Los sujetos deben señalar las preguntas con las que están de acuerdo. Los nú-
meros entre paréntesis indican los valores de la escala atribuidos a las preguntas a
partir de las evaluaciones de los jueces. Estos números no aparecen actualmente en
los cuestionarios que se entregan a los sujetos. Cada cuestión proporciona al sujeto
la alternativa de estar de acuerdo o en desacuerdo, y cada punto en la escala repre-
senta una puntuación. Las puntuaciones de las preguntas seleccionadas por el suje-
to dan lugar a una medida de la actitud de una persona en relación a las personas
negras.
La Escala de intervalos aparentemente iguales presenta algunas dificultades.
En primer lugar, la preparación de la escala es complicada, habiéndose encon-
trado resultados muy similares utilizando técnicas menos complejas que la Es-
cala de Thurstone. En segundo lugar, puede haber una distancia relativamente
grande entre el conjunto de jueces o informadores y la población a la que se
administra la escala. Generalmente, el grupo de jueces está constituido por inte-
lectuales, pudiendo ser su comprensión de las preguntas sustancialmente dife-
rente a la de otro grupo de población. En tercer lugar, Thurstone partió de la
idea de que los jueces ordenan las afirmaciones o proposiciones independiente-
mente de sus actitudes, habiéndose comprobado lo contrario. Mientras que las
investigaciones iniciales indicaban que las actitudes de los jueces no afectaban al
orden de las afirmaciones, otros estudios no van en esta dirección; así, Hovland
y Sherif (1952) encontraron que los jueces con actitudes personales extremas
ordenaban un mayor porcentaje de proposiciones en una determinada categoría,
contaminando la escala.
La Escala de Guttman se basa en el supuesto de que las opiniones pueden ser orde-
nadas en función de favorabilidad, de modo que la concordancia con una determina-
da proposición implica estar de acuerdo con todas las preguntas que reflejen opinio-
nes más favorables. Según Guttman, cualquier escala que reproduzca perfectamente
este modelo será unidimensional. A diferencia de la Escala de Likert en la que la
puntuación total de la actitud de una persona podía reflejar uno de los diversos pa-
trones de respuesta, una puntuación en la Escala de Guttman teóricamente sólo pue-
de ser obtenida de una forma. Si conocemos la puntuación de un individuo, entonces
conoceremos la forma en que la persona responde a cada pregunta de la escala. La
elaboración de una escala de este tipo incluye tres etapas:
a. Se agrupa un considerable número de opiniones acerca de la actitud que de-
seamos evaluar. Estas opiniones deberán permitir la exploración de los dominios
que constituyen el campo de expresión de la actitud. Por ejemplo, si consideramos la
actitud de un grupo social con respecto a un partido político, existe un conjunto de
opiniones de los miembros del grupo acerca del partido: opiniones sobre la política
extranjera de este partido, sobre su política cultural, su política en relación a la juven-
Evaluación de las actitudes 893
Acuerdo Desacuerdo
Puntuación A B ce A B €
3 PS Xx Xx
de o Xx Xx
1 Xx Xx Xx
0 Xx Xx Xx
Cualquier otro patrón de respuestas como, por ejemplo, estar de acuerdo con A
y C, y estar en desacuerdo con B, es considerado erróneo. Si efectivamente A es más
favorable y C menos favorable, no tendría sentido concordar con A y estar en desa-
cuerdo con B o C. Esto se tendrá en cuenta a la hora de ordenar las cuestiones. La
proporción de puntuaciones del pretest que concuerdan con el patrón ideal se consi-
dera un índice de adecuación de la escala o de reproductibilidad. La unidimensiona-
lidad de esta escala se puede ilustrar por medio de las actitudes sexuales en relación al
comportamiento sexual preconyugal. Reiss (1967) elaboró un continuo unidimen-
sional de comportamiento preconyugal que va desde besar hasta tener relaciones se-
xuales completas. Véase el cuadro 35.2.
Esta escala se basa en el supuesto de que la persona que apruebe acariciar inten-
samente, también aprueba acariciar ligeramente o besar, y la persona que desapruebe
acariciar ligeramente también desaprueba acariciar intensamente o el contacto oral y
las relaciones sexuales completas.
La unidimensionalidad de esta escala se puede representar tal como aparece en el
cuadro 35.3.
La escala unidimensional de Guttman evita el problema de los diferentes pa-
trones de actitud con la misma puntuación. Entre los problemas que presenta
esta escala destaca el hecho de que un conjunto de preguntas que da lugar a res-
puestas escalonadas (o unidimensionales) en una determinada población no lo
haga en otra población. Las cuestiones de la escala pueden ser ordenadas de
modo diferente o pueden no tener un orden consistente. Por eso, la escala debe
ser validada en una muestra de sujetos semejantes a aquellos con los que se va a
utilizar la escala en el estudio final. Una mayor información sobre las escalas de
Thurstone, Likert y Guttman se puede obtener en el capítulo de Pascual: y Sie-
rra en este mismo manual.
894 Félix Neto y J. Carlos Sierra
CUADRO 35.2. Escala para evaluar las actitudes en relación al comportamiento sexual pre-
E
conyugal A A AA zea
1. Considero que besar es aceptable para el hombre/la mujer antes de casarse si
él/ella está comprometido/a para casarse.
2. Considero que besar es aceptable para el hombre/la mujer antes de casarse si
él/ella está apasionado/a.
3. Considero que besar es aceptable para el hombre/la mujer antes de casarse si
él/ella siente un gran afecto por su compañera/o.
4. Considero que besar es aceptable para el hombre/la mujer antes de casarse aun
cuando él/ella no sienta un afecto particular por su compañera/o.
5. Considero que las caricias son aceptables en el hombre/la mujer antes de casarse
si él/ella está comprometido/a para casarse.
6. Considero que las caricias son aceptables en el hombre/la mujer antes de casarse
si él/ella está apasionado/a.
7. Considero que las caricias son aceptables en el hombre/la mujer antes de casarse
si él/ella siente un gran afecto por su compañera/o.
8. Considero que las caricias son aceptables en el hombre/la mujer antes de casarse
aun cuando él/ella no sienta un afecto particular por su compañera/o.
9. Considero que las relaciones sexuales son aceptables en el hombre/la mujer antes
de casarse si él/ella está comprometido/a para casarse.
10. Considero que las relaciones sexuales son aceptables en el hombre/la mujer antes
de casarse si él/ella está apasionado/a.
11. Considero que las relaciones sexuales son aceptables en el hombre/la mujer antes
de casarse si él/ella siente un fuerte afecto por su compañera/o.
12. Considero que las relaciones sexuales son aceptables en el hombre/la mujer antes
de Casarse aun cuando él/ella no sienta un afecto particular por su compañera/o.
Elevada permisividad E sE
+ =
+++
0N
mAs00
1 +++++
++
Poca permisividad = = E le
A > _— QQ _ —_ AI Dn A AA
Evaluación de las actitudes 895
En cada una de las escalas abajo indicadas señale su opinión con respecto al árbi-
tro del partido del sábado:
Bueno /- A A A A MO
Lento //72—/—//—/—/—-/—X—/ Rápido
AAA A A A a E) E
Este sujeto manifiesta claramente una actitud positiva en relación al árbitro del
partido.
El Diferencial semántico ofrece tres tipos de información acerca del objeto de la
actitud: evaluación, potencia y actividad. La dimensión de evaluación (en el ejemplo
anterior sería bueno-malo) permite conocer si se está en una posición favorable o
desfavorable con respecto al objeto de la actitud; la dimensión potencia (fuerte-
débil) y la dimensión actividad (rápido-lento) informan también sobre el significado
de un concepto para la persona.
El Diferencial semántico ha sido utilizado de diferentes formas y para diversos
objetivos. Algunos de sus usos son el estudio de las diferencias socioculturales en las
actitudes y el estudio de las diferencias sexuales; los sujetos masculinos y femeninos
pueden presentar diferentes respuestas connotativas hacia determinados conceptos
y objetos; también se utiliza para evaluar el autoconcepto. El Diferencial semántico
presenta la ventaja de ser fácil de construir y que casi toda la escala, una vez elabora-
da, puede ser utilizada como modelo para otra variable a estudiar, dado que los adje-
tivos son independientes de cualquier variable. Entre las críticas realizadas al Dife-
rencial semántico se señala la existencia, a veces, de falsas bipolaridades.
896 Félix Neto y J. Carlos Sierra
Los cuestionarios son con diferencia las técnicas de evaluación de las actitudes más
ampliamente utilizadas. No obstante, la facilidad en detectar su intención puede in-
fluir en ciertas personas; este hecho ha llevado a algunos investigadores a utilizar mé-
todos indirectos. Las medidas indirectas más comunes en las que no se pregunta a las
personas su actitud directamente son las técnicas psicofisiológicas, las técnicas com-
portamentales y las técnicas proyectivas.
Las técnicas psicofisiológicas utilizadas para la evaluación de las actitudes, tales
como la resistencia electrodérmica o la contracción pupilar, parten del presupuesto
de que el componente afectivo de las actitudes produce una reacción psicofisiológi-
ca que puede ser registrada. Se encontró que sujetos blancos mostraban una eleva-
da respuesta electrodérmica delante de un experimentador negro y no ante uno
blanco (Rankin y Campbell, 1955). Este resultado podría interpretarse como una
señal del preconcepto de los sujetos en relación al experimentador negro. Sin em-
bargo, más recientemente se llegó a la conclusión de que la novedad del estímulo
produce una elevada respuesta electrodérmica (Cacioppo y Sandman, 1981). La
sorpresa al encontrarse con un experimentador negro podría haber producido la
respuesta electrodérmica. El problema suscitado por la interpretación de esta expe-
riencia muestra las dificultades existentes al utilizar este registro psicofisiológico en
la evaluación de las actitudes. Otra medida que está asociada al sistema nervioso
autónomo es el cambio en el tamaño de la pupila ocular. Su dilatación se interpretó
como un indicador de una actitud positiva y su contracción como un indicador de
una actitud negativa (Hess, 1965). A su vez, Cacioppo y Tassinary (1990) utilizan
la actividad electromiográfica facial en situaciones estructuradas como medida in-
directa de las actitudes.
Las medidas conductuales se asientan en el supuesto de que el comportamiento
es consistente con las actitudes. Así, si un sujeto es afable con los inmigrantes, se pre-
supone que el sujeto tiene una actitud favorable en relación a los inmigrantes. Meh-
rabian (1967) estudió el aspecto comportamental de las actitudes utilizando algunas
de las ideas de la proxemia, la cual se refiere al grado de intimidad de la interacción
no verbal entre dos personas que se comunican. Según Mehrabian, se pueden eva-
luar las actitudes de un sujeto en relación a otro a través de la medida de la distancia,
del contacto ocular y de la tensión corporal en el momento en que interactúan. Otra
forma de evaluar las actitudes es a través de tareas cuya realización sea sistemática-
mente influenciada por las actitudes. Por ejemplo, en un experimento se ha pedido a
un número de estudiantes que desempeñaran el papel de jueces en un debate y que
evaluaran imparcialmente los argumentos sobre asuntos raciales sin hacer referencia
a sus propias actitudes (Brighan y Coock, 1979). Los autores partían de la hipótesis
de que a pesar de los intentos por ser imparciales, las evaluaciones de los estudiantes
estarían fuertemente afectadas por sus actitudes, pudiendo utilizar, por tanto, estas
evaluaciones como medidas indirectas de las actitudes. Tal como se hipotetizaba los
juicios realizados constituyeron una medida indirecta válida de las actitudes raciales
de los sujetos. Por último, recientemente se están utilizando medidas implícitas de la
memoria para evaluar de forma indirecta las actitudes (Dovidio y Fazio, 1992).
Evaluación de las actitudes 897
La utilización de técnicas indirectas para evaluar las actitudes presenta una se-
rie de ventajas y de desventajas, a su, vez. Entre las ventajas se señala que estas téc-
nicas son menos susceptibles de suscitar respuestas socialmente aceptables; la per-
sona no conoce qué actitud está siendo evaluada. Entre las desventajas destaca la
dificultad para evaluar la intensidad de la actitud y, dado que las actitudes son in-
feridas, estas técnicas pueden tener problemas de fiabilidad. A pesar de esto, las
medidas indirectas son la única alternativa a seguir cuando se trabaja en asuntos
sociales sensibles.
REFERENCIAS BIBLIOGRÁFICAS
Aiken, L. R. (1985). Psychological testing and assessment. Boston. Allyn and Bacon, Inc.
Alexandre, V. (1971). Les échelles d'attitude. París. Editions Universitarres.
Allport, G. (1935). Attitudes. En C. Murchison (dir.), A handbook of social pyschology. Wor-
certer. Clark University Press.
898 Félix Neto y J. Carlos Sierra
LECTURAS COMPLEMENTARIAS
Olson, J. M. y Zanna, M. P. (1993). Attitudes and attitude change. Annual Review Psycho-
logy, 44, 117-154.
Thorndike, R. M., Cunningham, G. K, Thorndike, R. L. y Hagen, E. P. (1991). Measurement
and evaluation in psychology and education. Nueva York. Maxwell McMillan.
M
se de
e
za ET,
A lt €.
de - Yaa 5 orar á
Astro all Appiod Di
.
+7.Pbe Dv A
, 4d 3 y 7 Vos
h Ñ ,
4 x cl 0 3
P A Mor a ed
' % Le ys
A a
| pa ch
e E
LA Es ARIAS 200 compo
/ ; » da MIN wiecios. Ja
de lies
e 4 uN
Ni PET
, . De
. E)
el
.
36. EVALUACIÓN DE LOS INTERESES
Il. INTRODUCCIÓN
El método más antiguo de evaluación de los intereses fue la estimación, la cual se rea-
lizaba pidiendo a los individuos que indicaran cómo se sentían en varias actividades.
Para mejorar la exactitud de su estimación, se animaba a la gente a probar las activi-
dades antes de realizar sus estimaciones. Sin embargo, estas técnicas de evaluación de
los intereses eran costosas en tiempo y dinero, lo que llevó al desarrollo de cuestio-
narios y escalas de estimación de los intereses (Miner, 1922; Kitson, 1925) y, final-
mente, a los inventarios de intereses que empleaban procedimientos estadísticos
para reducir las respuestas de un individuo a series de cuestiones que representasen
varias actividades y trabajos.
La elaboración de inventarios de intereses se basa en una serie de presupuestos;
en primer lugar, una persona puede dar respuestas justificadas del grado de interés
(por ejemplo, agrado, indiferencia, desagrado) en actividades y trabajos familiares; y,
en segundo lugar, las actividades no familiares tienen la misma estructura factorial
que las actividades familiares, por lo tanto, las actividades y trabajos habituales pue-
den ser empleados como cuestiones de los inventarios de intereses para identificar
los intereses laborales no familiares.
La primera batería de cuestiones de intereses en actividades fue elaborada en un
seminario dado por Clarence S. Yoakum en el Instituto Carnegie de Tecnología en
1919. La batería que incluía mil cuestiones fue desarrollada empleando un enfoque
de muestreo racional diseñado para representar el área completa de interés. Con los
años se realizaron análisis estadísticos para determinar el valor de cada cuestión y
numerosos inventarios emplearon esta primera batería de cuestiones como base para
su desarrollo. Entre estos inventarios podemos citar los siguientes: el Occupational
interest inventory [Inventario de intereses laborales] de Freyd (1923), el Interest re-
port blank [Formulario de intereses] de Cowdery (1926), la General interest survey
[Encuesta general de intereses] de Kornhauser (1927), el Vocational interest blank
[Formulario de intereses vocacionales] de Strong (1927), el Purdue interest report
[Informe Purdue de intereses] de Remmers (1929), el Interest analysis blank [For-
mulario de análisis de intereses] de Hubbard (1930) y el Minnesota interest inven-
tory [Inventario de intereses de Minnesota] de Paterson y cols. (1930).
los índices de respuesta de grupos criterio y los grupos de contraste, que representan
los intereses de los individuos en general, con el objetivo de identificar las cuestiones
que distinguen significativamente las dos muestras. La Kuder occupational interest
survey [Encuesta de intereses laborales de Kuder] emplea un método empírico dis-
tinto, el cual compara directamente los patrones individuales de respuesta con los
patrones de respuesta de las muestras criterio que representan los intereses de varios
trabajos y licenciaturas.
Actor/actriz A
Observar una operación a corazón abierto A
Las páginas de deportes del periódico A
Gente abierta con nuevas ideas A aRADUDO
A
Escalas laborales
y mujeres del MEG y HEG de 1985 están equiparados en la lista de trabajos; por ejem-
plo, si la muestra del HEG incluye tres electricistas, hay el mismo número en la
de MEG. :
El siguiente paso es recoger una muestra nacional de 200 a 300 mujeres y de
200 a 300 hombres de trabajos específicos que sirvan como muestras criterio. Los
sujetos incluidos en estas muestras tienen como mínimo 25 años, han estado en el
trabajo al menos 3 años y están satisfechos con él. El porcentaje de respuesta de la
muestra criterio a cada cuestión se compara con el de la muestra de contraste del
mismo sexo para identificar las cuestiones que diferencian a las dos muestras. Nor-
malmente, se identifican de 50 a 70 cuestiones como intereses (“Me gusta”) o aver-
siones (“Me disgusta”) de cada muestra de criterio laboral. Las puntuacionbru- es
tas de un individuo realizadas en las escalas laborales se convierten en puntuaciones
normalizadas basadas en la muestra criterio, con una media igual a 50 y desviación
típica de 10.
Se ha procurado proporcionar escalas laborales por sexos en el perfil del Inven-
tario de intereses profesionales de Strong; sólo 5 de las 106 ocupaciones (207 escalas)
están representadas por una única escala (por ejemplo, ayudante de dentista —m, hi-
giénico dental —m, profesor de economía nacional —m, secretaria —m y empresa-
rio agrícola —h). Las escalas laborales están ordenadas en el perfil según su código
Holland, comenzando por los trabajos cuyo código primario es “realista” y siguien-
do con ocupaciones “investigadoras”, “artísticas”, “sociales”, “empresariales” y
“convencionales”.
Las escalas laborales por sexos se siguen elaborando dado que hombres y muje-
res presentan claras diferencias que impiden realizar escalas válidas para ambos se-
xos. Strong (1943) intentó elaborar una versión para ambos sexos sin éxito; intentos
más recientes han resultado igualmente fallidos (Hansen, 1976; Kuder, 1977; Webber
y Harmon, 1978; Campbell y Hansen, 1981). Hasta que coincidan los intereses de
hombres y mujeres, las escalas laborales por sexos proporcionarán los resultados
más válidos y una mayor amplitud de exploración de los intereses de ambos sexos.
Los Temas laborales generales (TLG) constituyen una fusión del empirismo del Zn-
ventario de intereses de Strong con la teoría de Holland de tipos vocacionales. Cada
uno de los seis temas homogéneos contiene 20 cuestiones seleccionadas para repre-
sentar los tipos de Holland (realista, investigador, artístico, social, empresarial y con-
vencional). Los TLG correlacionan ampliamente (entre 0,72 y 0,79) con las escalas
del mismo nombre del Vocational preference inventory [Inventario de preferencias
vocacionales] (Hansen, 1983). Las correlaciones entre los TLG indican que el orden
hexagonal que propone Holland para describir la relación entre sus tipos (los tipos
adyacentes tienen más en común que los diametramente opuestos) también describe
la relación entre los temas del inventario de Strong (Hansen y Campbell, 1985). Las
puntuaciones normalizadas están basadas en una muestra de referencia general com-
puesta por 300 mujeres y 300 hombres con una media de 50 y una desviación típica
de 10. La integración de la teoría de Holland con el empirismo de Strong da lugar al
marco organizativo del actual perfil Strong.
Evaluación de los intereses 907
Las escalas de intereses básicos támbién están agrupadas según los tipos de Holland
identificando el tema con el que cada escala de interés básico tiene su mayor correla-
ción. Las 23 escalas se realizaron empleando la técnica estadística del análisis de
agrupamientos numéricos para identificar las cuestiones con una alta correlación
(Campbell y cols., 1968). Las escalas de intereses básicos fueron desarrolladas para
centrarse en la evaluación de un solo factor por escala y, por consiguiente, son más
fáciles de interpretar que las escalas laborales heterogéneas que incorporan cuestio-
nes que representan varios factores de interés, además del agrado y desagrado en
cada escala. Los nombres de las escalas describen el contenido homogéneo de las
cuestiones y el rasgo de interés evaluado por cada una de ellas.
Esta prueba de intereses generales está compuesta por escalas homogéneas que eva-
lúan los intereses en diez áreas diferentes: aire libre, mecánica, cálculo, ciencia, per-
suasión, arte, literatura, música, servicio social y área administrativa. Kuder desarro-
lló inicialmente las escalas agrupando las cuestiones relacionadas por la validez de
contenido; más tarde, realizó un análisis de cuestiones con el fin de establecer grupos
de cuestiones (escalas) con elevada consistencia interna.
La prueba incluye 168 grupos de tres ítems de elección forzada con un nivel de
lectura de sexto curso. El sujeto debe comparar cada una de las tres actividades con las
otras dos y las gradúa como la más preferida (+) y menos preferida (-). Por ejemplo:
Un inventario como el Kuder, el cual más que discriminar entre individuos propor-
ciona resultados ordenados en rangos para discriminar los intereses del sujeto, tiene
unos requisitos especiales para los análisis de la fiabilidad. La fiabilidad test-retest
sólo puede evaluarse en términos de lo consistente que es el orden de las puntuacio-
nes de un sujeto de una prueba a la siguiente. Kuder y Diamond (1979) comproba-
ron la fiabilidad —a las dos semanas— de la escala laboral en estudiantes de instituto
y universidad; la media de la fiabilidad en todos los casos fue de 0,90. Zytowski
(1985), empleando 192 estudiantes universitarios, obtuvo una estabilidad del perfil
de la estimación de intereses en un intervalo de dos semanas de 0,80. Zytowski
(1985) realizó un estudio de validez predictiva con más de 800 sujetos a los que loca-
lizó después de 12-19 años de haber completado esta encuesta; un 51% de los sujetos
estaba empleado en trabajos predichos por las puntuaciones de la encuesta de intere-
ses laborales de Kuder.
910 Jo-Ida C. Hansen y J. Carlos Sierra
Criminólogo SóiNo
Camarero de un restaurante SímuiNo
Fotograbador Sí No
Domador de fieras SiphNo
La versión actual del inventario vocacional (Holland, 19854) tiene siete escalas
homogéneas, construidas a partir de una serie de pasos empírico-racionales que eva-
lúan el autocontrol, más los seis tipos de Holland (realista, artístico, investigador, so-
cial, empresarial y convencional). Otras escalas del inventario vocacional desarrolla-
das empleando métodos empíricos de construcción de escalas son las siguientes:
Evaluación de los intereses 911
aquiescencia, que evalúa la disposición a decir “sí” a las cuestiones; estatus, que indi-
ca el interés en el estatus laboral; masculinidad-feminidad, que evalúa el interés por
trabajos tradicionalmente preferidos por hombres o mujeres; e infrecuencia, que
evalúa la tendencia a contestar a las cuestiones en una dirección atípica.
El Vocational preference inventory [Inventario de preferencias vocacionales]
puede ser puntuado manualmente; las puntuaciones brutas se marcan en el perfil
masculino o en el femenino. Aunque Holland es un firme defensor del uso de pun-
tuaciones brutas para predecir la ocupación, el perfil proporciona puntuaciones nor-
malizadas. El coeficiente medio de fiabilidad test-retest de las once escalas en un in-
tervalo de dos semanas es de 0,72.
Actividad:
Arreglar aparatos eléctricos ...oiicioniononsmonmmmmnmmmnss Me gusta Me disgusta
Aptitud:
Sé programar un ordenador para
estudiar un problema CientifiCO ..ocociocnincinanincaninonas 4 No
TIA Al A AAA
E IA TR 55 No
Autoestimación:
Habilidad MAdAGICA ao as. abad ia llo danes 7654321
El nivel de lectura de esta prueba se sitúa en séptimo u octavo curso; la forma fá-
cil (E), que sólo tiene 203 cuestiones, presenta una dificultad equivalente a cuarto
curso. Las puntuaciones brutas obtenidas más altas implican la asignación al sujeto
de los códigos primario, secundario o terciario (Thorndike y cols., 1991). El coefi-
ciente de fiabilidad media de las seis escalas del Self-directed search [Registro autodi-
rigido] es de 0,82 en estudiantes de instituto en un intervalo de dos semanas y de 0,92
en un intervalo de 7 a 10 meses en estudiantes universitarios (Holland, 1978, 1979,
1985b, 1985c). Los estudios sobre la validez predictiva, tanto del Vocational prefe-
rence inventory [Inventario de preferencias vocacionales] como del Self-directed
search [Registro autodirigido), para la elección de trabajo y especialidad universita-
ria en intervalos de uno, dos y tres años varía del 35 al 66% de exactitud (Holland,
1962, 1979, 1985c, 1987; Holland y Lutz, 1968).
912 Jo-Ida C. Hansen y J.Carlos Sierra
para su uso con individuos que estaban pendientes de una inmediata entrada en una
carrera, educación universitaria o preparación técnica, y se elaboró según elInventario
de intereses profesionales de Strong. En 1982 se tomó la decisión de cambiar de escalas
laborales por sexos a las de sexo combinado. La versión mejorada publicada en 1986
(Johansson, 1986) se ha ampliado para incluir varias escalas laborales que representan
ocupaciones profesionales. La versión de 1986 incluye 370 cuestiones y el perfil, al
¡gual que el inventario de Strong; contiene tres grupos de escalas: 6 temas generales ho-
mogéneos, 25 áreas homogéneas de intereses básicos y 111 escalas laborales homogé-
neas. El inventario emplea también la teoría de Holland para organizar las áreas de in-
tereses básicos y escalas laborales en el perfil, agrupando aquellas que representan cada
uno de los tipos de Holland. Los temas generales y las áreas de intereses básicos están
ajustadas según una muestra de referencia de ambos sexos compuesta por adultos con
empleo y estudiantes, obtenida a partir de las seis áreas de intereses de Holland; 75 mu-
jeres y 75 hombres de cada uno de los seis grupos, un total de 900 sujetos, componen la
muestra. Las escalas laborales fueron elaboradas empleando el método empírico de
muestras de contraste utilizado por Strong pero, a diferencia de las de éste, se desarro-
llaron con un criterio de sexos combinados y muestras de referencia general. Muchas
de estas muestras de ambos sexos distan mucho del objetivo ideal de representar igual-
mente a hombres y mujeres dentro de la muestra (por ejemplo, no aparece ninguna
mujer mecánica aeronáutica y ningún hombre secretario). Los índices de fiabilidad se
sitúan entre 0,70 y 0,90 (Murphy y Davidshofer, 1991), y la validez de las escalas es
cuestionable por la escasa representación de los sexos.
Esta prueba, aplicable a los niveles superiores del bachiller, está formada por
139 cuestiones que permiten evaluar los intereses en ocho ocupaciones diferentes:
teórico-especulativas, técnico-aplicadas, estéticas, físico- matemáticas, biológicas,
humanísticas, terapéuticas y personales. Asimismo, permite relacionar los intereses
del sujeto con los de diferentes grupos de estudiantes varones de los últimos cursos
de 28 carreras (Alonso Tapia, 1992).
El grado en que los intereses son estables es un factor importante para la capacidad
predictiva de los inventarios. Si los intereses son inconstantes e inestables, las pun-
tuaciones obtenidas en los inventarios no explicarán la variación de la predicción. La
duración de los intereses fue una de las primeras preocupaciones de los investigado-
res de la evaluación de intereses (Strong, 1943). Los métodos longitudinales y seccio-
nales han sido empleados en multitud de estudios para documentar que los intereses
son estables, incluso en edades tempranas de 15 ó 16 años. A los 20 años, la estabili-
dad de los intereses es obvia, incluso en intervalos test-retest de 5 a 10 años; a los 25
años muestran una mayor estabilidad (Johansson y Campbell, 1971). En la larga his-
Evaluación de los intereses 915
Los inventarios de intereses son utilizados por parte de una serie de instituciones
(asesorías de institutos y universidades, agencias de servicios sociales, agencias de
empleo, firmas consultoras, corporaciones y organizaciones comunitarias...) para
evaluar con eficacia los intereses.
vi3. Investigación
VI. CONCLUSIONES
to, valores, satisfacción y habilidades. La teoría de Holland sin duda seguirá provo-
cando investigaciones en el campo. Los estudios diseñados para comprender los
abandonos y cambios educativos y laborales, analizar la satisfacción laboral, enten-
der el desarrollo de los intereses y predecir el trabajo o el éxito académico se basarán
en los constructos teóricos de Holland para las variables independientes y en los in-
ventarios de intereses para identificarlos. La exploración de los intereses vocaciona-
les ha sido siempre un tema popular en la psicología de asesoramiento; el uso cre-
ciente de inventarios y programas de guías de carreras indica que los inventarios de
intereses seguirán siendo un componente importante de la investigación psicológica.
Investigaciones más recientes intentan ir más allá de la evaluación de los intereses,
tratando de explicar el desarrollo de los mismos (Barak, Shiloh y Haushner, 1992).
REFERENCIAS BIBLIOGRÁFICAS
Holland, J. L. (1962). Some explorations of a theory of vocational choice: 1. One- and two-
year longitudinal studies. Psychological Monographs, 76. > .
Holland, J. L. (1966). The psychology of vocational choice.M- 11m. Blaisdell.
Holland, J. L. (1971). The connselor's guide to the Self-Dircued Search. Palo Alto. Consul-
ting Psychologists Press.
Holland, J. L. (1973). Making vocational choices: A theory of careers. Englewood Cliffs.
Prentice-Hall. |
Holland, J. L. (1978). Manual for the Vocational Preferen . wentory (3.2 ed.). Palo Alto.
Consulting Psychologists Press.
Holland, J. L. (1979). The Self-Directed Search Professional Manual. Palo Alto, Consulting
Psychologists Press.
Holland, J. L. (19854). (VP1) Manual-1985 Edition. Odessa. Psychological Assessment Re-
SOUrces.
Holland, J. L. (1985b). The Self-Directed Search professional manual-1985 edition. Odessa,
Psychological Assessment Resources.
Holland, J. L. (1985c). The Occnpations Finder. Odessa. Psychological Assessment Resour-
ces.
Evaluación de los intereses 919
Holland, J. L. (1987). 1987 manual supplement for the Self- Directed Search. Odessa. Psycho-
logical Assessment Resources.
Holland, J. L. y Lutz, S. W. (1968). Predicting a student's vocational choice. Personnel and
Guidance Journal, 46, 428-436.
Hubbard, R. M. (1930). Interest Analysis Blank. En D. G. Paterson, R. M. Elliott, L. D. An-
derson, H. A. Toops y E. Heidbrider (dirs.), Minnesota Mechanical Ability Test. Minneá-
polis. University of Minnesota Press.
Jackson, D. N. (1977). Jackson Vocational Interest Survey Manual. Londres. Research Psy-
chologists Press.
Johansson, C. B. (1975). Manual for the Career Assessment Inventory. Minneápolis. Natio-
nal Computer Systems.
Johansson, C. B. (1986). Career Assessment 1nventory: Enhanced Version. Minneápolis. Na-
tional Computer Systems.
Johansson, C. B. y Campbell, D. P. (1971). Stability of the Strong Vocational Interest Blank
for Men. Journal of Applied Psychology, 55, 24-26.
Johansson, C. B. y Johansson, J. C. (1978). Manual Supplement for the Career Assessment In-
ventory. Minneápolis. National Computer Systems.
Johnson, W. F., Korn, T. A. y Dunn, D. J. (1975). Comparing three methods of presenting
occupational information. Vocational Guidance Quarterly, 24, 62-65.
Kitson, H. D. (1925). The psychology of vocational adjustment. Filadelfia. Lippincott.
Kornhauser, A. W. (1927). Results from a quantitative questionnaire of likes and dislikes
used with a group of college freshmen. Journal ofApplied Psychology, 11, 85-94.
Kuder, G. F. (1939). Kuder Preference Record-Form A. Chicago. University of Chicago
Bookstore.
Kuder, G. F. (1943). Vocational Preference Record-Form B. Chicago. Science Research Asso-
ciates.
Kuder, G. F. (1948). Kuder Preference Record-Form C (Vocational). Chicago. Science Re-
search Associates.
Kuder, G. F. (1966). General Manual: Occupational Interest Survey Form-DD. Chicago.
Science Research Associates.
Kuder, G. F. (1977). Activity interests and occupational choice. Chicago. Science Research
Associates.
Kuder, G. F (1988). Kuder General Interest Survey, Form E. Chicago. Science Research As-
sociates.
Kuder, G. F. y Diamond, E. E. (1979). Kuder Occupational Interest Survey: General
Manual. Chicago. Science Research Associates.
Lamb, R. R. y Prediger, D. J. (1981). Technical Report for the unisex edition of the ACT Inte-
rest Inventory. lowa City. American College Testing Program. EP
Lunneborg, P. Y. (1976). Manual for the Vocational Interest Survey. Seattle. University of
Washington, Educational Assessment Center. 2
Lunneborg, P. W. (1981). Vocational Interest Inventory Manual. Los Angeles. Western Psy-
chological Services. .
Maola,J. y Kane, G. (1976). Comparison of computer-based versus counselor-based occupa-
tional information systems with disadvantaged vocational students. Journal of Counse-
ling Psychology, 23, 163-165.
Miller, M. J. y Cochran, J. R. (1979). Evaluating the use of technology in reporting SCII re-
sults to students. Measurement and Evaluation in Guidance, 12, 166-173.
Miner, J. B. (1922). An aid to the analysis of vocational interests. Journal of Educational Re-
search, 5, 311-323.
Murphy, K. R. y Davidshofer, C. O. (1991). Interest assessment. En K. R. Murphy y C. O.
Davidshofer (dirs.), Psychological testing. Principles and aplications. Nueva Jersey. Prenti-
ce-Hall.
920 Jo-Ida C. Hansen y ]. Carlos Sierra
LECTURAS COMPLEMENTARIAS
Aiken, L. R. (1985). Psychological testing and assessment. Boston. Allyn and Bacon.
Hansen, J. C. (1990). Interest inventories. En G. Goldstein y M. Hersen (dirs.), Handbook of
Psychological assessment (2.* ed.). Nueva York. Pergamon Press.
Kaplan, R. M. y Saccuzzo, D. P. (1993). Psychological testing. Principles, applications, and is-
sues (3.2 ed.). Belmont. Brooks/Cole Publishing.
Murphy, K. R. y Davidshoffer, C. O. (1991). Psychological testing. Principles and aplicatio-
nes. Nueva Jersey. Prentice-Hall.
Rogers, T. B. (1995). The psychological testing enterprise. An introduction. Pacific Grove.
Brooks/Cole Publishing.
y us DADO
+
El AE
Sion ER (19277 Y > mm
Seroag; E K Ajo re Les
3 De ZATAA PY
A
á
Tho? e R. M Cc iban ¡cATS
q E
E deny ¿ 311 dalt: HE a En de wi virruda e 657.5 Cuna
E 7 Pinos Adios od chusta LES re
ES s ” 1] '
he 3
a n ñ hi
Fis Y 4
iq E AMroey! Mara Lo rel
La psicología del deporte tiene una corta historia en la mayoría de los países. Esta
área de aplicación de la Psicología no obtuvo de hecho su reconocimiento oficial, a
nivel internacional, hasta el 1Congreso Mundial de Psicología del Deporte celebra-
do en Roma en el año 1965, pese a que ya existían trabajos de autores pioneros como
Rudik y Puni en la antigua Unión Soviética y Griffith en Estados Unidos, en la déca-
da de los años veinte. Estos pioneros realizaron estudios sobre dos temas fundamen-
tales: el aprendizaje de destrezas motoras y la evaluación de la personalidad de los
deportistas (Cruz, 1991).
En la evaluación de los deportistas, los autores soviéticos utilizaron fundamen-
talmente tests de personalidad, tests de inteligencia y tests psicomotores para identi-
ficar las características individuales que podían predecir el éxito deportivo. Así, a
partir de 1925, Rudik evaluaba el tiempo de reacción en el Instituto de Cultura Física
de Moscú, y Puni, en Leningrado, realizaba una investigación complementaria al es-
tudiar los efectos de la práctica de algún deporte —el esquí, en su caso— en el de-
sarrollo de la personalidad del deportista (Rudik, 1960). En Europa occidental, el es-
tudio de la personalidad de los deportistas también ocupó un lugar destacado
durante los comienzos de la psicología del deporte. Así, en Alemania, Neumann
(1957) estudió las diferencias de personalidad entre deportistas y no deportistas. En
diferentes centros de Medicina del Deporte de España e Italia también se analizaba la
dinámica de grupo en equipos deportivos y se estudiaba empíricamente la aptitud
deportiva mediante tests de papel y lápiz y de una serie de pruebas de laboratorio so-
bre tiempo de reacción, percepción, concentración y vigilancia, como se comprueba
en los trabajos de Antonelli (1964) y Roig-Ibáñez (1964). En Gran Bretaña, Kane
(1973) realizó trabajos para comparar la personalidad de deportistas con la de alum-
nos universitarios de su misma edad pero no deportistas. En Francia, Thill (1975),
partiendo del supuesto de que existe relación entre el deporte que se practica y el
tipo de personalidad, pretendía establecer unos perfiles de personalidad ideales para
cada deporte.
En Estados Unidos, Griffith (1926), a partir de observaciones y entrevistas con
deportistas profesionales y universitarios, identificó una serie de características de
los atletas de éxito como vigor, valentía, inteligencia, euforia, confianza, ajuste emo-
cional, optimismo, diligencia, lealtad y respeto por la autoridad. Posteriormente, en
1962, Ogilvie y Tutko iniciaron una serie de estudios sistemáticos sobre la personali-
dad de los nadadores olímpicos. En una revisión del tema, Ogilvie (1968) concluía
afirmando que ciertos rasgos de personalidad (autoconfianza, determinación, con-
trol emocional, liderazgo, agresividad) —semejantes a las características halladas por
su compatriota Griffith— estaban asociados a los deportistas de éxito. Para evaluar
dichos rasgos, Ogilvie y sus colaboradores desarrollaron el Athletic motivation in-
ventory [Inventario de motivación deportiva] de Tutko, Lyon y Ogilvie (1969). De
acuerdo con la teoría de rasgos, los factores o rasgos de personalidad mencionados
eran relativamente estables y muy consistentes y resultaban útiles para predecir la
conducta en todas las situaciones deportivas. Por esta razón, el Athletic motivation
inventory fue uno de los tests de personalidad deportiva más utilizados.
A partir de la década de los años setenta, se publican los primeros trabajos que
plantean una serie de problemas conceptuales, metodológicos y de interpretación de
los estudios sobre personalidad y rendimiento deportivo (véase Martens, 1975). Ade-
más, los psicólogos del deporte comprueban que diferentes estudios caracterizan a
los deportistas de éxito con diferentes rasgos de personalidad y llegan a resultados y
conclusiones contradictorias, por lo que autores como Fisher, Ryan y Martens (1976)
concluyen que los tests de personalidad, incluso aquellos que son válidos y fiables,
tienen una utilidad práctica muy limitada para predecir el rendimiento deportivo.
A partir de 1975, disminuye el número de artículos sobre evaluación de la perso-
nalidad del deportista y se sustituye progresivamente el enfoque de rasgos por un
enfoque más interaccionista, debido fundamentalmente a la influencia del libro de
Mischell (1968) Personality and assessment. Este nuevo enfoque teórico, junto con el
interés por las características cognitivas de los deportistas provocó un gran aumento
de tests específicos a la situación deportiva, tal como se comprueba en las revisiones
de Aguerri (1986), Landers, Boutcher y Wang (1986) y Vealey (1989, 1992). Los re-
sultados de estos tests se completan, en muchos casos, con una serie de medidas fi-
siológicas y con estudios de observación para obtener un perfil más completo del
deportista, entrenador o árbitro que se estudia.
tinguiremos tres procesos psicológicos básicos que se pretenden evaluar con los ins-
trumentos correspondientes al indicador cognitivo: evaluación de procesos emocio-
nales, evaluación de procesos atencionales y evaluación de procesos motivacionales.
Según esta clasificación, en los siguientes cuadros se enumeran los principales instru-
mentos, especificando el título del test o cuestionario, el autor y el año de publica-
ción. Así, en los cuadros 37.1 y 37.2 se especifican los instrumentos de evaluación de
a emocionales, distinguiendo entre ansiedad (cuadro 37.1) y activación (cua-
Odd:
Instrumento
Instrumento
Instrumento
Instrumento
Instrumento
FIGURA 37.1. Categorías de observación para evaluar la conducta de John Wooden durante
los entrenamientos
CATEGORÍAS
Instrucciones 50,3%
Intensific. esfuerzo
Modelo positivo
Modelo negativo
Elogios
Broncas
Recompensa no verbal
Censura no verbal
Bronca-Reinstrucción
Otras
No codificables
res y conductas disruptivas de alguno o algunos de sus jugadores; las segundas son
respuestas iniciadas por el entrenador, que no tienen antecedentes inmediatos ni bien
definidos en el juego del equipo. Dichas respuestas pueden estar relacionadas con el
juego o ser irrelevantes al mismo.
CUADRO 37.8. Categorías del sistema de evaluación de la conducta del entrenador (CBAS)
. Reforzamiento
El
ACIERTOS
2 . No reforzamiento
3. Ánimo al error
4. Instrucción técnica al error
REACTIVAS ERRORES 5. Castigo : 13
6. Instrucción técnica punitiva
q . Ignorar el error
El CBAS permite evaluar las interacciones psicológicas que se dan entre entrena-
dores y jugadores y analizar, mediante la ayuda de cuestionarios, los efectos de di-
chas conductas en los jugadores. Por este motivo se ha utilizado mucho con entre-
nadores de equipos infantiles y cadetes de béisbol (Smith, Smoll y Curtis, 1979), de
baloncesto (Smith y cols., 1983) y de béisbol, fútbol americano y tenis (Sherman y
Hassan, 1986). En España se han realizado diferentes estudios con el CBAS. En uno
de ellos con entrenadores de baloncesto de equipos infantiles y cadetes se evaluó la
conducta de los entrenadores y la percepción que los jugadores tenían de la con-
ducta de su entrenador (Cruz y cols., 1987). En otro estudio, se realizó una inter-
vención conductual para mejorar la actuación del entrenador y se utilizó el CBAS
para evaluar la efectividad del cambio producido en la conducta de los entrenado-
res (Ruiz y cols., 1990; Cruz, 1992). Por su parte, Rejeski, Darracott y Hutslar
(1979) han utilizado el CBAS para comparar las conductas que emiten los entrena-
dores ante los jugadores con altas expectativas de rendimiento y con bajas expecra-
tivas de rendimiento.
Otros instrumentos importantes de evaluación de la conducta del entrenador y
de sus jugadores, que también pueden utilizarse con profesores de educación física
y sus alumnos, son los de Rushall (1977), Quaterman (1980) y Crossman (1981),
que el lector interesado puede hallar descritos en Darst, Zakrajsek y Mancini
(1989).
Evaluación en psicología del deporte 933
Las técnicas utilizadas en psicología del deporte para el registro del indicador fisio-
lógico-bioquímico (F-B) no difieren esencialmente de las que se usan habitualmente
en otros ámbitos de la psicología, o incluso de las utilizadas en medicina del deporte.
Lo interesante es determinar la información relevante que le puede proporcionar al
psicólogo el registro de este indicador. En general, el parámetro fisiológico o bioquí-
mico que se analiza se considera como variable dependiente, en un intento de eva-
luar el reflejo de la influencia de factores psicológicos que, a veces, son manipulables.
Principalmente, el indicador F-B proporciona dos tipos de información interesantes
para el psicólogo del deporte:
Análisis de la sudoración
También existen métodos directos para analizar la actividad de las glándulas sudorí-
paras, normalmente basados en el recuento del número de glándulas activas en mo-
mentos puntuales. Una técnica de uso sencillo y factible en situaciones deportivas
consiste en aplicar una capa delgada de parafina en la yema del dedo que, una vez so-
lidificada por el contacto con el aire, se puede recoger con una cinta adhesiva trans-
parente. Luego, esta cinta se visiona en un microscopio detectándose perfectamente
las glándulas sudoríparas abiertas (activas) en un área concreta. A partir de esta téc-
nica es posible realizar comparaciones intrasujeto contabilizando, mediante una
cuadrícula incorporada en el microscopio, el número de glándulas activas en una
misma zona. Como reflejo de la activación simpática, la actividad de las glándulas
sudoríparas puede ser un índice de activación general del deportista en situaciones
de reposo, pudiéndose relacionar con aspectos emocionales. En situaciones de acti-
938 Jaume Cruz y Lluís Capdevila
vidad física, es difícil establecer esta relación, ya que el factor principal que determi-
nará la abertura de las glándulas será el esfuerzo fisiológico realizado. En este senti-
do, tal vez la técnica pueda ser un índice del nivel de esfuerzo realizado en una deter-
minada situación deportiva.
No obstante, existe algún trabajo que ha utilizado el análisis de lactato para estu-
diar el comportamiento de ésta y de otras variables psicobiológicas en relación con
aspectos conductuales de la competición deportiva (Sanchís y cols., 1991). En situa-
ciones deportivas son escasos los estudios con un control experimental adecuado
que muestren la relación entre factores psicológicos y niveles de lactato sanguíneo.
No obstante, en situaciones de reposo se ha analizado la posibilidad de modificar el
940 Jaume Cruz y Lluís Capdevila
Las hormonas juegan un papel importante en los procesos fisiológicos y en las adap-
taciones metabólicas que tienen lugar durante la actividad física. Igual que en el aná-
lisis de lactatos, su forma de registro más habitual parte de la extracción de una
muestra de sangre capilar antes o después de cada período de esfuerzo. En el ámbito
de la psicofisiología, y también en el de la psicología del deporte, va en aumento la
atención prestada a los factores endocrinos, partiendo de la base de que muchosde
ellos son sensibles a diferentes tipos y niveles de estrés, incluido el estrés competiti-
vo. Así por ejemplo, se ha estudiado la reacción de hormonas como la testosterona,
el cortisol y la prolactina en diferentes situaciones deportivas con distintos niveles de
estrés, encontrándose cambios en los niveles hormonales en relación a la situación
(Salvador, 1992).
A partir de los aspectos tratados en los diferentes apartados de este capítulo, a modo
de conclusión, resumiremos la evolución de las técnicas de evaluación en psicología
del deporte, así como aquellos aspectos psicológicos que se deberían tener en cuenta
en la utilización de dichas técnicas.
En primer lugar, estamos de acuerdo con Vealey (1992) cuando concluye que los
primeros estudios de evaluación en psicología del deporte trataron de obtener perfi-
les de rasgos de personalidad de diferentes grupos de deportistas y de no deportistas
y estudiar la relación entre diferentes rasgos de personalidad y diferentes conductas
deportivas, especialmente, el rendimiento. En estos estudios se utilizaron tests gene-
rales como el Minnesota multiphasic personality inventory (MMP1) de Hathaway y
McKiunley (1943) o el 16 Personality factor questionnaire (16PF) de Cattell para com-
parar los perfiles de personalidad de diferentes grupos de deportistas o de un grupo
de deportistas respecto a la población normal (véase Vanek y Cratty, 1970; Morgan,
1980b). La conclusión general de estos estudios es que no hay ningún perfil de per-
sonalidad que diferencie a los deportistas de los no deportistas y que los rasgos de
personalidad no son unos buenos predictores del éxito deportivo (Fisher, Ryan y
Martens, 1976; Gill, 1986). Morgan (1980c), uno de los más acérrimos defensores de
los tests de personalidad en psicología del deporte, concluye su trabajo señalando
que los resultados de los tests de rasgos de personalidad se deben utilizar, de forma
complementaria, con otro tipo de datos como los estados de personalidad, las cogni-
ciones y las medidas fisiológicas para predecir el éxito deportivo.
Ante el fracaso de los tests de personalidad para predecir el éxito deportivo, los
psicólogos del deporte se han dado cuenta cada vez más de la importancia de nume-
rosos factores situacionales como por ejemplo los sistemas de entrenamiento, las
Evaluación en psicología del deporte 941
nes de observación para lograr unos datos válidos, ya que las conductas de los en-
trenadores difieren a veces entre los partidos y los entrenamientos, como han encon-
trado Horn (1985) y Wandzilack, Ansorge y Potter (1988), o entre diferentes activi-
dades de los entrenamientos, como han señalado Lacy y Darst (1985).
Además de la fiabilidad y la validez de los instrumentos de observación, habría
que tener también en cuenta la sensibilidad de los mismos para distinguir lascatego-
rías que producen mayor impacto en los jugadores o alumnos de educación física.
Así por ejemplo, los estudios de Horn (1987) y Chaumeton y Duda (1988) muestran
que no es tanto la frecuencia de reforzamiento por parte de los entrenadores como la
cualidad del mismo (contingencia, especificidad...) lo que resulta crucial para el ren-
dimiento y la motivación del deportista. Sin embargo, muy pocos instrumentos de
observación han incorporado dicha categoría a sus hojas de registro. En definitiva, la
validez y fiabilidad de los resultados del indicador conductual en el entorno depor-
tivo dependerán del instrumento de registro elegido y el entrenamiento de los obser-
vadores en el mismo, del procedimiento utilizado para planificar las sesiones de ob-
servación y de la sensibilidad del instrumento para evaluar las conductas que
resultan más relevantes en la situación estudiada.
La utilización, todavía minoritaria, del indicador fisiológico-bioquímico supone
retomar una línea de evaluación que ya habían desarrollado los psicólogos del de-
porte en Europa del Este (Vanek y Cratty, 1970). En la mayor parte de los estudios
publicados donde se registran variables psicofisiológicas o bioquímicas se efectúa el
análisis según valores medios en períodos de tiempo concretos, siendo pocos los es-
tudios que consideren tales variables de forma continua en el tiempo. Mediante la
evaluación continua en el tiempo del indicador fisiológico-biológico se pueden ob-
tener los siguientes tipos de información —que pasarían desapercibidos al reducir
los datos a un único valor medio: nivel de la variable en momentos puntuales de la si-
tuación estudiada, patrones individuales de conducta y nivel de actividad física a lo
largo de la situación, que refleja la conducta del deportista (Capdevila, 1989b).
En la investigación dentro del ámbito de la psicología del deporte es frecuente la
evaluación a partir de diseños de grupo. Del conjunto de estudios de este tipo publi-
cados sobre los factores psicológicos involucrados en la competición deportiva, se
puede deducir que no está nada clara la efectividad del entrenamiento psicológico
para potenciar el rendimiento deportivo. Ello es debido a que muy a menudo las re-
laciones de causa/efecto que se pretenden y los efectos obtenidos con las interven-
ciones no son consistentes o no se pueden traducir en ninguna aplicación práctica.
En nuestra opinión, esto se debe principalmente a dos motivos; por un lado, el uso
abusivo que se hace de los coeficientes de correlación o de regresión, sobre todo al
intentar relacionar diferentes indicadores y, por otro lado, a la poca representativi-
dad de los individuos en los diseños de grupo. Así pues, puede que el problema no
esté en la eficacia en sí misma de la intervención psicológica, sino en la evaluación
conductual que se efectúa del rendimiento del deportista. Así, creemos que el punto
de vista más adecuado es considerar la conducta de rendimiento deportivo de forma
continua, como un proceso implícito en la competición —y no como un resultado
final de la competición— (Capdevila, 19894). Este proceso puede ser evaluado a par-
tir de técnicas estadísticas como el análisis de series temporales (Capdevila, Cruz y
Viladrich, 1992).
Evaluación en psicología del deporte 943
A partir de los aspectos comentados, se deduce que una buena estrategia meto-
dológica a considerar en la evaluación de la conducta deportiva, es complementar el
uso del indicador cognitivo con una mayor utilización de los indicadores conduc-
tual y fisiológico-biológico. En euanto a los diseños de investigación en psicología
del deporte, se recomienda un empleo más generalizado de los diseños de caso úni-
co, tal como ya se observa en un número creciente de estudios empíricos y de publi-
a teóricas que recomiendan su uso (Zaichkowsky, 1980; Bryan, 1987; Smith,
REFERENCIAS BIBLIOGRÁFICAS
Aguerri, P. (1986). The development of sports psychology as seen through the analysis of the
first fifteen years of the “Journal”. International Journal of Sport Psychology, 17, 87-99.
Anguera, M. T. (dir.) (1991). Metodología observacional en la investigación psicológica. Bar-
celona. PPU.
Anshel, M. H. (1987). Psychological inventories used in sport psychology research. The
Sport Psychologist, 1, 331-349.
Antonelli, E. (1964). La valutazione psicologica dell'atleta. Roma. Scientiche Leonardo.
Bakeman, R. y Gottman, J. M. (1986). Observing interaction: An introduction to sequential
analysis. Cambridge. Press Syndicate of the University of Cambridge.
Benson, H. (1975). The relaxation response. Nueva York. William Morrow.
Benson, H. y Wallace, R. K. (1972). Decreased drug abuse with transcendental meditation-a
study of 1862 subjects. En C. J. D. Zarafonetis (dir.), Drug abuse-proceedings of the Inter-
national Conference. Filadelfia. Lea and Febiger.
Bryan, A. J. (1987). Single-subject designs for evaluation of sport psychology interventions.
The Sport Psychologist, 1, 283-292.
Capdevila, L. (19894). Efectos del entrenamiento psicológico sobre el estrés de competición y
sobre la eficiencia cardiorrespiratoria en atletas mediofondistas. Tesis doctoral inédita.
Universidad Autónoma de Barcelona.
Capdevila, L. (19895). Evaluación de la eficacia del entrenamiento psicológico. En Actas de
las V Jornadas de la ACPE. Esplugues de Llobregat. ACPE.
Capdevila, L. y Cruz, L. (1992). Análisis de series temporales aplicado al estudio de la emo-
ción y de la conducta en un atleta. Revista de Psicología General y Aplicada, 45, 103-111.
Capdevila, L., Cruz,J.y Viladrich, C. (1992). Conducta deportiva en diseños de grupo: análi-
sis de series temporales. Revista de Psicología General y Aplicada, 45, 453-460.
Carrobles, J. A. (1981). Registros psicofisiológicos. En R. Fernández-Ballesteros y J. A. Ca-
rrobles (dirs.), Evaluación conductual. Madrid. Pirámide.
Carrobles,J.A. y Godoy,J.(1987). Biofeedback. Barcelona. Martínez Roca.
Chaumeton, N. y Duda,J.(1988). It is how you play the game or whether you win or lose?
The effect of competitive level and situation on coaching behaviors. Journal of Sport Be-
havior, 11, 157-174.
Cheffers, J. T. y Mancini, V. H. (1989). Cheffers” Adaptation of the Flanders” interaction
Analysis System (CAFIAS). En P. W. Darst, D. B. Zakrajsek y V. H. Mancini (dirs.),
Analysing physical education and sport instruction. Champaign. Human Kinetics.
Crocker, P. R. E., Alderman, R. B. y Smith, F. M. R. (1988). Cognitive-affective stress mana-
944 Jaume Cruz y Lluís Capdevila
gement training with high performance youth volleyball players: Effects on affect, cogni-
tion and performance. Journal of Sport and Exercise Psychology, 10, 448-460,
Crossman, ]. E. (1981). The objective and systematic categorization of athlete and coach be-
havior using two observational codes. Journal of Sport Behavior, 8, 195-208. A
Cruz, J. (1991). Historia de la psicología del deporte. En J. Cruz y J. Riera (dirs.), Psicología
del deporte: aplicaciones y perspectivas. Barcelona. Martínez Roca. ette
Cruz, J. (1992). Evaluación de las interacciones entre entrenadores y deportistas jóvenes y ase-
soramiento conductual a entrenadores. Comunicación presentada en el 1Congreso Inter-
nacional sobre el Conductismo y las Ciencias de la Conducta. Guadalajara, México.
Cruz, J., Bou, A., Ferrández, J. M., Martín, M., Monras, J.. Monfort, N. y Ruiz, A. (1987).
Evaluació conductual de les interaccions entre entrenadors i jugadors de basquet escolar.
Apunts. Medicina de Esport, 24, 89-98.
Cuadras, A. y Cruz, J. (1988). Analisi de la freqiiencia cardíaca pre-partit en una parella d'ar-
bitres de basquet. Apunts. Medicina de Esport. 25, 201-207. :
Darst, P. W., Langsdorf, E., Richardson, D. E. y Krahenbubhl, G. S. (1981). Analyzimg coa-
ching behavior and practice time. Motor Skills. Theory into Practice, 5, 13-22.
Darst, P. W., Mancini, V. H. y Zakrajsek, D. B. (1983). Systematic observation instrumenta-
tion for physical education. Champaign. Leisure Press.
Darst, P. W., Zakrajsek, D. B. y Mancini, V. H. (1989). Analysing physical education and
sport instruction (2* ed.). Champaign. Human Kinetics.
Fernández-Ballesteros, R. y Carrobles, J. A. (1981). Evaluación conductual. Madrid. Pirá-
mide.
Fisher, A. C., Ryan, E. D. y Martens, R. (1976). Current status and directions of personality
research related to motor behavior and sport: Three panelists” views. En A. C. Fisher
(dir.), Psychology of sport. Palo Alto. Maytield.
Flanders, N. A. (1965). Teacher influence, pupil attitudes and achievement. (Cooperative re-
search monograph 12). Washington. US Office of Education.
Galilea, P. A., Riera, J. y Ruiz, O. (1992). Aplicación de la medición del lactato sanguíneo en
la práctica deportiva. LAB2000, 40, 5-8.
Gill, D. (1986). Psychological dynamics of sport. Champaign. Human Kinetics.
Godbout, P., Brunelle, J. y Tousignant, M. (1983). Academic learning time in elementary and
secondary physical education classes. Research Quarterly for Exercise and Sport, 54, 11-19.
Griffith, C. R. (1926). Psychology of coaching. Nueva York. Scribners.
Hackfort, D. y Schwenkmezger, P. (1989). Measuring anxiety in sports: perspectives and
problems. En D. Hackfort y C. D. Spielberger (dirs.), Anxiety in sports: An international
perspective. Nueva York. Hemisphere P.C.
Hanson, D. L. (1967). Cardiac response to participation in little league baseball competition
as determined by telemetry. The Research Quarterly, 38, 384-388.
Hathaway, J. R. y McKinley, J. C. (1943). MMPI Manual. Nueva York. Psychological Corpo-
ration.
Horn, T. (1985). Coaches” feedback and changes in children's percepcions of their physical
competence. Journal ofEducational Psychology, 77, 174-186.
Horn, T. (1987). The influence of teacher-coach behavior on the psychological development
of children. En D. Gould y M. Weiss (dirs.), Advances in pediatric sport sciences. Cham-
paign. Human Kinetics.
Husman, B. F., Hanson, D. y Walker, R. (1970). The effect of coaching basketball and swim-
ming upon emotion as measured by telemetry. En G. J. Kenyon (dir.), Contemporary
psychology of sport. Chicago. Athletic Institute.
Kane, J. E. (1973). Personality, body concept and performance. En]. E. Kane (dir.), Psycholo-
gical aspects ofphysical education and sport. Londres. Routledge and Kegan Paul.
Lacy, A. C. y Darst, P. W. (1985). Systematic observation of behaviors of winning high
school head football coaches. Journal of Teaching in Physical Education, 4, 256-270.
Evaluación en psicología del deporte 945
LECTURAS COMPLEMENTARIAS
¿PONE
O
4 E f
AA
Y ELA ds
e
> “3 1, db crrroajó 4
9543 O A lr a di
| nd ddr: dy retegreh, Tgialla
Jr TAO! bw MM Y, 2D) ha do W 4
v Í
' +4 114
'
6 MER
e E
o
38. EVALUACIÓN EN TRÁFICO Y SEGURIDAD VIAL
HÉCTOR MONTERDE
Los problemas derivados de la utilización de vehículos automóviles por las vías pú-
blicas están suponiendo un costo social alarmante en los últimos años, que se centra
en los accidentes y su prevención. Hasta el punto de que los gobiernos de todos los
países desarrollados están dedicando grandes esfuerzos y volúmenes de su presu-
puesto a encontrar e introducir medidas para reducir las tasas de accidentes y sus
costes económicos. Según la revista Tráfico (mayo de 1989), editada por la Dirección
General de Tráfico, los costes sociales directos e indirectos de los accidentes en Espa-
ña durante el año 1987 supusieron un billón de pesetas.
De los tres grandes factores a los que se atribuye la causalidad de los accidentes,
vehículo, vía y conductor, tradicionalmente las medidas adoptadas han incidido en
los dos primeros, produciéndose un gran desarrollo de la investigación en ellos, tra-
ducido en mejoras técnicas provenientes del campo de la ingeniería (estructura y di-
seño de vehículos, sistemas de seguridad pasiva, ergonomía, trazado de vías, vallas,
señalización, etcétera).
Con respecto a los vehículos, aunque algunos de los medios de reciente apari-
ción (ABS, airbag, tracción integral...) se ofrecen aún como opciones a precios (ya no
tan) prohibitivos o son elementos de serie en vehículos de alto standing de poca ad-
quisición popular, no se puede negar que los automóviles de hoy en general, y hasta
los más baratos, incluyen en su diseño elementos de seguridad que, comparados con
los automóviles fabricados hace quince años, ofrecen una seguridad pasiva y activa
elogiable. Hasta el punto de que todo automóvil que sale de las factorías actuales
Universidad de Valencia.
950 Héctor Monterde
una revisión, bien por el considerable período de tiempo en que han estado vigentes
o aceptados, bien por la cantidad de discusión y literatura científica que han provo-
cado en su defensa y en su crítica. El primer modelo, al que ya se ha hecho alguna re-
ferencia, lo constituye el modelo que aquí denominaremos de habilidades psicofísi-
cas, aunque distintos autores lo han referido con diferentes nombres (habilidades,
exigencia de tareas...), y que también puede ser denominado modelo aptitudinal, por
referencia a la psicología de las aptitudes, base conceptual, sobre la que se asienta y
que dominó la psicología en el período histórico en el que se desarrolló. Los otros
modelos, más recientes, han sido presentados por sus autores como teorías, de carác-
ter general; uno de ellos está basado en la teoría del aprendizaje, que también domi-
nó otro período del desarrollo de la psicología, y los otros dos cognitivo-motivacio-
nales, base conceptual de reciente dominio en la psicología.
ción como una tarea de autocontrol, en la que el conductor mismo es capaz de ajus-
tar su dificultad, que empieza a ganar popularidad a partir de la década de los años
sesenta y setenta (Summala, 1988). Desde entonces, el número de críticas que ha su-
frido este modelo ha ido en aumento, hasta el punto de que, en ausencia de una ac-
tualización científica o desarrollo conveniente, ha sido abandonado por la mayoría
de los investigadores. Sin embargo, hay que reconocer que los conceptos de “habili-
dad” y “propensión al accidente” tienen aún fuertes influencias sobre la idea de se-
guridad de los conductores (Svenson, 1981; Sivack y Soler, 1987) y están presentes en
las decisiones tanto individuales como sociales (Summala, 1988; Real Decreto
2272/1985). En el fondo es innegable que el nivel de destreza del conductor, que
puede hoy ser entendido no ya como un rasgo o dotación natural en el individuo
para el aprendizaje de la conducción (deficiencia del modelo clásico) sino como una
habilidad aprendida y por tanto susceptible de ser modificada o reeducada, juegue
algún papel como lo demuestra la necesidad de formación y entrenamiento de los
conductores. El examen actualmente legislado en España es reflejo de este modelo.
Estímulo neutro
(EN)
curva al frente sin visibilidad
Curva suave
(velocidad adecuada)
Estímulo condicionado
de segundo orden
(EC,)
curva cerrada
Respuesta de
evitación anticipada
(REA)
reducción a velocidad
adecuada
Estímulo condicionado
de primer orden
(Ec,)
comienzo ruedas a derrapar
Respuesta de
evitación diferida
(RED)
maniobra corrección
derrape
Estímulo incondicionado
(El)
salida calzada
de ésta puede producir efectos contrarios a los deseados con ello (pensemos que sl
se nos pudiera informar —en función de la marca, modelo y extras de nuestro ve-
hículo—, en cada curva, el momento en que hemos de empezar a reducir y Cuánto,
muy posiblemente en la mayoría de las ocasiones no lo haríamos antes, ni más de
lo indicado). Estas derivaciones del modelo de Fuller le otorgan una consideración
de predicción negativa o fatalista en la seguridad vial, y en concreto a las medidas
tendentes a incrementarla.
ción al tráfico) que está dispuesto a aceptar, nivel que estará determinado por aspec-
tos motivacionales, de los costos y beneficios percibidos para cada una de las posi-
bles alternativas de respuesta.
La teoría homeostática de riesgo, apoyándose en el principio de compensación,
mantiene que cualquier conductor tiene en todo momento un determinado nivel
preferido, aceptado, tolerado, deseado, etc. de riesgo de accidente (Wilde, 19884), el
cual intenta mantener ajustando su conducta (Janssen y Tenkink, 19884). Por tanto,
los accidentes son el resultado de esa conducta con la que se intenta equilibrar dicho
nivel de riesgo aceptado (y buscado) contra el riesgo percibido (Adams, 1988). Así,
después de introducir en el sistema de tráfico una medida no motivacional de la cual
se espera que afecte al nivel de riesgo prevalente (mejoras en el diseño de los vehícu-
los, carreteras...), el riesgo de accidente tornará finalmente al nivel inicial aceptado
(Janssen y Tenkink, 19884). La riqueza sugerente de este modelo es eclipsada por el
pesimismo impotente de su aplicación práctica.
vacionales. Deficiencia del modelo clásico frente al cual han surgido los modelos ac-
tuales, que se apoyan sobre bases motivacionales. Sin embargo, estos nuevos mode-
los alternativos a la posición clásica dejan de lado los aspectos psicofísicos, la adqui-
sición y papel de las habilidades motoras, sobre los que es innegable algún grado de
influencia. El modelo de habilidades, por dejar fuera los aspectos actitudinales y mo-
tivacionales, y los modelos motivacionales, por dejar fuera los psicofísicos, enten-
diendo que éstos también son aprendidos, resultan desde esta perspectiva incomple-
tos. Sin embargo, no hay que olvidar que el modelo de habilidades es el modelo que
más tiempo ha estado vigente —en la actualidad aún lo sigue estando—, que más ha
influido en la idea popular de seguridad tanto de los individuos como de las respecti-
vas administraciones de los Estados desarrollados, y, aún más, que más resultados
positivos ha dado. Prácticamente la totalidad de las medidas adoptadas, en el pasado
y en el presente, para prevenir la accidentalidad (mejora de vías, diseño de vehículos
para aumentar su seguridad pasiva y su facilidad de manejo) siguen y derivan de la
aplicación de este modelo. El desarrollo de la estructura instruccional/formativa
(educación vial, autoescuelas, exámenes de teoría y práctica de la conducción...) y de
la exploración médico-psicológica (con la derivación de restricciones en función del
estado psicofísico del conductor), en ambas facetas como condición previa a la con-
cesión del permiso de conducir, que caracterizan al Estado español frente a otros
países en los que la importancia concedida a estos aspectos ha sido menor, también
siguen y se derivan de este modelo.
Si el viejo modelo de aptitudes dejó de lado los aspectos actitudinales, los poste-
riores modelos alternativos, considerados como motivacionales, dejan de lado los
aspectos psicofísicos, la adquisición y el papel de las habilidades motoras, que desde
una perspectiva más actual también pueden considerarse como aprendidas, y por
tanto modificables, susceptibles de cambio, lo que permitiría una actualización del
modelo tradicional, revisando y desplazando los conceptos de aptitud y de propen-
sión al accidente, y recuperando el papel del entrenamiento, ya no sólo limitado a las
habilidades motoras sino ampliándose también a las cognitivas y sociales intervi-
nientes en la conducción.
te), lo que constituye una contradicción que afectaría, entre Otras cosas, a la hora de
decidir una señalización. Por otra parte, la presencia del riesgo de/o accidente como
EL, dentro del condicionamiento de evitación, es criticada, pues los conductores ra-
ramente lo experimentan (McKenna, 1982; Summala, 1988), planteando dificultades
a la identificación de un proceso cierto de condicionamiento de evitación en la situa-
ción de conducción. Fuller (1984, 1986) realiza una formulación bien desarrollada de
este aprendizaje de evitación y del paradigma del condicionamiento de evitación en
la conducción (Summala, 1988), si es que tiene lugar, pero ¿ocurre siempre?, ¿es sufi-
ciente para explicar toda la conducta del conductor?
El modelo homeostático de Wilde es, como se dijo, el que parece que más polémica
ha desatado, polémica que se mantiene en la actualidad en gran parte de los trabajos.
Las pruebas y críticas al modelo homeostático de Wilde se centran en el “principio
de compensación”. A su favor, existe evidencia de que fenómenos de compensación
se dan en la vida diaria. La existencia de este fenómeno ha sido comprobada experi-
mentalmente, en determinadas situaciones y procesos, como consecuencia de la in-
troducción de medidas técnicas (ingeniería) de seguridad. Así, han sido aportados
datos en el sentido de que en los parques y zonas de juegos infantiles diseñados bajo
criterios de seguridad ocurren más accidentes que en aquellos que no han sido dota-
dos de medidas específicas de seguridad (Ward, 1961; Hurtwood, 1968; Major, 1986;
Adams, 1988). Adams (1985; 1988) aporta el dato de que cuando en Suecia se pasó
de la conducción por la vía izquierda a hacerlo por la derecha, el número de acciden-
tes fatales descendió al 40% de su nivel “normal”; Adams (1985b) aporta datos acer-
ca de los efectos compensatorios producidos por la introducción de la obligación del
uso del cinturón de seguridad. La introducción de la obligatoriedad del casco en los
motoristas y el posible aumento de las velocidades sería otro dato en favor de este fe-
nómeno. Otros argumentos favorables se refieren a numerosas anécdotas, comenta-
das por los ingenieros responsables del tráfico sobre tramos de carretera que la gente
local considera peligrosos pero los cuales son estadísticamente “seguros”, con una
frecuencia de accidentes baja (Adams, 1988). No obstante, estos hechos u otros que
demuestren la existencia de fenómenos de compensación, no son suficientes para
que sea aceptada su ocurrencia con carácter generalizado y completo. Ello ha levan-
tado numerosas críticas (y lógicamente bastantes reservas y algunos recelos), situán-
dolo en un estado de indeterminación e insatisfacción, del que no parece terminar de
salir (Shannon, 1986; Janssen y Tenkink, 19884; Adams, 1988). El problema funda-
mental que plantea este modelo hace referencia a su aplicabilidad práctica, pues nie-
ga el efecto de cualquier medida técnica de seguridad (en el sentido de ingeniería) in-
troducida en el sistema tráfico, pues el nivel de riesgo tornará a su estado inicial
aceptado (el que cada conductor, cada sociedad, está dispuesto y “quiere” aceptar).
Según este modelo, las vías, la señalización, la seguridad pasiva de los vehículos no
deberían ser mejorados, puesto que no sólo no disminuirán la frecuencia de acciden-
tes, por los efectos compensatorios, sino que incluso su balance será negativo, bien
por aumentar la aceptación de riesgo (en ése o, por migración de efectos, en otro
Evaluación en tráfico y seguridad vial 963
campo de la conducta humana), bien, caso de mantenerse igual, por los altos costes
adicionales que representan para obtener el mismo resultado, lo que constituye un
gran obstáculo para la aceptación y puesta en práctica del modelo.
El fenómeno de compensación, que parece ser generalmente aceptado, es objeto
también de muchas matizaciones y objeciones. Unas reducen el fenómeno a deter-
minadas condiciones o situaciones. Así, Fuller (1986) señala que sólo en ciertas con-
diciones puede ser esperada la actividad compensatoria, especialmente en aquellos
casos en que la aceptación de riesgo es intrínsecamente recompensante. Brown
(1980) y Summala (1988) consideran inconcebible que los conductores deseen ope-
rar continuamente bajo el estrés emocional que implica la aceptación del riesgo, re-
duciendo la aceptación (cuando se da) a algún grado de incertidumbre o temor a al-
gunas circunstancias en las que se esté bajo una alta presión motivacional o a algunas
personas, especialmente jóvenes, que pueden incluso “buscar” riesgo (Summala,
1986). Otras objetan el desarrollo completo del proceso de homeostasis; es el caso de
Janssen y Tenkink (19884), quienes defienden que el proceso de compensación no
tiene por qué ser necesariamente completo, con lo que, admitiendo la existencia del
fenómeno, dejan libre la posibilidad de lograr efectos positivos a las medidas técni-
cas de seguridad introducidas, verdadero escollo del modelo de Wilde. En esta línea,
Evans (19854), después de revisar meticulosamente los hallazgos relevantes, concluye
que toda estimación de la futura efectividad de una medida de seguridad debe conte-
ner alguna asunción en relación a los efectos interactivos (por ejemplo, compensato-
rios), pero los esfuerzos futuros de investigación deberían ser dirigidos a averiguar
qué grado de compensación puede ser esperado que ocurra bajo estas condiciones
(que puede no siempre darse o darse en distinta forma), para prever sus efectos. Por
otra parte, al único tipo de medidas de intervención que Wilde reconoce efectos po-
sitivos, medidas de carácter motivacional, Huguenin (1988) contesta que el incre-
mento de seguridad conseguido interviniendo a nivel motivacional (por ejemplo,
aumentando el deseo de seguridad y el valor de la vida futura [Wilde, 1987]) no está
exento, por las mismas razones que en el caso de las medidas técnicas (ingeniería), de
compensación, añadiendo que las medidas técnicas también implican aspectos moti-
vacionales, por lo que una estricta disociación entre los dos tipos de soluciones no es
posible en ninguna forma. Otras críticas se dirigen a la circularidad que presenta el
modelo, a lo que Adams (19884) contesta diciendo que hasta el modelo de conducta
de Skinner (1971) la presenta en su definición y efecto del refuerzo. Otras críticas 1n-
tentan atribuir la aceptación de riesgo, que reconocen como motivación, a Otras cau-
sas. Así, Janssen y Tenkink (19884) afirman que es más apropiado pensar en algún ni-
vel aceptado de riesgo como producto de un proceso de maximización de la utilidad
(beneficio) en lugar de una variable control independiente. En definitiva, s1 se han
encontrado pruebas experimentales a favor de la existencia de procesos de compen-
sación, no menos experimental han sido las presentadas en contra del carácter gene-
ral de este modelo (McKenna, 1985a, 1985b, 1985c; Shannon, 1986). Para avalar es-
tos últimos comentarios con una referencia a aspectos metodológicos, cabe señalar,
además de las muchas críticas realizadas, que no menos problemático y sutil resulta
el concepto de migración de efectos, que constituye para los defensores de este mo-
delo (versus teoría) una “salida de escape” difícilmente contrastable, cuando aparen-
temente no se observan fenómenos compensatorios después de introducir una me-
964 Héctor Monterde
Desde una perspectiva general, los modelos actualmente propuestos de carácter mo-
tivacional, dejando aparte el de habilidades cuyo principio de “propensión al acci-
Evaluación en tráfico y seguridad vial 965
cluso de forma contradictoria (Van der Molen y Bótticher, 1988). El grado de especi-
ficación y definición operativa de los tres modelos deja mucho que desear, problema
que hace difícil el tratamiento científico, y por lo tanto su verificación empírica, así
como su aplicación práctica en forma de medidas concretas.
En conclusión, y como cuarto problema, habría que decir que los modelos hasta
el momento presentados con carácter de teorías, estando basados en principios com-
probados y aportando interesantes sugerencias, fallan precisamente en que no cum-
plen su carácter pretendido de teoría. Así, Huguenin (1988), haciendo un balance,
concluye que el concepto de propensión al accidente ha sido considerado anticuado,
la homeostasis de riesgo es también problemática y aplicable a un dominio muy li-
mitado, las teorías del aprendizaje explican los procesos de formación de la conducta
en el sistema-tráfico, pero no están cualificadas para predecir acciones específicas
que tienen lugar fuera de los modelos de conducta aprendidos; otros modelos deben
ser considerados pero explican sólo ciertos aspectos, etc. Es decir, todos los modelos
existentes, sin negar su base experimental y su aportación al estudio de la conducta
del conductor en aspectos concretos, resultan incompletos para explicar la conducta
humana (del conductor y del peatón) en el sistema tráfico en general. Son capaces de
explicar algunos fenómenos y bajo determinadas circunstancias, pero no todos los
fenómenos conocidos bajo todas las circunstancias conocidas hoy, en relación al fac-
tor humano y a la toma de decisiones en situaciones de tráfico. Los modelos pro-
puestos fallan precisamente en su pretensión de ser teorías, y, por lo tanto, en la pre-
dicción. En el campo de la psicología del tráfico, como afirma de forma optimista
Huguenin (1988), son pocas las teorías que permiten la predicción de la conducta del
conductor en general. Tal vez el problema sea que es demasiado pronto para estable-
cer teorías (modelos generales) de la conducta al volante. Sin pretender quitar mérito
a los intentos realizados y aceptando algunos de los principios básicos sobre los que
los modelos han sido construidos y a los que han servido para aportar evidencia
experimental, que a partir de ahora habrá que considerar, tal vez falten aún más estudios
parciales que dirijan la investigación hacia el conocimiento de aspectos concretos,
camino en el que los estudios realizados para desarrollar los modelos comentados
han de ser considerados como pioneros, para algún día, quizá, estar en condiciones
de pasar a la elaboración de una teoría explicativa de la conducta al volante y de las
relaciones en el sistema tráfico, si es que existe, en los que la percepción de riesgo
y los procesos de toma de decisiones deben jugar un importante papel, aún no escla-
recido.
Para terminar este apartado, hay que reconocer que, a pesar de estos problemas,
el mérito de estos modelos alternativos al clásico lo constituye el hecho de que se
plantean desde el punto de vista del conductor, como procesador de información,
tomador de decisiones y, en definitiva, responsable de la situación de riesgo, con un
papel activo, de autocontrol, que no le otorgaba el modelo de habilidades (o aptitu-
dinal) clásico. Así, frente al modelo clásico, constituyen importantes intentos por in-
corporar y conceder protagonismo a los aspectos motivacionales y cognitivos, cuya
importancia vienen poniendo de manifiesto la psicología y la investigación actuales.
Evaluación en tráfico y seguridad vial 967
(aunque limitada sólo a los permisos profesionales: B-2, CA, C-2,D y E), posibili-
tando la creación de unos centros específicos para realizar dichas exploraciones. Es-
tos centros, denominados Centros de Reconocimiento de Conductores, en su as-
pecto médico pasan a sustituir la función hasta entonces encomendada al médico * de
cabecera” de extender una certificación médica, y en su aspecto psicológico sustitu-
yen a los antiguos Institutos de Orientación Educativa y Profesional e/o Institutos
de Psicotecnia, donde los conductores de permisos “profesionales” debían pasar el
examen entonces denominado psicotécnico. 2...
Es a principios del año 1983 cuando empiezan a funcionar, desde la iniciativa pri-
vada, los primeros centros con estas características en España, y con ellos, se reinicia
el interés, después de un largo letargo, por el estudio psicológico de la conducta de la
conducción de automóviles, ahora bajo la denominación específica de psicología del
tráfico o vial (Soler, 1982, 1984; Prieto, 1982, 1987; Soler y Tortosa, 1985). Después
de casi tres años de funcionamiento de los centros de reconocimientos médico-
psicológicos, y de la consolidación de la psicología del tráfico o vial como línea de
investigación actualizada y área de estudio específica en el seno de la psicología espa-
ñola, lo.que favoreció la actitud de apoyo de la Administración, es publicado el 9 de
diciembre de 1985 el Real Decreto 2272/85 que sustituyendo al anterior extiende la
obligatoriedad de la exploración psicológica a todos los permisos y categorías exis-
tentes en España. La intervención psicológica en la exploración de conductores era
ya plena. Dicha extensión del reconocimiento (y otro Real Decreto que lo extiende
también a los poseedores de armas) entró en vigencia a mediados del año 1986.
Pero la intervención psicológica en la seguridad vial se había quedado en España
donde la dejaron sus pioneros iniciadores, no experimentando evolución destacable
desde el año 1935 en el que fue recogida en el Código de la Circulación, quedando
reducida a la, y entendida como, selección de conductores bajo la perspectiva de la
psicología de la época, resultado de lo que la sociedad de entonces, que afrontaba la
explosión del desarrollo industrial, demandaba a las ciencias. Así, en la parte psicoló-
gica, el actual examen (que recogía el primer Real Decreto y que se mantiene con li-
geras modificaciones en el segundo, vigente en la actualidad) es prácticamente la
continuación congelada de aquel ideado por Mira que comprendía básicamente la
evaluación de cuatro dimensiones (Monterde, 1987), consideradas como aptitudes:
coordinación manual, apreciación de velocidades y distancias, tiempos de reacción
selectivos con precisión de las reacciones y la atención. La utilización de material in-
formatizado (aplicación por ordenador) fue la única evolución destacable hacia los
avances actuales.
Este modelo de examen, justificado en su época, responde a un enfoque psicoló-
gico observacional-clasificatorio (Pelechano, 1979) más identificado con los oríge-
nes de la psicología científica que con las tendencias intervencionistas actuales. El
automóvil ya no es una máquina para unos pocos especialistas privilegiados que ha-
bía que seleccionar en función de sus aptitudes. Como consecuencia de este cambio
social y desarrollo de la automoción, el problema de la prevención de accidentes ha
ido pasando desde un punto de vista centrado en las aptitudes, cuya solución se cen-
traba en la selección, a un punto de vista centrado en las actitudes, cuyas soluciones
propuestas van a ser de carácter social, menos fisiológicas, centradas en el cambio de
actitud y en la intervención sobre los procesos de toma de decisiones. Aspecto dife-
Evaluación en tráfico y seguridad vial 969
1vV2. El futuro
Las limitaciones del modelo de intervención actualmente aplicado en España en los
Centros de Reconocimiento de Conductores han sido expuestas a través de trabajos
de investigación y de reflexión (Germain, 1966; Monterde y cols., 1986; Prieto, 1987;
Monterde, 1987; Soler y cols., 1988; Monterde, 19884; 1988b; 1989; Monterde, Soler
y Reig, 19904; Monterde, Soler y Reig, 1990b; Monterde, Carbonell y Montoro,
19914; Monterde, Carbonell y Montoro, 1991»). Entre las limitaciones de tipo cien-
tífico destacan las siguientes:
9861
Si0NLILIV el9usbleju]
-2uebB e9usbl¡aju]
-2usf e/9uaBIjaju]
-2us6
SITWNLIITILNI
ap
¡e 0U) "(1eq8A
-2ueb erdusb1ajul
¡el 'eme¡ndiueu
|eJ "emye¡ndiueuy
Ov6L-3G61
v861-3861
ey
e|
ap
181
159,uo
ejed
Sm
-elo0aelde
jeqo¡B
—
-auyue
—
"pequen
pnindy
“0911
:e/9usB1ajul
sepepiliqey—
UBUOZey
-QuINU -J8, -S9
elouaB1jaju|
Az A A A A EQ
— "1eq — “¡erned
'uadapu!-'daq
ap
“OQUuIBo
"WBUOZey
AA II A A A RE PER A ____—_—_——
Ñ A —_——
"INSO9
NO/O43O083d
SOAIL
-3A
SOT111S3
UO/DdanJay
Sp -2, uoroda91ad
ep e]
Sp
-=SsI0/'AVvalgo7
-9,
ap
sapepioo]
Á -UB]sIp -edu/pepioo|an
Á
Á
VIONVL selo -e]01da9/9d) “elgualo
) pasas,
Á
)
onaunb
ep (BIN
ap ZId8],)
-UB]sIp
uvonedionue
SeIo
159]
ep
UO/OdaDIS4
ep
sepepIoo]
ep euweÁnien
uorIodaniad
zide],)
Á
uol9e1oaldy
Seldue]sIp
ap -81)A -I1ulg
“(enn
Á
SBIDUe]sIp
,1s8]
uolderioaldy
“eigualo
ep
“(¿¡eded
pasds,
:SOI|
seioJ98Á
“(e/1nueuy
y
oneunmb
(,¡eded
A zzAA AAA A AÁAÁKÁK KÁ— KA _—
pepioedeo
-9891 — 1 "Y -IWIOSIQ"yl SUB -NuUNSo yr] ajdhinu-119SIp yl ajd4inus-1OSIp yl ajdnu -1OSIp
uonedionue
B| -eduw!/pep190/9n
en]
eueÁniena
-e]01d99/9d) -OSIA
INW
oje1B
ap “(ddny zapidey—
-Jed “SOM (URwIao “sal SBUJO]
Á
:90V38d
-JUOS “sa, SBUUIO]
Á -lUOS
NOIO
3191
OdMWN3I1
endao zide],)
A 'sop
Á sejsendsa/
sopÁ sejsandsa/
sajd
SAUOIDIOBIY
sepercose
e epeo sepeldose
e epeo
— y] JBnsia-98 O/quiau -a111/0d)
“(old
OJqualw -911110d)
SEJOJOLWOIPne
-uuISseAe/cose
on109|1189)-N| “(oje1Bnoe “(oje1Bnoe
(,J¡aded
“(sosouluu
OAILVNINI39SIO
AN A NN A O RÁáÚó_5_oÓ 0 ___ A AAA AAA
UO/DUA]Y -SI9804) UOIDUaJy
Á -SIS9J UO/9UaJy
Á -SIsa1
A
UOQIDUAIY
Á -SIS9J
-0950pe1qinbe])
SP
38
YH]
“UBUIaO)-19]
-19A ergua]
ergua]e e
e e] -Ou
-0U0Uu ejgua]
e e] -0U0Uu
se]
Uu0IS eA1j99/09 eJuojou u0IsidaJd)“eJuo] owoo e61]e, 'eJuo] ouwoJ9 e61]e,
ajue
VIV
-SaNASI
'U/reuIaO)-19151904
ua ja ofeueu
¡ep epipawJod “y epipauw
lod "y'1
alas
NOION31V
ap
Á seoep zide],
Á ajuejon -e|¡nuis—
ap sejsendsaJ
-ou ap sejsandsal
-ou
ap
eB1e]
VION3LSIS
(,¡eded —J0pap "(wua|y seo] ajue salas sejo] ajue sales
seJjojou -JOld
euojououl
Á so|nuse
sebiej
Á seanmeda) sebe]
Á seamedal
VINOLONOMN
ojelede)
ap so¡nunse
-0d) ap so¡nunse
-0d)
"(dISMOY
“(oje/Bnoea111| "(oje1Bnoeau!|
q
Héctor Monterde
O
971
(dVANI
2917S)|/AOWOJNE "((291S//NOLWONE
pninoe ep oleuo!] pni/oe ep o1Buo!]
-SaAND) UVOIDINPUOD -sanQ) uOo1VaNpuos
e] e1oey sopainoy: e| e1oey sepnnoy Ss3gnLILOV
“SO9
-ISI] SOJEP Á “yl
Evaluación en tráfico y seguridad vial
ap
-osjad ap soBsey -osjad ap soBsey
“JOJOUJOO "JOJOUIOD dOLONOJ9ISd
-Isd afezipualde -Isd afezipualde 3PVZIOUN38AV
ap pepioedeo op pepioedeo avia (O Vid VEO
"(wua|y ep Jop '(upi9noes
NOI9VNIQYOOO
-e¡nuls) ajue| -O1d SP 10104)
ZIBlONOSIA
IVANVIA
“(¡epreuuog (¡9preuuog (Jepreuuog -01 |ap ofeueu ¡enuewouou
BI1OJOLJOSIA
ap oJulleqe| a¡qop) ap ojuleqe| alqop) ua Uu0QIsI0ald— UQ/DRUIPI00)—
ap ojuaqe| a¡qop)
ojsandu! ou e ojsanduu ou e ojsandu ou e “(,¡oded Á zid (Aye ap ou
-B],)
-18
¡enueulg ZzlJoLuOS ¡enueuliq zIJouulOs ¡enueuq zI/jOuJOS -J0|) ¡enueuq
“lA UOIDBUIPJOOD -IA UOQI9BUIPIOOL) “IA UOIOBUIPIOOL) UO/DRUIPIO0O0D)— UQO/DRUIPIOO0D)—
972 Héctor Monterde
Es por ello por lo que se ha elaborado una propuesta de reforma del actual exa-
men psicológico de conductores, que implicara un nuevo modelo de actuación, de
carácter marcadamente intervencionista y comunitario, más acorde con los plantea-
mientos de la psicología actual y a las características actuales y necesidades próximas
de nuestra sociedad, y a la vez, compatible con el sistema seguido hasta el momento
en los centros de reconocimiento españoles.
conductores (que como sabemos es sólo una parte del riesgo en la conducción la que
corresponde evaluar y controlar a los centros).
g- Introducción de nuevas exploraciones. Algunas que podríamos considerar
clásicas en psicología, como la rapidez y velocidad lectoras (en aquellos casos en los
que existan indicios de deficiencia considerable o fracaso reiterado en el examen
“teórico” de conducción), exigiéndose un mínimo de rapidez en la comprensión de
textos y limitando la velocidad cuando el grado de deficiencia en este aspecto así lo
aconseje (téngase presente que gran parte de la información vial se expresa a través
de textos, y que en el caso de las señales informativas de dirección, especialmente en
vías rápidas, exigen una rapidez de procesamiento y decisión cuya imposibilidad de
logro dificulta la fluidez y la seguridad del sistema tráfico). Otras exploraciones son
tan nuevas en psicología como en este campo de aplicación, resultado de la investiga-
ción y literatura científica recientes (véase Monterde, 1989) en el campo de la psico-
logía del tráfico, tendentes a considerar, junto a las dimensiones clásicas, aspectos ac-
titudinales, motivacionales y/o cognitivos, como la percepción de riesgo, la actitud
temeraria y la toma de decisiones, en las que se ha venido trabajando, demostrando
su posibilidad de exploración y su viabilidad de aplicación dentro del modelo.
h. Desarrollo de un verdadero modelo de intervención/actuación psicológica,
que teniendo al centro de reconocimiento como base excede sus propios límites. En-
tendiendo la función del centro como primaria (primera exploración) y definitiva
(decisión final), controlando siempre el proceso entre ambos momentos, pueda re-
mitirse al sujeto a entidades públicas o privadas para completar una exploración, am-
pliarla, confirmar una deficiencia o los mismos resultados de la exploración realizada
en el centro, así como para recibir un tratamiento.
1. Finalmente, mínimas modificaciones en los equipos y pruebas ya adquiridas
que sólo afectan a la prueba de tiempo de reacción.
V. CONCLUSIONES
REFERENCIAS BIBLIOGRÁFICAS
Adams, J. G. U. (19854). Risk and freedom: The record of road safety regulation. Cardiff.
Transport Publishing Projects.
Adams, J. G. U. (1985b). Seed”s seat belts and the emperors's new clothes. En L. Evans y
R. C. Schwing (dirs.), Human behavior and traffic safety. Nueva York. Plenum Press.
Adams, J. G. U. (1988). Risk homeostasis and the purpose of safety regulation. Ergonomacs,
Sl
Blasco, R. D. y Casas, R. (1985). Polirreactímetro y batería de aptitudes psicomotrices para la
exploración de conductores. Tesis de licenciatura inédita. Universidad de Barcelona.
Bótticher, A. y Van der Molen, H. (1985). Risicomodellen als determinanten van voorlichting
en andere verkeersvelligherdsmaatregelen. Groninga. University of Groningen.
Bótticher, A. y Van der Molen, H. (1988). Predicting overtaking behavior on the basis of the
hierchical risk model for traffic participants. En J. Rothengatter y R. de Bruin (dirs.),
Road user behaviour: Theory and research. Assen/Maastricht. Vam Gorcum.
Brown, J. D. (1980). Error correction probability as a determinant of drivers” subjetive risk.
En D. J. Oborne y J. A. Levis (dirs.), Human factors in transport research. Londres. Aca-
demic Press.
Bruin, R. D., Vaa, T. y Ostvik, E. (1989). Opinions of drivers and police officers about the se-
riousness of traffic violations. Documento inédito.
Caparrós, A. (1985). Aspectos históricos de la psicología aplicada a la conducción. En DGT
(dir.), Primera reunión internacional de psicología de tráfico y seguridad vial. Madrid. Di-
rección General de Tráfico.
Conant, R. C. y Ashby, W. R. (1970). Every goad regulator of a system must be a model of
that system. International Journal of Systems Science, 1.
Cownie, A. R. y Calderwood, J. H.(1966). Feedback in accident control. Operational Re-
search Quarterly, 17.
Edwards, W. (1954). The theory of decision making. Psychological Bulletin, 81.
Evans, L. (19854). Human behavior feedback and traffic safety. Human Factors, 27.
Evans, L. (1985b). Factors controlling traffic crashes. Comunicación presentada al Tenth Re-
pe Conference on Subjetive Probability, Utility, and Decision Making. Helsinki, Fin-
andia.
Evaluación en tráfico y seguridad vial 077
Forbes, T. W. (1939). The normal automovile driver as a traffic problem. Journal of General
Psychology, 20.
Fuller, R. (1984). A conceptualization of driving behavior as threat avoidance. Ergonomics,
27, 1139-1155. .
Fuller, R. (1986). Reflections on risk homeostasis theory. En B. Brehmer, H. Jungerman,
P. Lourens y G. Sevon (dirs.), Nezw directions in research on decision making. Amsterdam.
North Holland.
Fuller, R. (1988). On learning to make risky decisions. Ergonomics, 31.
la J. (1966). El psicólogo y la seguridad vial. Revista de Psicología General y Aplicada,
Sivak, M. y Soler, J. (1987). Driver self-assessment in Spain and the USA. Documento inédito.
Skinner, B. F. (1971). Beyond freedom and dignity. Nueva York. Bantam Books.
Smeed, R. J. (1949). Some statistical aspects of road safety research. Journal of the Royal Sta-
tistical Society, 112.
Soler, J. (1982). El factor humano en la conducción de vehículos automóviles: un estudio bi-
pie en la R.P.G.A. (1946-1980). Tesis de licenciatura inédita. Universidad de Va-
encia.
Soler, J. (1983). Desarrollo histórico de las pruebas de aptitud psicotécnica para la conducción
en España. Documento inédito.
Soler, J. (1984). El factor humano en la conducción de vehículos automóviles: un estudio bi-
bliométrico en el S.S.C.I, Tesis doctoral inédita. Universidad de Valencia.
Soler, J., Reig, A., Monterde, H. y Mayor, L. (1987). Induced stress and risk-taking under
dummy driving conditions. Comunicación presentada al Second International Conferen-
ce on Road Safety. Groninga, Holanda.
Soler, J. y Tortosa. F. (1985). Psicología y seguridad vial: autores, temas y fuentes. Papeles del
Colegio, 21.
Soler, J., Tortosa, F., Montoro, L. y Monterde, H. (1988). Psicología y seguridad vial. Recose-
vial, 3.
Soler, J., Tortosa, F. y Reig, A. (1986). Psicología y seguridad vial en España: una perspectiva
histórica. Informació Psicologica, 25.
Summala, H. (1980). Driving-speed regulation and other means to reduce risks when mee-
ting a pedestrian on a dark road. International Revierw ofApplied Psychology, 29.
Summala, H. (1985). Modeling driver behavior: A pessimistic prediction? En L. Evans y
R. C. Schwing (dirs.), Human behavior an traffic safety. Nueva York. Plenum Press.
Summala, H. (1986). The deterministic man in stochastic world: Risk management on the
road. En B. Brehmer, H. Jungermann, P. Lourens y G. Sevon (dirs.), New directions in re-
search on directions making. Amsterdam. Elseviers Science Publishers/Nort-Holland.
Summala, H. (1988). Risk control is not risk adjustment: The zero-risk theory of driver beha-
vior and its implications. Ergonomics, 31, 491-506. ce
Summala, H. y Hietamaki, J. (1984). Drivers” inmediate responses to traffic signs. Ergono-
mics, 27. i
Summala, H. y Merisalo, A. (1980). A psychophysical method for determining the effects of
studded tires on safety. Scandinavian Journal of Psychology, 21. A.
Summala, H., Vierimaa, J., Hietamaki,J. y Keinánen, K. (1981). Varortusvilkku ja jalankulki-
joiden turvallisuus. Roads and Waterways Administration Publication, 74, 19-66.
Svenson, O. (1973). Change of mean speed in order to obtain a prescribed increase or decrea-
se in travel time. Ergonomacs, 16 y
Svenson, S. (1978). Risks of road transportation in a psychological perspective. Accidental
Anales Prevention, 10.
Svenson, O. (1981). Are we all less risky and more skillful than our fellow drivers? Acta Psy-
chologica, 47. ascreatde
Taylor, D. H. (1964). Drivers galvanic skin response and the risk of accident. Ergonomics, 7.
Tramm, K. A. (1921). Psychotechnik und Taylor-System (vol. 1). Arbeitsuntersuchungen.
ringer. -.
o rs H. y Bótticher, A. M. T. (1988). A hierarchical risk model for traffic partici-
ants. Ergonomicts, 31, 537-555.
Ward, (e 1961). Adventure playground: A parable of anarchy. Anarchy: A Journal of Anar-
chist Ideas, 7. 06
Wilde, G. ]. S. (19824). The theory of risk homeostasis: Implications for safety and health.
sk Analisys, 2, 209-225.
Fada GJ3S. (1982b), Criticals issues in risk homeostasis theory. Risk Analisys, 2, 249-258.
980 Héctor Monterde
LECTURAS COMPLEMENTARIAS
F. JAVIER PÉREZ-PAREJA
I. INTRODUCCIÓN
En resumen, y tal como hemos venido desarrollando, parece claro que la psico-
logía ambiental, y por consiguiente la evaluación ambiental, se conceptualiza desde
un modelo ecopsicológico en el que el propio medio, así como la interacción perso-
984 F. Javier Pérez-Pareja
112.1. El medio
11.22. El tiempo
La mayoría de los autores admite que el término ambiente remite a una concepción
fundamentalmente molar, pero que el ambiente no sólo contiene objetos y acciones
sino que también cubre un amplio espacio de tiempo, lo cual implica que el ambiente
ha de ser concretado necesariamente a la hora de su análisis. Según Fernández-
Ballesteros (1987, p. 20), «mientras que la primera dimensión molar=-molecular ha
permitido jerarquizar los términos que estamos tratando de definir en función del
tamaño-espacio y organización según una dimensión proximal-distal (de tipo verti-
cal), la dimensión horizontal nos permitirá dar cuenta en el tiempo al que se refieren
los conceptos ambientales que estamos manejando».
112.3. La interacción
Siguiendo a Fernández-Ballesteros (1987, pp. 31-35), fue Kantor quien en 1924 sos-
tuvo por primera vez, no sólo la influencia de las condiciones ambientales sobre la
conducta, sino un planteamiento interactivo. Así, los planteamientos no sólo am-
bientalistas sino también interactivos aparecen desde el modelo conductista, aunque
generalmente y de manera errónea se sostiene que fue Kurt Lewin en 1935 con su
formulación en la que la conducta se considera una función de variables de la perso-
na y del ambiente o de la situación cuando comienza a tomar valor el estudio del am-
biente.
Desde una perspectiva idiográfica la evaluación se dirige al análisis objetivo del
comportamiento de una persona (Fernández-Ballesteros, 1979, 1981, 1983). Este
análisis se efectuó, en un principio, en función de una serie de características pro-
cedentes de los estudios correlacionales y diferenciales a través de los cuales se pre-
tendía la descripción y/o clasificación de la persona (o personas). En este caso la con-
ducta aparece como función de una serie de características de la persona (variables
organísmicas), es decir, C =f(P). Por su parte, desde el modelo conductista, la eva-
luación propugnaba el análisis experimental de la conducta a partir del supuesto de
que ésta es una función de ciertas propiedades funcionales de los estímulos ambien-
tales, es decir, C =f (A). Sin embargo, en palabras de Fernández-Ballesteros (1987,
p. 25), «la evidencia empírica desmontó tanto el modelo reduccionista organísmico
o personologista /C =f (P)] como el radicalismo situacionista /C =f(A)), avalando
un modelo interactivo /C =f (Px A))». En este modelo, el énfasis se centra en el in-
tercambio que mantienen las variables de la situación y del organismo o de la perso-
na, y que explica la mayor parte de la variancia de la conducta (Endler y Magnusson,
1976), como ya había planteado Kantor en su modelo de campo, en el que un com-
portamiento quedaría definido por una función de estímuloyuna función de res-
puesta en relación recíproca. Sin embargo, tal como señalan Silva y López (1992), en
el campo de la evaluación psicológica, las formulaciones teóricas de Murray, en las
que se incluyen tanto las necesidades individuales como las presiones ambientales,
parecen haber tenido mayor influencia que los planteamientos teóricos antes señala-
dos. Por su parte, Bandura (1974, 1978) plantea, al menos formalmente, una refor-
986 F. Javier Pérez-Pareja
f. Planear intervenciones.
g. Evaluar las modificaciones producidas en función de las intervenciones.
Por último, continuando con las propuestas que al respecto realiza Fernández-
Ballesteros (1987), la importancia del análisis ambiental no proviene tan sólo de su
poder explicativo sobre la conducta de una persona, sino que en otro nivel de análisis
podemos evaluar al propio ambiente, lo que permitirá a través de diseños grupales
constatar las relaciones generales persona-medio y conducta-ambiente en sus distin-
tos niveles de complejidad ambiental.
Por otra parte, tal como señala Fernández-Ballesteros (1992, p. 450), «de la so-
mera enumeración de los principales enfoques teóricos se deriva una clasificación de
las condiciones implicadas en cualquier contexto» entre las que destacamos las ca-
racterísticas físicas, variables organizativas, características de los habitantes, varia-
bles psicosociales y variables conductuales. Igualmente, la misma autora señala que
en la descripción de las variables o dimensiones en las que puede ser operacionaliza-
do un ambiente nos encontramos con un problema importante referido a la necesi-
dad de evaluar los distintos ambientes como realidad física, social o cultural, o bien
cómo éstos son percibidos por sus habitantes; es decir, antes de realizar cualquier
evaluación ambiental «habremos de establecer cuáles son las variables objeto de aná-
lisis y determinar si lo que nos interesa es el ambiente tal y como es o tal y como es
percibido por las personas que lo ocupan» (Fernández-Ballesteros, 1992, p. 451).
ticas físicas del medio han sido consideradas patrimonio de otros científicos (ecólo-
gos, urbanistas, etc.), no podemos olvidar que tal como señala Moos (1974) lacon-
ducta ocurre en un contexto físico específico, lo que permite considerar este tipo de
variables desde una perspectiva psicológica. Según el nivel de inferencia de las unida-
des de análisis ambientales utilizado, podemos clasificar las estrategias de evaluación
en dos tipos diferentes:
a. Definir los límites del estudio: objetivos y recursos del investigador y las ca-
racterísticas temporales y espaciales del sistema objeto de estudio.
b. Identificar los distintos escenarios (settings) que existen en el sistema, locali-
zando y listando los escenarios potenciales.
c. Describir los escenarios a través de parámetros.
Sin embargo, este enfoque está sesgado por todos los problemas que la metodo-
logía correlacional lleva implícitos.
994 F. Javier Pérez-Pareja
V. EVALUACIÓN AMBIENTAL
Craik (1968) y Craik y Feimer (1987) postulan la existencia de una triple posibilidad
de evaluación ambiental: valorativa, descriptiva y predictiva. La evaluación valorati-
va, tal como señalan Íñiguez y Valera (1991), es utilizada bien para determinar las in-
tervenciones iniciales en una intervención ambiental o bien para evaluar, junto a las
personas implicadas en un ambiente determinado sobre el que se ha intervenido, la
actuación ya realizada. «En este caso, observamos cómo la evaluación ambiental se
enmarca en la valoración ambiental» (Íñiguez y Valera, 1991, p. 515). Por su parte, la
evaluación descriptiva busca identificar criterios comunes y comprensivos para eva-
luar tipos específicos de unidades ambientales. Por último, la evaluación predictiva
suele basarse en la generalización empírica o en la extracción de predicciones a partir
de modelos de simulación. Como destacan Iñiguez y Valera (1991), podemos seña-
lar dos momentos fundamentales en evaluación ambiental: uno, previo a la realiza-
ción de cualquier intervención en el cual se tienen en cuenta las intenciones de los
promotores de la intervención, las directrices del proyecto de intervención y las va-
riables pertinentes de carácter predictivo cuyo control puede optimizar la interven-
ción; y un segundo momento, posterior a la intervención, donde se establecerá el
grado de ajuste entre los objetivos de la intervención y las respuestas de las personas
afectadas por la misma. Los resultados de esta evaluación servirán para establecer
nuevos criterios para posteriores intervenciones de características similares. Por su
parte, Fernández-Ballesteros (1987) señala cómo a pesar de que evaluar y valorar son
términos sinónimos en lengua castellana, frecuentemente presentan un uso diferen-
ciado. Mientras que evaluación supone el análisis de variables conductuales y am-
bientales relevantes, en un momento dado, en una persona o grupo de personas; va-
loración implica la estimación del valor de un determinado tratamiento, programa o
intervención que se ha aplicado en un contexto o ambiente predeterminado. En con-
clusión, el término valoración parece referirse a un momento posterior a la inter-
vención. Por tanto, parece claro que evaluación, intervención y valoración se consti-
tuyen en los tres momentos claves de todo proyecto de intervención ambiental. Sin
embargo, en la realidad, el papel del psicólogo ambiental se limita, en la mayoría de
las ocasiones, a la evaluación de la intervención una vez realizada. Así, de una tarea
ideal de valoración de criterios de optimización se ha pasado a la evaluación de los
daños, y de predecir y promover efectos positivos se ha pasado a detectar y corregir
efectos negativos. Por último, uno de los aspectos importantes a tener en cuenta a la
hora de evaluar una investigación valorativa es su relevancia social o validez social.
Se considera validez social a la aceptación de un determinado tratamiento por parte
de los usuarios, allegados o expertos no implicados en el mismo; este tipo de validez
se establece generalmente por medio de pruebas subjetivas. Es significativo cómo
Evaluación ambiental 995
Wolf (1978) enfatiza la resignación que supone el tener que utilizar procedimientos
subjetivos a la hora de contrastar el análisis conductual aplicado. Por otra parte, di-
versos autores han resaltado la frecuericia con que datos de valoración subjetiva con-
tradicen indicadores objetivos de validación de intervenciones. En nuestra opinión,
la llamada validación social o consenso de utilidad social debe ser considerada tan
sólo como un elemento más, pero en ningún caso puede sustituir la constatación ob-
Jetiva de la intervención. De aquí se desprende la necesidad de objetivar las decisio-
nes valorativas con avales empíricos.
Siguiendo a Jiménez-Gómez (1990, pp. 40-42), las distintas etapas a través de las
cuales debe realizarse una evaluación serían las siguientes:
Por su parte, uno de los campos de aplicación donde más estrechamente se rela-
cionan evaluación e intervención ambiental es en el ámbito de la evaluación del im-
996 F. Javier Pérez-Pareja
pacto ambiental. Rubio (1987) entiende por evaluación de impacto ambiental los es-
tudios realizados para identificar, predecir e interpretar, así como para prevenir las
consecuencias o efectos ambientales que determinadas acciones, planes, programas
o proyectos puedan causar a la salud y al bienestar humano y al entorno. De esta
definición se desprende un carácter marcadamente instrumental del proceso de eva-
luación del impacto ambiental, estableciéndose dos momentos: la evaluación del im-
pacto ambiental y la valoración del mismo. El propio Rubio (1987) entiende la valo-
ración de intervenciones como una etapa del proceso de análisis ambiental dondelo
que se busca es determinar el grado en el que se han conseguido determinados obje-
tivos tras una intervención. Así, tal como recogen Íñiguez y Valera (1991), se puede
realizar una clarísima «distinción entre el proceso de evaluación del impacto am-
biental, valoración del impacto ambiental y valoración de intervenciones. Mientras
que los dos primeros conceptos son dos momentos en el proceso de evaluación [...]
del ambiente, el tercero sería propio de las intervenciones» (p.516).
Por último, y de manera resumida, destacaremos la propuesta que Iñiguez y Va-
lera (1991, pp. 521-525) realizan para evaluar y actuar en ambientes urbanos. En pri-
mer lugar, estos autores distinguen dos fases fundamentales en su modelo de acción:
fase de evaluación que incluiría el momento anterior a la toma de decisiones, y la fase
de valoración que se correspondería al momento posterior a la intervención urbanís-
tica. A su vez cada fase ha de responder a una serie de objetivos y contestar a una se-
rie de cuestiones precisas. Veamos cada una de ellas.
— Análisis de la demanda. En esta fase habría que responder a las siguientes cues-
tiones: ¿quién es el demandante?, motivación de la demanda, contrastación de la
motivación con la realidad del lugar, etcétera.
— Evaluación del contexto: memoria histórica del lugar necesaria para conocer
la realidad sociohistórica del mismo, inventario de recursos, valoración del usuario
(información, percepción, imagen y actitudes que el mismo tiene sobre el contexto),
estudio de las necesidades y expectativas (donde el usuario vuelve a ser el referente
principal) y diagnóstico.
— Análisis del lugar de la intervención, para lo que será necesario conocer la de-
finición de los límites del contexto en el que se va a intervenir y apreciar dicho con-
texto desde lugares colindantes. Igualmente, antes de la intervención sería necesario
determinar el grado de conservación de la interacción socioambiental actual.
— Estudio de preimpacto de la intervención propuesta desde un ejercicio de
prospectiva que debería de tener en cuenta la evaluación de impacto en las zonas co-
lindantes, la evaluación del impacto en el lugar mismo, las prospectivas del uso tem-
poral del ambiente concreto y el mantenimiento que requerirá la futura interven-
ción.
— Representación de la intervención, informe sobre la misma. El tipo de inter-
vención propuesta ha de reunir las condiciones de asequibilidad y comprensión sufi-
cientes para que pueda ser entendida no sólo por expertos, sino también por cual-
quiera de los posibles usuarios.
Evaluación ambiental 997
Por último, como señalan Íñiguez y Valera (1991, p. 525) «tanto los aspectos de
procedimiento como los metodológicos pueden seguir el plan de evaluación previa-
mente presentado, realizando un proyecto para todas o parte de las etapas allí pro-
puestas». Igualmente, durante el proceso el investigador utilizará las técnicas e ins-
trumentos de evaluación pertinentes a cada caso.
REFERENCIAS BIBLIOGRÁFICAS
Moos, R. H. (1974). The social climate scales: An overview. Palo Alto. Consulting Psycholo-
gists Press.
Moos, R. H. (1976). The human context, environmental determinants of behavior. Nueva
York. Wiley.
Moos, R. H., Gauvain, M., Lemke, S., Max, W. y Mehren, B. (1979). Assessment the social
environment of sheltered care settings. Geronthologist, 19, 74-82.
Moos, R. H. y Lemke, S. (1979). Multiphasic environmental assessment procedure: preliminary
manual. Palo Alto, Medical Center. Social Ecology Laboratory, Standford University.
Moos, R. H. y Lemke, S. (1980). Assessing the physical and architectural features of sheltered
care setting. Journal of Gerontology, 8, 207-210.
Pelechano, V. (dir.) (1981). Intervención psicológica. Valencia. Alfaplús.
Pinillos, J. L. (1981). Modelos ambientales de conducta. En F. Jiménez (dir.), Psicología y me-
dio ambiente. Madrid. CEOTMA.
Pol, E. (1991). Formación y profesión del psicólogo ambiental. En R. de Castro (dir.), Psico-
logía ambiental: intervención y evaluación del entorno. Sevilla. Arquetipo Ediciones.
Proshansky, H. M. (1972). Methodology in environmental psychology: Problems and issues.
Human Factors, 14, 451-460.
Rubio, V. J. (1987). Evaluación del impacto ambiental. En R. Fernández-Ballesteros (dir.), El
ambiente. Análisis psicológico. Madrid. Pirámide.
Silva, F. y López, M. C. (1992). Evaluación de las interacciones del sujeto con su ambiente.
En R. Fernández-Ballesteros (dir.), Introducción a la evaluación psicológica (vol. 11). Ma-
drid. Pirámide.
Sonnenfeld, J. (1969). Equivalence and distorsion of the perceptual environment. Environ-
ment and Behavior, 1, 83-100.
Stern, G. G. (1970). People in context: Measuring person-environment congruence education
and industry. Nueva York. Wiley.
Stokols, D. (1978). Environmental psychology. Annual Review, 29, 253-295.
Stokols, D. y Shumaker, S. O. (1981). Peoples in places: A transactional view of settings. En
J. H. Harvey (dir.), Cognition, social behavior and environment. Hillsdale. Lawrence Erl-
baum.
Sundberg, N. D. (1977). Assessment ofpersons. Englewood Cliffs. Prentice Hall.
White, R. N. (1974). Strategies of adaptation: An attempt at systematic description. En
G. V. Coelho, D. A. Hamburg y J. E. Adams (dirs.), Coping and adaptation. Nueva York.
Basic Books.
Wicker, A. W. (1981). Nature and assessment of behavior settings: Recent contributions
from the ecological perspective. En P. McReynolds (dir.), Advances in psychological as-
sessment (vol. V). San Francisco. Jossey Bass.
Wolf, M. M. (1978). Social validity: The case for subjetive measurement or how applied beha-
vior analysis is fiding it heart. Journal of Applied Behavior Analysis, 11, 203-214.
LECTURAS COMPLEMENTARIAS
De Castro, R. (dir.) (1991). Psicología ambiental: intervención y evaluación del entorno. Sevi-
lla. Arquetipo Ediciones. an o
Fernández-Ballesteros, R. (1987). El ambiente. Análisis psicológico. Madrid. Pirámide.
Holahan, C. ]. (1991). Psicología ambiental. Madrid. Trillas. pe bl
Jiménez, F. (1990). La psicología ambiental y su evaluación. En F. Jiménez y R. de Diegi
- (dirs.), Lecturas de psicodiagnóstico. Salamanca. Amarú.
y
'"y 0 A z
JEAE mit,
vtr g ió
y 1 AR
] » e ES
pe FAC Cc mA
om Y
ur h
olor]esla 37 hase
| E EE 7 le JS oe Y EJ ddnas t] + ( Y EN
1) O
Le E a ho 210 TIE DUO $ “E VA sd un A YH go
se Mu
Í 16 Ú y ' 4 . 4 ) *
, ' ; 3
¿ A ] tudrá
LADA e COIE
GS, JUSA rin EN GIA OL
E, leds
o
, yA ATI IS
3 UE Cl]
P A 4
MILI OGOSR PTA EU
4 y ¡7 al
d t PLA MINAS
4 , ' a
e AE A TOA]
E 161
; Il 150
APPO A soni
.
k . + Ln DS La +10 0%
40. DISEÑOS DE EVALUACIÓN DE PROGRAMAS
Il. INTRODUCCIÓN
de las Enseñanzas Medias. Para una descripción detallada, véase Álvaro (1988a,
1988b, 1990).
FIGURA 40.1. Muestreo exhaustivo.
Población de ítems
ADE
oo
RON
E
NAO
Población de ítems
PM
O
b, e
INES
ELO
Sac
Pa
Ó
n
d 3]
=D
MO
0
"E
1004 Mariano Álvaro y Gualberto Buela-Casal
Población de Ítems
Muestra
TIDO*=0Op—
us
Da”
"0
==:
0
O
a
Población de ítems
Muestra
PM
ou
b e
las
aaJU
ur
la
Ó
n
d
e
S
u
J
e
t
O
S
la evaluación, sino a una pequeña muestra de ellos. El muestreo matricial múltiple, tal
como fue implementado por el NAEP, dividía la población de ftems de un determinado
nivel de edad en diferentes cuadernillos, de tal forma que cada uno de éstos contenía
tantos ítems como el sujeto era capaz de contestar en un período de tiempo dado. Los
ejercicios que aparecían en un cuadernillo, no aparecían en otro, aunque sí podían in-
cluirse en cuadernillos de diferente nivel de edad (Messick, Beaton y Lord, 1983).
La cuestión primordial para el NAEP era recoger datos representativos a nivel na-
cional, pero al mismo tiempo asegurar a las administraciones estatales y locales que
los estándares nacionales no serían impuestos, ni se harían comparaciones entre esta-
dos o distritos. Se trataba de evaluar el sistema a nivel global. Por tanto, no era nece-
sario aplicar todos los ítems a todos los sujetos.
El proceso de elaboración y aplicación de las pruebas se realiza según las siguien-
tes fases:
Población de Ítems
OO
DADOS
GIN
—=:
10:
MO
Población de ítems
Sy
Mé
“O
FO
(a
07
Os
MN
0
E
+0
O
5708
oo
0519"
3
WO.
DE
0
Población de Ítems
.
Q=i0O
TU
0/0
DD
DT
ooQ
100)
MIDE
Hasta la aparición de los tests referidos a criterio, estos diseños apenas eran utiliza-
dos. Por ello, puede afirmarse que se emplean casi exclusivamente cuando se aplica
este tipo de tests. Es decir, cuando interesa saber si los sujetos alcanzan un nivel de-
terminado para considerarse aptos, más que si dominan todo el contenido de la ma-
teria. Al igual que el caso anterior, teniendo en cuenta el tamaño de las muestras re-
sultan cuatro modalidades.
Población de ítems
00.
3O—0O»)=00
ANO
10
D=S
Población de ítems
ADOOS
TOS
oo
EU
(DS
AO"
A
OO
Pr
IOI=RO
O
(Up
O
A)
Población de ítems
OU
—Q
[COR
=010
0
3
0
(DS
MIO
Población de ítems
Doo
ie)
ENS]
0.0
0
=—50=-E
Población de Ítems
050
=0
"00
AO
oo
0
10,0,
STO
Población de Ítems
ORD
PIO
OJO
MO
ANIOS
TIO
ODIO
10
+*D0=E
NO
Y
Población de Ítems
(MOR
DUO
SOS
"OD
=
INDAGA
Población de Ítems
O)
HAS
OA
RO
DO
DR
PQ
Población de ítems
MIO
QQ
10
OY
ONIS)
=
Mp)
E
(¿MSG
Población de ítems
COSO
oo
ION
PROS
TD
DIC
Hay otras razones de carácter técnico que justifican la utilización de los diseños
matriciales múltiples. Así, en cualquier evaluación referida a grandes poblaciones de
sujetos y de ítems, estos diseños resultan recomendables, puesto que, además de per-
mitir la estimación de parámetros de una población de sujetos dada, se pueden calcu-
lar las diferencias entre parámetros para dos o más poblaciones.
Entre las limitaciones más importantes que presentan los diseños matriciales
múltiples podemos destacar las siguientes:
a. No permiten establecer relación entre los distintos ítems, pues para ello es
necesario que un mismo grupo de sujetos responda a los mismos ítems. La
matriz de correlaciones entre ítems tan sólo puede obtenerse para aquellos
ítems que se aplicaron a una misma muestra de sujetos.
b. Imposibilidad de estimar parámetros a nivel individual. Sólo se pueden ob-
tener a nivel global.
c. Un problema importante es que el muestreo matricial está basado en la
asunción de que la respuesta de un sujeto a un ítem es independiente del con-
texto en el que se presenta el ítem. Es decir, la respuesta a un ítem no depende
del orden ni del tipo de ítems entre los que se incluye.
d. Otra dificultad es la falta de guías teóricas con las que el usuario pueda deter-
minar el diseño matricial más eficaz para cada caso particular que se le pre-
sente.
e. Porúltimo, hay que resaltar lo complejo que resulta utilizar el muestreo ma-
tricial múltiple, desde la construcción de las pruebas, la planificación y el di-
seño de la evaluación, hasta el análisis de los datos.
plantear un nuevo diseño de evaluación. Entre los factores más importantes destaca
la concesión de una mayor autonomía a los Estados para gestionar los programas
educativos. Así, los departamentos educativos de los Estados adquieren una mayor
competencia en la mejora de las escuelas, pero, para ello, necesitan una información
más amplia sobre la efectividad de los programas educativos y la relación del rendi-
miento con factores tales como organización de las escuelas, formación del profeso-
rado, actitudes hacia las tareas educativas, etc. Esto tiene como consecuencia que el
NAEP deba realizar una evaluación que sea relevante para las administraciones loca-
les, estatales y nacionales. Por tanto, es necesario disponer de resultados a nivel de
centro, pero sin perderel referente de los estándares nacionales.
Con estos planteamientos, es necesario establecer correlaciones entre variables
de background, por una parte, y entre los distintos ítems, por otra. Para ello fue ne-
cesario buscar un diseño que permitiera que cada par de ítems fuera respondido por
el mismo grupo de sujetos. Es decir, en cada cuadernillo hay un número determina-
do de bloques de ítems, pero distribuidos de tal forma que con la totalidad de cua-
dernillos se consigue que todos los bloques estén emparejados al menos una vez.
Cada ítem es administrado el mismo número de veces, pero, además, cada par de
ejercicios es aplicado también un número de veces determinado. Esto implica que
cada ejercicio o ítem está incluido en diferentes cuadernillos. Por tanto, podría decir-
se que en el BIB cada estudiante contesta a diferentes ítems, y cada cuadernillo tiene
diferentes ítems. Sin embargo, hay unos pocos ítems que son comunes entre distin-
tos cuadernillos y que son contestados por más de una matriz muestral de sujetos.
Esto permite que se pueda hacer correlación de ítems. Véase la figura 40.21.
El muestreo que se ha utilizado en la década de los años ochenta se compone
de tres fases. En la primera fase, la unidad muestral eran las unidades primarias de
muestreo (UPM). Éstas se clasificaban por estratos definidos por la región geográfi-
ca y el tipo de comunidad. Si las UPM (o distritos de muestreo) resultaban muy pe-
queñas, se agrupaban de forma que tuviesen un mínimo de 1 500 sujetos por cada
grupo de edad muestreado. En la segunda fase, la unidad de muestreo es la escuela.
En esta fase se enumeraban, estratificaban y seleccionaban escuelas, tanto públicas
como privadas, dentro de cada una de las UPM seleccionadas anteriormente. En la
tercera fase, la unidad muestral es el alumno. Se eligen los alumnos dentro de cada
escuela; aproximadamente, se seleccionaban entre 16 y 25 alumnos por cada grupo
de edad.
Otra característica distintiva del nuevo diseño es que se recoge una amplia infor-
mación sobre los sujetos excluidos de la evaluación. Anteriormente, se utilizaban
tres criterios para descartar a los sujetos como miembros de la muestra: tener deft-
ciente uso de la lengua inglesa, desajuste funcional y retraso mental. Se decidió am-
pliar información sobre los sujetos excluidos por dos razones fundamentales. Pri-
mero, para saber hasta qué punto la exclusión de los sujetos con las características
mencionadas podría sesgar la representatividad de las muestras utilizadas. La segun-
da razón era saber si el grupo excluido está compuesto, a su vez, por grupos suficien-
temente importantes en cuanto a su tamaño y considerablemente homogéneos
como para ser estudiados. Así, se comprobó que la población de hispanos tenía unas
características culturales propias y un tamaño suficiente como para ser evaluados.
Dado que los hispanos no están distribuidos de una forma homogénea en los distin-
1020 Mariano Álvaro y Gualberto Buela-Casal
Población de ítems
53
oy
0D
O
oQ
"DC
DIR
|] Ítems no comunes
Ítems comunes
tos Estados, fue necesario modificar el muestreo a nivel nacional para asegurar la re-
presentatividad del grupo hispano.
En el proceso de elaboración y aplicación de las pruebas, se siguen las mismas fa-
ses que en el muestreo matricial múltiple. Sin embargo, hay una diferencia funda-
mental. En el diseño BIB cada cuadernillo está compuesto por tres bloques diferen-
tes. La composición de los distintos cuadernillos se realiza de forma que cada par de
bloques aparezcan juntos en un mismo cuadernillo al menos una vez. Esto constitu-
ye la característica principal del diseño BIB. El hecho de emparejar los bloques, al
menos una vez, permite calcular la matriz de correlaciones entre todos los ítems. No
obstante, este diseño implica la edición de un mayor número de cuadernillos. Así
por ejemplo, si para evaluar un área determinada se necesitan 165 ítems, en el diseño
matricial múltiple se construirían 5 cuadernillos con 33 ítems cada uno, es decir, un
cuadernillo sería un bloque. En el diseño BIB un cuadernillo estaría compuesto de
tres bloques de 11 ítems cada uno. Si tenemos en cuenta que los bloques deben per-
mutarse de forma que todos aparezcan emparejados una vez, sería necesario impri-
mir un total de 35 cuadernillos.
Diseños de evaluación de programas 1021
V. DISEÑO DÚPLEX
ítems, que resultaría excesivo aplicárselos todos a un mismo sujeto. Por ello, para
cada alumno se obtienen las puntuaciones en las distintas categorías y la puntuación
global del área se consigue promediando los valores de las categorías. Los objetivos
específicos se evalúan a nivel de grupo, para lo que se utiliza la totalidad de las prue-
bas aplicadas.
El procedimiento de elaboración de las pruebas comienza estableciendo la
población de ítems que evalúan los distintos objetivos del programa. A conti-
nuación, se clasifican por áreas y categorías. Luego, teniendo en cuenta el tiem-
po disponible para la aplicación, es decir, el número de ítems que puede respon-
der un alumno, se elaboran tantas pruebas paralelas como sea necesario para
cubrir la totalidad de los ítems, pero esto debe hacerse de tal forma que cada
una de las pruebas individuales (cuadernillo) constituya una muestra representa-
tiva de la población de ítems que evalúan las categorías. Ello permite que se
puedan obtener puntuaciones individuales a nivel de las categorías. Sin embargo,
el número de ítems que evalúa objetivos específicos que se incluyen en cada una
de las pruebas paralelas no es suficiente como para evaluar dichos objetivos a
nivel individual, por lo que es necesario analizarlo a nivel de grupo, pues de esta
forma se obtiene la totalidad de la población de ítems que evalúa los objetivos
específicos.
En la fase de aplicación o administración de los cuadernillos, las distintas formas
paralelas se distribuyen en rotación dentro de las clases. Así, los datos individuales
(relativos a las categorías) se recogen por medio de cada cuadernillo, mientras que
los datos a nivel de grupo (relativos a los objetivos específicos) se recogen a través de
K cuadernillos.
Este diseño es una variación del diseño descrito anteriormente. Podría definirse
como mixto entre el dúplex y el matricial múltiple. De hecho, para la elaboración y
aplicación de las pruebas debe seguirse el procedimiento descrito en ambos. Por una
parte, el diseño dúplex complementario facilita información general a nivel indivi-
dual sobre aquellas áreas que interesen. Simultáneamente, facilita información deta-
Diseños de evaluación de programas 1023
llada sobre las áreas analizadas a nivel global y, además, de otras áreas que sólo inte-
rese evaluar a nivel de grupo.
En la elaboración de las pruebas, se procede de igual modo que en el diseño dú-
plex, construyendo diversas pruebas paralelas para evaluar las áreas que interese ana-
lizar a nivel individual y de grupo, pero, además, en cada cuadernillo se incluye un
número determinado de ítems correspondientes a una o más áreas, cuyos resultados
sólo interesan a nivel de grupo. Para la inclusión de estos ítems, se sigue el procedi-
miento del muestreo matricial múltiple. Así, en cada cuadernillo, se incluye una ma-
triz muestral de ítems hasta completar la totalidad de la población de ítems para esa
área. Véase la figura 40.22.
Por ejemplo, si en la evaluación de un determinado programa nos interesa eva-
luar dos áreas, una de ellas a nivel individual y de grupo y la otra sólo a nivel de gru-
po, se seguirá el procedimiento del diseño dúplex para evaluar la primera, mientras
que la segunda se efectuaría según el diseño matricial múltiple, pero todo ello en los
mismos cuadernillos. Es decir, éstos tendrían dos secciones, una correspondiente a
los ítems que evalúan la primera área y que serían formas paralelas y representativas
de la población de ítems de dicha área, cuyo análisis se podría realizar a nivel indivi-
dual o de grupo. La otra sección estaría compuesta por una matriz muestral, no re-
presentativa, de la segunda área. Por tanto, sólo cabría hacer análisis a nivel de grupo.
En definitiva, se puede concluir diciendo que el muestreo dúplex complementa-
rio es el más apropiado cuando se pretende obtener resultados a nivel individual y
global en algunas áreas y sólo global en otras.
Forma A FormaB
Muestra de ítems Muestra de ítems
M M
u u
e e
Ss Ss
t t
r E r
a - a
d : d
e - e
a "
S E . Ss -
u : ; u .
] ; : ] ,
e . 2 e .
t ” r t r
O > O :
5) 6 S =
Forma C Forma N
Muestra de ítems Muestra de ítems
M a M
u - u
e y e
S . S
t + e AA os
F L r z
a : a :
d : d .
e A
.
O e
MA A => .
,
5 ES P A
E El . ¿
] ] : ,
e e - >
t t
o) o)
S S
MUBSIra e Ítems
M
po
Po
DA
¡A
a 4
CUA
as
OS
no t
d 0.
e Ss
S
ú
J
e
t
O
S)
a. Mañana:
b. Tarde:
VII. CONCLUSIONES
Después de revisar los distintos diseños que se pueden utilizar para la evaluación de
programas educativos, la pregunta lógica sería ¿qué diseño se debe utilizar? La res-
puesta no es fácil. Pues, como veremos a continuación, además de las preferencias
Diseños de evaluación de programas 1029
personales y/o institucionales hacia uno u otro diseño, puede haber una gran varie-
dad de programas susceptibles de ser aplicados en una gran variedad de contextos,
por lo que la decisión sobre el diseño más adecuada sólo es válida para cada caso par-
ticular. No obstante, consideramos que puede establecerse una especie de guía que
sirva para identificar a aquellos factores que estarían directamente relacionados con
el diseño utilizado. En el cuadro 40.1 se presenta de forma esquemática una relación
de dichos factores.
1. Objetivos de la evaluación
— Evaluar un programa estabilizado
— Evaluar la eficacia de dos o más programas
— Evaluar de forma permanente
— Evaluar objetivos generales o específicos
2. Características de la población
— Tamaño
— Estructura homogénea/heterogénea
— Distribución de los estratos
— Número de lenguas utilizadas y su situación
3. Tipos de resultados
— Nivel individual, de grupo o global
— Resultados sobre la totalidad de objetivos o sobre un criterio
4. Tipos de análisis
— Se pretende comparar grupos
— Se pretende hacer estudios correlacionales entre áreas
REFERENCIAS BIBLIOGRÁFICAS
Tiana, A. (1990). Prólogo al libro de M. Álvaro. Hacia un modelo causal del rendimiento aca-
démico. Madrid. Centro de Publicaciones del Ministerio de Educación y Ciencia.
Wolf, R. (1987). The nature of educational evaluation. International Journal of Educational
Research, 1, 11.
LECTURAS COMPLEMENTARIAS
Je 07 ea JA
mes olvidar.(Welkks
a
4 os- | Morasalmente, sees
est el viA
CALVO <A epalerio conecto Dra
+28. bi izables ona pollo
«SL OS
beros,
vn peto.
en | ps
4 Sm0 mejoras le
+ ¿eficiene as
6 A
1 sv Do E
pi. +
|
41. EVALUACIÓN DE PROGRAMAS
L INTRODUCCIÓN
Universidad de Granada.
1034 José L. Arco, Gualberto Buela-Casal y Fernando Justicia
bución de recursos, esto es, disponer y/o generar los apoyos políticos suficientes que
garantizasen la continuidad de los programas, independientemente de sus resultados
(Cronbach y Shapiro, 1982), se va imponiendo la necesidad de que sea la competen-
cia entre recursos y/o programas, basada en los resultados obtenidos, el mecanismo
que ajuste la supervivencia de unos servicios frente a otros y racionalice, con ello, el
uso de los recursos y fondos públicos. De esta forma, la incorporación de este tipo
de prácticas evaluadoras por parte de las distintas áreas y departamentos de educa-
ción, salud, empleo, etc. es una consecuencia de la progresiva estructuración y plani-
ficación de tales sectores desde instituciones y gobiernos, tanto a nivel nacional
como regional. Por tanto, la importancia de los efectos derivados de utilizar la eva-
luación como instrumento selectivo de las intervenciones a nivel social hizo depurar
al máximo los distintos modelos de evaluación que se utilizaban. De esta forma, fue-
ron los modelos experimentales, basados en el esquema tradicional de identificación
de variables, manipulación de las mismas y evaluación de los efectos de tales cambios,
los que gozaron de mayor prestigio, por su rigor, entre aquéllos encargados de po-
nerlos en práctica. Sin embargo, a mediados de los setenta parecía ya estar bastante
claro que no sólo con rigor metodológico se iban a solucionar los serios problemas
de utilidad que amenazaban el crecimiento y consolidación definitiva del área (Pat-
ton, 1984). Las críticas no tardaron en aparecer y cada vez más autores se revelaban
contra un modelo que en la práctica de la evaluación de programas sociales resultaba
inviable. La base para tal afirmación la constituyen las características presentes en la
mayoría de los programas sociales; éstas son la complejidad de los tratamientos, el
alto grado de indefinición de los mismos y la falta de datos que reflejen el “compor-
tamiento” de las variables relevantes durante los procesos que tienen lugar en el de-
sarrollo de los programas.
En la necesidad de realizar intervenciones evaluadoras se encuentra una parte
importante de nuestra red de servicios sociales. La consecuencia de esta situación es
la demanda creciente de modelos de intervención que permitan ir tomando decisio-
nes respecto al tipo y alcance de las evaluaciones a realizar durante los diferentes mo-
mentos y fases a tener en cuenta en un proceso complejo, como es la planificación,
puesta en práctica y posterior evaluación de un programa. Quizás, en esta situación,
el riesgo más importante que corre el área de evaluación de programas es el escaso ri-
gor con el que a veces se utiliza la palabra evaluación. Con el término evaluación se
definen, a veces, actividades que ni por sus objetivos (mejora de programas y de las
condiciones de información en las que se toman las decisiones), ni por el rigor de sus
procedimientos (recogida sistemática de información sobre un amplio conjunto de
circunstancias), ni por el uso inadecuado de sus resultados (por gente indicada), nada
tienen que ver con la auténtica evaluación de un programa. No obstante, es necesario
manifestar que la aplicación del rango de evaluación a investigaciones evaluadoras
dependerá de multitud de variables y factores imposibles de determinar a priori. So-
lamente, tras la evaluación de la evaluación, es decir, mediante la metaevaluación po-
dremos decidir si el conjunto de decisiones, actividades, datos y resultados obteni-
dos en una investigación puede ser aceptado como evaluación de un programa. En
este capítulo no se aborda el tema del análisis de necesidades, previo al diseño y
puesta en práctica de un programa de intervención; se asume que han sido procesos
correctos desde un punto de vista metodológico y técnico, los que justifican la perti-
Evaluación de programas 1035
Todos los elementos recogidos en los cinco puntos anteriores son importantes
de cara a disponer de un auténtico diseño experimental. Sin embargo, la realidad nos
dice que en la mayoría de las situaciones aplicadas no sólo no se dan todas las condi-
ciones, sino que tampoco lo hacen en la forma más adecuada, por lo que el grado de
experimentalidad del diseño elegido varía en función de cuántos de esos elementos
estén presentes y también de cómo se combinen entre sí. Las variables que a la postre
amenazan a la validez interna y externa del diseño elegido se distribuyen entre los
cinco elementos mencionados antes, en interacción con el tipo de programa objeto
de la evaluación. Por ejemplo, si estamos tratando de evaluar el impacto de un pro-
grama de prevención del consumo de tabaco mediante una campaña publicitaria en
medios de comunicación es difícil garantizar la neutralidad de las condiciones en las
que los sujetos del grupo control recibirán un tratamiento neutro, ya que los mensa-
jes contra el consumo de tabaco están presentes a través de distintos medios de co-
municación, en distintos ámbitos, lugares, etcétera.
características que permitiesen a cualquier evaluador llevar a cabo los distintos tipos
de evaluaciones posibles, en esta situación los objetivos de la evaluación, en un pri-
mer momento, han de dirigirse a determinar cuál, de entre los posibles tipos de eva-
luación, es la más idónea en función de la interrelación de los siguientes grupos de
variables:
Antes de entrar a determinar las razones específicas por las que eso ocurre es ne-
cesario preparar una descripción del programa que nos aporte una idea, lo más pre-
cisa posible, de todo lo que ocurre en el programa, desde el principio hasta el final.
Para ello, podemos acudir tanto a la información que el programa va acumulando
para su control y seguimiento interno, como a posibles informes o evaluaciones pro-
cedentes de agencias u organismos externos, o bien acudir a entrevistar al personal
del programa para confirmar por ejemplo la precisión de la información recogida en
los informes o memorias de los programas. En cualquier caso hemos de tomar cuan-
tas iniciativas se consideren necesarias para acceder a la información, fases y compo-
nentes del programa a analizar.
El resultado final de este proceso ha de ser un modelo de evaluación del progra-
ma no sólo susceptible de ser llevado a la práctica, sino también que satisfaga las ne-
cesidades de aquellos que financian, respaldan o participan activamente en la evalua-
ción. Quizás sea éste el extremo que diferencia, tal y como formula Patton (1986), a
la evaluación de la investigación básica. En este momento es cuando se han de tomar
las decisiones más importantes respecto al tipo de evaluación a desarrollar, alcance
de la misma, y especialmente los esfuerzos requeridos al personal del programa para
mejorar aquellos componentes del programa que no permiten por distintos motivos
(falta de registros de los procesos, insuficiente definición de los tratamientos, etc.)
llevar a cabo investigaciones evaluadoras más potentes. Veamos esto que acabamos
de decir en un ejemplo. Supongamos que nos piden evaluar un programa de carácter
asistencial, y tras analizar tanto las características del programa (por ejemplo, objet1-
vos, modelo de intervención y sistema de puesta en práctica) como los intereses de la
audiencia principal (por ejemplo, responsables del programa) concluimos que el tipo
de evaluación más idónea es una evaluación de los procesos implicados en el progra-
ma frente a la alternativa de una evaluación del impacto que ese programa ha tenido
sobre la población objetivo. En este caso, tenemos que tener en cuenta el riesgo de
llevar a cabo evaluaciones de los procesos que tengan lugar en el programa, ya que
por ejemplo, puede que podamos determinar la fidelidad de su implantación, res-
pecto al diseño inicialmente previsto en la planificación, pero no poder determinar
su idoneidad, si no disponemos de los resultados sobre cuál es el impacto real del
programa (Rossi y Freeman, 1993). Sin embargo, y de acuerdo con la obra citada de
estos dos autores, para poder disponer de datos sobre el impacto real del programa
es necesario primero disponer de los datos sobre los procesos reales del programa, es
decir, un conocimiento detallado de los procesos subyacentes a ese programa, lo cual
a su vez depende de que se haya dispuesto o no de un sistema para registrar los datos
procedentes de la supervisión llevada a cabo de los distintos componentes del pro-
grama.
MI. CONCLUSIONES
ni existe un trabajo prolijo de seguimiento del programa por parte de los agentes y
responsables de los mismos; condiciones éstas, tal y como veíamos anteriormente,
vitales para garantizar una evaluación con los niveles de fiabilidad y validez desea-
bles. En la figura 41.1 se puede apreciar de forma resumida y ordenada el conjunto
de elementos y componentes a tener en cuenta durante esta primera fase.
1044
NOISID3a
30 avavoOJ4 OSI008d
30 NO/993
EVZIIV38
YNA VUNIXYIN NOIOVINEOW3NI
13013
NO/OVANI
130 LS3 Odil
A JONVITV
NOIOVNIVA3 130 VNV4DO484 OdIL30 NOI9OVATIVA3 30 V1 NOIOVNIWA3
seunuialag
¡9 sauonsano sajelsusf
9/q0s VIVA
18 "SI Vanl43go0o9—
ousodoJd
ap e] ja :euelBold 'o]xajuoo pejunjopeomod
— SOSIIOQUIÍ—
uOIden|ena erJo]sIy
Á 'sausBllo SOIPAN— SO9ILUQUODA -9U/3)(Gujun
u9roeonsní'sonelgo pepilo1J
ua se¿— OLOVINI—
sepepIsaoau
¡euosjed
lap “ewelBold opejs3—
ep ewelbold /AVAINILOI4I-I1
sisipeuy
ap Se| uoSejgod 'ontalgo OlO|43N39
SA|ARIEA
[99 ojsandnseaJld
Á seuoljsans
:0]x8]UOO "SEAIJe1IsIUILUpe
seuo!seno
:S9|euoldezIuebo uoOloeou
ap ep|
sold
Á
sen!jezlueBbliO—
sIUILupSA
y— senuooesred
¡a odh ap
Sseoluouos3—
SeompoJd— seAmeJod10)— uorcenjena epiBaja
seyeuolduny—
ja
saje1nog—
ep
9/gqos
seuonsan7)
Á
uoIsinay
ap sonelq
Á o
ep
seo,oedse
ope1lb
seoBojopojaul
:ewelBold
osodoJ
ap e|d
J8yulleg
¡o1 ¡ap sonelgo— son!elado
uordenjena
epiBaja
e] ap
oJepoyy— uOI9uanJaju!
ep euagold
uoroIUIJap
'uorouanajul
Jopen¡ena
eua]sis
ojaepou 'onnelgo
u0!98zIjesoduwa] eua]sig— ejsand
ue eonogid
ejsand
a
seuolsan;) uorde¡god
eonoe1d
g— ue ap uOIsIMadns
pepiiqel4
Á —
zapIreaSOJEp
sa|qiuodsip
jap ue '"sopepini]08)
José L. Arco, Gualberto Buela-Casal y Fernando Justicia
Evaluación de programas 1045
En este marco se sitúan las llamadas evaluaciones ex ante en las que los evaluado-
res pueden planificar cómo se van a seleccionar los grupos control o comparación
previamente a la implantación del programa y por supuesto a su evaluación, aunque
sin poder asignar aleatoriamente a los sujetos a uno u otro grupo, es decir, que traba-
jamos con diseños cuasi-experimentales. Sin embargo, tal y como veíamos anterior-
mente, las características presentes en la mayoría de los programas no satisfacen lo
que la teoría establece como condiciones ideales para un diseño experimental, ni se
han incorporado los prerrequisitos de la evaluación en la fase de planificación del
programa. Al contrario, la circunstancia más frecuente que se plantea a la hora de lle-
var a cabo la evaluación de un programa, es que ésta no fue prevista durante la fase de
planificación (o lo fue de una forma incompleta), con lo que en la mayor parte de las
ocasiones nos veremos obligados a realizar evaluaciones de las llamadas ex post. La
principal implicación de esta circunstancia es que no se dispone de grupos control
con los que comparar los resultados obtenidos en el grupo que ha recibido el trata-
miento o programa, con lo cual hay que “construir” los grupos control una vez que
el programa está en funcionamiento o incluso ha finalizado.
Esta circunstancia es especialmente amenazante para aquellos programas deno-
minados de cobertura total, es decir, que ningún miembro de la población objetivo
ha escapado al tratamiento, por lo que no se dispone de sujetos para construir el gru-
po control. En estos casos, la construcción del grupo control se realiza mediante
procedimientos que podríamos llamar de “baja exigencia”, con lo que la validez y
fiabilidad de las conclusiones quedan seriamente reducidas. Entre otros procedi-
mientos tenemos los controles reflexivos, análisis de series temporales, medidas pre-
post, etc. En realidad, en estos casos no existe un grupo control auténtico, sino que el
grupo que recibe el tratamiento hace de grupo control, mediante el registro de medi-
das pre antes de aplicar el tratamiento y de grupo experimental, mediante el registro
de medidas post, tras aplicarle el tratamiento. Si, por el contrario, la cobertura del
programa es parcial, es decir, que en el momento de plantear la evaluación aún hay
sujetos pertenecientes a la población objetivo que no han estado expuestos al trata-
miento que facilita el programa, el rango de métodos de construcción de grupos
control es mayor. Es decir, que se dispone de más opciones a nivel metodológico,
con las que mejorar el grado de experimentalidad del diseño obtenido y por tanto in-
crementar el grado de certeza con el que se podrán plantear las conclusiones sobre
los efectos del programa.
Los procedimientos que se utilizan para la construcción de grupos control están
en función de que la evaluación sea del tipo ex ante o ex post. En el primer caso, por
ejemplo, si la asignación de los sujetos a los grupos control o experimental es aleato-
ria disponemos de los procedimientos estadísticos simples y complejos que la bi-
1046 José L. Arco, Gualberto Buela-Casal y Fernando Justicia
bliografía al uso pone a nuestra disposición para garantizar la equivalencia entre los
grupos control y experimental. Si, por el contrario, tenemos una de las evaluaciones
llamada ex post, los procedimientos estadísticos de construcción de grupos control
se hacen más complejos: análisis de regresión, controles genéricos, encuestas cross-
seccionales, etc. Para un análisis de las implicaciones que para el área de evaluación de
programas ha tenido la incorporación de los diseños de grupos a la investigación
evaluadora puede acudirse a Buela-Casal y Arco (1998). En la figura 41.2. se puede
apreciar de forma resumida y ordenada el conjunto de elementos y componentes a
tener en cuenta durante esta segunda fase.
V. PLANIFICACIÓN TEMPORAL
SINOIOVIMIdNI
SsIsIpeue
ap UO/9ezI|eal
ap odula| “g
sopezI|1n sojuauun11sul o91081d ¡anu y—
SO| 9P ZAPIJEA o91Bojopojau ¡anu y—
epibooal
soyep
SauJojuloIny— -UOISRONNSAP
op
:SOJep ap epiboday
sojuavn1]sul
u019ezInn
UOIDBJOQB|3
o10|1d
OMPeneno—
¡euo¡9e¡aJJo9—
08]sanu ap
3p Á
VINVE4DONOYO ¡ejuauedxa-senog—
JeJoqel3 elSoye]se Je/0qe|3 ¡ejuawladx3—
30 NOIOVA
Md ON3SIO
IVA
SOLWO 30 VAIDODIS
Evaluación de programas
SOLVWO 30 SISIIYNV
aliSada
NOIOVZIVEOdAN31 A VdAIDODI8 30 30 SOLNINAELSNI
NV ld 4V4O4V13 A'SOCOLAIALSOS a JS Ta
sul a sopojau 9p Uu01999]] «JISPYT
UOIPAIPAOS 9p SoJugun “ETp VIADIA
1048 José L. Arco, Gualberto Buela-Casal y Fernando Justicia
¿Uuo!9ejue¡duul
ap uejd aqrsog?
sopez!¡eue sope]nsas sope1nsaJ ap
so| ap uo1oezJueBio se| qe) ¡euor9oajuo?)
SINOI/OVONINOD38 Á uo 1080 !!Iselo
soyep so] JaBo99)
SseuoIsn|9uo9 sopeynsaJ Á sojuaun4]sul
JeJ0epay SO| SP SISIPUy SO] Je.ISIUILUPY
OUdYNIIAVY SYIN VOVN3SIO
3INHOWNI 30 OdiL SsOLVO NOI/OVA IVA
Evaluación de programas
REFERENCIAS BIBLIOGRÁFICAS
LECTURAS COMPLEMENTARIAS
conductual, 15, 24-31, 33, 36, 41, 43-47, 58, Impulsividad, 693, 695-697, 700-701
67-68, 70, 71, 81, 85, 89, 91-92, 95, 97, 99- Independencia local, 209, 213
101, 113, 117-119, 122-124, 130-131, 133- Indicador
135, 140-142, 144-145, 164, 167-168, 171, cognitivo, 925-927, 941, 943
385-386, 411, 419-420 conductual, 925, 941-942
computarizada, 35 _ fisiológico-bioquímico, 926, 934-935, 942
continua rendimiento deportivo, 934, 942 Índice
de programas, 1001-1003, 1005, 1007, 1009, de dificultad de un ítem, 174
JOLIE AIO1S ADS LOLAGSLO19, 1021, 1023, de discriminación de un ítem, 176-177, 179
1025, 1027-1031, 1033-1037, 1039-1043, Informe
1045-1047, 1049-1050 escrito, 224, 226-228
del desarrollo, 659, 661-663, 665, 667, 669, oral, 223
671-675, 677,679, 681 psicológico, 221-225, 227, 229-233, 235, 237-
dinámica, 562, 564, 571-574, 576-582 238
del potencial de aprendizaje, 609, 614, 616- Insight, 590, 595, 598-599, 601, 605-607
617, 626-628 Instrumentos de recogida de datos, 1043, 1047
estadística, 506, 509-510 Integración, 111, 122, 129, 133-136, 141
estandarizada, 564, 566, 572-573, 582 Inteligencia, 523, 525-553, 555, 557, 559-561,
intuitiva, 506 564, 568, 573-574, 577, 580-581
neuropsicológica, 421-431, 438, 441, 450, cristalizada, 529, 539, 546
452, 732 fluida, 529, 539, 546
psicofisiológica, 397, 405-406, 413, 419 general, 525-531, 533, 535, 537-539, 541, 543-
psicológica, 71-75, 77-89, 91-99, 101 547, 549-551, 553, 555-557
en España, 49, 51, 53, 55, 57, 59, 61-66, 69 Interaccionismo, 832-833, 849
tradicional, 25-27, 32, 37, 44, 81, 89, 97, 101, Interdisciplinar, 131, 137-138
125, 130, 132, 144-145, 164, 168 Intereses, 901-917, 919
Exactitud, 343, 345, 349-356, 360-361 Intervención ambiental, 989, 994-995
Expectativas, 851, 853, 857, 862-865, 873 Introspección, 297
Experiencia de aprendizaje mediado, 609 Inventario de intereses, 902-907, 910, 912-916
Experimentación, 150, 152-153 Inventarios, 305, 312
Explicación científica, 103, 108 Investigación, 904, 912, 915, 917
Ipsativa, 474
Falsabilidad, 108, 115
Fiabilidad, 173, 176, 179-182, 184-189, 303, Juicio diagnóstico, 165-167
307, 311, 313, 315, 330-333, 370, 374-376,
410-411, 1039-1040, 1042-1045, 1047-1048 Lactato sanguíneo, 939-940, 944
de la entrevista, 289 Lenguaje, 422, 427, 430-431, 433, 435-436, 438,
Flujo sanguíneo, 390-391, 394-396, 419 440-442, 444, 447-448, 451-452
Formalización, 103, 107, 111, 114, 116, 120, escrito, 749, 753, 759-761, 767
128 no verbal, 736, 767
Función de información, 216-217 verbal, 733-737, 740-742, 747-748, 750-753,
Funcionamiento prosocial, 793, 817-819 756, 758, 767, 769-770
Funciones cognitivas, 614-615, 620, 624, 626 Lugar de control, 859, 862-866, 877, 880
Memoria, 428, 430-431, 433-436, 438, 441-442, conductual del entrenador (CBAS), 930, 932
445-447 sistemática, 315-316, 321-323
baterías de, 635 Orientación, 429-433, 437, 441-442, 444-445
cotidiana, 636, 638-639
no verbal, 634-635, 639-640 Paradigma, 109-111, 115, 127-130, 134, 136,
verbal, 634-635, 648 143
Metaanálisis, 567 constructivista, 111, 127-130, 143
Metacognición, 711, 714-716, 721-722 Pensamiento en voz alta, 304-306
Metacomponentes, 593, 595-597 Percepción, 951, 956-957, 966, 970, 973, 975,
Metamemoria, 631, 634, 636-638, 641 978, 980
Metodología observacional, 315-318, 329-333, de la verticalidad, 686, 688, 698-699
336, 338-341 Pletismografía, 391, 393-394, 396-397, 419
Método Poder discriminativo del ítem, 206
científico, 149, 151, 153, 155, 157, 159, 161- Podómetro, 372
162 Potencial de aprendizaje, 609-617, 619-621,
correlacional, 152 623-628
de clasificación del rasgo, 847 Precisión, 315, 318, 330-333
de descripción libre, 847 Predicción científica, 108
de inferencia del rasgo, 846 Presión sanguínea, 388, 390-391, 394-395, 407,
deductivo, 160-161 419
factorial, 830-832, 842-844, 848 Prevención, 662, 673-674
hipotético-deductivo, 163 de accidentes, 951, 968
inductivo, 158-160 Principios deontológicos, 240, 244
MFF-MFF20 (Test de emparejamiento de figuras Probabilidad
familiares), 693
condicionada, 496, 508-510, 512, 514-515
Microestrategias, 713-714, 722
de acierto al azar, 213
Modalidad, 568, 570
Problemas :
Modelo
conductuales, 791-801, 803-805, 807, 809,
causal analítico-funcional, 512-513, 515-516
811-813, 815, 817-819, 821, 823, 825
conductual, 106, 110-113, 116-126, 128, 130- de aprendizaje, 697
137, 139-142, 144-145
de enfermedad, 110-114, 118, 130 de lenguaje, 734, 753
de «evitación de amenaza», 953, 960 emocionales, 791-799, 801, 803-805, 807,
de «riesgo cero», 957, 964 809, 811-813, 815, 817-819, 821, 823, 825
español, 961, 967, 969-970, 972 Procesamiento de la información, 683-684
homeostático del riesgo, 956 Proceso
logístico, 205, 213-214, 216 de evaluación, 221, 223, 226-227, 229
médico, 111-113, 135, 140, 145 de evaluación psicológica, 163, 165, 167, 169,
psicodinámico, 111-116, 128, 132, 134, 140, 145 171
psicométrico, 17, 20, 24, 30, 110-111, 115- psicomotor, 665-667, 675
118, 124-125, 129-130, 133-135 Procesos
Modificabilidad estructural cognitiva, 609, 613, cognitivos, 713-715
626 representacionales, 475
Motivación intrínseca, 711-714, 723-724 Pruebas
Muestreo de evaluación psicológica, 239-247
de tiempo, 345-348 psicométricas, 80
observacional, 322 Psicodiagnóstico, 18, 32, 34, 40-41, 44-45, 55-
Multidisciplinar, 137 59, 64-65, 67, 69-70, 71, 73, 79-84, 86, 94, 96-
101, 252, 268-269
Narraciones, 346 Psicofisiología clínica, 385, 420
Psicología
Objetividad científica, 147-148 científica, 8-9, 49, 51, 54, 56, 65
Observación, 150-152, 155, 252-253, 255, 257, cognitiva, 852
260-261, 264-26, 423, 429, 737, 739-741, 744, de la personalidad, 829, 833-834, 847, 849
746, 759-760, 778-779, 796, 806-808, 812 de la Salud, 113, 123
Indice analítico 1055
del deporte, 923, 925-927, 929, 931, 933-937, del observador, 332-333, 338-339
939-945,
947 Sesiones de observación, 321-322, 335-337
Psicometría, 10-11, 54, 56, 69 Simulación, 308
Psicotecnia, 49-50, 52-55, 69, 78, 80 Sistema
Publicaciones periódicas, 62 nervioso autónomo, 391, 393, 416, 419
nervioso central, 391, 393, 401, 419
Q, metodología, Sistemas de categorías, 319-321, 333
clasificaciones Q, 459-460, 464, 486 Situacionismo, 832
perfil-modelo, 462-463, 465 Socialización, 773-778, 780-783, 787-788
Sociograma, 784-786
Rasgo Solución de problemas, 708, 710, 713, 715-716,
latente, 205, 208-210 720-722
psicológico, 116, 135 STAT (test de Sternberg para medir habilidades
Rasgos psicológicos, 831, 833, 835, 837, 839, de la inteligencia triárquica), 589, 595, 600,
841, 843, 845, 847, 849-850 604, 606
Reestructuración cognitiva, 686, 688, 699 Subteoría
Reflexividad-impulsividad, 684-687, 692-693, componencial, 595, 605
696, 703 contextual, 595, 599, 605
Registro práctica, 606
de duración, 347
de frecuencias, 347, 354 Tasa cardíaca, 394, 407, 414-415, 418-419
de sonido, 746 Telemetría, 405-406
observacional, 321, 325, 340 Temperatura corporal, 388, 391, 396
Rejilla, técnica de, Tendencia de respuesta, 308, 313
complejidad cognitiva, 473 Teoría, 103-110, 112, 114-115, 117-118, 120-
índice de intensidad, 474 121, 127-128, 130, 133, 140, 143
ordenada por rangos, 471-472 clásica, 205-208, 216-218
significatividad, 473 de respuesta al ítem, 202, 205, 207-211, 213,
Relaciones 215217219
funcionales causales, 496-497, 500, 502-506, triárquica, 589-591, 593-595, 597, 599-601,
IMEI 603, 605, 607-608
sociales, 794 Terapia de conducta, 58, 89, 91, 99, 101
Rendimiento, 559-562, 564-567, 570, 572, 574- Test, 252, 256-257, 262-264, 266, 268
576, 580-582 clasificación de, 461, 479
académico, 691, 693, 697, 703 de aprendizaje de posición, 620, 622
escolar, 711-712, 714, 723 de atención (K-T), 647
máximo, 254-255, 259 de bandejas o Plateaux, 622
típico, 254-255, 259 de desarrollo, 659-677, 679, 681
REP-test, 466, 469-470 de diseño de patrones, 620, 623
Resolución de problemas (procesos y tareas), de ejecución continua (CPT), 646
684, 691-692, 696 de figura compleja, 620-622
Respuestas endocrinas, 940 de figuras enmascaradas, 688-689, 699, 702-
RFT (Test del marco y la varilla), 688, 698 703
Rol de entrevistado, 272, 274-275, 282-288 de memoria asociativa, 620, 622, 625
Rol de entrevistador, 272, 274-276, 282-290, de organización de puntos, 614-615, 618-620
295-296 de organizador, 620-621, 623
RRT (Test de la habitación rotatoria), 688-689, de progresiones numéricas, 620-621, 623
698 de Raven, 612, 616, 620, 622, 624, 626-627
de selección, 665, 667-668, 671-672
Seguridad vial, 949, 951, 953, 955-957, 959, 961, Tests
963-965, 967-969, 971-973, 975-980 adaptados al sujeto, 217-218
Selección de personal, 901, 915 de estado, 925-926, 930
Series temporales, 511 de inteligencia, 525-526, 529-532, 539, 544,
Sesgos 546-547, 549, 551-553
de la observación, 333 de rasgos, 940
1056 Índice analítico
PSICOLOGIA
ETOLOGIA
PSICOLOGIA MORAL
PSICOLOGIA
ALDAZ, J. A, y VAZQUEZ, C. (comps.)—Esquizofrenia Fundamentos psicológi-
cos y psiquiátricos de la rehabilitación. 488 pp.
AVILA, A., y POCH, J. (comps.) —Manual de técnicas de psicoterapia. Un enfoque
psicoanalítico. 792 pp. Empastado.
BUELA-CASAL, G., y CABALLO, V. E. (comps.)— Manual de psicología clínica
aplicada. 562 pp.
BUELA-CASAL, G., CABALLO, V. E., y SIERRA, ]J. C. (dirs.)—Manual de eva-
Inación en psicología clínica y de la salud. 1.152 pp. Empastado.
BUELA-CASAL, G., y NAVARRO, F. J. (comps.)—Avances en la investigación
del sueño y sus trastornos. 480 pp.
CABALLO, V. E.—Manual de evaluación y entrenamiento de las habilidades so-
ciales. 432 pp. Empastado.
CABALLO, V. E. (comp.)—Manual de técnicas de terapia y modificación de con-
ducta. 1.016 pp. Empastado. (3.* ed.)
CABALLO, V. E. (dir.)—Manual para el tratamiento cognitivo-conductual de los
trastornos psicológicos.
Vol. 1. Trastornos por ansiedad, sexuales, afectivos y psicóticos.. 776 pp.
CABALLO, V. E., BUELA-CASAL, G., y CARROBLES, J. A. (dirs.)—Manual
de psicopatología y trastornos psiquiátricos.
Vol. 1. Fundamentos conceptuales; trastornos por ansiedad, afectivos y psicóticos.
864 pp.
Vol. 2. Trastornos de la personalidad, medicina conductual y problemas de rela-
ción. 824 pp.
FERNANDEZ RIOS, L.—Manual de psicología preventiva. Teoría y práctica.
608 pp.
GARCIA CUETO, E.—/Introducción a la psicometría. 264 pp.
GARCIA MADRUGA, J. A.—Desarrollo y conocimiento. 144 pp.
LEON-CARRION, J.— Manual de neuropsicología humana. 576 pp. Empastado.
URRA, J., y VAZQUEZ MEZQUITA, B.—Manual de psicología forense. 472 pp.
VERDUGO, M. A. (dir.)—Evaluación curricular. Una guía para la intervención
psicopedagógica. 784 pp. Empastado.
VERDUGO, M. A. (dir.)—Personas con discapacidad. Perspectivas psicopedagógi-
cas y rehabilitadoras. 1.464 pp. Empastado.
SALUD Y SOCIEDAD
e.
AA
La evaluación psicológica constituye un claro ejemplo de la evolución que ha
experimentado durante los últimos años la psicología en general. En la
actualidad, la evaluación psicológica hace referencia a un concepto que
engloba la aplicación de tests y el psicodiagnóstico. La aplicación de tests
constituye únicamente una pequeña parte del proceso de recogida de
información que supone la evaluación psicológica; esta última disciplina va
más allá de la simple recogida de información, pues exige la formulación de
hipótesis, su contrastación, así como la toma de decisiones con respecto a los
instrumentos con el fin de alcanzar unos objetivos preestablecidos
(descripción, clasificación, predicción y/o cambio). Por otro lado, una
segunda característica de la actual evaluación psicológica es que va más allá
de un simple diagnóstico, pues sus objetivos se ampliaron de una persona en
concreto a un grupo, a un ambiente o a un programa o tratamiento. El libro
está estructurado en seis partes (aspectos conceptuales y metodológicos,
técnicas de evaluación psicológica, evaluación de la inteligencia, evaluación
del aprendizaje y desarrollo, evaluación de la personalidad y evaluación en
otras áreas), participando más de cuarenta destacados especialistas
españoles y extranjeros que lo convierten en un significativo exponente de la
actual evaluación psicológica.
ISBN 84-323-0953-2
| 000 |
9"788432"309533