Psicológica: Manual de Evaluación

Gualberto BuelaCasal y
J. Canos Sierra (dirs.)
Manual de evaluación
psicológica
Fundamentos, técnicas y aplicaciones
yo
r— : j »
5 LE OA $
TR ss de AN
AAA TE
p, J
lo Eeye
es ll
Jeomal 0 del or A JS
AA
á |
” m
'
.
'
'
le
mA he
(
l Ao
P os ós PUNA '
e ; %
S
Todos los capítulos que componen el presente manual
son originales y han sido escritos (en inglés o español)
expresamente para el mismo. Los capítulos 16, 17, 21 y
32 han sido traducidos y adaptados del inglés por Miguel
Ángel Martínez-Cabeza.
MANUAL DE EVALUACIÓN PSICOLÓGICA
Fundamentos, técnicas y aplicaciones
por
GUALBERTO BUELA-CASAL
y J. CARLOS SIERRA
(dirs.)
siglo veintiuno editores, sa
CERRO DEL AGUA, 248. 04310 MEXICO, D.F.
siglo veintiuno de españa editores, sa

C/ PLAZA, 5. 28043 MADRID. ESPAÑA
Todos los derechos reservados. Prohibida la reproducción total

o parcial de esta obra por cualquier procedimiento (ya sea
gráfico, electrónico, óptico, químico, mecánico, fotocopia, etc.)
y el almacenamiento o transmisión de sus contenidos en
soportes magnéticos, sonoros, visuales o de cualquier otro
tipo sin permiso expreso del editor.
Primera edición, noviembre de 1997

O SIGLO XXI DE ESPAÑA EDITORES, S. A.
Calle Plaza, 5. 28043 Madrid
O Gualberto Buela-Casal y J. Carlos Sierra
DERECHOS RESERVADOS CONFORME A LA LEY
Impreso y hecho en España

Printed and made in Spain
Diseño de la cubierta: Pedro Arjona
ISBN: 84-323-0953-2
Depósito legal: M. 43.204-1997
Fotocomposición e impresión: EFCA, S. A.
Parque Industrial «Las Monjas»
28850 Torrejón de Ardoz (Madrid)
A Mariano Yela,
«el cimiento científico más sólido en el que
se sustenta la evaluación psicológica española»
Digitized by the Internet Archive
in 2022 with funding from
Kahle/Austin Foundation
htips://archive.org/details/manualdeevaluaci0OOOOunse
ÍNDICE
PROLOGO, Vi A A
TREFACIO ae AENA a ece
PRIMERA PARTE
ASPECTOS CONCEPTUALES Y METODOLÓGICOS
1. EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA,

Gualberto Buela-Casal y J. Carlos Sietra..........oocnmammmmmmiimiicn
LINAÓN o CNO
II. LA EVALUACIÓN PSICOLÓGICA EN LA ANTIGUEDAD coccion
IL. ANTECEDENTES CIENTÍFICOS DE LA EVALUACIÓN PSICOLÓGICA coccion.
IV. CONSTITUCIÓN Y DESARROLLO DE LA EVALUACIÓN PSICOLÓGICA ..........
A E E E A e e RO
ai ie loe o o london: ceso: ori ce
io e ed di EN
WE, POACIOES LENA UA
IV.5. Larepercusión de la primera y de la segunda guerra mundial.........
Iv.6. Período de crisis de la evaluación psicolÓgiCa......accaconommmmm.m..
Wita eralvación conducir E. mis
Y. LAEVALUACIÓN PSICOLÓGICA ENLA ACTUALIDAD narnia
acc
Vis ¿Crisis dela evaluatión conductual cancer pasos

ya O tosaspectos de actualidad ocaso noc As
NIF EUTURO DETA EVALUACIÓN PSICOLÓGICA Lorea coa coconoeeocoeonco nooincnnccatnss
REEBRENCIAS BIBLIOCRACICAS e oe lar oscila oia sobeon celvereda av obea cade cabe csinenss
TECTURAS COMPLEMENTARIAS Le A do oido dotan and cani don darias
2. EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA

EN ESPAÑA, Gualberto Buela-Casal y J. Carlos Sierra...
io ÓN Ns e e Eo AMO NO
IL. LACONSTITUCIÓN DE LA PSICOLOGÍA CIENTÍFICA (1900-1936) .aoconmomonoonono»
II. RECONSTRUCCIÓN DE LA PSICOLOGÍA (1939-1952) ocoononommonsincncncececnsreorss
VII Índice
IV. CONSTITUCIÓN DE LA EVALUACIÓN PSICOLÓGICA COMO DISCIPLINA

sanear card OUR ALOaotada
UNIVERSITARIA (19831974) aosocnanerónresirnenaneeraci ciaas 55
V. CONSOLIDACIÓN Y DESARROLLO DE LA EVALUACIÓN PSICOLÓGICA
A A LO E E ROO OA 58
REFERENCIAS BIBLIO CRAN estada Eaiaran US ORETOSS 64
TECTURAS COMPLEMENTARIAS o osea a cab oasis SETAS 66
3. CONCEPTO DE EVALUACIÓN PSICOLÓGICA, Gualberto Buela-

CAY CAPOS SAVE Train ora aca rc aa Y
LA INTRODUCE
O eS 71
To LADEENICIÓON: TIPOS AREA SOON ll
Ma. Importancia de la A at ea (aio 71

a o tl rt et lr EE 72
IIS" Reglas de ladelición ol a ao pea 75
H:--APLIGACIÓN DETESTS PSICOLÓCIOOSA A A 78

Ve PSICODIAGNOSTICO e a o E A IS)
Ve -EVALUACIÓN ESICOPOGICA: teAE ON 83
VIE VALORACIÓN a AA 86
VI EVALUACIÓN CONDUCTA A A 89
VIE" OTROSTERMINOS A rn ta diria JE E OL IN A 92
VIL1. Medida psicológica. E 92

VITE2..- EXAMEN PCI A E E 93
IX. LAEVALUACIÓN PSICOLÓGICA A TRAVÉS DESUS ACTIVIDADES cccoococoncnno. 94
A O a A A Pl IIA UN ALO 94
íx2.— Publicaciones ct No E A IIA 95
Dc3.. Actimdades protesionales. oi 9
A CONELUSIONES a A A 96
REFERENCIAS BIBTIO CRA 97
EECTURAS COMPLEMENTANRA 101
4. MODELOS DE EVALUACIÓN PSICOLÓGICA, Gualberto Buela-Casal y

Ls A E 103
+ INTRODUCCION dt o o 103
Ml. DELIMITACIÓN TERMINOLÓGICA Y CONCEBTUAL a Oi Ea 104
11. COSO AN 104
A E it A 104
1L3...... Modelos cientificos. ALEDIC
ABLA CAOS
OEA 106
TL.4....-Eormalización y “axiomitiz ación A OOO. 107
Índice
IL5. Explicación y predicción científica Pr rr rr rr rr rr rr rro rr rr rro

IL6. — Paradigmas Prrrrrrrrrrrr rro rro rr rrrrrcrr rr rrrrorrrorrrrrrrorrrrcrrororcrrcrrrrorsocrccorcrcrorossoo.s
II. MODELO DE ENFERMEDAD Pr rro rro crono rr or oro rro rro rro coro rrrrrrrrrrorcocororos.
IV. MODELO PSICODINÁMICO Pr rr rr rr rr rro rro rro rro rr rr rr error rro o rro nooo orcoranorocacocoso
V. MODELO PSICOMÉTRICO Pr rr rr rr rr rro rr rr rr rr rr rr rr rr ros rr rr orar c rr oo rr cr cororcrro coso.
VI. MODELO CONDUCTUAL Pr rr rr rro rr rro rro rr rro rro src arco rra rro rro rr ro rr rorrororoaoccoso
VIL MODELO COGNITIVO Pr rr rro rr oro rro rro rr rr or rro rr rro rro rro rro rr ron oros rro roo roo 9..
(rr rr rr rr rr rr rr rr rr rr reso rr rr rro rr rro roo rro rro 029
Pr rr rr rro rr rr rr rro rro rr rr rra rr rro rr rr raro
Pr rr rr rr rro rr rr rr rr rr rro rr rr ros rr rr rr roo rr rr rro
ar Erecncismonslida o oso de AS. o

A o 1 AAA
X3. Interdisciplinariedad Pr rr rr rr rr rr rr ross rr arc rro rro rr rr
PRRERENGIAS MIS IOGRACICAS nn inata aa

ERETURAS COMPLEMENTARIA e rnoee neodiario
o iuainaceo
5. MÉTODO CIENTÍFICO Y EVALUACIÓN PSICOLÓGICA, Gualberto

AS A e E E A A ME
TENA RO DEAON O a ada

IL OBJETIVIDAD CIENTÍFICA Y CONVICCIÓN SUBJETIVA .coccccoconononinnoncnonosoonona
HIMACARA CUERÍS CAS DEE MELODO CLENTELCO odas
ERICA CON CEN TO A O ae iaa:
IV.1.- La verificación en el proceso.de cOnOCiMiENtO..a.caccnaconoconconconionocanesa

IV.2 Procedimientos de verificación Ida iio contri coaseta
IV.3. Concepciones epistemológicas de verificación ..ccumnmommmmms
V. MÉTODO INDUCTIVO VERSUS DEDUCTIVO ....... POPE
EE metodo dui E A A pp sista nas

VA E tOdO dc A o o iaa
REFERENCIAS BORA ee emermeneanroiDrareccnsbadaS

DoiesseasE oia oo3siaaados
LECTURASCOMPELEMENTARIAS: corcconcccococcccinecconosocondaronnono
norosnrono somencononncnonsarana saodencncconncnanos
6. EL PROCESO DE EVALUACIÓN PSICOLÓGICA, Gualberto Buela-

Casal, Miguel Ángel Verdugo y J. Carlos Sierra o.
DAMINIRODUCCIÓN A A AR A A OA A accio
EL PROCESO EN LA. EVALUACIÓN TRADICIONAL: ssaacóbónasonosonónaoridiasasorienconos
MAMEPROCESOENMENEVAL UA CIÓN CONDUCIDA iio
WEBERENCIAS BIBROCRAECA atari erstes iio IAS
A AN IN A A A
X Índice
7. PRINCIPIOS PSICOMÉTRICOS DE LA EVALUACIÓN PSICOLÓGICA,

Mariano Álvar ii inserc ion
eoeisrct esos censos
ANA es 173
rene nonrnanera
Ll. ANÁLISIS DE ÍTEMS .cuccccnoconnnnnnnca ncnnncnros
nonenenrana ernrnrnenenenteneenanann 173
E OL A A 174
IN CA 176
II. nnnonancn
nencannancnnnacnnns
LAFIABILIDAD DE UN TEST occconccononccnnncnnnrnnononanonacnonnnnenocencnnc 179
111. Fiabilidad absoluta y relativVa.....ooononosamarsosnsnssorinosscareosacensenaacagaso 179

m2. Elerrortípico de medida ....muooromamnmmrscasesoresarmoronrnsaaanacacas 180
13. Lafiabilidad de un estadístico y la fiabilidad de las diferencias ....... 181
114. Estimación del coeficiente de fiabilidad: fuentes de error, méto-
A II A 184
TIL. EA VALIDEZ DE UN/TESTE oonaoqonocnosananasoooocoo oaronoarnsncenaronannaarana cacon orsasoncasasnosoccncao 189
TA CACAO E E 189
A A a rt 190
REFERENCIAS BIBLIOGRÁFICAS rr rr rr rr rr rr rr rr rr rr rr rro 192

LECTURAS COMPLEMENTARIAS rr rr rr rr rr rr rr rro rr raros rr rro 192
8. MEDIDAS ESCARARES Euiz Pasqualt y EoCArlos SEXTA score astas 193
E INTRODUCCIÓN parara aa ai EA A A a 193
E A 193
2... Conceptede propicdad sl 193
Lun Concepto de menudanes 194
IL. TAMEDIDA EN PSICOLOCIA aa 194

A A A 194
2. Pundamentación y velos de Meda aaa psa 195
MS PS AMA rd 195
IT. TÉCNICAS DE CONSTRUCCIÓN DE ESCALAS rr rr rr rr rocoso rr rr rr rr 197
nL1. Escalas psicofísicas PP rr rr rr rr rr rr rr rr rr rr rr rr rr errors rr rr rn 197
nL2. El enfoque de Thurstone (rr rr rr rr rr rr rr rra rr rr raro rr rr rr ros erro 198
13. El enfoque de Likert (Pr rr rr rr rr rr rr rr rra rr rro rr rr ros rro rr 199
IIL4. El enfoque de Guttman Pr rr rr rr rr rar rr rr rocoso rar rr rear 200
rr rr rr rro rr raros rr rr rr 201
Pr rr rr rr rr rr rr rr rr rr rr roscar rra rar rra roo rro rc rr rrcccro roo so 203
Pr rr rr rr rr rr rr rr rro rro rr rro rr ron or ser ro rr rro narra rnororososo 203
Pr rr rr rr rro rr rr rr rro rar rre c rro rr rro rro or roer orto caooorooo 204
Índice XI
errronrrrrarcrc.... 205
ll Pr rr rr rr rr rr rr rro raros oros rr rro rr rro rrorocerccrcrsscosss 205
IL. rorrrcrrrrorrrcoror oro... 205
TIL. Prrrrorrrrrrcrrc corr... 208
111.1. Dimensionalidad del espacio latente .....ononmmesm..... 208
E A A A AA 209
IIL3. Las curvas características de los ÍteMS ...cuonooonionoonannennsme 210
IV. PARÁMETROSDELA CURVA CARACTERÍSTICA DELÍTEM coconnrnenannesinasnos 210
A O o taatn E 210
A 212
AA A A E o: MIDEN AO A + GRA 213
A EA AA e EN a PISO MARE POE TIO DA 213
V. PRINCIPALES MODELOS UNIDIMENSIONALES DE LA TRl .ccoocnnoccconccinnnonnoronos 213
V.1. Modelo logístico de un parámetro o modelo de Rasch.................... 213
va: "Modelo logístico de dos parámetros nnaimetemecieensnat
renteronacoscaccnsar rear 214
VS Modelo Jopisuco Ue tres PArÁnietros inem rre conri 214
VI PASOSPARA LA'CONSTRUCCIÓN DE UN TEST .crtcnnremcanpoerranerec ona 214
VEL Analisis delrasoo io a pro tcoceneri iones mortis 214

vI2. Elaboración de un conjunto de ÍtemS ....uocmonoomooesssmmsmr. 215
E AO O O RN 215
VL4. Unidimensionalidad del rasgo o de la variable a evaluar ................ 216
MiS guste almodelo elegido ss 216
To EStumacion de lOs Paralelos ermermreteso pontiac erecta 216
VILA FUNCIÓN DE INFORMACIÓN Iori bs 216

VII. APLICACIONES DE LOS TESTS CONSTRUIDOS BAJO LOS MODELOS DE LA
A A 217
VIIL1.- Tests adaptados al sujeto (Tailored Tests) caroninciaricisanenseriiniiencenees 217

VII Comparación de pUNCUACIOnES ces moasntracle resortes ales susto 218
DE A 218
RBEERENCIAS BIBLIOGRÁFICA eo tncoccenacaccnrea neon soso ecropeserion tacrteoDd sed UE aceanad e ovindas Esos 219
LECTURAS COMPLEMENTARIAS o.nccconoconncconacccnnnosccrcnnnccarenconcccccncnnncccncnrnanccrccnn
noncranonccnacarccnano 215
10. EL INFORME PSICOLÓGICO, Fernando Jiménez .......ccoaammmnmm.. 221
UO O LON E
ENE O S 221
IL. CONCEPTO Y OBJETIVO DEL INFORME ooomoccnccccncnnnnnnnonnconncnnnnnansnncnnanarononarannnass 222
UI TIPOS DE LNEORME PSICOLOGICO coooceoeranrceo toser eco oie CR SCELd pues 223
A A A 223
111.2. El informe escrito Pr rr rr rr rr rr rro rra coronar roo. 224
XII Índice
IV. CARACTERÍSTICAS FUNDAMENTALES DEL INFORME PSICOLÓGICO .ccncoos. 227

V. MODELOS DE INFORME PSICOLÓGICO occccncconmosnonnnnonenncnrannnnnnnennnncanasannannanannoos 228
VI. ALGUNAS CONSIDERACIONES PARA REDACTAR EL INFORMEmmcconcononoanaos 234
REFERENCIAS BIBLIOGRÁFICAS occrooconconocnroncnncnu nonn
naconenanronnncranoenenrennnsnrenes
nonnrnnanarnenannonnonann 237
LECTURAS COMPLEMENTARIAS oocccccccccnconcncncacanannnnna nen as 237
11. DEONTOLOGÍA Y EVALUACIÓN PSICOLÓGICA, Leandro S. Almeida

y Gualberto Buela-Casal....mamomommmnmmmmnrrmnrermerres 239
LE INTRODUCE E across 239

IL. PRINCIPIOS DEONTOLÓGICOS EN LA EVALUACIÓN PSICOLÓGICA .ccucooroos 240
111. Los procedimientos, el material y las condiciones de evaluación... 240

12-"""Lossujetosumplicadosemdorevaluación:: ALMA... iso 242
IL3.. Interpretación de los resultados y conclusiOn€S.....aawmmomrmmmom. 245
IT. CONCLUSIONES: costociccnionos cias necencscnes aos casop sados anpsrooo tape radosa donen nieda sea anonimas 245
RERERENCIAS BIBUOGRAPIGAS eones aos ri ii scope Tn dat ces Ds 247
LECTURASCOMPLEMENTARIA ra sae 247
SEGUNDA PARTE
TÉCNICAS DE EVALUACIÓN PSICOLÓGICA
12. CLASIFICACIÓN DE LAS TÉCNICAS DE EVALUACIÓN PSICOLÓ-

GIGA, Carmen Garcia-Montalvo or IRA LAROLE, DIO. cacon 231
1. INTRODUCCION AS cti ito dd a o ten 2301

II. TÉCNICAS DE EVALUACIÓN. ACERCAMIENTO A TRAVÉS DELAS CLASIFI-
CACIONES MÁS RELEVANTES Pr rr rr rr rr rr rr rr rar rr rr rro rr ro ro 23)
IL1. Clasificaciones según criterios (criterio único) rro rr rro ro rr rro rra rc rr oro 253
IL2. Clasificaciones según autores (combinación de criterios) eoormsrorosro... DS
TIL. EL«STATUS» ACTUAL DELAS TÉCNICAS DE EVALUACIÓN PSICOLÓGICA . 264

REFERENCIAS BIBLIOGRÁFICAS rr rr rr rr rr rr rr rr rr rr rro rs rr rr rr rr carr rra 267
LECTURAS COMPLEMENTARIAS (rr rr rr rr rr rr rr rr rr rro rro rr rar roer rr rro nor rror oro oo 269
13. LA ENTREVISTA, Jorge Fernández del Valle rr rr arco rr rro ros rr rr raro r error rro roo 271
Pr rr rr rr rr rr rr rr rr rr rra rr rr rr rr rro ron roscar sarro roo 271

Pr rr rr rr rr rr rro rr rr rr rro sor rro rr rro rro rr roo 22
rrrnrorr nro rro rro sore carro roo 273
(rr rr rr rr rro rr rosso r rro rro rro rro roo rro nora rorcor or... 276
Iva. ""Entrevista diagnóstica O O 278
IV2. La entrevista conductual Pr rr rr rr rro or rro rro oros rro rr ro rr oros oro rro 280
Índice XUHI
LA ENTREVISTA EN SELECCIÓN DE PERSONAL rr rr rr rro rr rr rr rr 281

VL LA ENTREVISTA COMO INTERACCIÓN Pr rr rr rr rr rr rr rr rre rr rr rr rr rr 283
VIL1. El papel del entrevistador (rr rr rr rr rro rr rr rr rr rr rr rr rro rro rro rro rro rr 283
MSI papeldelienttons OVA LICEO ITA IZA. 2 286
VI3. Aprendizaje del papel de entrevistador rr rro rn rr rr rr rro rre rr rr 288
vIl GARANTÍAS CIENTÍFICAS DE LA ENTREVISTA rr rr rr rr rr rr rr rro rro rro rr rr 288
VIL1. Fiabilidad Pr rr rr rr rr rr rr rr rr rr rr rr rr rr rro rr rra rra rr rr rre raro nooo o 288
vIL2. Validez Pr rr rr rr rr rr rr rr rr rr rr rr rr rro rro rro rr error il
VII. 292
(rr rr rr rr rr rr rr rr rr rr rr rr rr ross rro rr rr 293
Pr rr rr rr rr rr rro rr rr rr rr rr arras rr rr rre 296
DA
DO
297
TIL. 305
MT Cuestionarios inventarios escala ar rerrni 305

ME SN AAA AAN REIS 306
IV. FACTORES QUE AFECTAN LA BONDAD DE LOS AUTOINFORMES occronnconnoooss 307

REFERENCIAS BIBLIO CERATI. A a aaa 313
PECTURAS COMPLEMENTARIAS Tal TO or OCCISO 314
151 LA OBSERVACIÓN, Vicens Quera y Júlia Bebar incaico SL)
La DEFINICIÓN Y CARACTERÍSTICAS DE LA METODOLOGÍA OBSERVACIONAL . SS

IL CODECACIÓN DETACONDU
EA ene
eal oa escalas ogooisa: SMiz
mt. - Elección delas conductas a Observar ..icoonccoionaniononónonnaconconnniananonancnnoos 317

mo) ndadestconductuales a e 318
EAS ESRRA LE CAR AE A A 319
TIL. rocoso
RECOGIDA DEDATOS OBSERVACIONALES ooncocancconcoronnnonnonancancnncnnancccnncano Sl
nro Medidas conductuales agp ARA ea: 321

12. Muestreo observacional y sesiones de Observación .ocucccoconnnnonmemns. 322
3. Reglas de muestreo intrasesional de sujetos y reglas de registro ..... 325
14 Obtención de medidas conductuales a partir del registrO............... 327
CONTRO DETACAMDADDE LOS DATOS das air barca dineros 329

a Se A A 330
A O A EA CRIA Sl
XIV Índice
IV3. Validez. anciana A A LD A trio 332

IV.4. Sesgos del observador y de la ObservaciÓn.......a.mommmm 332
Y... n
calar pivacres oscar doaoeneses
CLASES. DE ANALISIS DEDATOS osoroncadanaooaoscabosaonsnbonsa 334
VL ÁREASDE APLICACIÓN DE LA METODOLOGÍA OBSERVACIONAL .cccinconnooo 336
REFERENCIAS BIBLIOGRÁFICAS ooooonciconncaonesaconiónonenionaneconioncnninnnoiocisdadonanian dosnbanncnconenccccconconnas 338
LECTURAS COMPLEMENTARIAS ococcccccccooonannnoncnononananonconnonccnnnnnononor ncnncnnnc
cnn anarnnnnnnonnnnncannennns 341
16. LA AUTOOBSERVACIÓN, James D. Herbert y Rosemery O. Nelson-Gray.. 343
IL. INTRODUCCIÓN
Y DEFINICIONES oocuonmconocncnonconconcencenconcenreecnnrnnrnrn
cencencencanenss 343
II. FUNCIONES DEL AUTORREGISTRO .oococcccononooonornccnccnnccnoraroncccnnnccncocancancnaccnnoncnos 344
II. PROCEDIMIENTOS DE AUTORREGISTRO oomcconcccccsacocoronconccnasncoranconcnncanconasanconos 345
MA DR e 346
O A A 347
Ha... Registros de la duración Lt ARIAS TE 347
A E A A 347
IIL5s. Procedimientos de autorregistro pasivos y/o Mecánicos ...ccmmoo 348
e reee do o ld nd de 349
MI "Gra RAS 349
IV" EXACTITUD DETOSDATOS DE AUTORREGISTRO ctecre eootondocecorincate
rossones 349
Iv.1. Exactitud de la conducta externa autorregistrada ....ucnoncnnoesens»*m”. 349

Iv2. Exactitud de la conducta interna autorregistrada.....mmmmmonmmes*”m*.. 350
V. VARIABLES QUE AFECTAN A LA EXACTITUD DEL AUTORREGISTRO occumcnnoo 351
W.ts= Conciencia de la evaluación de la exactitud ..oncenooncnorerencrcacmssorenecess 351

W2. Refuerzo dependiente dela exact. 352
Y3.MNaturaleza dela conducta AO ASS 352
va. Registro de respuestas CONCULTERTES. omar 352
E O 353
A 599
Y7... ¡Entrenamiento en qutorresistrodono ld 353
V.8. Características del instrumento de autorregistrO ..auocicnonnornnesosos. 354
VI. PROCEDIMIENTOS PARA MEJORAR EL EMPLEO DEL AUTORREGISTRO ...... 354
VIL ESTIMACIÓN DE FRECUENCIAS 355
VII. FUNCIONESTERAPÉUTICAS DEL AUTORREGISTRO .cccccnonmcocosuenancarironconionas 356
IX. VARIABLESQUE AFECTAN A LA REACTIVIDAD DEL AUTORREGISTRO....... 357
IX-1... Motivación para el cambio de CONdUCTA. 2 cntrcacrianarepirenracaonsaaracn

canon 357
EX 2, alencia de la conducta coa AN 357
1x3. — Instrucciones del Experimenta 358
IX4. Objetivos, refuerzo y retroalimentación ..nccnocoesmsss. 358
IX.5. Número de conductas que se autorregistran conjuntamente.......... 359
BX6.. Naturaleza dela conducta nm a A 359
Índice xv
EU MMomenito del torres ACA LAA LAIA 359

EX.80= Blan delavtorregistrocasmnarrr ir aan 360
IX.9. Naturaleza de los procedimientos de autorregistO..... mmm 360
Ko EGONCELUSIONES A DIRAN aula d nal hores ls caia O EA AA oidos 361
(Pr rr rr rr rr rr rro rr rr rro rra rra rra rr rro rar 361
Pr rr rr rr rr rr rr rr rr rr rr rr rr rr rr rro rr rr rr rr 366
Rd ore enme Il Ata e otra nr ete te nor PRI 369
AA e dd A np e dic rs E 369
EA La actividad como factor del temperamento .ccccccconaconcnnoconcnnsnnsons 370

12. Lahiperactividad como factor de externalización de trastornos en
E A A AI E VACA 370
SAS TAS
A IO ct Ecarccso 371
II. INSTRUMENTOSPARA EL REGISTRO DE LA ACTIVIDAD MOTORA cooommcosononoos 371
A OOO EE No a ol oir tai 371

20 Medidores de lamclinación Lal id eemercenbabilanerocaoas 372
A... Medidores delmormimiento uti it LEE cinc rucicanincicins 372
kay piMeédidoresdelaaceleración: sud talca Ea paanins 343
¡E A DARAS
AE RRA ATRAPAR 374
A abilidad IOSTEOIDERtalanotaron
nte reco 374
O AA A A RA 3
PS ENDA ARSAA ed 376
nus. Podómetros y contadores de pasos tenian paca 376

120) Medidores de la MICUNACIÓN. cromos mecenas rias lepra non cióndnsticondaóns 376
WMiciiMedidóres dela aceleración: LAA 577
ANS
Y O A A OA 377
ER AAA EA 77
A E O ARO ALA 378
v.3. Muestreo de situaciones (validez de los resultados) ...........wcncoo...... 379
A AAA NS AAA A edo pao cc 380
a A de 380
A IES O coiree rbciiemeoness 381
A ON OE o ORO 381
REFERENCIAS BIBLIOGRÁFICAS rr rr rr rr rr rr rr rr rr rr rar rar rro 382
LECTURAS COMPLEMENTARIAS rr rr rr rr rr rr rr rro rr rro rro cr ro rro 384
XVII Índice
21. ANÁLISIS FUNCIONAL DE LA CONDUCTA, William H. O”Brien y

Stephen N. Hayn€S ocres 493
L... INTRODUCCIÓN mesero nisnarcn incaico dedo 493
Il. FORMULACIONES CONDUCTUALES ACTUALES DE LOS TRASTORNOS DE
CONDUCTAS ESAS A A 494
IT DEFNICION DEL ANALISIS FUNCIONAL aosncan encanto senos ene acens inca caben e stes 495
IV. VARIABLES COMÚNMENTE INCLUIDAS EN LOS ANÁLISIS FUNCIONALES. 498
Iv1. Topografía de las conductas analizadaS......wcarprrncrmsrrncsrrmseeenccns 498

1vz.'* Topografía de los factores determinantes ara cacormencanenncninnanonconsosase 499
V. REDUCCIÓN DE LA COMPLEJIDAD DE LA EVALUACIÓN: PAPEL DE LAS

PRESUPOSICIONES EN EL CAMPO:CAUSALÉ cctcncancaracancacancanmaconnansorananacanananianónas 500
VL IDENTIFICACIÓN Y EVALUACIÓN DE LAS RELACIONES FUNCIONALES
CAUSALES tintas doo as Eo donde Titi irana Osa ndannaganesnens anios daa da nasasas ina aesSa 502
VL1. Métodos empleados para la obtención de datos de las relaciones

funcionales. as idande los alias e rs 503
VI2. Evaluación de la magnitud de las relaciones funcionales causales... 506
VI... MODELO CAUSAL ANALÍTICO FUNCIONAL: UN MÉTODO PARA INTE-

GRAR Y SINTETIZAR DATOS.DE EVALUACIÓN ¿Ltda cuadh nadaa ronca canino bica 2
515
516
516
324
TERCERA PARTE
EVALUACIÓN DE LA INTELIGENCIA
22. EVALUACIÓN DE LA INTELIGENCIA GENERAL, Leandro S. Almeida

y Gualberto Buela-Casal Pr rr rr rr rr rr orar rr rra rr carr raro rr rr rr nrcorcrrroccranoo”. 525
L"NTRODUCCIÓN E OI A 525
IL. DEFINICIÓN Y EVALUACIÓN DE LA INTELIGENCIA Irrrrca oro r rr rr rar roo rr rnrra coco”. 526
IL1. Lainteligencia como entidad COMPUESTA ..uoccaccnnonioninonsonncnosnernsens 526
112. La inteligencia como entidad simple (factor 8).....auccnnananncnnsos 527
13. La controversia en torno al número de factores rrrronerrrrccrorcrncrrororaoso. 528
III. CLASIFICACIÓN DE LOS TESTS DE INTELIGENCIA rr rr rr rro rro rr socorro rosas 530
IV. TESTS COLECTIVOS DE INTELIGENCIA rr rr rr rr rr rr rro rr rr rr rro rro oro reno rosas 531
Iv.1. Revisión histórica de los tests colectivos de inteligencia AS 531
Iv.2. Características de los tests colectivos de inteligencia... 532
Iv.3. Ventajas y desventajas de los tests colectivos de inteligencia common...» 533
IV4. Descripción de algunos tests colectivos de inteligencia enrrncrrrnorsrscso.. 533
Índice XIX
VW... TESTS INDIVIDUALES DE INTELIGENCIA ¿ld adanccadaderoiacoso 537

V.1. Características de los tests individuales de inteligencia ................w... 538
V2. Descripción de algunos tests individuales de inteligencia................ 539
VI. CONSIDERACIONES SOBRE LA EVALUACIÓN DE LA INTELIGENCIA .......... 546
VI1. La controversia social en torno a los tests de inteligencia ................ 546
VI2. Laseríticas alostests de inteligencia. v.corcioraosiontoninderinsoeremer 547
VI3. La discrepancia entre la concepción y la evaluación de la inteli-
TIRSO
PEREA RIAD PETRA 549
VI4. Cambios previsibles en la evaluación de la inteligencia.................... 550
ALAN CUNA a RO ori 551
VIL1. Fiabilidad y validez de los resultados en los tests de inteligencia .... BO

vIL2. El papel de las críticas a los tests de inteligencia .........cmeacnnr 552
VIL3. Eluso inteligente de los tests de inteligencia... 532
RRFERENCIAS BIBLIOGRÁFICAS coonrmomensmmaamc

e AS 553
TECIURAS COMPLEMENTARIA dieron donen cae donan tro RR RRE TERRA ETS y
23. EVALUACIÓN DE LAS APTITUDES, Carol Robinson-Zañartu y Daniel

Y. RESTO DEE VALIA CA DOS AMO A EL POTESCO CASO 559
LT RODUCCIÓN e da IIA 559

11.- CONCEPTO DE APTITUD, INTELIGENCIA Y RENDIMIENTO Jo caciocnconecneniccnios 399
II. CARACTERÍSTICAS COMUNES DE LOS MODELOS DE APTITUD Y SU EVA-
UNO ER SS A MT SS, e OA, ET, E la el a 560
TIL1. Algunas consideraciones acerca de los procesos COgNitiVOS ............ 560

12. Variación en los niveles de respuesta en el individuo contra dife-
rencias de nivel de respuesta entre individuos ..cucccnncnnnocesensasees 561
111.3... Mejorías en el rendimiento escolar ....c..comomsmmmm”$*.”*<.s¡» 561
114. Mejorías en el funcionamiento cognitivo general ......cacommm. 562
DIFERENCIAS ENTRE LOS MODELOS DE'APTITUD ...ooooocnoneconeoono

sesosonvssrevosoneoo 562
Iv.1. Estabilidad contra cambio en las aptitudes ...aaaceonncnarenrarencesen». 562

Iv2. Orientación hacia el producto contra el proceso ...aacamamammmo. 563
mar Planteamiento de la tramsterenCia tad canontontocacoocucanascncena
rostiososcnecnenas 563
Iv.4. Evaluación estandarizada contra evaluación dinámiCa ...ueaaammom. 564
Iv.5. Aplicabilidad para la toma de decisioneS .oucccaaninnonnnennennnsmneros 564
MODELOS DE EVALUACION DELAS APTITUDES vo coocoooesocsdaceción snorsacnicigenconnssos 565
v.1. Modelos psicolingúísticos y perceptivoMOtOTES eammeancnononnninnneennos 565

v.2. Modelos de interacción entre las aptitudes y el tratamiento ............ 567
vL EVALUACIÓN DINÁMICA/MODELOS DE CAMBIO ooconconconnconsoncancinncencenenancasss 571

XX Índice
VI1. Gama de modelos dinámicos .ononconanenannnssnccmncerrcnrrrrrnrncess 571

vI2. Objetivos para el aumento del funcionamiento COSNItIVO caaaarrrnmrrros 573
vL3. Objetivos para el aumento del rendimiento escola? macacos 574
vI4. El tratamiento paralelo del contenido y el proceso para la transfe-
rencia distante al rendimiento escolar ...ooaomoionenremsrsnemecses 575
vI5. Laevaluación dinámica y la mediación de estructuras cognitivas y
iden N 576
vLó. Modelos de estabilidad contra modelos de cambi0 .a.ucaaanannonranrenens ZA
vI7. La atención dinámica al proceso frente a la atención estática al
o 578
vrs "PLD CA eela eau 579
via. Transferencia de resultados .cursnereemarrersosine
po ree 579
vLto. Las aplicaciones en la toma de decisiOMES oorvoreaaasszaconarnacaacansarentoneanas 580
VE Ex validez de tratamiento. On ccoo... RIAS Armcidolomaroaaras 581
VIL CONCLUSIONES. cuoncanacdrassas Sano iesnopasosr cascos endosar cactinodacdron nda de danne aenompedadngona2a02na 581
REFERENCIASBIBLIOGRAFIGAS Trracecocecoenoino carino dono o ras niooe cios Tinoco EOI UE R E E00S 583
LECTURAS COMPLEMENTARIAS csocorroosotonaniiicaniooto
orar diesieIci GIR cORO danIIIId diodedd ciande 587
24. EVALUACIÓN DE LAS HABILIDADES DE LA INTELIGENCIA:

TEORÍA TRIÁRQUICA DE LA INTELIGENCIA, Robert Sternberg y
Maria Dolor Ba E a ON 589
Ls RO UN 589
L.... ANTECEDENTES HISTORICOS ¿A a EAT. 20. 590
IL.1. LA perspechWa PSICOMICTEICA secar aero onto Roto E Sat E ROCES 590
M1EZA LA Perspectra psico ii o IZ
113: Procesamientodé liinformación bis sans llar 592
III. FUNDAMENTACIÓN TEÓRICA DE LA INTELIGENCIA TRIÁRQUICA ronmsasons. JN
1.1. Componentes de la inteligencia individual Perro rro rr rr rro rr rr ro 595
nas Procesos de la inteligencia experiencial rr rr rr rr rar rar rr rra rr rro 598
IEL3., La inteligencia práctica Pr rr rr rr rr rr rr rr rr rr rr rr rr rr rr 599
IV. EVALUACIÓN DE LOS COMPONENTES DE LA INTELIGENCIA arororrcrrranconoss... 600
VAL: Componentes dela modalidad verbal 3 ..cinacasrralidje erase sic 600
12: Componentes de la modalidad cuantitativa 600
IV.3. Componentes de la modalidad figurativa rrrrnrrr rr rre rr rr rr rr rr rr 601
V. EVALUACIÓN DE LA INTELIGENCIA EXPERIENCIAL morros oros rr rr ron orar oro 601
Elle Evaluación de los procesos de imsigbt.......cccccnnonnisncininenes. 601
v.2. Evaluación de los procesos de automatización rrrrrrrrarr corr rro rrrnrcorconssso 602
VI. EVALUACIÓN DE LA INTELIGENCIA PRÁCTICA rr rr rr rr arre rr rr rrr rro rar rr 603
VIt. Inteligencia práctica-modalidad verbal rro rro rr rr rr rr rra rr rro 603
Índice XXI
vI2. Inteligencia práctica-modalidad numérica rr rr rr rr rr rr rr rr rro rr 603

VI3. Inteligencia práctica-figurativa Pr rr rr rr rr rro rro rro rra rro roo rro rro o 604
VIL EL FUTURO DE LA EVALUACIÓN DE LA INTELIGENCIA rrrrrrrrrarnrrrorcrrcnrosor... 604
REFERENCIAS BIBLIOGRÁFICAS Pr rro rro rr rr rr rro corr rro rr rro rro roo rro rrororrrrrrrccrcccrcorocos. 606
LECTURAS COMPLEMENTARIAS Pr rr rr rr rr rr rr rr rra rro rro rr rr rro rro rro o rr rr oro roce rororrorercarco... 608
Prieto Pr rr rr rr rr rr rro rr rr rr rro rro src rro sonoros rrrr ron rr rrorrrorrrrororrrorororrcororrorcrsrco... 609
Pr rr rr rr rr rr rr rr rr rr rr rr rr rr rr rr rr rro rr rr rr rr 609
610
11. Antecedentes de la evaluación dinámica (1920-1940) )...ccconoconicininnns. 610
uz” "Diseños expermentales (1 O o ia aa caia 610
IL3. Diseño de teorías, instrumentos y modelos de evaluación dinámi-
ARONA ELO SIGE UE OSO DA 200%. TP AAA 611
CONSIDERACIONES GENERALES DE LA EVALUACIÓN DINÁMICA DEL

POTENCIAL DEAPRENDIZAJE (EDO a a 613
OBJETIVOS DELA EVALUACIÓN DINÁMICA o... is otitis AREA 614
PROCESOS DE INTERACCIÓN EN EL POTENCIAL DE APRENDIZAJE ..cccocnooo. 616
TESTS DE EVALUACIÓN DINÁMICA DEL POTENCIAL DE APRENDIZAJE ..... 617
VI1. Instrumentos perceptivomotores ense eniecencoo se cnescsoccnos 620
VI2. Instrumentos de evaluación de los procesos superiores de la inte-
A Ri O E IN e ONE RA 620
vL3. El Raven: evaluación de los procesos de razonamiento .cuonecoromonosos. 622
VI4. Instrumentos de evaluación de la memoria y de los procesos de
o A 622
REFERENCIAS EII CABAS eat dra re lr dio leyó lcd cines 626
LECTURAS COMPLEMENTARIAS vevouoncooconcasconorconsacanosnnccononosanonncrvsronnrccanonon
Igonac raoncoc ndaraarenccnan 628
CUARTA PARTE
EVALUACIÓN DEL APRENDIZAJE Y DEL DESARROLLO
26. EVALUACIÓN DE LA MEMORIA Y LA ATENCIÓN, ]. García-Martínez,

]. M. Rodríguez-González y Alfonso Blanco-Picabia.....wmmmmmmmmmo 631
Il. LAMEMORIA Y SU EVATUACION A A A O o a ica ds 631
EN Historia de la evaluación de la memorla....ccoocornnononannnnnnnnonoccnnonannnanosa 631

12. Concepto de MeMOTlA occ rrnrianess 631
13. Procedimiento clínico en evaluación de la memorla.....ononicicnnnnnnnennns 632
L4. Procedimientos de evaluación de la memorlA...cccocoonnnononncnrnnnenicnnisnass 634
LA ATENCIÓN Y SU EVALUACIÓN oooconiconnonncannnnaninoninocononacanicsnonananananconeanonosoness 641

XXI Índice
na — Introducción as o 641
112. Concepto de atención mocosenrreenceennnes 642
ma ¡Modalidades de tención Lt ai 643
Mu Evaluición dla A e EE MES T Tos 645
REFERENCIAS BIBLIOGRÁFICAS oonoconnnccososaroe nano ncsooco renonone r ona slots oo UE pies ae 650
LECTURAS COMPLEMENTARIAS oococococococoomocscnsorcacsoscoccccaconcacacoracaconnacococrorcacarcaraconacoreccccccoocs 657
27. EVALUACIÓN DEL DESARROLLO SENSORIOMOTOR, Carmen

Maganto cnmmcnmacmsncmmsrmmrmrmerrrmmenccrr erre 659
ml NEL ALO e A AE SAT 659

IL CONCEPTO DE DESARROLLO Y SU IMPORTANCIA EN LA EVALUACIÓN
DEL DESARROLLO SENSORIOMOTOR DE LA PRIMERA INFANCIA occcocacoooross 661
TI. CONSIDERACIONES Y CARACTERÍSTICAS DE LA EVALUACIÓN eomonconsnonononos 663
IV. CLASIFICACIÓN DELAS ESCALAS DE DESARROLLO... ocnnconccanesincoconanecessescaraoso 665
Iv1. Escalas psicométricas de evaluación del desarrollo infantil ............. 665

IV 2.., ,¡Escalas de funcionamiento COgnmitiyo joccseuoressarrqooromaertersaoras enema 669
v. GARANTÍAS PREDICTIVAS DE LA EVALUACIÓN DEL DESARROLLO occcrccnonos 671

REFERENCIAS BIBLIOGRÁFICAS AR O DO Rs 674
TECTURASCOMPLEMENTARDAS otrora dea TO TU RSS SES RRE So ES 676
683
E 683
IL 684
TIL. 685
IV. 686
IV.1. Pruebas de evaluación de la dependencia-independencia de
tenio seats e IDO PA 688
Iv.2. Principales implicaciones de la evaluación de la dependencia-
independencia dScaapo eee bei 690
REFLEXIVIDAD-IMPULSIVIDAD (R-I) Pr rr rr rr rr rr rro rr ross rr rro 692
V.1. Pruebas de evaluación de la reflexividad-impulsividad.......e.wc..... 693
v2. Principales implicaciones de la evaluación de la reflexividad-
impulsividad PP rr rr rr rr rr rr rro rr rro rr rr rr rr rro rr rro rro ercer rasero ros 696
vL GARANTÍAS CIENTÍFICAS DE LAS PRUEBAS DE EVALUACIÓN DE LOS ESTI-
LOS COGNITIVOS PP rr rr or rr rr rr rr rr rr rro rro rro oros rra ros rro rra orenooro so 698
VL1. Garantías científicas en la evaluación de la DIC Irorrrrrrrorrrrr rra rr scorcacroo. 698
VI2. Garantías científicas en la evaluación de la R-1 rrrreror ron nono rocoso rro rar arc so 699
REFERENCIAS BIBLIOGRÁFICAS Pr rr rro rr rro rr rro rro rr rro ars ros rrr oros rr ross rcercroccor.. 701
LECTURAS COMPLEMENTARIAS Pr rr rr rr rr rr rr rr rr rss rr rn rar rr rro rro rerorrr rro rcrranororroos.. 704
Índice XXI
29. EVALUACIÓN DE LAS HABILIDADES DE AUTORREGULACIÓN,

SA AAA AA AA
A a de cert bc e cod
4. CONCEPTODE AUTORREGULACION (ARarcoaqan agro carac
III. LA AUTORREGULACIÓN EN LA INVESTIGACIÓN EDUCATIVA occoocccccnoncononos
TIL1. Autorregulación y comportamiento social .occoconnonnicninnnsn.

12. Autorregulación y rendimiento escola «occ.
II3..... Autorregulación y metaCogniciÓoliiciacican citalatasdendotonoconiaciliónanocoanno
EV..... EVALUACIÓN DELA AUTORREGULACIÓN nonsrarario A od
IV... Estructura y funcionamiento del sistema de autorregulación .........

1V:2 La autorregulación, un sistema ablertó .aomaocamsanacannensricassionraoccrocasamos
IV. Evaluación de habilidades de autorregulación del alumno .............
IV.4. Evaluación de aspectos ambientales que inciden en la autorregu-
¡A A ie tanda Ma
REFERENCIAS RIBELIOGRÁFICAS vr ISS SS LIS AI

EXCTURAS COMPLEMENTARTSA OA A ata ai oir,
30. EVALUACIÓN DEL LENGUAJE, Victoria del Barri0..........uommmmmo
A A O A A A EAT
IRETENGUATE SOS ASPE TOSE VALIA ronsano scans coseno nsoRocacssassas
IL1. Distintas áreas de evaluación del lenguajE.accuinicnacinecacneniannnccareenos

11.2. Elementos del lenguaje que se evalúan ..oucomomommonmorncasoassoaserscsssss
1.3. Estrategias para la evaluación del lenguaje mamo
ME PROCESO DE EVALUACION DELELENCUATEcraneo
sas ende eeaancsaposa
IV. “TÉCNICAS DE EVALUACIÓN: DEL EENGUAJE: .oouocnoonoonanconenennonannnrnanapcasenonocadosa
AAA TO ET AAA RARA

PD ERE NES NM A A RARA
V. PRUEBASESTANDARIZADAS..ccomcmomoosscsosocccnnnannnnnonanonanecnnncncnnccconanenananonenanconaconno
v.1..... Pruebas globales de evaluación del lenguajO..aiiciconiciocarrorronimenirascanoso

M2 Pruebas EspecÍÍICaS omar IES dl ES. rl lcsonnoo
VI PRUEBASNO ESTANDARIZADAS occococoonsococcononnnrnonnnnnancnnonnnannnnnonannanononanaccnnnanans
VL1. «Análisis en la interacción verbal profesor-alumno» (Sanjuán, Fer-

nández y Marteles, 1974) ...ccaaoniomannmescsnannamemnnnmsrersress
vL2. «Bellugi interrogation test» [Test de interrogación de Bellugi] (Be-
nenes
llugi, 1978) .auucocnoonnsnnoneonnconaonrceneocannaranononenronneconnncennennnsenrananesnoron
vL3. «Word order production: An elicitation task» [Orden de producción
de palabras: tareas de elicitación] de Capman (1981) oacoccocaonaroorraroononooos
XXIV Índice
vI4. «Visually cued language cards (VCLC)» [Método visual para esti-
mulación del lenguaje] de Foster y cols. (1991) ...aaucananiornoernmess» ns 757
vI5. «The Stycar language test » [Test de lenguaje Stycar] de Sheridan
O Ad RASEra 758
vLó. Otras metodologías no estandarizadaS oumenranonoconcrnerennernneannienrennanos 758
VIL EVALUACIÓN DEL LENGUAJE ESCRITO .ccoccnoccnonnaoranconaonanonnnonanananonncncacanonnnnnos 139
vIL1. Recomendaciones para la evaluación del lenguaje escritO.....aaaumm.. 760

vIL2. Métodos de evaluación del lenguaje eSCritO ..aonconainonnenncorcercercencnsenees 760
VII. onrccnnncnccnno
coronar
CONCLUSIONES...ccccccooononccnconccnnnanancnnnanoccnronononncnon anna nrnnananaranonos 766
REFERENCIAS BB LOERAFICAS tna Raros cai aca aa LESOTO 767
noncnroccnonannncnnnnnonannnannnn
nnonroonononor
LECTURAS COMPLEMENTARIAS occccconcconcananncnconcncnrnn nacanacannnoss 771
31. EVALUACIÓN DEL DESARROLLO PSICOSOCIAL, Teresa Kirchner...... 773
L INTRODUCCIÓN sens ronaraanoaruaaneno senos room reno gamIsns ones pad esó si aedaa resa 173
II... CONCEPTO'DE. DESARROLLO PSICOSOCIAL secscoóanoacsacanabioomecocanoneno
tocancancarordono TES
II. TÉCNICAS DE EVALUACIÓN DEL DESARROLLO PSICOSOCIAL occcnoccoconncnnnnss TR
II ES RR A A A AN LR E 778
111.2. Dimensiones de la socialización: rs 780
13. Escalas de evaluación del desarrollo psicosocial .........awommammm.. 782
IV. CONSIDERACIONES SOBRE LA EVALUACIÓN DEL DESARROLLO SOCIAL.. 787
REFERENCIAS BIBLIOGRACICA o ac No 787
FECTURAS.COMPELEMENTARIAS USCIS AS O SETE RESTA 788
32, EVALUACIÓN DE LOS PROBLEMAS EMOCIONALES Y CONDUC-

TUALESEN NIÑOS: Alza Praza A 791
l. INTRODUCCIÓN: e E a Sl. Me A A. 9
TT. EE AMBIODE LAA a ee OEI 792
JL. MEFODOSDE EVALUACION O 793
UL. —Especicicad de evaluación teo

O EE 793
IL2....- Fuentes de nformación 22 a 794
HL3..... Modalidad. de la evaluación: EE 795
TA, O O A ON 79
VS INSTRUMENTOS DEAD 797
Vat. Funcionamiento delmdo. e dd e a 797

Iv.2. Anotaciones sobre el funcionamiento de los padres y familiares... 809
V. ALGUNAS CONSIDERACIONES Y CUESTIONES ACTUALES oocnccocconoconcnnninncnnss 812
V.1. Los niños y los padres como fuentes de informaciÓóN..accocccconnn.... 812

Índice
v.2. Convergencia de evaluaciones Pr rr rr rr rro rro rr rro rr raro rr rro rr
VI. RECOMENDACIONES PARA LA EVALUACIÓN INFANTIL Prnrrrnnrrcr rosas cro no...
V1.L...... Emplea de medidas múltiples iii lt

VI2. Empleo de medidas que permiten comparaciones normativas
VI3. Evaluación de áreas múltiples de funcionamiento Arrrrn ron oro anno nro raro o ..
VI. CONCLUSIONES Pr rr rr rr rr rr rro rr rr ros rr rro ro rro rrr scr rro rro ccoo ororocoranorerocc..
Pr rr rr rr rro rro rr rro rr rr rr rr rr rro rro rro rro oro rro sononor os
Pr rr rr rr rr rr rr rr rr rr rr rr rr rar rr rar rr error rr rara
E QUINTA PARTE
EVALUACION DE LA PERSONALIDAD
33. EVALUACIÓN DE LOS RASGOS PSICOLÓGICOS, Carmen García-

MEAR e e e e cn A A 829
E A a 829
II. LA PROBLEMÁTICA DE LOS RASGOS EN PSICOLOGÍA DE LA PERSONA-
829
Ms o OS eN E NI de 829
mos PA ES tua consmot AR AA MERA IIA A 832
832
1.4. Reformulaciones actuales del concepto de rasgo .oauccumommaesmess. 833
IM. TÉCNICAS DE EVALUACIÓN DE LOS RASGOS DE PERSONALIDAD ..ccnococononos 834
A Odd O. 834
UA LOMO O e a el ar e aa 835
IV. ESTADO ACTUAL DE LA EVALUACIÓN DE LOS RASGOS PSICOLÓGICOS... 845

REBERENCIAS BIBLIOGRÁBICA Som coo sercsotes idea oso cine sn doin qazo nes cndn go di de sa as UiNeOaotne eii DAD SON oia 847
LECTURAS COMPLEMENTARIAS ccoooercnecenocodoccododenondanadascnoono
nosesoedonosaeSIvUnOSOSPOazo senor anenana deve 850
34. EVALUACIÓN COGNITIVA DE LA PERSONALIDAD, Bernardo

Morendrlmérne ana a ns Mahal casa IUIR E NINE ete enteren san de sioaitoMeeriadeans 851
L FORMULACIÓN HISTÓRICA DE LA PSICOLOGÍA COGNITIVA DE LA PER-

terre loros dO Neo Ua dansa Ninn Sino a RIOR NON e 0 vane nte anneda de nee andas
SONALIDA Dissocnasacas sonaron 851
IL LASVARIABLES COGNITIVAS DE LA PERSONALIDAD occcooonnnonoroonanccnanaranannncnns 852
II. LOSCONSTRUCTO SPERSONALES occccccccovononsannannononennononanccnnncnnanonananancnnnancnnconoos 853
1111. Evaluación de los constructos personales ...acamnmomsmmm 854
IV. LASATRIBUCIONES DE CONDUCTA occccccccannonoonanencnnnnannnnanenananavanonnanananananananons 856
WMarnelLla cra luación delas atribuciones IRIS 858

XXVI Índice
Y... dinan
deal ario
LASEXPECIATIVAS coros coor 862
v.1. Laevaluación de las expectativas de lugar de control .......cwaaummmmo.. 864

VL EL AUTOCONCEPTO Y LA AUTOESTIMA ..covconinmocconcccinoanoccnnsrncancanncoracinecorocnonas 865
vI1. Laevaluación del autoconcepto... 867

vi2. ' La evaluación dela autoestima 870
REFERENCIAS BIBLIOGRÁFICAS Cocoa racnll alcoi ed acord oO Ió RM ARES Are LRS aaaO pa RSS 873
LECTURASCOMPLEMENTARIAS do. ccocsacesadene bebas dee ceenco ted servo soso nee yes PO os 880
35. EVALUACIÓN DE LAS ACTITUDES, Félix Neto y J. Carlos Sierra ............... 881
L. INTRODUCCION ALI LTL ANI LASA, Lon crear epocas 881
T. DEFINICION DEACTTUD cmcosomesaras
retos ass cutsdemoraron sanan vals aislada bones 882
va DD EBRIOS a A TI E E 882
119) (Caracteristicas neta RIO e 884
-LASESCACAS DEA a aora tocairo ora vols 885
A O A e IA At O IRE poo RSS 885

m2 Clasiticación delasiescalas de actitudes macoeasocnnseccao
nenas ooaons aces canoao 886
IV. MÉTODOS CLÁSICOS DE CONSTRUCCIÓN DE ESCALAS DE ACTITUDES...... 888
WirFESdde AA a RA 889
ia ti RESNO retar cadete erro IN TB 890
1134 5Escala de drertacosns aa A 8 891
Wa: Escalade Guam E A SE e A 892
Wi Di A 895
Ver MEDIDAS INDIREGCTAS DELASACIUDDES E AA 896

VIA VATIDEZ Y PLABIIDAD DELAS ESCALAS DEA 897
REFERENCIAS BEBO CRA O OA 897
LECTURAS COMPLEMENTARIAS aaa 899
36. EVALUACIÓN DE LOS INTERESES, Jo-Ida C. Hansen y J. Carlos Sierra.... 901
LA INTRODUCCIÓN ALO A IA IP A de 901

II... HUSTORIA, DELOS INVENTARIOS DE INTERESES
AS EE 901
I1. Características de las cuestiones de los inventarios de intereses...... 902
III. ELABORACIÓN DELASESCALAS DE LOS INVENTARIOS DE INTERESES....... 903
lL1. ” Desarrollo de escalas HOMOSENEAS comence olaaa 903

11L2... Desarrollo de escalas hererogéncas HA A E 903
IV... INVENTARIOS DE INTERESES ACIATES A a O 904
Índice XXVII
IV.1. Inventarios de intereses de Strong Pr rr rr rr rr rro rr rr rr rar rr ro 904

IV2. Inventarios de intereses de Kuder...ococoonnoniccoonennincononcinecm. 908
IV3. Inventarios de intereses de Holland Pr rr rr rr rr rr rar rro rr rr rr rr rro 910
IV.4. Otros inventarios de intereses Pr rr rr rr rr rr rr rr rr rr rr rro rr rr rr 912
(Pr rr rr rr rr rr rr rr rr rr rr rr rr rr rr 914
vL LS
vLt. Exploración delas carreras profesiomales .......eommomrmes». 915
A e a 915
A A A e AA 915
vIL 916
916
917
920
SEXTA PARTE
EVALUACIÓN EN OTRAS ÁREAS
37. EVALUACIÓN EN PSICOLOGÍA DEL DEPORTE, Jaume Cruz y Lluís

Capriles 923
L EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN EN PSICOLOGÍA DEL DE-

923
IL. CLASIFICACIÓN DE LOS INSTRUMENTOS DE EVALUACIÓN EN PSICO-
AA A e 924
AAAEYA EUA CIÓN DEEINDICADOR COGNITIVO tato cacao comence rmeasesiaron 926
IV "EVALUACIÓN DEFINDICADOR MOTOR donocncnnnrencerooconcacasnraccenezrosornoconearcrcods 927
IV.1. Instrumentos de evaluación de las interacciones entrenador-jugador 930

IV2. Instrumentos de evaluación de las interacciones profesor de edu-
A AA A A 933
V. INDICADOR FISIOLÓGICO-BIOQUÍMICO (E-B)escmiomsnscrsmeseresescs 934
A A A 935
v.2. Técnicas de registro más utilizadas en psicología del deporte ......... 935
VL ASPECTOS METODOLÓGICOS DE LA EVALUACIÓN EN PSICOLOGÍA DEL

AI A NOS 940
REE ERENCA A oem NeeoaS ey 943
nanonanacanosrcoconrnnos
nano orccccncnncccana cncnccrnrnr
LECTURAS COMPLEMENTARIAS oooccccccccooooonnoccnnnocncnnacoc 947
38. EVALUACIÓN EN TRÁFICO Y SEGURIDAD VIAL, Héctor Monterde... 949
L INTRODUCCIÓN AL PROBLEMA DE LA PREVENCIÓN DE ACCIDENTES... 949

XXVII Índice
IL. MODELOS TEÓRICOS EN LA EXPLICACIÓN DE LA CONDUCTA DE RIESGO

ENLA CONDUCCIÓN. 0 a ao tas dot ea censo 951
IL1. El modelo de “habilidades” o destrezas psiCOfÍSICAS......u..werommo.. 952

112. Elmodelo de “evitacion de amenaza” de Fuller.............a..cammomoo. pdedo
13. El modelo homeostático del riesgo de Wilde ..........auwmrmormomemmm. 956
11.4. El modelo de “riesgo-cero” de Náátánen y Summala ..ceaacnmmme. 957
A 209
II. REVISIÓN CRÍTICA DE LOS PRINCIPALES MODELOS: EL ESTADO DE LA

CUESTIÓN oa aa cota cia aaaBio 960
TM... Acerca delmodelo.de habilidades oem aacomnsiasancio coord sanaranaca nen saananra 960
IIL2. Acerca del modelo de evitación de Fuller ...........enocoonononononosnommem. 961
1IL3.. Acerca del modelo homeostático de Wilde ........ccconocacocanccararnornonononoo 962
UL4. Acerca del modelo de “riesgo cero” de Náátánen y Summala ........ 964
ms. Problemas comunes a los modelos motivacionales .......e.o.omoommo. 964
EF MODELO ESPANOL DE INTER VENCION => entae

Sao aSSsE Ea 967
Vr A aa 967
AN ias
e e tae a 969
v. GONCLUSONES caida ode dacatanido esta rccada dela cla batero lio 975
AS 976
980
Pnrmmmmnprrrrsrrrrrrcorararsnrscosos 981
rr rr rr rr rr rr rr rr rr rro rr rr ra rr rr rr ro 981
Pr rr rr rr rr rr rr rr rr rr rr rr rr rr rr rr rro 982
O y a A E 982
m0 >uPlementos dellanihss ambiental 2.00 A 984
13. Principales enfoques en psicología ambiental rro error corr rro rr rr 987
TIL. (rr rr rr rr rr rr rr rr rr rr rr rr rr rro rr rr ro rr 988
HILL Aspectos generals nen 988
nL2. El problema de la validez en investigación ambiental rrrrrrcarcorrrcosorn.. 989
IV. LAS TÉCNICAS EN EVALUACIÓN AMBIENTAL rr rre rr rr corro rr rr rra aro 989
IV. Evaluación de variables físicas del medio ambiente desde un enfo-
JE EC E ES 989
Iv.2. Evaluación de escenarios de conducta desde enfoques ecopsicoló-
990
IV.3. Evaluación de características psicosociales de grupos e institucio-
nes: enfoque ccolóricos oca a TER 991
IV.4. Análisis de las relaciones funcionales entre conducta y ambiente y
sus interacciones: enfoque ecológico conductual error arras errors 992
Índice XXIX
IV.5. Evaluación de la percepción subjetiva del ambiente ......cancinnns.

IV.6. Evaluación de disposiciones ambientales Pm rrrrrrrrcr rro rro raro rro oro oros.
Pr rr rr rr rr rr rr rr rr rr rro rro rro raros orar ro roo r rro?
VL Pr rr rr rr rr rro rro rra
Vie Pase de eyalración IES E OA Y ISR

A e A
REFERENCIAS BIBLIOGRÁFICAS Pr rr rr rr rr rr rr rr rro rra rro rr rra rra oo
LECTURAS COMPLEMENTARIAS (rr rr rr rr rr rro rro rro rr rro rre rr rocosa roo
40. DISEÑOS DE EVALUACIÓN DE PROGRAMAS, Mariano Álvaro y

GualbertoBuila Casal anota
An TNAO de enc a rncactós
ENTRO UCIÓN A tn NA A al cad
DISEÑO ARICA A a
IL.1. Características generales errar AREA

124 Jipos dediseños marciales simples etiotiat ol ai
IL3. Ventajas e inconvenientes de los diseños matriciales simples .........
y ANOS ES ct
TrulnCancrerricas Sensralena ETS raras REA

mw pliposdediseños.matriciales múltiples a
IIL3. Ventajas y limitaciones de los diseños matriciales múltiples ...........
IV. DISEÑO DE BLOQUES INCOMPLETOS BALANCEADOS (BIB)eccccmonnnononsonononcoos
e E e es
a Ventajas y lemitaciones del CiSeno BIB ant. ragonenicenonrsestrsorconescasrentzoncras
MOFDISEÑODÚPLEXO. 22 iran e ad A Te Ar arta e
Me Caracteristicas generales erase eones anat dea enano pco
v2. Ventajas e inconvenientes del diseño dúpleX......wwaaomaoommormso.
VIII DISEÑO DUPEERICOMPLE MENTA care
conocio toasseed acens
VIA PROPUESTA DE UN DISENO MO an eatenne mo cncnnecsoneto nova vana iones sdecncenenssy
AS ASAS A A AAA
VI boraición de las Pruebas os tacos codnnoon ecos cepoeoieerreree seis
vis. Laselección de la muestra de SUJELOS e osodrasdinnreracasun arcanones
socaramasooonesn
vIL.4. Fase de aplicación de las pruebas ..ua.aomonnoonnno rmscmernmecnmsnns s
CONCLUSIONES....ccoooonccnnoneccncnnnnanononncononnnanronanccnnnancnancnnnnnnnnnnasac
VII. nncnnnnnn o”.
nenonanoncn
REFERENCIAS BBLIOCRARIOA en eoonooaann Donne Dani onone Dam camne sono neon cno Seo uned oe siosoianons
nnnnnnnanennnon ennnenanannós
ononoonan
rnnnonnnranannnn ran
nnonnasan
LECTURAS COMPLEMENTARIAS coocccconononcnnanearn one
XXX Índice
41. EVALUACIÓN DE PROGRAMAS, José L. Arco, Gualberto Buela-Casal y

Fernando Justicia ici AGS AR ed IA cc 1033
1... INTRODUCCIÓN Ni RA Pt 1033
Il. DETERMINACIÓN DEL TIPO Y ALCANCE DELA EVALUACIÓN ..cmcrncocsncinnoss 1035
H1 Determinar el papel del evaluador eones

ademrlororenapoti incre 1035
HZ. Plamiicación dela evaluaciOnL...o.ooutuiariene
pues alar ioeronagol toortonors 1036
O IAS A 1036
IL4. Aspectos prácticOS ...u...... d ATLANTA 1039
HE CONCLUSIONESvacaatóno coda speniane ocaso naco Issa ara dO da a COCA RRR aan arena acota icon T esco Reno 1041
IV... ELECCIÓN DEMETODOS Y TÉONICASAS. onanenoroneee rato 1043
IV.1,75 En la. evalvación de procesos... Latin la docintinciacirid
or ecc 1043
IWZ...Enla evaluación de Impacto ems ela CAN 1043
Y. PEANIFICACIÓN TEMPORAL. LIAA cane 1046
VI. PUESTA EN PRÁCTICA DEL PLAN DE EVALUACIÓN cacoccónosnansonacnacioiecididonccniinn 1046
VIT... ELABORACIÓN DEL EIRORMES marron caos ae 1048
REFERENCIAS BIBLIOGRÁFICAS ranas EE LEA A 1050
EECTURAS. COMPLEMENTARIAS carr as o DO OOO Ad AT nc naa 1050
PRÓLOGO
Las plasmaciones de la ciencia social a finales del siglo XX (y los libros representan una
de estas plasmaciones) están caracterizadas por un conjunto de ritos. En el caso de los
Libros: la elección de temática, de editorial, de autores, de temas adscritos a los autores,
de los plazos sistemáticamente incumplidos por parte de alguno de los eslabones de la
cadena de producción, y casi al final de este proceso se encuentra el de cumplir con el
“prologuismo”, una característica peculiar en la que bien que mal la mayoría de los
autores hemos hecho primero peticiones para que “otro” nos prologue y, posterior-
mente, a medida que la edad pasa, para tener que prologar. Hace unos años resultaba
poco frecuente encontrar personas con un libro publicado y mucho menos prologado,
sin embargo, el incremento de publicaciones en la psicología española ha reconvertido
la situación en otra: resulta muy difícil encontrar un profesor de universidad que no
haya escrito todo o parte de un libro y apareció un club, cada vez más frecuente, de
prologuistas. El tema es, además, recurrente, de modo que hay quienes repiten hasta
el punto de que hay que dejar hueco en las agendas para dedicar un período temporal
a este quehacer, por ello, no sin cierta socarronería, algún colega conocido ya comien-
za a calificar a algún otro compañero como “prologuista”.
Como nuevo oficio, el de prologuista posee algunos problemas graves de entre los
que cabe señalar, por lo que se refiere a nuestra tarea aquí, el prologuismo de loa y el
de crítica. De joven, quien escribe estas líneas leyó un prólogo que no solamente era
de extensión similar al del texto que prologaba sino que defendía tesis bastante con-
trarias, lo que no resultó una experiencia especialmente grata. Asimismo, se ha encon-
trado con la experiencia opuesta: que el prólogo era incluso más optimista, defensor y
partidario de la obra que los “oportunos” extractos que el encargado de la promoción
en la editorial selecciona del texto con el fin no solamente de introducir el libro en el
mercado sino de ampliarlo al máximo echando fuera a los otros que existen sobre el
tema. Pienso que ambas posiciones son contraproducentes no solamente para el prolo-
guista sino para los autores y el libro, y en esta ocasión se intentará no caer en ellas. El
objetivo es más bien otro: proponer una estimación global y ensartar algunas conside-
raciones que pueden tener algún interés en el campo de la evaluación psicológica.
De una u otra forma, escribir un prólogo resulta un honor, y en el caso actual pue-
de llegar a representar un honor inmerecido. Por parte del autor de estas líneas resulta
sin lugar a dudas un honor en la medida en que el presente volumen representa la
obra colectiva de un buen número de profesores de psicología y el alcance de la obra
es considerable. Su lectura promete implícitamente unas continuaciones que rellenen
algunos huecos y completen el amplio panorama que ya, de por sí, abarca. Para bien o
para mal (desde el punto de vista de quien esto escribe, para lo primero, lo que se tra-
tará un poco más adelante), recoge una multiplicidad de orientaciones de “escuelas”
de pensamiento psicológico distintas que, si bien no están todas las que son, son todas
XXXU Prólogo
las que están; y representa, en buena medida, lo que da de sí la evaluación en España,

lo que ya es mucho. El título refleja la pluralidad (y no sólo de escuelas sino de temáti-
ca y niveles epistemológicos de análisis), lo que puede querer decir, para los compila-
dores, que es necesario más de un modelo teórico científico para poder dar razón de la
pluralidad de resultados, asimismo científicos, que pueblan la psicología, lo que de ser
así, resulta un punto de vista que comparte quien escribe este prólogo.
Más allá de lo que acaba de escribirse los consensos empiezan a resquebrajarse. Y
no solamente respecto al prologuista sino entre los propios autores que escriben capí-
tulos distintos. Toda obra representa un esfuerzo por exponer de manera clara y com-
prensible lo que cada autor considera más importante de su especialidad, lo que puede
ir modificándose a lo largo del tiempo (esta huida de esencialismos sigue estando de
moda) y es lo que convierte a una obra en histórica y, en todo caso, como decía Cron-
bach, en “notarial” en el sentido de que el científico ofrece lo mejor que puede el esta-
do actual de sus conocimientos sobre los problemas que trata; el cambio de los proble-
mas y de las maneras de abordarlos es algo que puede hacer modificar la extensión y
la intensidad de los tratamientos a lo largo del tiempo. En este sentido, la obra actual
representa un corte horizontal en el que se ha hecho un esfuerzo por incorporar las
aportaciones de autores españoles a la especialidad (si no todas, una parte notable de
las mismas), lo que no resulta frecuente y, por ello, debería ser tomada nota especial
acerca de la necesidad de seguir por este camino.
Por otro lado, los autores elegidos han trabajado cada tema hasta el punto de que,
bien que mal, representa una parcela de su especialización. Usualmente, el profesio-
nal de la universidad que trata de un tema tiende a magnificarlo con el fin de conver-
tir su trabajo en un esfuerzo intrínseco (el extrínseco es tan poco frecuente que inten-
tar buscar una justificación de recompensa externa por escribir una parte de una
monografía resulta una ingenuidad que va contra todos los datos científicos conocidos
y contrastados). Es este refuerzo intrínseco el que le hace “ver” la realidad (siempre
más de la que se ocupa temáticamente en el capítulo) de manera un tanto radical y
concederle la máxima importancia en un proceso atribucional de considerable ayuda
para el propio autor y que en alguna ocasión puede llegar a confundir al lector. Éste
no es el caso en muchos capítulos aunque puede rastrearse en el tratamiento de algu-
nos de los temas. Lo que es comprensible, defendible y hasta loable con el fin de ani-
mar a algún lector a que prosiga por la senda que el autor en cuestión ha abierto.
Maentras los posicionamientos radicales tienden a alejarse de la variopinta realidad,
poseen el valor de contagiar a algunos lectores, lo que lleva a seguir trabajando en el
tema y desde esta misma perspectiva, lo que, dado el escaso apoyo social que se recibe
para el cultivo de las tareas intelectuales de investigación continuada, resulta muy
loable y meritorio logro.
En tres ocasiones en los últimos doce meses, el autor de estas líneas se ha encontra-
do con un comentario que, procedente de fuentes diversas, ha tenido un contenido co-
mún: el primero, de un artículo en inglés en el que se calificaba a la psicología en espa-
ñol como contrastadora de hipótesis pero no como creadora de modelos (el trabajo se
refería a un tema candente en psicología de la salud, el estudio de la calidad de vida
de los enfermos), los otros dos han sido en congresos internacionales: uno en España y
otro en el extranjero y en ambos casos se defendía la idea de que en España se produ-
Prólogo XXXII
cían obras “de traducción” y, en el mejor de los casos, de compilación de trabajos rea-
lizados por investigadores de otros países (esencialmente de aquellos que ejercen su
actividad en Estados Unidos). Las raíces celtibéricas del autor se removieron y en un
caso protestaron, en los otros, dejaron pasar. El problema, sin embargo, queda abí y
podría resumirse en una frase que tiene la parte de verdad y de mentira que poseen
todas las caricaturas: la psicología española ha generado lectores de libros de psicolo-
gía producidos en otros países con la suficiente “entidad” como para que puedan
“contrastarse” ideas de otros, pero el panorama nacional percibido por “los de fuera”
no da lugar para muchas alegrías.
Es posible que se pueda defender esta situación desde posiciones muy dispares que
van desde la “homogeneización” de la psicología española a cánones internacionales
(nunca jamás han aparecido tantos autores españoles en revistas extranjeras de psico-
logía como en los últimos años), lo que ha sido y es promovido desde estructuras de
política científica estatal (quien no publica en inglés apenas existe en España, si existe;
los trabajos no se califican por su valor en sí mismos sino en función de la revista o la
editorial en la que se publican), hasta la creencia de que la psicología es una ciencia es-
trictamente natural y, por lo mismo, los “sujetos” son tan homogéneos entre sí como
unos átomos de sodio con otros; y las relaciones entre los componentes (la estructura
empírica y funcionalmente activa de la subjetividad) es la misma entre los habitantes
de Manhattan, Idaho, Tokio, Madrid, Tegueste y Alfafar. Si bien esta manera de
pensar es defendible en psicología (y en evaluación psicológica, por lo demás, se refiere
a toda la gran especialidad de la psicología transcultural), la verdad es que representa
una opción posible pero ni la única ni, en opinión del autor de estas líneas, la más ade-
cuada a nivel de aplicación profesional concreta en muchos campos de la psicología de
la evaluación. Las topografías comportamentales —funcionales— y vivenciales de
culturas y pueblos con tradiciones distintas no son superponibles sin negar la especifi-
cidad psicológica de estos pueblos y culturas; y mucho menos de los individuos que las
constituyen y cuyas interacciones forman el entramado de esa cultura. En paralelo y
en contraposición a la tendencia psicológica homogeneizadora de los medios de pro-
ducción, consumo, comunicación e informatización existe otra de diferenciación y es-
pecificación de las interacciones de adaptación del ser humano con el ambiente o con-
texto en el que vive. La negación de la segunda tendencia lleva consigo, entre otras
cosas, la negación de la diversidad cultural y la imposición de una única forma de ver
la realidad, entenderla, sentirla y comunicarla (y de la ciencia que la estudia), lo que
podría derivar en la posible imposición de una ingeniería sociológica homogeneiza-
dora que preludia la posible aplicación de una ingeniería genética encaminada al mis-
mo fin. Sería deseable que las ideas que forman este párrafo fuesen totalmente erró-
neas, aunque me temo que corren el peligro de tener una parte considerable de
verdad, al margen del alarmismo con el que pueden calificarse.
Desde otra perspectiva, la “naturalización” de la psicología convierte los trabajos
publicados en una “psicología transcultural” —émica que ha sido reiteradamente cri-
ticada y denunciadas sus limitaciones desde hace ya más de dos décadas desde presu-
puestos morales, epistemológicos y antropológicos. Y lacrítica viene justificada, entre
otras cosas, porque los modelos e instrumentos científicos tienden a ser originados a
partir de la observación de una parcela de la realidad quesepresenta como funcional-
mente oscura o con problemas. Pero, repárese, de la realidad que tiene delante el in-
XXXIV Prólogo
vestigador; la aplicación, sin más, de este modelo, instrumento o técnica de solución a

otro contexto y personas, “impone” a este segundo contexto, la estructura y la dinámi-
ca de variables que se ha hecho en el primero, lo que puede no ser ni la manera de
analizar el problema, ni la solución más idónea, en la medida en que el problema y el
instrumento no son elementos aislados y sin conexión con el contexto sociocultural to-
tal sino una parte que posee ideas, creencias y valores que pueden ser distintos en los
dos casos. Y de abí que las soluciones encontradas, o bien “se imponen” desde un con-
texto cultural a otro (anulando al “importador”), o en la imposición no se resuelven
realmente los problemas sino que tapan aquellos elementos que son más esenciales y
representarían, por tanto, soluciones parciales y, en el mejor de los casos, muy provi-
sionales y que crean problemas mayores.
Por lo demás, este tipo de consideraciones no son nuevas. Su aplicación a la eva-
luación psicológica podría correr a lo largo de las siguientes ideas que el autor de este
prólogo ha ido plasmando en la evaluación a lo largo de más de casi tres décadas de
trabajo ya. Se parte o bien de una lectura bibliográfica o bien de un análisis de la rea-
lidad que nos circunda y en la que existen ventajas e inconvenientes. En los dos proce-
dimientos nos encontramos con conceptos básicos (los “constructos” de la epistemolo-
gía tradicional) y/o problemas. La definición de estos conceptos representa los
elementos básicos para la constitución de modelos científicos que pueden ser emplea-
dos tanto por españoles como por otros científicos. Sobre estos conceptos se elaboran
los instrumentos y las técnicas de evaluación, que son validadas con las personas con-
cretas que habitan en estos contextos y de acuerdo con los criterios que la sociedad y la
cultura promueven y permiten. De esta forma, se pueden incorporar concepto e ideas,
así como procedimientos de medida y técnicas de registro de otros países y culturas
pero, al igual que sucede con las plantas y el resto de los organismos vivos, aquellos
conceptos, técnicas, procedimientos e instrumentos generados en otros lugares deben
“aclimatarse” y “aculturarse” en cada nicho. Esto no implica un relativismo cultural
radical (la tradición de pensamiento de “filosofía práctica” que existe en España está
por explotar por los españoles aunque el estoicismo de Séneca y el análisis de la reali-
dad personal de las obras de Lope de Vega y de Francisco de Quevedo, por poner dos
ejemplos clásicos, se encuentra en buena parte de la psicología contemporánea bajo
otros nombres) peros sí quiere ser una seria llamada de atención a la incorporación de
resultados e instrumentos obtenidos en otros lugares sin más reflexión, desde aquí
animamos a los investigadores españoles a que generen sus propios instrumentos; y,
por otro lado, a la búsqueda de tradiciones de pensamiento más propias de nuestra
tradición teórica y cultural con el fin de ofrecer una psicología mejor y de mayor apli-
cación para resolver los problemas que existen en nuestro entorno físico y social. Esta
especificación no quiere decir que sea de menor calidad ni con menores garantías me-
todológicas que las que se utilizan en otros entornos. Lo que pide es que sean relevan-
tes y con la misma calidad metodológica posible. Cuando hemos puesto en práctica es-
tas ideas los resultados han sido mejores con instrumentos generados desde nuestro
propio contexto que con otros importados. Y pensamos que los usuarios tienen dere-
cho a recibir los mejores servicios posibles.
Posiblemente este objetivo y metodología de pensamiento y acción lleve también
problemas, pero, cuanto menos, representa un esfuerzo por hacernos más eficaces y
aprovechar mejor nuestros recursos humanos. Es muy posible que una combinación
Prólogo XXXV
adecuada de las dos orientaciones que han sido presentadas sea una solución ecléctica
y, además, más eficaz y pertinente para resolver los problemas que tiene planteados
en la actualidad la evaluación en España. Pero los dos, y cada uno de ellos debe tener
su derecho y su lugar dentro de un panorama científico; a nivel aplicado, desde luego
resulta claro que es preferible el que es generado y validado desde los propios proble-
mas, a nivel transcultural es mejor el que se está llevando a cabo. Pero confundir la
ciencia y el valor de la ciencia psicológica eficaz con el dominio de idiomas, el poder
político dentro de la ciencia, el control político de las ideas, la sociología de la ciencia,
los medios de comunicación o la presencia en los foros internacionales de difusión re-
presenta una confusión grave y ante la que es posible que debamos mantenernos en
guardia para que la evolución de esta apenas nacida “oficialmente” psicología espa-
ñola posibilite unos mayores y mejores logros.
Es muy posible que éste no sea el mejor foro para promover una discusión sobre el
tema (al que volverá el autor de estas líneas en breve y en una publicación especial so-
bre ello), pero también es posible que en un libro dedicado a la evaluación psicológica
y en la que ambas orientaciones se encuentran presentes (con predominio de la trans-
cultural), estas líneas representen un caveat conveniente y que sea objeto de reflexión,
siquiera para los que han llegado hasta aquí.
Sirva lo anterior para animar al lector a enfrentarse a un libro voluminoso y que

refleja, en buena parte, los esfuerzos de profesionales muy distintos entre sí para ofre-
cer lo mejor que han sabido y podido, parte de ese saber que representa su quehacer
científico. Y en esto, el libro ha logrado sus objetivos y bien merece la pena que sea leí-
do y estudiado con interés y atención.
VICENTE PELECHANO
Callao Salvaje, Tenerife, agosto de 1997.
Fa a E
O A A E
EN
A o o E E A e
A
Ip micro ANPUO S A c
gía rradisionad? yl problemas, La d

Pt blicas:hot cie . es cemificos quepuede ypra
pre, sor. : si a e
A A na | A oire
dp poo Croviasgla aa od «dl 0 a
ds como procediment de ee ds y tica ye A : 3
1] S
DEYA. ¿li tom á Ñd su pur 10 $ piari as y ei ted de os
¿ a 1
ARO AE dimientos cinsrremintos senerados en otros lugares

deben —
EOL lio rr vierica saliva;sebo Farro ES Jen relarusmo eolueral e
1 Dai tr Per itaento $e sf pricota” que SN España está 3
Vi AMLO qsimciomo de Séneca y el arcilisin de lasrendis

de Vegas de Francisco «de E uevedo, por puner dos
s parte de a pacolosía somanpurinia bajo
un! A darriada Ál AÍCOPCIOS it neorporación de
“pm arros lusaros sit mas reflexión dende Aquí.

ENPTOA SOS DIOIOS MITA Y,
ponente 1 propias de nuestra
PSCOLOSÍA CIO Y ARI yor ani
“y rra 4
NILO Y wal Fs
¡NOTES PATATA 10 0-
eE de OL ALE MAN TOA
PETDÓS PUESTO EN ATACA >

ES cabos test: rasstro
nsHanos Lenen dtre
so y acosa den da mbién

WITEVTA AS PÍEGACES A
rl CEPIDIARCIO
PREFACIO
Hace ya algún tiempo se inició el ambicioso proyecto de escribir un manual lo más

completo posible sobre evaluación psicológica. Nuestra idea era elaborar un manual
que sirviese tanto a los estudiantes de psicología como a los psicólogos en su práctica
profesional. Este proyecto, después de superar las múltiples dificultades que hasta
resultan “naturales” dado el volumen de la obra y el número de autores que colabo-
ran, ha llegado por fin a las manos del lector. Detrás de estas más de mil páginas hay
un gran esfuerzo, y no sólo de los directores sino también de los colaboradores, que
con sus aportaciones han contribuido a que hoy todos podamos disponer de este
manual para el estudio y/o consulta en el cada día más importante campo de la eva-
luación psicológica.
S1 olvidamos por un momento los criterios académicos y reflexionamos sobre
cuál fue el primer antecedente de la psicología, seguro que muchos coincidimos en
que fue la «evaluación de las formas de ser y de comportarse las personas». Desde
nuestros más antiguos predecesores existe la costumbre de “evaluar psicológica-
mente a los demás”; esa costumbre se ha mantenido con el paso del tiempo hasta
nuestros días. Por ejemplo, cualquiera ha tenido la experiencia de conocer a una per-
sona y hablar con ella durante algún tiempo (por ejemplo, en un largo viaje en tren),
pues bien, después de esa interacción cada persona es capaz de emitir una opinión
sobre la otra persona; en estas situaciones se están aplicando, de forma asistemática,
técnicas de evaluación psicológica, como la entrevista, la observación, la autoobser-
vación, los autoinformes, etcétera.
Pero si regresamos al contexto académico también tenemos que afirmar que la
evaluación es tan importante en la psicología que difícilmente ésta podría existir sin
la evaluación, pues, sin duda alguna, la evaluación psicológica es la actividad más co-
mún que realiza el psicólogo en los ya múltiples y diversos ámbitos profesionales.
No es posible trabajar en psicología sin realizar algún tipo de evaluación. Así, desde
el ámbito clínico, donde es imprescindible evaluar para aplicar cualquier tratamien-
to, incluso evaluar después del tratamiento para comprobar si éste ha sido efectivo;
de igual forma necesita evaluar el psicólogo deportivo, el psicólogo escolar, etc., has-
ta ámbitos donde la evaluación es prácticamente el cien por cien de la actividad, sirva
como ejemplos la psicología del tráfico y la seguridad vial. Así, la experiencia ha de-
mostrado que aquellos psicólogos que «no aprendieron las técnicas y los procedi-
mientos de evaluación» están “condenados” a estudiarlos para poder trabajar como
psicólogos.
Si estos argumentos no fuesen suficientes para demostrar la importancia de la
evaluación psicológica, aún podemos decir algo más. Desde un ámbito curricular,
hay que resaltar que con los nuevos planes de estudio para la licenciatura de Psicolo-
gía, la Evaluación Psicológica es una asignatura “troncal”, es decir, se debe estudiar
XXXVII Prefacio
de forma obligatoria sea cual sea la universidad española en la que se estudie, o dicho
más sencillamente, la ley no permite ser psicólogo sin demostrar que se conocen y
dominan las técnicas y procedimientos de evaluación.
En cuanto a la orientación o modelo en que se puede clasificar este libro, sin
duda está influido, o mejor dicho, determinado por la postura epistemológica de los
directores en lo que se puede considerar evaluación psicológica dentro de un ámbito
académico y con, al menos, algunas garantías científicas. Así, en nuestra opinión, los
modelos de evaluación psicométrica y conductual son válidos, complementarios y
necesarios para la práctica profesional del psicólogo. En la actualidad, ya ningún psi-
cólogo, salvo aquellos que se dedican a “rumiar sus propios pensamientos”, o %a ne-
gar lo cognitivo con sus propias cogniciones” (sin darse cuenta de la estúpida para-
doja), y que viven habitualmente alejados del mundo real y profesional; salvo éstos,
que cada día son menos, ya nadie defiende que un solo modelo es “capaz y suficien-
te” para tratar de entender, explicar y modificar (cuando sea necesario) el tan com-
plejo comportamiento humano. No queremos extendernos en este aspecto, tan sólo
pretendemos dejar explícito que el diseño de este manual es un buen reflejo de nues-
tra postura epistemológica que, por supuesto, el lector puede compartir o no.
El contenido del presente manual está estructurado en seis grandes apartados.
El primero, considerablemente amplio, se dedica a las bases conceptuales y meto-
dológicas. Así, se abordan los aspectos históricos, la epistemología, el proceso, di-
versas alternativas metodológicas... y, por supuesto, las cuestiones éticas y deonto-
lógicas, sin duda algo que debe estar siempre presente en cualquier proceso de
evaluación.
En el segundo apartado se describen y explican las principales técnicas de evalua-
ción psicológica, tanto las conductuales como las psicométricas, desde las cognitivas
hasta las psicofisiológicas y las neuropsicológicas. Quizá sea bueno mencionar que
por primera vez se incluye la técnica de evaluación motora, el tercer componente de
respuesta siempre mencionado y siempre olvidado en los libros de evaluación.
En el tercer apartado se incluyen las diferentes técnicas y procedimientos para
evaluar la inteligencia: los tests de inteligencia más importantes, la evaluación cogni-
tiva de la inteligencia y el modelo triárquico planteado más recientemente por
R. Sternberg.
En un cuarto apartado se aborda la evaluación del aprendizaje y del desarrollo;
desde la memoria y la atención al desarrollo sensoriomotor y psicosocial, pasando
por los estilos cognitivos y el lenguaje. Asimismo, se incluye un tema dedicado a la
evaluación de los problemas emocionales y conductuales infantiles.
El quinto apartado se dedica a uno de los campos más tradicionales de la evalua-
ción psicológica, la evaluación de la personalidad que se hace desde una perspectiva
clásica como es la de los rasgos psicológicos y desde una orientación cognitiva. Tam-
bién se recoge en este bloque la evaluación de las actitudes y la de los intereses.
Por último, en el sexto apartado se incluye una relación de técnicas y procedi-
mientos en ámbitos aplicados que van desde la evaluación en la psicología del depor-
te, evaluación en tráfico y seguridad vial, hasta la compleja metodología de la evalua-
ción de programas. No obstante, aunque al lector le puede llamar la atención la
ausencia de aplicaciones en el ámbito clínico, esto es intencionado, pues los directo-
res de este manual recientemente han publicado otro manual sobre evaluación en
Prefacio XXXIX
Psicología Clínica y de la Salud (en la misma editorial), por lo que se ha tratado de

evitar solapamientos.
No quisiéramos terminar sin resaltar que para la elaboración de los diferentes ca-
pítulos hemos invitado a grandes especialistas en cada una de las temáticas, siendo,
además, la mayoría profesores de Evaluación Psicológica, y contando en algunos ca-
sos con la colaboración de prestigiosos especialistas internacionales como Kazdin,
Haynes, O'Brien, Nelson, Tryon, Sternberg, Almeida, Hansen..., lo cual ha contri-
buido, sin duda, a un resultado muy satisfactorio, al menos, por nuestra parte.
Santa Bárbara, California, septiembre de 1997
J. CARLOS SIERRA
Granada, septiembre de 1997
porta
PA dl DO
msa uevien
presel demos dejar exme a

4 >
tra DOLCUTA ero sión ra A Y Lanor + upue stoy el decia

1 canten 0 O y -yary * mjor mas sruerurado e
4
Y) 4 1 de 2 4 5.
J -
" . 6 E
»” / is ES > q
y «Dr
*
q * 4
L
-
a
FAS
verorr componen
, 173 4
dev;
[2
Muse; y ina
Í : y proceden
1] $
% p 14 ÓN
RELACIÓN DE AUTORES
Leandro S. Almeida, Universidad de Minho (Portugal).

Mariano Álvaro, Instituto de la Mujer.
José L. Arco, Universidad de Granada.
Victoria del Barrio, Universidad Nacional de Educación a Distancia.
Júlia Behar, Universidad de Barcelona.
Alfonso Blanco-Picabia, Universidad de Sevilla.
Xavier Bornas, Universidad de Las Islas Baleares.
Gualberto Buela-Casal, Universidad de Granada.
Lluís Capdevila, Universidad Autónoma de Barcelona.
José A. Carrobles, Universidad Autónoma de Madrid.
Jaume Cruz, Universidad Autónoma de Barcelona.
Jorge Fernández del Valle, Universidad de Oviedo.
Eduardo García-Cueto, Universidad de Oviedo.
J. García-Martínez, Universidad de Sevilla.
Carmen García-Montalvo, Universidad de Murcia.
Jo-Ida C. Hansen, University of Minnesota (EE UU).
Stephen N. Haynes, University of Hawaii (EE UU).
James D. Herbert, Hahnemann University (EE UU).
M. T. Hernández, Universidad Autónoma de Barcelona.
Adolf Jarne, Universidad Autónoma de Barcelona.
Fernando Jiménez, Universidad de Salamanca.
Fernando Justicia, Universidad de Granada.
Alan E. Kazdin, University of Yale (EE UU).
Teresa Kirchner, Universidad de Barcelona.
Carmen Maganto, Universidad del País Vasco.
Pilar Matud, Universidad de La Laguna.
Héctor Monterde, Universidad de Valencia.
Bernardo Moreno-Jiménez, Universidad Autónoma de Madrid.
Rosemery O. Nelson-Gray, University of North Carolina at Greensboro (EE UU).
Félix Neto, Universidad de Oporto (Portugal).
William H. O'Brien, University of Bowling Green Ohio (EE UU).
Luiz Pasquali, Universidad de Brasilia (Brasil).
Vicente Pelechano, Universidad de La Laguna.
Jordi Peña-Casanova, Universidad Autónoma de Barcelona.
Wenceslao Peñate, Universidad de La Laguna.
F. Javier Pérez-Pareja, Universidad de Las Islas Baleares.
María Dolores Prieto, Universidad de Murcia.
Viceng Quera, Universidad de Barcelona.
Daniel J. Reschly, lowa State University (EE UU).
Carol Robinson-Zañartu, San Diego State University (EE UU).
J. M. Rodríguez-González, Universidad de Sevilla.
XLO Relación de autores
Mateu Servera, Universidad de Las Islas Baleares.

J. Carlos Sierra, Universidad de Granada.
Robert Sternberg, University of Yale (EE UU).
Warren W. Tryon, Fordham University (EE UU).
Miguel Ángel Verdugo, Universidad de Salamanca.
PRIMERA PARTE
ASPECTOS CONCEPTUALES Y METODOLÓGICOS

GUALBERTO BUELA-CASAL y J. CARLOS SIERRA
I. INTRODUCCIÓN
El estado actual de la evaluación psicológica es, sin duda, un producto de la evolución

histórica de la disciplina y de su interacción con el desarrollo de la propia psicología
y Otras ciencias afines. Por tanto, no cabe adentrarse en el concepto de evaluación
psicológica, sin pasar previamente por un análisis histórico. De hecho, los distintos
autores, tanto españoles (Pelechano, 1976, 1988; Silva, 1982, 1985; Blanco, 19864,
1990; Martorell, 1988; Ávila, 1992a; Fernández-Ballesteros, 1992; Peñate, Matud e
Ibáñez, 1993) como extranjeros (Anastasi, 1973, 1988; Aiken, 1985; Nelson y Hayes,
1986; Goldstein y Hersen, 19904; Thorndike y cols., 1991; Kaplan y Saccuzzo, 1993)
que han tratado el concepto de evaluación psicológica, han comenzado por un mi-
nucioso análisis histórico.
McReynolds (1986) justifica este análisis histórico argumentando varias razones;
en primer lugar, un conocimiento de la evolución histórica de la evaluación ofrece
una amplia información y una mejor apreciación del estado actual de la evaluación
psicológica; en segundo lugar, el pasado es importante por sí mismo, ya que forma
parte de la herencia de la humanidad; y, en tercer lugar, hace posible que algunas
aproximaciones o directrices empleadas por nuestros antecesores, y olvidadas desde
entonces, vuelvan a ser descubiertas.
IL. LA EVALUACIÓN PSICOLÓGICA EN LA ANTIGUEDAD
Al examinar la historia de la humanidad, McReynolds (1986) pretende poner de ma-

nifiesto que, desde los tiempos más antiguos, en todas las sociedades civilizadas se
utilizó algún procedimiento de evaluación. Así, dentro de una primera etapa, que
podría etiquetarse como mágica o mítica, aparece en muchas culturas la adivinación
o predicción del futuro, donde podría incluirse la astrología. Ésta es considerada por
diversos autores (McReynolds, 1986; Silva, 1985; Pelechano, 1988) como uno de los
primeros antecedentes de la evaluación psicológica. Según McReynolds (1975), el
comienzo de la astrología podría situarse en el siglo V a.C. con el Tetrabiblos (libro
de los signos zodiacales) de Ptolomeo. Los astrólogos plantean que de igual forma
que los astros regulan la ritmicidad del ciclo día-noche, de las mareas, de las cose-
chas, etc., también determinan una gran parte de la conducta humana —entiéndase
carácter humano. En otras palabras, los individuos son particularmente sensibles a la
Universidad de Granada.
4 Gualberto Buela-Casal y J. Carlos Sierra
influencia de los astros, estando dicha influencia determinada por la posición relativa
de los planetas en el momento del nacimiento. A primera vista, parece que se dan las
condiciones necesarias para un proceso diagnóstico, puesto que existe un evaluador,
un evaluado, unos instrumentos, una intención por la explicación y el pronóstico y
una teoría que lo sustenta. Sin embargo, un análisis más detallado nos lleva a enten-
der la astrología como algo considerablemente distinto de la evaluación psicológica,
para que pueda considerarse un antecedente. En primer lugar, la astrología es una
práctica que podría incluirse dentro de lo mágico; en segundo lugar, el sujeto objeto
de evaluación no es el individuo en sí, ni su ambiente inmediato, sino tan sólo una de
cha, una hora y un lugar —de hecho se puede hacer una predicción sin la presencia
de la persona supuestamente evaluada; en tercer lugar, no tiene ninguna utilidad so-
cial, puesto que se limita a predecir el destino determinado por los astros; y, por últi-
mo, la astrología ha tenido una mínima o escasa evolución desde sus inicios hasta la
actualidad, sin darse ningún tipo de interacción con la evolución de la psicología, es
decir, la psicología se ha desarrollado con total independencia de la astrología. Mues-
tra de ello es que ningún astrólogo ha ido desarrollando su teoría hasta convertirla en
una escuela o corriente psicológica. Por tanto, no hay aspectos de la astrología que se
hayan transformado hasta convertirse en un constructo psicológico. En definitiva,
en nuestra opinión, aunque aparentemente tienen aspectos comunes, consideramos
que la astrología no ha sido un antecedente de la actual evaluación psicológica.
DuBois (1970) sitúa el nacimiento de la evaluación psicológica en la antigua Chi-
na, donde se realizaba una selección de los niños que en el futuro podrían ejercer
funciones en la administración pública. Los seleccionados eran sometidos a un in-
tenso programa de aprendizaje, al final del cual se evaluaba si habían conseguido la
capacitación para ocupar los puestos que les serían asignados. Por tanto, parece un
claro antecedente de la selección de personal. Otro hecho aislado que se suele citar
como antecedente de la evaluación psicológica son los procedimientos de la escuela
de Pitágoras para seleccionar a sus alumnos (Martorell, 1988).
Otro antecedente en el que suelen coincidir los autores que han estudiado la evo-
lución histórica de la evaluación psicológica es la fisiognomia (las características psi-
cológicas de un individuo pueden evaluarse por sus rasgos físicos), que tiene sus
raíces en el pensamiento filosófico griego. Según Rubinstein (1981), la historia de la
ciencia demuestra cómo las antiguas ideas de los filósofos griegos se formaron en el
proceso cognoscitivo práctico del hombre, con la acumulación de conocimientos de
los naturistas, médicos y filósofos. Dichas ideas se desarrollaron en oposición a las
ideas mitológicas sobre el mundo en general y sobre el hombre en particular. En este
contexto, resulta de especial importancia la concepción filosófica de Aristóteles,
quien aspira a vencer el dualismo de su maestro Platón. Aristóteles entiende el cuer-
po y el alma como algo indivisible. Por tanto, cada una de las funciones orgánicas
tiene su alma, considerando al cuerpo un organismo compuesto por órganos e ins-
trumentos del alma. Por ello, la teoría del alma es la teoría general de la vida y sus
funciones, lo que implica tanto sus funciones orgánicas como la vida consciente (Ru-
binstein, 1981). Con Aristóteles, lo psíquico se aproxima a lo físico, lo que implica
una base biológica del carácter. Las ideas de Aristóteles tuvieron su continuidad en
su discípulo Teofrasto. Este hace una sistematización de los principios de la fisiog-
nomia que lleva a plantear distintos caracteres que se establecen por medio de la ob-
Evolución histórica de la evaluación psicológica 5
servación de la conducta manifiesta de los individuos. Se establece así una nosología

de los caracteres, en la que se incluyen diversos adjetivos tales como arrogantes, es-
túpidos, avaros, cobardes, etc., que servían para clasificar a los individuos según sus
hábitos. Esta interacción cuerpo-psique es defendida posteriormente por Cicerón y
Séneca en la Roma Clásica, así como por autores árabes como Averroes o Avicena.
La idea de la evaluación de las características psicológicas a través de las característi-
cas somáticas está presente en tiempos más recientes en las tipologías de Kretschmer
y Sheldon. Siguiendo en este contexto, nos encontramos con la teoría de Hipócrates
que postula cuatro tipos (sanguíneo, flemático, colérico y melancólico) a partir de
cuatro clases de humores.
Esta concepción naturalista manifestada por una evaluación psicológica a partir
de características somáticas (propia de la fisiognomía y del pensamiento hipocrático)
será frenada en la Edad Media por la filosofía teológica, que tendrá su máximo expo-
nente en la concepción de la locura como una posesión diabólica. Con el fin de dife-
renciar a los sujetos poseídos de aquellos que no lo estaban se publica en 1486 el libro
Malleus Malleficarum [El martillo de los herejes], en cuya segunda parte se describen
los signos que permitían identificar a las brujas. Estos procedimientos utilizados por
la Inquisición para evaluar, o mejor dicho para interrogar, a sus víctimas podrían ser
considerados un antecedente remoto de la entrevista estructurada (Zubin, 1989).
A caballo entre los antecedentes filosóficos y biológicos se encuentra la contri-
bución más importante de este período a la evaluación psicológica, la obra de Juan
Huarte de San Juan Examen de ingenios para las ciencias, publicada en 1575 y tradu-
cida al inglés, en 1698, con el título The tryal of wits (McReynolds, 1986). En España
se reeditó en cinco ocasiones hasta que en 1581 fue incluida en el catálogo de libros
prohibidos de Lisboa y dos años después en el de Madrid. Siguiendo las correccio-
nes de la Inquisición, Huarte redacta una nueva versión que es publicada por su hijo
Luis Huarte en 1594. Esta versión tiene bastantes erratas, quizás debido a lo desor-
denado que dejó el material antes de morir. Sin embargo, fue la versión utilizada en
las ediciones posteriores que se hicieron en España, mientras que las ediciones reali-
zadas en Holanda fueron de la edición original. Este libro fue traducido al latín, in-
glés, holandés, italiano, francés y alemán (García Vega, 1989; Velarde, 1993). En esta
obra se plantea por primera vez la evaluación de una forma explícita. Se considera
que las personas difieren en cuanto a su talento y que dichas diferencias deben eva-
luarse para conseguir una adecuación entre las habilidades, las distintas ocupaciones
y los tipos de educación. Así, considera que el ambiente influye en el aprendizaje,
por lo que recomienda que los estudios deben realizarse en una ciudad diferente de
la que se es natural, pues la influencia de familiares y amigos es un estorbo para el
aprendizaje (Pérez-Álvarez, 1991). Su libro es una profesiografía en la que incluye
las principales ocupaciones de su tiempo (véase Gondra, 1994). Es, por tanto, el pre-
cursor más claro de la selección de personal. En opinión de Carpintero (1989),
Huarte de San Juan fue un discípulo de Vives, puesto que ambos compartían la idea
de que el ingenio deriva de los humores. Vives ya había planteado anteriormente el
tema de la diversidad de los ingenios, las diferentes adaptaciones a los estudios y la
importancia social de una educación adaptada a las dotes de los educandos. En su
obra El tratado del alma propone la práctica de la observación introspectiva y obje-
tiva para llegar a conocer las funciones del alma. Vives fue considerado por Watson
como el padre de la psicología moderna, aunque actualmente se le considera más

como un antecedente de la modificación de conducta (Pérez-Álvarez, 1991). Dentro
del ámbito universitario, la evaluación surge de forma paralela a la creación de las
primeras universidades europeas, donde se realizaban exámenes regulares para la
obtención de títulos y distinciones (Anastasi, 1988).
En definitiva, quizás el antecedente más claro de la evaluación psicológica sea la
tendencia natural del hombre a evaluar a los demás. Podría señalarse un sinfín de po-
sibles antecedentes de la evaluación psicológica; sin embargo, para contextualizar los
principales acontecimientos que dieron lugar a los actuales instrumentos de evalua-
ción, no necesitamos remontarnos más allá del siglo XVIIL.
III. ANTECEDENTES CIENTÍFICOS DE LA EVALUACIÓN PSICOLÓGICA
Los importantes avances científicos ocurridos durante el siglo XVII1, y sobre todo en
el XIX, harán que la psicología se separe de la especulación filosófica y se acerque al
método científico. Los antecedentes científicos de la evaluación psicológica podrían
situarse en el desarrollo de disciplinas como la frenología, la matemática, la psicofísi-
ca, la psiquiatría, la psicología educativa y el evolucionismo.
La frenología surge a finales del siglo XVIII y pronto alcanza una gran populari-
dad. Su creador, Gall (1758-1828), proporciona la primera conceptualización siste-
mática de los rasgos, la cual se apoya en los siguientes enunciados:
a. Las facultades mentales son innatas.

El cerebro es el órgano de la mente.
c. Laforma y el tamaño del cerebro se pueden conocer según la forma y medi-
da del cráneo.
d. La mente posee facultades separadas, el cerebro está compuesto de órganos
separados y cada facultad mental se manifiesta por medio de un órgano cere-
bral distinto.
e. El tamaño de cada órgano puede ser estimado durante la vida y, con las res-
tantes condiciones iguales, el tamaño es una medida de la capacidad del ór-
gano.
f.. Todo órgano, si es predominantemente activo, imprime al cuerpo ciertas ac-
titudes y movimientos, que se denomina “su lenguaje natural”.
Aunque la frenología ya forma parte de la historia, sirvió para asentar la idea de

que la conducta y el organismo no son entidades independientes, sino que están ínti-
mamente unidas. Gall practicaba un sistema de diagnóstico basado en la palpación
del cráneo para conocer las facultades dominantes en cada individuo. Entre las apor-
taciones que, según McReynolds (1986), la frenología aporta a la evaluación psicoló-
gica destacan las siguientes:
a. Se crea una taxonomía mental, según la cual se pueden explicar las diferen-
cias individuales.
Evolución histórica de la evaluación psicológica
7
b. Se hace énfasis en las diferencias individuales.

c. Se postula una vertiente aplicada de la psicología.
d. Se propone el paradigma de la evaluación, diferenciando los elementos in-
cluidos en una sesión de evaluación (evaluador, sujeto evaluado, perfiles...).
e. Se elaboran escalas para evaluar variables de personalidad.
f. Sehace énfasis en la objetividad de los datos.
En España la trenología estuvo representada por Cubí, quien realizó algunas

aportaciones teóricas a esta disciplina y propagó estas ideas hasta el punto de llegar a
crear una escuela. Mediante la craneoscopia se diagnosticaban dimensiones y facul-
tades psicológicas en los individuos, de acuerdo con un sistema preestablecido. Se-
gún Carpintero (1989), la obra de Cubí ha tenido su importancia en la historia de la
evaluación psicológica en España.
La matemática tuvo cierta influencia en la constitución y el posterior desarrollo
de la evaluación psicológica. La primera aportación está representada por Quetelet,
un matemático belga que hoy es considerado como uno de los fundadores de la apli-
cación de la estadística a las ciencias sociales (Silva, 1982). Quetelet estudió variables
biológicas y sociológicas, observando que ambas seguían una distribución gaussia-
na, por lo que desarrolló normas y medidas de tendencia central. Su influencia sobre
la evaluación psicológica se centra en dos aspectos importantes: ser uno de los auto-
res que se interesó de forma sistemática por las diferencias individuales y que sus
métodos tuvieron gran influencia en autores importantes como Galton, Pearson y
Spearman.
La psiquiatría ha sido otra disciplina que ha contribuido en buena medida al de-
sarrollo de la evaluación psicológica. El esfuerzo por diferenciar los trastornos men-
tales se traduce en la necesidad de técnicas de evaluación para establecer diagnósticos
diferenciales. Así, Pinel (1745-1826) introduce una breve clasificación de las enfer-
medades mentales que posibilitaba un tratamiento más diferenciado. Pinel defiende
el valor de las historias clínicas para el diagnóstico. Pero, sin duda, su contribución
más importante fue el cambio de actitud sobre los enfermos mentales, pasando a
considerarlos como enfermos con derecho a un tratamiento y a la libertad, y no
como sujetos que había que separar y encerrar, tal como se consideraban hasta en-
tonces. Las ideas de Pinel llegaron a Italia, encontrando su máximo defensor en
Lombroso, quien centró su obra en la relación entre lo penal y lo psiquiátrico, plan-
teando la posible eximente en los delitos cometidos por enfermos mentales. El estu-
dio de la relación entre delincuencia y enfermedad le llevó a postular su famosa teo-
ría sobre la “delincuencia innata”. Según esta teoría, la conducta delictiva puede
tener un origen degenerativo del organismo, debido al efecto de factores como la sí-
filis, el alcohol, la epilepsia, la edad avanzada de los padres, etc., los cuales actuarían
durante el desarrollo fetal produciendo una degeneración de los centros nerviosos
superiores, que posteriormente serían la causa del comportamiento delictivo. La
obra de Pinel alcanza su culminación en la figura de Kraepelin (1856-1926), quien se
interesó por la problemática de la clasificación de los trastornos mentales, conside-
rando que para poder hacer una buena evaluación e intervención era necesario con-
tar previamente con una clasificación. Quizás su contribución más importante fue el
cambio de una concepción sintomática de la enfermedad a una concepción evoluti-
va, es decir, las manifestaciones externas de la enfermedad son secundarias respecto a

su origen y evolución. Su aportación a la evaluación psicológica se centra de forma
más concreta en su interés constante por evaluar de forma objetiva la conducta de
sus pacientes. Así, evaluaba funciones o aptitudes como memoria, atención, Capaci-
dad de aprendizaje, tiempo de reacción, asociaciones verbales, etc. Paralelamente a
esta etapa aumenta el interés por los retrasados mentales, creándose en Europa y
América numerosas instituciones para su cuidado. El interés por un trato adecuado
a los retrasados mentales puso de manifiesto la necesidad de criterios diagnósticos y
de clasificación que permitiesen diferenciar entre sujetos normales, enfermos menta-
les y retrasados. Dentro de este contexto hay que destacar a Esquirol (1772-1840),
médico francés que en 1838 publicó una obra de dos volúmenes, en la que dedicó
más de un centenar de páginas al retraso mental. Otra contribución importante de
Esquirol fue su concepción del retraso mental. Para este autor, el retraso variaba a lo
largo de un continuo desde la normalidad hasta el retraso más profundo. Por ello,
realizó varios intentos para evaluar y clasificar los distintos grados y tipos de retraso
mental, llegando a la conclusión de que el mejor criterio para evaluar el nivel de dete-
rioro intelectual es el uso del lenguaje. Es importante considerar que los criterios ac-
tuales sobre el retraso mental son en gran parte lingúísticos, y que los tests de inteli-
gencia suelen estar bastante saturados de contenidos verbales (Anastasi, 1988). Las
aportaciones de Seguin, otro médico francés, supusieron un nuevo avance al consi-
derar el retraso mental como curable. En 1837 crea la primera escuela dedicada a la
educación de niños retrasados mentales. Muchos de los procedimientos de interven-
ción que se utilizan en la actualidad en los centros de educación especial están funda-
mentados en las técnicas propuestas por Seguin para el adiestramiento de los senti-
dos y de la actividad muscular. Pero sin lugar a dudas, su gran aportación a la
evaluación psicológica fue la incorporación de las pruebas de inteligencia manipula-
tiva. Una buena muestra ha sido su Test de ajuste de formas, que consiste en una es-
pecie de puzzle en el que hay que insertar varias piezas de formas diversas y en el
menor tiempo posible.
La psicofísica puede considerarse como una disciplina precursora de la psicolo-
gía científica. Los métodos ideados por Fechner permiten relacionar las experiencias
subjetivas con medidas objetivas. Por tanto, se plantea que las experiencias psicoló-
gicas se pueden verbalizar y en consecuencia clasificar en escalas de intensidad o dis-
criminación. La psicofísica tenía como postulado inicial el descubrimiento de leyes
generales para describir las relaciones mente-cuerpo. Su contribución a la evaluación
psicológica se puede observar en el estudio concreto de fenómenos psíquicos, rela-
cionando la experiencia subjetiva con medidas objetivas, la creación de nuevos mé-
todos para la investigación de dichos fenómenos y su sistematización teórica (Za-
brodin, 1985). Aunque autores como Fechner y Weber estaban más interesados en
leyes generales que en diferencias individuales, con ellos nace la situación de examen
psicológico; así por ejemplo, Fechner ya utiliza el autoinforme del sujeto como ins-
trumento de evaluación.
La psicología educativa muestra su auge con los planteamientos innovadores
producidos en relación al creciente interés por la educación, con la consiguiente es-
colarización obligatoria, naciendo así la necesidad de aplicar los principios psicoló-
gicos a la escuela y, por tanto, la demanda de evaluación del rendimiento académico.
Evolución histórica de la evaluación psicológica e
Este interés por la evaluación en el ámbito escolar tuvo su continuidad en autores

tan relevantes como Thorndike, Hall y Binet.
El evolucionismo marca un hito importante en la historia de las ciencias huma-
nas. El parentesco entre Darwin y Galton propició aún más la influencia de las teo-
rías evolucionistas para tratar de explicar las diferencias individuales y, en último tér-
mino, la inteligencia humana. La base del evolucionismo consiste en admitir la
variabilidad de los miembros de una misma especie, donde las características pueden
heredarse. Por tanto, en la naturaleza se produce una selección natural a través de la
supervivencia de los miembros más fuertes o mejor adaptados. En la especie huma-
na, la diferente capacidad de adaptación se denomina inteligencia. Las diferencias de
inteligencia eran perfectamente asumidas en la sociedad del siglo XIX. Así, el darwi-
nismo social servía para justificar el orden social establecido. En este contexto el es-
tudio y evaluación de la inteligencia adquiere gran relevancia (Marrero, Espino y
Gámez, 1989).
Los antecedentes más científicos de la evaluación psicológica tienen sus raíces en
los primeros laboratorios de psicología. En 1877 se produjo el primer intento para
fundar un laboratorio de psicofisiología por parte de los científicos británicos Venn
y Ward. Sin embargo, el Senado de Cambridge rechazó esta iniciativa, calificando a
dichos científicos de ateos (Yakunin, 1985). Dos años más tarde, Wundt inauguraba
en Leipzig (1879) el primer laboratorio de psicología, considerándose este momento
como el nacimiento de la psicología científica. La idea de Wundt de acercar la psico-
logía a la fisiología, a pesar de encontrar una clara oposición en los círculos filosófi-
cos, pronto ganó adeptos. Sin embargo, esta idea no era nueva, ya que Séchenov, un
destacado científico ruso, había tratado de interpretar los fenómenos psíquicos des-
de un punto de vista fisiológico. De hecho, su libro Reflejos del cerebro fue editado
en 1863, es decir, once años antes de que Wundt publicara Bases de la psicología fisio-
lógica. En un artículo escrito en 1873, Séchenov, partiendo de la tradición materialis-
ta de los pensadores rusos, defiende la tesis sobre la determinación objetiva de la psi-
quis. Las ideas de Séchenov tuvieron una gran acogida entre los psiquiatras y
neurólogos rusos, lo cual llevó a una reestructuración de la psicología desde una ver-
tiente fisiológica. Una muestra de ello es la creación del primer laboratorio de psico-
logía en Rusia, fundado por Béjteriev en 1886 en la clínica de enfermos alienados y
enfermedades nerviosas en la ciudad de Kazán. Pocos años después, en 1891, se
constituía la Sociedad Rusa de Psicología Experimental (Yakunin, 1985). Desde
su creación y hasta el principio del siglo XX el laboratorio de Wundt se consideró el
centro de la psicología experimental, siendo el ejemplo a seguir en la creación de
nuevos laboratorios. El objeto de estudio de los nuevos psicólogos experimentales
era llegar a plantear descripciones generales de la conducta humana. Las diferencias
individuales no sólo no interesaban, sino que llegaban a considerarse como “errores
de medida”. En la elección de los temas y en algunos métodos utilizados se plasmaba
la influencia de la medicina y de la fisiología. Coincidimos con Pelechano (1988) al
considerar que el tipo de psicología experimental practicada por Wundt y sus segui-
dores supuso en realidad una limitación al desarrollo de la evaluación psicológica.
Wundt negó la importancia de la psicología diferencial, no autorizaba la utilización
de cuestionarios para la investigación psicológica, no aceptaba la posibilidad de una
psicología científica fuera del laboratorio ni los estudios filogenéticos y ontogenéti-
cos del psiquismo humano. Sin embargo, no todo fue negativo, puesto que la psico-
logía experimental del siglo XIX sirvió para poner de manifiesto la importancia de
controlar de forma rigurosa las condiciones en las que se hacían las observaciones.
Por ejemplo, se controlaban las características del estímulo, el contexto en el que se
presentaba, las instrucciones que recibía el sujeto, etc. En definitiva, se trataba de
evaluar a todos los sujetos en las mismas condiciones tipificadas. Como es bien sabi-
do, esto fue totalmente asumido en el proceso de construcción y en la aplicación de
tests (Anastas1, 1988).
IV. CONSTITUCIÓN Y DESARROLLO DE LA EVALUACIÓN PSICOLÓGICA
Existe un cierto consenso en considerar a Galton, Cattell y Binet como los autores
que configuraron la evaluación psicológica como disciplina científica. A continua-
ción se hará referencia a ellos, así como a otros autores que también han contribuido
de modo relevante a la constitución de la evaluación psicológica. En segundo lugar,
se hará un recorrido por los diferentes acontecimientos que han supuesto el desarro-
llo de esta disciplina.
1v.1. La contribución de Galton
Galton (1822-1911) es considerado como el padre de la psicometría y de la psicolo-

gía diferencial. A pesar de ser un hombre polifacético en cuanto a sus intereses cien-
tíficos, supo centrar su investigación sobre la herencia de la inteligencia humana.
Pensaba que ésta es innata y, por tanto, mediante el carácter hereditario podía conse-
guirse una mejora de los individuos a través de la eugenesia. Su laboratorio antropo-
métrico del Kensington Museum en Londres se hizo famoso en todo el mundo. En
el año 1884, coincidiendo con la celebración de un congreso internacional de higie-
ne, establece un laboratorio antropométrico y propone a los visitantes conocer, por
el precio de tres peniques, la medida de algunos de sus rasgos físicos, la agudeza vi-
sual y auditiva, el tiempo de reacción, la fuerza muscular y algunas funciones senso-
riales. Con estos datos publicó la primera tabla de baremos, donde podían comparar
sus resultados los posteriores visitantes del laboratorio (DuBois, 1970). La mayoría
de los instrumentos que se utilizaban en su laboratorio antropométrico fueron crea-
dos por él mismo, y algunos siguen vigentes aún en la actualidad, como es el caso de
la barra de Galton para la discriminación visual de la longitud y la serie de pesos gra-
duados para medir la discriminación cinestésica. Dio especial importancia a la discri-
minación sensorial, pues pensaba que ésta servía para evaluar la capacidad intelec-
tual. Así, en las múltiples evaluaciones realizadas encontró que los idiotas tendían a
presentar deficiencias en la capacidad de discriminación de la temperatura y del do-
lor (Anastasi, 1988).
Como se ha dicho anteriormente, Galton estaba influido por las ideas de su pri-
mo Darwin, influencia que queda plasmada en su primera obra Hereditary genins
[La herencia de la genialidad] publicada en 1869. Diez años después, y coincidiendo
con el año en que Wundt inauguraba el primer laboratorio de Psicología, Galton pu-
blica dos artículos sobre psicometría titulados «Psychometric experiments» y «Psy-
chometric facts». En 1883 publica su obra más importante Inquiries into human fa-
culty and its development [Investigaciones sobre la facultad humana y su desarrollo],
que con el transcurso del tiempo se convertiría en un clásico de la evaluación psico-
lógica. Las aportaciones más relevantes de Galton podrían resumirse en los siguien-
tes puntos (Pelechano, 1988):
a. Interés por hacer un análisis cuantitativo de las características y diferencias

humanas. En este aspecto se notaba una influencia del matemático Quetelet, quien
en el año 1846 ya había demostrado cómo ciertos indicadores antropométricos se-
guían una distribución gaussiana. Por tanto, Galton defendía que las diferencias in-
dividuales se podían explicar de forma adecuada si se concebían como continuos
cuantitativos que seguían la distribución de la curva de Gauss.
b. Interés por la recopilación empírica y sistemática de la información. Esto se
demuestra en su infatigable labor en el laboratorio antropométrico del South Ken-
sington Museum de Londres, donde llegó a recopilar datos correspondientes a 9377
personas que eran evaluadas en un número considerable de pruebas (tiempo de reac-
ción, medidas físicas, respuestas a escalas de calificación...)
c. Aplicación de la estadística para interpretar la información. Además de utili-
zar algunas medidas de tendencia central, Galton introdujo el índice de correlación
(de hecho, en el año 1888 llegó a publicar un artículo sobre «Co-relations and their
measurement, chiefly from antropometric data») que posteriormente sería comple-
tado por Pearson, dando lugar al coeficiente de correlación y sobre el cual se asenta-
ría el modelo correlacional.
d. Interés por el estudio de las diferencias individuales. Siguiendo la teoría evo-
lucionista, Galton entendía las diferencias individuales como resultado de mecanis-
mos y procesos hereditarios. Para demostrar esto utilizó el estudio de los árboles ge-
nealógicos y las correlaciones de pruebas psicológicas entre padres e hijos. Por
medio de esta metodología pudo llegar a plantear la ley de regresión a la media. Gal-
ton se vio obligado a plantear esta ley para poder explicar algunos datos tales como
que padres muy inteligentes tendían a tener hijos menos inteligentes, mientras que
padres poco inteligentes tendían a tener hijos más inteligentes.
El pensamiento de Galton y un buen resumen de su obra pueden verse en el li-

bro Herencia y engenesia, en el que se recoge una recopilación de textos procedentes
de diversas obras suyas.
1v2. La contribución de Cattell
James McKeen Cattell (1861-1934) fue un psicólogo estadounidense con una sólida
formación adquirida en Europa. Su tesis doctoral trató sobre las diferencias indivi-
duales en el tiempo de reacción y fue realizada en el laboratorio de Wundt (Leipzig).
Posteriormente, trabajó con Galton en el laboratorio antropométrico del South
Kensington Museum de Londres. En 1888 fue nombrado profesor de psicología en
la Universidad de Pensilvania. Dos años después publica en la revista Mind un ar-

tículo titulado «Mental tests and measurements», el cual marca un hito en la historia
de la evaluación psicológica, puesto que es la primera vez que se utiliza el término
“test” en la literatura psicológica (McReynolds, 1986) y en él se describían los tests
que se aplicaban anualmente a los estudiantes universitarios con la intención de eva-
luar su nivel intelectual. Posteriormente se trasladó a la Universidad de Columbia,
donde creó la primera batería de pruebas de evaluación psicológica. En poco tiempo
la metodología y el procedimiento para elaborar los tests se hicieron muy populares.
En la última década del siglo XIX los tests se aplicaban, en Estados Unidos, a todo
tipo de sujetos (escolares, estudiantes universitarios, adultos...). Sin embargo, laful-
gurante trayectoria de Cattell se detiene, al menos parcialmente, ante las críticas
planteadas por Wissler y Sharp. El primero, que había sido discípulo de Cattell, pre-
sentó un detallado estudio en el que analizaba los resultados de Cattell, demostran-
do la poca validez alcanzada por los tests. En concreto, demostró que los coeficien-
tes de correlación entre los tests psicológicos y las calificaciones escolares eran
relativamente bajos. Lo mismo ocurría cuando se contrastaban distintos tests que
supuestamente evaluaban lo mismo. Por otra parte, Sharp demostró la baja fiabili-
dad y el poco valor predictivo que tenían los tests de Cattell (Pelechano, 1988). Estas
críticas unidas al hecho de que Cattell sigue vinculado a procedimientos de laborato-
rio y a la evaluación de procesos psicológicos básicos hace que destaque la figura de
Binet (Silva, 1982).
1v3. La contribución de Binet
Binet (1857-1911) era un licenciado en leyes y doctor en ciencias naturales que entró
en la psicología de la “mano” de Ribot, el gran promotor de la psicología experimen-
tal en Francia. Ribot entendía que el progreso de la psicología estaba en los métodos
experimentales (aunque no era un investigador), no en vano fue el fundador del pri-
mer laboratorio de psicología en la Universidad de la Sorbona, en el año 1889. Este
laboratorio estuvo dirigido por Bonin hasta 1895, a partir de entonces la dirección
pasa a Binet (Yakunin, 1985). En el año 1895, Binet funda L”Année Psychologique, la
primera revista francesa de psicología. En esta revista publica un artículo, «La psy-
chologie individuelle», en el que presenta las bases para una nueva aproximación a la
evaluación de la inteligencia. Binet compartía con Galton el interés por la evaluación
de las diferencias individuales, pero rechazaba la idea de que la inteligencia humana
podía evaluarse por medio de los procesos sensoriomotores. En su artículo, Binet y
Henri defienden que la inteligencia debe evaluarse según el rendimiento de los suje-
tos en diversas tareas que impliquen una variedad de procesos mentales complejos
(McReynolds, 1986). Binet y Henri comenzaron evaluando procesos como la me-
moria, la atención, la imaginación, la comprensión, la sensibilidad artística y moral,
la sugestibilidad, la fuerza de voluntad y la habilidad motora. Binet incluye como ca-
racterísticas de la conducta inteligente el tomar y mantener una dirección definida, el
adaptarse para alcanzar un fin y la autocrítica (Cronbach, 1990).
La gran oportunidad de Binet llega cuando es nombrado por el Ministerio de
Educación francés miembro de la comisión que se encargaría de buscar una solución
13
para los niños deficientes que habían entrado en la escuela pública como consecuen-
cia de la puesta en vigor de la enseñanza obligatoria en Francia. En respuesta a esta
petición, Binet, en colaboración con Simon, desarrolla una escala que contiene 30
problemas con grado de dificultad creciente. Para calcular el nivel de dificultad se
aplicó la escala a 50 niños normales con edades comprendidas entre 3 y 11 años y a
algunos con retraso mental. El contenido de los ítems cubría gran variedad de fun-
ciones, aunque predominaban los problemas relativos a comprensión y razona-
miento. La prueba resultante que se conoce como la escala de 1905 fue considerada
como un instrumento de evaluación provisional (Anastasi, 1988). Como señala Pi-
chot (1994, p. 120) «por primera vez se había salido de la era de las experiencias de la-
boratorio para entrar en la vida concreta». Binet y Simon siguen trabajando en esta
escala, y en 1908 presentan una segunda versión en la que se habían adaptado series
de ítems para grupos de edad. La edad mental se establecía según la edad correspon-
diente a la serie más elevada resuelta totalmente. Puesto que cada serie, que se corres-
ponde con una edad mental determinada, consta de cinco problemas, se añadía a la
edad base (la de la serie correctamente realizada en su totalidad) 1/5 de año por cada
test bien resuelto perteneciente a series superiores. La edad mental obtenida se ponía
en relación con la edad cronológica, viendo de esta forma si el niño seguía una evolu-
ción normal, retrasada o adelantada. En 1911, se presenta una tercera versión de la es-
cala, se aumentó el número de ítems en algunos niveles y se extendió a la edad adulta.
Sin embargo, la versión más difundida fue la realizada por Terman en la Universidad
de Stanford, conocida como la Escala de Stanford-Binet. En ésta se utiliza por pri-
mera vez el término de «cociente intelectual» (CI), como razón resultante de dividir
la edad mental por la edad cronológica. Posteriormente, aparecieron otras versiones,
pero resulta de especial interés la realizada por Kuhlmann en 1912 (Escala Kuhl-
mann-Binet) que extendió la escala por su parte inferior hasta la edad de tres meses,
siendo revisada posteriormente en 1937 y 1960". Terman efectúa otras dos revisiones
y, finalmente, Thorndike realiza la última hasta la fecha, en 1986 (Rogers, 1995).
Sin embargo, estas escalas no estaban exentas de problemas. Así, mientras Gal-
ton postulaba la medida de una inteligencia innata o biológica, Binet defiende la eva-
luación de una inteligencia de origen social (Luján, 1991). Pronto el movimiento euge-
nista toma como instrumento el test de Binet y Simon identificando la inteligencia
innata con la social. Pelechano (1988) señala que la lógica utilizada por Binet en la
construcción e interpretación de la escala era correcta, pero vista desde una óptica
actual tenía algunos problemas importantes:
a. No se demostró que las conductas muestreadas fuesen representativas de lo

que se pretendía evaluar (la capacidad intelectual).
b. La muestra utilizada para la tipificación de las puntuaciones no era represen-
tativa de la población a la que luego se aplicaba.
c. Lautilización de la edad cronológica como variable criterio para graduar la
edad mental, haciendo así implícito que cada doce meses se produce un cam-
bio en la capacidad intelectual.
1 La versión de 1960 fue adaptada en España por un grupo de psicólogos bajo la dirección de José
Germain.
d. El modelo acumulativo según el cual cada problema resuelto equivale a un

período de edad mental no fue demostrado. y
e. El supuesto de que la distribución de las puntuaciones es igual en cada grupo
de edad no es correcto.
f.. Se supone que todos los niños tienen un desarrollo normativo, es decir, igual
al del grupo de referencia.
Por otra parte, el tipo de problemas que se planteaba estaba íntimamente relacio-
nado con los contenidos académicos, por lo que la escala era buena predictora del
rendimiento académico, que no es lo mismo que capacidad intelectual.
A pesar de los problemas metodológicos que se detectan en las escalas de Binet,
éste debe ser considerado como el gran propulsor de la evaluación psicológica. Su
actividad ha sido realmente la de un evaluador y su influencia ha estado vigente du-
rante varias décadas. Una buena muestra de ello fue la cantidad de investigadores
que se interesó por la evaluación de la inteligencia durante las dos primeras décadas
del siglo XX. La producción en este campo era tan abundante como diversificada.
Por ello, en 1921 los directores del Journal of Educational Psychology organizaron
un congreso bajo el título La inteligencia y su medida e invitaron a distintas autori-
dades en la materia (Terman, Thorndike, Peterson, Thurstone, Woodrow, Pinter,
Colvin, Henmon...) para tratar sobre la naturaleza de la inteligencia (Sternberg,
1986). El resultado fue decepcionante; había casi tantas concepciones de inteligencia
como expertos que opinaban sobre el tema. El desconcierto era tal que Binet llegó a
pronunciar la famosa frase «inteligencia es lo que miden los tests». Sin embargo, el
congreso sirvió para establecer un cierto acuerdo acerca del camino a seguir en la fu-
tura investigación de la inteligencia (Marrero y cols., 1989). Desde entonces, han pa-
sado más de setenta años y aún no se ha llegado a un acuerdo unánime acerca de lo
que es la inteligencia y de cómo debe evaluarse (Eysenck, 1991).
1V4. Aportaciones de otros autores

Cuando Cattell abandonó la Universidad de Pensilvania su lugar fue ocupado por
Witmer (1867-1956) quien, al igual que el anterior, estaba interesado en el estudio de
las diferencias individuales. Sin embargo, su principal interés se centraba en la aplica-
ción práctica de los conocimientos psicológicos. En el año 1896, Witmer funda la
primera clínica psicológica (de hecho suele considerarse esta fecha como el naci-
miento de la psicología clínica, aunque por ello no debe interpretarse que Witmer
fue el primer psicólogo clínico). El tipo de trabajo que se realiza en esta clínica se re-
coge en los primeros números de la revista The Psychological Clinic, fundada en
1906 y dirigida por Witmer. La mayoría de los casos que se trataba procedía del ám-
bito escolar. En los primeros años, no disponía de pruebas específicas de evaluación
por lo que su diagnóstico se basaba fundamentalmente en la entrevista. Posterior-
mente, cuando aparecen los tests, adopta alguno de ellos e incluso crea el Witmer
formboard y el Witmer cylinders, que fueron utilizados durante varios años en su clí-
nica. Se centraba en la evaluación de conductas específicas de los sujetos con vistas al
tratamiento de dichas conductas. Por ello, se le ha considerado como un antecesor
de la evaluación conductual (McReynolds, 1986). Witmer fue un autor con una in-
fluencia limitada en la evaluación psicológica. Sin embargo, su gran mérito fue tratar
de aplicar la psicología a los problemas que se plantean en la vida real. Por otra parte,
su clínica psicológica sirvió como modelo a otras muchas que se fundaron posterior-
mente.
Spearman (1863-1945) supone otro paso importante en la constitución de la eva-
luación psicológica por haber aplicado los métodos correlacionales a la investigación
de la inteligencia. En el año 1904 publicó un importante artículo titulado «General
intelligence, objectively determined and measured», donde se sientan las bases de la
teoría psicométrica. Fue el primer autor que se interesó en buscar una explicación a
la baja correlación que se obtenía entre distintos tests de inteligencia y en plantear la
necesidad de utilizar pruebas paralelas para su evaluación. La gran aportación de
Spearman no sólo fue metodológica, sino que además fue el autor de la primera gran
teoría de la inteligencia, denominada teoría de los dos factores (un factor general y
unos factores específicos). Según dicha teoría, la capacidad representada en el factor
general (factor g) está relacionada con todas las tareas intelectuales, mientras que las
capacidades representadas en los factores específicos se relacionan con tareas senci-
llas. Para explicar la naturaleza del factor g Spearman propuso dos teorías. En la pri-
mera, se decía que el factor g estaba relacionado con el nivel de energía cerebral que
las personas pueden utilizar para resolver problemas intelectuales; la segunda consi-
dera que las diferencias en el factor g pueden explicarse según las diferencias indivi-
duales en la capacidad de las personas para utilizar tres principios cualitativos de
cognición: aprehensión de la experiencia, deducción de relaciones y deducción de
correlaciones (Sternberg, 1986; Marrero y cols., 1989). En la década de los años
treinta este esquema bifactorial será sustituido por un modelo multifactorial repre-
sentado por Thurstone.
Por último, Freud (1856-1939) plantea un enfoque diagnóstico basado en las
técnicas de asociación y en la utilización del simbolismo. En 1909 sus conferencias
en la Clark University of New York propiciarán la difusión del psicoanálisis en
Estados Unidos (Ávila, 1992b), dando lugar al diagnóstico dinámico que se desa-
rrollará a partir de la década de los años treinta con el uso de las técnicas proyec-
tivas.
vs. La repercusión de la primera y de la segunda guerra mundial

Existe un cierto acuerdo entre los diferentes autores en considerar las dos contiendas
mundiales como hechos determinantes en la evolución de la evaluación psicológica,
enmarcándose entre esos dos momentos históricos lo que Silva (1982) denomina la
“época clásica” del diagnóstico psicológico; así, según este autor, tanto lalínea psico-
métrica como la proyectiva y la clínica de la actual evaluación psicológica viven aún
de los grandes hitos de esta época: los grandes tests de inteligencia, los primeros
cuestionarios de intereses y los primeros tests proyectivos. Durante las dos primeras
décadas del siglo XX, la evaluación psicológica se vio enriquecida por un gran núme-
ro de investigaciones, artículos y manuales sobre el tema, como puede verse defor-
ma detallada en McReynolds (1986). El desarrollo alcanzado por la evaluación psi-
cológica hasta entonces es interpretado por Silva (1982) en función de tres aspectos
importantes:
a. La construcción y perfeccionamiento de las pruebas de Binet-Simon y las

posteriores aportaciones de Goddard (traductor de las escalas de Binet-Simon al
inglés en 1910), Stern (introductor del concepto cociente mental) y Terman (autor de
la versión de la escala Stanford-Binet de 1916 e introductor del concepto cociente 1m-
telectual).
b. La importancia que adquiere la educación (fundamentalmente a raíz de la
entrada en vigor de las leyes que regulan la educación obligatoria en varios países)
lleva consigo un interés creciente de la evaluación psicológica en el ámbito educa-
tivo.
c. La gran aportación metodológica de Pearson y Spearman que sientan los
fundamentos de una teoría psicométrica, vigente aún en la actualidad. Por otra parte,
la teoría de la inteligencia propuesta por Spearman generó diversas líneas de investi-
gación acerca de la naturaleza de la inteligencia y de los instrumentos para evaluarla.
Con el comienzo de la primera guerra mundial, la industria generada en torno a

la guerra afecta también a la psicología, y más concretamente a la evaluación psicoló-
gica. Así, la American Psychological Association (APA) nombró un comité que se
encargaría de estudiar la posible ayuda que podría ofertar la psicología. Era quizás
una buena oportunidad para demostrar a la sociedad que la psicología podía tener
una importante vertiente aplicada. El comité estaba dirigido por Robert Yerkes y
contaba con miembros tan relevantes como Terman, Woodworth y Otis, entre
otros. Pronto se vio la necesidad de seleccionar a más de un millón de soldados, para
lo cual era imprescindible disponer de pruebas colectivas que permitiesen clasificar a
los soldados según su nivel intelectual y sus aptitudes para desempeñar uno u otro
tipo de servicio. Dado que la mayoría de los tests existentes era de aplicación indivi-
dual, fue necesario recurrir a todo tipo de tests que se pudiesen aplicar de forma co-
lectiva. Arthur Otis puso a disposición del Ejército una serie de tests que estaba ela-
borando, pero que aún no había llegado a publicar. En cierto modo podría decirse
que la situación era similar a la que se le había planteado unos años antes a Binet,
aunque había dos diferencias muy claras: el equipo de Yerkes tenía que seleccionar
sujetos adultos de una población general (piénsese que la mayoría de las pruebas es-
taba elaborada para niños y estudiantes universitarios) y además la selección debería
hacerse “contra reloj”. Se necesitaban pruebas de dificultad progresiva, con respues-
tas cortas, corrección rápida y objetiva, con diferentes formas (para evitar el aprendi-
zaje) y de aplicación colectiva. Las pruebas construidas para evaluar el nivel intelec-
tual fueron conocidas como el Army alpha test y el Army beta test. La primera se
aplicaba a la población general (instruida) y constaba de las siguientes subpruebas:
cumplir órdenes, problemas aritméticos, sinónimos y antónimos, juicios prácticos,
analogías, información y gramática. Cada subprueba tenía una dificultad creciente y
debía responderse en un tiempo limitado. La segunda prueba estaba pensada para
personas analfabetas o personas que no hablaban inglés; por tanto, en ésta no se in-
cluían contenidos verbales, sino que constaba de laberintos, series, cubos, puzzles,
construcciones geométricas, cifras-símbolos y números. Por supuesto, el tiempo
para responder también era limitado. Para evaluar la sintomatología neurótica se uti-
lizó el Woodworth personal data sheet, un inventario de personalidad elaborado por
Woodworth y que llegó a aplicarse a más de un millón y medio de personas.
La influencia de todo este proceso ha tenido gran importancia en el desarrollo de
la evaluación psicológica en diversos aspectos, que intentaremos sintetizar en los si-
guientes puntos:
a. El primero, y quizás el más importante, ha sido considerar la figura del psi-

cólogo como un profesional cualificado que puede resolver problemas de la vida
real.
b. El perfeccionamiento de la metodología de la construcción de tests y la for-
mación de un gran banco de datos (más de un millón y medio de sujetos) de la pobla-
ción general.
c. El tipo de evaluación realizada en el ejército se adaptó a campos como el in-
dustrial (selección y evaluación de personal) y el clínico.
d. La consolidación de la aplicación de tests con la consiguiente connotación
del “psicólogo pasador de tests”.
La evaluación psicológica del período entre las dos guerras mundiales es caracte-
rizada por Silva (1982) como de «creciente expansión» y «creciente disociación». La
«creciente expansión» se refiere a la universalización de la evaluación psicológica y
su generalización a otros ámbitos (distintos del militar) y la especialización de la eva-
luación en áreas tan diversas como inteligencia, aptitudes, motricidad, intereses,
conducta social, personalidad, etc. La «creciente disociación» hace referencia a que,
por un lado, se produce un espectacular crecimiento del modelo psicométrico y, por
otro, surge también con gran fuerza una evaluación clínica, principalmente de tipo
proyectivo, y que no acepta los avances técnicos y metodológicos del modelo psico-
métrico. Esta evaluación de corte clínico no surge al azar después de la primera gue-
rra mundial. Por un lado, los instrumentos de evaluación clínica no tenían ninguna
utilidad en las tareas de selección y colocación requeridas por el ejército estadouni-
dense, pero sí se convierten en necesarios después de la guerra para la reinserción
de sujetos a la sociedad. La difusión de las técnicas proyectivas tiene su inicio en la
publicación por parte de Rorschach en 1921 de Psychodiagnostik, aunque no con-
viene olvidar que Jung ya había presentado en 1904 la prueba de asociación libre de
palabras.
Los antecedentes del test de Rorschach pueden remontarse a la antigua idea grie-
ga de que la interacción de una persona con una entidad ambigua facilita informa-
ción para el conocimiento de la primera. Según Álvarez (1972), en sus versiones más
primigenias, el test de Rorschach es tan antiguo como el hombre de Cro-Magnon,
cuando interpretaba las “manchas” de aquellos refugios rupestres. En el Renaci-
miento, Leonardo da Vinci aconsejaba a sus discípulos que ejercitaran su imagina-
ción contemplando los desconchones o las figuras que la humedad dibujaba en las
paredes. También puede relacionarse con una costumbre arraigada en algunas regio-
nes de Alemania que consistía en tirar una gota de plomo fundido en un recipiente
de agua fría e interpretar la forma resultante al solidificarse. Según la tradición, cuan-
do la interpretación se realizaba en la noche de San Silvestre podía averiguarse el fu-
turo de la persona que arrojaba el plomo fundido. Pero sin duda, el antecedente más
claro es la técnica denominada klebsografía (desarrollada por Klebs) que consiste en
echar unas gotas de tinta sobre un papel que posteriormente se dobla por la mitad,
interpretándose las manchas resultantes. A finales del siglo XIX, Binet comienza a
utilizar las manchas de tinta para estudiar la capacidad de imaginación visual. Algu-
nos años después, Herman Rorschach utiliza esta técnica para el diagnóstico de la
personalidad y de los trastornos psíquicos. De la totalidad de láminas utilizadas se-
lecciona diez con el fin de publicar su método, lo cual no consiguió hasta dos años
después, gracias a la mediación de Morgenthaler, que además sugirió a Rorschach
que cambiase su título original, «Método y resultados de un experimento diagnósti-
co basado en la percepción e interpretación de formas causales» por el de «Psico-
diagnóstico». En un principio, el libro tuvo muy poca aceptación. Las críticas fueron
pocas y en general desfavorables, lo cual le produjo una decepción considerable.
Rorschach murió sin saber la popularidad que llegaría a tener la técnica que había
creado (Serrate, 1980). En los años siguientes la evaluación dinámica irrumpe con
fuerza, fundamentalmente en la psicología de la personalidad, y la técnica de Rors-
chach se convierte en una de las pruebas más conocidas y utilizadas (Goldstein y
Hersen, 1990b). Una encuesta realizada por Lubin, Larsen y Matarazzo (1984) entre
psicólogos clínicos estadounidenses sitúa al Rorschach en el cuarto lugar entre los
tests más usados, detrás del Wechsler adults inteligence scale (WAIS), Minnesota mul-
tiphasic personality inventory (MMPI) y el Test gestáltico de Bender. Pocos años des-
pués, Murray publica en 1935 el Test de apercepción temática (TAT) como una alter-
nativa a la técnica de Rorschach por su subjetivismo y falta de fiabilidad y validez.
Otra fecha relevante es la de 1939 cuando Frank propone el término “método pro-
yectivo” para aludir a estas pruebas, caracterizándolas por un material con una es-
tructura mínima y en las que el sujeto “estructura” el material proyectando en esta
estructuración su modo personal de ordenar la realidad.
De forma paralela a este desarrollo de técnicas proyectivas se siguen producien-
do avances en el área psicométrica manifestados por un refinamiento de las técnicas
factoriales. Así, Thurstone publica en 1935 Vectors of the mind y en 1938 Primary
mental abilities, en donde la inteligencia adquiere una naturaleza multivariable (Ro-
gers, 1995). En 1939 se publica la Wechsler-Bellevue intelligence scale, la primera es-
cala de Wechsler para adultos, con algunas diferencias con respecto a la Stanford-
Binet: cada subtest incluía ítems para cada grupo de edad, hacía menos énfasis en la
velocidad de respuesta y contenía bastantes componentes no verbales (Rogers,
1995). Otras publicaciones relevantes de esta época son el Inventario de intereses vo-
cacionales de Strong en 1927 y el Test gestáltico de Bender en 1938. La coexistencia
de estos dos polos (clínico-proyectivo e intelectual-psicométrico), aparentemente
opuestos, ha conducido, tal como plantea Pelechano (1988), a una cierta hibridación;
así, la evaluación picométrica intenta ir más allá de una simple puntuación y, al mis-
mo tiempo, hay un intento de objetivización y cuantificación de las técnicas proyec-
tivas. Sin embargo, a pesar de los esfuerzos realizados para aumentar la fiabilidad de
las técnicas proyectivas [véase, por ejemplo, Exner (1990)], las críticas que recibieron
fueron contundentes. Ante esta situación, Silva (1982, 1985) plantea tres posibles Op-
ciones: seguir utilizando estas técnicas basándose en una aproximación proyectivo-
dinámica, haciendo caso omiso de las críticas científicas; prescindir de ellas; o mante-
4
nerlas, sustituyendo las interpretaciones psicodinámicas por otras propias de enfo-

ques interpretativos diferentes. A pesar de que la opción más adecuada es la última
(Martorell, 1988), las más frecuentemente seleccionadas son las primeras.
_ En la década de los años treinta comienza una época de discusiones teóricas en la
psicología soviética —entiéndase el término como genérico, y no como la psicología
de una determinada escuela. En 1930 comienza la “discusión reactológica”; la reac-
tología había sido propuesta pocos años antes por Kornilov y en ella se trataba de in-
tegrar la reflexología de Béjteriev y la psicología de la conciencia. Posteriormente, en
1932, se amplía la discusión a la teoría del desarrollo cultural de las funciones psíqui-
cas superiores (desarrollada por Vigotski). Las discusiones sobre la reflexología, la
reactología y la teoría del desarrollo cultural llevan a una intervención del gobierno.
En palabras de Rubinstein (1981, p. 103) «sólo la resolución del Comité Central del
PC de la U.S. del 4 de julio de 1936 desenmascaró algunas teorías sumamente perju-
diciales y reaccionarias, las cuales inhibían con sus falsas frases seudomarxistas el
desarrollo de la psicología, disgregándola por medio de conceptos acientíficos. Di-
cha resolución eliminó al mismo tiempo varios impedimentos externos de organiza-
ción en el trabajo de la investigación psicológica de la URSS». En esta resolución se
prohibía la construcción y utilización de los tests en la Unión Soviética (tal como es-
taba constituida hasta 1991). A partir de dicha resolución la evaluación psicológica
en la Unión Soviética se centra en la elaboración de procedimientos experimentales
de evaluación de procesos básicos (memoria, percepción, atención...) y complejos
(pensamiento, comprensión, abstracción...) La producción, tanto teórica como ex-
perimental, se incrementa de forma considerable. Se crean varios centros de investi-
gación y/o docencia en psicología: el Instituto Estatal de Psicología de Moscú, la Cá-
tedra de Psicología del Instituto Pedagógico Estatal (Leningrado), un Departamento
de Psicología en el Instituto Béjteriev de Investigación Cerebral, y otros en Georgia
y Ucrania. Fruto de ello, cabe resaltar los trabajos de Blonskii (sobre la memoria),
Teplov (sobre las facultades o aptitudes), Kravkov (sobre psicofisiología), etc. Por
otra parte, se potenció la evaluación neuropsicológica, como quedó patente en los
numerosos y excelentes trabajos de Luria.
Tal como había sucedido con la primera guerra mundial, la segunda guerra mun-
dial también tiene como consecuencia un gran incremento en la construcción y apli-
cación de tests. Para la selección del personal militar, en Estados Unidos se desarro-
lló el Army general classification test (que incluía subpruebas de lectura, vocabulario,
razonamiento aritmético, cálculo aritmético y relaciones espaciales), una prueba de
aplicación colectiva —por razones obvias— y que fue aplicada a más de nueve millo-
nes de personas durante la guerra. Además, se elaboraron otras pruebas más especí-
ficas para la selección de oficiales y de cuerpos técnicos del Ejército. Mientras tanto,
el ejército británico había optado por la utilización de pruebas de inteligencia gene-
ral (que evaluaban el factor g) con contenidos no verbales. Dos de las pruebas que se
emplearon están vigentes en la actualidad: las Matrices progresivas de Raven y el Test
de los dominós de Anstey. En definitiva, podría decirse que la segunda guerra mun-
dial supuso la aplicación de tests más numerosa que se ha hecho hasta la actualidad.
Se estima que en 1944, en los países aliados, se pasaron unos sesenta millones de tests
a unos veinte millones de personas (Pelechano, 1988).
Al comienzo de los años cuarenta, Hathaway y Mckinley presentaron el Minne-
sota multiphasic personality inventory (MMP1), construido según elmodelo psicomé-

trico, y que constituye una de las mayores aportaciones en el ámbito de la evaluación
de la personalidad y de la evaluación clínica (Goldstein y Hersen, 1990b). El auge
que tuvo esta prueba fue enorme, y todavía en la actualidad continúa siendo uno de
los instrumentos más utilizados en la práctica clínica (Lubin y cols., 1984; Keller,
Butcher y Slutske, 1990). Para elaborar las escalas que se incluyen en el MMPI se se-
leccionaron aquellos ítems que maximizaban las diferencias entre los sujetos con cla-
ra sintomatología psicopatológica y sujetos “normales”.
A modo de resumen, se puede apuntar que esta etapa coincidente con las guerras
mundiales supone un desarrollo de la evaluación de la personalidad, al mismo tiem-
po que se sigue desarrollando la evaluación de la inteligencia a través de escalas indi-
viduales como las de Terman y las de Wechsler y el refinamiento de la evaluación co-
lectiva gracias a las técnicas factoriales. En este período surge también, tal como se
comentó, la polémica entre la evaluación proyectiva y la psicométrica que llevará a
incongruencias, que se siguen manteniendo todavía en la actualidad, tales como el
empleo simultáneo del MMPI, el Rorschach y las escalas de Wechsler.
1v.6. Período de crisis de la evaluación psicológica

Al finalizar la segunda guerra mundial, en Europa comienza un período de recons-
trucción a todos los niveles, pero con una preferencia en los sectores económico y la-
boral. En este contexto, la psicología queda relegada a un segundo plano en espera
de una mejor situación económica, produciéndose así un incremento en la emigra-
ción —que había comenzado antes de la guerra— de importantes psicólogos euro-
peos a Estados Unidos (Titchener, Múnsterberg, Levin...). Sin duda, ésta fue una
causa adicional que contribuyó a un mayor desarrollo de la psicología en Estados
Unidos a partir de la posguerra. Estados Unidos al final de la guerra se encuentra
con el problema de la integración de los soldados a la vida civil. La “desarrollada”
evaluación psicológica especializada en selección de grandes masas ya no tenía tanta
utilidad. Ahora era necesaria una psicología orientada a la evaluación individual y a
la rehabilitación. Por otra parte, la polémica, en un principio académica, sobre gene-
tistas y ambientalistas pasa a ser un tema de debate social. A esto se unía una crítica,
cada vez mayor, hacia el uso indiscriminado de todo tipo de tests, tal como ilustra
Cronbach (1972, p. 36):
un psicólogo que hubiese inventado un test se limitaba a imprimir copias para su uso general
y a través, generalmente, de una empresa que vendía aparatos a los laboratorios de psicología.
Cuando la demanda de tests creció después de la primera guerra mundial, algunas firmas se
especializaron en la publicación de tests, incluyendo las especializadas en tests escolares...
Cada institución, untversidad, empresa, o cualquier otra, planificaba y financiaba su propio
programa. Cada cual adaptaba un test según su propia elección. Y en este sentido, reinaba una
absoluta libertad.
La utilización de tests llega a ser tan frecuente que el propio Cronbach se sor-
prende de que, sólo treinta meses después de haberse aplicado el primer test colecti-
vo para población escolar, éste se había administrado a más de cuatro millones de ni-
ños en Estados Unidos. Por su parte, Holtzman (1971) estima que en los colegios es-
tadounidenses se aplican anualmente más de 250 millones de tests.
La psicología soviética durante estos años no sólo se había consolidado, sino que
además había afinado sus críticas hacia los tests. Algunas de estas críticas se resumen
en los siguientes puntos (Rubinstein, 1981):
a. Si dos personas resuelven o no un mismo test, el significado psicológico de

este hecho no es único, puesto que un mismo resultado puede ser motivado por pro-
cesos psíquicos diferentes. Por tanto, el que un test haya sido resuelto o no, no deter-
mina la naturaleza interna del acto psíquico correspondiente.
b. Según el método de los tests, la evaluación de la personalidad se deriva tan
sólo de la evaluación estadística de los datos externos que se han obtenido por el in-
dividuo en respuesta a determinadas cuestiones. Por tanto, este método sólo se basa
en un enfoque mecánico, que parte de la conducta y se orienta hacia la personalidad.
Se intenta establecer la evaluación de la personalidad que se va desarrollando sólo
con una prueba, sin tener en cuenta el desarrollo del individuo y la influencia de la
educación.
c. El error se acentúa si se quiere establecer un pronóstico, partiendo para ello
del supuesto de que el nivel que se ha calculado por medio de dicho test en un deter-
minado grado de desarrollo caracterizará también en el futuro a la persona evaluada.
Según esto, se admite una trascendente predeterminación de toda ulterior evolución
de un ser humano bajo las condiciones que se han dado y, consciente o inconsciente-
mente, se niega la posibilidad de transformación del hombre: del adulto por la inte-
racción social y del niño por medio de la educación.
d. Cuando a dos personas de distinto desarrollo y en condiciones diferentes se
les formula el mismo test estándar y, según sus respectivas soluciones, quieren obte-
nerse conclusiones sobre su inteligencia, se comete evidentemente un error, pues no
se tiene en cuenta que los resultados dependen de las condiciones de evolución o
desarrollo. Dos estudiantes o dos trabajadores pueden resolver los tests de diferente
manera, porque uno de los estudiantes está menos preparado y uno de los trabajado-
res menos versado que los otros. Pero por medio de la enseñanza los unos pueden
superar a los otros.
e. El hecho de que determinados tests puedan ser resueltos por el 75% de los
niños de un intervalo de edad y de un determinado ambiente escolar no es razón
para considerarlo como criterio mediante el cual se pueda establecer la inteligencia o
el desarrollo intelectual de los niños que fueron educados en condiciones muy dis-
tintas. Postular tal conclusión equivaldría a no considerar que los resultados del test
dependen de las condiciones de evolución del ser humano concreto.
Otro inconveniente es el hecho de que se emplean escalas estandarizadas y se
intenta clasificar a los individuos por medio de pruebas en las cuales no se tienen en
cuenta las diferencias individuales.
También debe resaltarse el contenido casuista y a menudo provocador de es-
tas pruebas, las cuales, por lo general, no consideran la preparación específica del su-
jeto en la evaluación. Al formular problemas queno están ligados con la enseñanza
se cree, equivocadamente, poder obtener conclusiones sobre la capacidad de apren-
dizaje del sujeto.
Todos estos factores contribuyeron a una crisis que Maloney y Ward (1976) des-
cribieron como un período de exacerbado pragmatismo empiristaycon tendencia a
las fórmulas y recetarios de evaluación a modo de “libros de cocina”. Aligual que
Cronbach (1972), estos autores también hablan del abuso y uso indiscriminado que
se ha hecho de los tests, así como de su mala interpretación y/o desconocimiento del
significado de los mismos. Silva (1982) describe esta situación como una «Crisis ex-
terna», de cara a la sociedad, pero, además, este autor habla de una «crisis interna»,
centrada en las garantías científicas y aspectos psicométricos. La eficacia predictiva
de los instrumentos psicométricos queda en entredicho en una revisión de Ghusell:
en 1955; por su parte, Edwards en 1957 habla de la influencia de la deseabilidad so-
cial en los cuestionarios de personalidad. Durante este período las críticas iban dir1-
gidas tanto a las pruebas psicométricas como a las técnicas proyectivas y al diagnós-
tico psiquiátrico. Así, los tests de inteligencia eran acusados de tener escasa utilidad
de cara a la intervención psicológica, algunas de las escalas del MMP1 como las de
depresión y esquizofrenia estaban contaminadas por otras categorías diagnósticas, etc.
Tanto el Rorschach como el 747 fueron objeto de múltiples estudios con el fin de
analizar su objetividad y los diferentes tipos de fiabilidad y validez, los cuales en ge-
neral mostraron resultados negativos. Por su parte, el diagnóstico psiquiátrico fue
fuertemente criticado por la falta de fiabilidad y validez, y por sustentarse en el mo-
delo médico de enfermedad, considerando la conducta anormal como un síntoma de
enfermedad y etiquetando a la persona según un sistema nosológico. Las críticas lle-
garon incluso a la efectividad de la psicoterapia, surgiendo así una nueva área de la
evaluación psicológica, la evaluación de las intervenciones. Un buen ejemplo de ello
es la publicación en 1952 de The effects ofpsychoterapy: An evaluation por parte de
Eysenck.
Sin embargo, toda crisis tiene sus aspectos innovadores y positivos; así, en este
contexto aparecen numerosas publicaciones, consideradas clásicas actualmente, re-
ferentes a aspectos psicométricos. En 1950 Gulliksen publica The theory of mental
test con el fin de sistematizar los procedimientos de validación de los tests; en 1955
aparece el trabajo de Cronbach y Meehl Construct validity in psychological tests; y
en 1958 se publica la primera edición de Psychological testing de Anastas1. El esfuer-
zO por un acercamiento más individualizado a la evaluación psicológica hace que
surjan durante la década de los años cincuenta diferentes pruebas vigentes todavía en
la actualidad: la Prueba de clasificación Q de Stephenson, el Diferencial semántico de
Osgood y las Técnicas de rejilla de Kelly (Silva, 1982). Asimismo, esta década va a su-
poner también el desarrollo de la evaluación factorial de la personalidad. En Gran
Bretaña, Eysenck comienza a elaborar y desarrollar sus cuestionarios de factores bá-
sicos de personalidad; mientras, en Estados Unidos, Cattell publica su cuestionario
de dieciséis factores. Otro hito importante en esta época es la publicación por parte
de Meehl en 1954 del libro Clinical versus statistical prediction. A theoretical analysis
and a review of the evidence, en donde se critican abiertamente las técnicas proyecti-
vas, en especial su baja objetividad, su poca fiabilidad test-retest y su baja validez
predictiva, presentándose como alternativa científica el MMPI; además, como mani-
festa Pelechano (1988), la falta de una teoría en la que sustentarse lleva a identificar
estas técnicas con las teorías psicoanalíticas. Sin embargo, estas críticas no influyeron
en absoluto en su empleo; así, Sundberg (1961) comunica que entre los tests más uti-
lizados por psicólogos clínicos en el año 1959 se encontraba en primer lugar el Rors-
chach y en segundo el 7A7. Holtzman relata su experiencia cuando fue contratado
por las Fuerzas Aéreas de Estados Unidos, con la finalidad de comprobar la eficacia
del test de Rorschach en la selección de pilotos:
no se trataba exactamente de la puesta a prueba de la utilidad del Rorschach en la evaluación
clínica de los pacientes, o cualquiera que sufra un trastorno emocional o mental. Era más bien
un intento por comprobar algo que muchos de los defensores del Rorschach proclamaban,
en aquel tiempo, que era capaz de hacer. Durante e inmediatamente después de la segunda
guerra mundial algunos de los pioneros del Rorschach, como Klopfer entre otros, dijeron
que podían utilizar el test para predecir el éxito en las Fuerzas Aéreas. Y así se utilizaba, por
ejemplo, para decidir entre dos candidatos a piloto de guerra [...]. El experimento era la ade-
cuada puesta a prueba de esas particulares exageraciones. El Rorschach había sido propuesto
para la selección de pilotos; para comprobar su eficacia fui contratado por las Fuerzas Aéreas
a tiempo completo. En el estudio colaboraron 20 clínicos, expertos en Rorschach, muy cono-
cidos, repartidos por todo Estados Unidos. Se les proporcionaron protocolos seleccionados
al azar, pidiéndoles que diferenciaran los candidatos que habían tenido éxito de aquellos que
no. No fueron capaces de hacerlo. Este estudio tuvo una gran importancia en su momento
porque supuso la caída del Rorschach en los círculos académicos [...]. Lo que me resultó más
sorprendente es que ninguno de los clínicos, a pesar de sus declaraciones, fuera capaz de su-
perar el mero azar [...] y eso es muy pobre [Holtzman, 1989, pp. 108-109].
Es importante resaltar que Holtzman fue uno de los primeros en realizar estu-
dios sobre la fiabilidad y validez del Rorschach y que cuando le contrataron para
evaluar la eficacia de este test se encontraba en pleno auge la polémica iniciada por
Meehl sobre predicción estadística frente a predicción clínica, siendo Holtzman, en
aquel momento, un defensor de esta última. En 1988, la Society of Personality As-
sessment le concedió el galardón Distinguished Contribution Award por sus impor-
tantes contribuciones a la evaluación de la personalidad.
En un esfuerzo por mejorar la calidad de los instrumentos de evaluación psicoló-
gica, la APA crea un comité dirigido por Cronbach encargado de elaborar el informe
Technical recommendations for psychological tests and diagnostic aids? de 1954 en
donde se plantea la necesidad de que los tests vayan acompañados de un manual con
información acerca de la interpretación de los resultados, validez, fiabilidad, admi-
nistración, etc. (Rogers, 1995).
Sin embargo, todos estos esfuerzos son estériles y la crisis externa de la evalua-
ción psicológica alcanza su punto culminante en el movimiento antitests que tuvo
lugar en Estados Unidos en la década de los años cincuenta y, sobre todo, los sesenta.
La polémica fue iniciada entre defensores de posturas genéticas y ambientalistas, uti-
lizando ambos los resultados de los tests de inteligencia para defender sus posicio-
nes. La realidad era que, a pesar de que los primeros psicómetras utilizaron los tests
con la intención de que todas las personas tuviesen igualdad de oportunidades en
función únicamente de su capacidad, estos procedimientos de evaluación termina-
ron favoreciendo a las clases dominantes y privilegiadas. Pronto esta discusión pasó
de los círculos científicos a la vida ciudadana. Así, se producen hechos tan notables
2 Este informe ha sido revisado posteriormente en diferentes ocasiones, siendo publicada la última
versión en el año 1985.
como la quema de protocolos en una escuela de Texas en 1959, la prohibición del uso
de pruebas psicológicas en el estado de California y en las escuelas de Nueva York.
Los tests de personalidad fueron blanco también de fuertes críticas; se manifiesta un
descontento por la utilización de estos tests en la industria, e incluso se habla de in-
vasión de la privacidad (Rogers, 1995). En opinión de Blanco (19865), esta revuelta
antitests fue fruto de cuatro factores diferentes: las limitaciones reales tanto técnicas
(déficit conceptuales, metodológicos e instrumentales) como humanas (lagunas de
conocimiento, fallos o errores), los abusos cometidos en una administración indis-
criminada e inadecuada de pruebas, las reacciones defensivas de la sociedad ante
unos instrumentos que pueden potencialmente violar su intimidad y, en último lu-
gar, las críticas derivadas de una presentación inadecuada de los resultados del proce-
so diagnóstico; es decir, no es la técnica en sí misma, sino su inadecuado uso lo que
puede acarrear riesgos.
1v7. La evaluación conductual
Los inicios de la psicología conductual podrían situarse en las primeras aplicacio-

nes de los principios del aprendizaje al estudio de la conducta, lo cual se remonta a
los trabajos de Béjteriev a finales del siglo XIX, primero en la ciudad de Kazán
(donde fundó el primer laboratorio de psicología en Rusia) y luego en San Peters-
burgo donde crea otro laboratorio y desarrolla diversos equipos para registrar la
sensibilidad cutánea, el dolor, la cinestesia, etc. Fue el fundador de la reflexología
colectiva y del principio del estudio comparativo, el cual permitía evaluar la in-
fluencia de la relación entre sujetos sobre la respuesta de un sujeto, lo que constitu-
ye el primer intento serio y experimental del estudio del comportamiento humano
(Lómov, 1985). Desde la perspectiva de la psicología soviética, Béjteriev es conside-
rado como el creador de la orientación de la psicología de la conducta, no sólo en
la psicología soviética, sino en toda la psicología (Rubinstein, 1981). Esta visión es
compartida por Kazdin (1991) al plantear que los antecedentes de la evaluación y la
modificación de conducta se encuentran en los trabajos de Béjteriev, Watson, Ray-
ner, Jones, etc. Sin embargo, hay que matizar que en lo referente a la evaluación, tal
como ha puesto de manifiesto McReynolds (1986), Watson no ve como incompati-
bles el modelo psicométrico y su punto de vista conductual. Ello se demuestra en
una carta (fechada el 22 de mayo de 1917) que escribe Watson a Goddar (introduc-
tor de los tests de Binet en Estados Unidos) solicitándole una lista de tests psicoló-
gicos, con vistas a preparar un curso de psicología que tenía que impartir a estu-
diantes de medicina especializados en psiquiatría. Poco después dedica su libro
Psychology from the standpoint of a behaviorist (1919) a Cattell y a Meyer, donde
además incluye cinco páginas sobre tests. Además, en otro libro publicado en 1928
(Psychological care of infant and child) describe varios tests. El origen de la evalua-
ción conductual puede situarse, por un lado, en la aplicación de los principios del
aprendizaje a la modificación del comportamiento humano anormal y, por otro, en
el intento de suplir los déficit de la evaluación psicológica de la época al hacer fren-
te a la conducta anormal (Fernández-Ballesteros, 1994). Así, en investigaciones clá-
sicas, como la de Watson y Rayner con el pequeño Albert en la década de los años
veite O la de los Mowrer con sujetos enuréticos en la de los treinta, se realizan

evaluaciones de la conducta.
Sin embargo, será a mediados del siglo XX cuando se produce un hito histórico
en el desarrollo de la psicología y que posteriormente afectará a la evaluación psico-
lógica. Tres autores sientan las bases de la modificación de conducta: Skinner (Esta-
dos Unidos) publica en 1953 Ciencia y conducta humana (que daría lugar a la modi-
ficación de conducta basada en el modelo operante), Wolpe (Sudáfrica) publica en
1958 Psicoterapia por inhibición recíproca (con base en el condicionamiento clásico y
donde ya se describen técnicas como la desensibilización sistemática y el entrena-
miento asertivo) y Eysenck (Gran Bretaña) publica en 1960 Terapia de conducta y
neurosis, donde se describe la neurosis como una conducta inadaptada cuya adquisi-
ción y eliminación pueden explicarse en términos del condicionamiento clásico
(véase Franks, 1991). Así, en estos textos se encuentran ya esbozos de la evaluación
conductual; por ejemplo, Wolpe da una gran importancia a la entrevista como ins-
trumento para determinar los estímulos que evocan las reacciones de temor. Skinner,
por su parte, formula un concepto fundamental dentro de la evaluación conductual:
el análisis funcional, el cual enfatiza la conducta manifiesta y los eventos ambientales
que la controlan. Skinner radicalizó la perspectiva de Watson, comenzando a desa-
rrollar estudios experimentales sobre la conducta operante para lo cual propone el
análisis experimental de la conducta (búsqueda de las relaciones funcionales que pre-
valecen entre aspectos medibles de la conducta y las diferentes circunstancias y
hechos de la vida de un organismo), que se convertirá en el punto de partida de la
evaluación conductual. Además del trabajo experimental, Skinner resaltó las reper-
cusiones que tendría sobre la clínica. En los años siguientes se produce un gran desa-
rrollo, tanto a nivel conceptual como instrumental, consolidándose así la psicología
conductual que se convierte en el movimiento más importante dentro de la psicolo-
gía clínica en las últimas décadas.
En definitiva, la evaluación conductual surge como una necesidad ante la aplica-
ción de los principios del aprendizaje al tratamiento de la conducta anormal e inclu-
so ante la inutilidad que se empezaba a manifestar desde algunos círculos de los tests
psicométricos, proyectivos y de los sistemas clasificatorios vigentes (Fernández-
Ballesteros, 1994). De esta misma opinión son Hersen y Bellack (1976), quienes con-
sideran que la evaluación conductual surge como respuesta a una serie de factores ta-
les como los problemas de fiabilidad y validez que presentan los diagnósticos psi-
quiátricos a través del DSM-I y el DSM-11, la relación indirecta entre la evaluación
realizada por medio de tests tradicionales (como por ejemplo, los proyectivos) y la
planificación y puesta en práctica del tratamiento, la gran aceptación de la terapia de
conducta entre los psicólogos clínicos y el desarrollo de la evaluación en general, ha-
ciendo posible registros de conducta más precisos. Nelson (1983) otorga la “paterni-
dad” de la evaluación conductual a la percepción de la debilidad de las técnicas de
evaluación tradicional y a las innovaciones en la evaluación de los primeros terapeu-
tas de conducta. Este nuevo modelo de evaluación se caracterizará por los siguientes
principios: énfasis en aspectos observables; la conducta es fruto del aprendizaje, de-
pendiendo de una serie de hechos controlables; la evaluación y el tratamiento están
estrechamente interrelacionados, implicando todo ello una evaluación de carácter
idiográfico (Matud, 1993).
Dentro de este nuevo enfoque, Kanfer y Saslow (1965) publican el artículo «Be-
havioral analysis», dando lugar al nacimiento “oficial” de la evaluación conductual,
aunque según Goldfried y Linehan (1977) la idea (no el término) aparece por prime-
ra vez en un texto de Johnson en el año 1946, donde se trata sobre el tipo de evalua-
ción que debe hacer el psiquiatra, diciendo que éste debe obtener información acerca
de lo que hace y en qué situaciones lo hace. La aportación de este trabajo es la admi-
sión de variables subjetivas (eventos internos y variables personales u organísmicas)
dentro del análisis funcional propuesto por Skinner, quedando abierta la posibilidad
del empleo de autoinformes, aunque con cierta cautela.
Poco después, Cautela (1968) y Goldfried y Pomeranz (1968) utilizan por pri-
mera vez el término behavioral assessment; esta nueva forma de evaluación aparece
posteriormente con tres nombres: evaluación conductual, análisis funcional de la
conducta y análisis conductual, que son considerados como sinónimos por la mayo-
ría de los autores (Silva y Martorell, 1991). Por otra parte, Goldstein y Hersen
(1990b) entienden que el desarrollo de la evaluación conductual está, en cierto
modo, relacionado con la innovación en los instrumentos de registro o evaluación
de la conducta, lo cual se puede comprobar en los primeros números de las revistas
Journal of Applied Behavior Analysis, Behaviour Research and Therapy, Journal of
Behavior Therapy and Experimental Psychiatry y Behavior Modification, donde
aparece una gran cantidad de artículos sobre nuevos métodos e instrumentos de re-
gistro conductual. Un apoyo importante a esta incipiente evaluación conductual es
la publicación de Personality and assessment por parte de Mischel en 1968. En esta
obra se vierte una fuerte crítica sobre la evaluación psicológica “tradicional”, propo-
niéndose la evaluación conductual como alternativa que hará énfasis sobre la especi-
ficidad, lo idiográfico, etc. El situacionismo constituyó una dura crítica a la evalua-
ción tradicional de la personalidad (teoría de los rasgos y teoría psicodinámica). Su
crítica se centra en la validez, fiabilidad y en la falta de utilidad que aportan los ins-
trumentos de evaluación de la personalidad, resaltando la inadecuación de los rasgos
para predecir la conducta. La teoría de los rasgos era criticada por el supuesto de que
la personalidad se encuentra constituida por predisposiciones estables y duraderas
que ejercen efectos generalizados sobre la conducta. De igual forma, critica la teoría
psicodinámica por su énfasis en las entidades internas y en la estabilidad temporal y
transituacional. Para explicar la conducta humana, Mischel asume una concepción
interaccionista en la que se tienen en cuenta variables orgánicas, ambientales y de la
propia conducta. Sin embargo, su mayor aportación podría considerarse en el giro
que supone buscar la explicación de la variabilidad de la conducta, en vez de tratar de
hacerlo en función de la estabilidad y consistencia, tal como se venía haciendo. Su
obra ha servido para impulsar los estudios de la evaluación de situaciones, contextos
y ambientes. Paralelamente, Peterson (1968) publicaba The clinical study of social
behavior, donde se planteaba que dentro del ámbito clínico era necesario la cons-
trucción de situaciones que proporcionaran muestras representativas de las conduc-
tas a predecir; además, este autor recomienda la no utilización de los instrumentos
de la evaluación tradicional para inferir las características de la personalidad. Asimis-
mo, cabe destacar el trabajo de Lang (1968) sobre el triple sistema de respuesta y el
de Goldfried y Kent (1972) sobre las diferencias y semejanzas entre la evaluación
psicométrica y la evaluación conductual.
Evolución histórica de la evaluación psicológica 153)Ni
Sin embargo, un hecho llamativo es el retraso en el desarrollo que tuvo la eva-

luación conductual con respecto a la modificación de conducta, Así, se comprueba
que en las publicaciones de Eysenck y Rachman (1965), Meyer y Chesser (1970) y
Wolpe (1969) no se hacen indicaciones acerca del análisis conductual. Sin embargo,
ello no debe ser entendido como una falta de interés por la evaluación en los nue-
vos psicólogos conductuales, puesto que ya Staats y Staats (1963) se planteaban la
necesidad de incluir métodos conductuales de evaluación. Dos años después, UlI-
mann y Krasner (1965) en la introducción de su libro mantienen que hay un lugar
para la evaluación psicológica en la modificación de conducta, indicando que la
evaluación está íntimamente relacionada con el tratamiento. Se podrían plantear
dos razones explicativas del relativo retraso de la evaluación conductual con res-
pecto a la terapia de conducta. En primer lugar, no conviene olvidar que el nuevo
enfoque nace claramente orientado al tratamiento. Por tanto, desde esta perspecti-
va, parece lógico que primero se desarrollen las técnicas de intervención y a la zaga
la evaluación; en otras palabras, la evaluación conductual surge cuando las técnicas
de intervención conductual se ponen en práctica, donde se demuestra que la eva-
luación tradicional no da una información adecuada sobre la conducta del paciente,
por lo que tiene sentido que su desarrollo sea posterior. En segundo lugar, los pri-
meros psicólogos conductuales se encontraron con una evaluación psicológica
muy desarrollada y consolidada, por lo menos en lo que se refiere a la evaluación
de corte psicométrico. Es importante considerar que la consolidación de la terapia
de conducta coincide con la superación de la crisis que supuso la revuelta antitests.
Como consecuencia de la crisis, los procedimientos para la elaboración de los tests
se habían perfeccionado. Además, se produce una centralización y unificación en la
construcción y distribución de tests motivada por algunas leyes que prescriben qué
tipo de tests deben utilizarse y fundamentalmente por el desarrollo de la “industria
de los tests”. La edición de tests se había convertido en un negocio, como afirma
Cronbach (1972); ya no era suficiente con publicar un test que elaboraba un profe-
sor en sus ratos de ocio, sino que era necesario contar con un equipo de profesio-
nales cualificados y que contasen con una red de colaboradores por todo el país.
Además, debían demostrarse sus ventajas y garantías científicas en congresos y dis-
poner de unos buenos canales de distribución. Se había creado una competitividad
por conseguir el “test más eficaz”. Todo ello sirvió, sin duda, para seleccionar los
tests que llegaban a aplicarse, con la consiguiente mejora de la imagen, a lo que
también contribuía una tecnología más avanzada, tanto en los sistemas de correc-
ción automática, como en el tipo de presentación de resultados. Por tanto, los ps1-
cólogos conductuales no sólo tenían que elaborar un nuevo sistema de evaluación,
sino que, además, había que demostrar que los tests, un sistema tecnológicamente
muy avanzado y con grandes garantías científicas, no servían para los propósitos
del enfoque conductual. Evidentemente, esto suponía un período de reflexión an-
tes de comenzar a elaborar un nuevo sistema de evaluación. Recuérdese, por ejem-
plo, que el propio Wolpe (uno de los pilares de la terapia de conducta) en su libro
de 1958 recomendaba la utilización de inventarios de personalidad. Visto desde
esta perspectiva, incluso nos atreveríamos a decir que la evaluación conductual ha
tenido un desarrollo relativamente rápido, sobre todo si se tiene en cuenta que la
consolidación de la terapia de conducta se produce a partir de mediados de la déca-
da de los años sesenta y que en la siguiente década tiene lugar una gran expansión
de la evaluación conductual. na
A partir de la mitad de la década de los años setenta se produce la consolidación
de la evaluación conductual como consecuencia de la multitud de publicaciones que
sobre el tema van saliendo a la luz; entre los manuales más destacados se podrían c1-
tar Behavioral assessment. A practical handbook de Hersen y Bellack (1976), Beha-
vior therapy assessment: Diagnosis, design and evaluation de Mash y Terdal (1976),
Handbook of behavioral assessment de Ciminero, Calhoun y Adams (1977), Beha-
vioral assessment. New directions in clinical psychology de Cone y Hawkins (1977),
Behavior modification: Handbook of assessment, intervention and evaluation de
Gambrill (1977), Principles of behavioral assessment de Haynes (1978), A practical
guide to behavioral assessment de Keefe, Kopel y Gordon (1978) y Behavioral as-
sessment: Recent advances in methods, concepts and aplications de Haynes y Wilson
(1979). A estos manuales, ya clásicos, hay que añadir la aparición en 1979 de las re-
vistas Behavioral Assessment y Journal of Behavioral Assessment”. El número de pu-
blicaciones sobre este enfoque llegó a ser tan elevado que el único análisis posible es
el realizado a través de estudios bibliométricos, como el de Prieto, Tortosa y Silva
(1984), quienes hacen un análisis cuantitativo de las publicaciones sobre evaluación
conductual entre los años 1971-1982 a través de la base de datos Social sciences cita-
tion index, concluyendo que se ha producido un incremento considerable en los ar-
tículos publicados a lo largo de estos años, que estos artículos no aparecían exclusi-
vamente en revistas especializadas (por ejemplo, encontraron que la revista que más
trabajos publicó sobre esta temática fue Psychological Reports) y que el autor más
productivo en el área de la evaluación conductual fue Alan E. Kazdin.
A esta fase de consolidación de la evaluación conductual producida durante la
década de los años setenta, a la cual Nelson (1983) califica como “luna de miel”, su-
cede un período de “desencanto”, tal como es calificado por Fernández-Ballesteros
(1994), en el cual la evaluación conductual entra en una crisis en la que todavía parece
estar inmersa. Por otra parte, durante todo este período de auge del modelo conduc-
tual, la evaluación de corte psicométrico continúa dando lugar a publicaciones im-
portantes entre las que destaca un manual de evaluación psicológica por parte de
Cronbach en 1972 en donde se sistematiza la teoría de la generalizabilidad y la obra
de Wiggins (1973) Personality and prediction: Principles of personality assessment.
La situación de la evaluación psicológica desde la década de los años ochenta
hasta la actualidad será abordada en el siguiente apartado.
V. LA EVALUACIÓN PSICOLÓGICA EN LA ACTUALIDAD
En este apartado se describirá la situación de la evaluación psicológica desde la déca-

da de los años ochenta hasta la actualidad. Para ello se hará un breve repaso de los
acontecimientos más importantes ocurridos en los últimos años, así como algunas
> A partir de 1985 esta revista pasó a denominarse Journal of Psychopathology and Behavioral As-
sessment.
reflexiones sobre las cuestiones de especial relevancia que caracterizan este período,
como puede ser la crisis que experimenta la evaluación conductual, la apertura de la
evaluación psicológica a otras áreas, la introducción de la informática en la evalua-
ción o la teoría de respuesta al ítem, entre otras.
La característica que puede definir la evaluación psicológica de los últimos años
tal vez sea, como comenta Matud (1993), la reelaboración y ampliación de los mode-
los y procedimientos de evaluación, manifestándose de una forma clara una postura
más tolerante e integradora entre las diferentes aproximaciones, incluso entre la eva-
luación psicométrica y la evaluación conductual.
v.1. Crisis de la evaluación conductual
La década de los años ochenta se caracteriza por una serie de cambios dentro de la
evaluación conductual, y por un período de reflexión dentro de la evaluación psi-
cológica. Hayes y Follete (1993) y Fernández-Ballesteros (1994) señalan algunos
hechos que constituyen un reflejo de esta crisis; en primer lugar, dada la relevancia
que tomó el DSM-111 (1980) y DSM-II1-R (1987) los evaluadores conductuales em-
piezan a familiarizarse y a utilizar etiquetas diagnósticas, por lo que se intenta una
aproximación entre evaluación conductual y diagnóstico psiquiátrico (Haynes y
O'Brien, 1988; Hersen, 1988); en segundo lugar, Kendall y Hollon (1981) publican
Assessment strategies for cognitive-behavioral intervention que va a suponer una
ruptura con la propia evaluación conductual; y, por último, se produce un debilita-
miento del análisis funcional y una pérdida de vigencia de los planteamientos que
oponen la evaluación conductual a otros modelos de evaluación psicológica *.
Como ejemplo clarificador de esta situación están las palabras de Bellack y Hersen
(1988, p. 613): <[...] si empleamos entrevistas estandarizadas con el propósito de al-
canzar un diagnóstico con base en el DSM-111, generamos escalas clínicas sobre la
severidad de síntomas, administramos inventarios de autoinforme y evaluamos es-
tilos cognitivos, podemos preguntarnos ¿es todavía conductual la evaluación con-
ductual?».
Esta crisis de asunciones teóricas de la evaluación conductual se pone de mani-
fiesto en un análisis de los artículos publicados entre 1980 y 1987 en Behavioral As-
sessment y en el Journal of (Psychopathology and) Behavioral Assessment? realizado
por Fernández-Ballesteros (1988) [citado en Fernández-Ballesteros (1994)]. En Be-
havioral Assessment únicamente un 15% delos trabajos trataba sobre temas concep-
tuales y solamente un 0,40% hacía referencia al análisis funcional de la conducta; en
la segunda revista los datos tampoco son nada alentadores, con un 6,50% de artícu-
los conceptuales y un 0,50% referido al análisis funcional de la conducta. El mayor
* Aparecen publicaciones que utilizan al mismo tiempo los términos evaluación psicológica y eva-
luación conductual, como es el caso del manual Psychological and behavioral assessment de Magrab
(1984), y otras dedicadas exclusivamente a la evaluación psicológica incluyen apartados de evaluación
conductual que son combinados con la evaluación de la inteligencia, personalidad e incluso técnicas pro-
yectivas, como es el caso del Handbook of psychological assessment de Goldstein y Hersen (1984).
5 Como ya se ha comentado, la revista Journal of Behavioral Assessment fundada en 1979 pasa a de-
nominarse en 1985 Journal of Psychopathology and Behavioral Assessment.
porcentaje de trabajos alude a aspectos metodológicos. A partir de estos datos, Fer-

nández-Ballesteros (1994) concluye que los evaluadores conductuales no han dedi-
cado mucho tiempo a reflexionar sobre aspectos conceptuales. En otro estudio reali-
zado por Haynes y O'Brien (1990) en el que se analiza una serie de revistas
conductuales (Behavior Modification, Behaviour Research and Therapy, Behavior
Therapy y Journal of Applied Behavior Analysis) se concluye que únicamente un
20% de las intervenciones descritas estaba basado en el análisis funcional. En defini-
tiva, parece que el análisis funcional de la conducta no ha sido el elemento funda-
mental de la evaluación conductual.
La crisis de la evaluación conductual afecta también a aspectos metodológicos.
Así, el empleo por parte de los evaluadores conductuales de técnicas conductuales
(por ejemplo, la observación) de una forma exclusiva y el rechazo de los tests tradi-
cionales no terminó nunca de hacerse realidad. En el estudio de Fernández-Balleste-
ros (1988) [citado en Fernández-Ballesteros (1994)] se informa que sólo un 14,20%
de los trabajos de Behavioral Assessment y un 10,30% de los del Journal of (Psycho-
pathology and) Behavioral Assessment en el período 1980-1987 están dedicados a la
observación y un 18,40% y un 21%, respectivamente, se centraban en técnicas psi-
cométricas.
Según Matud (1993), esta desilusión metodológica se fundamenta en tres pilares
importantes: la imperfección de las técnicas actuales de evaluación conductual, las
cuales no muestran un acuerdo entre las diferentes medidas de la misma conducta, la
impracticabilidad de muchas de ellas, habiendo sido utilizadas (excepto la entrevista)
en menos de la mitad de los casos tratados por terapeutas de conducta, y la ausencia
de avances en la tipificación de las técnicas, proliferando técnicas no estandarizadas.
Este último hecho ha originado una de las discusiones más intensas de los últimos
años entre quienes consideran necesaria la incorporación de criterios psicométricos
a la evaluación conductual y quienes los rechazan. Así, por ejemplo, Nelson (1983)
se Opone a esta incorporación argumentando por un lado dificultades prácticas, ya
que el número de técnicas necesario para cubrir los diferentes sistemas de respuesta,
los diferentes métodos de evaluación y las posibles situaciones de evaluación es casi
infinito, y por otro dificultades teóricas existiendo tres diferencias insalvables entre
el modelo psicométrico y el conductual: los supuestos de consistencia-estabilidad de
la conducta, los modelos de causalidad de la conducta (estructural intrasujeto frente
a funcional ambiente-sujeto) y el nivel de análisis (individual frente a grupal). Otros
autores, tal vez más realistas, plantean una complementariedad de ambos enfoques.
Así, Bellack y Hersen (1988) afirman que la aproximación nomotética de rasgo po-
dría ser conveniente en las fases iniciales de la evaluación con el fin de categorizar al
paciente y realizar una descripción general de la disfunción y la situación vital, mien-
tras que en una segunda fase de evaluación cuando es necesario realizar un análisis
funcional y establecer medidas objetivas de conductas específicas estarían justifica-
das las técnicas conductuales.
En resumen, parece que los evaluadores conductuales han propuesto unos prin-
cipios básicos y han practicado otros. A pesar de los presupuestos iniciales, la eva-
luación conductual utiliza escasamente el análisis funcional, utiliza técnicas basadas
en diseños intersujetos implicando planteamientos nomotéticos y está empleando
conceptos intrapsíquicos (Fernández-Ballesteros, 1994); sin embargo, a nuestro en-
tender, esto no es más que una manifestación de la evolución a la cual está sometido
cualquier concepto (Sierra, 1996).
Ahora bien, a pesar de la crisis que experimenta la evaluación conductual en su
seno, ésta goza de un ámbito propio y específico, y sigue manteniéndose en diferen-
tes publicaciones; así, Cone (1993) informa que desde el período 1980-1982 a 1990-
1992 se produce un incremento del 15,80% de trabajos publicados sobre evaluación
conductual, así como un aumento del número de revistas en donde se publica este
tipo de artículos. Sin embargo, no debemos olvidarnos, tal como plantea Fernández-
Ballesteros (1993), que la salida de esta crisis pasa por la mejora de las garantías cien-
tíficas de las medidas conductuales.
v.2. Otros aspectos de actualidad

Junto al gran desarrollo de la evaluación conductual, la psicología en general se fue
abriendo a otros campos. En estos últimos años, la Organización Mundial de la Sa-
lud (OMS) ha recomendado, en reiteradas ocasiones, la necesidad de “invertir en sa-
lud”, considerando además que la psicología es importante en más de la mitad de los
objetivos planteados para mejorar la salud de la población. De estas recomendacio-
nes parece haberse hecho eco la actual psicología clínica. En opinión de Richelle
(1991), la psicología clínica ha experimentado un proceso de cambio que puede ob-
servarse a tres niveles. Primero, se ha dado un cambio de enfoque, pasando del inte-
rés por el sujeto “psicológicamente enfermo o anormal” al interés por el sujeto nor-
mal que se encuentra con problemas psicológicos que, en cierta medida, son
consecuencia de las complejidades de la vida moderna; segundo, se produce una di-
versificación en su campo de acción, abarcando los aspectos psicológicos de otros ti-
pos de enfermedad, además de la mental; y, tercero, se presta gran atención a la pre-
vención de la enfermedad. Por otra parte, la inclusión de la psicología en los servicios
sociales ha dado lugar al nacimiento de la psicología comunitaria, abordándose así
una gran diversidad de problemas desde un punto de vista social o de grupo (Holtz-
man, 1989). Todo ello contribuye, sin duda, a una extensión de la evaluación psico-
lógica a estos nuevos campos.
Todo ello, lleva a que la evaluación psicológica abra sus dominios a otras áreas:
evaluación neuropsicológica (véase Benton, 1994), evaluación en tráfico y seguridad
vial, psicología del trabajo y de las organizaciones (véase Fernández-Ríos, 1993; Ro-
dríguez, 1993), psicología jurídica (véase Garrido, 1991), psicología del deporte
(véase Cruz, 1995, y Cruz y Capdevilla en este mismo manual), etc. Asimismo, se
produce un desarrollo importante de la psicología ambiental, lo que lleva empareja-
do un interés por la evaluación ambiental, surgiendo publicaciones como Environ-
mental problems/behavioral solutions de Cone y Hayes (1980) y Pol (1994). Surge
una necesidad de evaluar los contextos (settings) conductuales, la percepción de los
mismos, su influencia en la conducta normal y patológica y la evaluación de los cam-
bios ambientales sobre la salud mental (Matud, 1993). En los últimos años se ha de-
sarrollado un gran interés por la evaluación de intervenciones y programas (Sechrest
y Figueredo, 1993; Fernández-Ballesteros, 1995; Hernández, 1996). Incluso en áreas
tradicionales como la evaluación de la inteligencia se produce una expansión de los
objetivos planteados; así, por medio de los tests de inteligencia no nos limitamos a la
obtención de un cociente intelectual, sino que evaluamos procesos cognitivos en pa-
cientes con daño cerebral o esquizofrénicos (Goldstein y Hersen, 19905). En defini-
tiva, la actual evaluación psicológica no se puede identificar con la mera aplicación
de tests psicológicos o la perspectiva clásica del psicodiagnóstico; hoy, la evaluación
psicológica es un elemento fundamental de la intervención e investigación psicológi-
ca (Almeida y Ribeiro, 1994).
En cuanto a la evaluación tradicional, no sólo no ha desaparecido sino que se ha
seguido desarrollando; así, siguen apareciendo manuales importantes tales como
New horizont in testing de Weiss (1983), Psychological testing (6* ed.) de Anastasi
(1988), Psychological testing. Principles and applications (2* ed.) de Murphy y Da-
vidshofer (1991) o The psychological testing enterprise. An introduction de Rogers
(1995). Kaplan y Saccuzzo (1993) indican que en la evaluación psicológica actual se
ha producido una proliferación de nuevos tests, muchos de ellos basados en mode-
los, teorías o conceptos claramente diferentes a los de los tests tradicionales; estos
tests no tradicionales están basados en teorías del aprendizaje, en la psicología social
o experimental. Este hecho respondería, en primer lugar, a un incremento de los
aspectos científicos de la psicología en el campo de la evaluación psicológica y, en
segundo lugar, al esfuerzo realizado por integrar los tests en otros aspectos de la psi-
cología aplicada (por ejemplo, el tratamiento). Además, se ha producido un incre-
mento de la tecnología, una mejora de la objetividad de los tests, y una alta preocu-
pación por los aspectos éticos implicados en la evaluación (especialmente el abuso de
los tests) puesta de manifiesto en 1988 por el Joint Committee on Testing Practices y
respaldada por la American Association for Counseling and Development, la Ame-
rican Educational Research Association, la American Psychological Association, la
American Speech-Language-Hearing-Association y el National Council on Measu-
rement in Education. Otro aspecto relevante citado por Kaplan y Saccuzzo (1993) es
que en la actualidad el “público” en general tiene un mayor conocimiento de los
tests; hoy existe una mayor demanda de servicios psicológicos, incluyendo la evalua-
ción, lo cual, a su vez, repercute en la mejora de la calidad de los tests. En un análisis
realizado de 65 practicum de psicodiagnóstico en psicología en Estados Unidos,
Craig y Horowitz (1990) muestran una perspectiva del empleo de tests durante estos
años; así, estos autores concluyen que los tests proyectivos, las escalas de Wechsler y
el MMPI siguen gozando de gran popularidad entre los evaluadores psicológicos, hay
un incremento en el empleo de tests neuropsicológicos, se usan los mismos tests para
los adolescences que para los adultos y, por último, tests como el Millon clinical mul-
t1axtal inventory (MCMI1) o el Millon adolescent personality inventory (MAPI) son
poco usados en la actualidad pero es muy recomendado su aprendizaje, posiblemen-
te porque los directores de los practicum creen que serán instrumentos importantes
en un futuro próximo.
- En la última década también se ha producido un incremento en el interés por el
diagnóstico psicopatológico; hay que destacar la publicación por parte de la Asocia-
ción Psiquiátrica Americana de tres ediciones del Diagnostic and statistical manual
of mental disorders (DSM-11I en 1980, DSM-I11-R en 1987 y DSM-IV en 1994). Las críti-
cas a la falta de fiabilidad y validez de las anteriores clasificaciones son superadas en
parte con la inclusión de criterios descriptivos ateóricos en cada una de las categorías
diagnósticas y la presentación de un sistema de evaluación multiaxial de cara a plani-

ficar el tratamiento y predecir la evolución del trastorno.
Todos estos hechos conducen a un progresivo acercamiento de las diferentes
opciones de evaluación; es decir, se ha producido una concepción de la evaluación
psicológica «entendida en un sentido amplio, que abarca desde la descripción del
comportamiento hasta la valoración de programas de intervención» (Fernández-
Ballesteros y Silva, 1985, p. 3).
La gran cantidad de acontecimientos que afectan a la evaluación psicológica en
estos últimos años hace que la valoración de la situación actual se convierta en una
tarea sumamente ardua, lo cual, en realidad, es un indicador del alto grado de desa-
rrollo que se ha alcanzado. Quizás nada mejor para ilustrar el estado actual que re-
ferirnos a dos trabajos sobre este tema. El primero es un estudio bibliométrico reali-
zado por Carbonell, Silva y Carpintero (1988) sobre las publicaciones relativas a la
evaluación psicológica. El material analizado incluía los manuales de Anastasi
(1982), Groffman y Michel (1982/1983), Fernández-Ballesteros (1983), Cronbach
(1984), Golstein y Hersen (1984) y los cinco primeros volúmenes (1968-1981) de
Advances in psychological assessment compilados por McReynolds. Los resultados
más relevantes podrían resumirse en los siguientes puntos:
a. Los autores más citados, en general, y que por tanto podrían considerarse
como los más influyentes fueron en orden decreciente: Cattell, Cronbach, Eysenck,
Reitan, Exner, Guilford, Golden, Jackson, McReynolds, Anastasi, Gough, Hersen,
Mischel, etcétera.
b. Mediante un análisis factorial de correspondencias se determinó la relación
entre autores y temas. Así, se obtuvieron cuatro factores bipolares que mostraban
los autores más citados junto con los temas más tratados. En el primer factor aparece
evaluación neuropsicológica (inteligencia y memoria) con Reitan, Golden, Benton,
Venables, Wechsler, etc., frente a Exner/Rorschach (y otras técnicas proyectivas) con
Exner, Swartz, Bandura, Holtzman, etc. En el segundo factor aparecen determinan-
tes situacionales con Barker, Moos, Haynes, Patterson, etc., frente a determinantes
individuales con Fleishman, Galton, Binet, Terman, etc. En el tercer factor aparece
evaluación ambiental con Moos, Barker, etc., frente a evaluación conductual con
Haynes, Nelson, Cone, Bellack, Kazdin, etc. El resto de los factores presentan bas-
tantes dificultades de interpretación, aunque en uno de ellos aparecía una dicotomía
bastante clara: evaluación de la inteligencia frente a evaluación de la personalidad.
En un análisis más reciente, Sierra (1996) informa que los quince autores de eva-
luación psicológica con más citas recibidas en el período 1993-1995 son Beck, Spit-
zer, Wechsler, Bandura, Piaget, Eysenck, Cronbach, Spielberger, Achenbach, Endi-
cott, Rosenthal, Kazdin, Campbell, Cattel y Zuckerman. En este mismo estudio,
analizando los contenidos del IV Congreso de Evaluación Psicológica (1994) y el
23nd International Congress of Applied Psychology (1994), se pone de manifiesto
que las áreas más relevantes de la evaluación psicológica son la clínica y salud, perso-
nalidad, psicología del trabajo y de las organizaciones, psicología educativa, evalua-
ción de programas, seguridad vial, psicología jurídica, psicología del deporte y psi-
cología ambiental.
3% Gualberto Buela-Casal y J. Carlos Sierra
En otro estudio realizado por Carbonell, Carpintero y Silva (1988) se solicitó in-
formación, por medio de una encuesta acerca de la «situación actual y perspectivas
futuras de la evaluación psicológica (o psicodiagnóstico en su sentido más amplio)»,
a más de cien profesionales seleccionados de los más representativos de la evaluación
psicológica a nivel internacional. El primer resultado, que llama la atención de los
autores, es que la mayoría de los especialistas encuestados evita describir de forma
estructurada la situación actual, lo cual es interpretado por Carbonell y cols. (1988)
como una muestra del grado de especialización alcanzado, con la consiguiente
dificultad que supone dar una visión global y estructurada de la actual evaluación
psicológica. Los resultados relacionados con aspectos conceptuales ponen de mani-
fiesto:
a. Unanecesidad de fundamentación teórica de la evaluación psicológica en su

conjunto, incidiéndose además en que hay que eliminar la idea de que evaluación
psicológica es sinónimo de aplicación de tests, y no dejarse llevar por la especializa-
ción tecnológica que no esté contextualizada en un modelo teórico.
b. Que especialistas con diversos enfoques plantean la necesidad de una inte-
gración de las diversas técnicas e instrumentos, proponiendo como ejemplo a imitar
la evaluación neuropsicológica. Sin embargo, algunos representantes del modelo
conductual se manifiestan reacios a una necesidad de integración.
c. Quelas variables biológicas adquieren relevancia.
d. Quecrece el interés por la evaluación de la personalidad.
e. Adquiere importancia la visión evolutiva de la evaluación.
En relación a las aplicaciones de la evaluación psicológica las conclusiones más

importantes son:
a. Una expansión de la evaluación a nuevos ámbitos (evaluación de ambientes

y Organizaciones).
b. Un énfasis en la relación entre evaluación y tratamiento, coincidiendo los
autores en señalar que la evaluación debe ser un medio que permita seleccio-
nar las alternativas de intervención, resaltando la especificidad del diagnósti-
co y los estudios de caso único.
c. Serecupera la confianza en los tests.
d. Se espera una próxima incorporación de los microordenadores a la práctica
habitual.
e. Las repercusiones sociales de la evaluación y las garantías éticas deben estar
siempre presentes.
Carbonell y cols. (1988) concluyen diciendo que el estado actual de la evaluación

psicológica es positivo, fundamentalmente si se opina en función de la visión de los
psicólogos que se identifican con modelos tradicionales. Sin embargo, quedan aún
algunos problemas importantes por resolver, tales como las diferencias conceptuales
entre distintos enfoques y el peligro de volver a la figura del psicólogo evaluador
como un experto en aplicar tests. Un dato sorprendente, y a la vez ilustrativo, de la
dificultad que implica describir la situación actual de la evaluación psicológica es el
hecho de que autores como Cronbach o Guilford se manifestasen incapaces de con-

testar de forma precisa a la cuestión planteada.
Recientemente, Piotrowski y Zalewski (1993) realizaron un análisis de los pro-
gramas de doctorado en psicología clínica acreditados por la APA, llegando a una se-
rie de conclusiones que también puede reflejar la situación actual de la evaluación
psicológica. En este informe se concluye que:
a. La evaluación psicológica es el área más importante en la formación de doc-

torado del psicólogo clínico; la evaluación de la inteligencia, de la personali-
dad y de la conducta son apartados imprescindibles en un currículo clínico.
b. En esta formación se combinan técnicas psicométricas (MMPI-2, 16PF...) con
técnicas proyectivas (Rorschach, TAT...) y técnicas conductuales (observa-
ción, autorregistro...).
Cc. Hay un auge de la evaluación por ordenador, referida tanto a la administra-
ción de tests como a su interpretación.
La incorporación de los ordenadores a la evaluación psicológica puede conside-

rarse actualmente ya una realidad; así, tal como plantean Kaplan y Saccuzzo (1993),
el empleo de ordenadores va más allá de la corrección o la transformación de pun-
tuaciones directas en típicas o centiles, llegando a la administración, corrección e in-
terpretación de las puntuaciones. En un estudio realizado por Spielberger y Pio-
trowski (1990) entre los miembros de la Sociedad de Evaluación de la Personalidad
se concluye que éstos consideran la evaluación computarizada como útil, aunque se
debe mejorar la interpretación informatizada de los tests. Según Kaplan y Saccuzzo
(1993), la aplicación de la informática a la evaluación psicológica puede hacerse a tres
niveles:
a. Procedimientos psicofísicos y de detección de señal, que consisten en pre-

sentar una señal al sujeto, el cual debe informar si la ha visto o no. De esta forma se
puede evaluar la velocidad y/o la eficiencia del procesamiento de información, capa-
cidad que está relacionada con las puntuaciones obtenidas en tests psicométricos de
inteligencia.
b. Informatización de tests clásicos. Muchos cuestionarios clásicos (MMPI, EPI,
16PF, Kuder...) disponen de una versión computarizada, mediante la cual el sujeto
puede responder delante de la pantalla del ordenador. Una gran ventaja que presenta
esta versión frente a la de lápiz y papel es que el evaluador puede disponer de la co-
rrección e, incluso, de la interpretación al momento. Pero, además, esta aplicación
informatizada puede llegar a aumentar el grado de confiabilidad y atractivo para el
sujeto, además de disponer de una mayor versatilidad en la presentación de estímu-
los%. La corrección de pruebas psicológicas y la obtención de una puntuación es tal
vez la faceta más conocida de la aplicación de la informática a la evaluación psicoló-
gica, y algo habitual ya entre los evaluadores, por lo que el aspecto más actual es la
6 Muchas de las pruebas informatizadas de evaluación de futuros conductores, homologadas por la

Dirección General de Tráfico (DGT), incluyen, además de estímulos visuales de diferentes colores, estí-
mulos auditivos.
interpretación de resultados. Así, The Psychological Corporation en Estados Uni-

dos y Técnicos Españoles Asociados (TEA) en España disponen de servicios a los
de diferentes
que se puede acceder para obtener informes a partir de los resultados
pruebas (WAIS, WISC, DAT, MMPL, Escalas de Beck, Rorschach...). Un ejemplo de es-
tos informes se recoge en Keller y cols. (1990), quienes muestran un informe exhaus-
tivo de un sujeto realizado por un programa informático a partir de las puntuaciones
del MMP1-2; además, el informe se acompaña de un perfil gráfico de las escalas, así
como de un listado de los ítems críticos de cada una de ellas.
c. Informatización de la evaluación conductual. En este apartado las posibili-
dades de la informática son múltiples: almacenamiento de datos de autoinforme, co-
dificación de observaciones, registro directo de conductas, análisis de datos, etcétera.
Otro apartado importante de la aplicación de la informática a la evaluación psi-

cológica es el referente a las entrevistas estructuradas. Así, algunas entrevistas como
Present state examination (PSE) (Wing, 1980) o Diagnostic interview schedule (DIS)
(Robins y cols., 1981) presentan una versión informatizada que formula los diagnós-
ticos. Sin embargo, en el momento en que la entrevista se transforma en un progra-
ma informático deja de cumplir los requisitos necesarios para ser catalogada como
tal y se convierte en un autoinforme. Un problema importante que nos encontramos
ante estos avances tecnológicos es la responsabilidad ética de las conclusiones de un
programa informático; ¿es el psicólogo el que realiza estas conclusiones o es el “frío”
ordenador? De hecho, la APA ya ha recomendado que el informe informático debe
acompañarse de un informe por parte del profesional (American Psychological As-
sociation, 1986).
Un hecho de especial relevancia en la actual evaluación psicológica es el desarro-
llo de la teoría de la respuesta a los ítems (TRI), que se puede considerar una alternati-
va psicométrica a la teoría clásica de los tests. Frente a los tests clásicos (que hacen
depender la evaluación del instrumento) y su corrección normativa (la puntuación
del sujeto depende del grupo normativo), la TRI propone una medida invariable en
relación a estos dos factores. La influencia de este cambio de concepción de los tests
sobre la evaluación psicológica se concreta en los “tests a medida” (taylored tests).
Según Muñiz (1990, p. 139) «[...] son unos tests que aun midiendo la misma variable
no son idénticos para todos los sujetos, varían en función del nivel de competencia al
que vayan destinados a medir». A partir de un banco de ítems, un programa infor-
mático administra un grupo de ellos que se irán seleccionando a medida que se van
evaluando las respuestas. Esto evitaría que los sujetos contestaran a ítems demasiado
fáciles o difíciles, lo cual incrementaría la motivación y reduciría la fatiga (Muñiz,
1990; Renom, 1993). Sin embargo, esta teoría se encuentra con el problema de que
requiere un requisito de unidimensionalidad, algo que sólo cumplen los tests de eva-
luación de conocimientos específicos (Muñiz y Cuesta, 1993), por lo que su campo
de aplicación está limitado hasta el momento a la evaluación del rendimiento acadé-
mico. Esto hace que se requieran importantes avances en la metodología de la TRI
para poder ser aplicada a contenidos multidimensionales.
Por último, para finalizar la descripción de la situación actual de la evaluación
psicológica se comentarán algunas de las reuniones científicas internacionales más
importantes sobre esta disciplina celebradas en los últimos años, y que nos pueden
servir para clarificar la situación de la disciplina en la actualidad. En Europa, un he-

cho relevante que supone un marco de referencia para la evaluación psicológica del
viejo continente es la transformación en junio de 1990 de la Sociedad Española de
Evaluación Psicológica en la European Association of Psychological Assessment,
cuyo órgano oficial de comunicación va a ser el European Journal of Psychological
Assessment (la publicación predecesora fue Evaluación Psicológica/Psychological As-
sessment). Esta sociedad ha organizado hasta la fecha cuatro congresos: Barcelona
(1991), Gronigen (1993), Trier (1995) y Lisboa (1997).
VI. FUTURO DE LA EVALUACIÓN PSICOLÓGICA
Algunos de los aspectos comentados anteriormente nos permiten predecir en cierta

medida el rumbo que tomará la evaluación psicológica en los próximos años. Sin
embargo, queremos hacer algunas reflexiones (o predicciones) acerca de las futuras
tendencias de esta disciplina. En líneas generales, nos atrevemos a decir que el futu-
ro de la evaluación psicológica es prometedor. Para ello, nos basamos, tal como
consideran Kaplan y Saccuzzo (1993), en el importante papel que ha jugado esta
disciplina en el reconocimiento de la psicología. Si observamos el gran desarrollo
alcanzado por la psicología (psicología conductual, psicofisiología, psicología de
las organizaciones, psicología comunitaria, etc.), no podemos ocultar el gran papel
que está desempeñando y tiene que desempeñar la evaluación psicológica en un fu-
turo. Por otro lado, la proliferación de nuevos tests y la actualización de los tradi-
cionales auguran un buen futuro para la evaluación psicométrica. La reciente apari-
ción en el campo de la evaluación de la inteligencia del Wechsler adult intelligen-
ce scale (WAIS-R), del Wechsler intelligence scale for children-3th ed. (WISC-111) y
del Wechsler preschool and Primary Scale of Intelligence-Revised (WPPSI-R), y del
MMPL2 en el campo de la evaluación de la personalidad auguran a estos instrumen-
tos un largo (y óptimo) futuro. En cuanto a la evaluación de la inteligencia, Mata-
razzo (1992) comenta que en los próximos años se continuarán utilizando los tests
colectivos y las escalas individuales, pero que dada la importancia que están adqui-
riendo las minorías en Estados Unidos (hecho que se podría extrapolar a cualquier
país) deberemos empezar a considerar la posibilidad de aplicar los instrumentos de
evaluación teniendo en cuenta el contexto familiar y cultural del sujeto, con lo cual,
tal vez, extinguiríamos algunas de las injusticias sociales de los tests tradicionales.
Por otra parte, en la evaluación de la inteligencia se están desarrollando técnicas ba-
sadas en teorías innovadoras (por ejemplo, Carroll, Hunt o Sternberg) con las que
se podrán estudiar desde los procesos mentales de primer orden hasta las habilida-
des cognitivas complejas como el razonamiento, la comprensión o la inteligencia.
Otro hecho que está actualmente en sus inicios, pero que sin duda alcanzará gran
importancia en los próximos años, es la evaluación de la inteligencia mediante indi-
cadores biológicos. Por ejemplo, la correlación encontrada entre potenciales evoca-
dos e inteligencia puede hacer de ellos una alternativa a la evaluación tradicional de
la inteligencia. Otra línea de investigación iniciada es la relación entre niveles de
glucosa e inteligencia. No sería de extrañar, tal como plantea Matarazzo (1992),
que en las próximas décadas se integrasen en un único modelo los planteamientos
teóricos de Carroll, Hunt o Sternberg con sustratos biológicos del funcionamiento

cognitivo. El
En un afán por mejorar la calidad de los tests, así como las habilidades de las per-
sonas que los aplican, se han formado dentro del marco de la Unión Europea dife-
rentes comisiones de trabajo cuyas conclusiones se tratarán de poner en práctica en
los próximos años; estos trabajos van dirigidos en tres direcciones (Muñiz, 1995). En
primer lugar, el Colegio Oficial de Psicólogos español ha creado una comisión que
intentará elaborar unas normas que tendrán que cumplir los tests con el fin de poseer
un criterio con el que contrastar si un test posee los requisitos técnicos exigibles para
su uso; en este contexto el Colegio de Psicólogos alemán ha planteado recientemente
la posibilidad de que los tests fuesen considerados por el Parlamento Europeo como
productos sanitarios, con lo que ello implica a nivel de uso y de control de calidad.
Por otro lado, el Colegio Oficial de Psicólogos español está integrado en una comi-
sión liderada por la International Tests Commission (ITC) que está a punto de finali-
zar la elaboración de unas directrices técnicas para la correcta adaptación de un test
de una lengua/cultura a otra; un primer avance con veintidós directrices agrupadas
en cuatro apartados (contexto, desarrollo de instrumentos y adaptación, administra-
ción e interpretación de las puntuaciones) fue publicado recientemente (Hambleton,
1994). Por último, en el futuro alguien (probablemente los colegios de psicólogos)
deberán acreditar a las personas para utilizar ciertos tipos de tests, lo cual implicará
el establecimiento de unos curricula o conocimientos exigibles. De hecho, en un re-
ciente trabajo de Moreland y cols. (1995) se establecen doce competencias mínimas
que deben cumplir aquellas personas que trabajen con tests, que van desde evitar
errores al establecer las puntuaciones y registrar los datos hasta no asumir que una
norma o baremo para una determinada situación o grupo de sujetos puede aplicarse
automáticamente a otra situación o grupo de sujetos distintos, pasando por abste-
nerse de entrenar a los sujetos en los ítems de los tests o no hacer fotocopias de mate-
riales originales. En Inglaterra ya se empieza a realizar una acreditación de especia-
listas en tests (Bartran, 1996).
Un buen ejemplo del desarrollo de la evaluación psicológica en los próximos
años es, en palabras de Matarazzo (1992), la mejora de la evaluación neuropsicológi-
ca. Ante la situación que probablemente tengamos que afrontar (una población en-
vejecida, un incremento de la enfermedad de Alzheimer y casos de lesiones neurona-
les) tendrán que desarrollarse baterías o tests que evalúen la eficacia para captar
información por diferentes modalidades sensoriales, la capacidad de atención, con-
centración y de procesamiento de información y la habilidad para ejecutar operacio-
nes verbales o motoras requeridas ante la presentación de un ítem. Por lo que respec-
ta a la evaluación de la personalidad, Matarazzo (1992) pronostica el desarrollo de
tests para el diagnóstico de psicopatologías específicas como consecuencia del per-
feccionamiento de la tecnología de elaboración de tests. Por otro lado, nuevas gene-
raciones de cuestionarios de personalidad como el NEO basado en las cinco dimen-
siones básicas (Costa y McCrae, 1988) se irán afianzando.
Pero sin duda ninguna, uno de los campos de evaluación más prometedores en el
futuro será la psicología de la salud. Tareas como la evaluación ecopsicológica del su-
jeto (Fernández del Valle, 1996) para determinar factores de riesgo y realizar cam-
bios ambientales serán fundamentales en los próximos años. La tercera edad será un
39
área de gran importancia en donde la evaluación psicológica tendrá un papel rele-

vante. Temas como los trastornos gastrointestinales, el dolor crónico, el asma, los
trastornos de la menstruación, la miopía, la artritis reumatoide, programas de salud,
calidad de vida, etc. demandarán al evaluador psicológico (véase Buela-Casal, Caba-
llo y Sierra, 1996).
Quisiéramos terminar con las predicciones sobre el futuro de la evaluación psi-
cológica realizadas por algunos autores relevantes de esta disciplina. En opinión de
R. Ardila (comunicación personal, 14 de septiembre de 1995), la evaluación psico-
lógica probablemente va a continuar abarcando nuevas áreas de la conducta huma-
na, utilizando técnicas estadísticas más elaboradas, lo cual no excluirá el empleo de
técnicas cualitativas. Por su parte, L. Almeida (comunicación personal, 24 de sep-
tiembre de 1995) considera que en el futuro se realizará un mayor esfuerzo por in-
tegrar conceptos antagónicos hasta el momento, como rasgo-conducta o E-R y
cogniciones; según este autor, en los próximos años seremos testigos de grandes
desarrollos en la evaluación psicofisiológica y en la computarización de la evalua-
ción psicológica. Para A. E. Kazdin (comunicación personal, 17 de agosto de 1995)
el “modelo estático” de evaluación en el que una persona es evaluada mediante un
test para predecir su ejecución dará paso a un “modelo dinámico” en el que prima-
rá la identificación de influencias bidireccionales entre constructos, de procesos de
relaciones entre individuos y de las personas con sus ambientes. Por su parte, L. E.
Beutler (comunicación personal, 15 de agosto de 1995) augura una mayor relación
entre investigación y práctica dentro de la evaluación psicológica, especialmente en
la planificación de tratamientos, y que todos aquellos procedimientos que tengan
dificultad para validarse terminarán desapareciendo de la práctica convencional.
Por último, en opinión de S. N. Haynes (comunicación personal, 23 de septiembre
de 1995) el futuro de la evaluación psicológica se puede resumir en los siguientes
apartados:
a. Se producirá un incremento en el empleo de los instrumentos de evaluación

validados previamente (Haynes, Bogan e Ignacio, en prensa).
b. Se seguirá incrementando el uso concurrente de diferentes métodos de eva-
luación (cuestionarios de autoinforme, registros psicofisiológicos, observación, auto-
rregistros...).
c. La evaluación psicológica seguirá integrando medidas de componentes si-
tuacionales con medidas tradicionales como los rasgos de personalidad, producién-
dose un incremento de la aceptación de modelos de interacción persona x situación.
d. Losjuicios clínicos seguirán cobrando gran importancia.
e. Teniendo en cuenta que la conducta es dinámica y cambia a lo largo del
tiempo (Haynes, Blaine y Meyer, 1995), se enfatizará una metodología de evaluación
basada en medidas de series temporales. Así, métodos como las correlaciones test-
retest, medidas pre y postratamiento, etc. ayudarán a evaluar estas características di-
námicas de las variables.
f. Se producirán avances importantes en el desarrollo de instrumentos de eva-
luación psicológica: registros de vídeo y audio, sistemas de computarización de da-
tos de observación, registros ambulatorios de variables psicotisiológicas, etc.
(Tryon, 1996).
Para finalizar este capítulo y, a modo de resumen, en el anexo 1.1 se presenta un

cuadro sinóptico que agrupa los hechos más relevantes quese han producido a lo
largo de la historia de la evaluación psicológica hasta laactualidad, iniciando elreco-
rrido en el período que hemos denominado constitución de la evaluación psicológi-
ca; evidentemente, no se trata más que de una muestra de hitos importantes, puesto
que una enumeración exhaustiva se apartaría de los objetivos del presente capítulo.
REFERENCIAS BIBLIOGRÁFICAS
Aiken, L. R. (1985). Psychological testing and assessment (5* ed.). Boston. Allyn and Bacon.
Almeida, L. S. y Ribeiro, 1. S. (1994). Avaliacao psicológica: repensar as formas e os contex-
tos. En L. S. Almeida e 1. S. Ribeiro (dirs.), Avaliacao psicológica: formas e contextos
(Vol. 1). Braga. APPORT.
Álvarez, A. (1972). Psicodiagnóstico clínico. Las técnicas de exploración psicológica. Madrid.
Aguilar.
prátbies Psychological Association (1986). Guidelines for computer-based tests and inter-
pretations. Washington. APA.
Anastasi, A. (1973). Los tests psicológicos (3* ed.). Madrid. Aguilar. (Orig. 1968).
Anastasi, A. (1982). Psychological testing (5* ed.). Nueva York. MacMillan.
Anastasi, A. (1988). Psychological testing (6* ed.). Nueva York. McMillan.
Avila, A. (dir.) (1992a). Evaluación en psicología clínica I: proceso, método y estrategias psico-
métricas. Salamanca. Amarú.
Ávila, A. (1992b). La psicología clínica: aproximación histórica y principales cuestiones teó-
rico-conceptuales. En A. Avila (dir.), Evaluación en psicología clínica Í: proceso, método y
estrategias psicométricas. Salamanca. Amarú.
Bartran, D. (1996). Tests qualifications and test use in UK: The competence approach. Exro-
pean Journal of Psychological Assessment, 12, 62-71.
Bellack, A. S. y Hersen, M. (1988). Future directions of behavioral assessment. En A. S. Be-
llack y M. Hersen (dirs.), Behavioral assessment. A practical handbook (3* ed.). Nueva
York. Pergamon Press.
Benton, A. L. (1994). Neuropsychological assessment. Annual Review of Psychology, 45, 1-
Da ,
Blanco, A. (dir.) (19864). Apuntes de psicodiagnóstico. Valencia. Promolibro.
Blanco, A. (1986b). Bases conceptuales e históricas del psicodiagnóstico. En A. Blanco (dir.),
Apuntes de psicodiagnóstico. Valencia. Promolibro.
Blanco, A. (dir.) (1990). Apuntes de diagnóstico clínico. Valencia. Promolibro.
Buela-Casal, G., Caballo, V. E. y Sierra,J.C. (dirs.) (1996). Manual de evaluación en psicolo-
gía clínica y de la salud. Madrid. Siglo XXL
Carbonell, E., Carpintero, H. y Silva, F. (1988). La evaluación psicológica vista por los eva-
luadores: una encuesta de sus perspectivas futuras. Evaluación Psicológica/Psychological
Assessment, 4, 259-314.
Carbonell, E., Silva, F. y Carpintero, H. (1988). Estructuración de la evaluación psicológica
contemporánea: una aproximación cienciométrica. Evaluación Psicológica/Psychological
Carpintero, H. (1989). La evolución del psicodiagnóstico en España. Evaluación Psicológi-
ca/Psychological Assessment, 5, 3-21.
41
Cautela, J. (1968). Behavior therapy and the need for behavioral assessment. Psychotherapy,
: Theory, Research and Practice, 5, 175-179.
Ciminero, A. R., Calhoun, K. S. y Adams, H. E. (dirs.) (1977). Handbook of behavioral as-
sessment. Nueva York. Wiley.
Cone, J. D. (1993). The current state of behavioral assessment. European Journal of Psycholo-
gical Assessment, 9, 175-181.
Cone, J. D. y Hawkins, R. (1977). Behavioral assessment. New directions in clinical psycho-
logy. Nueva York. Brunner/Mazel.
Cone, J. D. y Hayes, S. C. (1980). Environmental problems/behavioral solutions. Monterrey.
Brooks-Cole.
Costa, P. T. y McCrae, R. R. (1988). From catalog to classification: Murray's needs and the
five-factor model. Journal of Personality and Social Psychology, 55, 258-265.
Craig, R. J. y Horowitz, M. (1990). Current utilization of pyschological tests at diagnostic
practicum sites. The Clinical Psychologist, 43, 29-36.
Cronbach, L. J. (1972). Fundamentos de la exploración psicológica. Madrid. Biblioteca Nue-
va.
Cronbach, L. J. (1984). Esentials ofpsychology testing. Nueva York. Harper and Row.
Cronbach, L. J. (1990). Esentials of psychological testing (5* ed.). Nueva York. Harper and
Row.
Cruz, J. (comp.) (1995). Psicología y deporte. Revista de Psicología General y Aplicada, 48
1-2
DuBois, P. (1970). A hystory ofpsychological testing. Boston. Allyn and Bacon.
Exner, J. E. (1980). But 11's only an inkblot. Journal of Personality Assessment, 44, 563-577.
Exner, J. E. (1990). Manual de Rorschach para el sistema comprensivo. Barcelona. Sociedad
Catalana del Rorschach y Métodos Proyectivos.
Eysenck, H. J. (1991). Three view of intelligence. Personality and Individual Differences, 12,
971-973.
Eysenck, H. J. yRachman, S. (1965). The causes and cure of neurosis. Londres. Routledge and
Kegan Paul.
Fernández-Ballesteros, R. (1980). Psicodiagnóstico. Concepto y metodología. Madrid. Cincel-
Kapelusz.
Fernández-Ballesteros, R. (1983). Psicodiagnóstico. Madrid. UNED.
Fernández-Ballesteros, R. (1992). Introducción a la evaluación psicológica. Madrid. Pirámide.
Fernández-Ballesteros, R. (1993). Behavioral assessment: Dying, vanishing or still running?
European Journal of Psychological Assessment, 9, 159-174.
Fernández-Ballesteros, R. (1994). Evolución histórica de la evaluación conductual. En
R. Fernández-Ballesteros (dir.), Evaluación conductual hoy. Un enfoque para el cambio
en psicología clínica y de la salud. Madrid. Pirámide.
Fernández-Ballesteros, R. (dir.) (1995). Evaluación de programas. Una guía práctica en ám-
bitos sociales, educativos y de salud. Madrid. Síntesis.
Fernández-Ballesteros, R. y Silva, F. (1985). Presentación. Evaluación Psicológica/Psycholo-
Fernández-Ríos, M. (1993). Psicología del trabajo y de las organizaciones: marco teórico. Pa-
peles del Psicólogo, 57, 29-35.
Fernández del Valle, J. (1996). Evaluación ecopsicológica de los estilos de vida. En G. Buela-
Casal, V. E. Caballo y J. C. Sierra (dirs.), Manual de evaluación en psicología clínica y de la
salud. Madrid. Siglo XXI.
Eranks, C. M. (1991). Orígenes, historia reciente, cuestiones actuales y estatus futuro de la te-
rapia de conducta: una revisión conceptual. En V. E. Caballo (dir.), Manual de técnicas de
terapia y modificación de conducta. Madrid. Siglo XXI.
Gambrill, E. D. (1977). Behavior modification: Handbook of assessment, intervention and
evaluation. San Francisco. Josey-Bass.
García Vega, L. (1989). El antifeminismo científico de Juan Huarte de San Juan, patrón de la
Psicología. Revista de Psicología General y Aplicada, 42, 533-542. . y
Garrido, V. (1991). Psicología jurídica en España: líneas fundamentale s de intervención. Pa-
peles del Psicólogo, 48, 20-28.
Goldfried, M. y Kent, R. N. (1972). Traditional versus behavioral personality assessment:
A comparison of metodological and theoretical assumption. Psychological Bulletin, 23,
75-87.
Goldfried, M. y Linehan, M. (1977). Basic issues in behavioral personality assessment. En
A. Ciminero, K. Calhoun y H. Adams (dirs.), Handbook of behavioral assessment. Nue-
va York. Wiley. ao)
Goldfried, M. y Pomeranz, D. (1968). Role de assessment in behavior modification. Psycho-
logical Reports, 23, 75-87.
Goldstein, G. y Hersen, M. (dirs.) (1984). Handbook of psychological assessment. Nueva
Goldstein, G. y Hersen, M. (dirs.) (19904). Handbook of psychological assessment (2* ed.).
Nueva York. Pergamon Press.
Goldstein, G. y Hersen, M. (1990b). Historical perspectives. En G. Goldstein y M. Hersen
(dirs.), Handbook ofpsychological assessment (2* ed.). Nueva York. Pergamon Press.
Gondra, J. M. (1994). Juan Huarte de San Juan y las diferencias de inteligencia. Anuario de
Psicología, 60, 13-34.
Groffman, K. y Michel, L. (1982/1983). Psychologische diagnostik. Gotinga. Verlag fir Psy-
chologie.
Hambleton, R. K. (1994). Guideliness for adapting educational and pyschological tests: A
progress report. European Journal of Psychological Assessment, 10, 229-244.
Hayes, S. C. y Follete, W. C. (1993). The challenge faced by behavioral assessment. European
Journal of Psychopathological Assessment, 9, 182-188.
Haynes, S. N. (1978). Principles of behavioral assessment. Nueva York. Gardner Press.
Haynes, S. N., Blaine, D. y Meyer, K. (1995). Dinamical models for psychological assess-
ment. Phase space functions. Psychological Assessment, 7, 17-24.
Haynes, S. N., Bogan, K. e Ignacio, L. (en prensa). Psychological assessment instruments
used in treatment outcome studies. Journal of Consulting and Clinical Psychology.
Haynes, S. N. y O'Brien, W. H. (1988). The Gordian Knot of DSM-I11-R use: Principles of be-
havior classification and complex causal models. Behavioral Assessment, 10, 95-105.
Haynes, S. N. y O'Brien, W. H. (1990). Functional analysis in behavior therapy. Clinical
Psychology Revierw, 10, 649-668.
Haynes, S. N. y Wilson, C. (1979). Behavioral assessment: Recent advances in methods, con-
cepts and aplications. San Francisco. Josey-Bass.
Hernández. J. M. (1996). Evaluación de programas de salud. En G. Buela-Casal, V. E. Caba-
llo y J. C. Sierra (dirs.), Manual de evaluación en psicología clínica y de la salud. Madrid.
Siglo XXI.
Hersen, M. (1988). Behavioral assessment and psychiatric diagnosis. Behavioral Assessment,
10, 107-121.
Hersen, M. y Bellack, A. (1976). Behavioral assessment. A practical handbook. Nueva York.
Pergamon Press.
Holtzman, W. (1971). The changing world mental measurement and its social significance.
American Psychologist, 26, 546-553.
Holtzman, W. (1989). Entrevista. Papeles del Psicólogo, 41/42, 106-109.
Kanfer, F. y Saslow, G. (1965). Behavioral analysis. Archives of General Psychiatry, 12, 529-
538.
Kaplan, R. M. y Saccuzzo, D. P. (1993). Psychological testing. Principles, applications, and is-
sues (3* ed.). Belmont. Brooks/Cole Publishing.
Kazdin, A. (1991). Sobre los aspectos conceptuales y empíricos de la terapia de conducta. En
40
E id (dir.), Manual de técnicas de terapia y modificación de conducta. Madrid. Si-

glo :
ice y Gordon, S. (1978). A practical guide to behavioral assessment. Nueva
Keller, L. S., Butcher, J. N. y Slutske, W. S. (1990). Objective personality assessment. En
G. Goldstein y M. Hersen (dirs.), Handbook of psychological assessment (2* ed.). Nueva
Kendall, P. C. y Hollon, S. D. (1981). Assessment strategies for cognitive-behavioral inter-
vention. Nueva York. Academic Press.
Lang, P. (1968). Fear reduction and fear behavioral: Problems in treating a construct. En
E Research in psychotherapy (vol. 3). Washington. American Psychology
Lómov, B. (1985). Las particularidades de los procesos cognoscitivos en condiciones de rela-

ciones. En B. Lómov y V. Shustiov (dirs.), La ciencia psicológica soviética. Moscú. Naúka.
Lubin, B., Larsen, R. M. y Matarazzo, J. D. (1984). Patterns of psychological test usage in the
United States: 1935-1982. American Psychologist, 39, 451-454.
Luján,J.L. (1991). La psicofísica y el origen de los tests de inteligencia. Revista de Historia de
la Psicología, 12, 41-55.
Magrab, P. R. (1984). Psychological and behavioral assessment. Nueva York. Plenum Press.
Maloney, M. y Ward, M. (1976). Psychological assessment. A conceptual approach. Nueva
York. Oxford University Press.
Martorell, M. C. (1988). Técnicas de evaluación psicológica (vol. 1). Valencia. Promolibro.
Marrero, H., Espino, O. y Gámez, A. (1989). La crisis de la aproximación factorial. En
H. Marrero, G. Buela,J.Navarro y L. Fernández (dirs.), La inteligencia humana: más allá
de lo que miden los tests. Barcelona. Labor.
Marrero, H., Gámez, A., Espino, O. y León, I. (1989). Alternativas al enfoque factorial de la
investigación y medida de la inteligencia. En H. Marrero, G. Buela, J. Navarro y L. Fernán-
dez (dirs.), La inteligencia humana: más alla de lo que miden los tests. Barcelona. Labor.
Mash, E. J. y Terdal, L. G. (1976). Behavior therapy assessment: Diagnosis, design and eva-
lnation. Nueva York. Springer.
Matarazzo, J. D. (1992). Psychological testing and assessment in the 21st century. American
Psychologist, 47, 1007-1018.
Matud, P. (1993). Desarrollo histórico de la evaluación conductual. Hacia la evaluación psi-
cológica. En W. Peñate, P. Matud e 1. Ibáñez (dirs.), Evaluación psicológica: concepto y
técnicas de análisis. Valencia. Promolibro.
McReynolds, P. (dir.) (1975). Advances in psychological assessment (vol.3). San Francisco.
ossey-Bass.
OTE P. (1986). History of assessment in clinical and educational settings. En R. O.
Nelson y S. C. Hayes (dirs.), Conceptual foundations of behavioral assessment. Nueva
York. Guilford Press.
Meyer, V. y Chesser, E. (1970). Behavioral therapy and clinical psychiatry. Harmonsworth.
Penguin.
cd K. L., Eyde, L. D., Robertson, G. L., Primoff, E. S. y Most, R. B. (1995). Assess-
ment of test user qualifications. American Psychologist, 5, 14-23.
Muñiz,J.(1990). Teoría de la respuesta a los ítems. Un nuevo enfoque en la evaluación psico-
lógica y educativa. Madrid. Pirámide.
Muñiz, J. (1995). Los tests y la Unión Europea. Papeles del Psicólogo, 61, 60-63.
Muñiz,J. y Cuesta, M. (1993). El problema de la unidimensionalidad en la medición psicoló-
gica. En M. Forns y M. T. Anguera (dirs.), Aportaciones recientes a la evaluación psicológi-
ca. Barcelona. PPU. E Ae,
Murphy, K. R. y Davidshofer, C. O. (1991). Psychological testing: Principles E applications
(2* ed.). Nueva Jersey. Prentice Hall.
Nelson, R. O. (1983). Behavioral assessment: Past, present and future. Behavioral Assess-
ment, 5, 195-206.
Nelson, R. O. y Hayes, S. C. (dirs.) (1986). Conceptual foundations of behavioral assessment.
Nueva York. Guilford Press.
Pelechano, V. (1976). Psicodiagnóstico. Madrid. UNED. ]
Pelechano, V. (1988). Del psicodiagnóstico clásico al diagnóstico ecopsicológico (vols. 1 y 2).
Valencia. Alfaplús. 4
Peñate, W/., Matud, P. e Ibáñez, L (1993). Evaluación psicológica: concepto y técnicas de análi-
sis. Valencia. Promolibro.
Pérez-Álvarez, M. (1991). Prehistoria de la modificación de conducta en la cultura española.
En V. E. Caballo (dir.), Manual de técnicas de terapia y modificación de conducta. Madrid.
Siglo XXL
Dies D. (1968). The clinical study of social behavior. Nueva York. Appleton-Century-
Crofts.
Pichot, P. (1994). La evaluación psicológica en Europa. Clínica y Salud, 5, 117-127.
Piotrowski, C. y Zalewski, C. (1993). Training in psychodiagnostic testing in APA-aproved
PsyD and PhD clinical psychology programs. Journal of Personality Assessment, 61, 394-
405.
Pol, E. (1994). Environmental psychology. Applied Psychology. An International Review,
43, 157-174.
Prieto, F., Tortosa, F. y Silva, F. (1984). La evaluación conductual: aproximación bibliométri-
ca. Comunicación presentada en el ICongreso de Evaluación Psicológica. Madrid.
Renom, J. (1993). Tests adaptativos computarizados. En M. Forns y M. T. Anguera (dirs.),
Aportaciones recientes a la evaluación psicológica. Barcelona. PPU.
Richelle, M. (1991). Prólogo. En G. Buela-Casal y V. E. Caballo (dirs.), Manual de psicología
clínica aplicada. Madrid. Siglo XXI.
Robins, L. N., Helzer, J. E., Croughan, J. y Ratcliff, K. S. (1981). National Institute of Mental
Health Diagnostic Interview Schedule. Its history, characteristics, and validity. Archives
of General Psychiatry, 10, 41-46.
Rodríguez, A. (1993). Marco para el desarrollo de la Psicología del Trabajo y de las Organi-
zaciones. Papeles del Psicólogo, 57, 28.
Rogers, T. B. (1995). The psychological testing enterprise. An introduction. Pacific Grove.
Brooks/Cole Publishing Company.
Rubinstein (1981). Principios de psicología general. La Habana. Pueblo y Educación.
Serrate, A. (1980). Ayer y hoy de las técnicas proyectivas en España. Técnicas Proyectivas, 1,
3-11.
Sechrest, L. y Figueredo, A. J. (1993). Program evaluation. Annual Review of Psychology, 44,
645-674,
Sierra, J. C. (1996). De la crisis de la evaluación conductual a la actual evaluación psicológica.
Ponencia presentada en la IV Conferéncia Internacional Avaliacao Psicológica: Formas e
Contextos. Braga (Portugal).
Silva, F. (1982). Introducción al psicodiagnóstico. Valencia. Promolibro.
Silva, F. (1985). Psicodiagnóstico: teoría y aplicaciones. Valencia. Rubio.
Silva, F. y Martorell, M. C. (1991). Evaluación conductual y evaluación tradicional: la cues-
tión psicométrica. En V. E. Caballo (dir.), Manual de técnicas de terapia y modificación de
conducta. Madrid. Siglo XXI.
Spielberger, C. D. y Piotrowski, C. (1990). Clinician's attitudes toward computer-based tes-
ting. The Clinical Psychologist, 43, 60-63.
Pre A. y Staats, C. (1963). Complex human behavior. Nueva York. Holt, Rinehart and
inston.
Stermberg, R. (1986). Capacidad intelectual humana. En R. Sternberg (dir.), Las capacidades
humanas. Un enfoque desde el procesamiento de la información. Barcelona. Labor.
Sundberg, N. D. (1961). The practice of psychological testing in clinical services in the Uni-
ted States. American Psychologist, 16, 79-83.
Thorndike, R. M., Cuningham, G. K., Thorndike, R. L. y Hagen, E. P. (1991). Measurement
and evaluation in psychology and education (5* ed.). Nueva York. Maxwell McMillan.
Tryon, W. W. (1996). Behavioral observation. En M. Hersen y A. S. Bellack (dirs.), Behavio-
ral assessment: A practical handbook (4* ed.). Boston. Allyn and Bacon.
Ullmann, L. y Krasner, L. (1965). Case studies in behavior modification. Nueva York. Holt.
Velarde,J.(1993). Huarte de San Juan, patrono de Psicología. Psicothema, 5, 451-458.
Weiss, D. (dir.) (1983). New horizont in testing. Nueva York. Academic Press.
Wiggrns, J. (1973). Personality and prediction: principles ofpersonality assessment. Massachu-
setts. Addison-Wesley.
Wing, J. K. (1980). The use of the Present State Examination in general population surveys.
Acta Psychiatrica Scandinavica, 285, 230-240.
Wolpe, J. (1969). The practice of behavior therapy. Londres. Pergamon Press.
Yakunin, V. (1985). Los primeros laboratorios psicológicos. En B. Lomov y V. Shustiov
(dirs.), La ciencia PS soviética. Moscú. Naúka.
Zabrodin, Y. (1985). Sobre ciertas tendencias del desarrollo de la psicofísica en la Unión So-
viética. En B. Lomov y V. Shustiov (dirs.), La ciencia psicológica soviética. Moscú. Naúka.
Zubin, J. (1989). Use of research instruments in psychopathological assessment: Some histo-
rical perspectives. En S. Wentzler (dir.), Measuring mental illness: Psychometrics assess-
ment for clinicians. Washington. American Psychiatric Press.
LECTURAS COMPLEMENTARIAS
Ávila, A. (1992). La psicología clínica: aproximación histórica y principales cuestiones teóri-

co-conceptuales. En A. Ávila (dir.), Evaluación en psicología clínica 1: proceso, método y
Dubois, P. (1970). A hystory ofpsychological testing. Boston. Allyn and Bacon.
Goldstein, G. y Hersen, M. (1990). Historical perspectives. En G. Goldstein y M. Hersen
Matud, P. (1993). Desarrollo histórico de la evaluación conductual. Hacia la evaluación psi-
cológica. En W. Peñate, P. Matud e L. Ibáñez (dirs.), Evaluación psicológica: concepto y
técnicas de análisis. Valencia. Promolibro.
Valencia. Alfaplús. :
ANEXO 1. HECHOS MÁS RELEVANTES EN LA HISTORIA
DELA EVALUACIÓN PSICOLÓGICA
1883 Galton publica Inquiries into human faculty and its development
1884 Galton ofrece pruebas psicológicas en el South Kensington Museum
1890 Cattell utiliza por primera vez la expresión «test mental»
1904 Spearman sienta las bases de la teoría psicométrica ss
1905 Binet y Simon publican la primera versión de su test de inteligencia
1912 Stern propone el concepto de «cociente de inteligencia»
1914 Spearman formula la primera teoría factorial de la inteligencia
1916 Terman publica la primera adaptación de la escala de Binet en Estados Unidos :
1917 Otis elabora el Army alfa test y el Army beta test para la evaluación colectiva de la in-
teligencia durante la primera guerra mundial
1918 Woodworth publica el primer inventario de personalidad: Personal data sheet
1921 Rorschach publica Psychodiagnostik
1922 Cattell funda la Psychological Corporation, primera editorial de tests a gran escala
1927 Strong publica su I/nventario de intereses personales
1935 Murray publica el Test de apercepción temática (TAT)
1936 El Comité Central del Partido Comunista de la Unión Soviética prohíbe el uso de
tests
1938 Thurstone publica Primary mental abilities
1939 Wechsler publica su escala individual de inteligencia
Frank introduce la expresión «técnicas proyectivas»
1940 Comienza a publicarse la revista Educational and Psychological Assessment
1943 Hathaway y McKinley publican el Minnesota multiphasic personality inventory
(MMPI)
1947 La American Army Airforce publica los procedimientos de selección de pilotos
1952 Eysenck con la publicación de The effects ofpsychotherapy comienza la polémica
acerca de la eficacia y evaluación de la psicoterapia
1954 Meehl publica Clinical versus statistical prediction en donde se vierten fuertes críticas a
las técnicas proyectivas
1955 Ghiselli muestra el bajo poder predictivo de muchos tests
157 Edwards demuestra la influencia de la deseabiliadad social, comenzando la polémica
en torno a las tendencias de respuesta de los tests
1958 Anastasi publica la primera edición de Psychological testing
1959 Quema de tests en Texas iniciándose el movimiento antitests
1964 Se prohíbe la aplicación de tests colectivos de inteligencia en las escuelas de Nueva
York
1965 Kantfer y Saslow publican Behavioral analysis, produciéndose el nacimiento “oficial”
de la evaluación conductual
1966 McReynolds publica la primera edición de Advances in psychological assessment
1968 Cautela utiliza por primera vez la expresión «behavioral assessment»
Mischel publica Personality and assessment
Barker con la publicación de Ecological psychology establece los principios de la eva-
luación ambiental
1976 Se publica Behavioral assessment. A practical handbook de Hersen y Bellack.
17 Se inicia la publicación de las revistas Behavioral Assessment y Journal of Behavioral
Assessment
1981 Kendall y Hollon publican Assessment strategies for cognitive-behavioral interven-

tion que va a suponer el inicio de la crisis de la evaluación conductual
Merluzzi, Glass y Genest coordinan la obra Cognitive assessment, primera aproxima-
ción cognitiva a la evaluación clínica
1989 La APA comienza la publicación de la revista Psychological Assessment
1990 Se funda la European Society of Psychological Assessment
1991 First European Conference on Psychological Assessment celebrada en Barcelona
1992 Deja de publicarse la revista Behavioral Assessment, pasando a constituir una sección
de Behaviour Research and Therapy, lo cual se percibe como un signo de la crisis de la
evaluación conductual
1993 Second European Conference on Psychological Assessment celebrada en Gronigen
(Holanda)
I Conferéncia Internacional de Avaliagao Psicológica: Formas e Contextos celebrada
en Braga (Portugal)
1994 II Conferéncia Internacional de Avaliagao Psicológica: Formas e Contextos celebrada
en Braga (Portugal)
1995 III Conferéncia Internacional de Avaliacao Psicológica: Formas e Contextos celebra-
da en Braga (Portugal)
Third European Conference on Psychological Assessment celebrada en Trier (Ale-
mania)
Se inicia la publicación de la Revista Iberoamericana de Diagnóstico y Evaluación Psi-
cológica
Se inicia la publicación de la revista Evaluation
1996 IV Conferéncia Internacional de Avaliagao Psicológica: Formas e Contextos celebra-
da en Braga (Portugal)
1997 Fourth European Conference on Psychological Assessment celebrada en Lisboa
(Portugal)
V Conferéncia Internacional de Avaliacao Psicológica: Formas e Contextos celebrada
en Braga (Portugal)
| ci
hd oda
peaes Y
+2 , . 40
4 2 Munar PUbETA 0.4% UE dE UTE
í ¿a 0 - L 23 wi y 2
dels 201751003 3 240007 2agúlost
>.
y
es
2 ANO
E aAbi
diod l
jólua,
uns
1 LS
A les AS
É u dE ' EW LAU SR 3
$ .
de pl
EN yl
eo? 4 palénue
ca
nn 1 . ' huorze cit a
. 1]
E,
-
>. 54 olémica
eN
LS
EN ESPAÑA
GUALBERTO BUELA-CASAL Y J. CARLOS SIERRA
L INTRODUCCIÓN
Para realizar esta breve revisión sobre la evolución de la evaluación psicológica en

España nos situaremos a principios del siglo XX. Los hechos y acontecimientos más
relevantes, anteriores a esta fecha, pueden verse en Lafuente (1980), Rodríguez
(1981), Del Barrio y Carpintero (1985) y Carpintero (1994). Se puede anticipar que
existen pocos trabajos que traten sobre la evolución histórica de la evaluación psico-
lógica en España. Entre éstos hay que resaltar una revisión parcial de Carpintero
(19894) que alcanza hasta la década de los años cincuenta y algunos otros trabajos
más puntuales sobre algún aspecto o autor en concreto. Sin embargo, no se ha reali-
zado ningún estudio sistemático en el que se analice la evolución de esta disciplina
intentando establecer un hilo conductor entre autores y hechos a lo largo de este
siglo.
En estos casi cien años de historia de la psicología española, que comenzaron con
una cátedra de psicología y terminan con más de veinte centros donde imparten es-
tudios de psicología alrededor de mil profesores, hay en nuestra opinión cuatro eta-
pas bien delimitadas. La primera abarca desde principio de siglo hasta 1936 (inicio de
la guerra civil) y podría considerarse como el período de constitución de la psicolo-
gía científica. La segunda etapa, que se correspondería con el período entre la pos-
guerra y principio de la década de los años cincuenta, es el período de reconstrucción
de la psicología. En la tercera etapa, que se inicia con la fundación de la Escuela de
Psicología y Psicotecnia, se constituye la evaluación psicológica como disciplina
universitaria. La última etapa comienza a mediados de los años setenta con la entra-
da en España de la psicología conductual y se caracteriza por la consolidación y gran
desarrollo de la evaluación psicológica.
En la descripción y el análisis de los hechos relacionados con la constitución y
desarrollo de la evaluación psicológica partiremos desde una visión general de una
psicología en la que no existían especialidades, evolucionando hacia un estudio más
concreto de la evaluación psicológica. Paralelamente, el análisis que comenzará cen-
trándose en los autores, irá poco a poco despersonalizándose, dado que no sería po-
sible abarcar las contribuciones de todos los autores actuales.
IL LA CONSTITUCIÓN DE LA PSICOLOGÍA CIENTÍFICA (1900-1936)
El nacimiento de la psicología en España no podría ser más feliz, puesto que nace en
una facultad de ciencias; ¿quién podría imaginarse en aquellos momentos que termina-
ría reapareciendo en una facultad de filosofía casi siete décadas después? En el año
1902, Luis Simarro toma posesión de la cátedra de psicología experimental en la Facul-
tad de Ciencias Naturales de la Universidad de Madrid, que es, según Yela (1982), la
primera del mundo. Si bien es cierto que Urbano González fuecatedrático de Psicolo-
gía, Lógica y Filosofía Moral en el Instituto San Isidro de Madrid en 1875, en ésta no se
considera la psicología como una disciplina independiente. Simarro, médico con una
sólida formación, ocupó la plaza de jefe facultativo en el manicomio de Leganés (Ma-
drid), realizó estudios con Charcot y Claude Bernard en París y posteriormente consi-
guió la cátedra. Fue un gran impulsor de la psicología en España, pues en torno a él se
formaron los que más tarde sentarían las bases de la psicología española. Su labor era
más la de un organizador que la de un investigador. Participó en la creación de la Aso-
ciación Española para el Progreso de las Ciencias y en la Junta de Ampliación de Estu-
dios e Investigaciones Científicas (1907) (Alvarez, Cañas y Campos, 1990).
Desde los primeros años del siglo XX surgen dos líneas de trabajo, una dirigida
por Luis Simarro en Madrid y la otra se consolida en Barcelona bajo la dirección de
Ramón Turró, especialmente interesado en problemas epistemológicos. Carpintero
(1989a, 1994) llega a hablar ya de la escuela de Madrid y la escuela de Barcelona. La
primera evoluciona hacia el campo educativo y clínico, a lo cual contribuye la crea-
ción en 1914 del Patronato Nacional de Anormales, donde Achúcarro y Rodríguez
Lafora comienzan a trabajar en problemas psicopedagógicos; la segunda escuela
evoluciona hacia el campo de la psicotecnia, destacando la fundación en 1914 de la
Secretariat d'Aprenentatge de la Mancomunidad (transformada tres años después en
el Institut d'Orientació Professional), donde inicia sus trabajos Emilio Mira. Car-
pintero (19894) resalta dos características importantes de esta primera psicología:
una es su orientación hacia la intervención, lo cual contribuye al desarrollo de la eva-
luación psicológica y otra la focalización hacia el estudio de las aptitudes.
En Madrid surge una serie de instituciones (Patronato Nacional de Anormales,
Instituto de Reeducación Profesional de Inválidos del Trabajo, Inspección Médico-
Escolar, Colegio Nacional de Sordomudos, Instituto Médico-Pedagógico...) que
traerá como consecuencia una demanda de instrumentos de evaluación. Fruto de
ello son obras relevantes como Diagnóstico de niños anormales (1914) de Anselmo
González, en donde se incluye una descripción de la escala de Binet-Simon y Los ni-
ños mentalmente anormales (1917) de Gonzalo R. Lafora, orientada a maestros es-
pecializados en la enseñanza de niños deficientes. Sin embargo, posiblemente la pu-
blicación más relevante de esta época sea Pruebas de inteligencia. Revisión española
y adaptación práctica del método de L. M. Terman (1930) de José Germain y Merce-
des Rodrigo, lo que pone de manifiesto la preponderancia de la evaluación de la inte-
ligencia, y concretamente de la figura de Binet, en esta incipiente evaluación psicoló-
gica. En esta obra se defendía que estas pruebas de inteligencia (las cuales, en opinión
e los autores, formaban parte de una nueva rama de la psicología experimental: la
psicología aplicada) se aplicasen en la escuela con la ayuda de un psicólogo. Estos
Evolución histórica de la evaluación psicológica en España 51
mismos autores llegaron a publicar un test de inteligencia con diez pruebas (refranes,
analogías, etc.) para detectar estudiantes bien dotados (Carpintero, 1994). Este mis-
mo año se publica La psicología contemporánea, obra póstuma de Viqueira, un discí-
pulo de Simarro que se había formado con Múller en Alemania, donde llegó a publi-
car un estudio sobre la memoria de sílabas sin sentido, lo que en palabras de
Carpintero (1989b) constituye el estreno o puesta de largo de nuestra investigación
psicológica. Viqueira pudo haber sido el primer gran impulsor de la investigación
psicológica, pero su prematura muerte a los 36 años le convirtió en nuestra primera
frustración científica. Sin embargo, puede ser considerado como el primer represen-
tante de la evaluación psicológica en España, tal como queda de manifiesto en su tra-
bajo Los métodos del examen de la inteligencia (1917), en el que analiza las pruebas
de inteligencia de Binet, y en Qué es una medida mental: ¿es posible una psicología
cuantitativa?, trabajo que presentó en el Congreso de la Asociación para el Progreso
de las Ciencias celebrado en Sevilla en 1917. En su libro Introducción a la psicología
pedagógica, publicado en 1926, argumentaba que la psicología era de gran utilidad
para el maestro, pues le permitía conocer la evolución del individuo, por lo que re-
saltaba la importancia del diagnóstico en el ámbito educativo. A pesar de su corta
vida, su producción científica fue abundante y polifacética, tratando temas tan diver-
sos como psicología experimental, psicología infantil, evaluación y personalidad. Se-
gún Del Barrio y Carpintero (1985), Viqueira aparece como un auténtico psicólogo
moderno, con una formación plenamente europea, y cuya obra podría haber sido
decisiva para la psicología española si se hubiera dado el marco académico adecuado.
Ya en 1915, Viqueira planteaba la necesidad de crear un instituto de psicología, que
permitiría formar a los estudiantes que pretendieran estudiar en el extranjero y, al
mismo tiempo, serviría para ofrecerles la posibilidad de seguir trabajando en psico-
logía a su regreso. Sin embargo, su proyecto no encontró ningún apoyo institucio-
nal, por lo que optó por dedicarse a temas de psicología infantil y pedagógica en el
Museo Pedagógico Nacional, donde impartía cursos de psicología experimental. En
1917 consigue una cátedra de filosofía en el instituto de Santiago de Compostela y,
poco después, se traslada al instituto de La Coruña. A partir de entonces, su activi-
dad es aún más polifacética, sigue publicando trabajos de psicología, cultiva la músi-
ca y la poesía, al mismo tiempo que se convierte en un activo galleguista. En opinión
de Blanco y Rosa (1991), resulta difícil comprender el pensamiento de Viqueira sin
tener en cuenta su modo de experimentar lo gallego. No obstante, su primera voca-
ción seguía siendo la psicología y, de hecho, en 1924 había decidido volver a Alema-
nia, pero la osteomelitis que padecía desde la adolescencia, terminó con todas sus as-
piraciones, perdiéndose así uno de los primeros personajes de la exigua historia de la
ciencia española, cuya principal preocupación intelectual tuvo que ver con los pro-
blemas de la psicología científica (Blanco y Rosa, 1991).
Mientras tanto, en la escuela de Barcelona cabe destacar, por su relevancia en la
evaluación psicológica, la creación de la Secretariat d'Aprenentatge de la Mancomu-
nidad (1914) que se constituyó en un centro de orientación y selección profesional
para jóvenes; en 1917 se transforma en el Institut d'Orientació Profesional ' en don-
1 En este centro se llega a realizar todo tipo de evaluaciones (inteligencia, personalidad, etc.), así
como selección y orientación profesional.
de Emilio Mira ocupa por concurso oposición en 1919 la dirección del Laboratorio
Psicométrico, el primer laboratorio de psicofisiología (Ballús, 1994). En 1931 el cen-
tro se convirtió, bajo la dirección de Mira, en el Institut Psicotécnic de laGeneralitat
de Catalunya incluyendo tres secciones: orientación y selección profesional, psico-
tecnia comercial e industrial y psicopedagogía (Carpintero, 1994). En 1920 comenzó
a editarse la revista Anals de l'Institut d'Orientació Professional, que posteriormente
interrumpiría su edición en tiempos de Primo de Rivera, reanudando su publicación
(en castellano) en 1928 bajo el nombre de Anales de la Sección de Orientación y Se-
lección Profesional de la Escuela del Trabajo (un año antes el Institut pasó a depender
de esta Escuela). En 1933 inicia su edición la Revista de Psicologia i Pedagogia, en Ca-
talán. De esta revista llegaron a editarse cerca de veinte números, puesto que en 1937
se suprime su edición (Kirchner, 1979). Emilio Mira constituye otra figura relevante
para la evaluación psicológica durante este período; nacido en Santiago de Cuba en
1896, aunque luego se trasladaría a Galicia y posteriormente a Barcelona, donde es-
tudiaría la carrera de medicina, licenciándose con premio extraordinario. En 1921
diseña una serie de pruebas para la selección de conductores de autobuses del Ayun-
tamiento de Barcelona: capacidad de atención distribuida, coordinación de movi-
mientos, curva de fatiga, percepción de velocidades y distancias, tiempo de reacción,
etc. (Carpintero, 19894); asimismo intervino en la selección de agentes de policía, en
la cual tuvo en cuenta la inteligencia y la capacidad de observación de los aspirantes.
Su tesis doctoral sobre «Las correlaciones somáticas del trabajo intelectual», presen-
tada en 1922, es quizás el antecedente más claro de la actual evaluación psicofisioló-
gica. En esta investigación se pretende demostrar que los procesos psíquicos, inclui-
dos los superiores, no sólo están relacionados con el sistema nervioso central, sino
también con el sistema vegetativo. El objetivo principal de su tesis es analizar la co-
rrelación entre la actividad mental evaluada a través de pruebas de memoria y de aso-
ciación de conceptos con la actividad cardiovascular medida en oscilogramas regis-
trados en las extremidades superiores e inferiores. La conclusión de su investigación
es que la actividad mental se relaciona con un tipo de onda que denomina esfigmo-
psíquica, variando su amplitud e intensidad en función del esfuerzo que el sujeto reali-
za a nivel mental (García, Herrero y Carpintero, 1993). Posteriormente, Mira centra
su trabajo en dos campos, la psicotecnia y la psiquiatría, y en ambos ejerce una labor
importante. En relación con la última, colabora en la creación de la Asociación de
Neuropsiquiatras y en la fundación de la revista Archivos de Neurobiología. En 1933
consigue la cátedra de psiquiatría de la Universidad de Barcelona, siendo así el pri-
mer catedrático de esta especialidad en España (Miralles, 1985). Dos años después
publica su Manual de psiquiatría, donde se recoge su labor en este campo. Sin em-
bargo, su mayor producción, tanto en la investigación como en las publicaciones,
pertenece al campo de la psicología, y más concretamente al ámbito de la psicotec-
nia. Así, la contribución más importante de Mira fue la construcción de diversos ins-
trumentos de medida, entre los que hay que destacar el Test miokinético de Mira
(PMK) basado en el supuesto de que todo tono emocional se corresponde a una pauta
muscular determinada. El test consiste en un tablero especial en el que hay que dibu-
Jar determinadas figuras geométricas. Al sujeto se le dice que se trata de evaluar su
capacidad de coordinación motora o su estabilidad de pulso, por lo que no debe
apoyarse sobre la mesa. Los dibujos se realizan a ciegas, unos con la mano derecha,
otros con la izquierda y otros con las dos. La evaluación consiste en medir las desvia-
ciones con respecto a los modelos, comparando la ejecución de una mano con la
otra; se obtiene así un mínimo de 80 medidas expresadas en unas unidades denomi-
nadas “tetrones” (Álvarez, 1972). El test de Mira llegó a alcanzar una gran difusión;
muestra de ello es que fue adaptado por el Centro de Psicología Aplicada de París y
aparece recogido en la sexta edición del manual de Buros (The sixth mental measure-
ment yearbook del año 1965); llegó a ser mencionado por Sarason quien señaló la
complejidad que tenía para su aplicación, por lo que era más recomendable en la in-
vestigación que en el diagnóstico (Sarason, 1965); de la misma opinión era Wechsler
(1965) al sugerir algunas transformaciones para hacer del PUX una prueba más utili-
zable. Lamentablemente, su test no llegó a ser presentado en España, puesto que en
1939 tiene que exiliarse, lo que podría considerarse como nuestra segunda frustra-
ción científica. El Test miokinético lo presenta oficialmente en octubre de 1939 en la
Royal Society of Medicine de Londres. El exilio lleva a Emilio Mira a realizar algu-
nas estancias en Estados Unidos —donde dio conferencias en las universidades de
Harvard, Princeton, Yale y Chicago—, Cuba, Argentina, Uruguay y finalmente en
Brasil, estableciéndose definitivamente en Río de Janeiro, donde llegó a ser el direc-
tor del Instituto de Selegao e Orientacao Professional (Ardila, 1986), estando dividi-
da su producción científica entre España (153 trabajos) y el exilio (160 trabajos) (Sáiz
y Sáiz, 1992). Entre sus aportaciones a la psicología española hay que resaltar tam-
bién su colaboración en la organización del II y VI Congresos Internacionales de
Psicología Aplicada celebrados en Barcelona en 1921 y 1930 respectivamente. El pri-
mero fue presidido por Claparede y el segundo por Mira. Sin duda, estos congresos
significaban un reconocimiento internacional a la pujante psicología española.
Otra aportación digna de mención son los estudios de Marañón sobre la emo-
ción, los cuales pueden ser considerados como un antecedente de la actual evalua-
ción psicofisiológica. Marañón entendía la emoción como un estado subjetivo en el
que se pueden distinguir tres tipos de manifestaciones: conducta interior, conducta
manifiesta y ciertos patrones de reactividad fisiológica. De hecho, el trabajo más c1-
tado de Marañón fue el que publicó en Francia en 1924, «Contribution a Pétude de
Paction émotive de Padrenaline». Este artículo había sido publicado en España dos
años antes, pasando totalmente desapercibido (Ferrándiz y Carpintero, 1983). En
dicho trabajo estudia los efectos fisiológicos y subjetivos de la adrenalina en más de
doscientos sujetos, concluyendo que:
a. Se puede separar voluntariamente la emoción orgánica de la emoción psíquica.

b. Aunque sin la activación fisiológica del sistema nervioso autónomo no pue-
de producirse la emoción, la activación por sí sola no puede producir la emo-
ción subjetiva, para lo que es necesario un determinante psíquico.
c. La evaluación subjetiva (recuerdo, imaginación,...) será la que determina el
tipo de emoción.
Un hecho llamativo en el desarrollo de la evaluación psicológica en España, a di-

ferencia de otros países como por ejemplo Estados Unidos, es la ausencia de una psi-
cotecnia militar que diese lugar a un extenso conocimiento de las pruebas psicológi -
cas y a la conciencia de utilidad social de la psicología. La única excepción reseñada
por Carpintero (1994) es un gabinete psicológico que se estableció en la Academia

de Infantería de Segovia. »
En definitiva, en la década de los años treinta la psicología española había alcan-
zado un alto grado de desarrollo y comenzaba a ser reconocida en el extranjero, tal
como se demuestra con la designación de Madrid como sede para el Congreso Mun-
dial de Psicología Aplicada en 1936; lamentablemente, dicho congreso no llegó a ce-
lebrarse, pues un mes antes comenzó la guerra civil, teniendo que esperar al año 1994
para acoger de nuevo este importante congreso. Con la contienda civil española se
inicia un largo período de letargo para la psicología española. La guerra afectó a va-
rios niveles; se transformaron algunos centros, se suprimieron publicaciones (Arch:-
vos de Neurobiología, Revista de Psicología ¡Pedagogía, Revista de Pedagogía,...) y
se propició el exilio de muchas figuras de la psicología en aquel momento (José Or-
tega y Gasset, Gregorio Marañón, Pío del Río-Hortega, José Miguel Sacristán, Dio-
nisio Nieto, Emilio Mira, Gonzalo R. Lafora, José Germain, Mercedes Rodrigo,
Ángel Garma, Augusto Pi Sunyer, Joaquín Xirau, Domingo Barnes, Lorenzo Luzu-
riaga, Luis de Zulueta, Peré Roselló...) (Carpintero, 1994).
III. RECONSTRUCCIÓN DE LA PSICOLOGÍA (1939-1952)
Tras la guerra civil resurge con fuerza una psicología escolástica con raíces en Aristóte-
les y santo Tomás muy diferente a la psicología científica y aplicada que se estaba co-
menzando a fraguar antes de la contienda. Tal como señala Pelechano (1988), se tuvo
que volver a descubrir la psicología científica en sucesivas batallas con la “ciencia del
alma”. En 1940 llega a España desde Roma el padre dominico Barbado con el fin de di-
rigir las investigaciones psicológicas, consiguiendo abarcar todo el poder académico e
institucional de la psicología española hasta su muerte en 1945. En su obra Introduc-
ción a la psicología experimental (1943) consideraba a Aristóteles como verdadero fun-
dador de la misma y a santo Tomás como responsable de su estatus disciplinar, criti-
cando el conductismo, el psicoanálisis y la reflexología; un dato relevante de este texto
es que santo Tomás es el autor más citado con 191 referencias (Carpintero, 1994).
Con el paso del tiempo, poco a poco se fueron reanudando las actividades de los
institutos de Barcelona y Madrid bajo la dirección de dos ingenieros, Manuel Borrás
y Ricardo Ibarrola, respectivamente. Durante años, estos centros trabajaron con
muy poca coordinación, intentando solucionar mediante técnicas de orientación y
diagnóstico los problemas surgidos a los educadores en la práctica cotidiana de la ac-
tividad escolar. La reorganización del Instituto de Psicología Aplicada y Psicotecnia
de Madrid posibilita la publicación de la revista Psicotecnia que va a suponer un res-
tablecimiento de la tradición científica. Sin duda ninguna, en esta reconstrucción de
la psicología científica española la figura central va a ser José Germain, quien en 1948
funda, con Mariano Yela como secretario, el Departamento de Psicología Experi-
mental en el Consejo Superior de Investigaciones Científicas (CSIC), en el que reúne
a un importante grupo de colaboradores entre los que cabe destacar a Mariano Yela
(especializado en psicometría y en la técnica del análisis factorial con Thurstone en
Chicago), a José Luis Pinillos (formado en Londres, en donde entró en contacto con
los trabajos de Eysenck), a Miguel Siguán (que había trabajado con Mira y estaba es-
pecializado en el TAT), a Manuel Úbeda (especializado en electroencefalografía), a
Jesusa Pertejo (especializada en el Rorschach), así como a Francisco Secadas, José A.
Forteza, Alfonso Álvarez Villar y Juan García Yagúe. Sin embargo, los inicios fue-
ron difíciles, quedando claramente reflejada esta situación en la anécdota relatada
por Yela (1994, p. 43) ocurrida durante su primer contacto con Germain: «[...] en 1948
cuando le conocí personalmente le propuse que convocase una reunión de los psicó-
logos españoles para considerar nuestra situación y planear nuestro futuro. Me res-
pondió: “siéntese usted ahí, yo me siento aquí; ya estamos reunidos los psicólogos
españoles”. Desde luego exageraba: había otros tres o cuatro». Uno de los proyectos
más amplios desarrollados por Germain y su equipo del CSIC fue la adaptación y ba-
remación de pruebas para selección de pilotos, tomando como base las utilizadas
por el Ejército del Aire de Estados Unidos (Carpintero, 1994). En opinión de Yela
(1987), la contribución de Germain a la psicología consiste en haber conseguido es-
tablecer las condiciones para consolidar la docencia, la investigación y la aplicación
de la psicología. «A él, en muy primer lugar, se debe que exista una psicología en Es-
paña. No que despunte tal o cual psicólogo eminente, que eso ya aconteció en mu-
chos períodos de nuestro pasado, sino, lo que nunca se había conseguido, que haya
miles de psicólogos que enseñan, investigan y aplican su ciencia, día a día, sin inte-
rrupción, por toda la geografía española» (Yela, 1987, p. 60).
Germain en 1946 funda la Revista de Psicología General y Aplicada, la primera
revista española dedicada exclusivamente a la psicología, y en 1952 la primera socie-
dad científica y profesional de psicólogos, la Sociedad Española de Psicología (SEP)
que debería potenciar los trabajos de investigación y la imagen del psicólogo en la
sociedad española, organizando reuniones anuales y congresos nacionales (Mora,
1992; Carpintero, 1994), siendo secretario Mariano Yela. Para fomentar la relación
internacional se nombra a Piaget miembro de honor y se le invita para que imparta
una conferencia sobre «Las ilusiones y los mecanismos perceptivos» en la sede de la
sociedad. Todos los esfuerzos de Germain fueron en vano puesto que asistieron a la
conferencia menos de veinte personas (Siguán, 1981), lo cual es un indicador más del
estado de la psicología en esos momentos.
En este período aparecen los dos primeros libros sobre la técnica de Rorschach.
Uno es El estudio de la personalidad por el test psicodiagnóstico de Rorschach (Tran-
que, 1942), donde se revisa el método y las reglas de validación y se incluyen varios
protocolos de sujetos normales y con alteraciones psiquiátricas. Dos años después se
publica El psicodiagnóstico de Rorschach (Salas, 1944), que se considera en ese mo-
mento como el libro más importante sobre esta técnica escrito por un autor español
(Serrate, 1980).
IV. CONSTITUCIÓN DE LA EVALUACIÓN PSICOLÓGICA COMO DISCIPLINA

UNIVERSITARIA (1953-1974)
En el año 1953, gracias a los esfuerzos de José Germain, se crea la Escuela de Psicolo-
gía y Psicotecnia de la Universidad Complutense de Madrid. Se trataba de una es-
cuela para posgraduados de cualquier facultad o escuela especial y era el primer cen-
tro de formación de psicología en España (el título que se obtenía era el de Diploma-
do en Psicología). Su director fue el catedrático de pedagogía Juan Zaragúeta, los vi-
cedirectores José Germain y Manuel Úbeda, y el secretario Mariano Yela. La forma-
ción se distribuía en dos años: en el primero se cursaban asignaturas generales
(psicofisiología, impartida por Úbeda; psicometría y estadística, impartidas por
Yela; psicología experimental, impartida por Pinillos; psicología genética y diferen-
cial, impartida por Siguán, etc.); en el segundo año se podía optar entre las especiali-
dades de industrial, pedagógica y clínica; dentro de esta última especialidad estaba
incluido el psicodiagnóstico que era impartido por Romano.
En 1963 la SEP comienza a organizar los congresos nacionales de psicología, en
los cuales los trabajos de psicodiagnóstico y evaluación psicológica constituirán un
tópico frecuente y, a veces, prioritario (Ávila y cols., 1994). En 1964 con la ayuda de
Miguel Siguán se crea en Barcelona la Escuela de Psicología de la Universidad de
Barcelona en donde los estudios duraban tres años y tenía dos secciones: psicología
industrial y psicología pedagógica. De forma simultánea, se creaba la Escuela de Psi-
cología Clínica en la Facultad de Medicina de la Universidad de Barcelona (Siguán,
1981). Casualmente, en este mismo año (1964) fallecía en Brasil Emilio Mira, princi-
pal impulsor de la psicología científica en Cataluña.
A finales de la década de los años sesenta, concretamente en 1968, se inauguraba
en las universidades de Madrid y Barcelona la subsección de psicología, dependiente
de la sección de filosofía pura, de la que surgen los primeros licenciados; el psi-
codiagnóstico y la psicometría estaban incluidos en el plan de estudios. Los alumnos
de psicología de la Universidad Complutense comienzan a editar en 1970 (a mult-
copista) la revista Grupos de Trabajo de Psicología Crítica; tres años después se
transforma en Cuadernos de Psicología, donde se dieron a conocer los escritos de
Luria, Sechenov, Skinner, entre otros. Posteriormente, en 1975, se convierte en una
revista «más formal» pasando a editarse con el nombre de Cuadernos de Psicología 3
(Alvarez, Cañas y Campos, 1991). La evaluación psicológica que se imparte en esos
tiempos estaba representada por la intensa y constante labor de Mariano Yela en el
campo de la psicometría. En 1956 publicó dos importantes libros: Psicometría y es-
tadística y Psicología de las aptitudes y un año después La técnica del análisis facto-
rial. La importancia del primer libro queda de manifiesto por el hecho de que en
1975 se publicaba la vigesimoséptima edición. La aportación de Yela a la psicología
supone 14 libros como único autor, 40 como colaborador, 250 publicaciones en re-
vistas especializadas, 200 tests adaptados o construidos, 70 tesis doctorales dirigidas,
etc. (Muñiz, 1994).
Junto a esta vertiente psicométrica, representada por Yela, se estaba desarrollan-
do un psicodiagnóstico con una clara orientación hacia las técnicas proyectivas prac-
ticado en el Departamento de Psicología Clínica de la Facultad de Medicina de Ma-
drid dirigido por Jesusa Pertejo, y en el de Psicología Clínica del Hospital Provincial
de Madrid bajo la dirección de María Eugenia Romano. El interés por las técnicas
proyectivas en España, que se había iniciado con las publicaciones de Tranque y Sa-
las sobre el test de Rorschach, se consolida en torno a las figuras de María Eugenia
Romano, Jesusa Pertejo y Agustín Serrate, entre otros. En el III Congreso Nacional
de Pedagogía celebrado en Salamanca en 1964 ya se habían presentado algunos tra-
bajos sobre las aplicaciones del Rorschach al campo educativo. A principio de los
años setenta se celebra en Zaragoza el 1 Congreso Internacional de Rorschach y Mé-

todos Proyectivos; en dicho congreso se nombró una comisión, de la que formaban
parte María Eugenia Romano y Rocío Fernández-Ballesteros, encargada de consti-
tuir la Sociedad Española del Rorschach y Métodos Proyectivos, la cual queda fun-
dada en 1972. A partir de ese momento se realizan reuniones anuales, que sin duda
contribuyen a la difusión y desarrollo de estas técnicas.
En 1972 la XIV Reunión Anual de la SEP bajo el título «Sentido y límites de la
prospección y medidas psicológicas» se constituye en un foro de discusión sobre los
tests y las controversias generadas por los procedimientos de evaluación (Ávila y
cols., 1994). En ese mismo año, Álvarez (1972) publica Psicodiagnóstico clínico. Las
técnicas de exploración psicológica, en el que se describen más de 125 instrumentos de
evaluación (psicométricos y proyectivos), convirtiéndose en el libro más completo
sobre evaluación psicológica editado hasta esa fecha por un autor español. En su
afán por recoger todo instrumento o método de evaluación llega a incluir un apéndi-
ce sobre «La interpretación científica de los sueños», planteando que puede ser utili-
zado para el psicodiagnóstico de la misma forma que se emplean los relatos de las lá-
minas del TAT. En el prólogo de este libro, Álvarez lanza una advertencia acerca de la
necesidad urgente de realizar más investigación, fundamentalmente sobre construc-
ción y adaptación de instrumentos de evaluación.
El psicólogo español padece, efectivamente, un hambre crónica de buenas adaptaciones de

tests extranjeros, y cuando éstas, por una rara casualidad, existen, ocurre que carecen de bare-
mos adecuados. [....] Aunque no faltan los psicólogos-avestruces que intentan negar esta rea-
lidad ingrata, lo cierto es que los organismos que oficialmente debieran adaptar, y mejor aún,
crear nuevos instrumentos de medida, se han pasado con armas y bagajes al campo de la psi-
cología aplicada [Alvarez, 1972, p. x].
Pues bien, casi dos décadas después Pelechano escribe:

[...] Con todo ello se ha logrado que en España exista una gran cantidad de material de instru-
mentación traducida, aunque su adaptación y validez deje mucho que desear. A todo ello ha
ayudado la inexistencia de un servicio oficial de control respecto a la cantidad de instrumen-
tación que se ha utilizado y se sigue utilizando en España [...]. La adaptación cuando se haga,
exige una serie de requisitos metodológicos que, desgraciadamente, no se han solido tomar en
cuenta en nuestro país. Y también habría que hacer las adaptaciones, pero bien hechas y no
meras traducciones en donde la adaptación se refiere a poco más que a una “buena” traduc-
ción de los giros y locuciones específicas de los ítems o problemas [Pelechano, 1988, p. 158].
Tal vez, la psicología española tuvo desde el principio un gran interés por lo apli-
cado, lo cual condujo a un crecimiento muy rápido de la aplicación de la evaluación
psicológica a costa de deficiencias en la adaptación de muchos instrumentos (Pele-
chano, 1988). A primera vista parece que hay una tendencia de los psicólogos espa-
ñoles a inclinarse hacia el campo aplicado. Sin embargo, la razón, tal como se señala
en ambas citas, es una razón oficial. Quizás nadie lo ha resumido de forma tan acer-
tada como Yela (1982) cuando dijo que en la construcción de la psicología española
se comenzó la casa por el tejado. Y nunca mejor dicho. Primero se crearon los insti-
tutos de Psicología Aplicada y Psicotecnia, luego la Escuela de Psicología y Psicotec-
nia (para posgraduados) y finalmente la licenciatura de psicología, es decir, justo lo

inverso de lo que hubiese sido lógico.
Por último, una muestra de la evaluación psicológica desarrollada en España du-
rante este período son los trabajos publicados por autores españoles en la Revista de
Psicología General y Aplicada durante el período 1960-1974 analizados por Campos
y Aguado (1977), encontrándose que la gran mayoría estaba dedicada al estudio o la
aplicación de algún tipo de prueba o test.
V. CONSOLIDACIÓN Y DESARROLLO DE LA EVALUACIÓN PSICOLÓGICA (1975- )
El inicio de esta etapa viene marcado por la entrada de la evaluación conductual en

España sumándose así a la evaluación tradicional existente (técnicas psicométricas y
proyectivas). No resulta fácil determinar el inicio de la modificación de conducta
en España. Así, desde los antecedentes más remotos, recogidos en el trabajo de
Pérez-Álvarez (1991) sobre la prehistoria de la modificación de conducta en la cul-
tura española, hasta los datos recopilados por Bayés (1983), se mencionan diversos
autores y acontecimientos relacionados con la psicología conductual hasta la déca-
da de los años setenta. Sin embargo, las aportaciones son muy puntuales hasta me-
diados de dicha década, tal como se manifiesta en el trabajo de Campos y Aguado
(1977).
A partir de la década de los años setenta comienza a entrar en España el modelo
conductual. Su entrada oficial quizás podría fijarse en 1975 con la celebración en Pal-
ma de Mallorca de la V Reunión de la Asociación Europea de Terapia de Conducta,
que en la actualidad reúne a 29 asociaciones. En ese mismo año se funda la revista
Análisis yModificación de la Conducta y se celebra en Madrid el Il Symposium sobre
Aprendizaje y Modificación de Conducta en Ambientes Educativos. En 1977, Bar-
tolomé, Carrobles, Costa y Del Ser publican La práctica de la terapia de conducta,
que constituye el primer libro sobre terapia de conducta escrito por autores españo-
les. En pocos años, el modelo conductual se ha consolidado de forma tan rápida que
la mayoría de los psicólogos que trabajaba en la práctica clínica se calificaba como
conductual en el año 1986 (Ávila, 1989) y 1988 (Camarero y Ferrezuelo, 1988). El
modelo conductual se consolida con la aparición de asociaciones científicas, institu-
ciones privadas y revistas con una clara orientación conductual y con el incremento
del número de congresos sobre psicología conductual, así como de autores que pu-
blican libros sobre esta temática (Buela-Casal y cols., 1993). Asimismo, en el ámbito
universitario el modelo conductual está claramente consolidado, tal como queda re-
flejado tanto en el incremento del número de asignaturas de orientación conductual
en los nuevos planes de estudios de psicología (Buela-Casal y cols., 1993), como en
el nivel de aceptación mostrado por la promoción de psicólogos del año 1993 (Álva-
rez-Castro, Buela-Casal y Sierra, 1994). La evaluación psicológica se consolida en el
ámbito académico con la implantación de los estudios de psicología en diversas uni-
versidades, se edita el primer manual de psicodiagnóstico (Pelechano, 1976) y, en el
ámbito profesional, el 31 de diciembre de 1979 se crea el Colegio Oficial de Psicólogos.
La década de los años ochenta va a suponer un gran desarrollo de la evaluación
psicológica, dentro del auge que estaba cobrando la psicología en general. La dota-
ción de cátedras de psicodiagnóstico va a consolidar la enseñanza e investigación de
la disciplina, que serán ocupadas por María Eugenia Romano (fallecida en 1987),
Rocío Fernández-Ballesteros, Fernando Silva y Alfonso Blanco (Ávila y cols.,
1994). La preocupación por mejorar la evaluación psicológica ha sido constante en
España, lo cual conduce, por iniciativa del Departamento de Diagnóstico Psicológi-
co y Medida de la Universidad Autónoma de Madrid, a la celebración en 1981 de la
I Reunión Nacional de Profesores de evaluación psicológica, a la que asistieron
treinta profesores titulares de esta materia de diez universidades españolas. El objeti-
vo principal era tratar sobre el concepto, contenidos y métodos de enseñanza del
psicodiagnóstico, con el propósito de actualizar los programas de estudio y mejorar
la formación de los futuros psicólogos. En nuestra opinión, esta reunión tiene una
especial importancia, puesto que es la primera vez que se plantea una reflexión con-
junta sobre el psicodiagnóstico que se enseña en España, al mismo tiempo que se
compara con programas docentes de diversas universidades extranjeras. Una prime-
ra conclusión, quizás algo sorprendente, fue que aunque había cierta coincidencia en
los contenidos que se impartían en España y en diversos países, el término “psico-
diagnóstico” era poco frecuente en los planes de estudio de psicología de las univer-
sidades extranjeras. Según esto, y teniendo en cuenta las posibles connotaciones
“médicas” del término “psicodiagnóstico”, se optó por sustituirlo por el de evalua-
ción psicológica —lo que asumimos plenamente. Sin embargo, este cambio se limitó
al uso del término en las publicaciones y en la comunicación entre los profesionales,
puesto que, a nivel académico oficial, se ha mantenido hasta principios de la década
de los años noventa. Otra conclusión importante fue la consideración del psicodiag-
nóstico desde una perspectiva científica, definiéndolo como:
el proceso de análisis científico que, partiendo de múltiples datos (biológicos, evolutivos, pa-
tológicos, sociológicos), y a través de la descripción, comprensión y, en su caso, explicación
de la conducta de un sujeto o grupo humano, tiene como objetivo la intervención, en térmi-
nos de orientación, selección, predicción y modificación.
En palabras de Fernández-Ballesteros (1993, p.14) «tal evento no sólo alimentó

el quehacer profesional y académico de los participantes, sino que sirvió como semi-
lla para estrechar lazos afectivos entre los implicados, que con una clara vocación
científica, académica y profesional se embarcarían en nuevas aventuras de intercam-
bio y difusión científica». A lo largo de esta década de los años ochenta tuvieron lu-
gar otras dos reuniones de profesores de evaluación psicológica.
En 1984 se produce otro acontecimiento importante que contribuye al desarro-
llo de la evaluación psicológica en España. Nos referimos al 1 Congreso de Evalua-
ción Psicológica, organizado por iniciativa del Departamento de Diagnóstico Psico-
lógico y Medida de la Universidad Autónoma de Madrid, en colaboración con la
Sociedad Española de Psicología, el Departamento de Psicodiagnóstico de la Uni-
versidad Complutense y el Departamento de Personalidad y Anormalidad de la
Universidad de Valencia. En este congreso, con 400 asistentes, se presentaron 197
trabajos distribuidos en cuatro secciones: psicología clínica, psicología educativa,
psicología de las organizaciones y ambientes sociales. Este evento, además de estre-
char lazos, sirvió de impulso para la creación en 1985 de la Sociedad Española de

Evaluación Psicológica (SEEP) y la edición de la revista Evalmación Psicológica/Ps)-
chological Assessment por los profesores Rocío Fernández-Ballesteros y Fernando
Silva. En este mismo año 1985, en el Pazo de Mariñán de La Coruña, se celebra en
1985 la TIT Reunión de Profesores de Evaluación Psicológica. La SEEP se crea con los
siguientes fines:
a. Fomentar el interés y el estudio científico de la evaluación psicológica en sus

diversos ámbitos.
. Velar por el rigor del estudio científico del comportamiento humano.
c. Velar por la calidad científica y profesional de las actividades en el campo de
la evaluación psicológica.
d. Velar por el respeto y cumplimiento de las normas deontológicas en la inves-
tigación científica dentro del campo de la evaluación psicológica.
La SEEP será la entidad organizadora de las siguientes reuniones de profesores,

así como del II y III Congreso de Evaluación Psicológica. En el II Congreso de Eva-
luación Psicológica celebrado en Madrid en 1987 con cerca de 400 asistentes se pre-
sentaron 260 trabajos distribuidos en seis áreas: psicología de la salud, psicología
educativa, psicología de las organizaciones, psicología ambiental, personalidad y
metodología. La IV Reunión de Profesores de Evaluación Psicológica celebrada en
Madrid en 1990 tuvo como tema central «La evaluación psicológica en Europa: en-
señanza, investigación y práctica», a la cual fueron invitados especialistas de diversos
países europeos. Los cambios sociopolíticos experimentados en Europa junto a la
integración de España en la Comunidad Europea planteaban nuevos retos. La libre
circulación de ciudadanos comunitarios provocará un intercambio científico entre
profesionales, además de la realización de evaluaciones psicológicas con una tecno-
logía adaptada transculturalmente, surgiendo por tanto nuevas necesidades de inves-
tigación, formación y reciclaje de profesionales y académicos (Fernández-Balleste-
ros, 1993). Entre las conclusiones de dicha reunión destaca el intento por mejorar la
enseñanza y el entrenamiento en evaluación psicológica, así como por coordinar los
avances en esta disciplina entre los países europeos. Un primer paso para alcanzar
este objetivo fue la transformación en 1990 de la Sociedad Española de Evaluación
Psicológica en la European Association of Psychological Assessment (EAPA), cuyo
comité ejecutivo estaba formado por R. Fernández-Ballesteros (España) como Pre-
sidente, B. de Raad (Holanda), M. Forns (España), J. Ferreira-Márquez (Portugal),
H. Bombholt (Dinamarca), G. H. Fischer (Austria), E. Silva (España) y H. Westmeyer
(Alemania). La EAPA intenta cubrir una serie de tópicos tales como el proceso diag-
nóstico, la evaluación de la personalidad, la inteligencia, la conducta, la neuropsico-
logía y la psicofisiología, así como la aplicación de la evaluación a diferentes áreas, ta-
les como clínica y salud, educación, trabajo e investigación. Entre sus objetivos
están:
a. El incremento del interés científico de la evaluación psicológica en Europa.

b. La mejora del estudio de la evaluación psicológica en Europa.
c. Posibilitar los intercambios entre científicos europeos.
d. Intensificar los intercambios en evaluación psicológica entre académicos

europeos y de otras partes del mundo.
e. Mantener intercambios entre la EAPA y otras asociaciones internacionales.
La primera reunión científica organizada por la EAPA (la First European Confe-
rence on Psychological Assessment) tuvo lugar en Barcelona en el año 1991; en 1992
se transforma la revista Evaluación Psicológica/Psychological Assessment en el Enro-
pean Journal of Psychological Assessment, convirtiéndose en el órgano de difusión
oficial de la EAPA. El último evento organizado por la Sociedad Española de Evalua-
ción Psicológica fue el LIL Congreso de Evaluación Psicológica celebrado en Barce-
lona en el año 1991, presentándose 290 trabajos distribuidos en ocho áreas diferen-
tes: psicología clínica y salud, psicología del trabajo y las organizaciones, psicología
educativa, psicología ambiental, psicofisiología y neuropsicología, psicología de la
personalidad, servicios sociales, y psicología del deporte y seguridad vial. En el
IV Congreso de Evaluación Psicológica?, celebrado en Santiago de Compostela en
1994 se presentaron 322 trabajos repartidos en ocho áreas: psicología clínica, psico-
logía educativa, neuropsicología y psicofisiología, organizaciones, personalidad, psi-
cología de la salud, psicología del trabajo y valoración de programas. A lo largo de
estos cuatro congresos nacionales de evaluación psicológica podemos apreciar un
incremento en el número de trabajos presentados; sin embargo, a nuestro entender,
este aumento no es paralelo al gran desarrollo experimentado por la psicología espa-
ñola durante la última década, esperándose un incremento mucho mayor en el nú-
mero de trabajos; téngase en cuenta que se pasó de 197 en 1984 a 322 en 1994. Por
otro lado, se produjo una mayor especialización de los mismos dando lugar a áreas
temáticas más concretas, lo cual está en la dirección que ha tomado la evaluación psi-
cológica en todo el mundo; así, de las cuatro áreas presentes en el primer congreso se
pasó a ocho en el último. Nos hemos detenido con cierto detalle en las reuniones de
profesores y los congresos de evaluación psicológica porque en nuestra opinión am-
bos hechos son fundamentales para comprender la actual evaluación psicológica es-
pañola. Estos encuentros posibilitaron el contacto casi continuo de los psicólogos
relacionados con la evaluación psicológica, lo cual puede explicar en cierta medida la
relativa unificación de criterios que existe en esta disciplina en España.
Otras tres reuniones destacadas que tuvieron lugar en España en los últimos
años y que supusieron un respaldo importante a la evaluación psicológica fueron el
Il Congreso del Colegio Oficial de Psicólogos celebrado en Valencia en 1990, el
Congreso Iberoamericano de Psicología celebrado en Madrid en 1992 y el 23nd In-
ternational Congress of Applied Psychology celebrado también en Madrid en 1994.
El 27,20% de los trabajos presentados en el II Congreso del Colegio Oficial de Psi-
cólogos era de evaluación psicológica, lo cual indica que esta disciplina constituye
una parcela importante de la psicología en general. Las áreas generales que contaron
con más contribuciones de evaluación psicológica fueron la de psicología del trabajo
(38%), servicios sociales (27%) y psicología escolar (20,90%);pero además, se pre-
sentaron trabajos de evaluación psicológica en áreas tan específicas como Fuerzas
2 Este congreso ya fue organizado por la European Association of Psychological Assessment

(EAPA).
Armadas (18,90%),seguridad vial (14,80%), psicología jurídica (13,80%) y psicolo-

gía del deporte (3,20%). Ya dentro del porcentaje global de trabajosde evaluación
psicológica (recordemos el 27,20%) destacan en primer lugar los relacionados con la
clínica (ansiedad, depresión, estrés, etc.), en segundo lugar, los relacionados con
orientación, selección y peritajes y, en tercer lugar, la evaluación de programas o tra-
tamientos (Fernández-Ballesteros, 1991).
En 1992 se celebra en Madrid el Congreso Iberoamericano de Psicología que su-
pone un encuentro de toda la psicología de habla hispana y portuguesa; en esta reu-
nión, la evaluación psicológica tiene un papel importante, presentándose cerca de
200 trabajos sobre esta materia (un 13,48% del total de contribuciones al congreso);
en función de su temática, la mayor parte de estos trabajos estaba distribuida en psi-
cología clínica y de la salud (26,80%), aspectos conceptuales y metodológicos
(17,01%), psicología escolar (13,40%), psicofisiología/neuropsicología (12,37%) y
psicología de la personalidad (11,34%); sin embargo, la evaluación psicológica tam-
bién estaba representada en áreas muy concretas y de gran actualidad como la eva-
luación de programas (3,61%), psicología del deporte y seguridad vial (2,58%) y psi-
cología jurídica (2,06%).
Pero sin lugar a dudas, el congreso de psicología más importante celebrado en
España hasta la fecha fue el 23nd International Congress of Applied Psychology
realizado en Madrid en el año 1994. En este congreso se presentaron más de 2 500
trabajos, de los cuales el 16,45% fue de evaluación psicológica, lo cual, considerando
el carácter general del congreso, confirma la importancia que tiene esta disciplina
dentro de la psicología aplicada. Por otro lado, teniendo en cuenta que muchos de
los trabajos presentados eran de autores españoles, podemos afirmar que la evalua-
ción psicológica en España se caracteriza por una intensa actividad. Las áreas temáti-
cas más representadas fueron los aspectos conceptuales y metodológicos (33,33%),
lo cual indica una preocupación por perfeccionar las bases conceptuales y sobre
todo los instrumentos de evaluación; psicología clínica y de la salud (16,43%), psico-
logía del trabajo y de las organizaciones (13,85%) y psicología de la personalidad
(12,91%). Nuevamente en este congreso la evaluación psicológica tuvo cabida en la
evaluación de programas (4,46%),psicología del tráfico y seguridad vial (3,29%),
psicología del deporte (1,41%), psicología jurídica (1,41%) y psicología ambiental
(1,17%).
Otra forma de conocer la situación actual de la evaluación psicológica en España
es analizar las publicaciones periódicas; de este modo podemos descubrir los temas
sobre los que se ha venido investigando en los últimos años en nuestro país. Fernán-
dez-Ballesteros (1991) realizó un análisis de la revista Evaluación Psicológica/Psy-
chological Assessment desde el año 1985 a 1989, concluyendo que la mayor parte de
los trabajos publicados en esta revista especializada se dedica a la evaluación de la per-
sonalidad (14,70%), evaluación de la inteligencia (14,70%), tecnología básica —en-
trevistas, observación, etc.— (10,70%) y cuestiones metodológicas (9,40%), lo cual
está en la línea de otras publicaciones periódicas internacionales. Con el objetivo de
analizar la situación de la evaluación psicológica en España en los últimos años, Sie-
rra y Buela-Casal (1996) realizaron una revisión de los trabajos publicados en las dos
revistas con más arraigo en la psicología española (Revista de Psicología General y
Aplicada y Análisis y Modificación de Conducta), encontrando que en ambas tiene
cabida la evaluación psicológica; así, entre 1991 y 1995, el 22,16% delos trabajos pu-
blicados en la Revista de Psicología General y Aplicada y el 58,66% de los publica-
dos en Análisis yModificación de Conducta están dedicados a la evaluación psicoló-
gica, estando centrados la mayoría de ellos en el desarrollo de metodología y
tecnología de evaluación, evaluación psicofisiológica, evaluación de la personalidad
y evaluación en psicología clínica y de la salud. La consolidación y el gran desarrollo
experimentado por la evaluación psicológica en España durante los últimos años
también se pone de manifiesto en el alto número de libros publicados sobre esta ma-
teria desde finales de la década de los años setenta, y especialmente en la última déca-
da. El anexo 1 recoge una relación de libros que abarcan total o parcialmente la ma-
teria de evaluación psicológica escritos o compilados por autores españoles, a los
que habría que añadir otros muchos dedicados a aspectos más específicos, así como
las traducciones de libros extranjeros.
Por último, un análisis de las tareas realizadas por los psicólogos españoles en
ejercicio nos puede proporcionar información sobre la situación actual de la evalua-
ción psicológica en España. Para ello, nos vamos a centrar en el estudio de Díaz y
Quintanilla (1992) del cual extraemos los datos referidos a la evaluación psicológica.
En el estudio realizado por estos autores con una muestra representativa de los psi-
cólogos colegiados españoles, se concluye que el 48% de las tareas realizadas por los
psicólogos españoles está relacionado total o parcialmente con la evaluación psicoló-
gica; así, dentro de las diez principales actividades realizadas, cinco de ellas implican
tareas de evaluación, lo que indica la importancia de esta actividad dentro de la psi-
cología aplicada. Tengamos en cuenta ahora las diferentes áreas de intervención. Así,
dentro de la psicología clínica y de la salud, el 46,10% de las tareas realizadas está re-
lacionado con la evaluación, destacando el diagnóstico de pacientes (45,20%), reali-
zación de entrevistas de diagnóstico clínico (45%) y el diagnóstico del problema del
paciente y posterior remisión a otros profesionales (38,40%). En el área de la psico-
logía educativa encontramos que el 60% de las tareas realizadas por los psicólogos
colegiados en ejercicio está relacionado con la evaluación psicológica; entre estas ta-
reas destacan el diagnóstico y tratamiento de las dificultades de aprendizaje
(39,60%), el diagnóstico y tratamiento de problemas escolares (38,90%), elabora-
ción de informes de diagnóstico de niños (34,60%) y elaboración de informes sobre
niños evaluados y tratados (34,40%). En cuanto al área de la psicología del trabajo y
de las organizaciones, el 80% de las tareas corresponde a evaluación psicológica,
destacando la participación en procesos de selección como evaluador en alguna de
las fases (18,50%), realización de entrevistas de selección de personal con los candi-
datos al puesto (17,80%) y administración de pruebas de evaluación para la selección
de personal (17,60%). Por último, cabe destacar dentro del área de los servicios so-
ciales la evaluación de los resultados de un programa de intervención en servicios
sociales que supone un 6,60% de las tareas realizadas dentro de esta área, que aunque
es un porcentaje bajo supone la apertura de la evaluación psicológica a otras áreas.
En resumen, según estos datos la evaluación psicológica está presente en todos los
contextos de la psicología aplicada de igual forma o incluso en mayor medida que
Otras tareas.
La evaluación psicológica como uno de los trabajos más importantes que realiza
el psicólogo se pone de manifiesto también entre la “gente de la calle”. Así, en la en-
cuesta realizada por Berenguer y Quintanilla (1994) entre la población española se

señala que entre las tareas realizadas por el psicólogo destacan el diagnóstico de pro-
blemas emocionales (87,10%), pasar tests (85,30%), hacer entrevistas para orienta-
ción vocacional (73,20%) y la evaluación de conductores (43,60%).
En definitiva, la evaluación psicológica ha experimentado un gran desarrollo en
España en los últimos años. El gran número de publicaciones monográficas, artícu-
los en revistas especializadas, trabajos presentados tanto a congresos específicos de
evaluación psicológica como a congresos generales y su importante presencia en las
tareas realizadas por los psicólogos españoles, así lo confirman. Sin duda, el futuro
que nos espera es prometedor.
El anexo 2 muestra una relación de los acontecimientos más relevantes relacio-
nados con el desarrollo de la evaluación psicológica en España en el siglo XX.

Aguilar.
aan M., Cañas, A. y Campos, J. (1990). Hemeroteca. Papeles del Psicólogo, 46/47, 79.
Alvarez, M., Cañas, A. y Campos,J.(1991). Las revistas de estudiantes. Papeles del Psicólogo,
48,77.
Álvarez-Castro, S., Buela-Casal, G. y Sierra, J. C. (1994). Situación actual del modelo con-
ductual en España. Psicología Contemporánea, 1, 80-91.
Ardila, R. (1986). La psicología en América Latina. Pasado, presente y futuro. México. Siglo
XXL
Ávila, A. (1989). La psicología clínica en España: perspectiva de una década. Papeles del Psi-
_ cólogo, 36/37, 84-89.
Avila, A., Blanco, A., Calonge, L, Forns, M., Oliva, M., Martorell, M. C., Rodríguez, C., Sil-
va, F. y Torres, M. (1994). El diagnóstico y la evaluación psicológica en España: revisión y
perspectivas. ClínicaySalud, 5, 83-120.
Ballús, C. (1994). El laboratorio de psicofisiología. Anuario de Psicología, 63, 53-57.
Bayés, R. (1983). Enseñanza y ejercicio profesional del análisis de conducta en España. Revis-
ta de Psicología General y Aplicada, 38, 233-245.
Berenguer, G. y Quintanilla, 1. (1994). La imagen de la psicología y los psicólogos en el esta-
do español. Papeles del Psicólogo, 58, 41-68.
Blanco, F. y Rosa, A. (1991). J. V. Viqueira y la psicología española de principios del siglo XX.
Revista de Psicología General y Aplicada, 44, 127-136.
Buela-Casal, G., Caballo, V. E., Bornas, X., Tortella, M. y Servera, M. (1993). Pasado y pre-
sente de la psicología clínica conductual en España. Psicología Conductual, 1,7-34.
Camarero, C. y Ferrezuelo, P. (1988). El rol del psicólogo de la salud (estudio de los datos de
una encuesta). Papeles del Psicólogo, 33/34, 19-34.
Campos,J. yAguado, L. (1977). La investigación psicológica en España. Cuadernos de Psico-
logía, 3, 16-27.
Carpintero, H. (19894). La evolución del psicodiagnóstico en España. Evaluación Psicológi-
ca/Psychological Assessment, 5, 3-21.
Lvolución histórica de la evaluación psicológica en España 65
Carpintero, H. (1989b). El psicólogo en España. Notas históricas sobre su desarrollo profe-

sional. Papeles del Psicólogo, 36/37, 68-73.
Carpintero, H. (1994). Historia de la psicología en España. Madrid. Eudema.
Del Barrio,M.y Carpintero, H. (1985). Los comienzos de la psicología educativa en España:
la tradición krausista. Revista de Historia de la Psicología, 6, 133-143.
Díaz, R. y Quintanilla, I. (1992). La identidad profesional del psicólogo en el Estado español.
Papeles del Psicólogo, 52, 22-74.
Fernández-Ballesteros, R. (1991). Enseñanza, investigación y práctica de la evaluación psico-
lógica en España. Evaluación Psicológica/Psychological Assessment, 7, 5-21.
Fernández-Ballesteros, R. (1993). Presentación. En M. Forns y M. T. Anguera (dirs.), Apor-
taciones recientes a la evaluación psicológica. Barcelona. PPU.
Ferrándiz, A. y Carpintero, H. (1983). La aportación psicológica de Marañón. Revista de
Historia de la Psicología, 4, 347-375.
García, E., Herrero, F. y Carpintero, H. (1993). La tesis doctoral de Emilio Mira y López:
«Las correlaciones somáticas del trabajo mental» (1922). Revista de Historia de la Psicolo-
gía, 14, 139-152.
Kirchner, M. (1979). Historia de la psicología aplicada en Barcelona (1916-1936). Anuario de
Lafuente, E. (1980). Sobre los orígenes de la psicología científica en España. El papel del mo-
vimiento krausista. Estudios de Psicología, 1, 139-147.
Miralles, J. (1985). Aproximación bibliométrica a la obra psicológica de Emilio Mira y López:
bases para su interpretación. Revista de Historia de la Psicología, 6, 79-96.
Mora, J. A. (1992). El Dr. José Germain: hitos principales de su biografía (1897-1986). Revis-
ta de Historia de la Psicología, 13, 321-328.
Muñiz, J. (1994). Una obra diversa y unitaria. Papeles del Psicólogo, 60, 23-26.
Pelechano, V. (1976). Psicodiagnóstico. Madrid. UNED.
Valencia. Alfaplús.
Pérez-Álvarez, M. (1985). Moda, mito e ideología de la psicología cognitiva. Papeles del Co-
legio. Psicólogos, 20, 45-52.
Pérez-Álvarez, M. (1991). Prehistoria de la modificación de conducta en la cultura española.
En V. E. Caballo (dir.), Manual de técnicas de terapia y modificación de conducta. Madrid.
Siglo XXI.
Rodríguez, S. (1981). Esquema para una historia de la psicología en España. Revista de Psico-
logía General y Aplicada, 36, 881-901.
Salas,J.(1944). El psicodiagnóstico de Rorschach. Madrid. Morata.
Sáiz, M. y Sáiz, D. (1992). Emilio Mira i López pionero de la psicología aplicada en España e
Iberoamérica. Revista de Historia de la Psicología, 13, 93-100.
Sarason, J. G. (1965). Myokinetic pyschodiagnosis (MKP). En O. K. Buros (dir.), The sixth
mental measurements yearbook. Nueva York. Gryphon Press.
Serrate, A. (1980). Ayer y hoy de las técnicas proyectivas en España. Técnicas Proyectivas, 1,
3-11.
Sierra, J. C. y Buela-Casal, G. (1996). La actual evaluación psicológica reflejada en algunas
publicaciones de carácter general. Comunicación presentada en la IV Conferéncia Inter-
nacional Avaliacao Psicológica: Formas e Contextos. Braga (Portugal).
Siguán, M. (1981). Piaget en Cataluña. Anuario de Psicología, 25, 5-15.
Tranque, F. (1942). El estudio de la personalidad por el psicodiagnóstico de Rorschach. Ma-
drid. CSIC.
Wechsler, D. (1965). Myokinetic pyschodiagnosis (MKP). En O. K. Buros (dir.), The sixth
mental measurements yearbook. Nueva York. Gryphon Press.
Y ela, M. (1982). Esbozo de autobiografía. Revista de Historia de la Psicología, 3, 281-332.
Y ela, M. (1987). José A. Germain. Papeles del Colegio. Psicólogos, 28/29, 59-60.
Yela, M. (1994). La enseñanza de la psicología en España. Breve apunte histórico y situación

actual. Papeles del Psicólogo, 60, 39-48.
Ávila, A., Blanco, A., Calonge, 1., Forns, M., Oliva, M., Martorell, M. C., Rodríguez, C., Sil-
va, F. y Torres, M. (1994). El diagnóstico y la evaluación psicológica en España: revisión y
perspectivas. Clínica y Salud, 5, 83-120.
Buela-Casal, G., Caballo, V. E., Bornas, X., Tortella, M. y Servera, M. (1993). Pasado y pre-
sente de la psicología clínica conductual en España. Psicología Conductual, 1, 7-34.
Carpintero, H. (1994). Historia de la psicología en España. Madrid. Eudema.
Fernández-Ballesteros, R. (1991). Enseñanza, investigación y práctica de la evaluación psico-
lógica en España. Evaluación Psicológica/Psychological Assessment, 7, 5-21.
ANEXO 1. PUBLICACIONES MAS IMPORTANTES DE AUTORES ESPAÑOLES
EN EVALUACION PSICOLOGICA.
Año Título Autor/es

1914 Diagnóstico de niños anormales González
1917 Los niños mentalmente anormales Rodríguez Lafora
1917 Los métodos del examen de la inteligencia Viqueira
1926 Introducción a la psicología pedagógica Viqueira
1930 Pruebas de inteligencia. Revisión española
y adaptación práctica del método de L. M. Terman Germain y Rodrigo
1942 El estudio de la personalidad por el test
psicodiagnóstico de Rorschach Tranque
1943 Determinación de la edad mental Juarros
1944 El psicodiagnóstico del Rorschach Salas
1947 Orientación profesional Mira
1952 Las pruebas proyectivas y el conocimiento de la
personalidad individual Siguán
1956 Psicología de las aptitudes Yela
1957 La técnicas del análisis factorial, un nuevo método
de investigación en psicología y pedagogía ela
1966 Constitución y personalidad Pinillos, López Piñero y García
Ballester
1972 Psicodiagnóstico clínico Álvarez Villar
1976 Psicodiagnóstico Pelechano
1978 Introducción a la teoría de los tests psicológicos Yela
1979 Los métodos en evaluación conductual Fernández-Ballesteros
1980 Psicodiagnóstico. Concepto y metodología Fernández-Ballesteros
Psicodiagnóstico y estadística Forns, Buira y Doménech
Apuntes de psicodiagnóstico Pelechano
1981 Nuevas aportaciones a la evaluación conductual Fernández-Ballesteros
Evaluación conductual Fernández-Ballesteros
y Carrobles
1982 Introducción al psicodiagnóstico Silva
1983 Psicodiagnóstico Fernández-Ballesteros
1984 Psicodiagnóstico, teoría y aplicaciones Silva
1986 Apuntes de psicodiagnóstico Blanco
1987 Psicodiagnóstico clínico Avila y Rodríguez
Apuntes de diagnóstico clínico Blanco
1988 Técnicas de evaluación psicológica Martorell
Del psicodiagnóstico clásico al análisis ecopsicológico Pelechano
1989 Evaluación conductual y criterios psicométricos Silva
1990 Lecturas de psicodiagnóstico Jiménez y De Diego
1992 Evaluación en psicología clínica [: proceso, método
y estrategias psicométricas Avila
Introducción a la evaluación psicológica Fernández-Ballesteros
1993 Aportaciones recientes a la evaluación psicológica Forns y Angera

Evaluación psicológica. Concepto y técnicas de
análisis Peñate, Matud e Ibáñez
1994 Evaluación conductual hoy. Un enfoque para el
cambio en psicología clínica y de la salud Fernández-Ballesteros
1995 Evaluación de programas. Una guía práctica en
ámbitos sociales, educativos y de salud Fernández-Ballesteros
Evaluación en psicología clínica y de la salud Roa
Evaluación psicológica en niños y adolescentes Silva
1996 Manual de evaluación en psicología clínica y de la
salud Buela-Casal, Caballo y Sierra
ANEXO 2... ACONTECIMIENTOS MAS RELEVANTES RELACIONADOS CON
EL DESARROLLO DE LA EVALUACION PSICOLOGICA EN ESPA-
NA EN EL SIGLO XX
Año Acontecimiento
1914 Creación en Barcelona del Secretariat d'Aprenentatge de la Mancomunidad

1917 El Secretariat d'Aprenentatge de la Mancomunidad se transforma en el Institut
d'Orientació Profesional
Viqueira presenta en el Congreso de la Asociación para el Progreso de las Ciencias el
trabajo «Qué es una medida mental, ¿es posible una psicología cuantitativa?»
1918 Creación de un laboratorio de psicometría en el Institut d'Orientació Profesional
1919 Emilio Mira es nombrado director del laboratorio de psicometría en el Institut
d'Orientació Profesional
1921 Celebración en Barcelona de la II Conferencia Internacional de Psicología Aplicada
1922 Comienza la publicación de la Revista de Pedagogía
1924 Creación en Madrid del Instituto de Reeducación Profesional de Inválidos del Traba-
Jo, a partir de cuya sección de Orientación Profesional surge el posterior Instituto Psi-
cotécnico
1925 Sacristán presenta los primeros trabajos españoles sobre el test del Rorschach
1928 Creación en Madrid del Instituto de Psicología Aplicada
1930 Celebración en Barcelona de la VI Conferencia Internacional de Psicología Aplicada
presidida por Emilio Mira, en la cual se incluyen varias ponencias sobre evaluación
psicológica
1931 Creación del Institut Psicotécnic de la Generalitat de Catalunya dirigido por Emilio
Mira hasta 1939
1933 Emilio Mira y Joaquín Xirau fundan la Revista de Psicología 1 Pedagogía
1959 Emilio Mira publica en el exilio el Test miokinético
Fundación de la revista Psicotecniía por José Mallart
1946 Fundación de la Revista de Psicología General y Aplicada por José Germain
1948 Creación del Departamento de Psicología Experimental del Consejo Superior de In-
vestigaciones Científicas que será organizado por José Germain
1932 Fundación de la Sociedad Española de Psicología bajo la iniciativa de José Germain
1953 Creación de la Escuela de Psicología y Psicotecnia de la Universidad de Madrid, pri-
mera formalización de la enseñanza universitaria de la psicología en España, en cuyo
plan de estudios se incluye elpsicodiagnóstico
1957 Mariano Y ela es nombrado catedrático de Psicología Experimental
1963 Celebración en Madrid del lCongreso Nacional de Psicología
1964 Creación de la Escuela de Psicología de la Universidad de Barcelona y de la Escuela de
Psicología Clínica en la Facultad de Medicina de la misma universidad
1968 Creación de las secciones de Psicología en las facultades de Filosofía y Letras de las
Universidades de Madrid y Barcelona, incluyendo la asignatura de psicodiagnóstico,
de las que salen los primeros licenciados en psicología
1969 Aparición de la revista Anuario de Psicología fundada por Miguel Siguán
1971 Celebración en Zaragoza del 1Congreso Internacional del Rorschach y Métodos Pro-
yectivos
1972 Creación de la Sociedad Española del Rorschach y Métodos Proyectivos
Celebración de la XVI Reunión Anual de la Sociedad Española de Psicología dedicada

al tema «Sentido y límites de la prospección y medidas psicológicas»
1975 Fundación de la revista Análisis y Modificación de Conducta por Vicente Pelechano
Celebración en Palma de Mallorca del 5th Meeting of the European Association for
Behaviour Therapy que supone la entrada de la evaluación conductual en España
1979 Creación del Colegio Oficial de Psicólogos q
1980 Dotación de cátedras de psicodiagnóstico ocupadas por María Eugenia Romano, Ro-
cío Fernández-Ballesteros, Fernando Silva y Alfonso Blanco
1981 Celebración en Alicante del Congreso Internacional sobre Psicología y Procesos de
Socialización, en el que se dedicó una sección a la evaluación conductual
Celebración en Madrid de la 1 Reunión Nacional de Profesores de Evaluación Psico-
lógica
1982 ames en Madrid de la II Reunión Nacional de Profesores de Evaluación Psico-
lógica
1984 dd en Madrid del 1 Congreso del Colegio Oficial de Psicólogos
Celebración en Madrid del 1Congreso de Evaluación Psicológica
1985 Celebración en La Coruña de la III Reunión Nacional de Profesores de evaluación
psicológica
Edición de la revista Evaluación Psicológica/Psychological Assessment por Rocío Fer-
nández-Ballesteros y Fernando Silva
1986 Fundación de la Sociedad Española de Evaluación Psicológica
1987 Celebración en Madrid del II Congreso de Evaluación Psicológica
1990 Celebración en Valencia del II Congreso del Colegio Oficial de Psicólogos en el que
se dedica un área a la evaluación psicológica
Celebración en Madrid de la IV Reunión Nacional de Profesores de Evaluación Psi-
cológica
Transformación de la Sociedad Española de Psicología en la European Association of
Psychological Assessment
Publicación del Real Decreto 1428/1990 (BOE, 20-11-1990) en el que se establecen las
directrices para los nuevos planes de estudio de psicología, en los que se incluye la eva-
luación psicológica como una de las materias troncales
IS Celebración en Jaén del 1Symposium Nacional de Psicología Conductual
Celebración en Barcelona de la First European Conference on Psychological Assess-
ment
Celebración en Barcelona del III Congreso de Evaluación Psicológica
1992 Transformación de la revista Evaluación Psicológica/Psychological Assessment en el
European Journal of Psychological Assessment
1992 Celebración en Madrid del Congreso Iberoamericano de Psicología, el cual incluye
una sección de evaluación psicológica
1993 Celebración en Palma de Mallorca del II Congreso Nacional de Psicología Conduc-
tual con varios simposia sobre evaluación conductual
Edición de la revista Psicología Conductual por Vicente E. Caballo y Gualberto Bue-
la-Casal, entre cuyos objetivos se encuentran la evaluación conductual y la evaluación
cognitiva
1994 Celebración en Madrid del 23nd International Congress of Applied Psychology que
cuenta con una sección de evaluación psicológica
Celebración en Santiago de Compostela del IV Congreso de Evaluación Psicológica
1995 Celebración en Granada del II Congreso Internacional y III Nacional de Psicología
Conductual con varios simposia sobre evaluación conductual
1997 Celebración en Granada del III Congreso Internacional y IV Nacional de Psicología
Conductual con varios simposia sobre evaluación conductual
3. CONCEPTO DE EVALUACIÓN PSICOLÓGICA
GUALBERTO BUELA-CASAL y J. CARLOS SIERRA
Il. INTRODUCCIÓN
Abordar la definición de un término siempre suele ser una tarea compleja, máxime
cuando el término no se refiere a un significado concreto, como es el caso que nos
ocupa, puesto que se trata de un tipo de conocimiento para el que se utilizan algunos
nombres procedentes de la traducción de términos de otro idioma. Por otra parte,
nos encontramos con expresiones afines, en cierta medida, como tests psicológicos,
psicodiagnóstico, evaluación psicológica, evaluación conductual, valoración, medi-
da psicológica, examen psicológico, etc., lo cual incrementa aún más la dificultad del
análisis semántico y conceptual. A continuación intentaremos delimitar el significa-
do de cada uno de estos términos, pero previamente nos centraremos en analizar qué
es una definición, los distintos tipos de definición y las reglas que se deben seguir
para formular una definición válida y eficaz. Por otro lado, dado que la evaluación
psicológica se desarrolla especialmente dentro de una psicología aplicada se tratará
de hacer una aproximación a su concepto a través de sus actividades: trabajos cientí-
ficos presentados a congresos o publicados y tareas realizadas por los psicólogos en
evaluación psicológica.
II. LA DEFINICIÓN: TIPOS Y REGLAS

11. Importancia de la definición
El empleo de definiciones no es algo ajeno al método científico, puesto que ayuda a
precisar y delimitar el conjunto de contenidos que constituyen el cuerpo científico
de una disciplina. Además, el hecho de que no se formulen definiciones no implica
que éstas no estén presentes de forma implícita o supuesta, con el consiguiente peli-
gro que esto supone para la claridad y objetividad de la ciencia. Por otra parte, el tipo
de definición que se utilice es de suma importancia, ya que las definiciones, aligual
que las demás formulaciones científicas, deben responder al propósito de la ciencia
de describir la realidad o de garantizar la consistencia del sistema, según se trate de
una ciencia empírica o formal. No todas las definiciones son igual de completas, por
ello tampoco resulta indiferente la definición que se utilice. Muchas de las contro-
versias científicas han sido discusiones sobre definiciones, lo que resulta de gran ut.-
lidad para la disciplina científica en cuestión, ya que en buena parte la investigación
científica está delimitada por la definición del campo de estudio. Disponerdeuna

definición precisa y aceptada por la mayoría de los especialistas de una materia es un
índice del desarrollo científico alcanzado.
De acuerdo con Martínez Freire (1981) se podría decir que definir algo es expli-
carlo, es decir, presentarlode forma que resulte comprensible. Dicha explicación
puede hacerse de diversas maneras. Así, la forma más simple de definir algoesmos-
trarlo; a este tipo de definición se le denomina ostensiva. Otro modo de definir algo
es recurrir al lenguaje, necesario cuando se trata de definir una realidad abstracta (tal
como, por ejemplo, el objeto de este capítulo); entonces tenemos un tipo general de
definición llamada definición lingúística. Ésta consiste en un enunciado que explica
y delimita un signo o una realidad. Dicho enunciado consta de tres elementos: el de-
finiendum o definitum, que es el signo que se define; el definiens, que es el conjunto
de signos lingiñísticos que explican y delimitan el definitum; y la cópula definitoria,
que es la expresión es o la expresión quiere decir, o alguna equivalente. Para que una
definición lingúística resulte útil es necesario que las palabras que se utilicen sean fa-
miliares y bien conocidas por el colectivo que hará uso de la definición. Esto que a
primera vista parece una trivialidad, es algo de gran importancia, pues un término
puede ser familiar y bien conocido por un grupo de usuarios, extraño y confuso para
otros, e incluso desconocido para algunos, tal es el caso del término “paradigma”.
En resumen, una definición consiste en una explicación y delimitación del objeto
de la definición (un signo o una realidad). La explicación definitoria procede acotan-
do lo que se define hasta que queda claro y bien delimitado. La etimología de esta
palabra indica su procedencia del verbo definire, que incluye la expresión finis que
significa límite.
112. Tipos de definición

La pregunta por la definición de algo puede plantearse de dos formas distintas, que
dan origen a dos tipos generales de definición: definición de signo (nominal) y defi-
nición de cosa (realidad). No es lo mismo preguntar ¿qué quiere decir evaluación
psicológica? o ¿qué es evaluación psicológica? Estas preguntas representan una dis-
tinción lógica entre mención y uso de un signo. En la primera se menciona “evalua-
ción psicológica” atendiendo al signo en sí mismo, o sea, se interroga sobre el signifi-
cado del término (signo). En la segunda pregunta se usa el signo “evaluación
psicológica” atendiendo a lo que denomina, o sea, se interroga sobre el concepto.
Aunque frecuentemente suele considerarse que significado y concepto son lo mis-
mo, lo cierto es que son distintos, tienen funciones distintas y se refieren a entidades
distintas. El significado hace alusión al signo (por ejemplo, al término “evaluación
psicológica”); significado es aquello que es representado por un signo. La relación
entre signo y significado es arbitraria, es decir, es convencional que un signo se asocie
con un significado. Sin embargo, el concepto es una representación cognitiva de una
realidad o un conjunto de realidades. Por tanto, la relación entre el concepto y la rea-
lidad es causal, ya que el concepto es producido por la realidad; por ello, un concep-
to nunca es arbitrario. Otro hecho que demuestra la diferencia entre concepto y sig-
nificado es que el concepto de una realidad que aún no tenga nombre puede ser
Concepto de evaluación psicológica 73
definido sin problema, a pesar de que no tenga signo ni, lógicamente, significado. En
conclusión, significado es en lo que nos hace pensar un signo, mientras que concepto
es la representación cognitiva evocada directamente por una realidad.
La definición de un signo puede ser de dos tipos: sintáctica o semántica. La pri-
mera se caracteriza porque relaciona un signo con otro, o sea, se limita a señalar una
sinonimia. Por ejemplo, evaluación psicológica podría ser sinónimo de psicodiag-
nóstico. La definición sintáctica sirve para sustituir signos, el que sustituye el defini-
tum por el definiens y viceversa, por lo que resulta útil en las abreviaciones (por
ejemplo, EEG quiere decir electroencefalograma). Cuando interpretamos el signo
que constituye el definiens, la definición sintáctica se convierte en semántica. Así,
podría decirse que la definición semántica se caracteriza por poner en conexión un
signo con su significado. Según la forma de relacionar el signo con el significado
puede hablarse de definición semántica innovadora, cuando se relaciona el signo con
una significación nueva (por ejemplo, valoración quiere decir evaluación de progra-
mas); o conservadora, cuando un signo se pone en conexión con una significación ya
usada por un determinado colectivo (por ejemplo, test quiere decir técnica sistemáti-
ca que compara la conducta de dos o más personas).
Ahora bien, una palabra puede tener diversos significados en función de su uso.
Este determina en parte su significado y además su evolución semántica. Un buen
ejemplo es la palabra psicodiagnóstico, que ha cambiado considerablemente su sig-
nificado desde que comenzara a difundirse en España (esto se verá con detalle en el
apartado IV). Pero además, el uso de las palabras decide acerca de su supervivencia en
la medida en que se sigue considerando o no apta para expresar tal significado o sim-
plemente se va relegando su uso ante otra palabra con mayor aceptación. Esto es lo
que ocurre actualmente con el término “psicodiagnóstico”, que ha sido sustituido
por la expresión “evaluación psicológica”.
Por otra parte, el uso de una palabra en distintos ámbitos puede condicionar una
pluralidad de significados. Esto pone de relieve la importancia del contexto cuan-
do se pretende definir un signo que tiene distintos significados según el ámbito en
que se utilice. Éste es el caso de psicodiagnóstico, pues es evidente que no tiene el
mismo significado cuando se utiliza como nombre de una asignatura que cuando
aparece en el título de un libro como Psicodiagnóstico de Rorschach. Por tanto, según
esto, podemos distinguir entre definiciones contextuales, que son las que se hacen en
función de un contexto, y definiciones explícitas, que se hacen con independencia
del contexto. En las ciencias, cuando un término puede tener más de un significado
se deben utilizar siempre definiciones contextuales. El tipo de definición semántica
más frecuente es la conservadora descriptiva, que es la que se formula como resulta-
do de un análisis de lo que se entiende por un término bien en un contexto determi-
nado o en su uso más general. Si se combinan las dos categorías descritas anterior-
mente tenemos que las definiciones semánticas innovadoras descriptivas pueden ser
innovadoras contextuales o innovadoras explícitas; y, de igual forma, las definiciones
semánticas conservadoras descriptivas pueden ser descriptivas explícitas o descript1-
vas contextuales.
Además de las definiciones semánticas descriptivas existen otros dos tipos de
definiciones: la sinonímica y la etimológica. La primera se utiliza para indicar la sig-
nificación de un signo utilizando otro más conocido o de más fácil comprensión; es
decir, en la definición sinonímica el definiens no es una descripción, sino otro signo

cuyo significado captamos fácilmente. Por tanto, en este tipo de definición el defini-
tum y el definiens son signos sinónimos; por ejemplo, feedback quiere decir retroali-
mentación. Por último, una definición semántica conservadora puede ser etimológi-
ca; en ésta, la significación de un signo viene dada por su etimología, o sea, por la
significación de los signos originarios que componen el definitum. En general, este
tipo de definición tiene muy poca utilidad, pues suele ser impreciso y limitado, ade-
más de no reflejar la evolución semántica. .
Todos los tipos de definición vistos hasta aquí son definiciones lingúísticas, es
decir, responden a la pregunta ¿qué quiere decir un determinado signo? Pero como
ya anticipamos al principio de este apartado, las definiciones se pueden referir a una
realidad o conjunto de realidades, y en este caso responderían a la pregunta ¿qué es
una determinada realidad?, o sea, se interroga sobre el concepto. Aunque, como ya
hemos explicado, concepto y significado son entidades distintas, lo cierto es que en
la práctica se formulan preguntas mixtas en las que se interroga sobre el concepto a
través del signo. Así, se suele preguntar ¿qué es evaluación psicológica? Por tanto,
resulta lógico que en estos casos la respuesta pueda ser la misma que si se hubiese
preguntado ¿qué significa evaluación psicológica?, dado que en una definición que
se incluye el signo como definitum se hace implícito que su significado coincida con
el concepto. Sin embargo, tal como veremos a continuación, las definiciones de reali-
dades difieren de las lingúísticas en la forma de orientar la explicación y delimitación
del concepto. Así por ejemplo, no sería posible hacer una definición innovadora de
una realidad, puesto que el concepto es inherente a la realidad. La definición de una
realidad es siempre su concepto, y éste no es arbitrario como el signo, sino que es un
conjunto de características diferenciadoras de esa realidad. Por ejemplo, el concepto
de la asignatura evaluación psicológica seguiría siendo exactamente el mismo si se le
cambia de signo y pasa a denominarse psicoevaluación, a nivel lingúístico ambos tér-
minos serían sinónimos pero el concepto permanecería inalterable, a no ser que se
cambiasen los contenidos, en cuyo caso se estaría modificando su entidad.
Las propiedades de la realidad representadas en su concepto pueden ser estruc-
turales o funcionales y, en consecuencia, se puede hablar de definición estructural,
definición funcional y definición mixta (cuando incluye ambos tipos de propieda-
des). Las propiedades estructurales se refieren a los elementos constitutivos de la
realidad, así como las relaciones que se establecen entre ellos. Las propiedades fun-
cionales hacen alusión a la actividad de esos elementos, se refieren al dinamismo de la
estructura, a las acciones que pueden producir, e incluso a su utilidad.
Una definición estructural explica y delimita una realidad ofreciendo un concep-
to que recoge las propiedades constitutivas o estructurales. Ahora bien, estas propie-
dades pueden presentarse de dos formas: radicales o radicadas. Se considera que
una propiedad estructural es radical cuando no se deriva de una segunda propiedad. Una
propiedad estructural es radicada cuando se deriva de otra propiedad conocida, o se
infiere que puede derivar de algo distinto a ella misma. Por ejemplo, la interrupción
de la respiración es una característica estructural de la apnea, pero es radicada, puesto
que depende del estado del sistema nervioso (en la apnea central). Cuando el defi-
niens se corresponde con propiedades radicales se denomina definición esencial,
mientras que, cuando incluye propiedades radicadas, tenemos una definición des-
criptiva. En general, esta distinción no debe tomarse de forma estricta, ya que no

siempre resulta posible discernir si una propiedad es radical o radicada.
Una definición funcional de una realidad ofrece un concepto compuesto por
propiedades funcionales. Éstas pueden ser de tres tipos:
a. Definición genética, cuando las propiedades funcionales se refieren a la for-

ma en que se produce una realidad; por ejemplo, la evaluación psicológica es una ac-
tividad que tiene su origen en la antigua China, donde se realizaba una selección de
los niños que en el futuro podrían ejercer funciones en la administración pública.
b. Definición operativa, cuando las propiedades funcionales hacen alusión al
modo propio de actuar; por ejemplo, evaluación psicológica es una actividad en la
que se evalúan características psicológicas de un individuo.
c. Definición de utilidad, que se caracteriza por señalar la utilidad; por ejem-
plo, la evaluación psicológica es una actividad que permite orientar y predecir la
conducta de un individuo.
Ahora bien, una misma realidad puede delimitarse de diversas formas, lo cual
implica tantas definiciones como formas posibles de delimitar la realidad. Por ello, el
científico, frecuentemente, se ve en la necesidad de elegir. Para ello, existen tres crite-
rios:
a. Debe preferirse aquella definición que es más completa, es decir, que reúna
un conjunto de propiedades más amplio.
b. Debe preferirse la que exponga propiedades radicales frente a la que expon-
ga propiedades derivadas de otras.
c. Debe preferirse la que resulte más adecuada a la investigación.
Conviene señalar que, según el tipo de propiedades que se combinen en el defi-

niens, pueden resultar distintas definiciones mixtas: definición estructural mixta (in-
cluye propiedades esenciales y descriptivas); definición funcional mixta (puede in-
cluir propiedades genéticas, operativas y utilitarias), y definición mixta estructural
funcional (como su nombre indica, consta de propiedades estructurales y funciona-
les). Como es lógico, esta última es la más completa, pues ofrece información acerca
de las características estructurales, el origen, la forma de actuar y la utilidad de una
determinada realidad. No obstante, esto no implica que la definición más adecuada
deba ser la definición mixta estructural funcional, puesto que la mejor definición
será aquella que más se ajuste a nuestras necesidades y a la propia entidad de la reali-
dad que se pretende definir. En la figura 3.1 se recogen de forma esquemática los dis-
tintos tipos de definición.
13. Reglas de la definición

Para formular una definición lingúística (nominal o de realidad) es conveniente se-
guir ciertas reglas generales de la definición. Dichas reglas se refieren a los requisitos
que debe cumplir el definiens, es decir, el conjunto de signos lingúísticos que explica
FIGURA 3.1. Tipos de definición lingúística
DE SIGNO
(NOMINAL)
Sintáctica Semántica
Innovadora Conservadora
Descriptiva Sinonímica Descriptiva Etimológica
Contextual Explícita Contextual Explícita
DE COSA
(REALIDAD)
Estructural Funcional
Utitaria
y delimita el definitum. Para aplicar las reglas es importante tener en consideración

la distinta función que cumple el definiens, según se trate de una definición de signo
o de realidad. Recuérdese que en el primer caso es un conjunto de signos que expli-
can otro signo, mientras que en la definición de realidad, los signos explican un con-
cepto.
La primera regla de la definición trata de garantizar la capacidad de explicación.
Así, se dice «el definiens debe ser más claro que el definitum». Para ello, los signos
lingúísticos que se utilicen para constituir el definiens han de ser familiares y bien co-
nocidos. Por familiares no quiere decir que pertenezcan al lenguaje vulgar, sino que
sean utilizados con frecuencia por el colectivo que hará uso de la definición; mien-
tras que por signos bien conocidos se refiere a que su significado sea conocido de
forma precisa. Habitualmente, ambas características suelen darse de forma simultá-
nea, pero hay casos en los que no ocurre así. Por tanto, no debe emplearse ningún
término en el defimiens cuyo significado no haya sido establecido previamente, a no
ser que resulte obvio. En relación a esta regla se suelen citar cuatro posibles errores
lógicos:
a. Cuando el definitum forma parte del definiens, lo cual impide una explica-
ción adecuada, puesto que se pretende explicar un signo o una realidad a través de sí
mismo. Este tipo de transgresión se denomina círculo in definiendo, y habitualmente
se confunde con una regla errónea, muy extendida, que postula que «lo definido no
debe formar parte de la definición», lo cual es incorrecto, pues lo definido es uno de
los tres elementos necesarios de la definición, nos referimos al definitum, que es el
signo o realidad que trata de explicarse.
b. Cuando en el definiens se incluyen signos con significado supuesto o meta-
fórico, por lo que la explicación resulta ambigua.
c. Cuando se emplean signos que tienen posibles significados y no se hace una
delimitación contextual del significado cuando se integran en el definiens.
d. Cuando forman parte del definiens signos con significado confuso, es decir,
no se trata de signos con distintos significados en función del contexto en que apare-
cen, sino de signos sobre los que no hay un acuerdo unánime sobre su significado, y
ello a pesar de identificar el contexto. Estos tres últimos tipos de errores lógicos pro-
ducen una definición ambigua.
La segunda regla de la definición está relacionada con la capacidad de delimita-

ción del definitum por parte del definiens; es decir, el definiens debe tener la capaci-
dad de caracterizar el defínitum delimitando las características propias que permitan
su diferenciación. Según se formule la delimitación, de forma vaga, o bien demasiado
restringida, dará como resultado dos posibles transgresiones. La primera sería cuan-
do el definiens no alcanza a delimitar el definitum por defecto de acotamiento, o sea,
los límites son muy amplios (por ejemplo, evaluación psicológica es una actividad en
la que se utilizan tests); este tipo de error lógico se conoce como definición vaga.
La segunda se produciría cuando el definiens no llega a delimitar el definitum por
exceso de acotamiento (por ejemplo, evaluación psicológica es la asignatura en la que
se estudian los tests de inteligencia); este error lógico se denomina definición es-
trecha.
III. APLICACIÓN DE TESTS PSICOLÓGICOS
El término “test” fue acuñado por J. McKeen Cattell en 1890; para este autor, los
tests mentales eran sistemas normalizados de procedimientos que permitían obtener
información objetiva respecto al rendimiento de personas ante la realización de tareas-
tipo. Muy pronto el vocablo fue aceptado por prácticamente todo el mundo occi-
dental, pasando en el primer tercio del siglo XX a formar parte de los idiomas caste-
llano, francés, italiano y alemán (Pelechano, 1988). Asimismo, se publicaron, y se
siguen publicando, manuales anglosajones en cuyo título aparece la expresión tes-
ting |, que se podría traducir por «hecho o acción de aplicar tests». La aplicación de
tests psicológicos dio lugar a principios del presente siglo a la especialidad de psico-
tecnia, término que en España fue utilizado, tal como se ha comentado en el capítulo
anterior, en algunas publicaciones e incluso en el nombre de algunos institutos, lo
cual es un reflejo de la importancia de los tests psicológicos. Esta relevancia se hace
patente también dentro de la sociedad en general; así, en la encuesta realizada por
Berenguer y Quintanilla (1994) entre la población española, el 85,30% de la misma
considera que la tarea de los psicólogos es pasar tests. Recientemente, Rogers (1995)
llega a limitar más el significado de testing; este autor emplea el término psycholog:1-
cal testing para referirse a aspectos técnicos de los tests (fiabilidad, validez, etc.) y
psychological assessment para aludir al modo en que los tests son usados para tomar
decisiones conjuntamente con otras fuentes de información. En su manual The ps)-
chological testing enterprise. An introduction comenta que el objetivo de su texto es
«proporcionar el bagaje suficiente para permitir la valoración de la evaluación psico-
lógica, pero uno de los prerrequisitos es tener el suficiente conocimiento acerca del
psychological testing para poseer una opinión informada de la evaluación» (Rogers,
1995, p. 48).
Aunque las definiciones de tests psicológicos formuladas han sido diversas, to-
das ellas coinciden en unos aspectos comunes. A continuación vamos a comentar
dos de ellas planteadas por dos de los autores más relevantes de esta disciplina. Anas-
tas (1988, p. 23) afirma que «un test psicológico es esencialmente una medida objeti-
va y estandarizada de una muestra de conducta». En esta definición destaca el adjeti-
vo “estandarizada”, lo cual implica una uniformidad en el procedimiento de
administración y puntuación del test; es decir, el test será administrado en una situa-
ción controlada y la puntuación obtenida se interpretará comparándola con la del
grupo normativo. El otro elemento importante de la definición propuesta por Anas-
tasi es «muestra de conducta»; es decir, lo que se evalúa con un test psicológico no es
más que una muestra de las conductas, por lo que la bondad del mismo radica en la
adecuada elección de los ítems que representen al conjunto total de conductas que
queremos evaluar. Ello nos lleva al concepto empleado por Anastasi de “indicador”,
aludiendo a que los tests psicológicos son medidas indirectas. Por su parte, Cron-
bach (1990, p. 32) define el test psicológico como «un procedimiento sistemático
" Entre estos manuales destacan Psychological testing de Anastasi (1988), Essentials ofpsychological
testing de Cronbach (1990), Psychological testing. Principles, applications, and issues de Kaplan y Saccuz-
z0 (1993) o The Psychological testing enterprise. An introduction de Rogers (1995)
para observar la conducta y describirla con ayuda de escalas numéricas o categorías

establecidas». En esta definición se enfatiza también la sistematización del procedi-
mientoy se resalta el empleo de números o categorías. Tal como se puede apreciar, la
definición es demasiado amplia, pero es algo que el autor hace conscientemente con
el objetivo de incluir en su manual técnicas complementarias, como puede ser la ob-
servación sistemática. Cronbach considera también que los tests psicológicos se de-
ben caracterizar por la objetividad y la estandarización, pero, a diferencia de Anasta-
s1, estas características se refieren más a los procedimientos de aplicación que a la
normalización de las puntuaciones.
Por tanto, un test psicológico es un instrumento de medida que debe cumplir las
siguientes características (Murphy y Davidshofer, 1991; Rogers, 1995):
a. Un test psicológico es una muestra de conducta; solamente se incluye un po-

sible grupo de conductas que permiten evaluar algún atributo (por ejemplo, la intro-
versión) o predecir algún resultado (por ejemplo, el éxito en una profesión). Ello im-
plica, tal como se comentó anteriormente, que no todas las conductas son
susceptibles para evaluar o definir un atributo determinado y que la calidad del test
estará en función de la representatividad de esta muestra de conductas.
b. La muestra de conductas es obtenida bajo condiciones estandarizadas; el test
siempre se presenta con los mismos estímulos y las mismas instrucciones, y los pro-
cedimientos de puntuación e interpretación son consistentes.
c. Establece una puntuación; el test psicológico proporciona información
cuantitativa acerca de la muestra de conducta. Además, el test es una medida objeti-
va, es decir, sus resultados son claramente observables y verificables por cualquier
persona.
En resumen, un test psicológico es una medida objetiva y estandarizada de una

muestra de conductas. Sin embargo, dentro del apartado de tests psicológicos se in-
cluyen muchas veces (así se hace en los manuales citados anteriormente) técnicas que
no cumplen con todas las características comentadas (estandarización, objetividad e
interpretación normativa); tal es el caso de los tests proyectivos, los cuales no suelen
cumplir con el requisito de la objetividad. De ahí que se suela emplear el término téc-
nica o prueba para hacer referencia a estos últimos con el fin de establecer diferencias
con respecto a los tests psicométricos. No obstante, con el término test se puede ha-
cer referencia a los tests psicométricos que incluirían todas las características enume-
radas, o ampliarlo a otras pruebas que no cumplen con todos esos requisitos.
IV. PSICODIAGNÓSTICO
Analizándolo desde la etimología, el término “psicodiagnóstico” estaría compuesto

por tres vocablos: psykhé (posibilitante de la vida), díá (a través de) y grgnosko (co-
nocimiento), que conjuntamente vendrían a significar distinción O conocimiento di-
ferenciado de la psique. Es evidente que la definición semántica etimológica no cs
suficiente para delimitar el significado actual del término. La mayoría de los autores
coincide en situar el nacimiento de este término en la publicación en 1921 del libro

de Rorschach Psychodiagnostik. A partir de aquí, el término se asoció a las técnicas
proyectivas y al modelo médico de evaluación psicológica. Este carácter médico y
psicodinámico del término psicodiagnóstico, que todavía está presente por ejemplo
en Estados Unidos, hace que surja una nueva orientación de carácter más psicomé-
trico: las pruebas psicométricas (psychological testing) comentadas anteriormente.
En España el término comienza a difundirse con las publicaciones de Tranque
(1942) El estudio de la personalidad por el test psicodiagnóstico de Rorschach y Salas
(1944) El psicodiagnóstico de Rorschach. Posteriormente, en la década de los años cin-
cuenta se crea la Escuela de Psicología y Psicotecnia, donde se integra una asignatura
con el nombre de Psicodiagnóstico —este hecho será determinante para la futura
evolución de dicho término en España. En la siguiente década se crean las secciones
de psicología en Madrid y Barcelona, en las cuales, siguiendo el modelo de la Escuela
de Psicología, se incluyen asignaturas con la denominación de psicodiagnóstico, lo
que a su vez fue el modelo en la creación de las futuras secciones en las demás univer-
sidades. Las asignaturas de psicodiagnóstico, que en un principio se correspondían en
gran parte con técnicas proyectivas, fueron integrando las distintas innovaciones, tan-
to en técnicas como en modelos, sin modificar los nombres de las asignaturas. Por
otra parte, los libros editados por autores españoles eran fieles a esta tendencia, quizás
con la intención de ajustarse más a un libro de texto. Un buen ejemplo es el libro de
Álvarez (1972) Psicodiagnóstico clínico. Las técnicas de exploración psicológica, donde
el subtítulo sería en realidad el título apropiado si se tiene en cuenta que las técnicas
proyectivas se corresponden tan sólo con un tercio del contenido total del libro, el
cual es similar (aunque más modesto) al de Cronbach (1972) Fundamentos de la ex-
ploración psicológica, y de hecho el subtítulo del primero y el título del segundo son
muy parecidos. Por tanto, parece claro que el término psicodiagnóstico aparece en el
título por un motivo distinto que el de describir su contenido.
La misma tendencia se puede observar en la traducción de algunos manuales en
los que no aparecía el término en su edición original y se incluye en la versión caste-
llana. Un ejemplo sería el libro de Klopfer y Kelly The Rorschach technique que fue
traducido al castellano en 1974 con el título Técnica del psicodiagnóstico de Rors-
chach. En la mayoría de los libros de autores españoles que se editan posteriormente,
bien tratando la totalidad de los contenidos de las asignaturas de psicodiagnóstico o
bien abordando aspectos parciales, se sigue incluyendo el término “psicodiagnósti-
co”. Al margen de una perspectiva etnocéntrica, resultaría sorprendente encontrar
algunos temas como técnicas psicofisiológicas o evaluación de programas en un ma-
nual que tenga por título Psicodiagnóstico o, por el contrario, no encontrar ninguna
mención a técnicas proyectivas en un libro titulado Psicodiagnóstico (Temas de me-
todología) (Martorell, 1985).
El concepto de psicodiagnóstico a principios de la década de los años ochenta ha
sido estudiado por Blanco y León (1983) en un laborioso trabajo en el que analizaron
187 programas docentes de psicodiagnóstico y materias afines, tanto españoles como
extranjeros (Francia, Bélgica, Alemania, Gran Bretaña y Estados Unidos) impartidos
durante los años 1980-1982. Dada la cantidad de programas analizados puede consi-
derarse como un estudio clave para tratar dicho concepto. El análisis se organiza en
función de un triple objetivo: concepto, contenido y metodología de enseñanza.
Concepto de evaluación psicológica
81
Los autores concluyen que el concepto de psicodiagnóstico implícito en los pro-

gramas tiene una doble vertiente: por una parte, se refiere a la exploración psicológi-
ca a través de tests y, por otra, a la evaluación y análisis científico del comportamien-
to. Por tanto, se trata de un concepto integrador que incluye el “sentido testológico
tradicional” y planteamientos críticos. En cuanto a los contenidos de los programas
hay bastante similitud; no obstante, se aprecian diferencias considerables en el tiem-
po de dedicación a cada contenido y en el nivel en que se imparten. En general, el
mayor porcentaje del tiempo se dedica a las técnicas, y los contenidos más importan-
tes son la inteligencia y la personalidad. En el análisis de la metodología utilizada en
la enseñanza de esta materia los autores advierten una clara diferencia entre España y
los demás países. Así, mientras que en estos últimos se utilizan medios audiovisuales
y la participación activa de los alumnos, en España se sigue utilizando el sistema de
clases magistrales. En relación a las prácticas, mientras en los demás países se realizan
directamente con el sujeto evaluado, bien en hospitales, en escuelas, clínicas, etc., en
España se hace de forma indirecta, analizando casos sobre los informes emitidos
previamente por una tercera persona, lo que podría denominarse “prácticas teóri-
cas”. Los autores concluyen que el psicodiagnóstico se encuentra en una época de
transición, en la que están vigentes el modelo de evaluación tradicional y el de eva-
luación conductual. Además, se postula que la conducta puede ser estudiada según
tres niveles: biológico, conductual y social, indicando que sería necesario que en el
futuro los programas de psicodiagnóstico incluyesen temas relacionados con el nivel
biológico y social.
Examinando los apéndices de este trabajo se puede comprobar que en las seis
universidades españolas incluidas en el estudio hay por lo menos una asignatura con
la denominación de psicodiagnóstico (en el caso de las universidades extranjeras no
se mencionan los nombres de las asignaturas). También se pone de manifiesto en es-
tos datos una clara diferencia entre los distintos países en cuanto al tipo de evalua-
ción preponderante. Así por ejemplo, en España de los quince programas analiza-
dos, las técnicas proyectivas estaban presentes en once, los cuestionarios de
personalidad en diez, los tests de inteligencia en ocho y la evaluación conductual en
cinco. En Gran Bretaña, los cuestionarios de personalidad y los tests de inteligencia
se incluían en las quince universidades analizadas, los tests proyectivos en nueve y la
evaluación conductual en ocho. Por el contrario, en Estados Unidos la evaluación
conductual era la más importante, impartiéndose en ocho de las trece universidades
incluidas en el estudio, mientras que los tests de inteligencia se impartían en siete y
las técnicas proyectivas tan sólo en cinco.
En lo referente al uso del término “psicodiagnóstico”, no hace falta 1r muy lejos
para comprobar que la consideración de este término en España es sustancialmente
distinta a la de otros países. Por poner un ejemplo, en Portugal no existen asignatu-
ras con esta denominación, salvo cuando los contenidos son específicamente de téc-
nicas proyectivas, como es el caso de Psicodiagnóstico do Rorschach que se imparte
en la Universidad de Lisboa (Rodrigues-Silva, 1991). Tampoco podría argumentarse
que se trata de una característica propia de la psicología de habla hispana, puesto que
si se analiza el plan de estudios de la Facultad de Psicología de la Universidad Nacio-
nal Autónoma de México —la mayor facultad de psicología de lengua hispana—,
donde se imparten unas 200 asignaturas repartidas entre una licenciatura, varias es-
pecialidades, másters y doctorados, se puede comprobar que el término “psicodiag-

nóstico” no aparece en el nombre de ninguna asignatura. Y ello a pesar de que tienen
unas diez asignaturas sobre evaluación, diferenciando incluso entre evaluación de la
personalidad (donde se incluyen los tests psicométricos de personalidad) y pruebas
de personalidad (donde se imparten las técnicas proyectivas). En algunos países lat1-
noamericanos en los que se utiliza el término “psicodiagnóstico”, éste se refiere ex-
clusivamente a las técnicas proyectivas. No obstante, en un análisis de la bibliografía
de la literatura de psicología en lengua alemana entre los años 1971-1985 se pone de
manifiesto que en ese país se utiliza el término psicodiagnóstico, y además no aparece
una expresión similar a la de evaluación psicológica (Silva y cols., 1990). Por tanto, pa-
rece lógico que el término psicodiagnóstico no debe ser analizado independiente-
mente del contexto académico y profesional en el que ha evolucionado. Así, en el caso
de España es bastante evidente que en la década de los años ochenta, psicodiagnóstico
es sinónimo de lo que los anglosajones denominan psychological assessment (evalua-
ción psicológica), mientras que para ellos ésta no es sinónimo de psychodiagnostics.
La diferencia de significado entre psicodiagnóstico y psychodiagnostic queda de
manifiesto si se analizan algunas definiciones en diccionarios técnicos anglosajones y
españoles. Así, en el Diccionario de psicología de Warren de 1948, se define como el
estudio de la personalidad con ayuda de manifestaciones externas (fisonomía, porte,
postura, escritura...); en el Diccionario de psicología de Sillamy de 1969 se define
como el método de exploración de la personalidad, fundado en la interpretación li-
bre de formas fortuitas; y en el Diccionario de psicología de la editorial Penguin del
año 1985, como cualquiera de las técnicas más o menos válidas de evaluación de la
personalidad por medio de la interpretación de patrones de conducta, particular-
mente no verbales (por ejemplo, expresiones faciales, posturas corporales, gestos...),
y ocasionalmente el uso del test de Rorschach. En el Diccionario enciclopédico de
Corsini (1987) el psicodiagnóstico es considerado como un modelo de evaluación
clínica predominante desde la posguerra centrado en el estudio de la personalidad; el
psicodiagnóstico utiliza técnicas proyectivas para evaluar funciones conscientes e
inconscientes, enfatizando el juicio clínico y las inferencias. Mientras tanto, en Espa-
ña, en el Diccionario de psicología de la editorial Planeta de 1985 el psicodiagnóstico
es definido como el conjunto de técnicas utilizadas para el control de las característi-
cas psicológicas del individuo; en el Diccionario enciclopédico de educación especial
de la editorial Santillana del año 1985 se parte de la introducción del término por su
creador Rorschach en 1921, con una clara intención clínico-clasificatoria que lo hace
identificable con el modelo médico, planteándose a continuación la concepción ac-
tual más amplia, refiriéndose al estudio científico del comportamiento, de las inte-
racciones sujeto-ambiente y de los diferentes objetivos posibles. Como se puede
apreciar, en los cuatro primeros diccionarios se habla de la evaluación de la persona-
lidad y con un tipo determinado de técnicas, mientras que en los diccionarios espa-
ñoles se considera una evaluación más global, sin concretar ningún tipo de técnicas,
lo cual coincide con el planteamiento expuesto anteriormente de que el término psi-
codiagnóstico no tiene el mismo significado que psychodiagnostic.
Por otra parte, sí se hace un análisis comparativo entre manuales anglosajones,
como por ejemplo, el de Goldstein y Hersen (19904) Handbook ofpsychological as-
sessment y manuales españoles, como el de Fernández-Ballesteros (1983) Psicodiag-
nÓStICO, puede observarse que tanto en la organización como en su contenido hay

una gran similitud, es decir, utilizando términos diferentes en sus títulos, presentan
grandes similitudes en sus contenidos.
Si comparamos las definiciones de psicodiagnóstico de autores anglosajones y
españoles da la impresión también de que nos estamos refiriendo a disciplinas dife-
rentes. Así, para Weiner (1972, p. 534) el psicodiagnóstico es «la utilización clínica de
tests psicológicos para facilitar la evaluación de la personalidad»; Mash y Terdal
(1974) consideran el psicodiagnóstico como una fase previa de la evaluación: la iden-
tificación del problema; por su parte, Lidz (1981, p. 19) habla de que «el objetivo de
algunos procedimientos de evaluación es identificar un diagnóstico». Mientras tan-
to, en España, Fernández-Ballesteros (1980, p. 87) define el psicodiagnóstico como
«aquella disciplina que se dedica a la exploración de las características psicológicas
y/o psicopatológicas de los seres humanos a través de los tests u otras técnicas de
evaluación». Para Blanco (1986, p. 25) el psicodiagnóstico «es la asignatura que capa-
cita para el conocimiento, comprensión y aplicación de la conducta de un sujeto y
que permite la orientación y predicción, orientación y/o tratamiento del sujeto indi-
vidual con datos procedentes de la confluencia de fuentes múltiples y con dependen-
cia de la intervención psicológica que se realice en ella».
En definitiva, parece claro que en España, de manera especial en la década de los
años ochenta, el término “psicodiagnóstico” es sinónimo de lo que los anglosajones
denominan psychological assessment (evaluación psicológica), mientras que para
ellos este vocablo no es sinónimo de psychodragnostics. Un hecho que ejemplifica
perfectamente esta situación es la respuesta que Cronbach da a Carbonell, Carpinte-
ro y Silva (1988) sobre la situación actual y perspectivas futuras del psicodiagnóstico
en su sentido más amplio; este prestigioso autor contesta que no está preparado para
responder a dicha pregunta pues no tenía ningún contacto con la psicología clínica,
dedicándose exclusivamente a la psicología educativa y su evaluación.
Hemos hecho énfasis en el significado del término “psicodiagnóstico” en Espa-
ña, comparándolo con el resto de los países con el fin de justificar la sustitución reali-
zada a nivel académico a principios de la década de los años noventa del término
“psicodiagnóstico” por el de “evaluación psicológica”. No tenía sentido seguir utili-
zando el vocablo “psicodiagnóstico” para referirnos a una disciplina cuyos conten1-
dos se correspondían exactamente con lo que en el resto de los países se denominaba
evaluación psicológica. En resumen, el término “psicodiagnóstico” en un sentido es-
tricto ha caído en desuso en favor del de “evaluación psicológica” por sus matices
médicos y porque la disciplina que nos ocupa amplió en los últimos años su objeto
de estudio; en el caso de España, en la última década ya se estaba produciendo un so-
lapamiento entre psicodiagnóstico y evaluación psicológica.
V. EVALUACIÓN PSICOLÓGICA
Evaluación psicológica es la traducción del término anglosajón psychological assess-

ment, el cual aparece por primera vez en la literatura psicológica en el año 1948 con
la publicación del libro Assessment of men, donde se describen los procedimientos
utilizados por la Office of Strategic Services Staff [Oficina de Servicios Estratégicos]

de Estados Unidos para la selección de individuos especialmente cualificados para
misiones especiales. En este libro se defiende el uso del término “evaluación” alegan-
do que ésta pone el énfasis en los aspectos positivos de la conducta humana, mientras
que “psicodiagnóstico” (entiéndase según el significado anglosajón) se centra en la
detección de patologías. Al finalizar la segunda guerra mundial, los psicólogos que
habían participado en el programa de selección antes mencionado continuaron uti-
lizando el término assessment en sus futuras publicaciones. En 1953 la revista An-
nual Review of Psychology comienza a editar una serie de artículos sobre evalua-
ción psicológica, serie que se inicia con un artículo de Kelly sobre «La teoría y las
técnicas de evaluación» («The theory and techniques of assessment»). Posterior-
mente, esta palabra comienza a aparecer en los títulos de algunos textos, como, por
ejemplo, en el de Kelly, Assessment of human characteristics, que dos años después
fue traducido porJ.Baca al castellano, publicándose con el título «La valuación de
las cualidades humanas», lo que posiblemente sea la primera traducción del térmi-
no assessment; en este texto, evaluación psicológica se define como «cualquier pro-
cedimiento para hacer una evaluación significativa o una diferenciación entre los
seres humanos con respecto a sus características o atributos psicológicos» (Kelly,
1969, p. 1). Dos obras publicadas en 1968 suponen el apoyo definitivo al nuevo tér-
mino; nos referimos al primer volumen de Advances in psychological assessment de
McReynolds (1968) y Personality and assessment de Mischel (1968). Desde en-
tonces se ha generalizado de tal forma que en la actualidad resulta difícil encontrar
en la literatura anglosajona una referencia sobre el tema que no incluya el término
assessment.
Maloney y Ward defienden en su texto Psychological assessment. A conceptual
approach un modelo del proceso de evaluación diferente al centrado en los tests:
«[...] las herramientas [tests] de evaluación han sido inapropiadamente consideradas
equivalentes al proceso de evaluación» (Maloney y Ward, 1976, p. vit) y definen la
evaluación psicológica como «un proceso variable de solución de problemas que
utiliza diferentes procedimientos de recogida de datos» (Maloney y Ward, 1976,
p- vi). Para estos autores, la evaluación psicológica implica un proceso con tres ele-
mentos diferentes: el problema a evaluar que deberá ser configurado adecuadamen-
te, la recogida de datos y, por último, la interpretación de estos datos y respuesta al
problema. Graham y Lilly (1984) definen la evaluación psicológica como un proce-
so global que implica la recogida de información acerca de personas para realizar
predicciones o inferencias, mientras que los tests no serían más que un instrumento
de recogida de información en este proceso. Estos mismos planteamientos son de-
fendidos por Goldstein y Hersen (1990b) en su Handbook of psychological assess-
ment, quienes afirman que el término assessment implica que hay muchos caminos
para evaluar las diferencias individuales, uno de ellos serían los tests, pero también
podría utilizarse la entrevista, la observación de la conducta en ambientes naturales o
estructurados y el registro de variables psicofisiológicas. De igual opinión es
McReynolds (1990) al considerar que la expresión evaluación psicológica (psycholo-
gical assessment) hace referencia a técnicas como la entrevista, los tests, los inventa-
rios, la observación, las técnicas psicofisiológicas, etc. Según Haynes, Richard y Ku-
bany (1995, p. 238)
Concepto de evaluación psicológica 8 (8)
la evaluación psicológica incluye muchos paradigmas de evaluación, tales como la evaluación

conductual y la evaluación de la personalidad; muchos métodos de evaluación, como la ob-
servación directa y los cuestionarios de autoinforme; y muchos instrumentos de evaluación
como cuestionarios de autoinmforme para la depresión, protocolos de evaluación psicofisioló-
gica para trastornos de estrés postraumático o métodos de observación de conductas de pa-
dres e hijos para uso clínico.
Esta diversidad que caracteriza a la evaluación psicológica también está presente

en sus objetivos; así, entre éstos, S. N. Haynes (comunicación personal, 23 de sep-
tiembre de 1995) señala la identificación de conductas problema y sus relaciones
causales, el diagnóstico, la evaluación de los resultados del tratamiento, los peritajes
jurídicos y la predicción de riesgos de futuras conductas problema.
En definitiva, parece existir una coincidencia en que los textos de esta disciplina
no deben ser un simple listado de tests, puesto que existen otras técnicas, y que el
proceso de evaluación implica diferentes fases y actividades. Así, por ejemplo, Mar-
tin (1988) afirma que la evaluación psicológica es un proceso más amplio que la apli-
cación de tests, incorporando aspectos como los efectos del contexto sobre el rendi-
miento en los tests o las características que la persona presenta en el momento de la
evaluación. Además, este autor diferencia claramente entre el evaluador y el aplica-
dor de tests, pues el primero necesita una serie de conocimientos teóricos y expe-
riencia aplicada para que sus datos sean útiles; mientras el aplicador de tests se limita
a seguir las instrucciones de la aplicación, corrección e interpretación del test, el eva-
luador debe ir tomando decisiones a lo largo del proceso (por ejemplo, seleccionar
las variables adecuadas, integrar información de distintas fuentes, etc.), lo cual intro-
duce un elemento subjetivo importante, pero que juega un papel relevante, como
cuando presta atención a elementos no cuantificables de los instrumentos de medida
(por ejemplo, la falta de motivación del sujeto al realizar el test). En esta misma línea
se sitúa Groth-Marnat, quien en la introducción de su Handbook of psychological
assessment comenta que
muchos libros escritos sobre tests psicológicos y cursos organizados en relación con estos li-
bros se centran especialmente en la teoría y construcción de los tests y minimizan la interpre-
tación de los mismos. Por el contrario, el intento de este libro es centrarse en los procesos que
realizan de modo efectivo los profesionales durante la evaluación [Groth-Marnat, 1990, p. 1].
Estos procesos incluyen la clarificación de papeles, seleccionar las diferentes es-

trategias (tests psicológicos, entrevista y observación) e integrar todos los datos en
un informe psicológico. Asimismo, este autor también insiste en la importancia de
los conocimientos teóricos y la experiencia del evaluador. Esto nos parece de gran
trascendencia de cara a la formación o entrenamiento de evaluadores, siendo en defi-
nitiva lo que diferencia o separa la evaluación psicológica de la aplicación de tests.
Para Silva (1988) también está muy claro que la evaluación psicológica constituye un
proceso, cuyos objetivos son proporcionar información útil en tareas de clasifica-
ción, así como la modificación y evaluación de cambios, dirigiéndose todo ello tanto
a personas como a entidades, aunque en este caso tiene que estar presente la activi-
dad humana ya sea de forma directa o indirecta.
Como venimos comentando, la expresión “evaluación psicológica” fue ganando
terreno a otras como “psicodiagnóstico”, siendo en la actualidad el término más uti-

lizado, no sólo en libros de texto sino también en publicaciones periódicas. Así, en
1989 la American Psychological Association (APA) comienza a editar Psychological
Assessment en la que se publican trabajos acerca del desarrollo, la validación y la va-
loración de técnicas de evaluación aplicadas a diversos ámbitos y utilizando cual-
quier método de evaluación (inventarios, entrevistas, observación, registros psicofi-
siológicos, etc.) (Kazdin, 1989). En 1992 la European Association of Psychological
Assessment inicia la publicación del European Journal of Psychological Assessment
en la que tienen cabida trabajos sobre aspectos conceptuales y metodológicos, lega-
les, deontológicos, profesionales y de formación, así como la evaluación clínica y de
la salud, la evaluación neuropsicológica y la investigación en evaluación (Fernández-
Ballesteros y Silva, 1992).
Como se puede apreciar, no existe ninguna diferencia sustancial entre el concep-
to de evaluación psicológica y el de psicodiagnóstico tal como se ha entendido en
España. Sin embargo, en estos últimos años, tanto en la práctica profesional como en
la investigación, el término evaluación ha desplazado casi totalmente al de psicodiag-
nóstico. En un análisis que hemos realizado sobre los términos utilizados en los títu-
los de los trabajos presentados en los cuatro congresos nacionales de evaluación psi-
cológica celebrados en España en 1984, 1987, 1991 y 1994, hemos comprobado que
el término “evaluación” figura en 418 títulos, “valoración” en 29, “(psico)diagnósti-
co” en 28, “análisis” en 22, “medición” en 16 y “examen” en 3. Esta supremacía del
término “evaluación” frente a otros se hace realidad también a nivel académico,
como se ha comentado ya, con la implantación de los nuevos planes de estudio.
Como conclusión tomamos la definición de evaluación psicológica propuesta
por Fernández-Ballesteros (1992a, p. 17):
[...] es aquella disciplina de la psicología científica que se ocupa de la exploración y análisis del
comportamiento (a los niveles de complejidad que se estime oportunos) de un sujeto humano
(o grupo especificado de sujetos) con distintos objetivos básicos o aplicados (descripción,
diagnóstico, selección/predicción, explicación, cambio y/o valoración) a través de un proceso
de toma de decisiones en el que se encardinan la aplicación de una serie de dispositivos, tests y
técnicas de medida y/o evaluación.
Según esto, podríamos decir que los otros conceptos que hemos revisado y los
que vamos a revisar a continuación no serían más que elementos integrantes del pro-
ceso de evaluación.
VI VALORACIÓN
Según el diccionario de la Real Academia Española “valoración” constituye la ac-

ción de reconocer, estimar o apreciar el valor o mérito de una persona o cosa, lo cual
añade un matiz positivo al concepto de evaluación; exactamente lo mismo sucede
con los términos anglosajones assessment y evaluation. Sin embargo, a la hora de tra-
ducir estos vocablos se ha optado en los últimos años, al menos por parte de algunos
autores, por diferenciarlos en otro sentido, traduciendo assessment por “evaluación”
87
y evaluation por “valoración”; así, “valoración” haría referencia a la exploración o

examen de objetos (puestos de trabajo, tratamientos y programas), y “evaluación”
aludiríaa la evaluación psicológica de sujetos, grupos o condiciones ambientales.
Evaluación sería la traducción de assessment, la cual se refiere a una etapa previa de
recogida de datos y su organización de forma interpretable, mientras que valoración
sería la traducción de evaluation y haría referencia al juicio sobre la calidad del pro-
ceso o producto de la evaluación. No obstante, esta diferenciación no está demasia-
do clara como veremos a continuación.
Un autor que defiende la distinción entre evaluación y valoración es Adams
(1964), quien en su obra Measurement and evaluation in education postula que eva-
luación tendría un significado similar al de medida, mientras que la valoración supo-
ne juicios de valor, por tanto va más allá de la evaluación. Adams describe cinco pa-
sos en el proceso de valoración:
Determinación de lo que se quiere valorar.

Definición operativa de lo que se pretende valorar.
Selección de las situaciones adecuadas.
A
LP Registro de las observaciones previstas, de forma que permita un análisis ob-
jetivo.
e. Resumen y síntesis de los datos recogidos y elaborados.
Sin embargo, en nuestra opinión, estos pasos pueden aplicarse de igual forma al
proceso de evaluación, por lo que no constituye una aportación para la diferencia-
ción conceptual de evaluación y valoración. Por su parte, Shertzer y Linden (1979,
pp. 13-14) manifiestan que
la práctica preferida en educación y psicología es emplear el término “evaluación” para refe-
rirse a los métodos y medidas empleados para determinar el estatus o comportamiento de un
individuo, y los términos “apreciación” o “valoración” cuando se hacen juicios de valor acer-
ca de la bondad o utilidad del comportamiento de una persona. A pesar de que el uso diferen-
ciado de estos dos términos expresa una buena intención, es difícil mantenerlo completamen-
te en la práctica porque un programa de evaluación está frecuentemente relacionado con un
proceso total de apreciación (valoración) que implica un juicio de valor.
Existen ejemplos claros en los que se utilizan indistintamente los términos valo-
ración y evaluación: Fernández-Ballesteros y Vila (1983) en evaluación neuropsico-
lógica; por su parte, Álvaro y Cerdán (1988) al referirse a la distinción hecha por
Scriven, hablan de la evaluación formativa y la evaluación sumativa, mientras que
Fernández-Ballesteros (1992b) lo hace de valoración formativa y valoración suma-
tiva.
Otros autores defienden la complementariedad de ambos términos; tal es el caso
de Pelechano (1988) o Álvaro (1990, p. 61) quien considera que
la palabra castellana evaluación tiene dos acepciones diferentes en su traducción al inglés, am-
bas igualmente correctas. Por la primera de ellas, assessment, se entiende la medida u observa-
ción sistemática realizada sobre la extensión o calidad de la consecución de un logro. La se-
gunda, evaluation, implica la emisión de juicios acerca de los objetivos de aprendizaje usando
la información conseguida por medio de assessment.
Un paso más en esta confusa situación lo constituyen las palabras de Fernández-

Ballesteros (1985, p. 12): «[...] hasta aquí creo haber demostrado que evaluación y
valoración —al menos desde un punto de vista técnico en ciencias sociales—no son
conceptos equiparables [...]»; continúa diciendo esta autora: <(...] podemos decir que
las tareas que ha de realizar el valorador y el evaluador son muy semejantes y que tan
sólo varía el “sujeto” de análisis, es decir, la evaluación se dirige a un sujeto humano
mientras que la valoración se refiere a un programa o intervención» (Fernández-
Ballesteros, 1985, p. 17). En definitiva, valoración hace referencia a «la estimación de
las cualidades de un concreto tratamiento, intervención o programa que es aplicado
en un contexto determinado, a unos concretos individuos y con unas repercusiones
conductuales específicas» (Fernández-Ballesteros, 1992b, p. 475).
Sin embargo, este matiz diferenciador entre evaluación y valoración sigue sin es-
tar claro. Así, se utiliza el término “evaluación” para hacer referencia a tratamientos,
como es el caso de Páez, Echeburúa y Borda (1993) en su trabajo «Evaluación de la
eficacia de los tratamientos psicológicos: una propuesta metodológica», o a progra-
mas como el caso de Hernández, Aciego de Mendoza y Domínguez (1994) en su
trabajo «Crecimiento personal y educación en valores sociales: evaluación del pro-
grama PIECAP»; y, al contrario, se está utilizando el término “valoración” para aludir
a características individuales de sujetos, como en el trabajo «Valoración de diversas
variables conductuales en individuos con síndrome de Turner» de Pásaro, Fernán-
dez y Méndez (1993). Esta confusión llega incluso a foros tan especializados como
pueden ser los congresos de evaluación psicológica. Así, en el último congreso na-
cional de evaluación psicológica celebrado en 1994, de los dieciséis trabajos presen-
tados en cuyo título aparece el término “valoración” únicamente la mitad de ellos
hace referencia a programas, intervenciones o tratamientos; por el contrario, de los
veinte trabajos presentados en el área de valoración de programas únicamente nueve
de ellos emplean en el título el vocablo “valoración”, mientras que siete utilizan el de
“evaluación”; es más, uno de los simposia del congreso tenía como título «Evalua-
ción de programas de intervenciones en drogas».
El término valoración es empleado con cierta frecuencia en el campo de la neu-
ropsicología, utilizándose como sinónimo de evaluación (véase por ejemplo Fernán-
dez-Ballesteros [1983, p. 1003] o Kolb y Whishaw [1987, p. 647]). Pero sin duda, en
el ámbito de las técnicas proyectivas es donde más se ha utilizado el término valora-
ción, y una buena muestra es el libro Guía para la valoración del Test de Apercepción
Temática y protocolo de Fernández-Ballesteros (1972) y los textos de Álvarez (1972),
Serrate (1980) y Fernández-Ballesteros, Vizcarro y Márquez (1983).
En nuestra opinión, la sinonimia de los términos “valoración” y “evaluación” se
encuentra ya tan extendida que resulta difícil instaurar una definición semántica in-
novadora del término “valoración” (como por ejemplo, pretender limitar su uso a la
evaluación de programas o intervenciones). De hecho, en la práctica, la mayoría de
los autores sigue utilizando evaluación de intervenciones y evaluación de progra-
mas, tal como puede verse en el título del libro Evaluación externa de la reforma ex-
perimental de las enseñanzas medias, que constituye el informe de una de las mayo-
res evaluaciones sobre programas que se ha realizado en España (Álvaro, 1990). Por
ello, quizás lo más adecuado sea ajustarse a las normas de la Real Academia Española
de la Lengua, utilizando el término “valoración” únicamente para hacer referencia a
89
Juicios positivos, con lo cual el término “evaluación” abarcaría los contextos en los
que se está empleando “valoración”.
VII. EVALUACIÓN CONDUCTUAL
El término “conductual” es un neologismo de uso frecuente que en opinión de Pini-

llos (1989) responde a las crecientes necesidades léxicas de nuestro lenguaje psicoló-
gico. La evaluación conductual surgió al amparo de la terapia de conducta constitu-
yéndose desde el principio como una antítesis de la evaluación tradicional. El primer
término que se utilizó para denominar a este tipo de evaluación fue “análisis conduc-
tual” (behavioral analysis) que era el título del artículo de Kanfer y Saslow (1965),
que marca el inicio de la evaluación conductual. Con el paso de los años el término
cae en desuso, puesto que la evaluación conductual evolucionó adoptando modelos
explicativos distintos, complementarios o alternativos a los modelos operantes que
constituyen la base del análisis conductual (Silva, 1993); de hecho, esta expresión no
comenzó a ser frecuente hasta mediados de la década de los años setenta. Desde la
publicación del trabajo de Kanfer y Saslow ha aparecido una serie de expresiones ta-
les como “análisis funcional de la conducta”, “análisis aplicado de la conducta”,
“diagnóstico conductual”, lo cual ha incrementado la complejidad conceptual. A
continuación se hace una breve definición de estos términos (para un análisis más
detallado, véase Silva [1989], Godoy [1991] y Silva y Martorell [1991]).
La expresión “diagnóstico conductual” (behavioral diagnosis) fue utilizada por
Kanfer y Saslow (1969) para hacer referencia a un proceso que incluía las siguientes
metas:
Análisis de la situación problema

Delimitación de la situación problema
Análisis motivacional
Análisis del desarrollo
Análisis del autocontrol
Análisis de las relaciones sociales
Análisis
IS del desarrollo social, cultural y físico
Posteriormente, Schulte (1980) sintetiza todo el proceso en tres fases:
a. Identificación de las características topográficas de la conducta de un sujeto

que requieren modificación en su frecuencia, intensidad o duración, o en las
condiciones en las que se produce la conducta.
b. Delimitación de las condiciones en las que se adquirió la conducta y de los
factores que la mantienen.
€. Decidir los medios de intervención más adecuados para producir los cam-
bios deseados.
Sin embargo, tal como señala Silva (1993), el empleo de esta expresión no es re-
comendable dadas las fuertes connotaciones psiquiátricas propias del modelo médi-
co que posee el término “diagnóstico”. ys
El “análisis aplicado de la conducta” (applied behavior analysis) fue definido por
Baer, Wolf y Risley (1968, 1987) en el primer número de la revista Journal of Applied
Behavior Analysis como un proceso de aplicación de principios del comportamiento
al desarrollo de conductas específicas y a la evaluación de si los cambios producidos
son debidos a la aplicación de dichos principios. Según Kazdin (1991), debe conside-
rarse como un procedimiento de análisis y tratamiento que se basa en los métodos del
condicionamiento operante y que pone énfasis en los antecedentes y consecuentes,
no aceptando estados mediacionales, acontecimientos privados ni cogniciones. El
análisis aplicado de la conducta se caracteriza por un enfoque metodológico particu-
lar e incluye la evaluación experimental de la conducta, empleando preferentemente
diseños intrasujeto con medidas repetidas. El polo opuesto del análisis conductual
aplicado es el análisis experimental de la conducta; así, mientras que el primero se cen-
tra en el estudio de conductas socialmente importantes en sus contextos sociales habi-
tuales, el segundo analiza el comportamiento dentro de un contexto de laboratorio.
Por último, el “análisis funcional de la conducta” (functional behavior analysis)
fue definido por Peterson (1968) como un proceso que cumple las siguientes carac-
terísticas:
a. Realizar una observación sistemática de la conducta problema para obtener

una línea base de frecuencia de conductas.
b. Realizar una observación sistemática de las condiciones estimulares antece-
dentes o consecuentes a la conducta, con atención especial a los estímulos
discriminativos y a los refuerzos.
c. Manipulación experimental de la condición que aparece como causalmente
relacionada con la conducta problema.
d. Realizar observaciones y registros de los cambios que se producen en la con-
ducta.
Para Owens y Ashcroft (1982), el análisis funcional de la conducta aborda un

problema intentando responder a cuestiones que se relacionan con la función del
problema en el sistema (entendido como un todo). Para ello se recoge información
acerca de los antecedentes (A), de la conducta (B) y de los consecuentes (C), lo que se
conoce como el paradigma ABC. El análisis funcional implica en un primer momen-
to el establecimiento mediante una observación rigurosa de las relaciones entre el
comportamiento-problema y las condiciones ambientales antecedentes o conse-
cuentes, ampliando más tarde las condiciones estimulares a ciertos eventos internos
que preceden o siguen a la conducta objeto de estudio (Fernández-Ballesteros,
1994). Según Haynes y O'Brien (1990, p. 654), el análisis funcional consiste en «la
identificación de relaciones funcionales causales, controlables e importantes aplica-
bles a un conjunto específico de conductas de un paciente individual». Sin embargo,
esta tarea, tal como señala Silva (1993), no es fácil de llevar a la práctica, pues com-
promete conductas de tipo motor, psicofisiológico y cognitivo, cadenas conductua-
les que implican enlaces funcionales R-R (o R = E-R), covariaciones conductuales,
multitud de variables estimulares, etc. Todo ello hace que el análisis funcional de la
21
conducta sea un verdadero proceso de investigación que implica la formulación y

contrastación de hipótesis, así como la formulación de modelos explicativos.
En la actualidad, todos estos conceptos anteriores se incluyen dentro de lo que se
entiende por evaluación conductual (Silva, 1989, 1993; Silva y Martorell, 1991). La
evaluación conductual alcanza un gran desarrollo a finales de la década de los seten-
ta, encontrándose en la actualidad, según diversos autores (Bellack y Hersen, 1988;
Cone, 1988, 1993; Krasner, 1992; Hayes y Follete, 1993; Fernández-Ballesteros,
1994), en una profunda crisis.
Nelson y Hayes (1981) definen la evaluación conductual como la identificación
y medición de unidades significativas de respuesta y de las variables ambientales y
organísmicas que la controlan, con la intención de explicar y modificar la conducta
humana. Ésta es una de las definiciones más aceptadas por los diversos autores, aun-
que se considera incompleta, pues se echa en falta la extensión de la evaluación con-
ductual al tratamiento y al seguimiento, no limitándose únicamente al pretratamien-
to, pues tal como indica Barrios (1988), la evaluación conductual surge para cubrir
unas necesidades del tratamiento conductual. Además, tal como afirman McRey-
nolds (1986) y Mischel (1988), la evaluación conductual se debe abrir —y de hecho
lo está haciendo— a ámbitos distintos del tratamiento.
En los últimos años la evaluación conductual ha tenido una gran expansión a ni-
vel teórico, metodológico y aplicado, lo cual supone que el concepto de conducta
implique los tres sistemas de respuesta propuestos por Lang (1968). Así, la inclusión
del sistema cognitivo-verbal permite abordar los fenómenos encubiertos o subjeti-
vos. Sin embargo, no todos los autores aceptan esta conceptualización de la evalua-
ción conductual. Por tanto, en realidad, siguen existiendo diversas concepciones,
que, tal como ha señalado Cone (1986), lleva a que existan varias evaluaciones con-
ductuales, lo cual no es más que un espejo de la situación actual en terapia de con-
ducta (Franks, 1991). Por ello, podemos concluir con la definición de evaluación
conductual propuesta por Fernández-Ballesteros (1994, p. 53):
aquella alternativa a la evaluación psicológica a través de la cual se trata de identificar las con-
ductas objeto de estudio, tanto motoras como fisiológicas o cognitivas, así como las variables
ambientales y/o personales que las mantienen y controlan, con el objetivo de realizar un tra-
tamiento o cualquier otro tipo de intervención conductual y su valoración.
Como se puede apreciar en esta definición, el concepto de evaluación conduc-

tual ha evolucionado, no limitándose únicamente a la modificación de conducta e in-
cluyendo variables personales.
En definitiva, lo que hoy entendemos por evaluación conductual constituye una
modalidad de evaluación con unas características teóricas, metodológicas y aplica-
das propias que la diferencian de otras variantes de la evaluación psicológica (Silva,
1993; Fernández-Ballesteros, 1994; S. N. Haynes, comunicación personal, 23 de
septiembre de 1995). Así, la evaluación conductual plantea como objetivo funda-
mental el cambio de la conducta, la cual se puede explicar a través de múltiples varia-
bles (multicausalidad de la conducta): historia de aprendizaje del sujeto, variables
biológicas y ambientales, y la interacción de todas ellas (Haynes y O'Bryen, 1990;
Haynes, 1994; Haynes y Wai'Alae, 1994; Haynes, 1995). Este tipo de evaluación di-
rigida al tratamiento exigirá un acercamiento idiográfico a las conductas problema,

pero sin rechazar aproximaciones de carácter nomotético que permitan, por ejem-
plo, una clasificación del sujeto de cara a la comunicación interprofesional o su com-
paración en función de unas puntuaciones normativas (por ejemplo, las puntuacio-
nes de un paciente depresivo en la Escala de depresión de Beck), sin olvidar que la
evaluación conductual está basada en principios (nomotéticos) que explican las con-
ductas. Otro elemento propio de la evaluación conductual es el énfasis puesto en la
determinación ambiental de la conducta; sin duda, dentro del polo exógeno-endóge-
no de Coan, la evaluación conductual es la orientación que más se ajusta al extremo
exógeno. Sin embargo, el concepto de ambiente ha experimentado cambios a lo lar-
go de la historia del modelo, evolucionando desde una perspectiva molecular a plan-
teamientos molares. Por último, se asume que la aproximación a las diferentes varia-
bles objeto de evaluación exigen unos niveles mínimos de inferencia, incluso los
constructos conductuales (Haynes, 1992).
VIM. OTROS TÉRMINOS
Existen otros términos que frecuentemente se han asociado a la evaluación psicoló-

gica, pero que consideramos que deben ser integrados dentro de ella; entre éstos des-
tacan el de medida psicológica y examen psicológico.
vuL1. Medida psicológica

Algunos textos anglosajones de esta disciplina como el Wechsler's measurement and
apraisal of adult intelligence de Matarazzo (1976), Tests and measurements de Tyler
y Walsh (1979), Measuring human problems de Peck y Shapiro (1990) o Measure-
ment and evaluation in psychology and education de Thorndike, Cuningham,
Thorndike y Hagen (1991) utilizan el término measurement (medida). La medida
psicológica sería el proceso de asignar números a personas de tal forma que algunos
de los atributos medidos sean fielmente reflejados por algunas propiedades de los
números (Murphy y Davidshofer, 1991). Según estos autores las propiedades de los
números pueden ser empleadas para representar propiedades de las personas, lo cual
ejemplifican del siguiente modo:
$_-É---MMMmm
|
Propiedades de los números 2, 4 y 16 Propiedades de las personas A, B y C
_ _222. A E ERP PAI EIN A A
2 es diferente de 4, 4 es diferente de 16 Aes diferente de B, B es diferente de C
16 es mayor que 4, 4 es mayor que 2 C tiene más del atributo X que B, B presenta
más que A
La diferencia entre 16 y 4 es mayor que La diferencia en el atributo X entre C yBes
la diferencia entre 4 y 2 mayor que la diferencia entre B y A
—_—_a—a —oco co — _ o a QuOoUuoumnuNINIXIIAA
Pelechano (1988) entiende por medida psicológica el conjunto de recursos y

procedimientos cuantitativos mediante los que se intenta establecer relaciones entre
conceptos abstractos e indicadores empíricos, pudiendo emplearse para ello la esta-
dística. Sin embargo, a diferencia de la medición de objetos, donde los números re-
presentan magnitudes exactas y precisas, la medición en psicología se refiere a varia-
bles psicológicas y por tanto la asignación numérica podrá ser directa o indirecta,
dependiendo del tipo de variable que se pretenda cuantificar. La asignación de valo-
res numéricos a las variables psicológicas se hace por medio de las escalas de medida.
Según Martin (1988), la medida implica asignar números a características de las per-
sonas, siendo los tests los procedimientos que permiten exponer al sujeto a situacio-
nes en las que es posible obtener de su conducta una puntuación numérica. Esta aso-
ciación queda clara al afirmar que el «test no tiene otro poder que el de la medición;
las demás cualidades que se le atribuyen, predicción, diagnóstico, no son sino conse-
cuencias de su principal función de medir» (Forns, Buira y Doménech, 1980, p. 32).
La asignación de valores numéricos a las variables psicológicas se hace a través de
las escalas de medida. En función del tipo de escala utilizada, nominal, ordinal, inter-
valo, razón o proporción, el valor numérico implicará un tipo distinto de informa-
ción. En las escalas nominales los números son como etiquetas asignadas de forma
arbitraria y tan sólo permiten hablar de igualdad-desigualdad. Las escalas ordinales
además de determinar la igualdad o desigualdad permiten establecer una clasifica-
ción jerárquica de variables o de sujetos. En las escalas de intervalo se parte de un ni-
vel arbitrario, hay una unidad constante y permite una cuantificación en cuanto al
tamaño, pero expresado en intervalos. En la escala de proporción los números dan
información, además del orden de rango y del tamaño relativo, de la relación entre
las proporciones; la relación no es arbitraria como en el caso anterior, sino que guar-
da una relación con las magnitudes básicas y, por tanto, se parte de un cero absoluto
(Tyler y Walsh, 1979).
Es necesario distinguir entre medición y medida. La primera se refiere a una ope-
ración empírica y la segunda al grado o intensidad, es decir, lo que las operaciones de
medición tratan de determinar. Una vez que se ha formulado un concepto cuantita-
tivo, que se supone representa con fidelidad una propiedad, se procede a la búsqueda
de ciertos valores de la función en cuestión. Ahora bien, las propiedades pueden ser
directamente observables, como ocurre con algunas variables conductuales y fisio-
lógicas, en cuyo caso la medición es directa. Pero en psicología la mayoría de las va-
riables es inaccesible a la observación directa, por lo que es necesario recurrir a obje-
tivadores o indicadores adecuados, es decir, medir otras variables observables
relacionadas con las inobservables que se pretenden cuantificar (Bunge y Ardila,
1988).
vu. Examen psicológico

Aunque con menor frecuencia que los anteriores, el término “examen” también ha
aparecido en algunos textos relacionados con la evaluación psicológica. El uso de
este término en el contexto de la evaluación tiene un claro antecedente en la obra de
Huarte de San Juan Examen de ingenios para las ciencias publicada en 1575. Ya en el
presente siglo Xoan Viqueira publica, en 1917, un artículo titulado «Los métodos
del examen de la inteligencia». Sin embargo, este término no fue muy utilizado pos-
teriormente, salvo raras excepciones, como, por ejemplo, en el libro El diagnóstico
neuropsicológico de Luria, donde a pesar de que en la portada aparece la palabra
diagnóstico, en el interior, tanto en el prólogo, en el índice, como en el texto, se utili-
za continuamente el término examen. También aparece como título de algún libro,
como por ejemplo en El examen clínico en psicología de Rey. En los textos recientes,
tal vez sea en Psicodiagnóstico y estadística de Forns y cols. (1980) en donde se utiliza
el término con mayor asiduidad, definiéndose como «el conjunto de acciones enca-
minadas a comprender lo que un sujeto en consulta psicológica transmite al psicólogo
acerca de sus propias aptitudes, actitudes y vivencias, que permiten prever su desa-
rrollo futuro o tomar las decisiones oportunas en vistas a solucionar algún problema»
(Forns y cols., 1980, p. 49).
Sin embargo, en España como consecuencia del predominio que tuvo el término
“psicodiagnóstico” hasta hace poco y la implantación del de “evaluación psicológi-
ca”, el empleo de “examen psicológico” es casi nulo, aunque a nivel más popular
suele usarse con relativa frecuencia la expresión “examen psicotécnico”.
IX. LAEVALUACIÓN PSICOLÓGICA A TRAVÉS DE SUS ACTIVIDADES
Tal como se comentó al principio de este capítulo vamos a intentar realizar una apro-
ximación al concepto de evaluación psicológica a través de las actividades realizadas
en la actualidad por los profesionales de la psicología que están estrechamente rela-
cionadas con esta disciplina pues, como bien es sabido, la evaluación psicológica
constituye una parte importante de la psicología aplicada. Para tal acercamiento he-
mos optado por tres vías diferentes: aportaciones científicas a algunos congresos re-
levantes para la disciplina, algunas publicaciones importantes de esta disciplina en
los últimos cinco años y la actividad evaluadora del psicólogo.
IX.1. Congresos
Si analizamos dos congresos de carácter general, uno de ellos nacional (1! Congreso
del Colegio Oficial de Psicólogos celebrado en 1990) y otro internacional (23nd In-
ternational Congress of Applied Psychology celebrado en 1994), la evaluación psi-
cológica es una disciplina que está presente en la psicología clínica y de la salud, psi-
cología del trabajo y de las organizaciones, psicología educativa, servicios sociales,
psicología del tráfico y seguridad vial, psicología jurídica, psicología del deporte,
psicología ambiental, etc. Por otro lado, si analizamos los dos últimos congresos de
evaluación psicológica celebrados en 1991 y 1994, nos encontramos que junto a las
tres áreas clásicas (psicología clínica, psicología escolar y psicología del trabajo) van
surgiendo otros ámbitos de aplicación como la evaluación de programas, evaluación
ambiental o evaluación neuropsicológica. Todos estos ámbitos son parte de la actual
95
1x2. Publicaciones
S1 tenemos en cuenta los artículos publicados en Behaviour Research and Therapy

(sección de Evaluación conductual), European Journal of Psychological Assessment,
Journal of Personality Assessment y Journal of Psychopathology and Behavioral As-
sessment durante losprimeros cinco años de la década de los noventa nos encontra-
mos con tres grandes bloques que forman la evaluación psicológica: aspectos con-
ceptuales, aspectos metodológicos y aplicaciones de esa metodología a diferentes
ámbitos, siendo más importante el segundo; es decir, la mayoría de los trabajos pu-
blicados hacen referencia a la elaboración y desarrollo de nuevos instrumentos de
evaluación (cuestionarios, inventarios, escalas, etc.) o a la revisión de pruebas clásicas
de la evaluación psicológica (MMP1, Rorschach, TAT, etc.). Por otro lado, en segundo
lugar, se encuentra un importante número de trabajos dedicados a la aplicación de la
evaluación psicológica en distintos ámbitos (psicología clínica y de la salud, inteli-
gencia, evaluación ambiental, etc.). El tercer apartado en importancia lo constituyen
los aspectos conceptuales.
IX3. Actividades profesionales

Las actividades profesionales realizadas por los psicólogos nos pueden acercar tam-
bién al concepto de evaluación psicológica. Así, si nos centramos en el estudio de
Díaz y Quintanilla (1992), encontramos que entre las tareas realizadas por los psicó-
logos colegiados en España se incluyen las siguientes: diagnóstico de pacientes
(45,20%), realización de entrevistas de diagnóstico clínico (45%), diagnóstico y/o
tratamiento de problemas de ansiedad en niños, jóvenes y adultos (41%), diagnósti-
co y/o tratamiento de problemas de depresión en niños, jóvenes y adultos (39,90%),
diagnóstico y/o tratamiento de dificultades del aprendizaje en niños y adolescentes
(39,60%), diagnóstico y/o tratamiento de problemas escolares (38,90%), diagnósti-
co de pacientes y posterior remisión a otro profesional (38,40%), diagnóstico y/o
tratamiento de problemas de conducta en el aula (35,70%), elaboración de informes
de diagnóstico de niños (34,60%), elaboración de informes sobre niños evaluados y
tratados (34,40%), diagnóstico y/o tratamiento de problemas de lenguaje en niños y
adultos (32,10%), análisis de disfunciones familiares (31%), participación en proce-
sos de selección de personal como evaluador (18,50%), realización de entrevistas de
selección de personal (17,80%), administración de pruebas de evaluación para selec-
ción de personal (17,60%), evaluación psicológica de candidatos a un puesto de tra-
bajo (17,10%), corrección de pruebas de evaluación para la selección de personal
(16,70%), valoración y análisis de datos obtenidos en las pruebas psicotécnicas para
la selección de personal (16,40%), valoración y preselección de candidaturas para
una selección de personal (15,90%), realización de informes de selección para las
empresas solicitantes (14,40%), diagnóstico general mediante entrevista y pruebas
psicológicas a solicitud del juez o de los propios interesados (10,20%), evaluación de
distintas capacidades y aptitudes en los aspirantes a la obtención y renovación de los
distintos carnets de conducir (6,90%), evaluación de los resultados de un programa
de intervención en servicios sociales (6,60%), evaluación de la personalidad en los

aspirantes a la obtención y renovación de los distintos carnets de conducir y de per-
misos y licencias de armas (6%), elaboración de informes globales de menores a soli-
citud de un juez (5,80%), evaluación del nivel de inteligencia y de lectoescritura en
los aspirantes analfabetos a la obtención o la renovación de los distintos carnets de
conducir y licencias de armas (5,30%) y, por último, diagnóstico personalizado
de problemas derivados de la drogodependencia (4,90%). En resumen, la evaluación
psicológica está presente en la actividad profesional en todos los ámbitos de la psico-
logía aplicada.
X. CONCLUSIONES
A modo de síntesis, podemos concluir diciendo que en la actualidad la evaluación

psicológica hace referencia a un concepto que engloba la aplicación de tests y el psi-
codiagnóstico (además de otros términos revisados como valoración, medida o exa-
men). La aplicación de tests constituye Únicamente una pequeña parte del proceso
de recogida de información que supone la evaluación psicológica; esta última disci-
plina va más allá de la simple recogida de información, pues exige la formulación de
hipótesis, su contrastación, así como la toma de decisiones con respecto a los instru-
mentos con el fin de alcanzar unos objetivos preestablecidos (descripción, clasifica-
ción, predicción y/o cambio), lo cual exige del evaluador una serie de conocimientos
teóricos que no necesitaría en principio el “aplicador de tests”. Por lo que respecta al
psicodiagnóstico, aparte de la connotación médica y psicodinámica del término, deja
de tener sentido en el momento en que las demandas de evaluación se amplían de
una persona concreta a un grupo, a un ambiente o a un programa o tratamiento.
Veamos algunos ejemplos. Un psicólogo que en un centro psiquiátrico realiza
una exploración exhaustiva de un determinado paciente (a través de entrevistas con
él y sus familiares, diferentes tests psicológicos, observación de su conducta, etc.)
con el fin de establecer un diagnóstico y recomendar un determinado tratamiento,
está realizando una evaluación psicológica. Por su parte, otro psicólogo que trabaja
en un centro escolar y realiza una evaluación detallada de las aptitudes intelectuales,
de los intereses y preferencias profesionales de un grupo de alumnos con el objetivo
de orientarles en una carrera universitaria realiza también una evaluación psicológica.
Otro psicólogo, en este caso en una empresa, debe realizar una selección de personal
para determinados puestos laborales, para lo cual realiza una serie de entrevistas,
aplica diversos tests, etc. y elige a los mejores candidatos; también este psicólogo ha
realizado una evalución psicológica. Por último, un grupo de psicólogos analiza los
efectos que ha tenido sobre la población un programa para dejar de fumar, para lo
que evalúan los cambios conductuales producidos por la intervención; esta acción
también constituye una labor de evaluación psicológica.
En todos estos ejemplos, y en otros muchos que se podrían citar, se incluye una
serie de actividades de exploración y análisis de conductas o aspectos psicológicos
relacionados con un sujeto o grupo de sujetos que exigen un proceso de toma de
decisiones. Las diferencias entre todas estas actividades radican en los diferentes obje-
tivos y en los distintos contextos en los que se llevan a la práctica. Por ello, tal como
indica Fernández-Ballesteros (1992c), no es de extrañar que tal diversidad de activi-
dades, contextos y objetivos psicológicos haya dado lugar a lo largo del tiempo y de
los distintos contextos culturales, a que las actividades de evaluación psicológica ha-
yan adoptado distintas denominaciones. Así, se emplea el término “psicodiagnósti-
co” en un período de dominio del modelo médico, generalizándose posteriormente,
en el caso concreto de España, a prácticamente toda la evaluación psicológica, decre-
ciendo en los últimos años su ámbito de generalidad, limitándose su aplicabilidad a
aquellas situaciones en las que el objetivo de la evaluación es el diagnóstico psicoló-
gico, es decir, establecer la clasificación del sujeto con fines clínicos. Un fenómeno
similar sucedió con el término “aplicación de tests” que como consecuencia de la re-
levancia del modelo psicométrico ha llevado a la equiparación de la evaluación psi-
cológica con los tests psicológicos. Sin embargo, en la actualidad, aunque los tests
psicológicos (y las técnicas de evaluación en general) juegan un papel importante en
el proceso de evaluación, existe un consenso general en considerar a la evaluación
como un concepto más amplio que la mera aplicación de tests, que incluye la inte-
gración de toda la información recogida.
Los argumentos expuestos con anterioridad justifican el empleo del término
“evaluación psicológica”. Pero además, en la actualidad, cualquier otro concepto de
los revisados queda desfasado por el hecho de que en los últimos años la evaluación
psicológica ha ampliado su objeto de estudio, no limitándose única y exclusivamente
a las características psicológicas de las personas, sino que abarca contextos específicos
(evaluación del ambiente), tratamientos, programas o intervenciones (evaluación de
programas). Por todo ello, la evaluación psicológica constituye el estudio científico, a
través de diferentes procedimientos de recogida de información (entre otros muchos,
los tests psicológicos), de las actividades o características psicológicas de una persona
(o grupo específico de personas), ambientes específicos y/o intervenciones con el ob-
jetivo de alcanzar unos objetivos propuestos (entre ellos el diagnóstico).
Por último, la evaluación conductual, después de un período de gran auge y ex-
pansión en el que se presentaba incluso como una alternativa a toda la evaluación
psicológica, en la actualidad constituye un modelo más dentro de una disciplina en la
que se defiende de una forma cada vez más generalizada una aproximación de los di-
ferentes enfoques. Así, los evaluadores conductuales utilizan técnicas de evaluación
tradicional (Piotrowski y Keller, 1984), y para muchos autores la crisis de la evalua-
ción conductual ha dado lugar a una aproximación en la evaluación psicométrica
(Cone, 1988; Silva, 1989).
Adams, G. (1964). Measurement and evaluation in education, psychology and guidance.

Nueva York. Holt, Rinehart and Winston. EN
Aguilar.
Álvaro, M. (1990). Evaluación externa de la reforma experimental de las enseñanzas medias

(11). Madrid. MEC. A
Álvaro, M. y Cerdán, ]. (1988). De la evolución externa de la reforma de las enseñanzas me-
dias a la evaluación permanente del sistema educativo. Revista de Educación, 287, 181-
220%
Baer, D., Wolf, M. y Risley, T. (1968). Some current dimensions of applied behavior analysis.
Journal ofApplied Behavior Analysis, 1, 91-97. ; :
Baer, D., Wolf, M. y Risley, T. (1987). Some still-current dimensions of applied behavior
analysis. Journal ofApplied Behavior Analysis, 20, 313-327.
Barrios, B. A. (1988). On the changing nature of behavioral assessment. En A. S. Bellack y
M. Hersen (dirs.), Behavioral assessment: A practical handbook (3* ed.). Nueva York. Per-
gamon Press.
Bellack, A. S. y Hersen, M. (1988). Future directions of behavioral assessment. En A. S, Be-
llack y M. Hersen (dirs.), Behavioral assessment. A practical handbook (3* ed.). Nueva
Berenguer, G. y Quintanilla, L. (1994). La imagen de la psicología y los psicólogos en el Esta-
do español. Papeles del Psicólogo, 58, 41-68.
Blanco, A. (1986). Bases conceptuales e históricas del psicodiagnóstico. En A. Blanco (dir.),
Apuntes de psicodiagnóstico. Valencia. Promolibro.
Blanco, A. y León, J. (1983). Situación actual de la enseñanza del psicodiagnóstico. Revista de
Psicología General y Aplicada, 38, 753-772.
Bunge, M. y Ardila, R. (1988). Filosofía de la psicología. Barcelona. Ariel.
Carbonell, E. J., Carpintero, H. y Silva, F. (1988). La evaluación psicológica vista por los eva-
Cone, J. D. (1986). Idiographic, nomothetic, and related perspectives in behavioral assess-
ment. En R. O. Nelson y S. C. Hayes (dirs.), Conceptual foundations of behavioral assess-
ment. Nueva York. Guilford Press.
Cone, J. D. (1988). Psychometric considerations and the multiple models of behavioral as-
sessment. En A. S. Bellack y M. Hersen (dirs.), Behavioral assessment. A practical hand-
book (3* ed.). Nueva York. Pergamon Press.
Cone, J. D. (1993). The current state of behavioral assessment. European Journal of Psycholo-
Corsin1, R. (1987). Encyclopedia ofpsychology. Nueva York. Wiley.
Cronbach, L. J. (1972). Fundamentos de la exploración psicológica. Madrid. Biblioteca Nue-
va.
Cronbach, L. J. (1990). Esentials of psychological testing (5* ed.). Nueva York. Harper and
Row.
Díaz, R. y Quintanilla, [. (1992). La identidad profesional del psicólogo en el Estado español.
Papeles del Psicólogo, 52, 22-74.
Fernández-Ballesteros, R. (1972). Guía para la valoración del test de apercepción temática y
protocolo. Madrid. CCP.
e OS R. (1980). Psicodiagnóstico. Concepto y metodología. Madrid. Cincel-
apelusz.
Fernández-Ballesteros, R. (1985). Evaluación psicológica y evaluación valorativa. Evaluación
Psicológica/Psychological Assessment, 1,7-31.
Fernández-Ballesteros, R. (19924). Introducción. En R. Fernández-Ballesteros (dir.), Intro-
ducción a la evaluación psicológica. Madrid. Pirámide.
Fernández-Ballesteros, R. (1992b). Valoración de programas. En R. Fernández-Ballesteros
(dir.), Introducción a la evaluación psicológica. Madrid. Pirámide.
Fernández-Ballesteros, R. (1992c). Conceptos y modelos básicos. En R. Fernández-Balleste-

ros (dir.), Introducción a la evaluación psicológica. Madrid. Pirámide.
Fernández-Ballesteros, R. (1994). Evolución histórica de la evaluación conductual. En
R, Fernández-Ballesteros (dir.), Evaluación conductual hoy. Un enfoque para el cambio
Fernández-Ballesteros, R. y Silva, F. (1992). Editorial statement. European Journal of Psy-
chological Assessment, 8, 1.
Fernández-Ballesteros, R. y Vila, E. (1983). Evaluación psiconeurológica. En R. Fernández-
Ballesteros (dir.), Psicodiagnóstico. Madrid. UNED.
Fernández-Ballesteros, R., Vizcarro, C. y Márquez, M. (1983). Técnicas proyectivas. En
R. Fernández-Ballesteros (dir.), Psicodiagnóstico. Madrid. UNED.
Forns, M., Buira, C. y Doménech, J. (1980). Psicodiagnóstico y estadística. Barcelona. CEAC.
Franks, C. M. (1991). Orígenes, historia reciente, cuestiones actuales y estatus futuro de la te-
terapia y modificación de conducta. Madrid. Siglo XXI.
Godoy, A. (1991). El proceso de la evaluación conductual. En V. E. Caballo (dir.), Manual de
técnicas de terapia y modificación de conducta. Madrid. Siglo XXL
Goldstein, G. y Hersen, M. (dirs.) (19904). Handbook of psychological assessment (2* ed.).
Nueva York. Pergamon Press.
Goldstein, G. y Hersen, M. (1990b). Historical perspectives. En G. Goldstein y M. Hersen
Graham,J.R. y Lilly, R. S. (1984). Psychological testing. Nueva Jersey. Prentice Hall.
Groth-Marnat, G. (1990). Handbook ofpsychological assessment. Nueva York. Wiley.
Hayes, S. C. y Follete, W. C. (1993). The challenge faced by behavioral assessment. European
Journal of Psychopathological Assessment, 9, 182-188.
Haynes, S. N. (1992). Behavioral assessment. En M. Hersen, A. E. Kazdin y A. S. Bellack
(dirs.), The clinical psychology handbook (2* ed.). Nueva York. Pergamon Press.
Haynes, S. N. (1994). Juicio clínico y diseño de programas de intervención conductual: esti-
mación de la magnitud de los efectos de la intervención. Psicología Conductual, 2, 165-
184,
Haynes, S. N. (1995). Causalidad multivariada en psicopatología: introducción a los modelos
causales. En V. E. Caballo, G. Buela-Casal y J. A. Carrobles (dirs.), Manual de psicopato-
logía y trastornos psiquiátricos (vol. 1). Madrid. Siglo XXI.
Psychology Reviez, 10, 649-668.
Haynes, S. N., Richard, D. C. y Kubany, E. S. (1995). Content validity in psychological as-
sessment: A functional approach to concepts and methods. Psychological Assessment, 7,
238-247.
Haynes, S. N. y Wal'Alae, K. (1994). Fundamentos psicométricos de la evaluación conduc-
tual. En R. Fernández-Ballesteros (dir.), Evaluación conductual hoy. Un enfoque para el
cambio en psicología clínica y de la salud. Madrid. Pirámide.
Hernández, P., Aciego de Mendoza, R. y Domínguez, R. (1994). Crecimiento personal y
educación en valores sociales: evaluación del programa PIECAP. Revista de Psicología Ge-
neralyAplicada, 47, 339-347.
538.
Kanfer, F. y Saslow, G. (1969). Behavioral diagnosis. En C. Franks (dir.), Behavior therapy:
Appraisal and status. Nueva York. McGraw Hill. e Fs
Kaplan, R. M. y Saccuzzo, D. P. (1993). Psychological testing. Principles, applications, and 15-
Kazdin, A. (1989). Editorial. Psychological Assessment, 1, 3-5.
V. E. Caballo (dir.), Manual de técnicas de terapia y modificación de conducta. Madrid. Si-

lo XXL :
Kelly,E. (1969). La valuación de las cualidades humanas. Alcoy. Marfil.
Kolb, B. y Whishaw, 1. (1987). Fundamentos de neuropsicología humana. Barcelona. Labor.
Krasner, L. (1992). The concept of syndrome and functional analysis: Compatible or incom-
patible. Behavioral Assessment, 14, 307-322.
J. Shilen (dir.), Research in psychotherapy (vol. 3). Washington. APA.
Lidz, C. S. (1981). Improving assessment ofschoolchildren. San Francisco. Jossey-Bass.
Maloney, M. y Ward, M. (1976). Psychological assessment. A conceptual approach. Nueva
York. Oxford University Press. á
Martin, R. P. (1988). Assessment ofpersonality and behavior problems. Nueva York. Guil-
ford Press.
Martínez Freire, P. (1981). Teoría general de la definición. En MEC (dir.), Lógica, epistemolo-
gía y teoría de la ciencia. Madrid. MEC.
Martorell, C. (1985). Psicodiagnóstico (temas de metodología). Valencia. Promolibro.
Mash, E. J. y Terdal, L. G. (1974). Behavior therapy assessment: Diagnosis, design and eva-
luation. Psychological Reports, 35, 587-601.
Matarazzo, J. D. (1976). Wechsler's measurement and apraisal of adult intelligence. Baltimo-
re. Williams and Wilkins Company.
McReynolds, P. (1968). Advances in psychological assessment (vol. 1). Palo Alto. Science and
Behavior Books Inc.
MckReynolds, P. (1986). History of assessment in clinical and educational settings. En R. O.
Nelson y S. C. Hayes (dirs.), Conceptual foundations of behavioral assessment. Nueva
McReynolds, P. (1990). Introduction. En P. McReynolds, J. Rosen y G. Chelune (comps.),
Advances in psychological assessment (vol. 7). Nueva York. Plenum Press.
Mischel, W. (1968). Personality and assessment. Nueva York. Wiley.
Mischel, W. (1988). Revisión del libro Conceptual foundations of behavioral assessment de
R. O. Nelson y S. C. Hayes. Behavioral Assessment, 10, 125-128.
Murphy, K. R. y Davidshofer, C. O. (1991). Psychological testing: Principles and applications
Nelson, R. O. y Hayes, S. C. (1981). Nature of behavorial assessment. En A. S. Bellack y
M. Hersen (dirs.), Behavioral assessment. A practical handbook (2* ed.). Nueva York. Per-
gamon Press.
Owens, R. y Ashcroft, J. (1982). Functional analysis in applied psychology. British Journal of
Clinical Psychology, 21, 181-189.
Páez, D., Echeburúa, E. y Borda, M. (1993). Evaluación de la eficacia de los tratamientos psi-
cológicos: una propuesta metodológica. Revista de Psicología General y Aplicada, 46,
187-198.
Pásaro, E., Fernández, R. y Méndez, J. (1993). Valoración de diversas variables conductuales
en individuos con síndrome de Turner. Revista de Psicología General y Aplicada, 46, 449-
458.
Peck, D. V. y Shapiro, C. M. (1990). Measuring human problems. Chichester. Wiley.
diras D. (1968). The clinical study of social behavior. Nueva York. Appleton-Century-
Crofts.
Pinillos, J. (1989). Prólogo al libro de F. Silva Evaluación conductual y criterios psicométricos.
Madrid. Pirámide.
Piotrowski, C. y Keller, J. (1984). Attitudes toward clinical assessment by members of AABT.
Psychological Reports, 55, 831-838.
Rodrigues-Silva, D. (1991). Docencia, investigación y práctica de la evaluación psicológica en

Portugal. Evaluación Psicológica/Psychological Assessment, 7, 99-111.
Salas, J. (1944). El psicodiagnóstico de Rorschach. Madrid. Morata.
Schulte, D. (1980). El psicodiagnóstico como método para explicar y modificar la conducta.
En K. Pawlik (dir.), Diagnosis del diagnóstico. Barcelona. Herder.
o A. (1980). Ayer y hoy de las técnicas proyectivas en España. Técnicas Proyectivas, 1,
Shertzer, B. y Linden, J. D. (1979). Fundamentals of individual appraisal. Assessment techni-

ques for counselors. Boston. Houghton Mifflin.
Silva, F. (1988). La evaluación psicológica como proceso. Evaluación Psicológica/Psychologi-
cal Assessment, 4, 31-50.
Silva, F. (1989). Evaluación conductual y criterios psicométricos. Madrid. Pirámide.
Silva, F. (1993). La evaluación conductual: concepto y proceso. En F. J. Labrador, J. A. Cru-
zado y M. Muñoz (dirs.), Manual de técnicas de modificación y terapia de conducta. Ma-
drid. Pirámide.
conducta. Madrid. Siglo XXI
Silva, F., Martorell, C., Carbonell, E. y Tortosa, F. (1990). La evaluación psicológica en la psi-
cología de lengua alemana: una aproximación cienciométrica. Evaluación Psicológica/Psy-
chological Assessment, 6, 117-127.
Thorndike, R. M., Cuningham, G. K., Thorndike, R. L. y Hagen, E. P. (1991). Measurement
and evaluation in psychology and education (5* ed.). Nueva York. Maxwell McMillan.
Tranque, F. (1942). El estudio de la personalidad por el psicodiagnóstico de Rorschach. Ma-
drid. CSIC.
Tyler, L. E. y Walsh, W. B. (1979). Tests and measurements (3* ed.). Nueva Jersey. Prentice
Hall.
Weiner, L B. (1972). Does psychodiagnosis have a future. Journal of Personality Assessment,
36, 534-546.

Psicológica/Psychological Assessment, 1,7-31.
(dirs.), The clinical psychology handbook (2* ed.). Nueva York. Pergamon Press.
Nelson, R. O. y Hayes, S. C. (1981). Nature of behaviroal assessment. En A. S. Bellack y
M. Hersen (dirs.), Behavioral assessment. A practical handbook (2* ed.). Nueva York. Per-
gamon Press. E
Silva, F. (1993). La evaluación conductual: concepto y proceso. En F. J. Labrador, J. A. Cru-
drid. Pirámide.
3 3 Ñ % y ire a 7
donna oi nerd aer sta at

Milans ad ibi Comp
ESSir
pl de y
ete
E, 1 5H A a
sit (een. 4 A top e Aoi E da¡decias
ud
ns tiliaél ii y Id hol ¿Y (hs? <) e +10 doo Maia
1 god q ros
cima rien ds he Dds aora Sa ¿50d
3 . Phosiisra Pera + Ss iz
114 UVA La Ls CID ITA Led ca a ¡CUA8.0

j aleta
ha P 4 ri y J K nj SelPA dy ”
LM da A A sbads da dl A A
e TAS
; cs TA A
€ 53
1] >
a» 320330DO ANITA 7
ya ll 4 0 + y
A 20m ibm
ote air a
(UA)
¡eoor "5
Apta4
Y $ i
A pls YA A 21125) y
h AN : "4
h . La ó $4 SOLEADA
y y
) > E
¡e
d 131M A
ml
DIESES “Y
4. MODELOS DE EVALUACIÓN PSICOLÓGICA
GUALBERTO BUELA-CASAL Y J. CARLOS SIERRA
I. INTRODUCCIÓN
La ciencia tiene el objetivo de sintetizar los hechos, consecuencias deductivas, hipó-

tesis y leyes, con la finalidad de comprender la imagen unitaria, estructuralmente co-
herente, de la realidad que representan; es decir, llegar a una síntesis relacional del co-
nocimiento en orden a obtener una idea unitaria de lo real (Monserrat, 1984). En el
proceso de síntesis relacional pueden distinguirse cinco niveles: constructos explica-
tivos, teoría, modelos, formalización y explicación científica. La epistemología es la
ciencia que trata de conocer la naturaleza del conocimiento humano en sus princi-
pios reales y en su funcionamiento real, los tipos de conocimiento y los métodos que
pueden llevarnos a una realización correcta en cada caso. Sin embargo, hay autores
que consideran que la epistemología es una tarea exclusiva de los filósofos de la cien-
cia y que generalmente, salvo algunos científicos preocupados por las cuestiones
epistemológicas, los científicos generan sus propios criterios a partir de la práctica de
la investigación (Manicas y Secord, 1983). Sin embargo, la epistemología debería ser
la lectura preferida de todo científico, pues ésta le ayudará en todo el proceso de la
investigación, desde la elección de los enfoques y métodos más adecuados, delimi-
tación de los objetivos, hasta la evaluación sobre el grado de cientificidad de su co-
nocimiento. En definitiva, se trata de que sea el propio científico quien entienda de
epistemología y no se limite a consultar manuales de metodología científica o a ase-
sorarse por los metodólogos, pues —como señala Fernández Buey (1991)— la vida
de la ciencia palpita en los métodos de investigación de los científicos y no en los tra-
tados de metodología. Se plantea así un acercamiento de la epistemología a la investi-
gación, lo que en el caso de las ciencias sociales es aún más necesario.
En la actualidad se podría distinguir entre “epistemología científica” y “episte-
mología filosófica”. La primera sería la que se practica sobre la investigación científi-
ca, de la cual sería un buen ejemplo la obra de Bunge y Ardila (1988); la segunda se
refiere a aquella que se ocupa de problemas exclusivamente filosóficos, sin aplica-
ción alguna, ni científica ni social, por lo que carece de utilidad; es lo que Salmerón
(1985) denomina «epistemología académica o escolástica». Por fortuna, en los últi-
mos años este tipo de filosofía de la ciencia, constituida al margen de la investigación
científica, está cayendo en descrédito.
El conocimiento de una disciplina no se debe limitar a una aproximación históri-
ca o conceptual; este acercamiento conceptual debe completarse con un análisis por-
menorizado de los modelos relevantes en esa disciplina. En la evolución histórica de
la evaluación psicológica están presentes distintos tipos de actividad evaluadora, que
en general se adscriben a una determinada forma de entender la psicología. Por tan-

to, cada tipo de evaluación se apoya en una teoría que se caracteriza por unos presu-
puestos conceptuales, objetivo, unidades de análisis, método y ámbito de aplicación.
Para facilitar la comprensión de las teorías y sus particulares formas de entender
la evaluación se recurre al uso de modelos analógicos. Así, analizaremos los distintos
modelos de evaluación psicológica que siguen estando vigentes en la actualidad, con
más o menos adeptos. Los modelos deben ser considerados como una representa-
ción tipo de las teorías, por lo que las alusiones a la validez, garantías, críticas, etc. de
un modelo se refieren propiamente a las teorías que representan y no a la calidad de
los modelos. El análisis de los modelos existentes en evaluación psicológica sirve
para clasificar y estructurar los distintos enfoques del proceso de evaluación. Sin em-
bargo, hay que tener presente que esto supone una pérdida de información al pre-
sentar de forma simplificada y conjuntada las aportaciones de diversos autores, y,
por otra parte, no todos los autores aceptan en su totalidad el modelo con el que se
representa su teoría.
IL. DELIMITACIÓN TERMINOLÓGICA Y CONCEPTUAL

m1. Constructos explicativos
El constructo es un proceso de síntesis relacional del conocimiento que convencio-

nalmente no alcanza aún la complejidad de una teoría, es decir, sería un proceso pre-
vio que conduce a una teoría. Sus características epistemológicas podrían resumir-
se en:
a. Sintetizar un conjunto de conocimientos científicos anteriores, en el que se

pueden integrar hechos, deducciones, hipótesis y leyes (los hechos de obser-
vación han sido definidos aisladamente y con anterioridad a la formulación
del constructo).
b. La síntesis relacional puede llevar a establecer otras hipótesis, deducciones o
experimentaciones.
c. Se puede elaborar también partiendo de elementos científicos anteriores.
IL2. Teorías científicas

La teoría sería un constructo explicativo de orden superior, considerándose como
un proceso de conocimiento que ha ido constatando hechos observables y descri-
biéndolos de forma operativa; su interpretación relacional implica hacer inferencias
deductivas, analíticas y estructurales, y la formulación de hipótesis explicativas de
los problemas planteados. Este conjunto de observación, análisis, problematización,
hipótesis y deducción permite descubrir relaciones regulares de hechos que pueden
formularse en forma de leyes. Una teoría supone que en un cierto ámbito de la reali-
dad se ha llegado a una interpretación global lo suficientemente unitaria como para
Modelos de evaluación psicológica 105
posibilitar una imagen coherente. Sin embargo, las teorías no facilitan una coheren-
cia total y absoluta; tan sólo son interpretaciones provisionales del conocimiento
científico disponible hasta ese momento.
Para que una teoría sea científica debe cumplir varios requisitos:
a. Requisitos sintácticos: sistematización o unidad conceptual.

b. Requisitos semánticos: exactitud lingiñística, interpretabilidad empírica, re-
presentatividad y simplicidad semántica.
Cc. Requisitos epistemológicos: consistencia externa, capacidad explicativa, ca-
pacidad predictiva, capacidad unificadora, fecundidad y originalidad.
d. Requisitos metodológicos: escrutabilidad, refutabilidad, confirmabilidad y
simplicidad metodológica.
e. Requisitos filosóficos: principio de parsimonia y solidez metacientífica.
De una manera más simple, Popper (1962) afirma que las teorías son redes que
lanzamos para explicar aquello que llamamos el mundo, para racionalizarlo, expli-
carlo y dominarlo, y tratando de que la malla sea cada vez más pequeña. Las teorías
se construyen a través de un proceso complejo de contrastación deductiva múlti-
ple. Una serie de contrastaciones deductivas proporcionará un conjunto de conoci-
mientos sobre algún campo de la experiencia; al relacionarse de forma unitaria y
coherente se constituirá la teoría. Este proceso supondrá especulación e intuición,
por lo que también deberá someterse a una contrastación deductiva. Para demos-
trar si una teoría es o no válida, este autor distingue cuatro procedimientos para la
contrastación deductiva de una teoría. En primer lugar se puede realizar una com-
paración lógica de sus conclusiones, con lo que se somete a contraste la coherencia
interna del sistema. El segundo procedimiento se refiere al análisis lógico de la teo-
ría, con el objeto de determinar su carácter, viendo si es una teoría empírica (cientí-
fica) o una tautología. El tercer procedimiento consiste en compararla con otras
teorías, lo cual tiene la finalidad de averiguar si la teoría examinada constituye un
avance científico en caso de que sobreviva a las contrastaciones. Y por último, pue-
de contrastarse por medio de la aplicación empírica de las conclusiones que de ella
se deducen. Es decir, se pretende descubrir hasta qué punto satisfarán las conse-
cuencias de la teoría a la práctica, ya sean experimentos puramente científicos o
aplicaciones tecnológicas.
El procedimiento deductivo que se sigue en la contrastación partiría de unos
enunciados previamente aceptados de los cuales se deducen ciertos enunciados sin-
gulares (que se pueden denominar predicciones), que sean susceptibles de contrasta-
ción. Entre estos enunciados se seleccionan los que no se deducen de la teoría vigen-
te y los que se encuentran en contradicción con ella. Posteriormente, se trata de
decidir sobre los enunciados deducidos, comparándolos con los resultados obten1-
dos de la aplicación práctica o de la experimentación. Si las predicciones resultan
aceptadas o verificadas, la teoría ha superado con éxito las contrastaciones. Pero si la
decisión es negativa, o sea, si las conclusiones han sido falsadas, se pone de manifies-
to que la teoría es también falsa. Es importante resaltar que una decisión positiva tan
sólo puede apoyar temporalmente la teoría examinada, puesto que una decisión ne-
gativa posterior puede rechazarla. En opinión de Popper (1962), durante el tiempo
en que una teoría resiste contrastaciones minuciosas y exigentes, y que no queda an-
ticuada por otra teoría en la evolución del progreso científico, podemos decir que ha
«demostrado su temple», o que está corroborada por la experiencia.
13. Modelos científicos

Modelo es la identidad que inspira el conocimiento propio de una teoría. Así, tanto
los constructos como las teorías pueden tener sus modelos. Según Monserrat (1984),
el concepto de modelo es uno de los más incorrectamente utilizados. Así, hay quien
considera que teoría y modelo son lo mismo. Sin embargo, son dos conceptos epis-
temológicamente distintos y, aunque las teorías pueden conducir por su propia diná-
mica a la configuración de un modelo, no todas las teorías tienen su modelo y hay
posibles modelos que no lo son de nada y estrictamente tampoco son teorías. Por
otra parte, mientras que las teorías son generalizaciones (principios interpretativos
generales), los modelos pretenden reproducir la realidad en concreto, sirviéndonos
para hacer una aproximación intuitiva a la realidad, aunque no la reproducen de un
modo absolutamente perfecto. Monserrat (1984) considera que para comprender el
concepto de modelo debemos referirnos a los tres sentidos principales en que nor-
malmente se utiliza: analógico, formal y aplicado.
El concepto analógico de modelo es la acepción propia y estricta del concepto
de modelo. El científico tiende a hacerse una idea de la realidad que puede ser re-
presentada de forma imaginativa. Por tanto, la teoría es la que describe una deter-
minada realidad y el modelo es la idea intuitiva de esa realidad. Así, puede decirse
que la ciencia funciona inspirándose en analogías o modelos reales, traduciendo las
teorías a modelos que facilitan su comprensión. El modelo analógico puede defi-
nirse como aquella representación (aproximativa o analógica) de la idea de un
evento real contenida en un constructo o teoría, que cumple la misión de inspirar
(modelizar) la comprensión de su significado real. Es el tipo de modelo que utiliza-
remos cuando tratemos de los modelos de evaluación psicológica. El concepto for-
mal de modelo responde a la función que deben cumplir las ciencias formales en el
proceso de construcción de la ciencia y se refiere a toda estructura formal o abs-
tracta que sirva de instrumento para organizar las estructuras del conocimiento en
las ciencias formales. Estas ciencias desarrollan y construyen sistemas abstractos
cuya función inmediata no es representar estructuras reales, tal como ocurre en la
lógica formal, lingúística o en la matemática. El concepto aplicado de modelo pue-
de considerarse como un uso impropio del término en el ámbito científico. Los
modelos analógicos pretenden representar verdaderamente la realidad, y hasta cier-
to punto lo consiguen, aunque nunca se puede tener una seguridad total, por lo que
pueden ser utilizados para entender una realidad concreta en el ejercicio de la pro-
fesión; por tanto, sería un modelo construido por la ciencia (inspirándose en otros
modelos formales) para la comprensión concreta de la realidad en la praxis profe-
sional de una ciencia. Por ejemplo, cuando un psicólogo utiliza sus conocimientos
sobre el modelo conductual para evaluar el miedo a hablar en público de un sujeto
está aplicando un modelo.
Badiou (1972) hace una clasificación desde otra óptica cuando dice que los mo-
delos pueden dividirse en abstractos y materiales. Los primeros son los modelos
propiamente teóricos o matemáticos, que recogen un conjunto de hipótesis que se
supone relativamente completo del campo estudiado y cuya coherencia y posterior
desarrollo deductivo quedan garantizados por una codificación generalmente mate-
mática. En el segundo grupo distingue tres tipos:
a. Modelos que presentan en el espacio de manera sintética procesos no espa-

ciales; por ejemplo, un diagrama.
b. Modelos que representan estructuras formales, transfiriendo su materiali-
dad; por ejemplo, una figura de cartón que representa un poliedro regular.
Cc. Modelos que tratan de imitar comportamientos como, por ejemplo, los au-
tómatas.
En definitiva, los modelos serían generalizaciones realizadas por el científico a

partir de datos u observaciones concretas derivadas de un cierto número de casos
particulares con el fin de realizar predicciones acerca de la conducta de las personas
(Carrobles, 1989).
11.4. Formalización y axtomatización

La formalización significa un paso más en la cualificación del conocimiento científi-
co. De una manera genérica podría definirse como matematización no cuantitativa
que expresa de forma pura y estructurada la interdependencia entre una serie de fe-
nómenos reales convergentes en un sistema unitario. Por tanto, formalizar es captar
y expresar la forma de algo, utilizando para ello recursos expresivos, fundamental-
mente de la lógica o de la matemática, o también de la lingúística, teoría general de
sistemas, etc. En este contexto nos referimos a la formalización de las teorías (forma-
lización axiomática), puesto que también puede aplicarse a los modelos, constructos,
razonamientos, hipótesis, etc. Por ejemplo, el modelo organicista puede formalizar-
se como Cf (O) (la conducta está en función del organismo).
Para formalizar una teoría es necesario axiomatizarla previamente. Un sistema
axiomatizado implica reunir los supuestos necesarios y formar con ellos la esencia
del sistema. Estos supuestos suelen denominarse axiomas, postulados o proposicio-
nes primitivas (es importante considerar que aquí el término axioma no implica que
se consideren verdaderos). Los axiomas deben deducirse de forma tal que todos los
demás enunciados del sistema puedan hacerlo también a partir de ellos por medio de
transformaciones lógicas. Según Popper (1962), un sistema está axiomatizado si se
han formulado un conjunto de enunciados —los axiomas— que satisfacen los si-
guientes criterios:
a. El sistema de axiomas está exento de contradicción, lo que implica que no es

deducible del sistema un enunciado arbitrario cualquiera.
b. El sistema es independiente, o sea, no contiene ningún axioma deducible de
los restantes —sólo se llamará axioma a un enunciado si no es posible dedu-
cirlo de otro del sistema.
c. Los axiomas han de ser suficientes para deducir todos los resultados perte-
necientes a la teoría que se trata de ax1omatizar.
d. Los axiomas no deben contener supuestos superfluos.
Una teoría axiomatizada de esta forma permite investigar la dependencia mutua

de sus distintas partes. Así, podemos estudiar si una parte de la teoría puede deducir-
se de una parte de los axiomas, lo cual es de gran importancia en el problema de la
falsabilidad, pues la demostración de falsabilidad de un enunciado deducido sólo
afectaría a la parte del sistema (axiomas) de la que fue deducido y no a la totalidad.
En este caso, la axiomatización nos ayudaría a determinar qué subsistemas serían
afectados ante una observación falsadora determinada, viendo además en qué medi-
da ello repercutiría sobre la totalidad del sistema.
m5. Explicación y predicción científica

La explicación y la predicción son las metas del conocimiento científico. Partiendo
de una base empírica, a la que se le aplican deducciones, hipótesis, leyes, teorías,
axiomatizaciones y formulaciones, se puede llegar a estar en condiciones de explicar
y predecir los fenómenos objeto de estudio. Buscar una explicación causal de un fe-
nómeno significa buscar teorías explicativas (si es posible, verdaderas) que describan
las propiedades estructurales que nos permitan deducir, partiendo de las condiciones
iniciales, los efectos que tratamos de explicar.
El principio de causalidad consiste en la afirmación de que cualquier aconteci-
miento puede explicarse causalmente, es decir, se puede deducir en función de sus
causas. Esto debe interpretarse como que siempre es posible construir una explica-
ción causal, con lo cual, para una predicción cualquiera, siempre podremos encon-
trar enunciados singulares (condiciones iniciales) y enunciados universales que per-
mitan explicar la causalidad, aunque esto no implica que los enunciados universales
hayan sido contrastados y corroborados en otros casos. Popper (1962) considera el
principio de causalidad como un concepto metafísico y propone una regla metodo-
lógica que se corresponde con este principio: no abandonaremos la búsqueda de le-
yes universales y de un sistema teórico coherente, ni cesaremos en nuestros intentos
de explicar causalmente todo tipo de acontecimientos que podamos describir; esta
regla debe guiar al investigador científico en su tarea.
Por tanto, quiero dejar bien claro que, a mi parecer, el interés que tiene la explicación —esto
es, el descubrimiento de teorías explicativas— para el científico teórico es irreductible al inte-
rés tecnológico práctico de la deducción de predicciones. El teórico se interesa por las predic-
ciones, por otra parte, lo que es comprensible, pues está interesado en el problema de si sus
teorías son verdaderas o no; o dicho de otro modo, le interesa contrastar sus teorías, tratar de
averiguar si no se puede mostrar que sean falsas [Popper, 1962, p. 59].
La explicación científica de un fenómeno permite hacer una predicción sobre de-

terminados procesos reales relacionados estructuralmente con dicho fenómeno. El
concepto de predicción científica se refiere al conocimiento riguroso de lo que va a
producirse a partir de ciertos estados previos caracterizados por la concurrencia es-

tructural de un conjunto de factores reales.
IL6. Paradigmas
Este es otro concepto que frecuentemente se utiliza de forma inadecuada como sinó-
nimo de modelo o de teoría (Franks, 1991). Tal como señala Pérez-Álvarez (1985), la
mayoría de los autores alude al primer concepto de paradigma planteado por Kuhn
(1962), quien lo definía como un conjunto de suposiciones interrelacionadas respec-
to al mundo social que proporcionan un marco filosófico para el estudio organizado
de este mundo. En un sentido más amplio, un paradigma representa una “matriz dis-
ciplinaria” que abarca generalizaciones, supuestos, creencias y ejemplos, corriente-
mente compartidos, de lo que constituye el interés de la disciplina. Por tanto, un pa-
radigma sirve como guía a los profesionales de una disciplina, pues les ayuda a
identificar cuáles son las cuestiones importantes, les orienta hacia el desarrollo de un
esquema aclaratorio (teorías y modelos) que haga posible situar a estas cuestiones en
un marco que permita resolverlas, facilita establecer los criterios para el uso de la me-
todología adecuada (métodos, instrumentos, recogida de datos) y proporciona una
epistemología en la que las tareas precedentes pueden ser consideradas guías para la
realización del trabajo normal de la disciplina.
Como se puede apreciar en esta descripción de paradigma, este concepto es más
amplio y general que una teoría o un modelo. Tampoco sería acertado considerar al
paradigma como una gran teoría o un supermodelo, pues además de la amplitud o
extensión, existen otras diferencias. Piénsese que el modelo sirve para “representar”
y, por tanto, ayudar a interpretar un fenómeno o una teoría, mientras que el paradig-
ma es un concepto más filosófico que llega incluso a delimitar cuál debe ser el objeto
de estudio. La ambigiúedad del término paradigma llevó al mismo Kuhn a utilizarlo
de 22 formas distintas, algunas de ellas incluso excluyentes entre sí, tal como demos-
tró Masterman (1975). En este estudio se concluye que los distintos usos del término
paradigma pueden agruparse en tres categorías o nociones generales: paradigmas
metafísicos (que proporcionan principios de organización), paradigmas sociológi-
cos (que describen logros universalmente reconocidos) y paradigmas de constructos
(que describen herramientas e instrumentos metodológicos); este último parece ser
el uso más frecuente que hace Kuhn.
Tomando en consideración las críticas de Masterman (1975), Kuhn (1978) reco-
noce que ha utilizado el concepto de paradigma de manera multiforme y reformula
el concepto de “matriz disciplinar” y “ejemplar”. Dice que las matrices disciplinares
son todos aquellos elementos que nos permiten distinguir lo que se podría llamar
una comunidad científica y la convergencia de criterios, interpretaciones y métodos
que posibilitan un trabajo en común. El término matriz se refiere a un conjunto de
elementos ordenados de diversos tipos, mientras que disciplinar intenta representar
la puesta en común de los que practican una disciplina profesional. Así,los compo-
nentes principales de la matriz disciplinar abarcan modelos, generalizaciones simbó-
)
licas y generalizaciones ejjemplares. Los modelos son analogías con las que un grupo
unifica su idea de la realidad; las generalizaciones simbólicas se refieren a sistemas
formales instrumentales; las generalizaciones ejemplares son las soluciones de pro-

blemas concretos que tienen para el grupo una función paradigmática, siendo este
último el elemento epistemológicamente más importante y el que más se identifica
con el concepto inicial de paradigma que propuso Kuhn (1962). Así, las generaliza-
ciones ejemplares se corresponden con los paradigmas de constructos de Masterman
(1975). En conclusión, si el término paradigma se utiliza en un sentido amplio puede
identificarse con matriz disciplinar, mientras que con una conceptualización más
restringida se corresponde con la generalización ejemplar; es decir, lo que Kuhn en-
tendía por paradigma en su primera versión es ahora, en parte, matriz disciplinar y,
en parte, generalización ejemplar.
Una vez diferenciado el modelo de la teoría y del paradigma vamos a conocer al-
gunas características más acerca de los modelos. Así, dentro de la evaluación psicoló-
gica, Ávila (1992) plantea cinco requisitos para que un modelo pueda ser calificado
como tal; son los siguientes:
a. Que se hayan desarrollado dentro del campo conceptual de alguno de los

paradigmas de la psicología científica.
b. Que cuente con un objeto de estudio específico a través de las precisiones
que efectúe sobre el concepto de conducta.
Que cuente con un diseño de tecnología propia.
LN Que responda a las necesidades de evaluación propias de una época, cultura
o problemática de amplio alcance social.
e. Que tengan un desarrollo histórico propio, caracterizado por su introduc-
ción y progresiva implantación en el ámbito profesional.
El cumplimiento de estos requisitos es sumamente importante a la hora de selec-

cionar los modelos que tienen cabida dentro de la evaluación psicológica, puesto que
como considera Ávila (19924) podemos caer en el riesgo de una atomización de la
evaluación psicológica o en una reducción excesiva del número de modelos; de esta
misma opinión es Fernández-Ballesteros (1992a) a la hora de determinar qué mode-
los coexisten dentro de la evaluación psicológica pues muchos modelos psicológicos
no han llegado a tener relevancia dentro de esta disciplina y, por el contrario, dentro
de la evaluación psicológica existen modelos que no han derivado directamente de la
psicología, como es el caso de los modelos de enfermedad. Según esta autora, para
que un modelo sea incluido dentro de esta disciplina tuvo que producir con anterio-
ridad desarrollos innovadores en el modo de evaluar, «[...] en el qué [variables],
cómo [métodos], con qué [técnicas] o dónde [ámbito de aplicación] evaluar» (Fer-
nández-Ballesteros, 1992a, p. 35).
Si realizamos un repaso de la literatura nos encontramos, tal como plantea Ávila
(1992a), que los modelos se fueron estableciendo a través de polaridades. Así, duran-
te el período crítico de la evaluación psicológica se opuso una perspectiva clínica a
una estadística o actuarial; posteriormente, se estableció una dicotomía, la cual en-
globaba la anterior, entre lo conductual y lo no conductual. En la década de los años
setenta se empiezan a superar estas dicotomías; por ejemplo, Weiner (1972) propone
tres modelos (psicodiagnóstico, psicométrico y conductual). En la década de los
años ochenta, Fernández-Ballesteros (1983) propone los modelos del atributo, mé-
dico, dinámico, conductual y SOVIéticO; recientemente, esta misma autora elimina el

modelo soviético e incluye el cognitivo (Fernández-Ballesteros, 19924). A continua-
ción vamos a analizar cada uno de estos modelos de una forma pormenorizada; en
primer lugar, describiremos el modelo de enfermedad y el psicodinámico que inclui-
mos dentro de los modelos de carácter organicista, a continuación el psicométrico y
el conductual y, por último, el cognitivo y el humanista. Haremos también una refe-
dd al paradigma constructivista y a la posibilidad de integración de los diferentes
modelos. -
Il. MODELO DE ENFERMEDAD
Entre la primera y segunda guerra mundial, la psicología clínica experimenta un gran

desarrollo en un contexto eminentemente médico-psiquiátrico; dentro de este cam-
po el objetivo primordial era realizar un diagnóstico del paciente en función de sus
síntomas (y su configuración en síndromes) como paso previo para su clasificación y
asignación de un tratamiento (Ávila, 19924). Posteriormente, durante las décadas de
los años cuarenta y cincuenta se va a producir también un auge importante del diag-
nóstico clínico, lo que se pone de manifiesto en la aparición de diferentes clasifica-
ciones de los trastornos mentales (DSM, clasificación de la Organización Mundial de
la Salud, etcétera).
El modelo de enfermedad parte del supuesto de que la conducta puede explicar-
se en función de variables endógenas o internas; es decir, los determinantes de la con-
ducta son de carácter interno referidos al sustrato biológico de la persona o a sus
procesos intrapsíquicos (diferenciando de esta manera una etiología orgánica y fun-
cional). Por tanto, la formalización teórica sería C =f (O), la conducta en función del
organismo. La aplicación del modelo organicista al campo de la medicina ha dado
lugar al modelo de enfermedad con sus cinco submodelos: traumática, genética, fun-
cional, infecciosa y toxicológica. Su extensión al ámbito de la psiquiatría ha llevado a
considerar que la persona que manifiesta alteraciones del comportamiento está en-
ferma, o sea, padece una enfermedad mental, la cual se manifiesta a través de una se-
rie de síntomas y signos más o menos obvios. Por tanto, el supuesto básico de este
modelo es que la conducta anormal está asociada a trastornos orgánicos, fundamen-
talmente bajo la forma de alteraciones estructurales o funcionales en el sistema ner-
vioso, por lo que su tratamiento debe ser fundamentalmente de tipo médico (Carro-
bles, 1989). El objeto de estudio del modelo de enfermedad es el síntoma,
considerado éste como la unidad básica que permitirá construir síndromes, cuyas
manifestaciones conductuales serán indicadores de procesos psicopatológicos o de
alteraciones orgánicas subyacentes. Por tanto, estas variables objeto de estudio no
son más que signos que requieren una inferencia posterior que permita llegar a los
procesos internos etiológicos. Dado que el determinante de la conducta es organís-
mico y los procesos etiológicos se escapan normalmente a la observación directa, se
requieren técnicas de evaluación indirecta.
Como consecuencia de todo ello, la metodología fundamental de este modelo es
de carácter correlacional; así, se establecerán correlatos entre diferentes indicadores
para determinar patrones de covariación entre ellos con el fin de configurar síndro-
mes, y correlaciones entre indicadores y procesos internos. Las técnicas de evalua-
ción empleadas son múltiples, siendo las más importantes los procedimientos tipifi-
cados (entrevistas, cuestionarios o escalas). En los últimos años han surgido
diferentes entrevistas estructuradas relacionadas con las clasificaciones DSM; por
ejemplo, la Diagnostic Interview Schedule (DIS) de Robins y cols. (1981) o la Struc-
tured Clinical Interview for DSM-I11 (SCID) de Spitzer y Williams (1987). Esta aso-
ciación entre técnicas de evaluación y sistemas clasificatorios es consecuencia de la
importancia que tiene para este modelo el diagnóstico diferencial. :
Uno de los aspectos relevantes de los modelos de evaluación psicológica señala-
do por Fernández-Ballesteros (1992a) es el ámbito de aplicación y los objetivos
planteados. El objetivo primordial del modelo de enfermedad es el diagnóstico del
sujeto por medio de la descripción de síntomas y la clasificación, tal como hemos co-
mentado; este diagnóstico de carácter etiológico ayudará a conocer el pronóstico del
trastorno, lo que facilitará su predicción y tratamiento. Dentro de esta secuencia
diagnóstico-pronóstico-tratamiento, el psicólogo se vio relegado hasta hace poco
tiempo al primer paso de la secuencia, siendo un mero auxiliar del médico. Por últ:-
mo, el ámbito de este modelo ya va implícito en su rótulo, centrándose totalmente
en el contexto clínico.
En la actualidad, la defensa de un modelo radical de enfermedad cae por su pro-
pio peso; plantearse que la evaluación psicológica es similar a la evaluación médica
no tiene sentido actualmente. El modelo de enfermedad parece apropiado para ex-
plicar los trastornos del comportamiento que tienen su base en alteraciones neurofi-
siológicas y/o bioquímicas. Sin embargo, dicho modelo no debe aplicarse al resto de
los trastornos conductuales en los que no se ha demostrado ninguna base biológica o
determinante físico. Por otra parte, es un hecho bien conocido que las variables am-
bientales son capaces de producir modificaciones bioquímicas del organismo, lo cual
lleva a considerar que, aun suponiendo que se demostrara una alteración orgánica en
ciertos trastornos conductuales, ello no justificaría una intervención exclusivamente
médica. Según Carrobles (1989), el concepto de enfermedad ha variado de forma
considerable en la historia de la medicina y aún hoy su naturaleza es compleja, lo que
hace problemática la justificación de este modelo. Un déficit importante de este mo-
delo es la ausencia de un marco teórico adecuado, puesto que en vez de surgir del
desarrollo de alguna teoría parece haber emergido de una práctica profesional en un
contexto determinado. De hecho, otros modelos, como el psicodinámico e incluso
el conductual, asumen algunas de sus técnicas o planteamientos. Como consecuen-
cia de ello fue blanco de fuertes críticas, como por ejemplo realizar una argumenta-
ción circular, puesto que se da el nombre a determinadas manifestaciones de la con-
ducta, para posteriormente utilizar ese nombre como entidad explicativa o causal de
los síntomas que había utilizado para inferir dicha entidad. Otro problema es la utili-
zación de etiquetas diagnósticas para clasificar a los enfermos, aplicando así un trata-
miento estándar que se encuentra más en función de la etiqueta que del propio pa-
ciente (Ibáñez, 1980). Por último, se atribuye causalidad orgánica a la conducta y no
se considera otro tipo de variables conductuales, ambientales o cognitivas, así como
la interacción entre las distintas variables. Pero, sin duda, la crítica más seria que ha
recibido el diagnóstico psiquiátrico ha sido la falta de fiabilidad. Morey, Skinner y
Bloshfield (1986) revisaron los estudios realizados sobre fiabilidad del sistema de
clasificación psiquiátrica y categorizaron las distintas concepciones dadas al concep-
to de fiabilidad de la siguiente forma: consistencia temporal, consistencia de tasa de
diagnóstico en diferentes situaciones o lugares, heterogeneidad dentro de las catego-
rías diagnósticas y acuerdo entre evaluadores. Esta última categoría fue la más fre-
cuentemente estudiada y, como se sabe, hace referencia a que distintos evaluadores
deben llegar a las mismas conclusiones cuando evalúan un mismo caso. En la mayor
parte de los estudios realizados durante las décadas de los años sesenta y setenta se
encontró una fiabilidad muy baja en los sistemas de clasificación.
En los últimos años se superaron algunas de estas deficiencias, en especial la falta
de fiabilidad, como consecuencia de la mejora de instrumentos y sistemas de clasifi-
cación. De este modo, algunos elementos del modelo de enfermedad siguen vigentes
en la actualidad y son objeto de importantes debates. Por ejemplo, la necesidad de
una clasificación nosológica es tema de discusión entre los evaluadores conductua-
les; para algunos autores (Nelson, 1987; Hersen, 1988) no se trata simplemente de la
necesidad de utilizar un lenguaje común, sino del reconocimiento de la existencia de
covariaciones de respuestas dentro de los repertorios conductuales que merecen un
análisis más global. First y cols. (1992) consideran que la aproximación más global
del DSM-IV y la aproximación específica y atomista de la evaluación conductual están
interrelacionadas y se pueden beneficiar mutuamente tanto en la práctica como en la
investigación clínica. Para estos autores, el esfuerzo por desarrollar entrevistas y es-
calas en función de los constructos del DSM-IV es un indicador de estas relaciones.
En síntesis, el modelo de enfermedad como modelo de evaluación está claramen-
te superado; no obstante, algunas de sus aportaciones a la psicología clínica son to-
davía importantes; un ejemplo de ello es la aparición de disciplinas como la medicina
conductual o la psicología de la salud.
IV. MODELO PSICODINÁMICO
El modelo psicodinámico (en su vertiente psicoanalítica) ha mostrado elementos

contradictorios dentro de la evaluación psicológica. Así, por un lado, rechaza el diag-
nóstico nosológico de origen médico llegando a considerarlo como un obstáculo
para el psicoanálisis y, por otro, utiliza el lenguaje médico y se establecen criterios
para el diagnóstico diferencial por medio de técnicas proyectivas '. En los primeros
trabajos de Freud se alude a algunos elementos relacionados con la evaluación (mé-
todos para la evocación y evaluación de contenidos inconscientes y criterios para la
accesibilidad del paciente al tratamiento psiconalítico); pero será en la década de los
años treinta, a partir de Ana Freud y Hartmann, cuando se constituye un diagnósti-
co psicoanalítico centrado en la evaluación de los estados del yo y sus mecanismos
de defensa y adaptación; esto hace que las recién estrenadas técnicas proyectivas
(Rorschach o TAT) sean utilizadas por los psicoanalistas estadounidenses para facili-
tar el diagnóstico. Asimismo, la escuela kleineana dirige la evaluación hacia otros as-
' Un ejemplo claro de ello es la obra de Bohm (1972), Vademécum del test de Rorschach.
pectos como las relaciones objetales, lo cual dará lugar a la aparición de nuevos tests
como el Pata negra o el Test de relaciones objetales (Ávila, 19924). ,
El modelo psicodinámico es un modelo organicista. Más concretamente podría
considerarse como una variante del modelo de enfermedad traumática. Se considera
que los factores intrapsíquicos (estructuras internas de la personalidad) constituyen
las causas subyacentes de la conducta manifiesta, y tienen lugar en lamente bajo la
forma de impulsos, deseos, motivos y conflictos. Por tanto, la formalización teórica
de este modelo sería C =f (O), la conducta en función del organismo, pero a diferen-
cia del modelo de enfermedad, “O” alude a un constructo intrapsíquico. Las expe-
riencias infantiles tienen una gran importancia para explicar la conducta posterior de
los individuos. Así, se interpretan los trastornos psicopatológicos en términos de es-
tancamiento en la evolución libidinal, como una regresión a las etapas del desarrollo
psicosexual y una fijación en la etapa no superada. La evaluación y el tratamiento
psíquico deben centrarse en la actividad psíquica que no es directamente observable.
En cuanto a las variables objeto de estudio, Ávila (1992a) establece tres: procesos
y contenidos inconscientes con el fin de comprender su dinámica, estructura psíqui-
ca del yo y de los recursos adaptativos y defensivos a su servicio y la accesibilidad del
sujeto al tratamiento psicoanalítico. Como se puede apreciar, el modelo psicodiná-
mico estudia la estructura de la personalidad desde una perspectiva molar. En este
modelo, al igual que en el de enfermedad, la conducta es considerada como signo;
así, las conductas manifiestas (actos fallidos, sueños o ejecución en técnicas proyecti-
vas) necesitan ser interpretadas simbólicamente para que puedan tener valor diag-
nóstico. Sin embargo, a diferencia del modelo de enfermedad, esta relación entre sig-
no y significado es mucho más distante, alcanzándose un mayor nivel de inferencia.
Las técnicas de evaluación enfatizan la libertad de respuesta, por lo que son fun-
damentalmente procedimientos no estructurados a través de los que se infieren da-
tos relativos a conflictos conscientes e inconscientes (Pervin, 1979). De este modo,
mediante la técnica tratan de verificar la teoría y ésta a través de la teoría, lo cual
constituye una tautología inadmisible dentro de la ciencia positiva (Fernández-
Ballesteros, 1992a). Las técnicas proyectivas se constituirán en buenos instrumentos
que facilitan la aparición de estas respuestas libres. En este contexto, la fiabilidad del
instrumento no tiene demasiado interés, pues no importa tanto que evalúe fielmente
un determinado factor, sino su capacidad para producir respuestas de interés para la
interpretación, es decir, que constituyan reactivos que evoquen respuestas de interés
para el psicoanalista (Ávila, 1992a).
El objetivo básico del modelo psicodinámico de evaluación es ayudar al cambio
terapéutico, confundiéndose la evaluación con el propio proceso de psicoanálisis.
Dentro de este modelo la predicción de la conducta no tiene sentido, pues una misma
entidad intrapsíquica puede provocar distintas formas de conducta manifiesta; lo má-
ximo que se podría hacer sería realizar una explicación a posteriori de la misma (Fer-
nández-Ballesteros, 19924). Tampoco interesa la clasificación nosológica (a pesar de
utilizar terminología psiquiátrica) ni la comparación interindividual (Ávila, 19924).
La crítica más importante que ha recibido el modelo psicodinámico, sin duda, ha
sido la de que no puede ser considerado como un conocimiento científico, dado que
es imposible poder contrastar los constructos que se postulan. La ambigiúedad con
que está formulado y su nivel de abstracción e imprecisión conceptual hacen IMPosi-
ble su confirmación o falsación de acuerdo con los criterios científicos (Carrobles,

1989). Esta crítica tiene su base en las argumentaciones de Popper (1962), quien
distingue entre ciencia y seudociencia según se pueda o no aplicar el criterio de falsa-
bilidad; es decir, plantear las hipótesis de forma que puedan ser falsadas por los expe-
rimentos O la observación. Este autor cita como ejemplos de seudociencia a la astro-
logía y al psicoanálisis. Los defensores del modelo psicodinámico contestan
argumentando que no sólo es científico lo que el paradigma experimental y las con-
venciones de la mayor parte de la comunidad de científicos actuales consideran
como tal. Así, aluden a la inadecuación de la metodología científica convencional
para juzgar sus planteamientos, debiendo recurrir a otros tipos de criterios para va-
lorar el modelo dinámico. Como señala Eysenck (1988), los psicoanalistas han trata-
do de interpretar el término “ciencia” de forma que se pueda incluir al psicoanálisis.
El mismo Freud se lamentaba de ser leído como un novelista más que como un cien-
tífico. Eysenck coincide con los filósofos de la ciencia al considerar que las insufi-
ciencias lógicas de la teoría de Freud son razones suficientes para que sea considera-
da como una seudociencia. Dentro del marco de la evaluación psicológica, el hecho
de que la evaluación dependa más de la interpretación del evaluador que del propio
instrumento de evaluación limita considerablemente sus garantías científicas. Estas
limitaciones del modelo psicodinámico han conducido a un descenso en su popula-
ridad a nivel académico; así, en un estudio reciente, Sierra, Álvarez-Castro y Buela-
Casal (1994) ponen de manifiesto que los psicólogos españoles de la promoción del
año 1993 no consideran al psicoanálisis como parte de la psicología científica.
No obstante, a pesar de las críticas vertidas sobre este modelo, a juicio de algunos
autores (Bragado, 1986; Ávila, 19924), no se deben menospreciar algunas aportacio-
nes como la construcción de una teoría que intenta abordar la complejidad del ser hu-
mano en toda su dimensión, incluyendo aspectos no observables de la conducta y la
generación de diversas técnicas. En los últimos años se han realizado serios esfuerzos
por mejorar la fiabilidad de algunos instrumentos de evaluación (Exner, 1993). En su-
jetos adultos se han conseguido, con el Rorschach, índices altos de fiabilidad test-re-
test, con intervalos de más de un año (Exner, 1980); los índices menores encontrados
en niños son explicados por las variaciones propias de estas edades (Exner, Thomas y
Masson, 1985). Estos resultados positivos son fruto de la adopción de un enfoque ex-
perimental en la investigación del test de Rorschach, considerando las respuestas al
mismo más como una muestra representativa de la conducta del sujeto ante una tarea,
que como expresión simbólica de sus conflictos internos (Rodríguez, 1990). Sin em-
bargo, tal como comentan Aronow, Reznikoff y Moreland (1995, p. 223) «el Rors-
chach puede ser una técnica proyectiva y un test psicométrico, pero no en igual medi-
da [...] es una potente técnica idiográfica, pero un débil instrumento nomotético».
V. MODELO PSICOMÉTRICO
Los orígenes de este modelo se remontan a los clásicos trabajos de Galton, Binet y
Cattell, y el consiguiente interés por el estudio de las diferencias individuales; por
tanto, se trata de un modelo vinculado al desarrollo histórico de la psicometría y a
sus formulaciones teóricas, centradas fundamentalmente en especificar las formas en

que las personas pueden diferir unas de otras, identificar las causas de esas diferen-
cias y determinar la distribución de los atributos (características diferenciadoras) en
la población. La evolución del modelo psicométrico hasta la actualidad se ha caracte-
rizado por múltiples altibajos; así, después de la gran expansión que tuvo en los pri-
meros momentos fue blanco de duras críticas tanto desde la propia evaluación psico-
lógica como desde la misma sociedad, pasando a un segundo plano como
consecuencia del desarrollo del modelo conductual y recobrando en los últimos
años auge y vigencia. Otra característica relevante de este modelo es que recibe dife-
rentes calificativos en función de que se quieran resaltar sus fundamentos metodoló-
gicos (correlacional), su relación con la disciplina centrada en la medida psicológica
(psicométrico), su interés por las diferencias individuales (diferencial) o las variables
objeto de estudio (modelo del atributo).
A nivel conceptual, el modelo psicométrico considera que la conducta está deter-
minada por atributos intrapsíquicos o variables organísmicas (habilidades, intereses
o rasgos) que diferencian a unos sujetos de otros; su formalización teórica es Cf(O),
la conducta está en función del organismo, entendido aquí como el conjunto de ras-
gos o atributos diferenciales del sujeto. El modelo analógico en el que se basa sería
un modelo estadístico. Se parte del presupuesto de que todos los sujetos poseen en
mayor o menor medida unas variables organísmicas que son consistentes y estables a
lo largo del tiempo y de las situaciones; una vez definidos esos constructos se elabo-
ran los instrumentos para evaluarlos y conocer su distribución en la población, para
lo que resulta necesario evaluar una muestra representativa. Conocida esta distribu-
ción y conociendo la puntuación de un sujeto se le puede clasificar con respecto a la
población. Según esto, se puede hacer una predicción probabilística, que es resulta-
do de la asociación entre un predictor y un criterio. Así, las respuestas de un sujeto a
una prueba son interpretadas como un signo de la existencia en determinado grado
de tales atributos. Dado que tales atributos no pueden ser evaluados directamente,
estos instrumentos (tests psicológicos) evalúan diferentes manifestaciones externas
consideradas signos o indicadores de esos atributos. En este caso, al igual que en los
modelos médicos, la conducta es un signo de un atributo o rasgo subyacente en el
sujeto; pero, mientras para el modelo psicodinámico la relación entre el signo y el
criterio exige una compleja interpretación simbólica, en el modelo psicométrico se
realiza una interpretación estadística, es decir, se compara la puntuación obtenida
por el sujeto con la puntuación del grupo normativo, situando al sujeto en un deter-
minado punto de la distribución de esa característica en la población.
Por tanto, las variables objeto de estudio del modelo psicométrico son variables
intrapsíquicas evaluadas mediante tests estandarizados construidos según estrategias
teórico racionales, empíricas y factoriales, apoyándose en el supuesto de estabilidad
de la conducta. El rasgo fue definido por Guilford como el modo distinguible y rela-
tivamente permanente en que un individuo se diferencia de otro. Esta definición,
aunque es muy general y limitada, refleja de forma muy clara la idea de rasgo, puesto
que en ella se incluyen sus tres elementos básicos:
a. Debe ser una característica en la cual una persona difiere de otra.

b. Debe ser suficientemente identificable.
c. Debe mostrar alguna clase de consistencia en el tiempo, es decir, la cantidad

relativa de una característica que posee un individuo no debe cambiar radi-
calmente en el tiempo.
Dela relación entre conducta manifiesta y atributo se deduce que la metodología

básica empleada por este modelo es la correlacional y las técnicas son procedimien-
tos tipificados (tests psicológicos) construidos según criterios racionales, empíricos
o factoriales, apoyándose en el supuesto de la estabilidad de la conducta.
Entre los objetivos planteados por el modelo psicométrico podemos citar la des-
cripción (de hecho su interés se centra en las diferencias individuales), pero sin duda
alguna su objetivo fundamental es la predicción de la conducta en contextos diferen-
tes al de la evaluación, basándose para ello en su estabilidad. Esta función predictiva
hace del modelo psicométrico uno de los más utilizados en el ámbito escolar y del
trabajo (selección de personal); así, en función de la puntuación obtenida en un de-
terminado test por parte de un sujeto, podemos predecir su desempeño en otra tarea,
de ahí su importancia de cara a la orientación y selección. Asimismo, Fernández-
Ballesteros (1992a) otorga a este modelo la posibilidad de generar seudoexplicacio-
nes de la conducta, suponiendo que los rasgos implican tendencias intrapsíquicas de
acción; por ejemplo, una persona manifestaría una conducta perturbada porque es
neurótica.
En las últimas décadas, coincidiendo con el apogeo de la evaluación conductual,
el modelo psicométrico fue objeto de duras críticas (uso desmedido en el empleo de
tests, ignorar la situación, explicar la conducta en función de rasgos y éstos en fun-
ción de la conducta...), aunque la mayoría de ellas estaban mal enfocadas, ya que en
realidad deben dirigirse a las distintas teorías que utilizan este modelo. No es una de-
ficiencia del modelo que los constructos no estén bien definidos, evaluados o corro-
borados, sino de la teoría (aunque en muchos casos ésta aún no ha pasado del nivel
de constructo). De igual forma, el que se utilice una argumentación circular en la que
se define un constructo, se crea un instrumento para evaluarlo, y con dicha medida
se ratifica el constructo, tampoco es deficiencia del modelo, sino del teórico o inves-
tigador que hace tal planteamiento. Una de las críticas más frecuentes que recibió el
modelo psicométrico se centra en las repercusiones sociales del uso de los tests, en
relación al uso abusivo e indiscriminado. Así, los tests llegaron a considerarse como
instrumentos seudocientíficos que contribuían al mantenimiento del estatus social,
justificando la división de clases y la jerarquización de la sociedad. Es evidente que
dicha crítica nada tiene que ver con el modelo psicométrico sino con la propia teoría
de la inteligencia y con la utilización de dichos tests. Como manifestaba Yela (1990),
la cuestión de fondo es el problema del criterio, es decir, ¿cómo podemos determinar
el valor del criterio? A medida que ampliemos los conocimientos acerca del criterio
mejoraremos la capacidad de predicción del test. Para explicar este problema, el
autor propone el ejemplo de la construcción de un test de inteligencia. Una vez ela-
borado el test, será necesario comprobar en qué medida se relaciona con el construc-
to inteligencia. Pues bien, como parece lógico pensar, la inteligencia está relacionada
de alguna forma con la estructura y funcionamiento de la corteza cerebral. Por tanto,
podríamos preguntarnos si hay alguna relación entre las puntuaciones del test y los
parámetros de los potenciales evocados, tal como ya se ha demostrado en algunos
trabajos (Buela-Casal y Navarro, 1989; Eysenck, 1991). Supongamos que llega a es-
tablecerse por este procedimiento una validez del constructo inteligencia. En ese
caso el test sería totalmente válido para pronosticar, o sea, tendría validez empírica.
Como se puede deducir de este supuesto, el modelo utilizado sigue siendo el mismo;
lo que se ha mejorado es la teoría de base. : de
Las deficiencias propias del modelo psicométrico han sido principalmente meto-
dológicas, pues como ya es bien sabido, el uso de un solo coeficiente de correlación
(simple o múltiple) no es suficiente. Así, tenemos técnicas como el análisis de vías
(path analysis) que permite analizar la correlación de los componentes directos e in-
directos, demostrando que el coeficiente puede ser alto o bajo dependiendo de la in-
fluencia de otras variables; lo cual explica, además, la vieja convicción de que resulta
sumamente difícil interpretar en la práctica un único coeficiente de correlación. Sin
embargo, en los últimos años se ha producido un gran avance metodológico en el
modelo psicométrico, desde revisiones conceptuales sobre la validez hasta la incor-
poración de sofisticadas técnicas de análisis que, sin duda, han contribuido al relan-
zamiento del modelo psicométrico (Yela, 1990). Los análisis multivariados, el de-
sarrollo de la teoría de la respuesta al ítem, el renovado interés por el estudio de la
personalidad a través de los cinco factores básicos, la reciente aparición de nuevas
versiones del WISC, WAIS y MMPI, etc., hacen que el modelo psicométrico muestre un
importante auge en la actualidad.
VI. MODELO CONDUCTUAL
Los orígenes del modelo conductual pueden situarse en los trabajos de Pavlov sobre
el condicionamiento clásico, de Watson sobre el conductismo, de Thorndike sobre
el aprendizaje y de Skinner sobre el condicionamiento operante; no obstante, los an-
tecedentes de la evaluación conductual propiamente dicha habría que situarlos en la
publicación de Kanfer y Saslow (1965) Behavioral analysis. A diferencia de otros
modelos, el conductual contó con distintas variantes desde sus inicios y, posterior-
mente, en su desarrollo se le fueron añadiendo algunas más (Carrobles, 1985). Sin
embargo, en opinión de Kazdin (1991), estas diferencias fueron minimizadas con el
propósito de desarrollar un movimiento relativamente unificado que se opusiese al
modelo tradicional de enfermedad sobre la conducta anormal. Según este autor, la
diversidad se ha incrementado en estos últimos años. De esta misma opinión es
Franks (1991), quien considera que dentro de este modelo se encuadran concepcio-
nes aparentemente bastante distintas, que sólo pueden ser entendidas en el contexto
de su desarrollo histórico. Así, se puede distinguir entre el conductista metodológi-
co y el conductista metafísico o radical. El primero considera que la conducta puede
investigarse sin un examen directo de los estados mentales, aceptándose éstos de for-
ma inferencial. La investigación y la consistencia teórica se basan en variables media-
cionales, para lo cual se utiliza el método hipotético deductivo. Por tanto, «es perfec-
tamente posible ser un conductista metodológico y apoyar conceptos tales como el
libre albedrío, el autocontrol, la cognición y el darse cuenta» (Franks, 1991, p. 15) .
Sin embargo, el conductista metafísico o radical no acepta los estados mentales como
proposiciones útiles; en consecuencia, es antimentalista y defiende la comprobación
formal de las hipótesis.
Según Cone (1986, 1988), en la actualidad no es posible dar una definición de
evaluación conductual que sea compartida por la mayoría de los autores. El análisis
de los libros más representativos de la denominada etapa de consolidación de la eva-
luación conductual pone de manifiesto una gran diversidad de conceptualizaciones.
Este autor realiza un detallado estudio de éstas según cinco características: objeto de
la materia (rasgos o conducta), enfoque de la evaluación (idiográfico o nomotético),
método (inductivo o deductivo), fuente primaria de variabilidad (intraindividual o
interindividual) y énfasis ambiental (interactivo o no interactivo). A partir de este
análisis obtiene 32 modelos diferentes de evaluación conductual, por lo que conclu-
ye que debemos reconocer la naturaleza pluralista de la evaluación conductual. Sin
embargo, en opinión de Silva y Martorell (1991), la expresión evaluación conductual
debe ser entendida, en la actualidad, en su sentido más amplio, considerándose como
un marco conceptual en el que se incluyen los distintos enfoques de evaluación de la
psicología conductual. En nuestra opinión, una visión globalizadora de la evalua-
ción conductual presenta las ventajas de una unificación teórica, pero ésta, en reali-
dad, no representa la práctica profesional, pues los distintos autores siguen practi-
cando la evaluación según un modelo en concreto. Por ello, dicha unificación debe
ser entendida en el plano teórico, apoyándose en lo que hay en común entre los dis-
tintos modelos, tal como lo plantea Barrios (1988) cuando alude a los propósitos,
precisión y utilidad de la evaluación.
A continuación presentamos de forma resumida los modelos más representati-
vos de lo que se entiende, en la actualidad, por psicología conductual: el modelo del
condicionamiento clásico, el modelo del condicionamiento operante, el modelo
del aprendizaje social, dos que podrían considerarse como innovadores —aunque el
primero de ellos es ya clásico— (modelo interconductual y modelo de interaccionis-
mo evolutivo) y un modelo integrador (modelo conductual integrado).
El punto de partida se sitúa en un modelo básico formalizado por E-R (relación
entre estímulos y respuestas) que sintetiza los planteamientos del condicionamiento
clásico e instrumental. El objeto de la evaluación serán las respuestas motoras y los
estímulos físicos relevantes que supuestamente las controlan. El enfoque mediacio-
nal E-R consiste fundamentalmente en la aplicación de procesos de aprendizaje, en-
fatizando la relación entre estímulos y respuestas. Este modelo se desarrollará desde
el análisis aplicado de la conducta dando lugar a la formulación E-R-C (Estímulos
antecedentes-Respuestas-Consecuencias). Este modelo se caracteriza por plantear el
análisis exclusivamente en función de las variables situacionales. La evaluación y la
intervención se consideran inseparables. Las variables organísmicas no se conside-
ran objeto de estudio de la psicología, aunque no se niega su existencia. Para los de-
fensores de este enfoque, la conducta no está determinada por las variables cognit1-
vas, sino que es la propia conducta la que produce los procesos cognitivos. El
objetivo principal es construir una ciencia de la conducta, por lo que se pone especial
énfasis en los aspectos metodológicos. Tan sólo se acepta como objeto de estudio la
conducta externa, la cual se aborda con diseños de caso único, con la finalidad de es-
tablecer relaciones empíricas y meramente descriptivas entre la conducta y el am-
biente. Este modelo experimentará una mayor especificación por parte de Lindsley
(1964) al reformularlo como E-R-K-CG; en este caso, además de los estímulos antece-
dentes, la respuesta y las consecuencias ambientales, se introduce una relación de
contingencia entre la respuesta y sus consecuencias ambientales. mn
En la década de los años setenta se produce un paso importante en la evolución
de estos modelos con la introducción de otro elemento, el organismo (O). Kanfer y
Phillips (1970) plantean el modelo E-O-R-K-C y Goldfried y Sprafkin (1974) el
E-O-R-C; mientras para los primeros autores el nuevo elemento aludía exclusivamen-
te a aspectos biológicos, para los segundos estos elementos biologicistas se combina-
ban con variables cognitivas. Además, estos dos modelos, a diferencia del E-R=-K-C,
asumen que los antecedentes y las consecuencias pueden ser ambientales (como en el
caso anterior) o tener un carácter intrapsíquico. En esta misma década, Bandura
(1978) propone un determinismo recíproco entre ambiente, conducta y procesos
cognitivos (éstos se refieren a la percepción, la regulación y la valoración de la con-
ducta), dando gran importancia a los conceptos de autocontrol y autoeficacia. En su
formalización más reciente, el modelo del aprendizaje social es interaccionista, inter-
disciplinario y multimodal. Franks (1991) señala que mientras los conductistas radi-
cales tienden a rebajar el papel de las cogniciones y los terapeutas cognitivos a mini-
mizar la importancia de la ejecución, los teóricos del aprendizaje social incluyen a las
dos (cognición y ejecución); por otra parte, mientras que el modelo del condiciona-
miento operante da importancia a las contingencias de reforzamiento y el modelo
del condicionamiento clásico se centra casi exclusivamente en los acontecimientos
estimulares externos, el modelo del aprendizaje social toma en cuenta ambas situa-
ciones, utilizando los conceptos derivados de la autoeficacia y del modelado para es-
tablecer las relaciones necesarias.
Del planteamiento crítico de Kantor (1959) al análisis experimental de la con-
ducta surge el modelo interconductual. En opinión de Franks (1991), este modelo
fue olvidado o incomprendido, durante muchos años, debido a la prematura insis-
tencia de que la psicología conductual debe ser tan científica como las ciencias físi-
cas. Kantor planteó una teoría conductual de campo que está integrada por los si-
guientes componentes: organismo, funciones de respuesta, funciones de estímulo,
eventos disposicionales y la historia interconductual. En el organismo distingue tres
niveles de interrelación:
a. La estructura biológica interna y externa, que se refiere a la filogenia y onto-

genia, y que sería el determinismo biológico que hace posible las respuestas.
b. Las formas de respuesta referidas al análisis de la conducta de acuerdo a su
estructura física.
c. Funciones de respuesta, que serían el significado de la respuesta en un con-
texto determinado.
En el ambiente distingue entre las formas del estímulo, que se refiere a la estruc-
tura física del estímulo, y las funciones del estímulo, que indican la actividad de las
formas del estímulo en su relación funcional con las respuestas dentro del campo
conductual. Los eventos disposicionales hacen referencia al contexto de interacción
que puede facilitar o dificultar las conductas subsiguientes. Estas tres formas o nive-
les de interacción (formas, funciones y eventos disposicionales) constituyen el cam-

po interconductual del desarrollo del sujeto, que se denomina historia interconduc-
tual (Cervantes y cols., 1991).
Carrobles (1985), después de analizar la relación entre la conducta y la cognición
en los distintos modelos conductuales, establece cuatro posiciones diferentes:
a. Exclusionismo cognitivo, que se identificaría con las posiciones de Watson y
Skinner y con el modelo operante, donde los factores cognitivos se entienden como
una consecuencia de la conducta de los sujetos en su interacción con el medio, no te-
niendo, por tanto, un efecto causal sobre la conducta.
b. Primacía conductual, siendo su máximo representante Wolpe y el modelo
del condicionamiento clásico; las cogniciones son entendidas como conductas suje-
tas a las mismas leyes que la conducta manifiesta, aunque no se le reconoce como po-
sible factor causal de la conducta.
Cc. Primacía cognitiva, representada por Beck y Ellis, dando un papel prepon-
derante a las cogniciones, que pueden determinar o influenciar la conducta manifies-
ta (constituiría un modelo independiente que se describirá en el siguiente apartado).
d. Interaccionismo recíproco, que es la postura en la que se considera que la
cognición y la conducta manifiesta pueden influirse de forma recíproca.
Por tanto, como se puede observar, la actividad emocional afectiva del sujeto no
aparece referida de forma explícita como un componente esencial en los distintos
modelos. Por ello, Carrobles (1985) propone un modelo conductual integrado en el
que se tienen en cuenta todas las relaciones entre los factores cognitivos, conductua-
les y emocionales. En este modelo interactivo se considera que la conducta puede es-
tar causada o activada por múltiples factores, aislados o en combinación. Aparte de
integrar a los modelos anteriores, la característica más novedosa de este modelo es la
inclusión de los estados afectivos o emocionales.
En esta línea, Staats (1963, 1975) formula un modelo, denominado conductismo
paradigmático?, en el que se incluye la personalidad del sujeto, resultando por tanto
una propuesta integradora, siendo posteriormente aplicado a la evaluación psicoló-
gica (véase Fernández-Ballesteros y Staats, 1992). El objetivo planteado por Staats es
superar las rupturas entre los distintos modelos psicológicos, en especial los submo-
delos conductuales. Según este modelo, la conducta (C) está determinada por dife-
rentes variables: las condiciones ambientales pasadas (E,) que forman la historia de
aprendizaje del sujeto, los repertorios básicos de conducta (RBC) formados a lo lar-
go de la historia de aprendizaje del sujeto y que constituyen su personalidad, las
condiciones ambientales actuales que provocan o controlan la conducta (E,) y las
condiciones biológicas que han contribuido a la constitución de los RBC (O), que
los afectan o interfieren (O,) o que intervienen en la recepción de las condiciones
ambientales actuales (O,). Su formulación teórica sería:
2 Este modelo ha ido cambiando de denominación con el transcurso de los años. Así, empieza a de-
sarrollarse en la década de los años setenta por Staats bajo el nombre de conductismo social; en la década
de los años ochenta, con el fin de no confundirlo con la teoría del aprendizaje social de Bandura, pasó a
denominarse conductismo paradigmático; recientemente, Tryon (1990) en un afán integrador lo llamó
conductismo psicológico.
a ABE O, O
[do]
=>3
Pri
Un aspecto relevante del modelo son los repertorios básicos de conducta que se-
rían patrones complejos de respuestas aprendidos mediante un proceso acumulati-
vo-jerárquico, que podrían ser tanto variables dependientes (los RBC son determi-
nados por el ambiente y las condiciones biológicas iniciales) como variables
independientes (los RBC determinan parcialmente la conducta). Estos repertorios
básicos de conducta manifiestan unas diferencias importantes con respecto a la con-
ducta; Fernández-Ballesteros (19944) señala en primer lugar que los RBC son gene-
ralizables a través del tiempo y de las situaciones, mientras que C manifiesta especifi-
cidad temporal y situacional; en segundo lugar, los RBC son constelaciones de
conductas por lo que los instrumentos para evaluarlos son conjuntos de conductas
expresados en los ítems de un test, mientras que C es considerada molecularmente
según una definición operativa basada en su ocurrencia, frecuencia, duración, etc.; y,
en tercer lugar, C constituye la variable dependiente y los RBC las variables inde-
pendientes. Según este modelo, la evaluación conductual debería centrarse tanto en
aspectos conductuales o sincrónicos (lo que hacían los modelos previos) como en as-
pectos históricos o diacrónicos que constituyen la base de los repertorios básicos de
conducta, los que por su condición de variable independiente, sin duda tienen que
ser tomados en cuenta.
En definitiva, si por algo se ha caracterizado el modelo conductual ha sido por su
constante evolución; al modelo básico E-R se han añadido variables organísmicas,
éstas (e incluso el propio ambiente) se han convertido en constructos cognitivos, y,
por último, se ha intentado realizar una integración mediante el conductismo para-
digmático. Después de este desarrollo evolutivo del modelo conductual y teniendo
en cuenta el esquema que hemos seguido para los anteriores modelos vamos a anali-
zar su objeto de estudio, su metodología básica y sus ámbitos de aplicación.
Dejando a un lado los diferentes matices expuestos con anterioridad, las tres va-
riables objeto de estudio del modelo conductual son la conducta, el ambiente y el or-
ganismo. Sin duda el foco de interés ha estado en la conducta y en la forma de opera-
tivizarla, pues ello marca los propios límites del modelo conductual. La propuesta
de Lang (1968) de la triple modalidad de respuesta (motora, psicofisiológica y cogni-
tiva) ha permitido operativizar la conducta y, a pesar de las críticas recibidas por no
ser modalidades mutuamente excluyentes, por no proceder de sistemas biológicos
claramente diferentes (Evans, 1986) o la falta de interrelación entre los tres niveles
(Sierra y cols., 1993), constituye una de las características esenciales de la evaluación
conductual (Haynes, 1992). En cuanto al elemento cognitivo, éste no tiene por qué ir
en contra del modelo conductual, siempre y cuando sea considerado como variable
dependiente, y no como explicativa de otras respuestas. Por su parte, el ambiente
constituye una variable importante, tanto en los modelos sincrónicos, en donde se

manifiesta a través de estímulos antecedentes y consecuentes que supuestamente
controlan la conducta, como en los diacrónicos (conductismo paradigmático) en
donde se combina un ambiente histórico con un ambiente actual. En los últimos
años se ha pasado de un análisis molecular del ambiente propio del conductismo ra-
dical a una concepción molar del mismo (véase Mash y Terdal, 1988). Así, se asume
que el marco ecológico del individuo constituye un continuo molar-molecular que
va desde el estímulo hasta el ambiente (universo de situaciones que transcurren en la
vida diaria de una persona) pasando por la situación (conjunto de estímulos físicos o
sociales organizados) y el contexto que integra diferentes situaciones (Fernández del
Valle, 1996). Sin embargo, este énfasis en la determinación ambiental de la conducta
no excluye variables biológicas (Haynes, 1992) o variables personales consideradas
como repertorios de conducta (Fernández-Ballesteros, 19946).
La metodología básica del modelo conductual es de carácter experimental, ha-
ciendo énfasis en los diseños N = 1. Dado que el objetivo de este modelo es el cam-
bio, la evaluación se realiza a lo largo de todo el proceso de intervención: contrasta-
ción de hipótesis funcionales, comprobación de los cambios producidos en la/s
conducta/s objeto de estudio después de aplicar un tratamiento y evaluación final de
la intervención. Por ello, la metodología básica se centra en comparaciones intrain-
dividuales (enfatiza lo idiográfico), frente a las comparaciones interindividuales pro-
pias de los enfoques nomotéticos. Sin embargo, en la fase de recogida de informa-
ción se puede utilizar una metodología correlacional (Fernández-Ballesteros, 1994b)
con las características propias del enfoque nomotético. Como consecuencia de ello
se ha ido generando una serie de instrumentos, y así junto a la observación sistemáti-
ca realizada por expertos o los registros psicofisiológicos aparece la autoobserva-
ción, los autoinformes y la entrevista. Mientras tanto, el análisis funcional (teórica-
mente, la técnica básica de evaluación de este modelo) apenas se ha utilizado como
muestran los estudios de Piotrowski y Keller (1984), Fernández-Ballesteros (1988)
(citado en Fernández-Ballesteros, 1994c) o Haynes y O'Brien (1990).
Por último, teniendo en cuenta que la evaluación conductual nace al amparo de
la modificación de conducta, su objetivo fundamental es el cambio. El ámbito de
aplicación del modelo conductual, limitado tradicionalmente a la psicología clínica,
se ha extendido en los últimos años al área educativa (Taylor, 1988; Ollendick y Gree-
ne, 1990), a la psicología de las organizaciones y del trabajo (Gatewood y Perloff,
1990), a la psicología ambiental (Fernández-Ballesteros, 1992b) o a la psicología de la
salud (Hernández, 1996).
Mientras la mayoría de los modelos experimenta un resurgimiento, el modelo
conductual está inmerso en una crisis de identidad. Este desencanto está determina-
do por los límites del propio modelo, tanto por defecto como por exceso. Limitar la
evaluación a la conducta observable y defender un enfoque exclusivamente idiográ-
fico, tal como plantean las posturas más ortodoxas, va en contra de la complejidad de
la conducta humana; por otro lado, la inclusión de ciertas variables mal especificadas
que no respetan el principio del mínimo nivel de inferencia exigible por el modelo y
el planteamiento de constructos cognitivos como estructuras con capacidad explica-
tiva está yendo en contra del propio modelo. Ante esta encrucijada, planteamientos
como el conductismo paradigmático, al aunar los principios básicos conductistas
con la complejidad de la conducta humana, pueden presentarse como una oportuna

salida.
A modo de conclusión podemos extraer algunas características del modelo con-
ductual (entendido en su planteamiento más general), que servirán para identificar
conjuntamente a los diversos modelos que lo integran y diferenciarlo de otros mo-
delos considerablemente distintos, como, por ejemplo, el psicométrico. Dichas ca-
racterísticas serían:
a. La evaluación se basa en los principios teóricos de la psicología del aprendi-

zaje.
b. Sedella de forma operativa cada uno de los elementos objeto de evalua-
ción.
c. La evaluación conductual facilita una descripción precisa y objetiva de la
conducta.
a El proceso, los objetivos y los métodos deben especificarse con precisión,
para que sea posible la replicación.
La evaluación se realiza según la metodología científico experimental.
P
a Énfasis en los determinantes actuales de la conducta, en vez de determinan-
tes históricos.
g. La evaluación es continua, centrándose en la identificación de las condicio-
nes que controlan la conducta.
o La conducta anormal no se considera cualitativamente distinta de la normal,
puesto que ambas pueden explicarse según los mismos principios.
1. Énfasis en el cambio de la conducta manifiesta como principal criterio para
evaluar el tratamiento.
J. La evaluación se centra en conductas específicas y no en causas subyacentes
hipotéticas.
k. La evaluación está relacionada con la intervención.
VII. MODELO COGNITIVO
La existencia de un modelo cognitivo de evaluación psicológica constituye un tema

polémico, al menos la conceptualización de un único modelo; así, por ejemplo,
Forns, Kirchner y Torres (1991) hablan de tres modelos cognitivos: el de la perspec-
tiva piagetana, el de la evaluación neuropsicológica y el del procesamiento de la in-
formación. Pérez-Álvarez (1995) señala que los diversos enfoques amparados en el
calificativo de cognitivo presentan notables diferencias, yendo su base teórica desde
el condicionamiento hasta el procesamiento de información, pasando por el apren-
dizaje social. No obstante, todos ellos presentan un factor común: la formulación de
que las variables cognitivas (cogniciones, atribuciones, funciones mentales superio-
res...) son los principales determinantes de la conducta.
La discusión no se limita a la coexistencia de diferentes submodelos dentro del
modelo cognitivo, sino que incluso se llega a poner en duda la existencia de un mo-
delo cognitivo dentro de la evaluación psicológica. La confusión se centra en primer
lugar en el hecho de que no todos los modelos de personalidad han derivado en

modelos de evaluación y, por otro, según algunos autores no se puede hablar de
un modelo exclusivamente cognitivo, pues los teóricos cognitivos reconocen la
interdependencia entre cognición, afecto, fisiología y conducta, por lo que lo cog-
nitivo por sí sólo no puede explicar la conducta (Dobson y Franche, 1991). En
esta misma línea se sitúan Fishman y Franks (1992) al negar la existencia de un en-
foque cognitivo(-conductual) al margen del modelo conductual. En cuanto al ori-
gen, Caro (1995) señala que el enfoque cognitivo comienza a desarrollarse en la dé-
cada de los años sesenta como consecuencia, en primer lugar, de una apertura del
modelo conductual a aspectos cognitivos? y, en segundo lugar, de orientaciones aje-
nas al modelo conductual como puede ser la reestructuración cognitiva de Ellis o
Beck.
Teniendo en cuenta esta polémica como telón de fondo, podemos decir que
para el modelo cognitivo la conducta está determinada por los elementos cogniti-
vos de la persona [C =f (P)], por lo que las variables objeto de estudio serán las es-
tructuras mentales (por ejemplo, los almacenes de memoria) y los procesos y/o es-
trategias cognitivas que median entre los estímulos y las respuestas
(Fernández-Ballesteros, 19924). Un elemento relevante es la diferencia entre las va-
riables cognitivas de este modelo y las variables cognitivas propias del modelo psi-
cométrico y, especialmente, del conductual; en el modelo cognitivo las variables
cognitivas pasan a determinar el resto de la conducta, es decir, pasan de variables
dependientes a variables independientes en terminología experimental. En este
contexto, el conductismo paradigmático establece unos criterios muy claros para
salvaguardar al modelo conductual de aquellos constructos sobre los que no exis-
ten suficientes garantías; estos criterios son la definición operativa del constructo,
existencia de pruebas experimentales y observacionales de cómo esa condición ha
sido adquirida, de técnicas que permitan controlarlos y de pruebas empíricas acer-
ca de la asociación entre esa variable y la conducta (Fernández-Ballesteros, 19944).
En cuanto a la tecnología, no existe una aportación clara de este modelo a la eva-
luación psicológica, puesto que las técnicas utilizadas, tales como los autoinformes
o autorregistros (Segal y Shaw, 1988), forman parte también del modelo conduc-
tual. La diferencia estaría en la interpretación hecha de los datos que nos propor-
cionan estas técnicas; en el caso del modelo cognitivo se interpretarían desde un de-
terminismo cognitivo. Sin embargo, la distinción realizada por Dobson (1988)
entre evaluación de estructuras cognitivas y procesos cognitivos, puede llevar a in-
cluir por ejemplo técnicas propias como la evaluación del potencial de aprendizaje
(Calero, 1995). Tal como señala Martorell (1988), el evaluador cognitivo debe cen-
trarse en qué ocurre cuando el sujeto adquiere información nueva y en cómo la ela-
bora y la emite; así, mientras en la evaluación tradicional se trabaja con puntuacio-
nes totales y las aptitudes mentales son evaluadas como un constructo, en la
evaluación cognitiva las aptitudes mentales se evalúan como un proceso. El ámbito
de aplicación del modelo cognitivo va desde la clínica (la terapia cognitiva de Beck
3 Esta “cognitivización” del modelo conductual, pasando a denominarse cognitivo-conductual, se

produce como consecuencia del condicionamiento encubierto de Cautela, el determinismo recíproco de
Bandura y de las autoinstrucciones de Meinchenbaum entre otros.
o la terapia racional-emotiva de Ellis son ejemplos claros) hasta la escuela (perspec-

tiva piagetana o evaluación del potencial de aprendizaje).
A la hora de valorar este modelo, Pérez-Álvarez (1995) duda si realmente ha
aportado algo al modelo conductual; según este autor parece que el modelo cogniti-
vo no ha alcanzado los objetivos planteados en un primer momento, y un buen
ejemplo de ello es que sus propios promotores se manifiestan descontentos con este
planteamiento dando un salto al constructivismo. Dentro de la terapia de conducta,
Cruzado, Labrador y Muñoz (1993) señalan que los supuestos cognitivos pudieran
ser innecesarios para las técnicas conductuales.
VIl. MODELO HUMANISTA
Las razones argumentadas para dudar de la inclusión del modelo cognitivo dentro
de la evaluación psicológica pueden extrapolarse a la hora de hablar del modelo hu-
manista. Ávila (1992b) señala como pilares de este modelo la psicología individual de
Adler, las formulaciones guestálticas que postulan una concepción totalista de la
conducta, los constructos personales de Kelly y las obras de Rogers y Maslow cen-
tradas en la autorrealización y crecimiento personal.
Según este modelo, la conducta del sujeto está determinada por su percepción
del mundo. Por tanto, la subjetividad y la introspección se convertirán en elementos
centrales. Sólo se podrá comprender realmente a una persona cuando nos situemos
en su lugar para percibir el mundo desde ella misma (Carrobles, 1989). Una limita-
ción que plantea el modelo es una insuficiente formulación de un concepto de con-
ducta, limitándose a describirla sin intentar identificar las causas funcionales de la
misma. En principio, el objeto de estudio planteado es la personalidad como algo
global, por lo que no se haría énfasis en variables aisladas; sin embargo, según Ávila
(1992b) podrían señalarse como objetos de estudio la autopercepción, el autocon-
cepto, la percepción de los otros y del ambiente, las estrategias personales de solu-
ción de problemas, la tendencia a la autorrealización, etc. Pero sin duda ninguna, la
mayor limitación de este modelo es que sus postulados y conceptos no son científi-
cos, constituyendo simples y vagas descripciones de las que resulta difícil generar hi-
pótesis verificables (Carrobles, 1989).
Aunque parece inherente al modelo el uso de la introspección, se utiliza la obser-
vación y la autoobservación (Ávila, 1992b), aunque puesta en marcha a través de la
entrevista como marco de relación (Forns y cols., 1991). Las técnicas subjetivas,
como la técnica de rejilla de Kelly para la evaluación de los constructos personales o
la técnica Q de Stephenson son propias de este modelo. Asimismo, el análisis de
contenido aplicado a las técnicas psicobiográficas y las narraciones personales tienen
cabida dentro de este enfoque. El ámbito de aplicación por excelencia del modelo
humanista es el clínico, proponiendo una visión unitaria y molar de la personalidad
frente a posturas moleculares.
IX. PARADIGMA CONSTRUCTIVISTA
En estos últimos años el enfoque constructivista ha cobrado interés en las terapias de

corte cognitivo, en las sistémicas, fenomenológicas* y en algunos campos de aplica-
ción como la educación o la evaluación de programas. En la década de los ochenta,
Mahoney ya indicaba que el modelo cognitivo era restrictivo en su acercamiento a la
evaluación de los procesos cognitivos (Mahoney, 1980). Como consecuencia de esta
diversidad no se propone como modelo sino como paradigma que aglutina diferen-
tes teorías con un planteamiento de base común: la visión del hombre como ser
constructor de su propia realidad, es decir, cada persona construye su propia y única
percepción de la realidad. Esta diversidad la pone de manifiesto Joyce-Moniz (1985,
p- 160) al señalar que «las formas de constructivismo son tan numerosas como las
opiniones sobre la manera en que un hombre transforma la realidad». R. A. Neime-
yer (1993a) incluye dentro del constructivismo la teoría de los constructos persona-
les, la terapia cognitiva estructural-evolutiva (Mahoney, 1991), la reconstrucción na-
rrativa (Meinchenbaum y Fong, 1993; Goncalves, 1994) y la terapia familiar
constructivista (Feixas, 1990). Los constructivistas son pluralistas en sus postulados
y procedimientos, estando unidos por su oposición a una epistemología positivista
(Neimeyer, 1994).
El paradigma constructivista plantea que las personas crean activamente sus pro-
pias realidades; estos modelos creados de la realidad determinan a su vez el modo en
que la realidad puede ser percibida (Botella, 1991). Estos modelos de la realidad con-
tribuyen a la experiencia en sí misma, más que reflejar simplemente la experiencia; el
determinismo recíproco entre determinantes personales, comportamentales y am-
bientales es superado, produciéndose una construcción que influirá de forma decisi-
va en las posteriores construcciones que realizará una persona (Carmin y Dowd,
1988).
Según Guba y Lincoln (1989), para el paradigma constructivista existen múlti-
ples realidades socialmente construidas, elaboradas por las personas al intentar dar
sentido a sus experiencias; por su parte, la investigación consiste en consensuar las
diferentes construcciones posibles sobre el mismo hecho o fenómeno. R. A. Neime-
yer (19934) señala que el paradigma constructivista se caracteriza por:
a. Asumir parte de los presupuestos del construccionismo social, emplazándo-

se el sí mismo en un contexto social.
b. Suponer que no podemos afirmar la validez del conocimiento sino su viabi-
lidad (consecuencias que tiene para el sujeto y grado de coherencia respecto
a su sistema personal).
c. Los seres humanos somos agentes activos que construimos los significados
de nuestro mundo de experiencias.
1 El enfoque constructivista alcanza su máximo desarrollo dentro de la psicoterapia, constituyéndo-

se en un paradigma integrador de la Teoría de los constructos personales, la Terapia cognitiva estructural-
evolutiva, la Terapia cognitiva narrativa y la Terapia familiar constructivista.
d. El conocimiento humano es interpersonal, evolutivo y proactivo (anticipa-

torio).
e. Los seres humanos son sistemas caracterizados por un desarrollo autoorga-
nizativo que busca proteger y mantener la coherencia y la integridad interna.
La formalización teórica del constructivismo plantea que el determinante básico

de la conducta es la persona [C =f (P)], considerada ésta como el conjunto o sistema
de creencias que ha construido a partir de su experiencia con el medio. El ser huma-
no no es pasivo ni está determinado, sino que es activo y anticipatorio. Por tanto, la
psicoterapia no tiene como objetivo el cambio de las creencias irracionales (propio
de un enfoque racionalista y positivista como el modelo conductual), sino la recons-
trucción conjunta entre el terapeuta y el cliente en interacción de una nueva forma de
percibir el mundo y a sí mismo. Estamos por tanto ante un paradigma que rechaza
los planteamientos conductuales.
Las variables objeto de estudio son los sistemas de constructos personales y las
narrativas personales del sujeto. Mientras la evaluación cognitiva tradicional (por
ejemplo, la teoría de Beck o la de Ellis) se centra en variables aisladas tales como las
creencias irracionales o los pensamientos automáticos, el paradigma constructivista
tiene como objeto de evaluación los sistemas interconectados de constructos perso-
nales, construcciones metafóricas y narrativas. El cuadro 4.1 recoge una compa-
ración realizada por Neimeyer y Neimeyer (1993) entre la evaluación cognitivo-
conductual y la constructivista; ello clarificará las diferencias entre estas dos
posturas.
La metodología básica del paradigma constructivista está fuera del campo cientí-
fico positivo y dentro de un proceder hermenéutico y dialéctico (Guba y Lincoln,
1989). La evaluación del sujeto es un proceso de construcción (reconstrucción en
psicoterapia) que surge de la interacción evaluador-evaluado. Teniendo en cuenta
que se trata de un paradigma que agrupa diversas teorías, las técnicas son muy diver-
sas. Así, se encuentran técnicas clásicas para la evaluación de constructos personales
como la técnica de rejilla y otras innovadoras para evaluar los significados del sujeto
tales como el escalonamiento, la autocaracterización, flujo de conciencia, lazos fami-
liares, etc. (Neimeyer, 1993b), el análisis de contenido que a su vez ha dado lugar a
algunas escalas (Viney, 1993) o la narración personal como «relato en primera perso-
na que tiene algún grado de organización aparente, temporalidad y coherencia temá-
tica» (Hoshmand, 1993, p. 179). La entrevista más que una técnica puntual constitu-
ye un ámbito o contexto en el que se desarrolla la evaluación-reconstrucción
personal.
Por lo que respecta a los ámbitos de aplicación del paradigma constructivista, el
más importante sin duda es la psicología clínica; de hecho, muchas de sus teorías se
desarrollan dentro de la psicoterapia. Sin embargo, el constructivismo está adentrán-
dose en otros campos como la evaluación de intervenciones (Guba y Lincoln, 1989)
o la psicología educativa (Bernad, 1994; Gómez-Granell y Coll, 1994).
Una de las limitaciones del constructivismo es la adopción de un posicionamien-
to epistemológico al margen de la ciencia positiva, por lo que presenta problemas
epistemológicos y metodológicos similares a los del modelo psicodinámico; de he-
cho, Pérez-Álvarez (1995, p. 67) manifiesta que se trata de «un salto a construcciones
CUADRO 4.1. Comparación entre la evaluación cognitivo-conductual y la evaluación cons-

tructivista (tomado de Neimeyer y Neimeyer, 1993)
COGNITIVO-CONDUCTUAL CONSTRUCTIVISMO
xKá— MMMM
— Evaluación neutral, no reactiva. * — Evaluación generadora de cambio.
—El objetivo son unidades aisladas del — El objetivo son sistemas de creencias,
pensamiento, aurorreferencias, creen- narraciones personales, etc.
Clas, etc.
— El foco de atención es la frecuencia de —.El foco de atención son las relaciones

pensamientos o la intensidad de las de implicación entre constructos.
creencias.
— Se centra en el presente. — Se centra en el presente, pero haciendo

énfasis en el desarrollo.
— El tipo de cognición estudiado son las — El tipo de cognición estudiado son las
proposiciones; por ejemplo, «soy des- distinciones fundamentales o construc-
preciable». tos bipolares.
— El tipo de relación entre cogniciones es — El tipo de relación entre cogniciones es

asociacionista, (para)lógica. jerárquica, haciendo énfasis en los pro-
cesos de ordenación.
— El nivel de análisis es individual. — El tipo de análisis va de individual a sis-

témico.
—.El diagnóstico hace énfasis en el tras- — El diagnóstico enfatiza la comprensión,

torno específico. lo general.
— Se utilizan cuestionarios autoadminis- — Se utiliza la entrevista o la programación

trados. interactiva, el diario personal, etc.
— Los instrumentos de evaluación son es- — Los instrumentos de evaluación son me-
tructurados y estandarizados. nos estructurados.
— La corrección es cuantitativa. — La corrección es cuantitativa y cualita-

tiva.
— El criterio de adecuación es psicomé- — El criterio de adecuación es tanto psico-

trico. métrico como hermenéutico.
teoreticistas al modo freudiano». Otro hándicap importante es que dentro del pro-
pio paradigma coexisten teorías muy diversas, lo que nos coloca en la duda de si en el
futuro se producirá una integración o una escisión. Por último, de cara a una solidez
del paradigma, se necesitan operativizar (o al menos especificar mejor) aspectos tan
relevantes dentro del paradigma como, por ejemplo, el desarrollo evolutivo de los
constructos personales, cómo afectan las primeras experiencias, cómo se modifican,
ué papel juega el ambiente físico o social, etc. Entre los elementos positivos, Pérez-
Álvarez (1995) señala el énfasis que hace en el carácter proactivo y reconstructivo, lo
cual podría ser de interés en la relación terapeuta-paciente. En el caso concreto de la
evaluación psicológica, el planteamiento absolutamente idiográfico que defiende

puede ser de interés”, así como tener en cuenta los valores y los sesgos del evaluador
en ese proceso de interacción; tal como señala Neimeyer (1994), la terapia construc-
tivista busca una relación más igualitaria entre terapeuta y paciente que las terapias
tradicionales. Por su parte, Caro (1995) considera que el constructivismo impregna-
rá, con algunos de sus conceptos, los enfoques cognitivos tradicionales, pero sin lle-
gar a provocar un cambio de paradigma o metodología.
X. CONFLUENCIA DE MODELOS
Como ya se ha comentado con anterioridad, la evaluación conductual surge como

una alternativa a la evaluación tradicional (modelos de enfermedad y psicométrico).
En un afán por destacar las diferencias entre ambas perspectivas, diversos autores
(Ciminero, 1986; Barrios, 1988) han extremizado y sintetizado al máximo los mode-
los expuestos con anterioridad hasta llegar a dos polos diferentes: la evaluación psi-
cométrica y la evaluación conductual (modelo conductual o conductual-cognitivo).
Esta oposición se muestra de una forma resumida en el cuadro 4.2.
Con el paso del tiempo, las posiciones irreconciliables entre ambos enfoques han
ido desapareciendo, por lo que en la actualidad ya no tiene mucho sentido dicha dis-
tinción, pues simplifica la realidad de enfoques existentes e impide las perspectivas
integradoras dentro de la evaluación psicológica. En la actualidad estamos siendo es-
pectadores de un acercamiento entre los diferentes modelos; así, se están intentando
aplicar principios psicométricos al modelo conductual (véase Silva, 1989), los mode-
los conductual y cognitivo han ampliado sus campos de acción y comparten proce-
dimientos y principios (Caro, 1995), etc. La evaluación psicológica actual ha alcan-
zado un elevado nivel de desarrollo, tanto a nivel teórico como aplicado. Esto ha
llevado a una pérdida de unificación, siendo realmente difícil poder conceptualizarla
como una sola disciplina. Así, se suele considerar como una disciplina eminente-
mente aplicada (Silva, 1988), al mismo tiempo que se está produciendo un distancia-
miento entre la teoría y la práctica (Fernández-Ballesteros y Silva, 1989). Por otra
parte, se está experimentando un resurgimiento del modelo psicométrico (Yela,
1990), simultáneamente a una mayor ramificación del modelo conductual. A esto
hay que añadir una mayor especialización de los autores, lo que trae consigo una
pérdida de la visión global. Ante esta diversidad de modelos, submodelos, teoría,
práctica, especialización, los autores optan por diversas opciones:
a. Adoptar una postura ecléctica, es decir, utilizar cualquier técnica que pueda
ser útil en la práctica, independientemente del modelo teórico de partida.
b. Adoptar una postura integradora como, por ejemplo, la aplicación de los
principios psicométricos al modelo conductual (Silva, 1989; Silva y Marto-
rell, 1991).
Dentro del paradigma constructivista el enfoque idiográfico alcanza su máxima expresión, puesto
que cada evaluación-reconstrucción tiene lugar en un acto interactivo evaluador-evaluado irrepetible.
CUADRO 4.2. Comparación entre la evaluación psicométrica y la evaluación conductual
EVALUACIÓN PSICOMÉTRICA EVALUACIÓN CONDUCTUAL
— Conducta determinada por atributos in- — La conducta está en función de varia-

ternos. > bles ambientales actuales y del “orga-
nismo”.
— Las respuestas son signos o indicado- —Las respuestas son muestras de con-
res de características subyacentes. ducta.
—La conducta es consistente y estable — La conducta depende de la situación o

debido a las dimensiones internas del de la interacción persona-situación. La
sujeto. Si hay inconsistencias en la me- estabilidad de la conducta se consigue
dida test-retest son consecuencia del mediante el control estimular.
error de medida.
— Evaluación indirecta: las respuestas a — Evaluación directa de las respuestas.

un test no están relacionadas directa-
mente con el atributo evaluado.
— Técnicas características: tests psico- — Técnicas características: observación y

métricos. registros psicofisiológicos.
— Los ítems no presentan especificidad; — Los ítems presentan especificidad.

son descripciones conductuales gene-
rales.
—Énfasis en la validez de criterio y de — Énfasis en la validez de contenido.

constructo.
— Evaluación preestablecida; batería de — Evaluación idiográfica.

tests.
— Evaluación global. — Evaluación atomizada.
— La relación con el tratamiento (cuando — La relación entre evaluación y trata-

existe) es indirecta y puntual. miento es directa y continua.
— Menor costo para el evaluador y para el — Mayor costo para el evaluador y para el
evaluado. evaluado.
c. Adoptar una postura interdisciplinar, la cual permitiría la especialización y la

colaboración entre los distintos modelos. A continuación, presentamos una
síntesis de cada una de estas posturas.
x1. Eclecticismo
Desde que Lazarus (1967) se autodefiniese como terapeuta multimodal y lanzarasu

enérgica defensa sobre lo que él llama eclecticismo técnico, consistente en seleccio-
nar técnicas con independencia de la teoría que las ha generado, la polémica se man-
tiene prácticamente en los mismos términos. Este autor plantea que si bien un cientí-
fico no puede permitirse el lujo de ser ecléctico, el clínico no puede permitirse ellujo
de no serlo; es decir, mientras que el eclecticismo teórico es lógicamente imposible, y
en esto coincide la totalidad de los científicos, el eclecticismo técnico se justifica ar-
gumentando que cualquier técnica que resulte útil será bienvenida en la terapia. Esta
postura es realmente peligrosa, puesto que en muchas ocasiones la selección de la
técnica es consecuencia de la atracción subjetiva, vivencia o creatividad del terapeuta
sin que haya ninguna base conceptual (Feixas, 1994). Franks (1991) critica estos ar-
gumentos por incurrir en una clara contradicción. Este autor defiende que la investi-
gación sistemática es la estrategia ideal tanto para la investigación como para la prác-
tica; por tanto, la información más útil y eficaz en la práctica es aquella que se va
acumulando de forma consistente dentro de un enfoque teórico. Por otra parte, dada
la gran cantidad de técnicas disponibles sería sensato inclinarse por aquellas que tie-
nen un fuerte respaldo en la investigación realizada en el marco teórico con el que se
identifica el clínico. Según esta perspectiva, es menos eficaz practicar el eclecticismo
técnico, ya que para saber qué es lo que funciona son necesarios estudios de valida-
ción. De manera similar opina Wolpe (1989) cuando acusa de eclecticismo amorfo a
la práctica de muchos clínicos actuales que han abandonado el modelo del condicio-
namiento, pasándose a otros modelos en los que no han obtenido mejores resulta-
dos; defiende la terapia conductual clásica y el modelo del condicionamiento y hace
duras críticas a la terapia conductual surgida a partir de la denominada revolución
cognitiva.
En la actualidad, autores como Kazdin (1991) y Franks (1991) consideran que
los psicólogos conductuales ya no son tan intolerantes con otros modelos como el
psicodinámico, e incluso en algunos sectores se está produciendo un acercamiento,
tanto en el ámbito clínico como en el teórico, con vistas a la búsqueda de perspecti-
vas integradoras. Algunas encuestas realizadas ponen de manifiesto la existencia de
este tipo de posturas, sobre todo en Estados Unidos. En una encuesta efectuada en-
tre los miembros de la Association for Advancement of Behavior Therapy (AABT) se
encontró que los instrumentos propios de la evaluación tradicional eran utilizados
de forma asidua por los terapeutas de conducta; así, un 70% aplicaba el MMPI y un
34% el Rorschach (Piotrowski y Keller, 1984). Datos similares se registraron en otra
encuesta realizada a los miembros de la división de psicología clínica de la American
Psychological Association (APA), de los cuales un 29% se autodefinía como eclécti-
cos, siendo esta orientación la más importante en el año 1986 (Norcross, Prochaska
y Gallagher, 1989). En Alemania, el porcentaje de eclécticos llegaba al 74% (Ávila,
1989); en un estudio más reciente, Schorr (1993) pone de manifiesto el empleo que
los terapeutas de conducta alemanes hacen de las técnicas proyectivas. No obstante,
estos datos deben ser tomados con cierta cautela pues, tal como considera Feixas
(1994), la etiqueta de ecléctico puede entenderse más por lo que no es (no adhesión a
ningún modelo concreto) que por lo que es. En un análisis reciente de los programas
de doctorado acreditados por la APA realizado por Piotrowski y Zalewski (1993), se
halla que en la formación se combinan técnicas psicométricas, proyectivas y conduc-
tuales. El caso de España, tal como apuntan Buela-Casal, Sierra y Carrobles (1995)
basándose en diferentes encuestas realizadas (Andrés y Ferrezuelo, 1984; Ferrezue-
lo, 1985; Camarero y Ferrezuelo, 1988), dista bastante del de Estados Unidos, sien-
do mínima la postura ecléctica e, incluso, con tendencia a reducirse. Así, la mayoría

de los profesionales (Camarero y Ferrezuelo, 1988) y de los estudiantes de psicolo-
gía (Buela-Casal, Álvarez-Castro y Sierra, 1993; Sierra y Freixa ¡ Baqué, 1993; Álva-
rez-Castro, Buela-Casal y Sierra, 1994; Sierra y cols., 1995) se identifica con el mo-
delo conductual.
Sin embargo, los autores más importantes, que en definitiva son los que siguen
marcando el rumbo, no ven posible tal postura, y así se manifiesta Franks (1991,
p19):
mi posición en este debate es clara: los dos son básicamente irreconciliables a niveles concep-
tuales y teóricos, y la integración a nivel de la práctica clínica plantea numerosos problemas
[...]. Los terapeutas de conducta y los psicoanalistas se basan en paradigmas distintos, entien-
den y formulan los problemas psicológicos de manera diferente, confían en métodos diferen-
tes de verificación y aceptan hechos distintos como datos legítimos [...]. Desde mi punto de
vista, una solución, al menos en un futuro cercano, sería que cada sistema fuese a su avío, con
la esperanza de desarrollar una teoría y una práctica más viables dentro de su propio sistema.
Entre las distintas razones que se han formulado en contra del eclecticismo po-
demos señalar que el eclecticismo incrementa el distanciamiento entre la teoría y la
práctica, siendo un indicador de debilidad teórica y falta de rigor metodológico.
Además, en la postura ecléctica se intenta minimizar las diferencias entre los distin-
tos enfoques y, aunque es cierto que hay aspectos comunes, también lo es que hay
distinciones importantes. De forma similar opina Ardila (1990, p. 103) al señalar que
es un hecho que en los distintos sistemas psicológicos hay muchas cosas que rescatar. Y es un
hecho que no todos los marcos conceptuales pueden ser correctos ni válidos porque se basan
en diferentes filosofías y en distintas maneras de mirar el mundo. Si alguien trata de hacer una
síntesis ecléctica de las teorías de la psicología de hoy el resultado sería imposible de manejar,
estaría lleno de contradicciones y carecería de una columna vertebral. Carecería completa-
mente de validez.
x.2. Integración
Otra opción ante la diversidad de enfoques es intentar una integración, lo cual hasta
cierto punto es lógico y factible, tal como hemos visto en los modelos integradores
de la evaluación conductual. No obstante, cuando se trata de modelos considerable-
mente distintos en su fundamentación teórica, como ocurre por ejemplo con el mo-
delo conductual y el psicométrico, la integración resulta sumamente compleja. La
integración no consiste en hacer desaparecer la pluralidad para reafirmar un único
modelo, sino partir de la diversidad y aprovechar las diferencias de las perspectivas
(Feixas, 1994). Se trataría de buscar aspectos comunes, unificando las partes para
crear algo nuevo, siendo este algo más que la suma de las partes, con lo cual se dife-
renciaría del eclecticismo que busca las diferencias, representa la suma de las partes y
aplica lo existente (Caro, 1995). Una integración para que sea válida y efectiva debe
realizarse a tres niveles diferentes: epistemológico, metodológico y aplicado. En pri-
mer lugar habría que analizar si los tipos de conocimientos que se obtienen con am-
bos modelos están en un mismo nivel y por tanto si es factible la integración. Por
ejemplo, se podría predecir que el modelo conductual y el psicodinámico, en su con-

ceptualización actual, nunca llegarán a integrarse. Para que una disciplina pueda in-
tegrarse en otra es necesario que todas las teorías y leyes de una sean consecuencias
lógicas de las formulaciones teóricas de la otra. Esta condición se denomina deriva-
bilidad. Además, se requiere que todos los términos técnicos de la disciplina que
pretende integrarse sean redefinidos según la terminología de la disciplina a la que se
pretende integrar. Ésta es la condición de conectabilidad (Nagel, 1961). En segundo
lugar, habría que analizar si se produciría una contradicción metodológica; si de lo
anterior se concluye que la integración es posible, sería necesario demostrar las ven-
tajas que tendría la integración frente a la no integración. Por último, en el caso de
que se considere útil, sería imprescindible un último análisis sobre las posibilidades
de que llegue a implantarse a nivel aplicado (por ejemplo, sería mejor aceptado a ni-
vel profesional un modelo integrado en Alemania, donde la mayoría son eclécticos,
que en España donde éstos representan una pequeña minoría) y la forma en que de-
bería hacerse. Hay que considerar que el futuro modelo integrado no aparecería en
el ámbito profesional como un nuevo modelo, sino que tendría que implantarse
como una sustitución de los que ya están más o menos consolidados. De no hacerse
así, probablemente llevaría a tener tres modelos donde antes había dos. Si un proceso
de integración no se realiza según los niveles propuestos anteriormente, es muy po-
sible que nunca llegue a consolidarse, pues se corre el riesgo de entrar en polémicas
con argumentaciones circulares, lo cual sólo sirve para incrementar la complejidad
de las estructuras sinápticas de los teóricos.
El intento más claro ha sido la integración del modelo psicométrico y del con-
ductual, lo cual ha dado lugar a intensos debates sobre todo dentro del modelo con-
ductual. Han pasado ya dos décadas desde que se inició un intento de integración de
ambos modelos, y en este tiempo se ha discutido mucho, pero se ha avanzado poco.
El origen de la polémica tiene lugar en la década de los años setenta cuando desde las
filas conductuales surgen quejas acerca de la pobreza psicométrica que presentan
muchos instrumentos utilizados en evaluación conductual. Sin embargo, importan-
tes evaluadores conductuales, como es el caso de Rosemery O. Nelson y John D.
Cone, se han opuesto siempre a este acercamiento apoyándose para ello en tres gran-
des diferencias entre ambos modelos: consistencia-inconsistencia, análisis grupal-
análisis individual y causalidad estructural intrasujeto-causalidad funcional ambien-
te sujeto (Silva, 1989). Cone (1989, p. 184) llega a afirmar que
ya es hora de que los evaluadores conductuales adopten un paradigma más adecuado a su ob-
jeto de estudio, la conducta, y de que rechacen conceptos que pertenecen a un paradigma ra-
dicalmente distinto y desarrollado para un objeto de estudio completamente diferente [...]
tampoco sería sorprendente contemplar el surgimiento de un movimiento separatista en la
evaluación conductual, y que los evaluadores conductistas radicales formaran su propia disci-
plina o subdisciplina.
En opinión de Silva y Martorell (1991), esta oposición frontal a la integración

desde el modelo conductual no tiene mucho sentido cuando los conceptos clásicos
de la psicometría han evolucionado en los últimos años abandonando posturas de-
mastado radicales. Sin embargo, Cone (1996) sigue pensando que la pluralidad de la
evaluación conductual hace muy difícil tratar con aspectos psicométricos concisos;
desde entonces mantiene esta postura, si cabe aún más radical, manifestando la im-
posibilidad de ver la conducta con “gafas psicométricas”. Asimismo, L. E. Bleutler
(comunicación personal, 15 de agosto de 1995) señala que tal integración está muy
pobremente formulada y que es difícil llevarla a la práctica. De la misma opinión es
5. C. Hayes (comunicación personal, 25 de septiembre de 1995), para quien el mode-
lo conductual podría integrar aspectos psicométricos, pero el problema es que los
resultados encontrados son negativos, pues para el modelo psicométrico la fiabilidad
y la validez están por encima de la utilidad. Este autor llega incluso a poner en duda
la importancia de los aspectos psicométricos, puesto que el relevante papel que han
tenido durante cincuenta años no ha servido para mejorar la actual evaluación psico-
lógica. Por su parte, K. R. Murphy (comunicación personal, 4 de septiembre de
1995) considera que una posible integración sólo tendría sentido en algunos contex-
tos y ante algunos objetivos, pues los fines de ambos modelos son diferentes.
La situación actual es que sigue promoviéndose un intento de integración, que
parece ser bien aceptado por autores del modelo psicométrico. Un buen ejemplo es
Anastasi (1985) al plantear la necesidad de contextualizar la medición y su intento de
definir el rasgo según una perspectiva conductual. Mientras que la oposición a la in-
tegración está representada por autores conductuales. Es importante resaltar que la
expresión evaluación conductual representa en realidad distintos modelos de evalua-
ción, tal como hemos visto anteriormente, por lo que sería necesario analizar si to-
dos los modelos son integrables. A. W. Staats (comunicación personal, 15 de sep-
tiembre de 1995) habla de una tercera generación del conductismo con las
características conceptuales, metodológicas y empíricas que proporcionan la base de
la unificación psicométrico-conductual; como ejemplo de ello pone el conductismo
paradigmático. Por su parte, A. E. Kazdin (comunicación personal, 17 de agosto de
1995) considera que ambos enfoques son diferentes, pero que pueden ser integrados
hasta el punto de que cualquier medida puede satisfacer los requerimientos plantea-
dos por la evaluación. Asimismo, la postura de Haynes y WaiAlae (1994) parece ser
realista al considerar que la naturaleza funcional de la evaluación conductual fomen-
ta el uso de variables mínimamente inferenciales, pero en el caso de las variables mo-
leculares son importantes las dimensiones psicométricas de exactitud, validez y fia-
bilidad. Por su parte, L. Almeida (comunicación personal, 24 de septiembre de 1995)
señala que la integración de ambos modelos es algo muy deseable de cara a la investi-
gación y la práctica clínica porque permite el análisis de un mayor número de varia-
bles (tanto internas como externas). En resumen, aunque a nivel conceptual y meto-
dológico la integración parece difícil o al menos polémica, en la práctica
[...] en la actualidad la coexistencia de la metodología e instrumentación tradicional con la

comportamental es un hecho que no sólo supone excesivos roces, sino que además demuestra
en este terreno la posibilidad de una mutua complementación e incluso de una potenciación
de las diferentes formas de intervención psicológica en el campo que tradicionalmente se ha
considerado más estrictamente médico [Ávila y cols., 1994, p. 95].
Por último, habría que matizar una cuestión planteada por Carbonell, Carpinte-
ro y Silva (1988) quienes después de realizar un estudio sobre la situación actual y
perspectivas futuras de la evaluación psicológica, postulan en una de sus conclusio-

nes que hay una tendencia a la integración, para lo cual se apoyan en las opiniones de
autores importantes. Sin embargo, las expresiones utilizadas por algunosde estos
autores, como por ejemplo, «evaluación pluralista» (Kendall), «investigación cola-
borativa» (Exner), «aproximaciones multidimensionales» (Chelune), «se han reali-
zado intentos por parte de los neuropsicólogos y terapeutas conductuales para
aunar esfuerzos» (Goldstein), etc., parecen más propias de propuestas interdiscipli-
nares o multidisciplinares. ,
Otro intento de integración es la síntesis experimental del comportamiento. Este
ha sido formulado por Ardila (1988, 1990) siguiendo el sistema de análisis de Kubn.
Comienza afirmando que la psicología ha superado el período preparadigmático y
que, en la actualidad, se encuentra en un período de paradigmas en oposición, donde
cada escuela psicológica tiene una escuela en oposición (tesis-antítesis). Por tanto,
según los postulados de Kuhn, debe seguir un período de síntesis; de ahí el nombre
de síntesis experimental del comportamiento. Pero la síntesis de Ardila (1990) no es
ecléctica pues, como su denominación indica, se basa en el análisis experimental del
comportamiento. Se trata pues de una propuesta conductista muy próxima a Skin-
ner. El siguiente paso en el desarrollo de la psicología sería un paradigma unificador
para que se convierta en una ciencia “normal” en el sentido de Kuhn. Pero para ello,
deben cumplirse los siguientes requisitos:
a. Estudiar problemas más complejos que los estudiados tradicionalmente por

los conductistas; por tanto, se deberían abordar los procesos cognitivos, el lenguaje,
las emociones, el comportamiento social, etcétera.
b. Utilizar como punto de partida datos observacionales y correlacionales. Ta-
les datos aportan únicamente directrices para formular hipótesis, aunque debe enfa-
tizarse siempre el método experimental.
c. Utilizar matemáticas y formular estructuras teóricas para explicar los he-
chos. El análisis experimental del comportamiento ha sido en cierto modo un siste-
ma muy cercano a los hechos y muy alejado de las teorías. Sin embargo, en el presen-
te es necesario formular teorías, elaborar modelos matemáticos y sistemas amplios
de explicación.
d. Eliminar el dogmatismo. Esto es realmente complejo; está relacionado con
la sociología de la ciencia e incluso con la “psicología de los científicos”.
e. Enfatizar el humanismo conductual. La ciencia es una actividad humana, el
científico no surge en un vacío social; por tanto, sus valores y sus metas influyen o
guían sus experimentos. El concepto de humanismo conductual en este contexto se
refiere a los aspectos de evaluación de la ciencia, entendiendo que ésta debe estar al
servicio del hombre.
Si todos estos pasos se cumplen, la psicología se convertiría en una ciencia unifi-

cada que, según Ardila (1990), tendría las siguientes ventajas:
a. Un nivel conductual de explicación, entendiendo la conducta en su concep-

ción más amplia.
b. Utilización del método experimental, aunque en una primera etapa se puede

admitir el correlacional, la observación, etc.
c. Enfasis en elaprendizaje (la mayor parte de la varianza que se observa en el
comportamiento humano se fundamenta en el aprendizaje o en la interac-
ción de éste con su base biológica).
d. Un objeto de estudio amplio; se debe tratar de explicar todo lo que tradicio-
nalmente ha sido tratado por la psicología.
e. Enfasis en el ambiente, entendiendo el ambiente físico, el sistema cultural y
el social.
f. La tecnología conductual; para la síntesis experimental del comportamiento
es muy importante entender el mundo y, además, debe modificarse para
adaptarlo a nuestra especie.
x3. Interdisciplinariedad
Una tercera opción ante la diversidad de enfoques sería la interdisciplinariedad, la
cual puede definirse como la convergencia de dos o más disciplinas científicas para el
conocimiento de un objeto común. Según Monserrat (1984), en la actualidad se pue-
de plantear con toda seguridad que no está justificado hablar de disciplinas científi-
cas autónomas, puesto que todas tienen un cierto grado de interdependencia; la in-
terdisciplinariedad va borrando de forma progresiva las barreras de las ciencias. Con
la interdisciplinariedad se trata de hacer compatibles la especialización inherente al
actual conocimiento científico con la complejidad de los fenómenos empíricos que
son abordados por la ciencia. Debemos comenzar distinguiendo dos términos que
en muchas ocasiones se utilizan como sinónimos, cuando en realidad se refieren a
dos conceptos distintos. Nos referimos a “multidisciplinar” e “interdisciplinar”. El
primero se refiere a la yuxtaposición o sumación de diversos estudios, con diversos
enfoques, en torno a un tema común. Los datos son obtenidos de forma indepen-
diente por cada uno de los enfoques, sin que las teorías y los métodos de ninguna de
las disciplinas se modifiquen por la influencia de las otras disciplinas que intervienen
en el estudio. El segundo concepto implica que la explicación y el análisis de los su-
puestos básicos y las teorías de una determinada disciplina son estudiados utilizando
los modelos, las teorías y los métodos de otras disciplinas. Esto permite comprender
muchos planteamientos que a primera vista pueden parecer lógicos, pero que resul-
tan sumamente complejos o, por el contrario, encontrar sencillas explicaciones a
problemas aparentemente complejos. Sin embargo, como señala Gyarmat1 (1990), lo
interdisciplinar no debe entenderse como una simple mezcla de dos o más discipli-
nas, o el traspaso de los principios y métodos de unas a otras, sino que debe ser una
síntesis armónica. Con el enfoque interdisciplinar se perfecciona cada una de las dis-
ciplinas implicadas, al mismo tiempo que se aumenta su capacidad para interaccio-
nar y colaborar con otras disciplinas.
La interdisciplinariedad ha nacido como una necesidad promovida por el avance
científico. Al principio cada disciplina era capaz de abordar su objeto de estudio, tra-
tando los problemas de una forma acotada, pero el avance del conocimiento implica
una perspectiva cada vez más amplia y, con ello, aparece la necesidad de utilizar da-
tos y resultados procedentes de disciplinas afines. Esto ha llevado a la desaparición

de la frontera que separaba las distintas disciplinas, siendo éste uno de los conceptos
importantes de la interdisciplinariedad (Monserrat, 1984). Esto puede resultar un
tanto paradójico, puesto que cada vez se tiende a una mayor especialización dado el
crecimiento de conocimientos en cada disciplina. Sin embargo, no existe tal contra-
dicción, pues interdisciplinariedad implica especialización y colaboración; es decir,
la investigación interdisciplinar es la que se encarga de la relación entre dos o más
disciplinas, posibilitando un canal de comunicación que permita poner en relación
los distintos conocimientos.
Toda disciplina científica utiliza un conjunto típico y restringido de hipótesis,
empleando unos determinados métodos y procedimientos para analizar los fenóme-
nos objeto de estudio. Al realizar investigación interdisciplinar se puede derivar en
nuevos interrogantes. De hecho, a menudo lo que se obtiene no es una respuesta a la
pregunta original, sino un cambio en la formulación de la pregunta inicial (Gyarma-
ti, 1990). Así, algunos aspectos que previamente parecían irrelevantes o ni siquiera se
cuestionaban, pueden pasar a ser relevantes o incluso el foco central de la investiga-
ción. Un buen ejemplo de investigación interdisciplinar lo constituye la psiconeu-
roinmunología, donde algunas teorías psicológicas están contribuyendo en gran me-
dida a explicar determinados aspectos del funcionamiento del sistema inmunitario.
Actualmente la necesidad de investigación interdisciplinar es tan creciente que ha
llevado a algunas universidades extranjeras a crear centros de investigación interdis-
ciplinar. Estos centros están pensados para que científicos de diversas disciplinas
aprendan a pensar de forma interdisciplinar y se relacionen con otros, analizando
cómo otras disciplinas podrían contribuir a la propia y viceversa. De hecho, en la
mayoría de las universidades, en las que de momento no existen estos centros, se está
realizando ya investigación interdisciplinar, pero de una forma improvisada.
Según Gyarmat (1990), el procedimiento más adecuado para desarrollar investi-
gaciones interdisciplinarias es seguir el método de “análisis secuencial”. Éste consis-
te en encargar el estudio de un problema determinado a un representante de una dis-
ciplina específica, quien emite un informe sobre el tema. Dicho informe es analizado
según las teorías y métodos de otra disciplina, y como resultado se redacta un segun-
do informe en el que se sintetizan los dos análisis. Posteriormente, este último infor-
me se somete a un especialista de una tercera disciplina, y así se continúa hasta que se
cubren todas las disciplinas pertinentes al caso. De este modo se van detectando la-
gunas en la forma de abordar el problema, lagunas debidas a las limitaciones concep-
tuales de cada disciplina, dando como resultado una visión interdisciplinaria. El pre-
supuesto básico para poder realizar investigación interdisciplinaria es la aceptación
de un planteamiento de base común, que sea compartido por todos los miembros
del grupo de trabajo, pues de lo contrario sería un conjunto de estudios en paralelo y
sin conexión. Por último, es necesario establecer un lenguaje común que permita
una fluida comunicación entre los distintos especialistas.
La investigación interdisciplinar podría resultar de gran utilidad en la evaluación
psicológica, dado el crecimiento y especialización que se ha alcanzado. Como puede
verse en el estudio de Carbonell y cols. (1988) sobre la situación actual de la evalua-
ción psicológica, diversos autores, consultados por ser considerados especialistas en
esta área, respondieron manifestando su incapacidad de aportar una visión global
sobre la evaluación psicológica en general, puesto que habían centrado su trabajo en

alguna subdisciplina en concreto. Ante esto, Carbonell y cols. (1988, p. 266) llegan a
concluir que
la evaluación psicológica aparece como un campo donde los autores se centran en parcelas es-
pecíficas, biendeaplicación (clínica, educativa, organizacional, neuropsicológica, suicidio...),
bien de conocimiento (técnicas concretas, psicopatología, personalidad, inteligencia...). Esto
aún resulta más claro si observamos que la mayor parte de las restantes contestaciones se ubi-
can en un ámbito específico para generalizar después, en su caso, al conjunto de la evaluación
psicológica.
Ello pone de manifiesto la necesidad de la interdisciplinariedad para poder rela-

cionar, de forma coherente y organizada, los distintos tipos y áreas de la evaluación
psicológica. Pues, como manifestaba McReynols (1990), en la actualidad resulta
muy difícil, sino imposible, que un psicólogo pueda estar informado sobre todas las
áreas de la evaluación psicológica.
Álvarez-Castro, S., Buela-Casal, G. y Sierra, J. C. (1994). Situación actual del modelo con-
ductual en España. Psicología Contemporánea, 1, 80-91.
Anastasi, A. (1985). Mental measurement: Some emerging trends. En J. Mitchell (dir.), The
ninth mental measurements yearbook (vol. 1). Nebraska. The University of Nebraska
Press.
Andrés, V. y Ferrezuelo, P. (1984). Los centros madrileños de psicología clínica. Papeles del
Colegio. Psicólogos, 13, 3-26.
Ardila, R. (1988). Síntesis experimental del comportamiento. Madrid. Alhambra.
Ardila, R. (1990). ¿Qué es la síntesis experimental del comportamiento? Anuario de Psicolo-
gía, 4, 101-107.
Aronow, E., Reznikoff, M. y Moreland, K. L. (1995). The Rorschach: Projective technique
or psychometric test? Journal of Personality Assessment, 64, 213-228.
Ávila, A. (1989). La psicología clínica en España: perspectiva de una década. Papeles del Psi-
_ cólogo, 36/37, 84-89.
Ávila, A. (19924). Aproximación a perspectivas y modelos de la evaluación psicológica en la
clínica contemporánea. En A. Ávila y C. Rodríguez (dirs.), Psicodiagnóstico clínico. Ma-
drid. Eudema.
Ávila, A. (1992b). La psicología clínica: aproximación histórica y principales cuestiones teó-
rico-conceptuales. En A. Ávila (dir.), Evaluación en psicología clínica I: proceso, método y
Ávila, A., Blanco, A., Calonge, 1., Forns, M., Oliva, M., Martorell, M. C., Rodríguez, C., Sil-
ya, F. y Torres, M. (1994). El diagnóstico y la evaluación psicológica en España: revisión y
perspectivas. Clínica y Salud, 5, 83-120.
Badiou, A. (1972). El concepto de modelo. Buenos Aires. Siglo XXI.
Bandura, A. (1978). The self-system in reciprocal determinism. American Psychologtst, 33,
344-358.
Barrios, B. A. (1988). On the changing nature of behavioral assessment. En A, S. Bellack y

M. Hersen (dirs.), Behavioral assessment: A practical handbook (3.* ed.). Nueva York.
Pergamon Press. Y
Bernad, J. A. (1994). El constructivismo en la LOGSE: condiciones e instrumentos para su
aplicación en las aulas. Revista de Psicología General y Aplicada, 47, 79-87.
Bohnm, E. (1972). Vademécum del test de Rorschach. Madrid. Morata. an
Botella, C. (1991). Terapia cognitivo-estructural: el modelo de Guidano y Liotti. En V. E. Ca-
ballo (dir.), Manual de técnicas de terapia y modificación de conducta. Madrid. Siglo XXI.
Bragado, C. (1986). La teoría psicoanalítica de la personalidad. En J. Bermúdez (dir.), Psicolo-
gía de la personalidad. Madrid. UNED.
Buela-Casal, G., Álvarez-Castro, S. y Sierra, J. C. (1993). Perfil de los psicólogos de la última
promoción de las universidades españolas. Psicología Conductual, 1, 181-206.
Buela-Casal, G. y Navarro, J. F. (1989). El estudio de la inteligencia mediante técnicas psico-
fisiológicas. Én H. Marrero, G. Buela-Casal, J. Navarro y L. Fernández (dirs.), La inteli-
gencia humana: más allá de lo que miden los tests. Barcelona. Labor.
Buela-Casal, G., Sierra, J. C. y Carrobles, J. A. (1995). Psicología clínica y de la salud en Espa-
ña: su estado actual. Revista Latinoamericana de Psicología, 27, 25-40.
Calero, M. D. (1995). La evaluación del potencial del aprendizaje. En M. D. Calero (dir.),
Modificación de la inteligencia. Sistemas de evaluación e intervención. Madrid. Pirámide.
Camarero, C. y Ferrezuelo, P. (1988). El rol del psicólogo de la salud (estudio de los datos de
una encuesta). Papeles del Psicólogo, 33/34, 19-34.
Carbonell, E. J., Carpintero, H. y Silva, F. (1988). La evaluación psicológica vista por los eva-
Carmin, C. C. y Dowd, E. T. (1988). Paradigms in cognitive psychotherapy. En W. Dryden
y P. Trower (dirs.), Developments in cognitive psychotherapy. Newbury Park. Sage.
Caro, L (1995). Pasado, presente y futuro de las terapias cognitivas. Boletín de Psicología, 46,
115-160.
Carrobles, J. A. (1985). El modelo conductual o del aprendizaje social: enfoques y aplicacio-
nes. En J. A. Carrobles (dir.), Análisis y modificación de conducta 11. Madrid. UNED.
Carrobles,J.A. (1989). Paradigmas o modelos sobre las anormalidades psicológicas: el mode-
lo médico o fisiológico, el modelo psicodinámico, el modelo fenomenológico o humanis-
ta y el modelo estadístico. En J. A. Carrobles (dir.), Análisis yModificación de la Conduc-
ta II. Madrid. UNED.
Cervantes, E., Martín, J., Prieto, V. y Zazo, M. (1991). Programa de intervención desde la psi-
cología interconductual en pacientes psiquiatrizados. En G. Buela-Casal y V. E. Caballo
(dirs.), Manual de psicología clínica aplicada. Madrid. Siglo XXI.
Ciminero, A. R. (1986). Behavioral assessment: An overview. En A. R. Ciminero, K. S, Cal-
cd y H. E. Adams (dirs.), Handbook of behavioral assessment (2.2 ed.). Nueva York.
ley.
Cone, J. D. (1986). Idiographic, nomothetic, and related perspectives in behavioral assess-
sessment. En A. S. Bellack y M. Hersen (dirs.), Behavioral assessment. A practical hand-
book (3.* ed.). Nueva York. Pergamon Press.
Cone, J. D. (1989). Consideraciones “psicométricas” en la evaluación conductual. En R. Fernán-
dez-Ballesteros y J. A. Carrobles (dirs.), Evaluación conductual (5.2 ed.). Madrid. Pirámide.
Cone, J. D. (1996). Psychometric considerations: Concepts, contents, and methods. En
M. Hersen y A. S. Bellack (dirs.), Behavioral assessment. A practical handbook (42 ed.).
Boston. Allyn and Bacon.
Cruzado, J. A., Labrador, F. J. yMuñoz, M. (1993). Introducción a la modificación y terapia

de conducta. En F. J. Labrador, J. A. Cruzado y M. Muñoz (dirs.), Manual de técnicas de
modificación y terapia de conducta. Madrid. Pirámide.
Dobson, K. S. (1988). The present and future of the cognitive-behavioral therapies. En
E S. Dobson (dir.), Handbook of cognitive-behavioral therapies. Nueva York. Guilford
ress.
Dobson, K. S. y Franche, R. (1991). La práctica de la terapia cognitiva. En V. E. Caballo (dir.),
Manual de técnicas de terapia y modificación de conducta. Madrid. Siglo XXI.
Evans, L M. (1986). Response structure and the triple-response-mode. En R. O. Nelson y
S. C. Hayes (dirs.), Conceptual foundations of behavioral assessment. Nueva York. Guil-
ford Press.
Exner, J. E. (1980). But it's only an inkblot. Journal of Personality Assessment, 44, 563-577.
Exner, J. E. (1993). The Rorschach: A comprehensive system (3.* ed.). Nueva York. Wiley.
Exner, J. E., Thomas, E. A. y Masson, B. (1985). Children's Rorschachs: Description and
prediction. Journal of Personality Assessment, 49, 13-20.
Eysenck, H. (1988). Decadencia y caída del imperio freudiano. Barcelona. Ediciones de Nue-
vo Arte Thor.
Eysenck, H. J. (1991). Three view of intelligence. Personality and Individual Differences, 12,
971-973.
Feixas, G. (1990). Personal construct theory and the sistemic therapies: Parallel or convergent
trends? Journal of Marital and Family Therapy, 16, 1-20.
Feixas, G. (1994). Aportaciones constructivistas a los eclecticismos y la integración en psico-
terapia. Revista Argentina de Clínica Psicológica, 3, 147-164.
Fernández-Ballesteros, R. (19924). Conceptos y modelos básicos. En R. Fernández-Balleste-
ros (dir.), Introducción a la evaluación psicológica. Madrid. Pirámide.
Fernández-Ballesteros, R. (1992b). Técnicas de evaluación ambiental. En R. Fernández-
Ballesteros (dir.), Introducción a la evaluación psicológica. Madrid. Pirámide.
Fernández-Ballesteros, R. (19944). Modelos en evaluación conductual. En R. Fernández-
Ballesteros (dir.), Evaluación conductual hoy. Un enfoque para el cambio en psicología clí-
nica y de la salud. Madrid. Pirámide.
Fernández-Ballesteros, R. (1994b). Características básicas de la evaluación conductual. En
Fernández-Ballesteros, R. (1994c). Evolución histórica de la evaluación conductual. En
Fernández-Ballesteros, R. y Silva, F. (1989). Evaluación psicológica: aportaciones para una
crisis. Evaluación Psicológica/Psychological Assessment, 5, 119-125.
Fernández-Ballesteros, R. y Staats, A. W. (1992). Paradigmatic behavioral assessment, treat-
ment and evaluation: Answering the crisis in behavioral assessment. Advances in Beha-
viour Research and Therapy, 14, 1-28.
Fernández Buey, F. (1991). La ilusión del método (ideas para un racionalismo bien tempera-
do). Barcelona. Crítica.
Fernández del Valle, J. (1996). Evaluación ecopsicológica de los estilos de vida. En G. Buela-
Casal, V. E. Caballo y J. C. Sierra (dirs.), Manual de evaluación en psicología clínica y de la
salud. Madrid. Siglo XXI.
Ferrezuelo, P. (1985). Definición del psicólogo clínico y funciones que desempeña. Papeles
del Colegio de Psicólogos, 20, 3-6.
First, M. B., Frances, A., Widiger, T. A., Pincus, H. A. y Davis, W. W. (1992). DSM-IV and be-
havioral assessment. Behavioral Assessment, 14, 297-306.
Fishman, D. B. y Franks, C. M. (1992). Evolution and diferentiation within behavior the-
rapy: A theoretical and epistemological review. En D. K. Freedheim (dir.), History ofpsy-

chotherapy. A century cEhaiga Washington. APA. UBIO) $8.
Forns, M., Kirchner, T. y Torres, M. (1991). Principales modelos en evaluación psicológica.
Barcelona. L'Estudi d'en Llop.
Franks, C. M. (1991). Orígenes, historia reciente, cuestiones actuales y estatus futuro de la te-
terapia y modificación de conducta. Madrid. Siglo XXI. A
Gatewood, R. y Perloff, R. (1990). Testing and industrial application. En G. Goldstein y
M. Hersen (dirs.), Handbook ofpsychological assessment (2.* ed.). Nueva York. Pergamon
Press.
Goldfried, M. R. y Sprafkin, J. N. (1974). Behavioral personality assessment. Nueva Jersey.
General Learning Press. e
Gómez-Granell, C. y Coll, S. (1994). De qué hablamos cuando hablamos de constructivis-
mo. Cuadernos de Pedagogía, 221, 8-10.
Gongalves, O. F. (1994). Cognitive narrative psychotherapy: The hermeneutic construction
of alternative meanings. Journal of Cognitive Psychotherapy, 8, 105-126.
Guba, E. G. y Lincoln, L. S. (1989). Fourth generation evaluation. Newbury Park. Sage.
Gyarmati, G. (1990). La psicología en una perspectiva interdisciplinaria. Revista Interameri-
cana de Psicología, 24, 83-98.
(dirs.), The clinical psychology handbook (2.2 ed.). Nueva York. Pergamon Press.
Psychology Reviezo, 10, 649-668.
Haynes, S. N. y Wai'Alae, K. (1994). Fundamentos psicométricos de la evaluación conduc-
tual. En R. Fernández-Ballesteros (comp.), Evaluación conductual hoy. Un enfoque para
el cambio en psicología clínica y de la salud. Madrid. Pirámide.
Hernández. J. M. (1996). Evaluación de programas de salud. En G. Buela-Casal, V. E. Caba-
Siglo XXI.
Hersen, M. (1988). Behavioral assessment and psychiatric diagnosis. Behavioral Assessment,
10, 107-121.
Hoshmand, L. T. (1993). The personal narrative in the communal construction of self and life
issues. En G. J. Neimeyer (dir.), Constructivist assessment. A casebook. Londres. Sage.
Ibáñez, E. (1980). Conducta anormal y estructuras patológicas. Análisis y Modificación de
Conducta, 6, 127-137.
Joyce-Moniz, L. (1985). Epistemological therapy and constructivism. En M. J. Mahoney y
A. Freeman (dirs.), Cognition and psychotherapy. Nueva York. Plenum Press.
Kanfer, F. y Phillips, J. (1970). Learning foundations of behavioral therapy. Nueva York. Wiley.
538.
Kantor, J. (1959). Interbehavioral psychology. Ohio. Principia Press.
eO (dir.), Manual de técnicas de terapia y modificación de conducta. Madrid. Si-
glo :
Kuhn, T. (1962). The structure of scientific revolutions. Chicago. University of Chicago Press.
Kuhn, T. (1978). Segundos pensamientos sobre paradigmas. Madrid. Tecnos.
J. Shilen (dir.), Research in psychotherapy (vol. 3). Washington. American Psychology
Association.
Lazarus, A. A. (1967). In support of technical eclecticism. Psychological Reports, 21, 415-416.
Lindsley, O. R. (1964). Direct measurement and prothesis of retarded behavior. Journal of
Education, 147, 62-81.
Mahoney, M. J. (1980). Psychotherapy and the structure of personal revolutions. En

M. J. Mahoney (dir.), Psychotherapy process. Current issues and future directions. Nueva
York. Plenum Press.
Mahoney, M. J. (1991). Human change processes. Nueva York. Basic Books.
Manicas, P. y Secord, P. (1983). Implications for psychology of the new philosophy of scien-
ce. American Psychologist, 4, 399-413.
Mash, E. J. y Terdal, L. G. (1988). Behavioral asessment of child and family disturbance. En
E. J. Mash y L. G. Terdal (dirs.), Behavioral assessment of childhood disorders (2.2 ed.).
Masterman, M. (1975). La naturaleza del paradigma. En IL. Lakatos y A. Musgrave (dirs.), La
crítica y el desarrollo del conocimiento. Barcelona. Grijalbo.
McReynolds, P. (1990). Introduction. En P. McReynolds, J. Rosen y G. Chelune (dirs.), Ad-
vances in psychological assessment (vol. 7). Nueva York. Plenum Press.
Meichenbaum, D. y Fong, G. T. (1993). How individuals control their own minds: A cons-
tructive narrative perspective. En D. M. Wegner y J. W. Pennebaker (dirs.), Handbook of
mental control. Englewood Cliffs. Prentice-Hall.
Monserrat, ]. (1984). Epistemología evolutiva y teoría de la ciencia. Madrid. UPC.
Morey, L., Skinner, H. y Blashfield, R. (1986). Trends in the classification on abnormal beha-
vior. En A. Ciminero, K. Calhoun y H. Adams (dirs.), Handbook of behavioral assess-
ment. Nueva York. Wiley.
Nagel, E. (1961). The structure of science. Nueva York. Harcourt, Brace and Ward.
Neimeyer, R. A. (19934). An appraisal of constructivist psychotherapies. Journal of Consul-
ting and Clinical Psychology, 61, 221-234.
Neimeyer, R. A. (19935). Constructivist approaches to the measurement of meaning. En
G. J. Neimeyer (dir.), Constructivist assessment. A casebook. Londres. Sage.
Neimeyer, R. A. (1994). Problemas y posibilidades de la psicoterapia constructivista. Revista
Argentina de Clínica Psicológica, 3, 125-145.
Neimeyer, G. J. y Neimeyer, R. A. (1993). Defining the boundaries of constructivist assess-
ment. En G. J. Neimeyer (dir.), Constructivist assessment. A casebook. Londres. Sage.
Nelson, R. O. (1987). DSM-117 and behavioral assessment. En C. G. Last y M. Hersen (dirs.),
Issues in diagnostic research. Nueva York. Plenum Press.
Norcross, J. C., Prochaska, J. O. y Gallagher, K. M. (1989). Clinical psychologists in the
1980s: II. Theory, research, and practice. The Clinical Psychologist, 42, 45-53.
Ollendick, T. H. y Greene, R. (1990). Behavioral assessment in children. En G. Goldstein y
M. Hersen (dirs.), Handbook ofpsychological assessment (2.* ed.). Nueva York. Pergamon
Press.
Pérez-Álvarez, M. (1985). Moda, mito e ideología de la psicología cognitiva. Papeles del Co-
legío. Psicólogos, 20, 45-52.
Pérez-Álvarez, M. (1995). Pasado, presente y futuro de la terapia de conducta. Boletín de Psi-
cología, 46, 37-94. us :
Pervin, L. A. (1979). Personalidad. Teoría, diagnóstico e investigación. Bilbao. Desclée de
Brouwer. Ñ
Piotrowski, C. y Keller, J. (1984). Attitudes toward clinical assessment by members of AABT.
Psychological Reports, 55, 831-838. ENT y JUDA
Piotrowski, C. y Zalewski, C. (1993). Training in psychodiagnostuc testing in APA-aproved
PsyD and PhD clinical psychology programs. Journal of Personality Assessment, 61, 394-
405.
Popper, K. (1962). La lógica de la investigación científica. Madrid. Tecnos.
Robins, L. N., Helzer,J.E., Croughan,J.y Ratclift, K. S. (1981). National Institute of Mental
of General Psychiatry, 10, 41-46.
Rodríguez, C. (1990). Situación actual del test del Rorschach. Anuario de Psicología, 45, 88-
5)9
Salmerón, A. (1985). ¿Qué es y para qué sirve la epistemología? En M. Bunge (dir.), Episte-
mología. Barcelona. Ariel.
Schorr, A. (1993). Projective testing in behavior therapy. Exropean Journal of Psychological
Segal, Z. W. y Shaw, B. F. (1988). Cognitive assessment: Issues and methods. En K. S. Dob-
son (dir.), Handbook of cognitive-behavioral therapies. Nueva York. Guilford Press.
Sierra, J. C., Álvarez-Castro, S. y Buela-Casal, G. (1994). Situación actual del psicoanálisis en
España. Revista Latinoamericana de Psicología, 26, 189-203. A
Sierra, J. C., Fernández-Guardiola, A., Luna-Villegas, G. y Buela-Casal, G. (1993). Relación
entre diversos indicadores de activación (tiempo de reacción, estimación del tiempo, tasa
cardíaca y activación autoinformada) en una situación control y bajo los efectos del diace-
pam. Vigilia-Sueño, 4, 15-21.
Sierra, J. C. y Freixa i Baqué, E. (1993). Estudio preliminar de la evolución de la imagen de la
psicología en estudiantes españoles de esta carrera. Psicothema, 5, 67-82.
Sierra, J. C., Pál-Hegediis, C., Álvarez-Castro, S. y Freixa i Baqué, E. (1995). Imagen de la
psicología en estudiantes universitarios de España y Costa Rica. Psicología Contemporá-
nea, 2,60-69.
Spitzer, R. L. y Williams, J. B. (1987). Structured Clinical Interview for DSM-111-R-Outpa-
tient version (SCID-OP, 1/4/87). Nueva York. New York Psychiatric Institut.
Staats, A. W. (1963). Complex human behavior. Nueva York. Wiley.
Staats, A. W. (1975). Social behaviorism. Nueva York. Wiley.
Taylor, H. G. (1988). Learning disabilities. En E. J. Mash y L. G. Terdal (dirs.), Behavioral
assessment of childhood disorders (2.2 ed.). Nueva York. Guilford Press.
Tryon, W. W. (1990). Why paradigmatic behaviorism should be entitled psychological beha-
viorism? The Behavior Therapist, 13, 127-128.
Viney, L. L. (1993). Listening to what my clients and 1 say: Content analysis categories and
scales. En G. J. Neimeyer (dir.), Constructivist assessment. A casebook. Londres. Sage.
Weiner, I. B. (1972). Does psychodiagnosis have a future. Journal of Personality Assessment,
36, 534-546.
Wolpe, J. (1989). The derailment of behavior theraphy: A tale of conceptual misdirection.
Journal of Behavior Therapy and Experimental Psychiatry, 20, 3-15.
Yela, so (1990). Evaluar qué y para qué. El problema del criterio. Papeles del Psicólogo,
46/47, 50-54.
Avila, A. (1992a). Aproximación a perspectivas y modelos de la evaluación psicológica en la

clínica contemporánea. En A. Ávila y C. Rodríguez (dirs.), Psicodiagnóstico clínico. Ma-
drid. Eudema.
Avila, A. (1992b). La psicología clínica: aproximación histórica y principales cuestiones teó-
rico-conceptuales. En A. Ávila (dir.), Evaluación en psicología clínica 1: proceso, método y
estrategras psicométricas. Salamanca. Amarú.
Carrobles, J. A. (1989). Paradigmas o modelos sobre las anormalidades psicológicas: el mode-

lo médico o fisiológico, el modelo psicodinámico, el modelo fenomenológico o humanis-
ta y el modelo estadístico. En J. A. Carrobles (dir.), Análisis yModificación de la Conduc-
ta 11. Madrid. UNED.
Fernández-Ballesteros, R. (19944). Modelos en evaluación conductual. En R. Fernández-
Pérez-Álvarez, M. (1995). Pasado, presente y futuro de la terapia de conducta. Boletín de Psi-
cología, 46, 37-94.
logía en eta ¡ .S
SUIa
: Ed
ea
E
2404
PÚ Di dis
_..
Silva,E- TP La ió hp co A
brersrenas, €, 1130
PE ut " TMIánci POT
' : . APORTA, Es alerian coneiurt alió
k Hatloíde.: Maita idetdt le ed
1
ás ci Ed d o
cal Insecta for Par da -R-Oiipa
= Paytú ar lost
Y PE e , ley ' i
wr : a Fa
7 | CJ % ; Le erdal (dira y Bebav
: TA ao ross, sz
r
ud) be envitdesl psrclutogicalbeha
IX
bn ¿EL rre sd
e 2
' cOn.
á
, 5
f nm
+
: |
5d
d A
'
5. MÉTODO CIENTÍFICO Y EVALUACIÓN PSICOLÓGICA
Il. INTRODUCCIÓN
La diferenciación entre tipos de conocimiento se remonta a los tiempos de Platón,

quien distinguía entre la opinión vulgar (doxa) y la ciencia (episteme). En la actuali-
dad, el término ciencia se refiere a la expresión ordenada y sistemática del conoci-
miento crítico racional según las exigencias metodológicas que le son propias; orde-
nada, porque los conocimientos se presentan en un orden que se puede establecer
según diversos criterios; sistemática, porque los conocimientos ordenados se rela-
cionan entre sí adquiriendo la forma de sistema.
El conocimiento ordinario es el que se alcanza por uno mismo; es intuitivo ya
que se construye por la visión inmediata y directa de las cosas; es vivencial, puesto
que se basa en la propia experiencia. Sin embargo, aunque sea de forma incipiente,
se analizan y sintetizan racionalmente las cosas. La vida de un hombre normal se
rige por este tipo de conocimiento. El conocimiento crítico racional, también de-
nominado conocimiento científico, se alcanza por discernimiento analítico de la
experiencia y la consiguiente síntesis relacional. Por tanto, este tipo de conocimien-
to implica:
a. Unanálisis minucioso de los datos de la experiencia hasta donde sea posible,

precisando con toda exactitud sus contenidos.
b. Relacionar dichos contenidos entre sí, ordenándolos y sistematizándolos
para entender analíticamente su coherencia unitaria.
c. Formular una idea de la realidad estructuralmente consistente que se mani-
fiesta en los contenidos de la experiencia.
IL. OBJETIVIDAD CIENTÍFICA Y CONVICCIÓN SUBJETIVA
El término objetividad (de los enunciados científicos) hace alusión a que el conoci-
miento científico ha de ser susceptible de contrastarse de forma intersubjetiva. La
objetividad se encuentra en relación con la construcción de las teorías, puesto que
sólo cuando se produce la recurrencia de ciertos acontecimientos de acuerdo con
unas reglas, tal como ocurre en los experimentos repetibles, pueden ser contrasta-
das las observaciones. Éstas no deben ser aceptadas como científicas hasta que se
han repetido y contrastado. Sólo así podemos llegar al convencimiento de que no
148 Gualberto Buela-Casal
nos encontramos con un efecto aparente, sino que se trata de un fenómeno que de-
bido a su regularidad y repetitividad, es en principio contrastable. Si un fenómeno
es irrepetible y único, no puede considerarse objeto de la ciencia.
Una experiencia subjetiva o un sentimiento de convicción nunca pueden consi-
derarse enunciados científicos, aunque sí pueden ser objeto de indagación empíri-
ca. Por tanto, podemos estar absolutamente convencidos de la verdad de un enun-
ciado, seguros de la evidencia de nuestra percepción, incluso puede parecer absurda
cualquier duda. Sin embargo, todo ello no es suficiente para que pueda ser un
enunciado científico, puesto que no aporta ninguna razón a la ciencia. Ahora bien,
la experiencia subjetiva puede constituir una hipótesis a contrastar de forma expe-
rimental. Por tanto, desde una perspectiva científica tendría la misma considera-
ción una simple sospecha que una convicción de certeza indudable, es decir, el gra-
do de convicción subjetiva es irrelevante para la justificación de un enunciado
científico.
La exigencia de objetividad de los enunciados científicos es de suma importancia
puesto que soluciona el problema de la base empírica. Las experiencias que descri-
ben nuestras percepciones sólo pueden incluirse en la ciencia como hipótesis. Los
enunciados que pertenecen a la base empírica tienen que ser también objetivos, o
sea, contrastables de forma intersubjetiva. Por tanto, si todos los enunciados han
de ser contrastados, no puede existir en la ciencia ninguno que no sea contrastable, y
en consecuencia, que no pueda ser refutado al falsar alguna de las conclusiones que
de él se puedan deducir. Los sistemas teóricos se contrastan deduciendo de ellos
enunciados con un nivel de universalidad más bajo, los cuales también deben ser
contrastados. Esto, aparentemente, nos lleva a una continua contrastación en la que
nunca se llega a aceptar un enunciado. Sin embargo, no es así, puesto que no es nece-
sario haber contrastado todo enunciado científico antes de aceptarlo; sólo se exige
que sean susceptibles de contrastación. Popper se niega a admitir que en la ciencia
existan enunciados cuya verdad se acepte de forma resignada, por la única razón de
no poder someterse a contraste por razones lógicas.
La base empírica de la ciencia objetiva, pues, no tiene nada de absoluta; la ciencia no está ci-
mentada sobre roca; por el contrario, podríamos decir que la atrevida estructura de sus teo-
rías se eleva sobre un terreno pantanoso, es como un edificio levantado sobre pilotes. Éstos se
introducen desde arriba en la ciénaga, pero en modo alguno hasta alcanzar algún basamento
natural o “dado”; cuando interrumpimos nuestros intentos de introducirlos hasta un estrato
más profundo, ello no se debe a que hayamos topado con terreno firme: paramos simplemen-
te porque nos basta que tenga firmeza suficiente para soportar la estructura, al menos por el
momento [Popper, 1962, p.106].
II. CARACTERÍSTICAS DEL MÉTODO CIENTÍFICO
Método es una regla, o conjunto de reglas, para actuar según un determinado orden
con el fin de alcanzar una meta. Por tanto, un método puede ser formalizado como
una concatenación de varias pautas, cada una de las cuales describe un paso del pro-
cedimiento a seguir. Así, por ejemplo, la introspección no puede ser considerada
Método científico y evaluación psicológica
149
como un método, puesto que no está dirigida por reglas (Bunge y Ardila, 1988). Una
técnica es un método para realizar algo especial. Para que una técnica sea científica
debe ser compatible con el cuerpo de conocimiento científico, es decir, una técnica
será científica si:
a. Se orienta a una meta alcanzable.

b, Es razonablemente eficaz (si permite alcanzar la meta en un porcentaje ele-
vado de casos).
Es intersubjetiva (aporta los mismos resultados para todos los usuarios).
a” Puede ser controlada o comprobada por métodos alternativos.
e. Existe una teoría que explique cómo y por qué es operativa.
Un método que cumpla únicamente las tres primeras condiciones se cataloga
como semicientífico, mientras que si no satisface ninguna de ellas se considera no
científico. Por tanto, el método científico puede considerarse como un conjunto de
reglas que se utiliza para resolver un determinado problema. Así, se dice que una in-
vestigación se realiza según el método científico si cumple, o al menos pretende
cumplir, las siguientes etapas (Bunge y Ardila, 1988):
a. Descubrimiento del problema o laguna en un conjunto de conocimientos. Si

el problema no está enunciado con claridad, se pasa a la siguiente etapa; si lo está, en-
tonces se pasa a la c.
b. Planteamiento del problema en términos operativos. También puede tratar-
se de un replanteamiento de un viejo problema en el contexto de nuevos conoci-
mientos (empíricos, teóricos o metodológicos).
c. Búsqueda de conocimientos o instrumentos relevantes al problema (por
ejemplo, datos empíricos, teorías, instrumentos de medición...); es decir, hacer una
inspección de lo conocido hasta el momento, para ver si se puede resolver el pro-
blema.
d. Tentativa de solución del problema con ayuda de los métodos identificados.
Si este intento falla, se pasa a la etapa siguiente, si no a la f.
e. Propuesta de nuevas ideas (hipótesis, constructos, teorías o técnicas) o pro-
ducción de nuevos datos empíricos que prometan resolver el problema.
Obtención de una solución del problema con ayuda del material conceptual
o empírico disponible.
Análisis de las consecuencias de la solución obtenida. Si se trata de una teo-
ría, deben establecerse las predicciones que puedan hacerse con su ayuda. Si se trata
de nuevos datos, se examinan las consecuencias que puedan tener para las teorías re-
levantes.
h. Contrastación de la solución. Se trata de confrontarla con la totalidad de la
teoría y con la información empírica pertinente. Si el resultado es satisfactorio, se da
por finalizada la investigación; si no lo es, entonces se pasa al siguiente punto.
¡Corrección de las hipótesis, teorías, procedimientos o datos empleados en la
investigación. Por tanto, este punto daría paso a un nuevo ciclo de la investigación.
¡.. Examinar el impacto de los resultados sobre el acervo de conocimientos del
marco de referencia y, en función de ello, formular nuevos problemas.
IV. VERIFICACIÓN CIENTÍFICA
La teoría de la ciencia no solamente nos indica cómo construir una teoría de forma
adecuada, sino que además nos facilita los criterios y métodos que debemos utilizar
para confrontarla con la experiencia. Verificación científica podría definirse como la
comprobación de la verdad de un conocimiento determinado (teorías, leyes, hipóte-
sis, hechos...). El concepto de verdad se refiere a la adecuación entre la representa-
ción de la realidad y la misma realidad. El conocimiento implica interpretación; por
tanto, la comprobación es siempre provisoria (Monserrat, 1984). La verificación
científica puede analizarse según tres aspectos:
a. Análisis de cómo surge la verificación en el conocimiento.

b. Análisis de los procedimientos utilizados en la constatación de los datos que
permitan justificar definiciones de hechos, sistemas deductivos, hipótesis,
leyes, teorías, etc.; aquí se incluyen la observación metódica, la experimenta-
ción y la correlación.
c. Análisis de la distintas concepciones epistemológicas del proceso de verifi-
cación.
Iv.1. La verificación en el proceso de conocimiento

El conocimiento científico debe construirse de forma que su contenido aparezca
ordenado y sistematizado para que pueda ser verificado ante la experiencia real. La
labor del científico consiste en definir hechos, deducir de ello inferencias, plantear
hipótesis explicativas, formular leyes sobre las regularidades observadas, interrela-
cionar todo ello mediante la construcción de teorías. En cada una de estas fases es
necesario verificar si hay un ajuste correcto con la realidad. Como señala Popper
(1962, p. 52), «el juego de la ciencia, en principio, no se acaba nunca. Cualquiera
que decide un día que los enunciados científicos no requieren ninguna contrasta-
ción ulterior y que pueden considerarse definitivamente verificados, se retira del
juego». Aunque en la actualidad no existe un acuerdo unánime acerca de cuál debe
ser el criterio de demarcación científica, ello no significa que la verificación no sea
necesaria en el proceso del conocimiento científico. La falta de criterios inequívo-
cos de demarcación no debe llevarnos a pensar que todo vale por igual (Fernández
Buey, 1991).
1V2. Procedimientos de verificación

1V2.1. Observación metódica
La observación es el procedimiento más antiguo de recolección de datos, y sigue

siendo de uso frecuente en la actualidad. Su consolidación como metodología obser-
vacional se ha producido durante los últimos quince años. Así, ha pasado de ser una
Método científico y evaluación psicológica 151
simple técnica de recogida de información a un método de investigación, adaptándo-

se alos cánones del método científico, constituyéndose en una herramienta útil para
elestudio de la conducta (Anguera, 1991). La observación puede ser casual o metó-
dica. Esta última puede ser científica o no científica. Así, se dice que una observación
es científica cuando se realiza con el propósito de resolver un determinado proble-
ma, con la ayuda de hipótesis y técnicas científicas (Bunge y Ardila, 1988). Por tanto,
la observación es una técnica fundamental en la investigación científica. Por medio
de ésta, el científico describe de forma Operativa cómo suceden los fenómenos, de
modo que puedan ser contrastados. En el método observacional se pueden distin-
guir tres fases: en la primera (la fase exploratoria), se observa la conducta objeto de
estudio y se establecen las categorías correspondientes; en la segunda, se caracteriza
dicha conducta, es decir, se evalúa utilizando el sistema de categorías desarrollado en
la fase precedente; y en la tercera, se contabilizan y analizan los datos registrados
(Bakeman, 1991).
La observación puede variar en el grado de naturalidad, desde totalmente natu-
ral, hasta totalmente controlada. Evidentemente, cuanto más controlada sea la ob-
servación, mayor será la reactividad o influencia sobre el fenómeno observado y,
cuanto más natural, mayor será la dificultad de control de todas las variables que
pueden estar incidiendo sobre el fenómeno observado. La influencia del observador
es de especial relevancia en psicología ya que puede modificar la conducta objeto de
observación, por lo cual se han ideado algunas estrategias para minimizar los efectos
de la reactividad; entre éstas podemos destacar las siguientes:
Utilización de observadores participantes.

Utilización de observación encubierta.
Minimizar la relación entre observador y sujeto observado.
Minimizar la inoportunidad o molestia causada por el observador.
DENSA
Proporcionar pautas al sujeto observado para que se comporte de forma na-
tural.
£ Dejar pasar un tiempo suficiente para que el observador llegue a ser un ele-
mento natural del entorno, lo cual elimina el efecto de reactividad; utilizar
un número suficiente de observadores que permita hacer un contraste inter-
subjetivo. ,
g. Utilización del instrumental técnico adecuado (grabación, registros telemé-
tricos, etcétera).
Por otra parte, hay que tener en consideración que lareactividad no se produce
por igual en cualquier conducta o situación. Ásí por ejemplo, cuando la conducta
tenga un margen de variabilidad mínimo en su forma o en sus relaciones con el am-
biente, de forma que se manifieste con cierta independencia de la situación, el efecto
de la reactividad es menor. Lo mismo sucede cuando los sujetos observados no tie-
nen la capacidad de procesar la información sobre los cambios de una situación na-
tural a una de laboratorio, tal como ocurre en los neonatos (Riva, 1991).
1v2.2. Experimentación versus correlación
La experimentación consiste en manipular de forma planificada y sistemática un fe-

nómeno para observar los efectos producidos. Las variables que manipula el investi-
gador se denominan variables independientes y las que observa son las dependien-
tes, puesto que éstas son susceptibles de variación por efecto de las independientes.
Para realizar la manipulación de forma adecuada el científico debe controlar total-
mente la situación experimental, es decir, la situación en la que se produce la mani-
pulación y observación de las variables. Según el tipo de fenómeno que se pretende
estudiar puede ser adecuado realizar la manipulación en un ambiente natural con-
trolado o en una situación artificial (como por ejemplo, un laboratorio). El control
es una característica importante en la experimentación, puesto que es la garantía de
que los efectos observados en la variable dependiente se deben a la manipulación de
la variable independiente. Por tanto, el experimentador debe controlar la variable in-
dependiente, haciéndola variar de una forma conocida (como mínimo debe adoptar
dos valores) y las variables contaminadoras (aquellas que pueden modificar el efecto
de la variable independiente sobre la dependiente), las cuales deben eliminarse de la
situación experimental, o bien mantener su valor constante. En resumen, se podría
decir que el experimentador pretende maximizar la varianza primaria (debida a la
manipulación experimental), controlar la varianza secundaria (debida a las variables
contaminadoras) y minimizar la varianza error (debida a factores imprevistos).
El método correlacional permite estudiar fenómenos que no son susceptibles de
manipulación, bien por razones éticas o por la propia entidad del fenómeno. La co-
rrelación nos da información sobre el grado de relación que hay entre dos variables,
por tanto, la información que se obtiene debe ser entendida en términos descripti-
vos. En la actualidad se dispone de técnicas estadísticas muy sofisticadas que hacen
posible análisis precisos entre dos o más variables (Yela, 1990). La idea básica sería
poder predecir los valores de una variable (criterio) a partir de los valores de otra va-
riable (predictor). La aplicación del método correlacional resulta útil en aquellas si-
tuaciones en las que hay que predecir la conducta de un sujeto en comparación con
otros, generalmente con respecto a un grupo normativo o un criterio validado. Se-
gún el objetivo de la evaluación, el evaluador selecciona aquellas variables más ade-
cuadas; una vez evaluadas, compara los resultados con los datos normativos. Para
que las conclusiones sean válidas, es necesario que el sujeto y el grupo tengan carac-
terísticas similares y las condiciones de aplicación de las pruebas estén estandariza-
das. Por tanto, la generalización de las medidas en el método correlacional se basa en
las condiciones de semejanza entre los sujetos y en el control de las condiciones en
las que se realiza la medida.
En evaluación psicológica la oposición experimentación versus correlación ya
fue descrita por Cronbach en 1957 cuando en la reunión anual de la American Psy-
chological Association (APA) presentó una ponencia sobre «Las dos disciplinas de la
psicología científica». En este trabajo se hace un detallado análisis sobre las dos for-
mas de practicar la psicología: la experimental, que se basa en la manipulación y el
control, y la correlacional que se apoya en un enfoque multivariado sobre las varia-
bles tal como se presentan en la naturaleza. Posteriormente, en 1975, Cronbach pre-
senta otro trabajo titulado «Más allá de las dos disciplinas de la psicología científica»,
donde defiende la necesidad de una psicología aplicada integrada. Así, plantea la ne-
cesidad de encontrar para cada individuo el tratamiento que puede adaptarse más fá-
cilmente, lo cual exige la aplicación conjunta de métodos experimentales y correla-
cionales. Para apoyar este planteamiento presenta los resultados de distintos
estudios sobre la interacción de la aptitud y el tratamiento (estudios ATI), donde se
resalta la importancia de las interacciones de los fenómenos observados y las condi-
ciones de laboratorio (Silva, 1986).
1v.23. La validez de la experimentación y de la correlación

En todo experimento se intenta establecer conclusiones válidas acerca del efecto de
la manipulación efectuada sobre la variable independiente. Así, si los resultados de
un experimento pueden ser atribuidos de forma inequívoca a la variable indepen-
diente, entonces se dice que el experimento tiene validez interna. En otras palabras,
la validez interna se refiere al grado en que se pueden descartar explicaciones alterna-
tivas en los resultados. Una disminución de la validez interna indica una influencia
de variables contaminadoras y, por tanto, produce una ambigúedad interpretativa de
los resultados de la investigación (Pereda, 1987). La validez externa hace referencia a
la posibilidad de generalizar los resultados. Una investigación tiene una alta validez
externa cuando sus conclusiones pueden aplicarse en poblaciones de sujetos y en si-
tuaciones distintas a las de la investigación original. Podría decirse que el objetivo de
la validez externa es indicar en qué medida los resultados de la investigación pueden
ser aplicados en contextos más generales.
Según lo anterior, es fácil inferir que el método experimental tiene validez inter-
na, mientras que el correlacional carece casi por completo de este tipo de validez. Sin
embargo, en lo que se refiere a la validez externa la relación es más compleja, pues a
pesar de que están apoyados en la realidad y en contextos naturales, autores como
Campbell y Stanley (1966) consideran que los estudios correlacionales tienen poca
validez externa. Según estos autores, la validez interna es un requisito previo para la
validez externa, por tanto, sólo cabría hablar de la validez interna de la experimenta-
ción, ya que es más importante demostrar una relación sin ambigúedades que plan-
tear su generalización. Esta situación se agrava por el hecho de que a mayor validez
interna menor capacidad de generalización. Una solución es repetir los experimen-
tos en diferentes situaciones y con distintos sujetos, con lo cual se incrementa la vali-
dez externa de la experimentación (Alvira, Avia, Calvo y Morales, 1979).
1v3. Concepciones epistemológicas de verificación

Iv3.1. Criterio de verificación operacional de Bridgman
Los filósofos de la ciencia de finales del siglo XIX se centraban en la idea de que lo
único verdaderamente científico era la medición, pues esto era lo que permitía hacer
una ciencia exacta. Bridgman lleva el fiscalismo a sus últimas consecuencias, cons-
truyendo lo que se conoce como la concepción operacionalista de la ciencia. Según

dicha concepción, los únicos enunciados científicos que se pueden integrar en el len-
guaje objeto de la ciencia deberían incluir:
a. Lecturas de cuantificaciones de fenómenos o relaciones entre cuantificacio-

nes de grupos de fenómenos.
b. Descripción de las operaciones realizadas para obtener las lecturas de las
cuantificaciones.
Así, para el fiscalismo radical de Bridgman el conocimiento científico se reduci-

ría a la cuantificación y construcción de instrumentos de medida, es decir, la ciencia
se limitaría a obtener un conocimiento cuantitativo del mundo. Bridgman formuló
el criterio operacional de verificación, según el cual para que un enunciado sea consi-
derado como científico debe llevar implícita la posibilidad de ser cuantificado. Inclu-
so los conceptos previos a la medición, tales como la velocidad, la distancia, etc., de-
ben expresarse en términos cuantitativos para que puedan considerarse parte de la
ciencia. En la actualidad, este planteamiento se considera insostenible, pues según el
criterio operacional sólo podrían ser objeto de verificación científica aquellos fenó-
menos que se ajustan a las exigencias del operacionalismo.
1v.3.2. Criterio de verificación del Círculo de Viena
Como es bien sabido, en el Círculo de Viena se consolida el neopositivismo lógico,

representado por autores como Russell, Wittgenstein, Carnap, etc., dando lugar a la
primera gran escuela de epistemología científica durante el siglo XX. El fenomenalis-
mo que había sido la base del pensamiento positivista del siglo XIX sigue presente en
la epistemología del Círculo de Viena. El conocimiento parte de lo dado en la expe-
riencia; por ello, la función básica del científico es constatar lo que se da en la ex-
periencia inmediata del hombre. La constatación debe ser rigurosa, tal como se pre-
senta en la realidad. Conocer no es transformar, sino dejarse impresionar por los
contenidos objetivos. Aunque el conocimiento se refiera a una actividad individual,
es entendido a nivel social y, por tanto, debe expresarse con el lenguaje. Las unidades
lingúísticas más elementales para describir el conocimiento las denominan «enuncia-
dos protocolarios», puesto que son un simple protocolo de lo dado en la experien-
cia. Por tanto, el proceso de formalización del conocimiento se realiza a partir de los
enunciados protocolarios, incluyendo la relación de dichos enunciados y los enun-
ciados que pueden deducirse a partir de ellos.
El criterio de verificación científica para el positivismo lógico postula que un
enunciado puede ser considerado como científico cuando es un enunciado protoco-
lario o cuando puede ser deducido lógicamente de otros enunciados protocolarios.
Es decir, la verificación de un enunciado consiste en poder retrotraerlo de unos
enunciados inmediatamente comprobables por la experiencia. Según este plantea-
miento, las teorías son conjuntos de deducciones analíticas de enunciados.
1v.3.3. Criterio de falsabilidad de Karl R. Popper

La segunda gran escuela de epistemología científica del siglo XX se conoce como el
racionalismo crítico, cuyo fundador y máximo representante es Popper. Sus plantea-
mientos surgen como una reacción crítica ante los fundamentos de la epistemología
del neopositivismo lógico. Así, rebate las principales tesis del Círculo de Viena, ins-
taurando una nueva teoría de la ciencia, que a partir de la década de los años treinta
comienza a adquirir una gran influencia. Algunas de las críticas de Popper al neopo-
sitivismo lógico son tan contundentes que llegan a influir en la evolución de los auto-
res del Círculo de Viena. Popper está dispuesto a admitir que solamente la observa-
ción puede proporcionar un conocimiento acerca de los hechos. Sin embargo, este
conocimiento no justifica ni fundamenta la verdad de ningún enunciado. Podemos
poseer conocimientos cercanos a la verdad, pero nunca podemos estar seguros de
ellos e inmunizarlos a la crítica. Todo conocimiento que pretenda ser científico debe
ser contrastado con la experiencia.
El racionalismo crítico propone el criterio de falsación para decidir si un enun-
ciado es científico. Según este criterio, sólo pueden introducirse en el lenguaje cientí-
fico aquellos enunciados que puedan ser falsados, es decir, demostrados como falsos
en su confrontación con la experiencia. Así, se dice que una teoría está falsada cuan-
do se han aceptado enunciados básicos que la contradicen. Esta condición es necesa-
ria pero no suficiente, puesto que algunos acontecimientos aislados no reproduci-
bles carecen de significación para la ciencia y, por tanto, para rechazar una teoría. Sin
embargo, se considerará falsada si descubrimos un efecto reproducible que la refute.
Entonces, sólo se acepta la falsación si se propone y corrobora una hipótesis empíri-
ca de bajo nivel que describa dicho efecto, la cual se denomina hipótesis falsadora.
Por tanto, falsación sería demostrar que un enunciado es falso por no resistir las
pruebas de falsación. Para Popper no existen las verificaciones absolutas. Resistir
una prueba de falsación no es verificar un enunciado, sólo implica reconocer que de
momento resiste la confrontación con la experiencia, por lo que puede ser conside-
rado provisionalmente como correcto o útil para tratar la realidad. La influencia del
racionalismo crítico ha sido tan importante que toda la teoría de la ciencia desde me-
diados del siglo XX hasta la actualidad ha pasado por Popper, bien sea para aceptar
toda su teoría, bien sea para construir a partir de él (Monserrat, 1984).
Iv.3.4. Criterio de verificación de A. J. Ayer

Ayer fue el introductor del neopositivismo lógico en Gran Bretaña. No obstante,
debido a las influencias de Popper, presenta una concepción suavizada en la que
considera que las teorías no pueden ser absolutamente falsadas ni verificadas, por
lo que sustituye el criterio de verificación fuerte del positivismo por una compro-
bación provisoria (verificación débil). Según ésta, verificar un enunciado científico
es poder aducir una serie finita de observaciones, comprobables de forma intersub-
jetiva, que permitan considerar como verosímil, con mayor o menor certeza, tal
enunciado.
1v.3.5. Criterio de confirmación de Rudolf Carnap

Carnap fue un claro representante del neopositivismo lógico. Colaboró con el Cír-
culo de Viena y llegó a fundar un centro de neopositivismo en Praga. En un princi-
pio, Carnap defendía la versión más radical del criterio de verificación, tal como se
había propuesto en el Círculo de Viena. Sin embargo, a raíz de las críticas de Popper,
se vio obligado a reconsiderar su postura y reformular el criterio de verificación. Así,
plantea que la verificación o comprobación de verdad de enunciados de experiencia
no debe entenderse nunca de manera absoluta, ni en el caso de los enunciados uni-
versales ni en los particulares. Por ello, en lugar de verificación propone utilizar el
término confirmación, entendiendo por ésta una forma amortiguada de verificación.
Además, reconoce que el criterio de verificación no puede aplicarse a enunciados
aislados, tal como mantenía anteriormente, su aplicación correcta sólo puede hacer-
se en relación a los sistemas científicos y la experiencia. También acepta que los
enunciados deberán ser contrastables, es decir, que puedan ser confirmados a través
de un experimento. No obstante, admite enunciados confirmables pero no contras-
tados por no haberse diseñado aún un experimento que pueda contrastarlo. Las crí-
ticas de Popper sobre los enunciados protocolarios lleva a Carnap a distinguir entre
un lenguaje observacional y un lenguaje teórico. El primero está referido en su tota-
lidad a la experiencia y todos sus términos están confirmados, expresa la experiencia
inmediatamente accesible y representada en el lenguaje ordinario acordado por la
comunidad científica. El segundo es un sistema de enunciados con estructura lógica.
Un enunciado puede ser admitido como lenguaje científico cuando se puede poner
en relación con un enunciado admitido en el lenguaje observacional.
IV.3.6. Criterio de verificación pragmática de Júrgen Habermas

Habermas es un representante de la epistemología dialéctica de la Escuela de Franc-
fort, la cual postula que todas las interpretaciones son dialécticamente revisables en
el proceso de la historia. A diferencia del positivismo, se considera que el conoci-
miento no se da en las ciencias naturales. No se pretende construir teorías estables de
interpretación de la realidad, sino la búsqueda en la sociedad y en la naturaleza de to-
dos aquellos elementos negativos que deben ser superados. Se postula que ninguna
interpretación humana puede pretender presentarse como correcta, aunque sea de
forma provisoria, hasta que se haya confrontado con la acción. Además, la búsqueda
de la verdad sólo puede hacerse por el diálogo intersubjetivo en el contexto de una
sociedad crítica. Habermas propone como criterio de verificación la teoría de la ver-
dad como consenso. El conocimiento humano es siempre una interpretación; por
ello, el hombre tiene que confrontar su interpretación con los demás hombres. La
verdad se obtiene por consenso intersubjetivo, es decir, por acuerdo intersubjetivo
de las interpretaciones de la realidad. Así, la verdad sería el consenso total entre los
hombres. Por tanto, la verificación de las teorías no puede analizarse independien-
temente del contexto social. Así, verificar implica registrar el éxito que alcanza en la
dimensión social en que se sitúa. Según Monserrat (1984), este criterio no está desen-
caminado si se tiene en cuenta que el éxito social es un índice de la aceptación inter-

subjetiva. Sin embargo, como criterio de demarcación científica resulta insostenible,
pues, por ejemplo, por acuerdo intersubjetivo podría afirmarse que la luna es mayor
cuando está sobre el horizonte que cuando está en el cenit; o también, según este cri-
terio, tendríamos que admitir que un acuerdo unánime de los miembros de un jura-
do implicaría que su decisión es verdadera, lo cual, evidentemente, no necesita co-
mentarios.
Iv.3.7. Criterio de contrastabilidad empírica y teórica

En la ciencia actual las teorías han alcanzado un nivel de complejidad que hace difícil
refutarlas o confirmarlas. La confrontación con los datos empíricos ya no es sufi-
ciente para contrastar una teoría, tal como se ha propuesto hasta ahora en las distin-
tas escuelas epistemológicas. Así, en la literatura científica se utilizan expresiones
como: «si el dato a se confirma, debilitaría la hipótesis A», «el dato a parece robustecer
la hipótesis A». Por tanto, se hace necesario revisar el concepto de verificación cien-
tífica, puesto que el criterio de ser objetivamente contrastable con datos empíricos es
una condición necesaria pero no suficiente (Villoro, 1985). Una hipótesis o una teo-
ría será empíricamente contrastable cuando, junto con los datos empíricos, implica
proposiciones particulares que se pueden comparar con proposiciones sugeridas por
experiencias controladas. Según los medios que se utilicen, la contrastación puede
ser directa o indirecta. Por otra parte, una hipótesis o teoría será teóricamente con-
trastable cuando se puede comparar con hipótesis o teorías empíricamente contras-
tables. Para poner a prueba una teoría es necesario formular hipótesis que cuestio-
nen los principios que se postulan en la teoría. La posibilidad de formular hipótesis
más o menos precisas está en función del grado de generalidad de la teoría, puesto
que a mayor generalidad menor contrastabilidad. Pero esto sólo es aplicable a las
teorías científicas, puesto que cuando un constructo no puede enriquecerse con hi-
pótesis subsidiarias, entonces no puede llegar a alcanzar el estatus de teoría científica.
Por tanto, una primera condición para la consideración de conocimiento científico
es que científico implica ser contrastable. Sin embargo, esto no es suficiente, pues un
constructo puede ser contrastable y además incompatible con el conocimiento cien-
tífico. Tal es el caso de la astrología o del psicoanálisis, que adquieren la considera-
ción de seudociencias antes de ser contrastadas y refutadas de forma empírica, pues-
to que ya previamente son incompatibles con el conocimiento científico; por ello, no
es necesario llegar a refutarlas, lo cual tampoco sería difícil.
En resumen, una teoría es científica si puede ser contrastable y, además, es com-
patible con el conocimiento científico. Así, las teorías que aún no han sido contrasta-
das pueden clasificarse tal como recoge la figura 5.1.
Gualberto Buela-Casal
158
FIGURA 5.1. Clasificación de las teorías incontrastadas
TEORÍAS
INCONTRASTADAS
Incontrastables Contrastables
No
científicas
Incompatibles Compatibles
No Científicas
científicas
V. MÉTODO INDUCTIVO VERSUS DEDUCTIVO
va. Elmétodo inductivo
El método inductivo consiste en hacer inferencias a partir de enunciados singulares

(también llamados particulares), tales como descripciones de observaciones, para
construir enunciados universales, como por ejemplo una teoría. Inducción es cons-
tatar repetidamente y generalizar. En otras palabras, la inducción es el desarrollo de
reglas, ideas o conceptos generales a partir de conjuntos específicos de ejemplos. Por
medio del análisis de similitudes y diferencias entre experiencias específicas, se extraen
características generales de las clases de objetos, sucesos o situaciones (Pellegrino,
1986).
La inducción es una técnica de constante aplicación, tanto en las distintas situa-
ciones de la vida diaria, como en la construcción de muchas leyes científicas. Se pue-
de distinguir entre inducción enumerativa e inducción eliminativa. Según la primera,
todos los sujetos observados en un conjunto (por ejemplo, los cuervos) tienen la
misma propiedad (son negros). Por tanto, puede afirmarse que en el caso » (cual-
quier cuervo) también se dará la misma propiedad (será negro). La inducción enu-
merativa no permite formular una ley universal y necesaria, tan sólo debe ser inter-
pretada como una ley hipotética de una regularidad natural. La inducción
climinativa permite controlar la anterior eliminando aquellas instancias en que la re-
Método científico y evaluación psicológica
159
lación entre la propiedad y el sujeto es puramente fortuita, por lo que no se debe te-
ner en cuenta al hacer la generalización (Monserrat, 1984). En este método pueden
distinguirse cuatro modalidades:
a. Método de concordancias; si en varias ocasiones que se produce el fenóme-

no a sólo hay la circunstancia común A, entonces puede afirmarse que Á es
la causa de a.
b. Método de las diferencias; la proposición anterior se confirma si el fenóme-
no a no se produce cuando falta la circunstancia A.
c. Método de las concordancias y las diferencias; es la conjunción de los dos
anteriores.
d. Método de las variaciones concomitantes; cuando un fenómeno a varía y de
todas las circunstancias que concurren en la misma situación, solamente A
varía en las mismas proporciones, A es la causa o efecto de a.
Los positivistas del Círculo de Viena matizaron que la inducción no garantiza

que los hechos constatados se produzcan siempre del mismo modo, pues la induc-
ción no proporciona la seguridad absoluta, sino, únicamente, una seguridad práctica
sobre la expectativa de fenómenos futuros. Según Wittgenstein, el método inductivo
sería verdaderamente válido si existiese una ley natural constante. Pero este método
no se apoya sobre una presuposición apriórica de la existencia de tal ley. En todo
caso puede ser aplicado cuando pueda conducir a resultados provechosos, pero te-
niendo presente que nunca proporciona seguridad. En opinión de Bunge y Ardila
(1988), a pesar de que el método inductivo es la versión más popular del método
científico y que las operaciones de inducción resulten eficaces en casos elementales,
no resulta válido en aquellos casos en que la generalización (hipótesis o teorías) no es
inductiva, puesto que implica conceptos que no se encuentran en los datos.
Popper (1962) es más radical en cuanto a la validez del método inductivo, pues
considera que desde un punto de vista lógico no se puede justificar la inferencia de
enunciados universales a partir de enunciados singulares, por elevado que sea su nú-
mero, puesto que cualquier conclusión que se obtenga de este modo siempre corre el
riesgo de resultar un día falsa. Así dice que: «cualquiera que sea el número deejem-
plares de cisnes blancos que hayamos observado, no está justificada la conclusión de
que todos los cisnes sean blancos» (Poper, 1962, p. 27). De hecho, ser cisne y ser
blanco es una coincidencia existencial, no existe ningún tipo de relación entre am-
bos; por tanto, no es de extrañar que se descubriesen cisnes negros en Australia. Este
autor habla del problema de la inducción para referirse a la cuestión sobre cómo es-
tablecer la verdad de los enunciados universales basados en la experiencia. Tal es el
caso de las hipótesis y los sistemas teóricos de las ciencias empíricas. Aunque los po-
sitivistas creen que la verdad de estos enunciados se sabe por laexperiencia, está cla-
ro que todo enunciado en el que se informa de una experiencia no puede ser origi-
nalmente un enunciado universal, sino tan sólo un enunciado singular. Por ello,
decir que sabemos por experiencia la verdad de los enunciados universales debe en-
tenderse como que la verdad de esos enunciados se infiere de otros (singulares) que
son verdaderos según la experiencia. Es decir, según esto, los enunciados universales
están basados en inferencias inductivas. Así, la pregunta de si las leyes naturales son
verdaderas es lo mismo que preguntar si las inferencias inductivas están justificadas

lógicamente. Para justificar las inferencias inductivas es necesario establecer un prin-
cipio de inducción que permitiese hacer las inferencias de una forma lógicamente
aceptable. Sin embargo, tal principio no puede ser una verdad puramente lógica. En
realidad, si existiese un principio de inducción puramente lógico, no habría proble-
ma en la inducción, pues se podrían aceptar todas las inferencias inductivas como
transformaciones puramente lógicas, de la misma forma que se hace con lasinferen-
cias de la lógica deductiva. Popper (1962) no encuentra ninguna razón para justificar
la aceptación del principio de inducción y define su postura de una forma clara:
algunas personas que creen en la lógica inductiva se precipitan a señalar, con Reichenbach,
que «la totalidad de la ciencia acepta sin reservas el principio de la inducción, y que nadie pue-
de dudar de este principio en la vida corriente». No obstante, aun suponiendo que fuese así
—después de todo, «la totalidad de la ciencia» podría estar en un error— yo seguiría afirman-
do que es superfluo todo principio de inducción, y que lleva forzosamente a incoherencias
(incompatibilidades) lógicas [Poper, 1962, p. 28].
En un cuento popular ruso se narra la historia de dos ranas que un día se cayeron
en una vasija que contenía leche. Ambas saltaron una y otra vez para intentar salir de
la vasija, pero no conseguían elevarse lo suficiente para alcanzar el borde. Después
de muchos intentos, una de las ranas pensó: «está claro, por mucho que lo intente,
nunca conseguiré salir, por tanto es mejor ahogarme que seguir sufriendo». La otra
rana pensó que el hecho de no haberlo conseguido hasta el momento no era razón
para dejar de intentarlo y, por tanto, continuó saltando. Por efecto de los saltos, la le-
che se fue convirtiendo en manteca y llegó un momento en que pudo tomar suficien-
te impulso para salir de la vasija. Este cuento es, sin duda, ilustrativo de que en el mé-
todo inductivo no siempre se cumplen las inferencias.
v2. El método deductivo
El método deductivo es un proceso sistemático de pensamiento que conduce de un

grupo de proposiciones a otro y que está basado en los principios de la lógica. La fi-
nalidad de los principios lógicos es garantizar la validez. Así, una deducción es válida
s1 y sólo si la certeza de sus premisas es suficiente para garantizar la certeza de la con-
clusión. Si la conclusión no se sigue validamente de las premisas, entonces será falsa,
aunque aparentemente sea verdadera. Un ejemplo podría ser el siguiente. Si todas las
langostas hervidas y rojas están muertas y si todas las langostas muertas y rojas están
hervidas, ¿es correcta la siguiente inferencia?: «todas las langostas muertas y hervi-
das están rojas».
El principio fundamental del método deductivo es que una conclusión puede
Justificarse si no existe ninguna condición que la contradiga. Es decir, una deducción
es válida siempre que al considerar la conclusión como falsa no exista ninguna forma
de interpretar las premisas que resulte consistente (Johnson-Laird, 1986). Para Mon-
serrat (1984), la concepción deductiva es aquella manera de entender el proceso
constructivo de la ciencia en que se considera que éste debe proceder principalmente
como un análisis lógico de los fenómenos que constituyen la base empírica. Se extraen
consecuencias deductivas, analíticas y estructuradas, se formulan las hipótesis nece-

sarias para justificar la coherencia real de los enunciados obtenidos, se diseñan pro-
cedimientos para realizar observaciones más exactas y experimentos para verificar
las hipótesis formuladas. El método deductivo permite que la base empírica, las con-
secuencias deductivas, las hipótesis y las leyes sean la base para la construcción de las
teorías y de los modelos científicos. En esta concepción, la formulación de hipótesis
arriesgadas facilita los avances más espectaculares de la ciencia. Por ejemplo, la teoría
de la relatividad no hubiese sido posible sin una concepción hipotético-deductiva.
Frente al inductivismo, Popper propone el deductivismo como el método que per-
mite contrastar de forma crítica las teorías científicas. Para este autor es necesario
distinguir entre la psicología del conocimiento (que trata de los hechos empíricos) y
la lógica del conocimiento (que trata exclusivamente de relaciones lógicas), pues en
su opinión la creencia en una lógica inductiva se debe, en gran medida, a la confusión
de los problemas psicológicos con los epistemológicos. La cuestión acerca de cómo
se le ocurre una idea a un científico tiene interés desde un punto de vista psicológico,
pero carece de relevancia para el análisis lógico del conocimiento científico. En con-
secuencia, distingue entre el proceso de concebir una idea y los métodos y resultados
de su examen lógico. Para la concepción crítico racionalista, el contexto de descubri-
miento no se considera relevante desde una perspectiva epistemológica. Incluso se
postula que las hipótesis que se contrasten no deben ser únicamente aquellas que son
resultado de un proceso lógico rigurosamente reconstruido, sino también aquellas
que son fruto de una especulación creativa y que, a veces, suponen un salto arriesga-
do en el contexto de una teoría. Por tanto, la tarea lógica del conocimiento debe ce-
ñirse exclusivamente a la investigación de los métodos empleados para contrastar de
forma sistemática toda nueva idea antes de que pueda ser válidamente aceptada.
En la actualidad, autores como Fernández Buey (1991) critican la unidad del mé-
todo científico por reducir la ciencia a una concepción hipotético-deductiva, consi-
derando, por tanto, que sólo es científico aquello que se ajusta a dicho método. Ante
esta postura se propone una flexibilidad en la que tengan cabida las reflexiones es-
pontáneas de los científicos, que no siempre siguen el método deductivo. En defini-
tiva, se trata de un racionalismo suavizado o, en palabras de Fernández Buey (1991),
de un «racionalismo bien temperado».
Alvira, P., Avia, M., Calvo, R. y Morales, F. (1979). Los dos métodos en las ciencias sociales.
Madrid. Centro de Investigaciones Sociológicas. E
Anguera, M. T. (dir.) (1991). Metodología observacion al en investigació n psicológica. Barce-
lona. PPU. z .
Bakeman, R. (1991). Prólogo al libro de M. Anguera (dir.), M etodología observacion al en la
investigación psicológica. Barcelona. PPU. | ]
Campbell, D. y Stanley, ]. (1966). Experimental and quasi-experimental designs for research.

Chicago. Rand McNally.
Fernández Buey, F. (1991). La ilusión del método (ideas para un racionalismo bien tempera-
do). Barcelona. Crítica.
Johnson-Laird, P. (1986). Capacidad de razonamiento deductivo. En R. Sternberg (dir.), Las
capacidades humanas. Un enfoque desde el procesamiento de la información. Barcelona.
Labor.
Monserrat, J. (1984). Epistemología evolutiva y teoría de la ciencia. Madrid. Servicio de Pu-
blicaciones de la Universidad Pontificia Comillas.
Pellegrino, J. (1986). Capacidad de razonamiento inductivo. En R. Sternberg (dir.), Las capa-
cidades humanas. Un enfoque desde el procesamiento de la información. Barcelona. La-
bor.
Pereda, S. (1987). Psicología experimental. I. Metodología. Madrid. Pirámide.
Riva, C. (1991). El método observacional. Decisiones básicas y objetivos. En M. T. Anguera
(dir.), Metodología observacional en la investigación psicológica. Barcelona. PPU.
Silva, F. (1986). Cronbach y “las dos disciplinas de la psicología científica”. Papeles del Cole-
gio. Psicólogos, 26, 57-58.
Villoro, A. (1985). ¿Qué es y para qué puede aplicarse el método científico? En M. Bunge
(dir.), Epistemología. Barcelona. lcdel
Yela, M. (1990). Evaluar qué y para qué. El problema del criterio. Papeles del Psicólogo,
46/47, 50-54.
Alvira, P., Avia, M., Calvo, R. y Morales, F. (1979). Los dos métodos en las ciencias sociales.
Madrid. Centro de Investigaciones Sociológicas.
Monserrat, J. (1984). Epistemología evolutiva y teoría de la ciencia. Madrid. Servicio de Pu-
blicaciones de la Universidad Pontificia Comillas.
6. ELPROCESO DE EVALUACIÓN PSICOLÓGICA
GUALBERTO BUELA-CASAL, MIGUEL ÁNGEL VERDUGO y J. CARLOS SIERRA
Il. INTRODUCCIÓN
La información que se obtiene a través de una evaluación psicológica está deter-

minada por múltiples factores, uno de los cuales es el proceso que se sigue para
realizar la evaluación. No obstante, en opinión de Fernández-Ballesteros y Silva
(1989), a pesar de su relevancia no ha sido suficientemente tratado. Es un hecho
que la evaluación psicológica se realiza a través de un proceso en el que se recoge
información sobre el sujeto evaluado y se toman decisiones. No obstante, el pro-
ceso entendido como una metodología no ha recibido, por parte de los investiga-
dores, la importancia que en realidad tiene. La concepción de su evaluación psi-
cológica como un proceso ha servido para distinguir la evaluación de una simple
aplicación de tests psicológicos; el evaluador utiliza otras muchas técnicas dife-
rentes a los tests y la aplicación de éstos no es más que una fase de un procedi-
miento que conduce a la resolución de un problema.
En la última década, diversos autores han señalado la importancia de considerar
y estudiar el proceso de evaluación como de toma de decisiones, puesto que la me-
jora en las decisiones diagnósticas se incrementa con el estudio del proceso (Vizca-
rro, 1987). Como se pondrá de manifiesto a continuación, el proceso de evaluación
sigue, explícita o implícitamente, los pasos de un procedimiento semejante al méto-
do científico. El evaluador observa, formula hipótesis, las prueba, interviene y los
resultados obtenidos retroalimentan su proceso hasta alcanzar el objetivo plantea-
do. Westmeyer y Hagebóck (1992) señalan que una de las condiciones para maxi-
mizar el rigor científico de la evaluación psicológica es contar con un proceso en el
que se establezcan claramente los distintos pasos y actividades que debe realizar el
evaluador.
El proceso de evaluación psicológica incluye diversas fases, sin que exista al res-
pecto un consenso entre los diferentes evaluadores, lo cual responde a las diferentes
metas, sujetos implicados, conceptualización del mismo (Matud, 1993) y a los dis-
tintos modelos teóricos de evaluación psicológica. Fernández-Ballesteros (1992)
considera que el proceso de evaluación está determinado por el objetivo de la evalua-
ción; así, aun cuando todo proceso de evaluación sigue las fases del método hipotéti-
co-deductivo, si el objetivo de la evaluación es el diagnóstico, la orientación o la se-
lección, la verificación de las hipótesis formuladas se realizará mediante técnicas
correlacionales, mientras que si el objetivo es el tratamiento, la metodología correla-
cional debe ser complementada con procedimientos experimentales.
Universidad de Granada, Universidad de Salamanca y Universidad de Granada, respectivamente.

164 Gualberto Buela-Casal, Miguel Ángel Verdugo y J. Carlos Sierra
Il. ELPROCESO EN LA EVALUACIÓN TRADICIONAL
El proceso denominado tradicional en evaluación psicológica se caracteriza por la

no inclusión del tratamiento, a diferencia de lo que hará la evaluación conductual. Si-
guiendo el método hipotético deductivo pueden distinguirse dos perspectivas dis-
tintas del proceso de evaluación (Silva, 1988): una perspectiva a posteriori, donde el
tratamiento es el contexto en el que se contrastan las hipótesis, y una perspectiva a
priori, en la que el proceso de evaluación está estructurado de tal forma que las hipó-
tesis se verifican antes del tratamiento. El modelo de evaluación a posteriori es elmás
conocido y utilizado. Sin embargo, presenta un problema, puesto que en realidad
nos viene a decir que si el tratamiento tiene éxito confirma el diagnóstico (es decir,
éste ha sido adecuado), mientras que si el tratamiento no tiene éxito se considera que
el diagnóstico era inadecuado o insuficiente. Como resulta lógico pensar, este proce-
dimiento impide una valoración de la efectividad del tratamiento. No obstante,
como es bien sabido, el tratamiento puede fallar por diversos motivos, distintos de
una evaluación inadecuada. Por todo ello, parece conveniente utilizar un modelo a
priori. En éste, la evaluación pretratamiento puede descomponerse en cuatro fases
(Carey y cols., 1984; Silva, 1988, 1993; Fernández-Ballesteros, 1992):
Recogida de información preliminar.

Desarrollo de hipótesis explicativas.
Contrastación de hipótesis.
A
AN Resultados.
La recopilación de información sirve para formular las hipótesis explicativas y,

además, para su posterior contrastación. Esto se realizaría antes de iniciar el trata-
miento y de acuerdo con una metodología hipotético-deductiva. Aunque no existe
un acuerdo unánime en cuanto al número de fases o etapas que deben incluirse en el
proceso de evaluación tradicional, hay cierto consenso con respecto a las siguientes:
a. Información preliminar. Esta etapa incluye la recogida de información, la

operativización o precisión del motivo de la consulta y la decisión de si es o no perti-
nente una intervención. La información debe recogerse de forma sistemática, para lo
que se utilizan diversas técnicas de evaluación de amplio espectro, como puede ser la
entrevista, recabando datos sobre el sujeto, contexto social y ambiental. Una vez or-
ganizada y operativizada la información se procede a decidir si dado el motivo de la
consulta es objeto de intervención y si ésta nos corresponde a nosotros o a otros
profesionales.
b. Formulación de las hipótesis. Para elaborar las hipótesis se sigue el método

inductivo, partiendo de la información preliminar hasta la interpretación del caso
como una categoría concreta dentro del marco de referencia del evaluador. Sin em-
bargo, es importante considerar que esta interpretación inicial debe ser flexible para
permitir modificaciones posteriores, puesto que según se avance en el proceso diag-
nóstico irán apareciendo nuevos datos que implicarán un replanteamiento de la si-
El proceso de evaluación psicológica 165
tuación inicial. Las hipótesis planteadas serán contrastables y deberán estar basadas
en datos empíricos debidamente comprobados, por lo que en este momento los co-
nocimientos teóricos del evaluador son fundamentales. Según Fernández-Balleste-
ros (1992), se pueden formular cuatro supuestos diferentes en función del objeti-
vo de la evaluación; si el objetivo es un simple diagnóstico es suficiente con supuestos
de semejanza, si el objetivo es orientar o seleccionar se deberán formular supuestos de
cuantificación y asociación predictiva, y si la meta final es el tratamiento se deben
plantear supuestos de relación funcional, una vez verificados los supuestos de aso-
ciación predictiva durante el proceso correlacional.
c. Planificación de la evaluación. Una vez operativizadas las hipótesis resulta

necesario seleccionar los instrumentos de evaluación más adecuados. Como es lógi-
co, la selección estará determinada en buena medida por el modelo teórico con el
que se identifica el evaluador y, además, por otros criterios como pueden ser especi-
ficidad-globalidad. Así, puede optarse por instrumentos generales que exploran di-
versos aspectos o por otros más específicos.
d. Exploración e interpretación. En esta etapa se realizan las evaluaciones y

comprobaciones que permiten contrastar las hipótesis planteadas al inicio del proce-
so. Por tanto, se caracteriza por una metodología deductiva. No obstante, la verifica-
ción de las hipótesis será más o menos rigurosa en función del tipo de técnicas utili-
zadas para confrontar las hipótesis. Así pues, es aquí donde hay que plantearse las
garantías científicas de los instrumentos utilizados, por ello, el tipo de técnica utili-
zada, la fiabilidad, la validez, la representatividad, las condiciones en las que se apli-
ca, etc., son informaciones claves para saber a qué nivel de verificación nos referi-
mos. Si el resultado de la contrastación es negativo, es necesario volver a las fases
iniciales, revisando la formulación de hipótesis e incluso la información preliminar.
e. Juicio diagnóstico. Éste ha sido definido por Silva (1988) como aquel proce-
dimiento por medio del cual se llega, a partir del conjunto de datos recopilados, a
una formulación sintética que permite deducir conclusiones dirigidas hacia la plani-
ficación de medidas de acción (orientar, seleccionar o proponer un tratamiento).
Esta etapa es de suma importancia, pues permite tomar decisiones sobre el motivo
de la consulta. Si el juicio emitido lleva a la formulación de nuevas hipótesis, enton-
ces el proceso no debería darse por concluido, sino que habría que retomar las fases
anteriores.
f.. Informe de los resultados. La mayoría de los autores coincide en señalar que
el informe debe ser un documento científico que permita trasmitir una informa-
ción ajustada, rigurosa y estructurada sobre los resultados y el procedimiento se-
guido en la evaluación. En su redacción es importante tener en consideración quién
es el destinatario, pues el nivel de comprensión de éste puede variar en gran medi-
da, puesto que puede dirigirse a otro profesional, al propio sujeto,a los familiares,
a otros profesionales no psicólogos, etc. En el informe deben incluirse, además, re-
comendaciones acerca de cómo orientar o intervenir en relación al tema objeto de
la evaluación.
En la actualidad, el juicio diagnóstico está siendo objeto de múltiples investigacio-

nes, tal como puede verse en Vizcarro (1987), Silva (1988) y Schulte (1989). Haynes
(1994) identifica el juicio diagnóstico con las inferencias sobre un cliente, basadas en
la evaluación, que afectarán al tipo de tratamiento que recibirá. El juicio diagnóstico
puede considerarse como un proceso de toma de decisiones, donde están implícitos
diversos aspectos cognitivos, por lo que a menudo refleja los sesgos, las expectativas,
las experiencias destacadas recientes, el entrenamiento, el modelo teórico y la aten-
ción selectiva del evaluador, en vez de ser una función de los objetivos (Silva, 1988;
Haynes, 1994). En opinión de Godoy y Silva (1992) existen dos defectos importantes
a la hora de realizar un juicio diagnóstico: generar hipótesis excesivamente pronto en
el proceso de evaluación, lo que conduce a ignorar datos importantes a nivel social,
personal y clínicamente relevantes, y realizar un razonamiento global, intuitivo y no
sistemático que lleva a confirmar hipótesis diagnósticas falsas. Así, se han realizado
estudios sobre el tipo de procesamiento a que se someten los datos, búsqueda de mo-
delos matemáticos que expliquen el juicio como un proceso de toma de decisiones y
los posibles sesgos implícitos. Silva (1988) recoge de una forma más sistemática una
serie de sesgos en los que se puede incurrir al realizar el juicio diagnóstico y que, por
tanto, deben tenerse en cuenta. Los más importantes son los siguientes:
a. En la elaboración del diagnóstico se tiende a hacer un mejor uso de la infor-

mación positiva, es decir, de la presencia de alguna característica, que de la
información negativa, es decir, la ausencia.
b. Tendencia a una mayor utilización de la información que confirma las hipó-
tesis que de aquella que las contradice.
c. Hay un efecto de primacía en el proceso de evaluación, consistente en sobres-
timar el valor diagnóstico de la primera información, y un efecto de recencia,
dando mayor valor a la última información obtenida.
d. En las primeras fases del proceso diagnóstico se tiende a extender el sistema
de las hipótesis de trabajo y se tiende a reducir en las siguientes fases.
e. Existen determinados factores que hacen que el sistema abierto de hipótesis
de trabajo se convierta en un sistema cerrado, debido a la mayor probabili-
dad otorgada a una determinada hipótesis.
f.. Tendencia a sobrestimar las hipótesis que tenemos más a mano y subestimar
las que están en el trasfondo.
g. Actitud conservadora ante algunos problemas diagnósticos.
h. Cuanto menor sea el conjunto de hipótesis con que se trabaja y mayor la
cantidad de valor informativo que contienen los datos recibidos, el umbral
para decidirse por la hipótesis modal será mayor.
1. La escasa habilidad para valorar covariaciones, lo que puede llevar al fenó-
meno de las correlaciones ilusorias.
La influencia de las ideas preconcebidas.
a La falta de conciencia acerca de los propios procesos de construcción de los
juicios diagnósticos.
l. El fenómeno de la hiperseguridad o seguridad excesiva en el diagnóstico que
se ha hecho, lo cual, además, correlaciona de forma negativa con la calidad
del diagnóstico.
m. La deformación que se hace de la información diagnóstica al tratarla de for-

ma retrospectiva.
Sin embargo, el conocimiento de los posibles sesgos no es suficiente para mejo-
rar el juicio diagnóstico. Lo que se necesita son programas de entrenamiento en los
que se ponga un énfasis especial en las tareas prácticas. En este contexto se sitúa una
de las polémicas más importantes de la historia de la evaluación psicológica: la pre-
dicción clínica frente a la predicción actuarial. Desde el estudio de Meehl (1954) se
han realizado diferentes análisis que han manifestado la superioridad de la predic-
ción estadística frente al juicio clínico; sin embargo, a nuestro entender, esto no anula
las tareas del evaluador, muchas de las cuales son insustituibles (por ejemplo, la se-
lección de variables relevantes, identificación de predictores o formulación de hipó-
tesis), sin entrar en cuestiones deontológicas y legales. Por otro lado, cuando se utili-
zaron modelos que intentaban reproducir matemáticamente el juicio clínico, se
encontró que con modelos sencillos se llegaban a conseguir juicios adecuados pero
su fiabilidad decrecía a medida que se hacían más complejos (Hoffman, 1960). En
este contexto, destaca también el trabajo de Elstein, Shulman y Sprafka (1978) en el
que se concluye que la adquisición de información, la interpretación y la generación
de hipótesis son variables que están más determinadas por el tipo de problema abor-
dado que por el propio evaluador, lo que nos permite indicar que los problemas
planteados generan estrategias específicas. La superación de estos sesgos por parte
del evaluador podrían corregirse tal vez en un futuro más o menos lejano con pro-
puestas informáticas como el enfoque normativo de Westmeyer y Hagebóck (1992).
En resumen, el proceso de evaluación que se acaba de describir termina cuando
se alcanzan, a través de la descripción, clasificación y predicción, los objetivos de
diagnóstico, orientación, selección O propuesta de tratamiento.
III. EL PROCESO EN LA EVALUACIÓN CONDUCTUAL
Cuando el objetivo de la evaluación es el cambio, se exige una manipulación experl-

mental para comprobar las hipótesis funcionales, lo que hace que el proceso de eva-
luación presente algunas peculiaridades diferentes al descrito anteriormente. Aun-
que la intervención no sea una tarea “específica” del evaluador, éste siempre planifica
los tratamientos y evalúa el cambio producido (Fernández-Ballesteros, 1992). Por
otro lado, la evaluación y el tratamiento son dos partes inseparables de la interven-
ción, y no sólo en el modelo conductual; no obstante, será dentro de este modelo en
donde se refleje de una forma muy clara este tipo de enfoque de intervención, puesto
que la evaluación conductual tiene un papel fundamental en laplanificación del tra-
tamiento (evaluación pretratamiento) y en la evaluación del mismo (evaluación pos-
tratamiento). La evaluación conductual tiene unas características propias, como es
su íntima relación con el tratamiento. Por tanto, podría decirse que el proceso se
orienta hacia la intervención. En el proceso de evaluación psicológica se recoge todo
lo que el terapeuta hace desde que se dispone a enterarse de lo que aqueja al paciente
hasta que finaliza su intervención. Según Godoy (1991), no existe un acuerdo sobre
el número de pasos que deben incluirse en este proceso, aunque en la mayoría de los
casos se distinguen tres fases principales:
a. Selección y descripción de las conductas problema.

b. Selección de las técnicas de intervención.
c. Evaluación de los efectos de la intervención.
Fernández-Ballesteros (1992, 1994) hace una descripción detallada de este pro-

ceso, en el que la primera parte se corresponde con el de la evaluación tradicional
descrito anteriormente, incluyendo las fases de recogida de información preliminar,
formulación de hipótesis, comprobación y resultados; la segunda parte de carácter
experimental incluye, según esta autora, cuatro fases diferentes: formulación de hi-
pótesis funcionales, recogida de datos, valoración de resultados y seguimiento. En
función de los resultados obtenidos en la parte descriptiva, en primer lugar, se esta-
blecen los supuestos funcionales sobre el caso, lo cual implica la selección de las con-
ductas problema a cambiar y las variables relevantes a manipular y, en segundo lugar,
se hace una deducción de predicciones verificables. Una vez formuladas estas hipó-
tesis se pasa a la siguiente fase, en la que se selecciona el diseño de intervención y las
técnicas de evaluación y control de posibles variables contaminadoras y, en ciertas
ocasiones, se hace una evaluación continua del progreso del tratamiento. Una vez
aplicado el tratamiento se incluye una nueva fase de carácter exclusivamente evalua-
dor, que exige una evaluación de las conductas problema con el fin de determinar si
se han alcanzado los objetivos terapéuticos planteados y establecer si los datos ava-
lan las hipótesis funcionales formuladas. En algunas ocasiones se requiere la comu-
nicación de los resultados al sujeto o a otras personas. La última fase hace referencia
al seguimiento que incluye una nueva recogida de datos y la comprobación de si se
mantienen los resultados del tratamiento. Según Fernández-Ballesteros (1992) estas
dos variantes del proceso en evaluación psicológica se diferencian fundamentalmen-
te en el modo de contrastar las hipótesis. Así, el proceso correlacional utiliza técnicas
como la observación o tests psicológicos para la recogida de información, sin llegar a
verificar experimentalmente las hipótesis; mientras tanto, en el proceso experimen-
tal, las técnicas se utilizan para operativizar el problema y las variables relevantes del
mismo, haciendo uso de técnicas experimentales para la comprobación de las hipó-
tesis con el objetivo de explicar funcionalmente la conducta y validar el propio pro-
ceso de evaluación. Para más información véase Godoy (1996) y Haynes (1994).
A continuación presentamos de forma resumida el proceso de la evaluación con-
ductual (Godoy, 1991):
a. Análisis del motivo de la consulta. Ésta es la fase que menos atención ha reci-
bido por parte de los investigadores e incluso por muchos terapeutas, que suelen co-
menzar directamente con la operacionalización de las conductas problema. No obs-
tante, antes de iniciar la delimitación de tales conductas es necesario tener un
conocimiento claro acerca del problema real del paciente.
b. Establecimiento de las metas últimas de tratamiento. Éstas hacen referencia

a los criterios necesarios para que el tratamiento pueda considerarse como un éxito,
es decir, los cambios logrados deberán ser clínicamente relevantes y socialmente sig-
nificativos; por tanto, su valoración debe enfocarse desde distintas perspectivas, dan-
do solución a las demandas del paciente. Las metas últimas del tratamiento depen-
den, fundamentalmente, de los juicios de valor de los que de forma directa o
indirecta intervienen en la terapia: el terapeuta, el paciente y el medio social en que
vive el paciente.
c. Análisis de las conductas problema. En el motivo de la consulta pueden dis-

tinguirse dos tipos de problemas: quejas y/o demandas. Las primeras se refieren a lo
que el paciente pretende eliminar, es decir, lo negativo, mientras que las demandas
hacen alusión a aquellas conductas o habilidades que el paciente pretende adquirir.
Para delimitar las conductas problema es necesario operativizarlas en términos con-
ductuales. Frecuentemente, la formulación de la conducta problema por parte del te-
rapeuta suele ser más amplia que el motivo alegado al principio por el paciente, pues-
to que se deben incluir aquellos comportamientos previos en la cadena causal de los
cuales dependen las quejas presentadas.
d. Estudio de los objetivos terapéuticos. Las conductas meta son aquellas sobre
las que se centra la intervención. Cuando se han modificado las conductas objetivo,
supuestamente deben haber quedado resueltas las quejas y las demandas. Pero no
toda queja o demanda supone una conducta objetivo, ya que es frecuente que ante
una queja o demanda el terapeuta proponga varios puntos sobre los que debe incidir
la terapia; y por el contrario, en algunos casos se pretende abordar varias quejas o de-
mandas con la intervención sobre una única conducta objetivo. Es importante resal-
tar que por la expresión conducta objetivo, no sólo debe entenderse una conducta
del sujeto, sino que, además, puede referirse a determinadas condiciones ambientales
o a la relación del sujeto con su ambiente social. Para la selección de las conductas
objetivo suelen tenerse en cuenta diversas consideraciones, tales como, por ejemplo,
que sólo deben ser consideradas como conductas objetivo aquellas que son suscepti-
bles de ser modificadas. Por último, hay que tener presente que el problema no suele
ser monosintomático, por ello resulta necesario establecer una prioridad en las con-
ductas objetivo.
e. Criterios directrices para la elección del tratamiento adecuado. La evaluación

debe incluir una recomendación de cuál puede ser el tratamiento más adecuado.
Esto implica la existencia de conocimientos sobre las técnicas de intervención por
parte del evaluador. Existen diversas estrategias para seleccionar el tratamiento más
adecuado en cada caso. Éstas pueden agruparse en tres categorías: el análisis funcio-
nal, la estrategia de la conducta clave (cambiar una conducta para que ésta cambie a
otra) y la estrategia diagnóstica (una vez que se ha hecho el diagnóstico se elige el tra-
tamiento que se ha demostrado más eficaz para ese tipo de trastorno). No se ha lle-
gado a un acuerdo generalizado acerca de cuál es laestrategia más eficaz. Sin embar-
go, existe consenso acerca de que el análisis funcional no debe realizarse de forma
rutinaria, ya que no siempre resulta útil y además, en algunos casos, Otras estrategias
se han mostrado más efectivas. Así por ejemplo, en aquellos problemas que se pre-
senta una etiología biológica relativamente clara, puede ser más útil el enfoque diag-
nóstico, mientras que el análisis funcional sería especialmente útil en aquellos casos
en que hay una interrelación del problema con el ambiente.
f.. Evaluación de los resultados del tratamiento. Una vez finalizado el trata-
miento, éste debe ser evaluado por diversas razones:
a. Obtener información acerca de la magnitud y dirección de los cambios.

b. Apreciar el grado en que se han alcanzado las metas últimas del tratamiento
y, en consecuencia, si el tratamiento puede considerarse o no un éxito.
c. Laevaluación del tratamiento ofrece garantías sobre su calidad.
d. Facilita el avance de la evaluación y de la intervención, pues permite identifi-
car los procedimientos de evaluación e intervención más eficaces y su mejor
adecuación para uno u otro trastorno.
Para evaluar los resultados del tratamiento se pueden utilizar dos procedimien-
tos. Uno consiste en valorar los resultados con respecto a la línea base, por el cual se
compara al paciente en cada una de las conductas elegidas como conducta objeto de
intervención con las medidas de las mismas conductas durante la línea base. Este
tipo de evaluación nos indica la magnitud del cambio, pero no nos da información
acerca de su relevancia. Otro procedimiento consiste en evaluar los resultados de la
intervención por comparación con las metas últimas del tratamiento, es decir, se tra-
ta de comparar el estado actual con los objetivos meta previamente fijados, y no con
la línea base. Así, cuanto más próximo esté el estado actual de los objetivos marca-
dos, mayor será la relevancia clínica y social de los cambios producidos (véase
Goncgalves y cols. , 1996).
Una vez descrito el proceso debemos relacionar las técnicas de evaluación con el
mismo; Fernández-Ballesteros (1992, 1994) indica que la inclusión de las técnicas de
evaluación dentro del proceso está en función de dos factores: el costo de aplicación
y su nivel de especificidad y rigor. De este modo, los instrumentos utilizados en la
primera fase de recogida de información son de amplio espectro y sometidos a un
mayor número de sesgos (entrevista, observación asistemática, autobiografía...) en
un segundo nivel se utilizan técnicas más precisas y de mayor costo de administra-
ción (autorregistros, observación sistemática...), y en las últimas fases del proceso se
emplean técnicas de mayor costo, especificidad y rigor (tests situacionales, observa-
ciones en vivo y registros psicofisiológicos).
Carey, M. P., Flasher, L. V., Maisto, S. A. y Turkat, D. (1984). The a priori approach to psy-
chological assessment. Professional Psychology, 15, 515-527,
Elstein, A. S., Shulman, L. S. y Sprafka, S. A. (1978). Medical problem solving. Cambridge.
Harvard University Press.
Fernández-Ballesteros, R. (1992). El proceso como procedimiento científico y sus variantes.

En osFernández-Ballesteros (dir.), Introducción a la evaluación psicológica. Madrid. Pi-
rámide.
Fernández-Ballesteros, R. (1994). El proceso en evaluación conductual. En R. Fernández-
Fernández-Ballesteros, R. y Silva, F. (1989). Evaluación psicológica: aportaciones para una
crisis. Evaluación Psicológica/Psychological Assessment, 5, 119-125.
técnicas de terapia y modificación de conducta. Madrid. Siglo XXI.
Entoz eines Toma de decisiones y juicio clínico. Una aproximación psicológica. Madrid.
irámide.
Godoy, A. y Silva, F. (1992). La evaluación psicológica como proceso. Valencia. Nau Llibres.
Gongalves, O. F., Machado, P. P., Sierra, J. C. y Buela-Casal, G. (1996). Evaluación del pro-
ceso y de los resultados del tratamiento. En G. Buela-Casal, V. E. Caballo y J. C. Sierra
(dirs.), Manual de evaluación en psicología clínica y de la salud. Madrid. Siglo XXI.
184.
Hoffman, P. J. (1960). The paramorphic representation of clinical judgement. Psychological
Bulletin, 57, 116-131.
Matud, P. (1993). El proceso diagnóstico. En W. Peñate, P. Matud e I. Ibáñez (dirs.), Evalua-
ción psicológica: concepto y técnicas de análisis. Valencia. Promolibro.
Meehl, P. (1954). Clinical versus statistical prediction. A theoretical analysis and a review of
the evidence. Minneapolis. University of Minnesota Press.
Schulte, D. (1989). Clinical diagnoses and treatment planning. Evaluación Psicológica/Psy-
chological Assessment, 5, 135-146.
Silva, F. (1993). La evaluación conductual: concepto y proceso. En E. J. Labrador, J. A. Cru-
drid. Pirámide.
Vizcarro, C. (1987). Aproximaciones empíricas al estudio del proceso diagnóstico. Evalua-
ción Psicológica/Psychological Assessment, 3, 525-531.
Westmeyer, H. y Hagebóck, J. (1992). Computer-assisted assessment: a normative prospec-
tive. European Journal of Psychological Assessment, 8, 1-16.
Fernández-Ballesteros, R. (1992). El proceso como procedimiento científico y sus variantes.

En R. Fernández-Ballesteros (dir.), Introducción a la evaluación psicológica. Madrid. Pi-
rámide.
técnicas de terapia y modificación de conducta. Madrid. Siglo XXL
Godoy, A. (1996). Toma de decisiones y juicio clínico. Una aproximación psicológica. Madrid.
Pirámide.
Godoy, A. y Silva, F. (1992). La evaluación psicológica como proceso. Valencia, Nau Llibres.
Matud, P. (1993). El proceso diagnóstico. En W. Peñate, P. Matud e 1. Ibáñez (dirs.), Evalua-
Silva, F. (1988). La evaluación psicológica como proceso. Evaluación Psicológica/Psycholog:-
ar Hesaño? vaa
E Dt
nerd hombro izado ar
md A e 4):
piel OO
Ala
sn
bei ins
ido eb: eS
My sido eii raimd
a
NEO
h
3
qi ISR RLGO -AD roo]

e
) ano rta bn Ty ANS
e
*-
-
Mos LETRA EE S
sa
1 IVY YPITLA robo
6
5 en O
h ” $
b
p
Ñ AA
«ft 7
ER
+4 E
13 -
3 AE >
Ñ
7. PRINCIPIOS PSICOMÉTRICOS DE LA EVALUACIÓN
PSICOLÓGICA
MARIANO ÁLVARO
En este capítulo se tratan aspectos básicos referidos a la teoría clásica de los tests:
análisis de ítems, fiabilidad y validez. Además de la exposición conceptual de los tér-
minos utilizados y de las fórmulas estadísticas necesarias en cada caso, se incluyen
comentarios y recomendaciones, que pueden ser útiles para el profesional que haga
uso de los tests.
IL. ANÁLISIS DE ÍTEMS
Cuando se habla de análisis de ítems se está haciendo referencia al estudio del índice
de dificultad y del índice de discriminación. Sin embargo, antes de pasar a hablar de
estos índices, parece conveniente definir algunos conceptos referidos a los ítems más
utilizados y considerados como prototipo: los ítems de alternativa múltiple.
De forma general, el ítem puede definirse como una pregunta o enunciado en la
que se presenta al sujeto una situación problemática y se le pide que dé una respues-
ta, sólo una, siguiendo ciertas instrucciones de tipo formal. Un ítem está configura-
do por las siguientes partes:
a. Tronco de la pregunta o enunciado, que es la parte inicial del ítem y en ella se

plantea la tarea que el sujeto ha de realizar. Esta parte puede ser una pregunta, unas
directrices o un párrafo incompleto; en este último caso, el párrafo se completa con
la opción considerada como correcta, entre las varias ofrecidas.
b. Las opciones son las diferentes alternativas a elegir; entre estas opciones hay
unas que son incorrectas, denominadas distractores, y otra que es la correcta y se de-
nomina clave.
La dificultad para construir un “buen” ítem estriba en la elección correcta de

unos adecuados distractores, que permitan saber si el conocimiento del sujeto se ha
quedado en un nivel general o ha descendido a detalles, hasta el punto de ser capaz
de apreciar diferencias de matiz.
Instituto de la Mujer.
174 Mariano Álvaro
11. Índice de dificultad

El índice de dificultad de un ítem indica qué porcentaje de sujetos ha respondido co-
rrectamente al ítem en cuestión. Esta definición que en principio parece de fácil
comprensión, en la práctica se complica de manera considerable, puesto que puede
resultar difícil tomar una decisión respecto a qué grupo de sujetos se tiene en cuenta
en el momento de hallar el porcentaje. En el numerador pueden considerarse sola-
mente los sujetos que han respondido correctamente el ítem, es decir, los que han
elegido la opción denominada “clave” o, por contra, puede interesar tener en cuenta
también a quienes hayan cometido errores, es decir, a quienes hayan elegido alguno
de los distractores. El denominador puede hacer referencia a todos los sujetos que
han contestado el test, independientemente de lo que hayan hecho en el ítem en
cuestión, o puede excluir de ese total de sujetos a quienes han “omitido” el ítem y/o
a quienes “no han alcanzado” el ítem. Un ítem se considera omitido cuando un suje-
to lo ha dejado en blanco, pero ha contestado a otros que están situados detrás en el
conjunto del test. Por otro lado, un ítem se considera no alcanzado cuando un sujeto
lo ha dejado en blanco y ningún otro ítem situado detrás de él en el test ha sido con-
testado; por consiguiente, puede decirse que los sujetos evaluados que no han con-
testado los ítems “no alcanzados” ni siquiera lo han intentado.
Combinando todas las posibilidades comentadas, las diferentes fórmulas a utili-
zar para averiguar el “índice de dificultad” serían las siguientes:
a. Porcentaje de aciertos sobre el total de sujetos que contesta el test:
n
PIN
N
en donde » es el número de aciertos y N es el número de sujetos.
b. Porcentaje de aciertos excluyendo a los sujetos que han “omitido” el ítem, es

decir, que no lo han contestado, pero sí han contestado otros situados detrás de él:
(ti (0
N-O
en donde O hace referencia al conjunto de sujetos que han omitido el test.
c. Porcentaje de aciertos excluyendo a los sujetos que no han alcanzado el ítem,

es decir, a aquellos que no lo han contestado, ni han contestado a otros situados de-
trás de él:
= —n x 100
N-NA
en donde NA es el número de sujetos que no han alcanzado el ítem.
Principios psicométricos de la evaluación psicológica
175
d. Porcentaje de aciertos, excluyendo a los sujetos que omiten el ítem y a los

que no lo han alcanzado:
pik Ora
n
nens
NOTAS
e. Porcentaje de aciertos penalizando errores:
E
as
N 10
en donde A indica número de aciertos, E número de errores, K número de opciones
del ítem y N número de sujetos.
f. Porcentaje de aciertos penalizando errores y excluyendo a los sujetos que

han “omitido” el ítem:
E
a its
Kal abera o
presto
N-0
g Porcentaje de aciertos penalizando errores y excluyendo a los sujetos que
“no han alcanzado” el ítem:
E
de Re]
Re 10)
N-NA
h. Porcentaje de aciertos penalizando errores y excluyendo a los sujetos que
han “omitido el ítem” y a los que “no lo han alcanzado”:
Sobre qué valores deben tener los índices de dificultad de los ítems que se utili-
cen, cabe decir que, en principio, desde el punto de vista psicométrico es aconsejable
que estén en torno a 50, puesto que de esta forma la varianza será mayor. No se olvi-
de que, cuando las puntuaciones son binarias (1,0), la varianza es igual al producto
deppor q (S? = pq), siendop el porcentaje de casos favorables, aciertos, y q es igual a
1 menosp (1-p); al tratarse de porcentajes: Q = 100— P. El mayor valor pg se obtiene
cuando p es igual a q (p =q), lo que solamente ocurre cuando el valor de p y q es igual
a 0,50 (expresado en proporciones) ó 50 (expresado en porcentajes). S1 la varianza es
176 Mariano Álvaro
mayor, el coeficiente de fiabilidad del test será mayor, puesto que este coeficiente de
fiabilidad es la correlación del test consigo mismo. En principio, a mayor varianza
mayor correlación. Por otra parte, una varianza pequeña indica que las puntuacio-
nes de todos los sujetos se posicionan respecto al rasgo evaluado de manera muy
agrupada. Todos obtienen resultados similares y, en consecuencia, será muy difícil
que el poder de discriminación del ítem o test en cuestión sea alto. Una varianza
grande no avala un poder de discriminación alto, pero es muy difícil que un ítem
tenga capacidad de discriminar entre los sujetos con alta y baja posesión del rasgo
evaluado si la variabilidad de las puntuaciones de todos los sujetos es pequeña. En
suma, una varianza grande avala un coeficiente de fiabilidad alto y un índice de dis-
criminación alto en mayor medida que una varianza baja. ne
Ahora bien, por razones de tipo funcional puede interesar que los índices de difi-
cultad sean superiores o inferiores al 50%. Por ejemplo, en determinadas circunstan-
cias convendría empezar el test con ítems fáciles para que el sujeto vaya tomando
confianza y pueda tener un rendimiento en la prueba apropiado a la posesión del
rasgo evaluado. Asimismo, en un momento dado interesaría discriminar entre suje-
tos con un nivel bajo o un nivel alto en un determinado rasgo, en cuyo caso tendrían
que utilizarse ítems fáciles o ítems difíciles con alto poder discriminativo en esos ni-
veles. En consecuencia, puede afirmarse que, aunque desde el punto de vista estadís-
tico es deseable que todos los ítems tengan un índice de dificultad en torno al 50%,
desde el punto de vista funcional puede ser recomendable que haya un determinado
número de ítems fáciles y/o un determinado número de ítems difíciles. La mayor
parte de los manuales recomienda la siguiente distribución a la hora de aplicar una
prueba de rendimiento o aptitudes a una muestra representativa de una población
“normal” de sujetos: 25% de ítems fáciles, 25% de ítems difíciles y 50% de ítems de
dificultad media. Se entendería por ítem fácil aquel que es respondido correctamente
por más del 75% de la población. Un ítem difícil sería el que es contestado de forma
adecuada por menos del 25% de la población. Los ítems de dificultad media ten-
drían valores de dificultad comprendidos entre 25 y 75% (Álvaro, 1993).
12. Índice de discriminación
El índice de discriminación de un ítem hace referencia a su capacidad para distinguir

entre los sujetos que poseen en alto grado el rasgo evaluado y los que lo poseen en
bajo grado. Así, en un ítem con alto poder de discriminación, los sujetos que posean
en mayor medida el rasgo que se esté evaluando sacarán sistemáticamente mayores
puntuaciones que quienes posean ese rasgo en menor medida.
El procedimiento tradicional para establecer el poder de discriminación de un
ítem ha estado basado en las diferencias entre los porcentajes de aciertos del grupo
más alto y el porcentaje de aciertos del grupo más bajo en el total del test. El grupo
más alto está constituido por el 25 6 27% de sujetos con puntuaciones más altas en el
total del test y el grupo más bajo por el 25 6 27% con puntuaciones más bajas. En la
actualidad, la forma más habitual de estudiar el índice de discriminación de un ítem
es mediante las correlaciones biserial y biserial puntual que, como se verá más ade-
lante, se basan en una comparación entre medias.
Principios psicométricos de la evaluación psicológica 177
12.1. Diferencias entre el porcentaje de aciertos del grupo más alto

y el del grupo más bajo
Wood (1990) y Álvaro (1993) señalan un índice de discriminación muy elemental,
según el cual el poder de discriminación de un ítem vendría indicado por las dife-
rencias entre la proporción de sujetos que han contestado correctamente el ítem,
entre el 25 6 27% que han obtenido las puntuaciones más altas en el total del test
(p,), y el porcentaje de sujetos que han acertado el ítem, dentro del grupo com-
puesto por el 25 6 27% de sujetos que han obtenido las puntuaciones más bajas en
el total del test (p,).
I,=p,—P, en donde
Di
a
, en donde
a
n, es el número de sujetos, entre el grupo más alto, que ha acertado el ítem y N, es el

número de sujetos que constituyen el grupo más alto.
Por su parte,
Py= , en donde
b
n, es el número de sujetos, entre el grupo más bajo, que ha acertado el ítem y N, es el

número de sujetos que constituye el grupo más bajo. Obviamente, N_ =N),,
12.2. Diferencia entre el número de aciertos del grupo más alto y del grupo
más bajo, dividida por el número de aciertos del grupo más alto
00
tE
n a
Esta fórmula indica directamente en porcentajes, en una escala de O a 100, cuánto

más pequeño es el número de sujetos del grupo más bajo que contesta correctamente
al ítem, que el número de sujetos del grupo más alto, que también lo ha acertado.
Por ejemplo, supongamos que tenemos una muestra de 1600 sujetos y que 300
del grupo más alto constituido por el 25% han contestado correctamente el ítem en
cuestión y sólo 100 sujetos del grupo más bajo lo han acertado. El índice de discrimi-
nación sería:
y 300-100 OO) = 200 2100 =66,66

d 300 3
178 Mariano Álvaro
Quiere ello decir que el número de acertantes del grupo más bajo es 66,66%
(2/3) más pequeño que el del grupo más alto.
123. Correlación biserial
En la actualidad, los índices de discriminación más utilizados son las correlaciones

biserial y biserial puntual, dependiendo de si los ítems se dicotomizan a posteriori o
han sido evaluados directamente de manera dicotómica. La correlación bisertal se
utiliza con ítems “dicotomizados” después de haber sido evaluados con escalas de
intervalo u ordinales. Por ejemplo, esto sucede cuando un profesor ha corregido una
pregunta con puntuaciones de O a 10 y una vez que ha calificado las respuestas de to-
dos los alumnos a esta pregunta decide puntuar a los que están por debajo de 5 con
un O y alos que están por encima con 1. La correlación biserial también se considera
como un índice de homogeneidad, ya que evalúa la correlación entre el ítem y el
conjunto de ítems que componen el test, asumiendo que las puntuaciones de cada
ítem oscilan en un continuo que va de O a 1. La fórmula de la correlación biserial es la
siguiente:
de era de 4
r, = HE x Pai que equivale a:
Se y
r,= A Pi , en donde
$ t y
X,, es la media en el test de los sujetos que aciertan el ítem 7, X,, es la media en el test
de los sujetos que no aciertan el ítem z, S, es la varianza de las puntuaciones obtenidas
en el test, p, es la proporción de sujetos que aciertan el ítem 7, q, es la proporción de
sujetos que no aciertan el ítem ¿(q,=1-p,), y es el valor de la ordenada que separa en
1
una distribución normal la proporción de sujetos que acierta el ítem ¿ (p) de la pro-
porción que no lo acierta (q,) y X, es la media del test, considerando a todos los suje-
tos que lo han contestado.
124. Correlación biserial puntual

Cuando los ítems han sido evaluados directamente de manera dicotómica, es decir, que
son dicotómicos en vez de dicotomizados, se utiliza la correlación biserial puntual.
2d Mis
tp = 2 2 xp, q,, o lo que es lo mismo:
h XX, 7)
ed E t 4;
En relación al valor de discriminación de un ítem que es preferible alcanzar, ca-

bría pensar, en principio, que lo ideal es que cuanto mayor sea, mejor; cuanto más se
aproxime a 1, que es el valor máximo de una correlación, mejor, pues ello indicaría
que el ítem tiene gran capacidad de discriminación entre los sujetos más altos, res-
pecto al rasgo evaluado, y los más bajos. Sin embargo, teniendo en cuenta que las co-
rrelaciones biserial y biserial puntual también pueden considerarse como un índice
de homogeneidad, y que si todos los ítems tienen una correlación muy alta con el
test (conjunto de todos los ítems) se está indicando que todos los ítems evalúan lo
mismo, lo que iría en detrimento de la validez de contenido, por lo que es recomen-
dable que los índices de discriminación obtenidos con estas correlaciones tengan va-
lores alrededor de 0,50; un ítem con un índice inferior a 0,25 debe ser eliminado.
Il. LA FIABILIDAD DE UN TEST
Cuando se habla de la fiabilidad de un test, se hace referencia a la precisión, a la con-

sistencia (Feldt y Brennan, 1989) y a la constancia (Henerson, 1987) en la medida; las
tres características tienen un significado similar en este caso. Se dice que un test es
fiable si aplicado varias veces a una misma muestra, en las mismas condiciones, los
resultados son idénticos en todas ellas. Esto sólo puede conseguirse si el test utiliza-
do evalúa con precisión, es decir, los resultados obtenidos con él son consistentes. El
concepto de fiabilidad aplicado a un test es similar al utilizado al referirnos a un
arma; ésta tiene fiabilidad, es fiable, si cuando dispara con ella varias veces un buen
tirador siempre acierta a dar en el mismo sitio, en cuyo caso se dice que hay precisión
en el tiro.
11. Fiabilidad
absoluta y relativa
Cuando se evalúa cualquier rasgo, se comete algún error, que puede ser grande o pe-
queño. Cuanto menor sea este error, más fiable es el instrumento de medida. La fia-
bilidad hace referencia a las diferencias entre las puntuaciones obtenidas y las pun-
tuaciones verdaderas. Estas diferencias son las puntuaciones erróneas, o mejor, la
parte de las puntuaciones obtenidas que son debidas a los errores de medida que se
cometen. Por tanto, la puntuación empírica se descompone en dos partes: una ver-
dadera y otra errónea.
VES
donde X es la puntuación empírica u observada, V es la puntuación verdadera y £ es

la puntuación errónea. y
Del mismo modo, la varianza de las puntuaciones empíricas será igual a la va-
rianza de las puntuaciones verdaderas más la de las puntuaciones erróneas.
S=8S +8
180 Mariano Álvaro
La fiabilidad absoluta hace referencia a la proporción de la varianza de las pun-

tuaciones empíricas explicada por la varianza de las puntuaciones verdaderas.
$?
v
y
xx Ss
E
A la raíz cuadrada de la denominada fiabilidad absoluta se le denomina índice de

fiabilidad, que, a su vez, es la correlación entre las puntuaciones empíricas y las pun-
tuaciones verdaderas:
Conocer directamente cuál es la fiabilidad absoluta de un test es imposible, pues-

to que no puede saberse qué parte de las puntuaciones obtenidas es verdadera. Sin
embargo, sí puede averiguarse qué parte de la varianza total o empírica es errónea y,
consecuentemente, la raíz cuadrada de esta varianza errónea. A esta última se le de-
nomina error típico de medida. Por tanto, la fiabilidad absoluta de un test viene de-
terminada por el error típico de medida y, por consiguiente, conocer cuál es su valor
ha de ser una prioridad básica cuando se decide trabajar con un test. Entonces, puede
afirmarse que cuando se estudia la fiabilidad absoluta de un test se está intentando
averiguar cuál es el error típico de medida que se comete con él.
La fiabilidad relativa hace referencia a la correlación del test consigo mismo (7, .).
La fiabilidad absoluta, que viene expresada también por esta correlación del test
consigo mismo, se define por la proporción de varianza empírica explicada por la va-
rianza verdadera. Por tanto, puede afirmarse que la fiabilidad absoluta de un test es
una, mientras que la fiabilidad relativa puede variar de muestra a muestra y de mo-
mento a momento de aplicación. A la correlación del test consigo mismo se le deno-
mina coeficiente de fiabilidad; este coeficiente es igual al índice de fiabilidad elevado
al cuadrado:
112. El error típico de medida

Como ya se ha indicado, el error típico de medida es la raíz cuadrada de la varianza
de error; por su parte, la varianza de error es igual a la varianza empírica menos la va-
rianza verdadera:
A)
Es decir, que la varianza empírica o total se descompone en una parte verdadera

y en otra errónea:
S=82+8
Por consiguiente, laproporción de la varianza empírica explicada por la varianza

verdadera más la explicada por la varianza errónea es igual a la unidad:
Sev mEQUA
2 6 2 31
Xx 26:
Ya se ha apuntado que la proporción de varianza empírica explicada por la va-

rianza verdadera es la correlación del test consigo mismo:
$?
7) 206
ES
Por tanto, el error típico de medida (S,) sería el siguiente:

2
xx
- 37 = 1, por lo que
Sr +S=8S
pS e
2
Es
SIS,
S=S (L>r_.),
$.35 Vir,
13. La fiabilidad de un estadístico y la fiabilidad de las diferencias

El error típico de medida, que es la desviación típica de una distribución muestral,
permite saber entre qué valores se encuentra un estadístico referido a la población,
llamado parámetro, que es la puntuación verdadera, así como si las diferencias inter
o intraindividuales son significativas.
113.1. La fiabilidad de un estadístico
Para saber entre qué valores se encuentra el parámetro o estadístico referido a la po-
blación, es decir, la fiabilidad de un estadístico, es fundamental averiguar el error
muestral máximo, que es igual a la zeta crítica (Z,) multiplicada por el error típico.
La Z_ viene determinada por el nivel de confianza con el que se decide trabajar. Los
límites entre los que se encontrará el parámetro se obtienen sumando y restando el
error muestral máximo al estadístico en cuestión.
Veamos un ejemplo:
Se ha aplicado un test a una muestra de sujetos. Según los resultados encontra-

182 Mariano Álvaro
dos, la media ha tenido un valor de 18 (X= 18), la desviación típica de 5 (S, =5) y el
coeficiente de fiabilidad de 0,90 (7, =0,90). Nos interesa saber entre qué límites esta-
ría el verdadero parámetro de la población, teniendo en cuenta que se decide trabajar
al nivel de confianza del 5% (NC =5%).
1.2 Se mira el valor de la Z_: NC=5% => Z,= 1,96. La Z, se obtiene a través de
las tablas de la curva normal.
2.2 Se obtiene el error típico (S,):
S,=S, 1-r,:5,=5 10,90

S,=5 0,10=5x0,316=
1,58
3.2 Se halla el error muestral máximo (E):
E=58,xZ,;E=1,58 x 1,96 =3,10
4.2 Se obtiene el intervalo confidencial (1C):
IC=X+E
IC =18 +3,10=21,10 y 14,90
Por tanto, puede afirmarse a un nivel de confianza del 5% (es decir, teniendo un
95% de probabilidades de acertar) que la media de la población está entre 14,90 y
21,10:
113.2. Fiabilidad de las diferencias
En este caso, la estrategia consiste en averiguar la razón crítica, que es igual al estadís-
tico en cuestión dividido por el error típico. García-Cueto (1993) distingue entre las
diferencias interindividuales, las diferencias intraindividuales y las diferencias entre
puntuaciones. El procedimiento para estudiar unas y otras es el mismo; la única dife-
rencia estriba en la forma de estimar el error típico en cada caso.
Diferencias interindividuales
El error típico (S,,) se obtiene con la aplicación de la siguiente fórmula:
e x
Lia xx
Siguiendo con el ejemplo anterior, queremos saber si existen diferencias signifi-

cativas entre dos sujetos; uno ha obtenido una puntuación de 19 (X ¿=19) y el otro
una puntuación de 14 (X, = 14).
12 NC=5%>Z =1,9
SS 10,90 0,10 2=5x0,31x1,41
=2,23
183
3.2 Razón crítica:
4.2 Juicio de significación:
2,24 > 1,96, por tanto las diferencias son significativas al nivel de confianza del 5%.
En todos los demás casos considerados a continuación, el procedimiento utiliza-

do para estudiar la significación estadística entre puntuaciones es exactamente igual
que el recién comentado, variando únicamente, como ya se ha indicado, la forma de
obtener el correspondiente error típico. Por ello, y con el ánimo de evitar la reitera-
ción, en las líneas siguientes solamente se exponen las fórmulas.
Diferencias intraindividuales
Cuando se hace referencia a las puntuaciones de un mismo sujeto, en un mismo test,

aplicado en dos momentos diferentes, la fórmula para obtener el error típico es exac-
tamente la misma que en el caso anterior, ya que antes se estudiaban las diferencias
entre las puntuaciones de dos personas y ahora se establecen las diferencias entre las
puntuaciones de un mismo sujeto.
Cuando se hace referencia a las puntuaciones de un mismo sujeto en tests dife-
rentes la fórmula sería:
SS IS O
teniendo en cuenta que 57 x $ = S?, donde $? sería la varianza de las puntuaciones

empíricas, considerando conjuntamente los dos tests, suponiendo que ambos estén
en la misma escala de medida, tendremos que:
SF (2 t 1 0)
S¿=5, x V A
Diferencias entre puntuaciones de grupos
En este caso, no se comparan puntuaciones individuales sino de grupos o muestras,

es decir, estadísticos, como la media, que hacen referencia al conjunto de sujetos que
los constituyen. Las diferencias estudiadas no son entre XA, y X,, sino entre (X, y X,).
Por tanto, la razón crítica (R,) será igual a:
O
des
d
184 Mariano Álvaro
Cuando los grupos o muestras son independientes, la fórmula es:

22:02 2
Sa Y Se + Sea
Cuando los grupos o muestras están “relacionadas” ! sería:
S; 3 Si, + da =2 Y, So Sa
14. Estimación del coeficiente de fiabilidad: fuentes de error, métodos

y fórmulas
Tradicionalmente, en la bibliografía se habla únicamente de tres métodos para esti-
mar los coeficientes de fiabilidad (García-Cueto, 1993). Sin embargo, como puede
apreciarse en las siguientes líneas, existen más, y el empleo de un método u otro, así
como de las correspondientes fórmulas estadísticas, depende de las tres fuentes de
error que pueden existir.
11.4.1. Selección de una muestra de preguntas

Cuando se aplica un test, se suele utilizar un grupo de preguntas o ítems que preten-
den ser una muestra representativa del rasgo, habilidad, área de conocimiento, etc.,
que se intenta evaluar. Al elegir o seleccionar los ítems que componen el test, se está
cometiendo un error de medida que puede ser grande, mediano o pequeño, pero tie-
ne un valor. El tamaño del mismo se estudia a través de tres métodos diferentes.
Uso de formas paralelas
Consiste en aplicar a los mismos sujetos dos versiones diferentes, aunque equivalen-
tes, del mismo test, llamadas formas paralelas. Después de aplicadas, se dispone de
dos grupos de puntuaciones referidas al mismo grupo de individuos. Para estimar el
coeficiente de fiabilidad en este caso, se aplica la fórmula de la correlación de Pearson:
_ XX, -X)(Y,-Y)
o NSS, ;
en donde X, X y $, son las puntuaciones directas, la media y la desviación típica, res-
pectivamente, que corresponden a una de las formas paralelas del test; Y, Y y $ son
las puntuaciones directas, la media y la desviación típica de la otra forma del test, y N
hace referencia al número de sujetos a los que se les ha aplicado el test.
* Se considera que dos grupos o muestras están “relacionadas” cuando: a. A una misma muestra se le
aplica el mismo test en dos momentos diferentes; b. Las dos muestras se han confeccionado de tal forma
que a un sujeto de una muestra le corresponde otra con las mismas características en la otra muestra.
185
Método de las dos mitades
Se divide el test en dos mitades diferentes, pero equivalentes, para posteriormente

hallar la correlación entre ambas. Ahora bien, dado que si se halla la correlación en-
tre dos mitades de un test, los resultados obtenidos hacen referencia a un test con la
mitad de longitud que el original, después de conocer la correlación entre una y otra
mitad, es necesario aplicar las fórmulas que se presentan a continuación para obtener
el coeficiente de fiabilidad de todo el test:
a. Spearman-Brown
kr 0
da Y AáAN<A<>
>>
2 1+(kD)r,”
en donde k es el número de veces que aumenta la longitud del test y 7, es el coeficien-

te de correlación original obtenido al aplicar la fórmula de Pearson. En el caso del
método de las dos mitades, la fórmula de Spearman-Brown quedaría así:
as 2r 0
e
SB >
de
siendo “r,” la correlación de Pearson entre las dos mitades del test.
La primera de estas dos fórmulas de Spearman-Brown fue propuesta para estu-
diar cuál es el coeficiente de fiabilidad de un test cuando aumenta o disminuye su
longitud, es decir, su número de ítems. Por consiguiente, no sólo es aplicable al caso
del método de las dos mitades.
b. Guttman
en donde $? es la varianza de una mitad, $? es la varianza de la otra y Ses la varianza

de todo el test.
Esta fórmula de Guttman, así como la de Spearman-Brown, establece la correla-
ción existente entre solamente dos mitades, aunque el número de posibles mitades
de un test es muy grande y, además, conseguir dos mitades que sean exactamente
iguales es muy difícil. Por ello, es recomendable utilizar uno de los índices de consis-
tencia interna que se presentan a continuacion.
Consistencia interna
El tercer método utilizado para estudiar la fiabilidad, cuando la fuente de error de

medida estriba en la selección de preguntas, se denomina método de consistenc ia in-
186 Mariano Álvaro
terna, aunque también puede considerarse como tal el método de las dos mitades.
Con él se analizan los datos de todos y cada uno de los ítems, asumiendo que todas
las preguntas del test evalúan el mismo rasgo. Por tanto, puede afirmarse que, mien-
tras que los métodos y fórmulas anteriores establecen la correlación entre dos mita-
des de un único test, el de consistencia interna y las correspondientes fórmulas, que
se presentan a continuación, tienen en cuenta todas las posibles mitades que pudie-
ran construirse con el grupo de ítems en cuestión. En este caso se analizan los datos
de cada ítem respecto a los del total del test.
Los coeficientes de fiabilidad denominados por antonomasia de consistencia in-
terna son los siguientes:
a. Coeficiente alfa de Cronbach. Respecto a los coeficientes de Spearman-

Brown y Guttman, tiene la ventaja de que implícitamente averigua la media de los
coeficientes de fiabilidad de todas las posibles combinaciones de mitades, no sola-
mente de una:
tf
e
N-1 San
en donde N es el número de ítems del test, S?es la varianza de las puntuaciones de
cada ítem y $?es la varianza de todo el test.
Analizando la fórmula, puede observarse que si las preguntas o ítems individua-
les no están correlacionados con los demás, el coeficiente alfa será cero. A mayor in-
tercorrelación entre las preguntas, mayor coeficiente alfa. De ahí que este coeficiente
sea considerado como un índice de consistencia interna.
b. Kuder-Richardson 20. Este coeficiente es equivalente al de Cronbach, pero

se usa cuando las preguntas del test se han puntuado de manera binaria, es decir, con
1 si el ítem es respondido correctamente y con 0 si se ha contestado incorrectamente.
N
YUIAPAO] HR q ee Bi a
NA $?
en donde p,es la proporción de sujetos que responde correctamente una pregunta o
ítem. E
c. Kuder-Richardson 21. Se utiliza en lugar de la fórmula anterior cuando la

proporción de respuestas correctas no varía mucho de un ítem a otro, por lo que en
este caso es apropiado utilizar la proporción media.
(EdesaN yLU
Np (1- y
N-1 S
en donde p es la proporción media de respuestas correctas para todos los ítems del
test.
114.2. Momento de aplicación

La segunda fuente de error en la medida puede ser el momento de aplicación del test.
Para determinar el tamaño del error en este caso, debe aplicarse un test a la misma
muestra más de una vez, de ahí el nombre de test-retest con el que se denomina a este
método. El grado de acuerdo entre las diferentes medidas a lo largo del tiempo es un
índice de la fiabilidad del test, entendida ésta como la constancia, la estabilidad en la
medida.
La fórmula más usada en este caso ha sido la correlación de Pearson, que no tiene
en cuenta la variación sistemática entre dos momentos diferentes de aplicación. Por
ello, es recomendable utilizar la que se presenta a continuación, que está basada en el
modelo de análisis de varianza:
de SE?
Via 2 >
SE2+ SW. +SP
en donde SE? es la varianza debida a las diferencias entre sujetos, SV? es la varianza
debida a los distintos momentos de aplicación y S1? es la varianza debida a la interac-
ción entre sujetos y momentos de aplicación.
114.3. Persona que otorga las puntuaciones
Por último, una tercera fuente de error puede ser la persona o juez que otorga las
puntuaciones. Esta fuente es propia de las preguntas que se plantean de manera
abierta, es decir, de manera que los sujetos no tienen que elegir una respuesta entre
varias, sino que tienen que escribir su respuesta completa. En este caso, es conve-
niente hacer una distinción entre la puntuación de las respuestas con una escala de
intervalos o continua y la clasificación de los sujetos en aptos y no aptos.
Fiabilidad de los tests cuya calificación resulta ser una variable continua
En este caso, la forma más habitual de hallar la fiabilidad consiste en estimar la corre-
lación de Pearson entre las puntuaciones otorgadas por dos jueces para, posterior-
mente, aplicar la fórmula de Spearman-Brown, con el fin de conocer la fiabilidad de
toda la prueba, de forma que la k será igual al número de jueces que califica a cada su-
jeto.
Igual que ocurría con el método test-retest, la fórmula de Pearson no tiene en
cuenta la variación sistemática entre jueces, que en aquel caso era entre momentos.
Por consiguiente, es recomendable utilizar la fórmula basada en el modelo de va-
rianza:
PL SE?
ASELESPASP.
188 Mariano Álvaro
en donde SE? es la varianza debida a las diferencias entre sujetos, $]? la debida a las
diferencias de puntuación entre jueces y 5? la debida a la interacción entre sujetos y
jueces.
Fiabilidad de las clasificaciones de sujetos en aptos y no aptos
En esta ocasión se hace referencia a la fiabilidad obtenida cuando se selecciona a un

grupo de sujetos, en cuyo procedimiento cada individuo aspirante a ser seleccionado
es catalogado como “apto” o “no apto”. Pueden darse dos circunstancias diferentes:
que los sujetos sean evaluados en dos momentos diferentes, en cuyo caso la fiabili-
dad obtenida haría referencia a la coincidencia de clasificaciones en los dos momen-
tos, y que los sujetos sean evaluados en un único momento por dos jueces diferentes;
en esta última circunstancia, la fiabilidad haría referencia a la coincidencia entre las
clasificaciones de los dos jueces.
Las dos fórmulas utilizadas para estudiar la fiabilidad de las clasificaciones
—tanto entre momentos como entre jueces— parten de la siguiente tabla:
En esta tabla, A, hace referencia a los sujetos clasificados como aptos por el juez
1 o en el momento 1, A, a los sujetos clasificados como aptos por el juez 2 o en el
momento 2, N, alos sujetos clasificados como no aptos por el juez 1 o en el momen-
to 1, y N, a los sujetos catalogados como no aptos por el juez 2 o en el momento 2.
El índice de fiabilidad más simple es el siguiente:
a+d
ES a+b+c+d”
en donde a y d comprenden a los sujetos que son clasificados de la misma forma por
ambos jueces o en los dos momentos, y b y c, por contra, incluyen a los individuos
respecto a los cuales no hay coincidencia en la clasificación entre un juez y otro o en-
tre un momento y otro.
Esta fórmula no tiene en cuenta los efectos aleatorios en el grado de coinciden-
cia, por lo que es preferible utilizar el coeficiente Kappa (k) de Cohen:
=
k=
mera
Po
donde
usimarid
Pa a+b+c+d
eE ar*c 0 a+b da b+d od

É a+b+c+d a+b+c+d a+b+c+rd a+b+c+d
A modo de conclusión acerca de la fiabilidad de los tests pueden hacerse las si-
guientes reflexiones:
a. El coeficiente de fiabilidad depende de la varianza de las puntuaciones, de

forma que a mayor heterogeneidad del grupo de sujetos respecto al rasgo evaluado
menor fiabilidad. Si el grupo es muy homogéneo, cualquier mínimo cambio afecta al
orden de los sujetos dentro del grupo y, por consiguiente, a su fiabilidad. Por otra
parte, si estos sujetos son idénticos respecto al rasgo evaluado, las diferencias encon-
tradas serán debidas a errores de medida y, por lo tanto, la varianza de error será un
alto porcentaje de la varianza total, lo que indica que la fiabilidad (porcentaje de va-
rianza empírica o total explicado por la varianza verdadera) será baja.
b. Un test puede ser fiable en un nivel del rasgo evaluado y no en otro, pues
puede suceder que los sujetos del primer cuartil sean más homogéneos que los del
cuartil tercero; por consiguiente, siguiendo con el argumento anterior, la fiabilidad
sería menor en el primero de estos grupos que en el segundo.
c. La fiabilidad de un test puede variar de una muestra a otra y de un momento
de aplicación a otro. Como se ha expuesto con anterioridad, la fiabilidad de un test
hace referencia a la correlación del test consigo mismo. Esta correlación depende de
la varianza empírica, que puede variar de una muestra a otra y de un momento de
aplicación a otro.
d. El coeficiente de fiabilidad varía con el método usado, de forma que el que
suele producir un valor mayor es el de las dos mitades, seguido por el test-retest, el
de las formas paralelas y, por último, uno que combinara las dos anteriores: correla-
ción entre formas paralelas aplicadas después de transcurrido cierto tiempo.
II. LA VALIDEZ DE UN TEST
En este epígrafe se explica, en primer lugar, el concepto de validez y a continuación

se comentan los diferentes tipos de validez utilizados.
us. Concepto de validez

La validez hace referencia a la correlación del test con un criterio externo, que puede
ser otro test, unas puntuaciones predichas, etc. Este criterio externo indica si el test
es válido para los fines propuestos. Puede hablarse de una validez ontológica, según
la cual un test es válido si evalúa adecuadamente el rasgo que pretende evaluar, y de
190 Mariano Álvaro
una validez funcional, en cuyo caso se dice que un test es válido si cumple de manera
adecuada los fines para los que ha sido diseñado y construido. Si se ha confeccionado
un test para seleccionar a un grupo de sujetos que deberán desempeñar determinadas
tareas, el test será válido si efectivamente los individuos seleccionados obtienen un
alto nivel de rendimiento en el desempeño de las tareas encomendadas.
Henerson (1987) resalta dos facetas en la validez de un test; una descriptiva, que
indica cuál es el nivel de posesión de un rasgo por parte de un sujeto, y otra predicti-
va que indica que a raíz de los resultados obtenidos con la aplicación de un test pue-
den predecirse otros de cara al futuro. Si los resultados predichos se confirman, se
está avalando la validez del test.
m2. Tipos de validez

A pesar de que son muchas las clases de validez mencionadas en la bibliografía, Mes-
sick (1989) afirma que todos los tipos considerados desde 1950 pueden reducirse a
tres: validez de contenido, validez referida a un criterio externo y validez de cons-
tructo.
112.1. Validez de contenido
Este tipo de validez se refiere a la relevancia del contenido del test, a la representati-
vidad de los ítems que lo componen, respecto a la totalidad del campo o rasgo objeto
de evaluación. Un test tendrá validez de contenido si el conjunto de preguntas en él
incluido constituye una muestra suficientemente extensa y representativa del rasgo
al que hacen referencia. No existe un índice de validez de contenido, pues éste viene
avalado por la forma o procedimiento utilizado para construir el test y por las perso-
nas que lo construyen, por su grado de conocimiento del área o rasgo evaluado.
Respecto al procedimiento a seguir para construir un test, cabe decir que el pri-
mer paso ha de consistir en una clara definición del universo a evaluar; sólo así podrá
obtenerse una muestra representativa del mismo. A continuación, deberían redac-
tarse las preguntas o ítems que formarán parte del test. La validación del ajuste entre
las preguntas que constituyen el test y el universo a que pertenecen se consigue me-
diante una validación experimental, que consiste en repetir el proceso de escribir
revisar las preguntas representativas con dos grupos de trabajo (Cronbach, 1971).
Por lo que respecta a la redacción de los ítems, es recomendable que en ella parti-
cipen distintos especialistas del área, dominio o rasgo que se pretende evaluar, ade-
más de un experto en psicometría.
112.2. Validez referida a un criterio externo
A la correlación existente entre un test y un criterio externo al mismo, como puede

ser otro test, se le denomina validez de criterio externo. A su vez puede ser de dos
clases:
a. Validez concurrente. Indica hasta qué punto las puntuaciones en un test co-
relacionan con una variable criterio, que generalmente es otro test que evalúa lo
mismo. En este caso sí existe un coeficiente de validez, que se obtiene averiguando la
correlación de Pearson entre las puntuaciones de ambos tests.
b. Validez predictiva. Indica hasta qué punto las puntuaciones en una variable
criterio futura se correlacionan con las puntuaciones predichas según los resultados
obtenidos en un test aplicado con anterioridad. Ahora, el índice de validez viene ex-
presado por la regresión de la puntuación predicha sobre la variable criterio.
1123. Validez de constructo
Un test tiene validez de constructo si evalúa realmente el rasgo que pretende evaluar.
Por tanto, coincide esta definición con la definición clásica de validez de un test. La
validez de constructo hace referencia al grado de concordancia entre los resultados
obtenidos al aplicar un test y los planteamientos o hipótesis teóricas existentes sobre
el campo o rasgo evaluado. Por consiguiente, la validez de constructo de un test pue-
de contrastarse mediante la confirmación o no de que determinada estructura sub-
yacente existe y mediante la confirmación o no de determinadas hipótesis. Por ejem-
plo, si se parte del supuesto de que el constructo “personalidad” se articula en dos o
tres factores, y después de aplicado un test y hacer un análisis factorial se confirma la
existencia de esos factores, puede afirmarse que el test de personalidad aplicado tiene
validez de constructo. Asimismo, si se han pronosticado ciertas diferencias significa-
tivas entre distintos grupos y con los resultados obtenidos se confirma la existencia
de tales diferencias, puede asegurarse que el test tiene validez de constructo. Real-
mente, la validez de constructo está implícita en cualquier aplicación que se haga de
un test, ya que siempre que se clasifican situaciones, personas o respuestas se hace
basándose en constructos que los datos empíricos han de confirmar.
A lo largo de la historia del desarrollo de los tests, la validez más utilizada ha sido
la de criterio externo, debido a que los tests se han usado prioritariamente para estu-
diar las aptitudes mentales y la personalidad. Sin embargo, desde que se comenzaron
a emplear para evaluar el rendimiento académico, la situación ha cambiado radical-
mente, siendo recomendable, en este caso, hacer uso de la validez de contenido y de
la validez de constructo. Para evaluar las aptitudes mentales y los rasgos de persona-
lidad se disponía de tests suficientemente contrastados, que servían de criterio exter-
no de comparación. En cambio, es difícil encontrar pruebas de rendimiento genera-
lizables en el tiempo y en el espacio, teniendo en cuenta la concepción dinámica de
los currícula que impera en la actualidad. La idea de un currículo abierto, que se
adapta a las circunstancias contextuales, está muy extendida, por lo que los tests de
rendimiento necesitan renovarse continuamente. En consecuencia, no es aconsejable
utilizar un test anterior como criterio respecto al cual se compara el “test del mo-
”
mento .
192 Mariano Álvaro
Álvaro, M. (1993). Elementos de psicometría. Madrid. Eudema.

Cronbach, L. J. (1971). Test ita En R. L. Thorndike (dir.), Educational measurement.
Washington, D.C. American Council on Education.
Feldt, L. S. y Brennan, R. L. (1989). Reliability. En R. L. Linn (dir.), Educational measure-
ment. Nueva York. American Council on Education and Memillan Publishing Com-
any.
cias E. (1993). Introducción a la psicometría. Madrid. Siglo XXI.
Henerson, M. (1987). How to measure attitudes. Los Angeles. Sage Publications.
Messick, S. (1989). Validity. En R. L. Linn (dir.), Educational measurement. Nueva York.
American Council on Education y McMillan Publishing Company.
Wood, R. (1990). Item analysis. En H. J. Warberg y G. D. Haertel (dirs.), The international
encyclopedia of educational evaluation. Nueva York. Pergamon Press.
Álvaro, M. (1993). Elementos de psicometría. Madrid. Eudema.

Butcher, J. N. (dir.) (1995). Methodological issues in psychological assessment research [nú-
mero especial]. Psychological Assessment, 7 (3).
García-Cueto, E. (1993). Introducción a la psicometría. Madrid. Siglo XXT.
Messick, S. (1995). Validity of psychological assessment. American Psychologist, 50, 741-749.
Muñiz,J.(1992). Teoría clásica de los tests. Madrid. Pirámide.
ETA V. (1988). Del psicodiagnóstico clásico al análisis ecopsicológico (vol. 2). Valencia.
aplús.
Silva, F. (1989). Evaluación conductual y principios psicométricos. Madrid. Pirámide.
8... MEDIDAS ESCALARES
Lurz PASQUALI y J. CARLOS SIERRA
Il. INTRODUCCIÓN
Las medidas escalares en psicología se sitúan dentro de un enfoque epistemológico

defendido por la psicometría. Como todo enfoque epistemológico, la psicometría
suscita muchas controversias, cuya solución es una cuestión de consenso en torno a
ciertos principios básicos. Sólo tiene sentido hablar de escalas o de medida general en
psicología si se aceptan los principios de la psicometría. Para enfocar mejor el pro-
blema de las medidas escalares se deben aclarar algunos conceptos, tales como siste-
ma, propiedad y magnitud.
Lt. Concepto de sistema

Un sistema es un todo organizado, real o imaginado. Así, existen sistemas físicos
(entidades físicas definidas en términos de átomos u otras entidades defendidas por
las teorías físicas), sistemas biológicos, sistemas sociales, sistemas psicológicos, etc.
Un sistema es un objeto específico de estudio de cada ciencia. La definición de siste-
ma es una de las cuestiones fundamentales de cualquier enfoque epistemológico y,
por tanto, una de las más controvertidas. Es preciso enfatizar que el objeto del que
hablamos es un ente creado en el mundo del discurso. El sistema u objeto psicológi-
co del que habla la psicometría está constituido por el comportamiento de los orga-
nismos. Los procesos mentales están incluidos en esta concepción dado que repre-
sentan constructos elaborados a partir de la conducta observable. Esta afirmación se
fundamenta en otra suposición epistemológica que hace de la observación el método
específico de la ciencia —entendida aquí como ciencia empírica. La observación tie-
ne que ser concebida a partir de los sentidos, razón por la que los procesos mentales
en sí no pueden ser construidos como objeto de observación, siendo, por tanto, infe-
renciales, estructuras latentes. Para la psicometría, es esta estructura latente la que
constituye el sistema psicológico. Esta digresión sobre epistemología es relevante
para evitar que el problema de la medida y de las escalas se reduzca a una cuestión de
estadística; la medida es ante todo una cuestión epistemológica.
12. Concepto de propiedad

De modo similar a como el sentido común concibe los objetos a través de sus carac-
terísticas (peso, tamaño, color...), un sistema es concebido a través de sus propieda-
Universidad de Brasilia (Brasil) y Universidad de Granada.

194 Luiz Pasquali y J. Carlos Sierra
des, dimensiones o atributos. La determinación de estas propiedades en un sistema

físico newtoniano no parece suscitar mayores dificultades; éstas surgen en el caso de
las propiedades de un sistema psicológico o de la estructura psicológica latente, dada la
falta de equivalencia inmediata del método (observación) con la calidad latente de
la estructura psicológica, que solamente se manifiesta a través del comportamiento
observable.
13. Concepto de magnitud

La psicometría asume que las propiedades presentan magnitud, lo cual la distingue de
otros enfoques psicológicos. Las propiedades psicológicas pueden ser simplemente
descritas; la psicometría considera que son medibles siguiendo la afirmación de
Thorndike de que todo lo que existe lo hace en alguna proporción. Esto quiere decir
que las propiedades pueden ser más o pueden ser menos. Así, al decir que alguienes
más inteligente que otro estamos estableciendo alguna diferencia entre ellos: uno tie-
ne más de la propiedad “inteligencia” que el otro. Si esto es así, estamos afirmando
que la propiedad “inteligencia” se presenta en grados o niveles de diferente magnitud.
IL. LA MEDIDA EN PSICOLOGÍA
1L1. Formas de medida
Dada la naturaleza de una propiedad psicológica, su medida debe ser diferente de la

medida de una propiedad física. "Tal vez la distinción hecha por Campbell (1938)
ayude a esclarecer este punto. Este autor distingue tres formas de medida:
a. Medida fundamental (para magnitudes de tipo A). Es aquélla en que el pro-

pio instrumento ya posee la propiedad idéntica a la propiedad del sistema que va a
medir; un ejemplo lo constituyen las propiedades físicas extensivas (tamaño, peso...).
En este caso medir consiste simplemente en ajustar la propiedad del instrumento de
medida sobre la propiedad idéntica de lo medido (coincidencia de puntos).
b. Medida derivada (para magnitudes de tipo B). Es la medida que resulta de la
relación entre medidas fundamentales, como es el caso de la velocidad: relación entre
la distancia recorrida (espacio) y el tiempo empleado (tiempo). Por tanto, la medida
derivada es reducible, en último término, a medida fundamental.
c. Medida per fiat. Esta medida no es ni derivada ni reducible a medidas funda-
mentales, y parte de un doble supuesto. En primer lugar, al medir la propiedad de un
sistema estamos analógicamente midiendo la propiedad de otro sistema; esto es, al
medir la propiedad de un sistema comportamental estamos midiendo la propiedad
de una estructura psicológica latente; la analogía en cuestión debe ser fundamentada
a través de la teoría. En segundo lugar, al exigir de un sujeto una reacción a expresio-
nes como “mucho”, “poco” o similares estamos recogiendo información sobre la
magnitud de una propiedad a la que estas expresiones están siendo relacionadas.
Medidas escalares
195
- Así, sten las medidas físicas el mayor problema consiste en la precisión de la me-
dida en términos de coincidencia de puntos, en la medida psicológica la cuestión más
delicada parece ser la de la teoría que fundamenta la legitimidad de la operación.
12. Fundamentación y niveles de medida

La definición clásica de medir es distribuir números a las propiedades de las cosas se-
gún ciertas reglas. Esta aserción implica la existencia de un isomorfismo riguroso (no
solamente analógico) entre las propiedades del número —que pertenece al sistema
matemático— y las propiedades de las cosas —que pertenecen al sistema de la cien-
cia empírica—. Como consecuencia, medir en psicología consiste en atribuir núme-
ros a las propiedades psicológicas. Esto es posible, puesto que como se dijo anterior-
mente, las propiedades psicológicas poseen magnitud.
Entre las propiedades del número que tienen correspondencia isomórfica con las
propiedades de las cosas se citan tres: orden, distancia y origen. El número tiene un
origen natural, absoluto: el cero; tiene orden, puesto que tres es mayor que dos, el
cual es mayor que uno; y, por último, el número tiene distancia, porque entre uno y
dos existe el mismo intervalo que entre dos y tres. La medida debe presentar isomor-
fismo, al menos, en una de estas propiedades del número; no habiendo ningún iso-
morfismo, el uso del número no constituye una medida, utilizándose apenas como
rótulo. Dependiendo del número de isomorfismos entre el número y la medida sur-
gen los diferentes niveles de medición o escalas de medida. Si no hay ningún isomor-
fismo se habla de escala nominal que, como decíamos, no es medida sino clasifica-
ción, dado que los números pueden ser invertidos o sustituidos por cualquier otro
trazo (siempre y cuando los trazos sean diferentes entre sí) sin ninguna consecuencia
para la medida. La diferencia entre usar trazos y números en este caso consiste en el
hecho de que la utilización del número permite el empleo de ciertas operaciones es-
tadísticas basadas en el axioma de identidad, tales como el chi cuadrado para frecuen-
cias. Si hay isomorfismo de orden, sea creciente o decrecente, en el que al aumento o
disminución del número corresponde un aumento o disminución en la magnitudde
la propiedad medida, se habla de escala ordinal. Si, más allá del orden, la medida
mantiene isomorfismo de intervalo, estamos utilizando una escala de intervalo; y,
por último, si, más allá del orden y del intervalo, existiera isomorfismo de punto de
origen —esto es, origen natural—, la medida está hecha en escala de razón. Estas es-
calas de medida tienen consecuencias importantes para el tratamiento estadístico de
los datos. El gran sueño de los psicometristas es medir al nivel de escala de intervalo,
A pesar de la oposición de algunos psicólogos (Siegel, 1956), la gran mayoría admite
que la medida de intervalo no solamente es posible, sino que es común en psicología.
13. Parámetros de la medida

Se habla de parámetros de medida al referirse a ciertos requisitos necesarios que ésta
debe presentar para constituir un procedimiento válido y adecuado. Una escala está
normalmente constituida por una serie de indicadores o cuestiones, los cuales deben
presentar ciertos parámetros psicométricos, tanto las cuestiones de una forma indi-
vidual como la escala en su conjunto. elo
Las cuestiones o preguntas deben poseer al menos cuatro parámetros: unidi-
mensionalidad, dificultad, discriminabilidad y control del azar (respuesta aleatoria).
La técnica más moderna de verificación de los tres últimos parámetros es la curva ca-
racterística del ítem dentro de los modelos de la teoría de la respuesta al ítem. La uni-
dimensionalidad de la cuestión es supuesta por esta teoría y es determinada por el
análisis de la estructura de toda la escala a través del análisis factorial.
La teoría de la respuesta al ítem (Lord, 1980) (véase en este mismo manual el ca-
pítulo de García-Cueto) parte del supuesto de que el desempeño en la pregunta está
relacionado con la propiedad psicológica o “trazo latente” que el sujeto presenta, es
decir, con un nivel de magnitud que el sujeto posee de esta propiedad. La determina-
ción de los parámetros de las cuestiones a través de la teoría de la respuesta al ítem si-
gue sofisticados procedimientos estadísticos. Existen varios modelos de esta teoría:
modelo logístico de un parámetro (Rasch, 1960) que evalúa solamente la dificultad
de las preguntas, asumiendo igual nivel de discriminación para todas las cuestiones y
la ausencia de respuestas al azar; modelo logístico de dos parámetros (Birnbaum,
1968) para evaluar la dificultad y la discriminabilidad de las cuestiones; modelo lo-
gístico de tres parámetros (Lord, 1980) para evaluar la dificultad, la discriminabili-
dad y la respuesta al azar que sustituye al modelo de ogiva normal (Lord, 1952). A
pesar de que estos modelos han sido desarrollados para el análisis de las cuestiones
en escalas de aptitudes dicotómicas, dado que existen solamente respuestas ciertas o
erróneas, se están también empezando a utilizar en escalas politómicas (Molenaar y
Sijtsma, 1988), existiendo inclusive programas de ordenador para análisis de escalas
politómicas para datos no paramétricos (Debets y cols., 1989). Los diferentes mode-
los, a pesar de partir de presupuestos diferentes, dan lugar básicamente a los mismos
resultados (Albanese y Forsyth, 1984).
Una escala constituye un instrumento psicológico que pretende evaluar un
constructo o “trazo latente” —propiedad psicológica— de una forma unívoca, ade-
cuada y constante. Así, dado que el constructo psicológico es concebido como un
continuo que presenta una cantidad con magnitudes desde cero (arbitrario) a un má-
ximo, la escala debe cumplir los siguientes requisitos: evaluar este constructo y no
otra cosa, referirse únicamente a ese constructo en todas sus cuestiones (unidimen-
sionalidad), las cuestiones de la escala deben cubrir toda la extensión del continuo de
una manera equilibrada y, por último, dar lugar a los mismos resultados en diferen-
tes evaluaciones de los mismos sujetos.
El primer requisito se refiere al concepto de validez de la escala. El criterio más
importante de validez es aquel que garantiza que de hecho la escala está midiendo el
constructo para el cual fue creada; ésta es la validez de constructo. Así, si se constru-
ye una escala para evaluar un constructo psicológico sin una teoría sólida previa de
este constructo, dificilmente llegaremos a resultados satisfactorios. El análisis facto-
rial es una de las técnicas más utilizadas para establecer la validez de constructo de
una escala, aunque una validación de hipótesis es de hecho más decisiva. Ésta consis-
te en determinar si la escala es capaz de discriminar grupos-criterio definidos exclu-
sivamente en términos de la magnitud del constructo en cuestión (por ejemplo, gru-
po de mínima aptitud y grupo de máxima aptitud). El problema de esta técnica es la
Medidas escalares
197
dificultad para establecer grupos criterio de forma válida e independiente de la pro-

pia escala, así como la dificultad para determinar si los grupos difieren única y exclu-
sivamente con respecto al constructo de interés para de este modo tomar decisiones
Iinequívocas sobre los resultados. Estos procedimientos son igualmente utilizados
para verificar la unidimensionalidad de la escala. Aunque una escala puede medir
más de un constructo (escalas multidimensionales) se suele hablar en estos casos de
batería de escalas, evaluando cada una de ellas de forma unidimensional uno de los
constructos, dando lugar a un perfil de evaluación en vez de a una evaluación pun-
tual del sujeto. Además, la escala debe constituir una medida adecuada de toda la ex-
tensión del continuo del constructo, implicando que existen cuestiones capaces de
discriminar no sólo los sujetos “débiles” de los “fuertes” en el constructo, sino tam-
bién entre los más o menos “débiles” y entre los más o menos “fuertes”. La falta de
este aspecto hace que la escala disminuya o pierda su validez.
Finalmente, la escala debe presentar fiabilidad o precisión, esto es, que en ocasio-
nes diferentes dé lugar a los mismos resultados. Este parámetro se evalúa a través de
diferentes técnicas, entre las que destaca la de test-retest: evaluando a los mismos su-
e en ocasiones temporales diferentes los resultados se deben distribuir de forma
similar.
TI. TÉCNICAS DE CONSTRUCCIÓN DE ESCALAS
Las medidas escalares, tal como son aquí concebidas, se confunden con el propio
concepto de psicometría: toda medida que resulta de una escala de números es una
medida escalar. Este concepto incluiría desde la psicofísica hasta los tests psicológi-
cos. Esta concepción probablemente deba ser mantenida, aunque las escalas hayan
surgido dentro de la evaluación de constructos de la psicología social y de la perso-
nalidad. Una distinción que aún parece tener sentido es la que se hace entre la escala
psicofísica y la escala psicométrica. La escala psicofísica tiene como objetivo escalo-
nar estímulos físicos a través de la medida fundamental, correspondiéndose con la
escala psicológica de intervalos (escala de respuesta), estando las dos relacionadas
por alguna ley psicofísica. La escala psicométrica propone escalonar estímulos que
expresan un constructo psicológico; el concepto de escala se usa más comúnmente
para referirnos a este segundo concepto. Sin embargo, estas distinciones se hacen
muy tenues, porque al final siempre se ordenan estímulos (cuestiones) observables.
ms. Escalas psicofísicas

Estas escalas verifican o describen la correlación que existe entre estímulos físicos
(sonido, peso, tamaño...) y la respuesta del sujeto; más concretamente, tratan de des-
cribir cuál es el mínimo valor del estímulo que es capaz de producir una respuesta en
el organismo (umbral absoluto) y cuál el mínimo incremento necesario en el estímu-
lo para producir en el organismo una respuesta diferente a E anterior (umbral dife-
rencial). La determinación del umbral absoluto se hace en términos del 50% de per-
cepción de un estímulo dado: el nivel de estímulo que es percibido un 50% de las ve-
ces es considerado el umbral absoluto o nivel cero (cero inicial) de la escala de res-
puesta. Para determinar los umbrales diferenciales surgieron varias leyes en la histo-
ria de la psicología. :
Al presentar los diferentes tipos de escalas de tipo psicométrico debemos tener
en cuenta los procedimientos teóricos, los procedimientos empíricos o experimenta-
les y los procedimientos analíticos, los cuales discriminarán diferentes tipos de esca-
las psicológicas.
m.2. Elenfoque de Thurstone

Thurstone (19274) introdujo el concepto de continuo psicológico en oposición al
continuo físico de la psicofísica. La diferencia se puede comprender en el ejemplo
siguiente: supongamos que tenemos diez objetos de igual tamaño pero con pesos
diferentes; estos objetos se pueden ordenar por el peso de dos formas. Primero,
podemos usar una balanza y ordenar los objetos por su peso real, dando lugar a
un continuo físico —a través de la medida fundamental—; una segunda posibili-
dad es pedir a un grupo de sujetos que, a falta de balanza, ordenen los objetos del
menos pesado al más pesado, constituyendo esta colocación un continuo psicoló-
gico de pesos. Esta ordenación psicológica puede ser hecha por los sujetos compa-
rando los diez objetos, dos a dos, hasta llegar al orden final. Basándose en este ra-
zonamiento, Thurstone (1927b, 1927c y 1927d) desarrolló la ley de la valoración
comparativa, que se puede considerar como la introducción de las escalas psicoló-
gicas (o métodos psicométricos en un sentido estricto) en oposición a los métodos
psicofísicos.
La ley de la valoración comparativa postula que al comparar dos estímulos ¿ y ¡
para decidir cuál de ellos es mayor, el sujeto tiene que hacer tres tipos de juicios. Pri-
mero debe evaluar el estímulo z, después el estímulo ; y, finalmente, la diferencia en-
tre 1 y j. Al evaluar los dos estímulos individualmente el sujeto realiza un proceso
discriminante, y al evaluar la diferencia entre los dos estímulos realiza una diferencia
discriminante. Sin embargo, al realizar los juicios en ocasiones diferentes, el mismo
sujeto no efectúa el mismo proceso discriminante, de forma que se produce una va-
riabilidad llamada dispersión discriminante en torno a un proceso discriminante
modal que se corresponde a la media de los diferentes procesos discriminantes refe-
rentes al estímulo. Así, para cada estímulo, sobre los que existe una serie de juicios
(muchos sujetos evaluando el mismo estímulo o el mismo sujeto evaluando un estí-
mulo en múltiples ocasiones), tenemos un proceso discriminante modal y una dis-
persión discriminante, esto es, la media y la desviación típica, dado que los procesos
discriminantes se distribuyen normalmente.
Una vez obtenidos los valores escalares de una gran serie de estímulos, se puede
construir una escala de intervalos seleccionando (cerca de veinte) los que se sitúan a
distancias iguales entre sí. Estos estímulos así escalonados constituyen la escala para
la medida de las actitudes. Basta pedir al sujeto que seleccione la cuestión (estímulo)
con el que está más de acuerdo, siendo el valor escalar de esta cuestión la medida de
la actitud del sujeto. O bien se pide al sujeto que escoja las tres cuestiones con las que
Medidas escalares
199
más concuerda, siendo la media de los valores escalares de estas tres cuestiones
la
medida de su actitud.
La construcción de escalas a partir de esta ley de Thurstone es extremadamente
laboriosa; en realidad, se convierte en una tarea casi imposible con un número eleva-
do de cuestiones, dado que la comparación de las preguntas dos a dos aumenta geo-
métricamente. Para diez estímulos tenemos 45 comparaciones [(10 x 9) / 2] y para
100 cuestiones tenemos 4 950 [(100 x 99) / 2]. Por ello, Thurstone desarrolló otras
técnicas de construcción de escalas de actitud; una de ellas es el método de los inter-
valos aparentemente iguales (Thurstone y Chave, 1929). En este caso, las afirmacio-
nes —cerca de cien— sobre un objeto de interés son impresas en tarjetas que los su-
jetos deben distribuir en once montones según el grado de favorabilidad que, en su
opinión, la afirmación presenta en relación al objeto psicológico. Los once monto-
nes son erigidos sobre un continuo de tarjetas etiquetadas de A a K, donde A está se-
ñalado con la expresión “desfavorable”, K con “favorable” y F (tarjeta situada en
medio de A y K) con “neutro”. El valor escalar de las cuestiones se hace a través del
cálculo de la mediana, teniendo como coeficiente de variabilidad el intervalo semiin-
tercuartílico.
Se propusieron diversas variantes de este método (Edwards y Kilpatrick, 1948;
Webb, 1951). El propio Thurstone presentó una variante denominada método de los
intervalos sucesivos.
m3. Elenfoque de Likert

La técnica de Likert (1932) tal vez sea la más utilizada en la construcción de escalas
psicométricas. En su base teórica, Likert considera que una actitud —propiedad psi-
cológica— constituye una disposición para la acción. Esta concepción presenta difi-
cultades para Likert, dado el enfoque conductista positivista de la época que conce-
bía la actitud como un simple sustituto verbal para una acción concreta. Thurstone
defendió la actitud como un elemento de la personalidad, concebido tal vez como un
constructo hipotético; asimismo defiende que existe una serie de tales constructos de
personalidad y no uno sólo. Likert ni se plantea la cuestión de la magnitud de las
propiedades psicológicas —concretamente de la actitud—, pues se trataba para él de
una cuestión ya lo suficientemente clara: las propiedades psicológicas tienen magn1-
tudes, y por eso pueden ser medidas.
El objetivo de la escala de Likert no es procurar determinar el valor escalar de las
cuestiones, tal como pretende Thurstone, sino verificar el nivel de concordancia del
sujeto con una serie de afirmaciones que expresan algo de favorable o desfavorable
en relación a un objeto psicológico. Las cuestiones se responden en una escala de tres
o más puntos; el sujeto tiene que decir si está de acuerdo, si duda o si está en desa-
cuerdo con lo que la frase afirma sobre el objeto psicológico. El número de puntos
en la escala de respuesta varía entre tres y más de diez, siendo las más utilizadas las
escalas de cinco y siete puntos, aunque el número de puntos utilizados en las escalas
de Likert parece ser algo irrelevante. Matell y Jacoby (1971) utilizaron escalas de dos
hasta diecinueve puntos; con la excepción de las escalas de dos y tres puntos, en to-
das ellas el porcentaje de uso de los puntos y el tiempo de respuesta no eran afecta-
dos de forma significativa. Otros estudios ya habían demostrado que el número de

puntos de la escala, ya sea con un punto neutro o no, no afecta a la consistencia inter-
na de la escala Likert (Komorita, 1963; Matell y Jacoby, 1971), ni a la estabilidad test-
retest (Van der Veer, Howard y Austria, 1970; Goldsamt, 1971; Matell y Jacoby,
1971), ni a la validez concurrente y predictiva (Matell y Jacoby, 1971). y
Los procedimientos empíricos consisten en crear un número N de cuestiones
sobre un constructo psicológico y que estas cuestiones sean respondidas por N suje-
tos en una escala de N puntos. El apartado cuatro de este capítulo se centrará en la
elaboración de las cuestiones. Los procedimientos analíticos determinan la selección
final de las cuestiones y la evaluación de los parámetros psicométricos de la escala.
Likert sugiere seleccionar las cuestiones en función de su poder discriminativo
en los grupos criterio, formados en función de la puntuación final que los sujetos
obtienen en la escala. Se hace una prueba t entre las medias de cada cuestión, obteni-
das por el grupo superior y el inferior (el 30% de las puntuaciones superiores y el
30% de las inferiores en la escala). Los análisis más modernos de la teoría de la res-
puesta al ítem parecen más prometedores, pues ofrecen hasta tres parámetros para
las cuestiones: discriminación, dificultad y respuesta al azar.
El análisis de la escala debe verificar la validez y la fiabilidad. Un análisis impor-
tante de la escala consiste en verificar la supuesta unidimensionalidad de la misma;
normalmente, para ello se utiliza el análisis factorial. El análisis de la fiabilidad se
hace normalmente a través del coeficiente alfa de Cronbach.
Por último, queda todavía la duda de si la escala de Likert da lugar a medidas úni-
camente ordinales o si llegan a ser de intervalo. En realidad, con los datos empíricos
recogidos con la escala se puede evaluar el valor escalar de las categorías utilizadas
—los puntos— en la escala de respuesta y, a partir de ahí, utilizar estos valores esca-
lares para las categorías. Con todo, tal procedimiento lleva a utilizar con ligereza las
escalas tipo Likert. Edwards y Kenny (1946) verificaron que las escalas construidas
en el estilo Likert (considerando las categorías uno, dos, tres... como intervalos igua-
les) correlacionan en torno a 0,90 con escalas de intervalos aparentemente iguales a
las de Thurstone; estos autores concluyen que dada la facilidad de construcción y
utilización, las escalas tipo Likert presentan grandes ventajas frente a las de tipo
Thurstone.
114. Elenfoque de Guttman

Guttman (1944, 19474, 1947b, 1950a, 1950b) elaboró una serie de escalas para eva-
luar las actitudes. La parte teórica de la técnica presupone que la propiedad psicoló-
gica posee magnitud y es unidimensional. Cada cuestión (indicador comportamen-
tal) expresa un nivel diferente de magnitud, siguiendo una serie monotónica
creciente (por lo menos de orden). El conjunto de cuestiones de la escala expresa el
continuo de la propiedad y, al ser acumulativos, la aceptación de una cuestión de ma-
yor nivel implica la aceptación de todas las cuestiones inferiores.
Los procedimientos empíricos de la técnica consisten en construir una serie de
cuestiones sobre un constructo, de forma que las cuestiones puedan ordenarse acu-
mulativamente. Así, un sujeto que está de acuerdo con una cuestión que expresa un
Medidas escalares 201
cierto nivel de actitud con respecto al constructo, estará también de acuerdo con to-
das las cuestiones que tienen un nivel menor. De esta forma una serie de cuestiones
(según Guttman, cerca de diez) se ordenan de la más débil hasta la más extrema, con-
figurando una escala, al menos, ordinal. Si esto es verdad, basta saber la cuestión más
extrema con la que el sujeto está de acuerdo para poder reproducir perfectamente
sus respuestas en las otras cuestiones. Pero, en la realidad, esto no sucede así, dado
que las respuestas de los sujetos nunca son perfectas. Entonces la pregunta que surge
es cuál es el mínimo aceptable de reproductibilidad de las respuestas para poder de-
cir que una escala satisface el criterio de acumulatividad. Para ello, Guttman desarro-
lló procedimientos analíticos para determinar un índice de reproductibilidad que re-
sulta de la comparación entre las respuestas correctas e incorrectas; este coeficiente
de reproductibilidad debe ser al menos de 0,90 para que la escala pueda ser conside-
rada adecuada.
Este tipo de escalas tiene la ventaja de evaluar la unidimensionalidad, presentan-
do una garantía de que la amplitud del continuo del constructo es cubierta, sobre
todo si el número de cuestiones es elevado (al menos diez, sugiere Guttman). Sin
embargo, es relativamente raro encontrar en la literatura este tipo de escalas debido a
que no todos los constructos psicológicos permiten el escalonamiento; por ejemplo,
al evaluar la actitud política, un sujeto puede estar de acuerdo con una posición de un
determinado candidato y no con otra, lo que podría estar indicando una falta de uni-
dimensionalidad de la escala.
IV. PRINCIPIOS DE ELABORACIÓN DE ESCALAS
Dado el gran uso que se hace de las escalas tipo Likert vamos a presentar un esquema
resumido de los procedimientos y de las etapas más relevantes para la elaboración y
la validación de este tipo de escalas. La mayoría de los procedimientos nos sirven
también para la elaboración de cualquier instrumento psicométrico. Existen alme-
nos tres grandes aspectos a tener en cuenta a la hora de elaborar escalas: el teórico, el
empírico y el analítico.
El aspecto teórico hace referencia a la teoría que debe fundamentar cualquier
procedimiento científico; en este caso la teoría sobre el constructo u objeto psicoló-
gico para el cual se quiere desarrollar un instrumento de medida y la operacionaliza-
ción del constructo en cuestiones. El aspecto empírico o experimental define las eta-
pas y técnicas de aplicación del instrumento piloto y de recogida de información. El
aspecto analítico establece los procedimientos de análisis estadísticos de los datos
para llegar a un instrumento válido, preciso y, si fuera el caso, normalizado. Los pro-
cedimientos teóricos se deben elaborar para cada escala, dependiendo, por tanto, de
la literatura existente sobre el constructo psicológico en cuestión. Los procedimien-
tos analíticos se encuentran en la literatura psicométrica y estadística. El
La construcción y elaboración de las cuestiones debe seguir ciertos requisitos
que se resumen en los siguientes criterios:
a. Criterio comportamental. La cuestión debe expresar un comportamiento,

no una abstracción o constructo. Según Mager (1981) la cuestión debe permitir al su-
jeto una acción clara y precisa.
b. Criterio de objetividad o de deseabilidad. En el caso de las escalas de aptitu-
des, las cuestiones deben cubrir comportamientos, permitiendo una respuesta cierta
o errónea. En el caso de las aptitudes y de la personalidad en general, las cuestiones
deben cubrir comportamientos deseables (aptitud) o característicos (personalidad).
En este caso, el sujeto debe poder estar de acuerdo o en desacuerdo u opinar si tal
comportamiento es conveniente o no para él; es decir, las cuestiones deben expresar
deseabilidad o preferencia.
c. Criterio de simplicidad. Una cuestión debe expresar una única idea.
d. Criterio de claridad. La cuestión debe ser inteligible hasta para los estratos
más inferiores de la población objetivo. Se deben utilizar frases cortas con expresio-
nes simples e inequívocas.
e. Criterio de relevancia (pertinencia, correspondencia o unidimensionalidad).
La expresión debe ser consistente con el atributo o propiedad psicológica; es decir, la
cuestión no debe insinuar un atributo diferente al definido.
f. Criterio de precisión. La cuestión debe poseer una posición definida en el
continuo del atributo y ser distinta de las demás cuestiones que cubren el mismo
continuo. Este criterio supone que la cuestión pueda ser localizada en una escala de
estímulos; en términos de Thurstone, diríamos que la cuestión debe tener una posi-
ción escalar modal definida y una desviación típica mínima. En términos de la teo-
ría de respuesta al ítem este criterio representa el parámetro b (dificultad) y única-
mente puede ser evaluado después de la recogida de datos empíricos sobre las
cuestiones.
g. Criterio de la amplitud. Este criterio se refiere a la escala total y afirma que el
conjunto de cuestiones referidas al mismo atributo debe cubrir toda la extensión del
continuo del atributo. Este criterio también es evaluado por el parámetro b de la teo-
ría de respuesta al ítem.
h. Criterio del equilibrio. Las cuestiones del mismo continuo deben cubrir
proporcionalmente todos los segmentos o sectores del continuo, debiendo existir,
por tanto, cuestiones fáciles, difíciles e intermedias en el caso de las aptitudes, y cues-
tiones débiles, moderadas y extremas en el caso de las actitudes.
1. Criterio de la variedad. Este criterio tiene en cuenta dos aspectos:
— Cambiar el lenguaje. Usar los mismos términos en todas las cuestiones con-
funde las frases y dificulta su diferenciación, además de provocar monotonía, can-
sancio y aburrimiento.
— En el caso de las escalas de preferencias se debe formular la mitad de las cues-
tiones en términos favorables y la otra mitad en términos desfavorables para evitar
respuestas estereotipadas a la izquierda o a la derecha de la escala de respuestas.
J.. Criterio de modalidad. Se deben formular frases con expresiones de reacción

modal, es decir, no utilizar expresiones extremas como “excelente”, “miserable”, et-
cétera.
k. Criterio de la tipicidad. Se deben formar frases propias e inherentes al atri-
buto; por ejemplo, la belleza no es “pesada”, ni “gruesa”.
Medidas escalares
203
V. CONCLUSIONES
A pesar de los muchos problemas que aún existen en la teoría de la medida en las
ciencias sociales y de la conducta, el uso de las escalas, especialmente en psicología
social y psicología de la personalidad, está muy difundido. Este hecho puede ser
consecuencia de que las medidas escalares ofrecen un conocimiento válido en las
ciencias del comportamiento.
Las diferentes técnicas descritas (Likert, Thurstone y Guttman) presentan una
razonable consistencia, tanto en su estructura interna como en los resultados que se
obtienen por medio de ellas. En realidad, todas estas técnicas ofrecen procedimien-
tos estadísticos que permiten evaluar esa consistencia interna. En cuanto a la consis-
tencia de los resultados obtenidos con las escalas y las técnicas propuestas para su
construcción no son todavía lo suficientemente robustas. Es posible que esto se deba
en gran parte a la falta de definiciones más precisas de estas mismas técnicas.
Aunque existe una gran preocupación sobre la adecuación de los procedimien-
tos estadísticos, el verdadero problema de las escalas es construir un instrumento vá-
lido que evalúe algo psicológicamente relevante. Sin una buena teoría psicológica
que la fundamente, la escala puede parecer estadísticamente perfecta y consistente y,
en cambio, no estar evaluando nada relevante.
Albanese, M. A. y Forsyth, R. A. (1984). The one-, two- and modified two parameter latent
trait models: An empirical study of relative fit. Educational and Psychological Measure-
ment, 44, 229-246. >
Birnbaum, A. (1968). Some latent trait models and their use of inferring an examinee's ability.
En F. M. Lord y R. M. Novick (dirs.), Statistical theories of mental test scores. Reading.
Addison-Wesley.
Campbell, N. R. (1938). Symposium: Measurement and its importance for philosophy. Pro-
ceedings Aristot Society Supplementum, 17, 121-142.
Debets, P. y Brouwer, E. (1989). MSP: A program for Mokken Scale analysis for polychoto-
mous items. Groningen. IEC ProGAMMA.
Debets, P., Brouwer, E., Sijtsma, K. y Molenaar, 1. W. (1989). MSP: Acomputer program for
item analysis according to a nonparametric IRT aproach. Educational and Psychological
Measurement, 49, 609-613. ; ]
Edwards, A. L. y Kenny, K. C. (1946). A comparison of the Thurstone and Likert techniques
of attitude scale construction. Journal ofApplied Psychology, 53, 72-83.
Edwards, A. L. y Kilpatrick, F. P. (1948). A technique for the construction of attitude scales.
Journal ofApplied Psychology, 32, 374-384. : ]
Goldsamt, M. R. (1971). Effects of scoring method and rating scale length in extreme response
style measurement. Tesis doctoral inédita. Universidad de Maryland. mat
Guttman, L. (1944). A basis for scaling qualitative data. American Sociological Review, 9,
139-150.
Guttman, L. (19474). On Festinger's evaluation of scale analysis. Psychological Bulletin, 44,

451-465.
Guttman, L. (1947b). The Cornell technique for scale and intensity analysis. Educational and
Psychological Measurement, 7, 247-280. mE
Guttman, L. (19504). The problem of attitude and opinion measurement. En S. A. Stouffer
(dir.), Measurement and prediction. Princeton. Princeton University Press.
Guttman, L. (19505). The basis for scalogram analysis. En S. A. Stouffer (dir.), Measurement
and Prediction. Princeton. Princeton University Press.
Komorita, S. S. (1963). Attitude content, intensity, and the neutral point on a Likert scale.
Journal of Social Psychology, 61,327-334.
Likert, R. (1932). A technique of the measurement of attitudes. Archives of Psychology, 140,
Sl
Lord, F. M. (1952). A theory of test scores. Psychometric Monograph, 1.
Lord, F. M. (1980). Applications of item-response theory to practical testing problems. Hills-
dale. Lawrence Erlbaum Associates.
Mager, R. F. (1981). Medindo os objetivos do ensino ou “conseguin un par adequado”. Porto
Alegre. Editora Globo.
Matell, M. S. y Jacoby, J. (1971). Is there an optimal number of Likert scale items? Study 1:
Reliability and validity. Educational and Psychological Measurement, 31, 657-674.
Molenaar, I. W. y Sijtsma, K. (1988). Mokken's approach to reliability estimation extended
to multicategory items. Kwantitatieve Methoden, 9, 115-126.
Rasch, G. (1960). Probabilistic models for some intelligence and attainment tests. Copenha-
gue. Danish Institute for Educational Research.
Siegel, S. (1956). Nonparametric statistics for the behavioral sciences. Nueva York. McGraw-
Hill.
Thurstone, L. L. (19274). Psychophysical analysis. American Journal of Psychology, 38, 368-
389.
Thurstone, L. L. (1927b). A law of comparative judgment. Psychological Review, 34, 273-
286.
Thurstone, L. L. (1927c). The method of paired comparisons for social values. Journal ofAb-
normal and Social Psychology, 21, 384-400.
Thurstone, L. L. (19274). Equally often noticed differences. Journal of Educational Psycho-
logy, 18, 289-293.
Thurstone, L. L. y Chave, E. J. (1929). The measurement of attitude. Chicago. University of
Chicago Press.
Van der Veer, F., Howard, K. I. y Austria, A. M. (1970). Stability and equivalence scores ba-
sed on three different response formats. Proceedings of the 78th Annual Convention of
the American Psychological Association, 5, 99-100.
Webb. S. C. (1951). A generalized scale for measuring interest in science subjects. Educatio-
nal and Psychological Measurement, 11, 456-469.
Anastas1, A. (1988). Psychological testing. Nueva York. Macmillan Publishing Co.

Hambleton, R. K. (1991). Advances in educational and psychological testing: Theory and ap-
plications. Hingham, M. A. Kluwer Academic Publishers.
Reckase, M. D. (1990). Scaling techniques. En G. Goldstein y M. Hersen (dirs.), Handbook
ofpsychological assessment. Nueva York. Pergamon Press.
Thorndike, R. M., Cunningham, G. K., Thorndike, R. L. y Hagen, E. P. (1991). Measure-
ment and evaluation in psychology and education. Nueva York. Maxwell McMillan.
9. LA TEORÍA DE RESPUESTA AL ÍTEM
EDUARDO GARCÍA-CUETO
1. INTRODUCCIÓN
En las últimas décadas, aun sin olvidar la teoría clásica de los tests, cada vez se viene
prestando más atención a aquellos modelos conocidos como modelos del rasgo la-
tente, teoría del rasgo latente, teoría de la curva característica del ítem o teoría de la
respuesta al ítem (o a los ítems) (TRI). Estos modelos constituyen un nuevo enfoque
en la teoría de los tests que permite resolver ciertos problemas de evaluación psico-
lógica intocables desde la teoría clásica de los tests (Muñiz, 1990). Aunque el térmi-
no “curva característica del ítem” haya sido acuñado por Tucker (1946), se puede de-
cir que los verdaderos antecesores de las curvas características de los ítems y los
primeros que las utilizaron, aunque no lo denominasen así, fueron Simon y Binet en
1916. Estos autores consideraban que el rendimiento de los niños en tareas de tipo
cognitivo mejora con la edad y utilizaban diagramas en los que representaban la pro-
babilidad de éxito de los sujetos examinados en una tarea o en un ítem en función de
la edad, obteniendo curvas semejantes a la que muestra la figura 9.1.
Algo muy parecido es lo que en los modelos de la teoría de la respuesta a los
ítems se denomina curva característica del ítem. Tal vez el primero en introducir en
la literatura psicológica el término rasgo latente (en un sentido no freudiano) haya
sido Lazarsfeld (1950); sin embargo, es el trabajo de Lord «A theory of test scores»,
publicado en 1952 en un número monográfico de la revista Psychometrika, el consi-
derado como origen y consolidación de la teoría del rasgo latente o teoría de la res-
puesta al ítem. Otros nombres importantes dentro de este campo son Birnbaum
(1968), Lord y Novick (1968) y Samejima (1974), quienes extienden la teoría del aná-
lisis de ítems dicotómicos al de ítems policotómicos y continuos. También conviene
destacar los trabajos de Rasch (1960), cuya obra marca un hito en la historia de estos
modelos, siendo su modelo logístico el que, tal vez, más trabajos e investigaciones
dentro de esta área haya desarrollado. Quizás se entienda mejor el porqué del estu-
dio de la teoría de la respuesta al ítem si se comienza por conocer los problemas y las
limitaciones que presenta la teoría clásica de los tests.
IL. INCONVENIENTES DE LA TEORÍA CLÁSICA DE LOS TESTS
Uno de los problemas fundamentales de la teoría clásica de los tests es que el resulta-
do de una medición realizada sobre una variable dependa, por un lado, del test utili-
Universidad de Oviedo.
206 Eduardo García-Cucto
FIGURA 9.1. Probabilidad de éxito de los sujetos examinados en una tarea o en un item en
función de la edad
0,75
5U
DO!
OD
ONO
DERE
0,50
DITA
TD
EIN
0,25
DH
0.0
==
0D
9 30d 4 0 0,9 000 DS 8 a O O Sd olaaa o O
Edad
zado y, por otro lado, del grupo normativo a partir del cual se estimaron los distintos
parámetros de los ítems y del test. Es algo así como si el peso de una persona depen-
diera del tipo de báscula en donde se pesara y si además las cualidades y característi-
cas de la balanza se establecieran en función del sujeto al que se pesa. Además, los su-
puestos en los que se basa la teoría clásica de los tests no son suficientemente
consistentes. En definitiva, podemos señalar las siguientes limitaciones de la teoría
clásica (limitaciones que los modelos de la TRI prometen subsanar):
a. Dependencia de un grupo normativo, lo que trae como consecuencia que

el valor de estadísticos tales como el poder discriminativo de un ítem o su índice de
La teoria de respuesta al ítem
207
dificultad dependan de la habilidad media del grupo en el que sean calculados. Un

test podrá aparecer como fácil si se estudia en un grupo de sujetos cuya habilidad
para responderlo sea elevada, y el mismo test aparecerá como difícil si el grupo
normativo elegido carecía de habilidad para resolver la problemática planteada por
el test.
ob. Valores tan importantes dentro de la teoría clásica de los tests, como el coefi-
ciente de fiabilidad, coeficiente de validez, índices de homogeneidad y de validez de
los elementos, son estimados mediante el coeficiente de correlación momento-
producto de Pearson, lo que hace que dichos valores estén directamente relaciona-
dos con la variabilidad de las puntuaciones del test en el grupo normativo; es decir,
existen tantos coeficientes diferentes (de fiabilidad, validez...) como aplicaciones del
test sean hechas a distintos grupos.
c. Un tercer inconveniente de la teoría clásica surge cuando se quieren estable-
cer comparaciones entre las aptitudes de los sujetos que hayan sido evaluados en la
misma variable por tests diferentes. Así por ejemplo, un sujeto que haya obtenido
un centil 80 en fluidez verbal en el test A puede poseer dicha aptitud en el mismo,
mayor o menor grado que otro sujeto con el mismo centil en la misma aptitud, pero
evaluada mediante el test B, ya que dicha comparación va a depender del nivel de
dificultad de cada uno de los tests utilizados.
d. Uno de los conceptos fundamentales de la teoría clásica de los tests es el de
fiabilidad, la cual se define en términos de correlación entre formas paralelas de un
mismo test. Esto resulta muy difícil de conseguir empíricamente. Véase el siguiente
ejemplo. Podemos crear un test para evaluar la fluidez verbal, se les puede pedir a un
grupo de sujetos que escriban todas las palabras que se les ocurran que comiencen
con una letra dada, por ejemplo la letra p. Un test paralelo a éste podría ser que escri-
bieran todas las palabras que se les ocurran con la letra d. Para realizar ambas prue-
bas se deja un tiempo limitado, por ejemplo, cinco minutos. Ambos tests tienen la
misma media y la misma varianza y además se sabe por un diccionario de usos que el
número de palabras posibles dentro del idioma y su frecuencia de uso es muy seme-
jante en ambos casos. Ambas pruebas pueden ser consideradas como dos tests para-
lelos. El coeficiente de correlación de Pearson entre ambas es de 0,80; por cons1-
guiente, el coeficiente de fiabilidad de ambos tests es de 0,80. Al mismo grupo y bajo
las mismas condiciones se le pide que escriban ahora palabras que comiencen por la
letra £. La media y la varianza de esta prueba es igual a la media y la varianza de la
prueba de las palabras que empezaban por la letra d. El coeficiente de correlación en-
tre estos dos últimos tests es de 0,60. De acuerdo con la teoría clásica de los tests, el
test de palabras que empiezan por la letra d tiene a la vez como coeficiente de fiabili-
dad 0,80 y 0,60. e
e. La estimación de la verdadera puntuación de un sujeto en el test, los interva-
los confidenciales en torno a la puntuación empírica obtenida por un sujeto en un
test y otras medias y comparaciones se basan fundamentalmente en el error típico de
medida del test. Este error típico se supone constante para un mismo test para cual-
quier muestra de sujetos. Este supuesto resulta muy débil y muy difícil de mantener,
con lo que todo el sistema de estimaciones de puntuaciones verdaderas y de compa-
raciones entre puntuaciones de los tests según la teoría clásica falla desde la misma
base.
208 Eduardo García-Cuetu
Para finalizar, existen muchos aspectos importantes de la medida tales como el

sesgo de los ítems, la probabilidad de acierto de un sujeto a un ítem, etc., que la teoría
clásica de los tests no puede resolver de forma adecuada.
II. SUPUESTOS BÁSICOS DE LA TEORÍA DE RESPUESTA AL ÍTEM
Cualquier modelo matemático incluye un conjunto de supuestos sobre los datos a los
que se ha aplicado dicho modelo. Cuando dichos supuestos son violados se obtienen
resultados de dudoso valor y las conclusiones que de ellos sean extraídas serán pobres y.
difícilmente interpretables. La teoría de la respuesta al ítem supone que una conducta
individual puede ser explicada, en buen grado, definiendo ciertas características huma-
nas (no observables) denominadas rasgos, estimando cuantitativamente la posición del
individuo en cada uno de estos rasgos y utilizando los valores numéricos obtenidos de
dicha estimación para predecir o explicar la conducta individual en situaciones perti-
nentes. Se trata de especificar las relaciones entre las puntuaciones observables obteni-
das por un sujeto en un test y los rasgos latentes que se supone que han de subyacer para
poder explicar dichas puntuaciones, es decir, la habilidad que dicho individuo ha de po-
seer para poder explicar sus respuestas a los ítems del test. Si un test está compuesto por
un número determinado de ítems y dicho test se utiliza para evaluar las características
de un individuo, la unidad básica de medida utilizada es obviamente el ítem. En general,
las personas poseerán la habilidad que pretenda evaluar el test en diverso grado, es decir,
su posición en el rasgo latente que se va a medir será diferente y consecuentemente no
presentarán todos los individuos un mismo patrón de respuestas a un mismo test. Por
consiguiente, las respuestas de las personas a los ítems dependen, por un lado, de la ha-
bilidad de dichas personas y, por otra parte, de las propias características de los ítems. El
objetivo fundamental de cualquiera de los modelos de la respuesta al ítem es proporcio-
nar los procedimientos adecuados para estimar la habilidad de cada individuo que res-
ponde al test y estimar al mismo tiempo las características de los ftems según las res-
puestas manifiestas y observables de dichas personas. A continuación vamos a describir
los supuestos más importantes de la teoría de la respuesta al ítem.
111. Dimensionalidad del espacio latente

Se asume que las respuestas dadas por un sujeto a un test (o cualquier otra conducta
observable y medible) se explica por un conjunto % de rasgos latentes o habilidades.
Así pues, se denomina espacio latente a un espacio k dimensional en donde todos los
sujetos que respondan a un test puedan estar representados por un punto. Si se con-
sidera un conjunto de » ítems y de k rasgos se asume que cada uno de dichos rasgos,
para cualquier sujeto, está afectando su resultado en el test. Esto puede estar repre-
sentado por el siguiente vector:
A=(Op Oe di0):
en donde 0es la variable latente que se desea estimar, siendo sus límites —0co < 9< + oo,
La teoría de respuesta al ítem 209
Por tanto, se representa un rasgo 9 mediante un vector de k componentes, co-

rrespondiéndose cada uno de esos componentes con las dimensiones que se conside-
ra a priori que están incluidas en el rasgo y sobre las que se pueden obtener distintos
valores. Por lo tanto, cada una de las 0,estimadas se considera una variable aleatoria
(Santisteban, 1990). Este conjunto de rasgos latentes es quien define la dimensionali-
dad del espacio latente. Dicho espacio tendrá tantas dimensiones como rasgos laten-
tes sean necesarios para explicar la conducta objeto de estudio. El espacio latente está
completo si todos los rasgos latentes necesarios para explicar la conducta objeto de
medida han sido convenientemente especificados y definidos (Gruijter y Van der
Kamp, 1984). Si es necesario más de un rasgo para definir el espacio latente completo
nos encontramos ante modelos multidimensionales. Los modelos son unidimensio-
nales cuando es suficiente un rasgo latente para considerar completo el espacio laten-
te. En el presente capítulo sólo nos ocuparemos de los modelos unidimensionales; el
lector interesado en los modelos multidimensionales puede consultar la obra de Sa-
mejima (1974) y Whitely (1980).
El supuesto de unidimensionalidad está implícito y/o explícito en la inmensa
mayoría de los tests. El problema fundamental es probar dicho supuesto de unidi-
mensionalidad. Hattie (1985) enumera 87 índices distintos para su estudio. No obs-
tante, parece que el análisis factorial constituye la técnica más adecuada. Una dificul-
tad añadida es el hecho de tener que someter ítems dicotómicos a análisis factorial;
esto puede solucionarse realizando el análisis factorial sobre la matriz de correlacio-
nes 0 o de correlaciones tetracóricas. La unidimensionalidad sería perfecta si el pri-
mer factor extraído explicara el 100% de la varianza. Como esto no es posible, la
unidimensionalidad se convierte en un problema de grado; cuanto mayor sea la pro-
porción de varianza explicada por el primer factor con respecto a los demás, menos
riesgo se correrá de violar el supuesto de la unidimensionalidad.
m.2. Independencia local

Si se cumple el supuesto de la unidimensionalidad, necesariamente se dará la inde-
pendencia local entre los ítems; es decir, que para un valor 9 dado la probabilidad de
que un sujeto acierte un ítem es independiente de que haya acertado o fallado cual-
quier otro ítem del test. Si esto no fuera así significaría que la variable unidimensio-
nal no daría cuenta de toda la varianza de los ítems, sino que parte de ésta dependería
de otros ítems, lo cual es claramente contradictorio con el hecho de que la variable
latente sea unidimensional (Gruijter y Van der Kamp, 1984).
Cuando dos ítems son localmente independientes, la probabilidad de que un su-
jeto con un valor 6 en la variable latente acierte ambos ítems es el producto de las
probabilidades de que el sujeto acierte cada uno de ellos. Así, si un sujeto con un va-
lor O, en el rasgo latente tiene la probabilidad de 0,8 de acertar el ítem 1 del test y la
probabilidad de 0,2 de acertar el ítem 2, la probabilidad de que acierte ambos ítems
es 0,16. O dicho de otra forma, la probabilidad que dicho sujeto tiene de acertar el
ítem dos, habiendo acertado o fallado cualquier otro ítem es de 0,2. /
Lo mismo que se ha dicho de la independ encia local de ftems puede afirmarse de
la independencia local de los sujetos, es decir, que el rendimie nto de un sujeto ha de
AO Eduardo García-Cueto
ser independiente del rendimiento de cualquiera de los otros sujetos que respondan
o puedan responder al test.
ma. Las curvas características de los ítems
La curva que pone en conexión las medias de las distribuciones condicionadas es la

regresión de la puntuación del ítem sobre el nivel de habilidad 8, denominándose
curva característica del ítem (CCI) o función característica del ítem. La curva caracte-
rística de un ítem es una función matemática que relaciona la probabilidad de con-
testar correctamente a un ítem con la habilidad medida por el conjunto de ítems que
configuran el test. En otros términos, la CCI es la función de regresión no lineal de la
puntuación en el ítem sobre el rasgo o la habilidad medida por el test. La CCI no es la
regresión ítem-test, aunque tenga algunas semejanzas. La regresión ítem-test consis-
te simplemente en hacer corresponder los valores del test con las proporciones de
aciertos en un determinado ítem. La diferencia fundamental entre la CCI y la regre-
sión ítem-test viene dada porque en la CCI la variable que miden los ítems es el nivel
de habilidad del sujeto en el rasgo (0) y no la puntuación en el test, medidas ambas
que, si bien están relacionadas, no son coincidentes. La puntuación de un sujeto en
un test varía entre O si no acierta ningún ítem y el número máximo de ítems que ten-
ga el test si los acierta todos, mientras que el valor de 6, como ya se ha indicado, está
comprendido entre — co y +00. Las figuras 9.2 y 9.3 muestran respectivamente la re-
gresión ítem-test y la curva característica de un ítem.
La CCI para un ítem dado permanece invariable de un grupo de sujetos a otro,
siempre que el espacio latente de ambos grupos sea el mismo y esté completo; es de-
cir, cualquier parámetro descrito por la curva característica de un ítem es un paráme-
tro invariante del ítem. Por supuesto, la curva característica del ítem no es directa-
mente observable ya que tampoco lo es 6; pero puede ser inferida a través de las
respuestas de los sujetos a los ítems del test.
IV. PARÁMETROS DE LA CURVA CARACTERÍSTICA DEL ÍTEM
A partir de este momento se asumirá que todos los ítems de cualquier test que se es-
tudie bajo los supuestos de la teoría de respuesta al ítem son dicotómicos o están di-
cotomizados y que las respuestas dadas por cualquier sujeto al test se explican por la
posesión de una habilidad única y unidimensional o un rasgo latente 6. Además se
asume que la probabilidad de acertar un ítem es una función monotónica creciente
de 6.
IV1. Parámetro a
El parámetro a se denomina parámetro de discriminación del ítem o índice de discri-

minación. Su valor es proporcional a la pendiente de la recta tangente a la CCI en el
La teoría de respuesta al ítem
211
FIGURA 9.2. Regresión item-test
OS
0)
b
a
b
¡
nOs
fo
a
d
d
e
2 o
C
|
e
ñ
t
y 02
0
1 2 3 4 5) 6 7 8 9 10 ¿Lil de 13 14
Puntuación en el test
punto de máxima inflexión, en donde 0 = bh. Su valor teórico está comprendido entre
menos infinito y más infinito (- eo < a < + 09), si bien todos los ítems con valores de a
negativos se eliminan de los tests. Tanto los ítems con valores muy próximos a cero o
muy altos en este parámetro deben ser eliminados.
En este caso la probabilidad de acertar un ítem es independiente del valor de 6, lo
cual es absurdo y está en claro conflicto con los supuestos del modelo.
Así pues, <[...] el modelo es poco plausible para modelizar conducta humana
real, en la que el paso fallar-acertar un ítem no se produce tan sistemáticamente en un
punto concreto y siempre el mismo, más bien se da una transición probabilística»
(Muñiz, 1990, p. 20).
212 Eduardo García-Cueto
FIGURA 9.3. Curva característica de un ¡tem
0,8
0,6
0,4
02
o ARI A IS E E AAA OSA AAA A ADITEALDS A
Iv2. Parámetro b
El parámetro hb hace referencia a la dificultad del ítem. Su valor es el valor de 9 co-

rrespondiente al punto de la máxima pendiente de la curva característica del ítem. El
valor del parámetro b es igual al valor de 9 si P(0) =0,50, si no se dan aciertos ni fallos
por azar. Teóricamente, sus límites son — eo < hb < + oo, aunque en la práctica, al igual
que los valores de 6, suelen acotarse entre-4 y +46-3 y +3.
IV3. Parámetro c
El parámetro c es el parámetro del acierto por adivinación de la respuesta o el pará-

metro de acierto al azar; es decir, sería el valor de P(0) s1 0=—0co; en otros términos, es
el valor asintótico de la CCI cuando O tiende a=oo.
IV4. Parámetro p
Este es el parámetro que contempla la posibilidad que existe cuando sujetos de alta
competencia en el rasgo que se está midiendo fallan un ítem. En cierto modo, sería lo
opuesto a acertar el ítem por azar. Puede darse este caso debido a mínimas deficien-
cias no trascendentales del sujeto si el test contempla aspectos que tal vez no tienen la
relevancia debida, o a que el constructor del test por descuido omitió información a
la hora de elaborar los ítems. De cualquier forma este parámetro, tal vez más que te-
nerlo en cuenta, al construir el test habrá que cuidar que su valor sea cero. No parece
que dicho parámetro añada mucha más información sobre la habilidad de los sujetos
que la proporcionada por los otros tres.
La CCI queda definida cuando se especifican estos cuatro (o tres) parámetros y se
adopta una determinada función matemática para dicha curva. Según el tipo de fun-
ción que se adopte tendremos los diversos modelos de CCI.
V. PRINCIPALES MODELOS UNIDIMENSIONALES DE LA TRI
La finalidad de este apartado es hacer una somera introducción a los modelos más
comúnmente utilizados en la TRI. Todos los modelos que se exponen a continuación
asumen independencia local de ítems y sujetos, ítems binarios, dicotómicos o dico-
tomizados, unidimensionalidad del rasgo o de la habilidad sometida a medida y, ade-
más, todos los modelos son probabilísticos.
La mayoría de las investigaciones realizadas hasta la fecha se ha centrado en dos
tipos de funciones matemáticas para las CCI por un lado, la función logística y, por
otro, la curva normal acumulada, lo que puede dar lugar a ocho modelos distintos,
según se tengan en cuenta uno, dos, tres o cuatro parámetros. Dada la poca utilidad
del cuarto parámetro y la mayor tratabilidad de la función logística sobre la curva
normal acumulada, los tres modelos más utilizados dentro de la TRI son los modelos
logísticos de uno, dos y tres parámetros.
v.1. Modelo logístico de un parámetro o modelo de Rasch

Según este modelo, la respuesta dada por un sujeto a un ítem sólo depende de la ha-
bilidad del sujeto y de la dificultad del ítem, es decir, de 0 y de b, ya que el parámetro
de discriminación del ítem se supone igual para todos los ítems del test y además se
da por supuesto que los sujetos no contestarán a ningún ítem alazar. Esto hace muy
restrictivo el modelo, ya que ambos supuestos son muy difíciles de mantener en la
realidad. La experiencia nos dice que los sujetos, cuando no están muy seguros de
una respuesta, pueden fácilmente arriesgarse a contestar el ftem a ver si aciertan, y
además es muy difícil encontrar un conjunto de ítems suficientemente grande como
para constituir tests, si se exige que todos esos ítems tengan idéntico poder discrimi-
nante. De cualquier forma, este modelo es uno de los más utilizados por su sencillez
y para salvar los inconvenientes antes mencionados se acude a la explicación de la ro-
bustez del modelo frente a las violaciones de sus propios supuestos básicos.
v2. Modelo logístico de dos parámetros

El modelo es desarrollado por Birnbaum (1968) y asume que las CCI vienen dadas
por la función logística, teniendo en cuenta dos parámetros: la dificultad del ítem y
su capacidad para discriminar. Evidentemente, el modelo asume que no se dan res-
puestas al azar.
v3. Modelo logístico de tres parámetros

El modelo logístico de tres parámetros se obtiene del de dos parámetros con la adic-
ción del tercer parámetro, comúnmente denominado parámetro c. Como ya se ha
señalado, el tercer parámetro c, indica el valor de P((9) cuando 6 => — co. Dicho en
otras palabras, expresa la probabilidad de acertar un ítem por azar.
VI. PASOS PARA LA CONSTRUCCIÓN DE UN TEST

vI1. Análisis del rasgo
De la misma manera que no se construiría una balanza para medir distancias ni una
cinta métrica para medir temperaturas, también en psicología es necesario tener cla-
ras la naturaleza y las características del objeto que va a ser medido para que el apara-
to de medida construido resulte adecuado. Por elección del rasgo se entiende saber
qué es lo que va a ser medido, definirlo y pensar en la adecuación del instrumento de
medida que se quiere construir con las características del rasgo que se quieren medir.
Esta fase ha de dar respuestas a preguntas tales como ¿qué se va a medir?
Veamos un ejemplo. Supóngase que se desee evaluar la agresividad. El siguiente
paso sería preguntar ¿qué es la agresividad? Esta pregunta es necesario contestarla de
forma operativa, huyendo de definiciones filosóficas etimológicas o declaraciones
de principios; es decir, no serviría definir la agresividad como hostilidad, sadismo,
etc. Tampoco sería útil definirla como conducta no aconsejable, actitud antisocial,
pulsión básica del ser, etc. Es necesario que la definición operativice el constructo.
Así podría ser definida la agresividad como conducta hostil que se puede manifestar
de forma verbal (insultos), agresiones físicas contra los demás o contra uno mismo
(mutilaciones), etc. Clarificado todo esto se puede pensar en cómo evaluar estas con-
ductas, estas manifestaciones externas de la agresividad. De esta forma se pasaría a la
siguiente fase.
vI2. Elaboración de un conjunto de ítems

Los ítems han de ser adecuados también para explorar las conductas que pueden dar
información sobre el rasgo sometido al proceso de evaluación. En el ejemplo que es-
tamos siguiendo podrían ser indagaciones sobre la actuación de los encuestados ante
diversas situaciones (fácilmente insulto a los demás si me llevan la contraria, parece
que tengo una especial disposición para meterme en líos y peleas callejeras, difícil-
mente me enfado...). A estas afirmaciones el sujeto deberá contestar sí o no, según
sean O no ciertas en su caso particular. Es conveniente que el número de ítems sea lo
suficientemente extenso como para poder tener un amplio margen de elección. Se
recomienda un mínimo de tres veces el número de ítems de los que vaya a constar el
test.
vi3. Elección de ítems

VI3.1. Análisis subjetivo
Esta fase conviene que sea realizada por un conjunto de especialistas previamente in-
formados sobre el objeto de la medida y de la definición que se ha dado sobre el ras-
go que se evalúa, utilización posterior del test, cuáles son las características del grupo
al que va dirigido el test, etc. Los ítems poco claros, de interpretación dudosa, con
poca relación con el campo de interés del test, ambiguos, repetitivos, de complicada
sintaxis, deben ser eliminados. Tras esta primera selección aún se ha de disponer de
suficiente número de ítems como para poder realizar un análisis objetivo.
vI3.2. Análisis objetivo

Índice de homogeneidad del ítem
Se trata de ver la relación ítem-test. Su expresión numérica se obtiene mediante el

coeficiente de correlación del ítem con el total del test, una vez eliminada la influen-
cia del ítem en la puntuación global del test. Si el test es una variable normal y conti-
nua y el test es dicotómico, el coeficiente de correlación más adecuado es la correla-
ción biserial puntual. Aquellos ítems cuyo coeficiente de correlación sea muy bajo
deben ser eliminados del test.
216 Eduardo García-Cucto
vi4. Unidimensionalidad del rasgo o de la variable a evaluar

Este estudio puede realizarse mediante las técnicas ya indicadas anteriormente.
vis. Ajuste al modelo elegido

Para la estimación de la bondad de ajuste de los datos al modelo elegido se propone
un estadístico de distribución muy semejante a la de X? que se distribuye con k= 1
grados de libertad (Wright y Panchapakesan, 1969).
En Muñiz (1990) puede verse un ejemplo desarrollado para estimar la bondad de
ajuste de un ítem al modelo logístico de dos parámetros.
vió. Estimación de los parámetros

Una vez seleccionado el modelo que se va a utilizar y comprobada la bondad de
ajuste de los datos al modelo, no queda sino estimar los parámetros de los ítems y la
habilidad del sujeto en el rasgo o la característica que se esté evaluando; es decir, el
valor de la O estimada para cada sujeto. Es evidente, aunque no se haya dicho explíci-
tamente que, previo a cualquier análisis estadístico de los datos, se debe realizar la
aplicación del test a un grupo de sujetos; este grupo ha de ser una amplia muestra re-
presentativa de la población de sujetos a la que el test vaya destinado.
La estimación de todos los parámetros, incluido el nivel del sujeto en el rasgo
que se evalúa (0), se suele hacer mediante estimaciones de máxima verosimilitud, si
bien este método no es el único utilizado (Hambleton y Swaminathan, 1991). El mé-
todo de máxima verosimilitud estima los valores de los parámetros que sean más
plausibles en función de los datos empíricos obtenidos. La estimación se realiza por
aproximaciones sucesivas o interacciones y su cálculo es enormemente laborioso,
siendo necesario en la práctica el uso de ordenadores para realizar las estimaciones;
los programas informáticos más utilizados son el BILOG y el LOGIST.
VII. LA FUNCIÓN DE INFORMACIÓN
La función de información no es única, cada ítem tiene su propia función de infor-

mación lo mismo que cada test tiene la suya. De forma algo “grosera” podría decirse
que el coeficiente de fiabilidad de un test es a la teoría clásica de los tests lo que la
función de información es a la teoría de la respuesta al ítem; dicho con otras palabras,
la precisión o exactitud con la que se puede estimar 6 viene dada por el valor de la in-
formación del test.
¡e |óln L ]
50
La teoría de respuesta al ítem
Dz
Siendo ln L el logaritmo neperiano de la función de verosimilitud L. Se puede

demostrar que el estimador maximoverosímil de sigue una distribución normal
asintótica siendo su media 0 y su varianza 1(0). El valor de la información / se con-
sidera como una función de 6; esta función 1(9) es lo que se denomina función de in-
formación. Su expresión matemática para n ítems es:
1(0)= Pi(0)
= P(6)Q(6)
siendo P?(0) la derivada primera de P(0) respecto a Oy Q|(0) = 1-P(0). Puesto que
los ítems del test son dicotómicos, puede demostrarse que la función de información
para un determinado valor de 0 es la inversa de la varianza de los errores de medida
para ese valor de 0, ya que el error típico de medida no es único e invariable para cada
test, sino que depende del valor de 9 (Gruijter y Van der Kamp, 1984). Esto implica
que es difícil interpretar el valor de la función de información como valor absoluto.
Tiene mucho más sentido hacerlo en relación con otros tests; esta comparación se
hace posible mediante el concepto de eficiencia relativa del test. La eficiencia relativa
de o el A y el B, cuando ambos evalúan la misma habilidad o el mismo rasgo
0 se define:
VIII. APLICACIONES DE LOS TESTS CONSTRUIDOS BAJO

LOS MODELOS DE LA TRI
La independencia de los valores de los parámetros del grupo normativo, la variabili-

dad del error de medida del test y de los ítems en función de la capacidad de los suje-
tos en el rasgo que el test evalúe y el que la auténtica unidad de medida del rasgo sea
el ítem y no el test, entre otras características de la TRI, hacen posible la aplicación de
estos tests en circunstancias y con finalidades impensables desde la perspectiva de la
teoría clásica de los tests.
via. Tests adaptados al sujeto (tailored tests)

La finalidad de los tests adaptados al sujeto es que cada individuo que va a ser sometido
a medida deba contestar ítems en consonancia con su propia capacidad. En las aplica-
ciones de tests tradicionales todos los sujetos de un grupo debían contestar el mismo
test, por lo tanto no era difícil encontrarse con sujetos para los que la mayoría de los
ítems resultaba muy fácil y otros sujetos que encontraban los ítems del test extremada-
mente difíciles. En general, los tests sólo estaban adaptados a los sujetos de capacidad
media. Los tests adaptados al sujeto hacen que para la evaluación de una misma varia-
ble (neuroticismo, estrés, inteligencia general...) cada sujeto responda a un conjunto de
ítems (un test) diferentes, en función exclusivamente del nivel en el que el sujeto se en-
cuentre dentro de la variable en la que va a ser evaluado. Estas aplicaciones pueden ha-
cerse mediante tests aplicados por ordenador o en test de papel y lápiz (Lord, 1980).
Para la aplicación de tests adaptados al sujeto es indispensable poseer un gran

banco de ítems perfectamente calibrados y con todos sus parámetros conocidos. Si
la aplicación se hace mediante papel y lápiz, al sujeto se le aplica un test piloto para
estimar si pertenece a un grupo bajo, medio-bajo, medio, medio-alto o alto en el ras-
go que el test pretenda evaluar. En función de los resultados obtenidos por la perso-
na en el test piloto se eligen los ítems a los que contestará y que forman el verdadero
test al que el sujeto responderá y que se utilizará para estimar su 6. Si la presentación
del test se hace por ordenador, el primer ítem se le presenta al azar y en función de
que lo falle o lo acierte se le presenta otro ftem más fácil o más difícil y así sucestva-
mente hasta que la persona haya contestado un número suficientemente elevado de
ítems de dificultad media en función de su propia habilidad (9 = b) para poder esti-
mar cuál es su verdadera capacidad en el rasgo objeto de estudio.
vu2. Comparación de puntuaciones

Puesto que la estimación final que se pretende con estos modelos no es la puntua-
ción del sujeto en el test, sino su puntuación en la variable objeto de medida y ésta es
independiente del test utilizado, las capacidades, habilidades, aptitudes y/o actitudes
de los sujetos evaluados en el mismo rasgo son siempre comparables entre sí. Basta
poseer un gran banco de ítems, todos ellos calibrados con la misma métrica.
IX. CONCLUSIONES
Parece claro que si los datos se ajustan a los modelos estudiados, la TRI presenta cla-
ras ventajas sobre los tests tradicionales de la teoría clásica. Esto no significa que la
TRI sea la panacea que venga a solucionar todos los problemas de la medida en las
ciencias de la conducta. Tampoco todo son ventajas. El problema de la unidimensio-
nalidad es una seria objeción a estos modelos. Primero, porque muchas conductas
humanas son claramente complejas y difíciles de analizar en todas sus dimensiones
primarias aislando unas de otras; en segundo lugar, en muchas ocasiones la variable
tiempo es importante en la medida de la velocidad y de algo más, lo cual es incompa-
tible desde el mismo punto de partida con el supuesto de la unidimensionalidad, ya
que el tiempo es por sí mismo una clara dimensión. No es fácil la construcción de
grandes bancos de ítems ni las muestras todo lo numerosas que serían de desear para
calibrar dichos ítems, sobre todo cuando las poblaciones de interés tienen caracterís-
ticas muy peculiares, como poblaciones con ciertas patologías. La dificultad para
trabajar con ítems continuos o categoriales es otro inconveniente que puede resultar
insalvable en ciertas áreas de interés para el psicólogo. De cualquier forma es un ins-
trumento más en las manos del profesional de la psicología que puede ayudarle a ser
más objetivo y cometer menos errores en su toma de decisiones; bien utilizado pue-
de ser de gran utilidad y ayuda en numerosas ocasiones en el ejercicio de la profe-
sión.
Birnbaum, A. (1968). Some latent trait models and their use in inferring a examinee's ability.
En F. M. Lord y M. Novick (dirs.), Statistical theories in mental test scores. Reading.
Addison-Wesley.
Grujter, D. N. M. y Van der Kamp, L. J. T. (1984). Statistical models in psychological and
educational testing. Lisse. Swets and Zeitlinger.
dbisan R. K. y Swaminathan, H. (1991). Fundamentals of item response theory. Lon-
res. Sage.
Hatue, J. A. (1985). An empirical study of various indices for determining unidimensionality.
Multivariate Behavioral Research, 19, 49-78.
Lazarsteld, P. F. (1950). The logical and mathematical foundation of latent structure analysis.
lnS. A. Stoufer (dir.), Measurement and prediction. Princeton. Princeton University
ress.
Lord, F. M. (1980). Applications of item response theory to practical testing problems. Nueva
York. Academic Press.
E a M. y Novick, M. (1968). Statistical theories in mental test scores. Reading. Addison-
esley.
Muñiz,J.(1990). Teoría de respuesta a los ítems. Madrid. Pirámide.
Rasch, G. (1960). Probabilistic models for some intelligence and attainment tests. Copenha-
gue. The Danish Institute for Educational Research.
Samejima, F. (1974). Normal ogive model on the continuous response level in the multidi-
mensional latent space. Psychometrika, 39, 11-121.
Santisteban, C. (1990). Psicometría. Madrid. Norma.
Tucker, L. R. (1946). Maximum validity of a test with equivalent items. Psychometrika, 11,
1213.
Whitely, S. E. (1980). Multicomponent latent trait models for ability tests. Psychometrika, 45,
479-494,
Wright, B. D. y Panchapakesan, N. (1969). A procedure for samplefree ¡tem analysis. Educa-
tional and Psychological Measurement, 29, 23-48.
Allen, M. J. y Yen, W. M. (1979). Introduction to measurement theory. California.

Hambleton, R. K. (dir.) (1983). Applications of item response theory. Vancouver. Educational
Research of British Columbia.
Hambleton, R. K. (1994). Item response theory: A broad psychometric framework for mea-
surement advances. Psicothema, 6, 535-556.
Hambleton, R. K. y Swaminathan, H. (1991). Fundamentals of item response theory. Lon-
dres. Sage. EXI
Muñiz,J.(1990). Teoría de respuesta a los ítems. Madrid. Pirámide.
Santisteban, C. (1990). Psicometría. Madrid. Norma.
qe 5 e
"ms -
E RAE A
e $ Goin. 1 o
e
LA a -á Y o
$ 4
a e
Ad DS
1 SII RA SE
td, se” UN OA Ar 2 A pr, 5
inadt src 008) ud e.

AL 5 2 PA lie a só pb muucncid ¿OARAN
hi aca da parsesrque$venga a pas das primas

¿BCAA de a conducta, ARMADOCO toda y dea El
cosipinasydices
e E E, cdi
pl IL HO US 4
o mid
sona ceras del

27 abunia CIS 1% SEO y 8
0 CR bat,PSA
RR o as ir E PA
¿praia dd cielo Pe rmacad miss ero a
z 10 slroma de de años bierrurilizado:gue-
Tarinsad OATES tra
ejeracio de la proto.
10. ELINFORME PSICOLÓGICO
FERNANDO JIMÉNEZ
L INTRODUCCIÓN
Una de las funciones esenciales y más frecuente que se va a encontrar el psicólogo

en su trabajo cotidiano es la de atender a los diferentes pacientes que le son remiti-
dos desde distintas instancias. El solicitante del informe puede ser un padre preo-
cupado por lo que le ocurre a su hijo, el propio sujeto adulto que se acerca volun-
tariamente a la consulta para tratar de resolver de una vez por todas sus propios
problemas que le aquejan constantemente, la familia que aprecia “irregularidades”
en el comportamiento de un familiar, el jefe de personal de una empresa que solici-
ta la resolución de un puesto de trabajo, el jefe de servicios del departamento de
clínica o de psiquiatría, o incluso la petición puede provenir de un juez tratando
de apreciar la responsabilidad o irresponsabilidad de los actos de su encausado,
o de los juzgados de familia en cuanto a la tutela de los hijos en caso de separación
de los padres, etc. Hoy día son muchas, y muy diversas, las instancias que deciden
realizar una consulta al psicólogo.
Cuando el psicólogo se encuentra ante un paciente al que tiene que atender, sabe
que al final de todo el proceso de evaluación va a tener que elaborar un informe más
o menos extenso en el que tiene que expresar —y hacerse entender— los diferentes
aspectos encontrados, las recomendaciones y el tratamiento más efectivo. El infor-
me es la última etapa de todo el proceso de evaluación del paciente. En el momento
que pretende realizar la elaboración de un informe se va a enfrentar a una habilidad
no fácil de adquirir. Redactar un informe supone tener la habilidad suficiente no sólo
para analizar, sintetizar e integrar todos los datos recogidos en la información pre-
viamente obtenida, sino también la de disponer de las habilidades propias del len-
guaje como para poder apreciar que su comunicante, destinatario del informe, va a
entender con precisión y claridad los mismos conceptos y terminología que el psicó-
logo pretende. Appelbaum (1970), quien concibe el informe como un instrumento
de persuasión política, diplomática y estratégica que funciona en un contexto socio-
político complejo más que un documento científico y técnico, señala que el emisor
de un informe psicológico debe de tener las siguientes habilidades:
Habilidad para encontrar el equilibrio entre datos objetivos y abstracción.

Uso de la modulación.
Ser asertivo o modesto cuando sea necesario.
Mantener el interés del lector.
SA Usar de forma inteligente las ilustraciones y los ejemplos.
DEAN
Universidad de Salamanca.
222 Fernando Jiménez
£.. Discutir sistemáticamente cada una de las partes del informe.

g. Facilitar el proceso de toma de decisiones.
Es evidente que no vamos a encontrar todas estas habilidades, pero sí almenos

queremos hacer resaltar la idea de que elaborar un correcto informe psicológico im-
plica un tiempo de estudio que contemple las diferentes facetas de organización,
atención selectiva, análisis, síntesis, funcionalidad y capacidad para transmitir el
mensaje en sus propios términos. Es muy frecuente encontrar informes que se limi-
tan a exponer una serie de cifras (por ejemplo, resultados de tests psicométricos) y/o
una serie de siglas (por ejemplo, abreviaturas de las pruebas utilizadas) que hacen
verdaderamente difícil la comprensión para cualquier otro profesional o destinatario
como podrían ser los padres, educadores, psiquiatras, jueces, etc., así como encon-
trarse en estos mismos informes con una descripción literaria acompañados de un
lenguaje tecnicista sobre los procesos psicológicos hipotéticamente involucrados en
la realización de las pruebas. Quizás uno de los problemas fundamentales que se nos
presenta a la hora de confeccionar un informe es el poder llegar a formular, con la
mayor precisión y claridad posible, una descripción de la conducta de la persona que
sea relevante e inteligible para tratar de resolver adecuada y fielmente los propósitos
que motivaron el informe.
II. CONCEPTO Y OBJETIVO DEL INFORME
Cuando nos planteamos el concepto del informe psicológico acabamos siempre re-
flexionando sobre las diferentes teorías que sustentan su propia definición. Tallent
(1983) define el informe como un documento escrito que sirve para comprender
algunas características de la persona y sus circunstancias, con el fin de tomar deci-
siones y de intervenir positivamente en su vida. Quizás la definición de Heiss
(1964) muestre más interés en la síntesis de los datos entendiendo el informe como
la representación integradora obtenida a partir de nuestra investigación. Para Fer-
nández-Ballesteros (1983) el informe supone un documento escrito a través del
cual se presentan los resultados de las exploraciones efectuadas, a partir de las que
se realizan unas recomendaciones concretas o se derivan determinados tratamien-
tos, dando con todo ello respuesta a los objetivos planteados por el sujeto o por
el remitente. Ávila, Ortiz y Jiménez (1992) consideran que el informe es la co-
municación (oral o escrita) a través de la cual se informa de los resultados de las
exploraciones efectuadas, a partir de los cuales se realizan diferentes observacio-
nes (diagnóstico y tratamiento más adecuado), dando con ello respuesta a los obje-
tivos planteados (motivo de la consulta) por el sujeto, entidad u organismo remi-
tente.
Por tanto, podemos apreciar la existencia de cuatro factores comunes en todo in-
forme psicológico:
a. Esuna comunicación oral o escrita.

b. Presenta una síntesis de la evaluación o diagnóstico efectuado.
El informe psicológico 223
Cc. — Indica el tratamiento más adecuado o recomendaciones de actuación.

d. Darespuesta al motivo de la consulta u objetivos planteados.
En definitiva, el objetivo del informe es dar respuesta a los interrogantes que fue-
ron planteados por el sujeto o remitente; por tanto, éste debe estar centrado en el
mismo sujeto, orientado a las pruebas aplicadas, no debiendo obtener más informa-
ción que la estrictamente necesaria para la finalidad que fue solicitado.
III. TIPOS DE INFORME PSICOLÓGICO
Existen diversos tipos de informes; no obstante, en un sentido amplio, y teniendo en

cuenta la modalidad de expresión, podemos reducir los informes a dos tipos: oral y
escrito.
m1. El informe oral

Según Dana (1982), los clientes y usuarios de los psicólogos creen, cada vez con más
fuerza (Bringmann, Pakula y Balance, 1978), que las interpretaciones derivadas de
las técnicas de evaluación que les han sido aplicadas les pertenecen por derecho pro-
pio. Este sería uno de los principales puntos de partida para considerar el papel que
tiene la devolución de información en la psicología clínica contemporánea. En las
dos últimas décadas se han estructurado dos líneas principales de investigación en
torno a los problemas de la devolución o feedback; por una parte, las investigaciones
sobre el proceso de la devolución oral y, por otra, la investigación propiamente clíni-
ca. La primera se ha ocupado casi exclusivamente de investigar la devolución de con-
tenidos falsos, la segunda se ha ocupado de estudiar las características de los infor-
mes escritos, a los que haremos referencia posteriormente.
El informe oral consiste en la comunicación al sujeto, en el curso de una o varias
entrevistas, de los resultados de las exploraciones habidas y de las recomendaciones
de intervención. Ello supone la participación activa del sujeto y del evaluador, en in-
teracción. Esta comunicación constituye el contenido básico de la denominada “fase
devolutiva” o “devolución de información” del proceso de evaluación. Se entiende
por “devolución de información” la comunicación verbal discriminada y dosificada
que el psicólogo hace al paciente, a sus padres y al grupo familiar de los resultados
obtenidos en el proceso de evaluación del propio sujeto y de la información del tra-
tamiento más adecuado. Esta devolución es un proceso dinámico que no debe ser
realizada de una manera rígida y estereotipada. La devolución de información, como
todo el proceso previo, se da en el contexto de la relación psicólogo-sujeto, por lo
que no se puede entender como una mera comunicación de resultados estéticos y es-
tereotipados. La conducta del sujeto, sus reacciones frente a la información, la apari-
ción de nuevos datos, etc. pueden determinar un cambio en la planificación de la en-
trevista, así como también permitir modular las opiniones previas del psicólogo y
emitir un diagnóstico, pronóstico y orientación terapeútica con mayor certeza.
224 ' Fernando Jiménez
Cuando nos planteamos cómo realizar esta entrevista de devolución, ¿por dón-
de hemos de comenzar? La “devolución” debe comenzar por los aspectos más adap-
tativos y positivos del sujeto e ir incluyendo los aspectos patológicos y menos posi-
tivos para la persona en la medida en que el sujeto pueda tolerarlos. Hay autores que
recomiendan comenzar por los aspectos intelectuales y cognitivos, pensando que és-
tos generan menos ansiedad que los factores emocionales. Sin embargo, dependería
de cada caso y, fundamentalmente, del motivo de la consulta. Respecto al lenguaje
que debemos emplear al comunicar los resultados, es importante no emplear un len-
guaje demasiado técnico que pudiera dificultar su comprensión e interpretación.
Ante todo, creemos necesario hacernos entender y adaptarnos a la persona destina-
taria del informe para que la comunicación resulte comprensible e interpretada en
sus términos concretos.
¿Quiénes pueden ser los destinatarios de la entrevista de devolución? Cuando el
sujeto es un niño o un adolescente es imprescindible realizar la entrevista de devolu-
ción con los padres porque son los que han pedido la consulta y porque comprende-
rán mejor la información transmitida (Wiener y Kohlert, 1986) y porque son los res-
ponsables del tratamiento a seguir con el niño. Si se trata de un adolescente, es
necesario explicarle de alguna manera (adaptándose a sus capacidades y facilidad de
comprensión) los puntos fundamentales del informe, haciéndole comprender que es
una tarea de todos, de él (para que tome parte activa) y de sus padres. Cuando los pa-
dres no acuden por iniciativa propia a la consulta, sino que son enviados por un ter-
cero (maestro, médico, etc.) la entrevista de devolución posibilita la toma de con-
ciencia del conflicto. En el caso de una persona adulta no suele ser necesario la
devolución de información a ningún familiar, excepto en los casos cuya gravedad lo
requiera o cuando es solicitado por el propio sujeto; en cualquier caso, no se debe
hacer sin el conocimiento y consentimiento del propio sujeto.
12. El informe escrito

El informe psicológico escrito ha sido enfocado desde numerosas perspectivas (Fos-
ter, 1951; Hammond y Allen, 1953; Huber, 1961; Maloney y Ward, 1976; Tallent,
1980, 1983, 1987; Kipnowski, 1981).
112.1. Organización del informe

Podemos organizar el informe haciendo énfasis bien en la teoría de la personalidad
que lo sustenta, en las técnicas empleadas para la exploración y obtención de la co-
rrespondiente información, o podemos basarnos en la problemática planteada. Es-
tos aspectos no son exclusivos entre sí, sino que más bien se complementan y a veces
se solapan, ya que un autor que profese una teoría determinada sobre la evaluación
de la personalidad, tendería a aplicar unas técnicas de exploración propias de esa
misma teoría.
Informe psicológico basado en la teoría
Los informes basados en la teoría son aquellos que eligen y ordenan su exposición
según los postulados teóricos que se derivan de la teoría de la personalidad. Por con-
siguiente, un informe no será el mismo desde una perspectiva dinámica que desde
una perspectiva psicométrica o conductual. El enfoque, las técnicas, la terminología
y el lenguaje van a ser propios de la teoría que profesa el evaluador. Estos tipos de in-
forme tienden a utilizar una forma más literaria, presentando un relato organizado y
con coherencia interna. Quizás el inconveniente mayor que puedan presentar es la
tendencia a utilizar afirmaciones demasiado genéricas y ambiguas atribuibles a la
mayoría de las personas.
Informe psicológico basado en las técnicas
Los informes fundamentados en las técnicas de exploración utilizadas suelen estar ba-
sados en la descripción de los resultados ofrecidos por las pruebas psicológicas em-
pleadas. Estos tipos de informe han sido, y continúan siendo, los más extendidos, y
en particular en España en los ambientes clínicos y psicopedagógicos. Los informes
mecanizados, elaborados por un programa de ordenador, utilizan este modelo to-
mando como método para la interpretación o valoración final la adscripción de pro-
posiciones generales para las puntuaciones más destacadas. Como puede deducirse, el
valor de este tipo de informes tiende a ser casi nulo. Quizás el inconveniente mayor
que presentan es la impersonalización del informe, la confección de un inventario
atomista de respuestas sin foco alrededor de las cuales se sitúa el peso más importante
de la información (Pelechano, 1976), la redundancia de datos (a veces pueden hasta
resultar contradictorios) y el tecnicismo superfluo que puede llegar a hacer inteligible
un determinado informe si la persona destinataria del mismo no se encuentra adecua-
damente experimentada para su comprensión correcta (Tallent, 1987).
Informe psicológico basado en el problema planteado
El informe redactado bajo esta perspectiva está diseñado en función de los objetivos
o problemas objeto de estudio (motivo de la consulta) planteados por el sujeto remi-
tente. Son informes altamente específicos, orientados a facilitar la toma de decisiones
o la intervención. Su ventaja más importante estriba en la posibilidad de construir un
modelo psicológico funcional y dinámico de la persona sobre la que se ha realizado
la evaluación psicológica (Pelechano, 1976).
Un ejemplo de este tipo de informe es el elaborado por Weed (1970) con la deno-
minación de Problem Oriented Record (POR) cuya ventaja principal es la de consti-
tuir una pauta que puede ser utilizada por diversos profesionales. El POR consta de
cuatro apartados:
a. Datos básicos: clínicos, biográficos, funcionamiento intelectual, etc.

b. Listado de problemas: trastornos ambientales, conductuales, sociales y mé-
dicos.
c. Formulación de un procedimiento de intervención.

d. Seguimiento.
1122. Los objetivos prácticos del informe

Considerando qué aspectos pueden ser útiles, desde el punto de vista práctico, dis-
tinguimos diversos tipos de informes escritos.
El informe técnico
Se trata de un informe regido por la precisión científico-metodológica, que da

cuenta del proceso de evaluación realizado (es decir, no sólo de los datos obte-
nidos, sino de su adecuada valoración), discusión e integración en un todo, de
manera que facilite la toma de decisiones y la realización de las intervenciones per-
tinentes. Su destinatario es otro (u otros) técnico y nunca el sujeto o cliente. Las
características del informe deben ajustarse al lenguaje compartido por ambos téc-
nicos (el informante y el receptor del informe). Este tipo de informe debe ser
susceptible de discusión e intercambio directo de puntos de vista entre ambos
profesionales. Además, tiene un carácter estrictamente confidencial. Como ejem-
plo podríamos reseñar los informes clínicos intrahospitalarios (interservicios),
los informes clínicos intraequipos y, en algunos casos, los informes clínicos peri-
ciales.
El informe personal
Constituye un informe al sujeto o cliente. Se trata de un informe regido por la comu-

nicación de los puntos de vista del profesional, tras las exploraciones pertinentes, so-
bre las demandas formuladas por el sujeto. En este informe ha de utilizarse un len-
guaje coloquial, limitándose su contenido a lo más relevante y pertinente del objeto
de la demanda. En todo caso, consideramos que cuando el informe va dirigido al
propio sujeto (o a los padres) es más conveniente efectuar la entrevista “de devolu-
ción”, porque permite contrastar el efecto que produce la información que va reci-
biendo el sujeto y la ansiedad que provoca. Quizás el inconveniente mayor es que un
informe escrito, aunque sea en un lenguaje comprensible para el sujeto, puede llevar
a malinterpretaciones difíciles de corregir y controlar.
El certificado
Se trata de un testimonio documental que el psicólogo presta, bien a instancias de un

cliente o de una institución. Es un documento centrado en su objeto, y en el que se
excluyen todas las formulaciones técnicas que no sean pertinentes al mismo. Tiene la
particularidad de encontrarse circunscrito temporalmente (se informa aquí y ahora)
y es breve, conciso y debe estar referido a un uso predeterminado. Un ejemplo de
este tipo de informes es aquel preceptivo para la concesión de determinadas presta-
ciones sociales.
Por último, el informe pericial sería un informe técnico con las matizaciones
concretas, dado que su destinatario no suele ser un profesional de la psicología, con
las dificultades que supondría un uso abusivo del lenguaje técnico. Por otro lado, en
nuestra opinión, el informe psicopedagógico se encontraría entre el informe técnico
y el certificado, dado que debe informar fundamentalmente acerca del rendimiento
y capacitación escolar, pero al mismo tiempo debe ser conciso y excluir todas las for-
mulaciones que no sean específicas. Los niños detectados con algún “problema” o
cuando los padres solicitan un informe escrito de su hijo, deben ser acompañados de
una entrevista de “devolución” en la que participen los mismos padres con el permi-
so expreso del propio alumno explorado.
IV. CARACTERÍSTICAS FUNDAMENTALES DEL INFORME PSICOLÓGICO
Las características básicas que ha de reunir todo informe psicológico, con indepen-
dencia de su contexto, deben ser las siguientes:
a. Elinforme es parte y a la vez resultante del proceso de evaluación psicológi-

ca al cual pertenece.
b. El informe ha de ser relevante en cuanto a su objeto y a su contenido; debe
excluirse todo aquello que no se refiere a su objetivo.
c. El informe ha de ser necesario; no deben realizarse informes rutinarios o de
forma estereotipada sin que exista un propósito definido para su realización relevan-
te a la intervención psicológica.
d. El informe ha de tener utilidad, es decir, debe permitir tomar decisiones o
hacer un uso específico del mismo de acuerdo a las necesidades reales del sujeto.
e. El informe ha de ser riguroso, veraz y objetivo, tanto en sus aspectos meto-
dológicos (procedimientos de exploración e integración seguidos para su elabora-
ción) como en su contenido. Para algunos autores (Pelechano, 1976; Fernández-
Ballesteros, 1983), el informe es un documento “científico” ya que es producto de un
proceso ajustado a normas a través del cual se han obtenido unos resultados de los
que se deriva una serie de acciones que dan respuesta a los objetivos previamente
formulados.
£. El informe ha de referirse personalizadamente al sujeto objeto de estudio.
No deben realizarse informes que describan a los sujetos y sus problemas en térmi-
nos generales, aplicables a la mayoría de las personas, y que impida toda interven-
ción específica posterior.
El informe debe tener coherencia interna, tanto en su redacción final como
en las estrategias de exploración.
». Elinforme ha de tener sentido en el contexto al cual va destinado, lo que im-
plica un uso consensual adecuado del lenguaje, un análisis de los objetivos del infor-
me y una consideración acerca de su utilización social. Us hd
¡. El informe ha de estar abierto a la perspectiva interdiscipl inar con la que
es imprescindible abordar la mayoría de los problemas y supuestos que los mo-
tivan.
El informe debe respetar los principios éticos básicos de la psicología y los

derechos legales de los pacientes, todo ello tanto por las repercusiones que el infor-
me tiene para el sujeto como para la responsabilidad que el psicólogo contrae al sus-
cribirlo.
V. MODELOS DE INFORME PSICOLÓGICO
Son muchas las propuestas formuladas por los diversos autores para la presentación
de los resultados de una exploración a través de un informe escrito. Á continuación,
vamos a presentar los modelos más representativos de los autores que se han dedica-
do más intensamente al estudio de este tema. Los esquemas que vamos a referir son
los de Maloney y Ward (1976), Pelechano (1976), Sattler (1982) y Fernández-Balles-
teros (1983). Posteriormente, expondremos los puntos básicos que debe cumplir
cualquier informe. Podemos observar que no existen disparidades sustanciales entre
los diversos autores.
El modelo que proponen Maloney y Ward (1976) está dentro de un enfoque
conductual y racional de la organización del material de evaluación (véase cuadro
10.1).
El modelo propuesto por Pelechano (1976) presenta características muy seme-
jantes a las de Maloney y Ward, tanto en su línea teórica como en sus respectivos
apartados (véase cuadro 10.2).
Los modelos de Sattler (1982) y Fernández-Ballesteros (1983) se recogen en los
cuadros 10.3 y 10.4, respectivamente.
En el cuadro 10.5 se presenta una guía con los puntos básicos que deben aparecer
en todo informe.
a. Datos de identificación:
—Nombre, apellidos, edad, sexo, estado civil, nivel de escolaridad y/o pro-
fesión del sujeto evaluado.
—Nombre, apellidos y número de colegiado del psicólogo evaluador.
—Fecha de la evaluación.
b. Motivo de la consulta:
— Motivos por los que ha solicitado los servicios de un psicólogo.

—¿Ha venido por iniciativa propia o remitido por un tercero?
c. Técnicas empleadas:
—Tests y procedimientos de recogida de información.

—Se debe realizar una enumeración de las técnicas que se han utilizado en el
mismo orden que fueron aplicadas; de esta manera cualquier otro psicólo-
go puede efectuar una contrastación de los resultados.
CUADRO 10.1. Modelo de informe psicológico propuesto por Maloney y Ward (1976)
Nombre y apellidos del evaluador: Fecha de la evaluación
—Nombre:
—Edad:
DATOS PERSONALES: | —Sexo:
—Estado civil:
—Profesión:
—Naturaleza del problema

CUESTIONES DE REFERENCIA
—Planteamiento básico (remitente)
Y OBJETIVOS:
—Objetivos básicos (remitente y sujeto)
DATOS BIOGRÁFICOS:
:
PROCEDIMIENTOS DE EVALUACIÓN:
an | —Técnicas empleadas
Dato blendss
CONDUCTA Y —Observaciones efectuadas durante la evaluación

OBSERVACIONES: —Actitudes observadas
—Habilidades intelectuales
— Aptitudes
—Afectividad
RESULTADOS E INTEGRACIÓN: | —Contacto social
— Motivación
—Nivel de aspiración
—Otros resultados
RECOMENDACIONES Y LÍNEAS DE ACTUACIÓN:
RESUMEN FINAL:
d. Conducta observada durante el proceso de evaluación:
—Conducta verbal y no verbal, la cual nos aporta información acerca de

cómo el sujeto se ha relacionado con el psicólogo y de cómo se ha enfren-
tado a la situación del examen.
—Señalar cuál ha sido la actitud del sujeto y los cambios que se han produci-
do a lo largo de las sesiones y ante las diferentes pruebas.
CUADRO 10.2. Modelo de informe psicológico propuesto por Pelechano (1976)
—Nombre y apellidos
—Sexo
—Estado civil
—Lugar y fecha de nacimiento
—Fecha de la evaluación
—Datos biográficos
1. DATOS DE IDENTIFICACIÓN Y A na NI
RAZÓN DE LA EVALUACIÓN:
—Padres
—Nivel socioeconómico —Familiares
—Propio sujeto
—Nivel cultural
—El examinador
—Actitudes hacia: —La situación de la prueba
—Sí mismo
—los errores cometidos

CONDUCTA DURANTE LA —Reacciones ante: | —los aciertos cometidos
EVALUACIÓN: —Jos ítems de los tests
—Hábitos de trabajo:
—Área del lenguaje:
—Área visomotora:
: —Precisión
NIVEL DE FUNCIONAMIENTO INTELECTUAL: alidez
Ñ —Positivos
ASPECTOS DE LA PRUEBA: — Negativos
IMPLICACIONES DIAGNÓSTICAS (Resultados): | TOpecrcos

Pruebasno-cognilivas
—Fortalecer conductas positivas

— Informar alteraciones detectadas
— Indicar evaluación posterior
RECOMENDACIONES: | —Sugerencias tratamiento
—Señalar aptitudes vocacionales
—Predicción de pronóstico
—Líneas de actuación a seguir
—Puntos principales del informe

RESUMEN (opcional): —Pronóstico sugerido
—Áreas de acción más conveniente
CUADRO 10.3. Modelo de informe psicológico propuesto por Sattler (1982)
—Fecha de nacimiento
DATOS DE IDENTIFICACIÓN: ¿Edad cronológica
—Fecha del examen
—Grado escolar
—Pruebas administradas
RAZONES POR LAS QUE FUE REFERIDO:
—Actitudes hacia el
examinador
ye, —Actitudes hacia la situación
—Características de la prueba
OBSERVACIONES actitudinales: —Actitud hacia sí mismo
GENERALES DE —Hábitos de trabajo
LA CONDUCTA: —Reacción al fracaso
—Reacción al elogio
—Área del lenguaje

—Area visomotora
RESULTADOS DE LAS PRUEBAS (interpretación y síntesis):
RECOMENDACIONES:
RESUMEN:
e. Resultados obtenidos:
—Aspectos intelectuales: nivel intelectual y factores cognitivos, de los que

no se deben dar exclusivamente los datos numéricos sino fundamental-
mente la interpretación cualitativa de los mismos.
—Nivel de aspiraciones e intereses del sujeto.
—Aspectos afectivos de la personalidad.
f.. Integración de los resultados junto con la historia del sujeto de modo que
podamos tener una comprensión completa del caso.
232 Fernando Jimenez
CUADRO 10.4. Modelo de informe psicológico propuesto por Fernández-Ballesteros (1983)

AA A A A za
Nombre y apellidos del evaluador: Fecha de la evaluación: Colegiado N*: __
—Edad
—Sexo
1. DATOS PERSONALES: LEEN
—Profesión
—Escolaridad
2. REFERENCIA Y OBJETIVOS: | —Motivo

— Opjetivosde planteados
la evaluación
—Lejano
—En su contexto: des
—Próximo
3. DATOS BIOGRÁFICOS RELEVANTES:
—Datos sociodemográficos
4. TÉCNICAS Y PROCEDIMIENTOS UTILIZADOS:
—Área de la motricidad
5. CONDUCTA OBSERVADA: —Area verbal
—Actitudes inferidas
—Exploraciones
psiconeurológicas
—Condiciones biológicas: —Exploraciones
psicofisiológicas
—Exámenes físicos
(resumen)
6. INTEGRACIÓN DE LOS —Repertorios Básicos —Funciones intelectuales

RESULTADOS: de Conducta (RBC): —Funciones orécticas
—Funciones psicomotrices
—Área de la motricidad
—Conductas problemas: —Area fisiológica
—Area cognitiva
Relaciones socioambientales:
7. ORIENTACIÓN Y OBJETIVOS DE INTERVENCIÓN:
8. VALORACIÓN DE INTERVENCIONES:
CUADRO 10.5. Puntos básicos que se deben incluir en un informe psicológico
1. DATOS DE IDENTIFICACIÓN
2. MOTIVO DE LA CONSULTA
3. TÉCNICAS EMPLEADAS
HH
4. CONDUCTA OBSERVADA
5. RESULTADOS OBTENIDOS
6. INTEGRACIÓN DE LOS RESULTADOS
7. DIAGNÓSTICO Y PRONÓSTICO
8. RECOMENDACIONES TERAPÉUTICAS
g. Diagnóstico y pronóstico:
—El diagnóstico final sugerido por el psicólogo debe ser una conclusión ba-
sada en una integración de las declaraciones formuladas en cada apartado.
—Se deben evitar “etiquetas diagnósticas” que reducen la realidad de la
complejidad de la conducta humana a una definición “estática” (Marto-
rell, 1988).
—En función de los resultados obtenidos y de la historia del sujeto se harán
las predicciones que el psicólogo considere acerca de la evolución que
puede presentar el sujeto, tanto en el caso de que siga un tratamiento
como en el caso contrario.
h. Recomendación terapéutica o de intervención:
—Según el diagnóstico y pronóstico se realizarán las recomendaciones tera-

péuticas que se consideren más convenientes.
VI. ALGUNAS CONSIDERACIONES PARA REDACTAR EL INFORME
Cuando nos disponemos a elaborar un informe son muchos los interrogantes que
nos planteamos: ¿cuál es el enfoque que debo emplear?, ¿qué material debe de ser in-
cluido en el informe?, ¿qué terminología empleo?, las pruebas aplicadas, ¿las refiero
por sus iniciales o por el contrario hago una breve exposición de cada una de ellas?,
¿qué extensión debe tener un informe?, ¿el informe debe analizar todo lo relaciona-
do con las habilidades y personalidad del paciente además de los datos cuantitativos
obtenidos del rendimiento de éste?, ¿debo razonar todas las deducciones o conclu-
siones obtenidas proponiendo un ejemplo?, ¿hago un resumen final?, etcétera.
Tallent (1983) solicitó a una muestra de 1400 sujetos formada por psicólogos,
psiquiatras y asistentes sociales, siguiendo la técnica de Rotter, que completasen la
siguiente frase: «el problema de los informes psicológicos es que...». Los resultados
de la encuesta señalaron que los principales problemas de los informes psicológicos
se centraban en tres aspectos: la terminología técnica empleada (tanto psicológica
como psiquiátrica), la ambigitedad de los términos y la falta de organización y preci-
sión del informe.
Como norma general es necesario tener muy claro cuál es el objetivo del informe
y dar respuesta a los interrogantes planteados en el momento en que el sujeto fue re-
querido para la evaluación. Los criterios prácticos que señala Sattler (1982), tomados
de Sargent (1951), para saber apreciar cuál es el material que se debe incluir en un in-
forme, son referidos por la naturaleza del problema que indujo a la evaluación, fina-
lidad de las pruebas y características de las personas para las que escribe el informe.
Pueden incluirse datos que, aunque aparentemente se aparten del tema esencial, pue-
den tener implicaciones importantes. En los informes no es conveniente siempre es-
pecificar los diferentes “pasos” que nos han conducido a las inferencias, conclusio-
nes, recomendaciones y formulaciones diagnósticas; sin embargo, es necesario
referirse a los datos originales sobre los que se basan las inferencias (Sattler, 1982;
Martorell, 1988).
Con respecto al grado de certeza que debemos utilizar en el informe, quizás este-
mos demasiado acostumbrados a emplear con bastante frecuencia las palabras “pro-
bablemente”, “tal vez”, “parece que” o semejantes cuando no estamos completa-
mente seguros de nuestras predicciones, deducciones o conclusiones. Cuando
tengamos la seguridad de datos fiables, seguros y definitivos, démosle convicción
presentándolos con toda confianza.
En la elaboración del informe es importante ofrecer e insistir en la presencia de
datos o rasgos de comportamiento más que en su ausencia. Podríamos hacer una lis-
ta de aspectos que no posee el paciente y no tiene nada que ver con el motivo de la
consulta, ya que éste no es nuestro objetivo. No obstante, sería interesante hacer alu-
sión a algunas características ausentes cuando el foco del informe coincide con el
motivo de la consulta. Es conveniente citar siempre la fuente de información cuando
se afirma algo que no ha podido verificarse directamente. Por ejemplo: «según la
maestra ...», «de acuerdo con el informe presentado por el psicólogo del colegio....».
Con respecto al lenguaje y terminología que debemos emplear, hemos de tener
como norma general que el destinatario del informe llegue a entender lo que noso-
tros le queremos decir. En consecuencia, es necesario ajustar la terminología y el len-
guaje según el remitente. En el caso de que no nos pudiera entender, se hace necesa-
rio una entrevista para su mejor comprensión (Fernández-Ballesteros, 1983). Con
un lenguaje abstracto, con frases e ideas excesivamente generales o una terminología
demasiado específica o profesional, sin tener en cuenta el nivel cultural o la profesio-
nalidad del destinatario, lo único que conseguimos es hacer inútil nuestro trabajo. El
lenguaje debe ser claro, sencillo, preciso y sin ambigúedades. Un informe lleno de
ambigúedades y generalidades seguramente va a producir una interpretación erró-
nea. Lo mismo ocurre cuando el informe se encuentra elaborado con frases deducti-
vas incorrectas e inexactitudes. No obstante, tampoco sería correcto emplear un len-
guaje chabacano y excesivamente vulgar que reste seriedad y rigurosidad científica al
informe.
Como regla general no deben usarse abreviaturas en el informe. No obstante,
Sattler (1982) admite el uso de CI (cociente intelectual), EM (edad mental) y EC (edad
cronológica). Probablemente, en el ámbito cultural español, y no siendo el destina-
tario un profesional de la psicología, podemos encontrarnos con problemas al no es-
pecificar incluso estas mismas siglas aludidas por Sattler.
A modo de resumen exponemos los principios normativos para la elaboración
del informe de Emerick y Hatten (1974):
a. Quela exposición sea directa y objetiva.

b. Repasar el informe cuidadosamente para asegurarse de que la ortografía,
gramática y puntuación son correctas.
c. Cuidar la semántica, evitando palabras muy comunes o nebulosas, expresto-
nes demasiado personales y frases estereotipadas.
d. Evitar escribir un informe tan superficial que pueda aplicarse a cualquier su-
¡eto; por el contrario, que el informe describa las características exclusivas de
un sujeto determinado.
Que el informe sea “compacto”.

No hacer del informe un pretexto para exhibir la sabiduría personal o para
hacer alarde de la riqueza de vocabulario.
Apegarse a los datos hasta el momento de resumir las propias observaciones
o proponer algunas interpretaciones.
Finalmente, no debemos descuidar los principios éticos y la deontología que im-

plica a todos los profesionales de la psicología. Son muchos los autores (Cameron y
Shepel, 1981; Sattler, 1982; Fernández-Ballesteros, 1983; Tallent, 1983; Silva, 1985;
Martorell, 1988; Ávila y cols., 1992) que en sus estudios sobre el informe hacen refe-
rencia a este aspecto de la profesionalidad.
El Código deontológico del psicólogo, en su capítulo V (artículos 39 al 49, ambos
inclusives) recoge los puntos principales referidos a la obtención y uso de la infor-
mación (Colegio Oficial de Psicólogos, 1987). A modo de resumen, exponemos lo
más importante de cada artículo:
a. Artículo 39. Derecho a la propia intimidad. Recabar solamente la informa-

ción estrictamente necesaria.
b. Artículo 40. Sobre la obligación del secreto profesional.
Artículo 41. Autorización del cliente para comunicar a terceras personas los
datos obtenidos de la evaluación.
Artículo 42. Derecho del cliente a ser informado del hecho de la evaluación
y del destinatario del informe, cuando dicha evaluación haya sido solicitada
por otra tercera persona.
Artículo 43. Confidencialidad del informe.
Artículo 44. No obtener provecho propio de la información obtenida.
Artículo 45. No identificar al sujeto, o su correspondiente autorización,
cuando se trate de exposición pública de casos clínicos.
T Artículo 46. Responsabilidad personal del psicólogo de custodiar los datos
00759
psicológicos obtenidos para que las personas ajenas no puedan acceder a
ellos.
Artículo 47. Ante la presencia de personas para la evaluación, se requiere el
permiso expreso del cliente.
Artículo 48. Los informes psicológicos habrán de ser claros, precisos, rigu-
rosos e inteligibles para su destinatario. Deberán expresar su alcance y limi-
taciones, el grado de certidumbre que, acerca de sus varios contenidos, po-
sea el informante, su carácter actual o temporal, las técnicas utilizadas para
. elaboración, haciendo constar en todo caso los datos del profesional que
o emite.
Artículo 49. Obligación del secreto profesional, incluso en caso de falleci-
miento del cliente.
El informe psicológico : 237
Appelbaum, S. A. (1970). Science and persuasion in the psychological test report. Journal of
_ Consulting and Clinical Psychology, 35, 349-355.
Avila, A., Ortiz, P. y Jiménez, F. (1992). El informe psicológico en la clínica. En A. Ávila
(dir.), Evaluación en psicología clínica I: proceso, método y estrategias psicométricas. Sala-
manca. Amarú.
Bringmann, W. G., Pakula, C. y Balance, W. D. (1978). Acceptance of oral and writen psy-
chological reports by clients. Perceptual and Motor Skills, 46, 1022.
Cameron, R. y Shepel, L. (1981). Strategies for preserving the confidentiality of psychologi-
cal reports. Canadian Psychology, 22, 191-193.
Colegio Oficial de Psicólogos (1987). Código deontológico del psicólogo. Madrid. COP.
Dana, R. (1982). An human science model for personality assessment with projective techni-
que. Springtield. Charles C. Thomas.
Emerick, L. L. y Hatten, J. T. (1974). Diagnosis and evaluation in speech pathology. Nueva
York. Prentice-Hall.
Fernández-Ballesteros, R. (1983). Comunicación de los resultados del proceso: el informe.
En R. Fernández-Ballesteros (dir.), Psicodiagnóstico (vol. 1). Madrid. UNED.
Foster, A. (1951). Writing psychological reports. Journal of Clinical Psychology, 7, 195.
Hammond, K. R. y Allen, J. M. (1953). Writing clinical reports. Nueva York. Prentice-Hall.
Heiss, R. (1964). Methodik and problematik des psychologischen Gutachtens. Gotinga. Hogrefe.
Huber, J. T. (1961). Report writing in psychology and psychiatry. Nueva York. Harper and Row.
Kipnowski, A. (1981). Hinweise fur die gestaltung psychologischer Gutachten. Psychologie
und Praxis, 25, 183-190.
Maloney, M. P. y Ward, M. P. (1976). The psychological report. En M. P. Maloney y M. P.
Ward (dirs.), Psychological assessment. A conceptual approach. Nueva York. Oxford Uni-
versity Press.
Sargent, H. D. (1951). Psychological test reporting: An experiment in comunication. Bulletin
of the Menninger Clinic, 15, 175-186.
Sattler, J. M. (1982). Evaluación de la inteligencia infantil y habilidades especiales. México. El
Manual Moderno.
Silva, F. (1985). Cuestiones deontológicas en el diagnóstico psicológico. En F. Silva (dir.). Psi-
codiagnóstico: teoría y aplicación. Valencia. CESPU. )
Tallent, N. (1980). Report writing in special education. Nueva Jersey. Prentice-Hall.
Tallent, N. (1983). Psychological report writing. Nueva Jersey. Prentice-Hall.
Tallent, N. (1987). Computer-generated psychological reports: A loock at the modern psy-
chometric machine. Journal of Personality Assessment, 51, 95-108.
Weed, 1. B. (1970). Medical records, medical evaluation and patien care. Cleveland. Western
Herserve University.
Wiener, ]. y Kohlert, S. (1986). Parent's comprehension of psychological reports. Psychology
in the Schools, 23, 265-270.
Ávila, A., Ortiz, P. y Jiménez, F. (1992). El informe psicológico en la clínica. En A. Ávila

(dir.), Evaluación en psicología clínica 1: proceso, método y estrategias psicométricas. Sala-
manca. Amarú.
Fernández-Ballesteros, R. (1992). La comunicación de los resultados del proceso: el informe.

En R. Fernández-Ballesteros (dir.), Introducción a la evaluación psicológica (vol. 1). Ma-
drid. Pirámide.
Fierro, A. (1986). Fluctuaciones en la autoestima tras un informe psicológico. Estudios de Psi-
cología, 26, 47-57.
Klopfer, W. G. (1960). El informe psicológico. Uso y comunicación de los descubrimientos psi-
cológicos. Buenos Aires. Tiempo Contemporáneo.
11. DEONTOLOGÍA Y EVALUACIÓN PSICOLÓGICA
LEANDRO S. ALMEIDA Y GUALBERTO BUELA-CASAL
I. INTRODUCCIÓN
En este capítulo se pretende mostrar una serie de ideas generales sobre aquellas con-
ductas más deseables a la hora de realizar una evaluación psicológica. Una informa-
ción más específica (sobre todo acerca del uso de los tests psicológicos) se puede en-
contrar en códigos elaborados para tal efecto por las asociaciones de psicología en
los diferentes países. Un ejemplo de estos códigos lo constituyen las sucesivas revi-
siones de los Standards for educational and psychological tests elaboradas y publica-
das por la American Psychological Association (APA) (American Psychological
Association, 1985).
Sin caer en un discurso demasiado moralista o legalista, procuraremos a través
del texto expresar algunas ideas u orientaciones generales y no principios o normas
de conducta. Sin duda, consideramos al propio psicólogo como parte significativa de
la responsabilidad del carácter científico de su práctica y, en este caso concreto, de la
evaluación psicológica que realiza. Sin embargo, este margen de libertad del psicólo-
go no puede ir en contra de valores universalmente aceptados. Estos valores forman
parte de la práctica psicológica y justifican la elaboración de códigos de conducta
por parte de los psicólogos. Por otro lado, se trata de ideas y orientaciones generales
que por sí mismas poco dicen acerca de la utilización concreta de las pruebas psico-
lógicas y del procedimiento de evaluación. El lector debe buscar esta información
más técnica y específica en manuales técnicos de las diferentes técnicas de evaluación
psicológica (observación, registros psicofisiológicos, tests psicológicos, etcétera).
Por último, tomaremos como punto de referencia el empleo de las pruebas psi-
cológicas. A pesar de que la evaluación psicológica es un concepto mucho más am-
plio, abarcando toda la conducta inherente a la apreciación de las características de
las personas o grupos, consideramos que las cuestiones de tipo deontológico se ilus-
tran mejor y se hacen más fácilmente comprensibles si nos limitamos al uso de prue-
bas o tests psicológicos.
En las últimas décadas, la evaluación psicológica no ha recibido las mejores refe-
rencias por parte del público y el mejor aprecio posible por parte de los propios psi-
cólogos. Se puede establecer una diferencia clara del papel de la evaluación psicoló-
gica, y en concreto de los tests psicológicos, entre las décadas de los años treinta y
cuarenta y las décadas de los años setenta y ochenta. No sólo las pruebas psicológi-
cas son menos usadas en la actualidad, sino que también se han formulado varias crí-
ticas a su empleo. La asociación realizada entre tests psicológicos y decisiones discri-
minatorias que no respetan los derechos de las minorías constituye el origen
Universidad de Minho (Portugal) y Universidad de Granada.

240 Leandro S. Almeida y Gualberto Buela-Casal
—cespecialmente en Estados Unidos— de una legislación bastante restrictiva en el

empleo de los tests (Bersoff, 1981). De forma paralela a la evolución en el saber y en
la práctica de la psicología debemos establecer algunas consideraciones de carácter
deontológico como forma de salvaguardar el papel de la evaluación en la investiga-
ción e intervención psicológica. De hecho, los movimientos antitests, especialmente
las posiciones legislativas asumidas en Estados Unidos, siempre tomaron en su de-
fensa aspectos éticos del uso y “abuso” de los tests (Brim, Neulinger y Glass, 1965).
Un análisis objetivo de los problemas nos posibilita defender la importancia de la
evaluación en la investigación y práctica psicológica. En encuestas realizadas en di-
versos países, los psicólogos de forma mayoritaria reconocen la importancia de la
evaluación en su práctica, así como el uso de los tests como forma de asegurarse una
mayor objetividad de la evaluación (Poortiga y cols., 1982; Almeida y Cruz, 1995).
Estos hechos justifican no sólo el esfuerzo en la mejoría de los instrumentos y pro-
cedimientos, sino también la garantía de los principios deontológicos en torno a la
IL. PRINCIPIOS DEONTOLÓGICOS EN LA EVALUACIÓN PSICOLÓGICA
La evaluación está siempre presente en cualquier actividad científica, así como en la

actividad profesional cotidiana; además, en la actualidad, en las relaciones con los
otros nos encontramos frecuentemente con posturas de evaluación. Asumiendo di-
ferentes formas, correspondiendo a diferentes finalidades o teniendo diversas impli-
caciones, podemos afirmar que la evaluación forma una parte importante de nuestro
quehacer cotidiano. Por tanto, no es extraño que seamos unos continuos evaluados
y evaluadores. Entonces, ¿cómo puede una práctica tan básica del conocimiento y de
la práctica científica y, a su vez, tan cotidiana en nuestros días implicar tantas posi-
ciones —a veces extremas— de rechazo o de plena aceptación en psicología? La res-
puesta no es fácil, y mucho menos aceptada por todos. Diversos factores explican las
reacciones en el momento actual en torno a la evaluación psicológica. Tomaremos en
consideración únicamente aquellos factores que pueden estar asociados a los aspec-
tos deontológicos de tal evaluación, y así situarnos en tres líneas diferentes:
a. Los procedimientos, el material y las condiciones de evaluación.

b. Los sujetos implicados en la evaluación.
c. La interpretación de los resultados y las conclusiones.
1.1. Los procedimientos, el material y las condiciones de evaluación

La evaluación psicológica corresponde siempre a una necesidad. Posiblemente en la
historia de la psicología y en la época del apogeo de los tests, la práctica psicológica
se asoció a la fase de evaluación psicológica. El psicólogo, definido como “profesio-
nal de tests”, consideraba la evaluación como un modo de definir su espacio y esta-
tus profesional. Sin embargo, la evaluación psicológica no puede ser un acto aislado;
Deontología y evaluación psicológica 241
no define, ni puede encerrar la práctica psicológica. La evaluación debe estar al servi-

cio de objetivos determinados, debe responder a cuestiones, a hipótesis y a necesida-
des específicas. Sea en una situación de ayuda psicológica o en una situación de selec-
ción de personal, la evaluación psicológica es necesaria como diagnóstico o
pronóstico, perteneciendo al sujeto o a su legítimo representante el derecho de parti-
cipar en los aspectos que justifican la evaluación psicológica a realizar.
Un aspecto esencial en la evaluación psicológica está relacionado con los medios
y las condiciones en que la misma tiene lugar. Al no ser posible la observación direc-
ta de las variables psicológicas, ante su inferencia y estimación a través de las conduc-
tas externas, la evaluación psicológica requiere procedimientos que garanticen el ri-
gor de la información obtenida. En este procedimiento se incluyen por norma los
instrumentos estandarizados de evaluación. Los tests, las escalas, el autorregistro y
la observación son algunas de las formas más usadas por los psicólogos en la evalua-
ción de los sujetos y de los grupos en dimensiones de carácter psicológico. Sea en un
contexto de estímulos estructurados, como por ejemplo un test formal de inteligen-
cia, sea una situación de observación en un contexto natural o de autoinforme por
parte del sujeto, el psicólogo busca un objetivo de rigor y significancia de la evalua-
ción que realiza. En el primer caso, tenemos los aspectos más ligados a los medios
usados y las condiciones en que la evaluación ocurre y, en el segundo caso, tenemos
que considerar especialmente las dimensiones psicológicas evaluadas y la forma
comportamental en que fueron operacionalizadas. Así, en relación al punto de vista
ético, el psicólogo deber procurar en la evaluación que realiza alcanzar este doble
objetivo. Debemos prestar una particular atención a la investigación que viene sien-
do realizada, especialmente la que cuestiona y reformula la teorización en torno a los
constructos psicológicos. Todavía debe llamar la atención la investigación que con-
cierne a las condiciones de la aplicación de los tests y a la influencia de determinados
factores en el desempeño máximo o típico (Cronbach, 1972) de los individuos.
Deontológicamente no sólo es reprobable que se mantengan situaciones de eva-
luación psicológica poco controladas en términos de variables presentes, sino tam-
bién el uso de ciertos instrumentos cuando la investigación es el origen o fundamen-
to teórico de los respectivos constructos, la operacionalización de los ítems de las
pruebas y la validez empírica de sus resultados. Ciertamente, de esta exigencia ética
surge un mayor intercambio entre investigadores y clínicos. Este esfuerzo es exigido
en favor de la calidad del servicio prestado, la dignidad profesional del psicólogo y el
respeto por la persona.
Procedimientos e instrumentos menos fiables y válidos comprometen la calidad
de la evaluación y las decisiones que le siguen. Procedimientos (por ejemplo, las con-
diciones del sujeto en el momento de la evaluación, las instrucciones empleadas, el
uso del ordenador como generador y administrador de los estímulos, etc.) e instru-
mentos no debidamente contrastados invalidan la evaluación realizada. Los resulta-
dos obtenidos en tales circunstancias, reflejando una interacción compleja de varia-
bles como el material, las condiciones y el propio sujeto, difícilmente aseguran la
objetividad de la evaluación. Estos aspectos asumen gran relevancia dado que la rea-
lidad psicológica no puede ser evaluada directamente, implicando por tanto la com-
prensión y la cooperación del sujeto. Un psicólogo consciente —y esto indepen-
dientemente de las solicitudes de los sujetos acerca de una determinada evaluación o
aplicación de determinada prueba— debe recusar una evaluación realizada en cir-

cunstancias de dudosa objetividad. El esfuerzo en la estandarización debe ser mayor
en el caso de la evaluación de las características y capacidades de los sujetos en rela-
ción a un grupo normativo. En este campo, los estudios diferenciales nos han permi-
tido aislar variables no estrictamente psicológicas que influyen en el rendimiento de
los sujetos, tales como la edad, el sexo, el grupo étnico, la clase social, las habilidades
académicas y el estatus urbano o rural. Por tanto, es importante que las condiciones
de aplicación y las normas de interpretación de los resultados de las pruebas psicoló-
gicas tengan en consideración estos aspectos y los expliquen para la información y
toma de decisiones del psicólogo.
Los editores de tests y otras pruebas psicológicas deben proporcionar al psicólo-
go la información técnica necesaria para su utilización. Así, el manual que acompaña
una prueba psicológica debe caracterizarse por la seriedad y la sobriedad de infor-
mación, y de ningún modo debe inducir a errores o crear falsas expectativas. La ter-
minología empleada debe minimizar errores de interpretación y no provocar impre-
cisiones en sus usuarios. En cuanto al contenido, éste debe ser claro, así como sus
características técnicas, su proceso de desarrollo y su administración. Asimismo,
deben estar descritos en el manual los parámetros estadísticos referentes a los ítems y
a los resultados, así como los procedimientos estadísticos seguidos y las muestras
utilizadas. Esta información no sólo sirve al psicólogo para analizar e interpretar el
desempeño del sujeto evaluado, sino también para tomar decisiones acerca de su
aplicación o no en una fase previa. Evidentemente, esta decisión previa presupone la
existencia de información precisa y clara sobre el instrumento en cuestión. Sería
bueno que esa información fuese ya diferenciada en función de grupos de sujetos o
de objetivos. Sabemos que las estandarizaciones son siempre relativas a un determi-
nado grupo y a un determinado objetivo y, cuanto más pormenorizados estén estos
aspectos, mayor seguridad tendrá el psicólogo a la hora de usar la prueba en cues-
tión.
12. Los sujetos implicados en la evaluación

En la evaluación psicológica podemos diferenciar cuatro componentes: quién la soli-
cita, quién la realiza, quién se somete a ella y quién va a utilizar los resultados. Si en
relación a quién la realiza no nos quedan dudas de que será el psicólogo, en la solici-
tud de la evaluación y en el uso de la misma pueden intervenir diferentes personas.
Gran parte de las cuestiones deontológicas inciden en este punto, es decir, cuando la
evaluación es solicitada y empleada por otra/s persona/s que no es el sujeto eva-
luado.
De hecho, en algunas ocasiones quien solicita la evaluación psicológica y quien
más tarde va a emplear los resultados obtenidos en sus decisiones, no es el sujeto de
la evaluación ni tampoco el psicólogo. Médicos, profesores y gestores de personal
recurren con cierta frecuencia a los psicólogos para tareas de diagnóstico y evalua-
ción psicológica de sus pacientes, alumnos o trabajadores. Por norma, son también
éstos los protesionales que más directamente emplearán la información obtenida en
la evaluación. Independientemente del nivel de formación en psicometría de estos
profesionales, conviene aclarar algunas cuestiones. En primer lugar, el psicólogo

mantiene la responsabilidad técnica sobre la decisión de la evaluación, las condicio-
nes en que la misma se realiza y el empleo que se hace de los resultados. Lo mismo
sucede en situaciones de evaluación colectiva cuando el psicólogo es sustituido en la
aplicación de baterías de pruebas por personas menos cualificadas; en estos casos el
psicólogo también debe supervisar el trabajo. Patrones de exigencia técnica científica
cubren aspectos que van desde la elección de las pruebas hasta la elaboración del in-
forme y uso de la información, pasando por la aplicación y corrección de las prue-
bas, y el análisis e interpretación de los resultados. En segundo lugar, es importante
que los psicólogos y otros profesionales tengan conciencia de que el primer “propie-
tario” de los resultados es el sujeto evaluado; éste tiene una serie de derechos, entre
los que destaca el derecho a la privacidad, al respeto, al sigilo y a la singularidad. El
psicólogo asume aquí una responsabilidad de no tener más dominio que el empleo
de la información recogida (Pelechano, 1988). Diversas confusiones son frecuentes
entre los derechos de pertenencia y los derechos de utilización, a veces magnificadas
por la aparición de un tercer elemento, una institución o persona que solicita y
“paga” la evaluación. Dentro del código deontológico, éste constituye uno de los
puntos que mayor atención debería merecer, tanto por parte de los profesionales
como por parte de la comunidad científica y las asociaciones de psicología.
Hay otros dos aspectos que nos parecen también relevantes cuando la evalua-
ción es solicitada por otra persona distinta a la evaluada; por un lado, el conocimien-
to y el acuerdo claro por parte del sujeto acerca de los objetivos, ámbito y tipo de
empleo de la evaluación y, por otro, el derecho que asiste al sujeto en conocer los re-
sultados y conclusiones. Desgraciadamente, estos aspectos no siempre aparecen
contemplados, y no siempre su falta es responsabilidad de los psicólogos. Estos y
otros problemas éticos han aumentado su incidencia e intensidad en los últimos
años, debido al hecho de que otros profesionales (médicos, profesores, gestores de
personal, técnicos de servicio social, etc.) se autocalifican de evaluadores psicológi-
cos, tal vez aprovechando un menor acometido en las tareas de evaluación psicoló-
gica por parte de los psicólogos.
En relación al psicólogo —agente de evaluación— es importante que conozca
técnicamente los medios que utiliza. Este conocimiento va más allá de los procedi-
mientos metodológicos y las condiciones de evaluación (materiales, instrucciones,
tiempo...). El análisis e interpretación de los resultados de las pruebas psicológicas
requiere una formación general en las dimensiones evaluadas y una formación espe-
cífica en cada prueba por parte del psicólogo. Defender que esta formación especíti-
ca Únicamente es necesaria para pruebas proyectivas es no querer reconocer que en
el caso de inventarios objetivos de personalidad y en baterías multifactoriales de ap-
titudes surgen discrepancias en los resultados y perfiles que sólo un amplio conoci-
miento asociado a la intuición empírica del psicólogo consigue esclarecer. En resu-
men, nadie por ser psicólogo se encuentra automáticamente legitimado para emplear
cualquier prueba de evaluación psicológica. Si esto es verdad respecto alpsicólogo,
más cierto es todavía en relación a otros profesionales que en la actualidad parecen
reclamar para sí esta área de intervención de los psicólogos. Cuando asistimos a una
reducción en las licenciaturas de psicología de disciplinas orientadas a los tests psico-
lógicos y al psicodiagnóstico, consideramos pertinente recordar que la información
específica de los psicólogos en este campo incluye el conocimiento de diversas técni-

cas, así como de los aspectos a considerar en su elección, las condiciones generales y
específicas de su aplicación, los procedimientos de corrección y normalización de
los resultados, la integración de la información, su interpretación y conclusiones, y
la presentación de la información al sujeto evaluado y a quien solicitó su evaluación.
Todos estos aspectos ponen de manifiesto lo difícil que es en evaluación psicológica
mantener el nivel de objetividad necesario, por lo que es necesario preparar a los psi-
cólogos para garantizar los principios deontológicos en su práctica.
El sujeto objetode evaluación debe estar en sus condiciones normales o, al me-
nos, en condiciones que no distorsionen su desempeño. Es cierto que la conducta
humana está en parte determinada por el ambiente, pero no podemos ignorar el pa-
pel de las condiciones psicofisiológicas del sujeto en las respuestas emitidas. En la ac-
tualidad, conocemos el papel determinante que sobre el desempeño tienen las varia-
bles sociocognitivas (expectativas de éxito o fracaso, atribuciones causales de los
resultados, sentimientos de autoeficacia, conocimiento de los procedimientos a to-
mar...). El psicólogo no puede ignorar o despreciar estas variables. El hecho de apli-
car tests debe representar un compromiso entre una situación de laboratorio (bus-
cando la objetividad máxima de la información) y una situación natural o
significativa para el sujeto (buscando el significado de la información recogida).
De este modo, el psicólogo debe conocer los factores ambientales o personales
del sujeto que pueden interferir en su desempeño; inclusive, puede concluir que no
siempre el sujeto está preparado para la evaluación programada. Como mínimo
debe prestar atención a esos aspectos en el análisis de los datos obtenidos. Hay que
mencionar también la preocupación del psicólogo por actitudes y conductas poco
sinceras del sujeto en los tests, mejorando su desempeño o su imagen. Por ejemplo,
en algunos cuestionarios de personalidad existen escalas de “detección de mentiras”,
en tests de aptitudes cognitivas se incluyen cuatro o cinco alternativas de respuesta
con el fin de disminuir el margen de azar en el número de aciertos. La búsqueda de la
objetividad en evaluación psicológica justifica a nuestro entender estas precauciones
por parte del psicólogo. Con todo, no podemos dejar de aludir a la presencia e in-
fluencia en los resultados de otros factores externos y que, en sentido contrario, pro-
porcionan imágenes y resultados menos positivos del sujeto. Además, el psicólogo
debe reconocer que en la interpretación que hace de los resultados de un sujeto pue-
de estar inducido al error por factores relacionales no directamente evaluados como
el sexo, la edad, las creencias o el estatus socioeconómico del sujeto evaluado.
Desgraciadamente —en la mayoría de las ocasiones felizmente— la conducta
humana presenta siempre un matiz de individualidad del sujeto y de la singularidad
del hecho interactivo de ese factor con el contexto que lo precede, acompaña o sigue.
Así, se explica que incluso cuando creemos establecidas las mismas condiciones para
todos los sujetos, la individualidad del sujeto y la singularidad de la situación echa
por tierra la posibilidad de afirmar el rigor de la evaluación y de la comparación in-
tersujetos.
13. Interpretación de los resultados y conclusiones

Por regla general, es en las fases de interpretación de los resultados y en la elabora-
ción de las conclusiones cuando más se necesita de la formación y experiencia del
psicólogo en evaluación psicológica. Si en la aplicación colectiva de las pruebas y, de
forma especial, en la corrección mecánica, otra persona puede sustituir —e incluso
con mayor éxito— al propio psicólogo (por ejemplo, un lector óptico en ítems de
elección múltiple), esto no puede suceder en la fase de interpretación de los resulta-
dos. Situaciones anómalas de diagnósticos no concluidos o contradictorios surgen
en el momento en que esa competencia del psicólogo es sustituida por un programa
informático o por otro profesional, incluso con una amplia formación en psico-
tecnia.
Un segundo punto de análisis está relacionado con el carácter altamente sensible
de la interpretación de resultados y elaboración de conclusiones en evaluación psi-
cológica. Esta alta sensibilidad en las conclusiones explica el porqué frecuentemente
es éste el momento por excelencia para la crítica a los tests. Especial cuidado, al me-
nos moralmente, merecen las evaluaciones en el contexto clínico y escolar solicitadas
por otras personas. Con cierta frecuencia, el empleo de tests psicológicos fue asocia-
do al etiquetamiento de problemas y cuadros clínicos de muy poca utilidad para los
sujetos evaluados. Estos aspectos nos remiten a otros tantos problemas deontológi-
cos en la evaluación psicológica. Un cierto significado y poder mítico ha envuelto
este resultado por parte de algunos psicólogos, de amplios sectores del público o de
otros grupos profesionales. Es importante considerar esto desde el principio como
una estimación del desempeño y no como la capacidad o la personalidad del sujeto;
como estimación que es, este resultado refleja las circunstancias de espacio y de
tiempo en que fue observado. Por tanto, no puede ser tomado como absoluto o,
peor todavía, como estable o permanente. En definitiva, muchos cuidados se merece
la formulación de juicios de valor sobre la conducta presente o su pronóstico futuro
por parte del psicólogo.
TI. CONCLUSIONES
No es fácil extraer unas conclusiones acerca de la temática del presente capítulo. No

obstante, siempre queda algo por decir o clarificar. Consideramos que los principa-
les problemas fueron identificados a lo largo del texto. Sin embargo, para terminar
nos gustaría hacer referencia a tres puntos a los que somos especialmente sensibles:
la comercialización abusiva realizada de los tests psicológicos, el uso indiscriminado
de la evaluación psicológica a través del ordenador y la necesidad de un mayor de-
sarrollo por parte de las escuelas, asociaciones científicas y profesionales de la psico-
logía en este asunto. CA 7D hz
En primer lugar, la distribución y comercialización de las pruebas psicológicas
debe estar ligada a los psicólogos (mediante presentación de certificado profesional
o equivalente). La formación, especialmente de estudiantes de psicología, puede per-
mitir la venta y el uso de las pruebas psicológicas por otros que no sean psicólogos;
en estos casos, es el profesor el responsable del uso de las pruebas. Un problema fre-
cuente que nos encontramos aquí es el de la reproducción (fotocopiado) del mate-
rial. Aparte de los derechos editoriales, esta práctica estudiantil da lugar a la vulgari-
zación de algunas pruebas entre el público, quitándoles cualquier significado en usos
futuros (y más grave todavía es cuando el psicólogo no tiene conocimiento de ello).
En segundo lugar, es importante analizar el empleo de los ordenadores en laeva-
luación psicológica. No habría mayores problemas cuando su empleo se asocia a la
generación de ítems y su presentación a los sujetos, y a la corrección y puntuación de
los resultados. En nuestra opinión, si la elaboración y aplicación de ítems se hace
de una forma sensata y encontrándose el sujeto en condiciones normales frente al
ordenador, no habría problemas en su empleo en tareas de evaluación. La corrección
y puntuación de los resultados por vía informática no nos merece comentarios nega-
tivos; normalmente, la frecuencia de error en comparación al factor humano es me-
nor. No obstante, es importante que las condiciones de aplicación estén estandariza-
das. Un uso de los ordenadores en evaluación psicológica menos frecuente, pero no
por ello menos importante, es la elaboración de perfiles psicológicos y, especialmen-
te, la síntesis interpretativa de los resultados. Si ya la elaboración del perfil nos ofrece
algunas dudas, puesto que no siempre el softawvare da lugar a un análisis minucioso de
la interacción necesaria entre las características del sujeto y los resultados obtenidos,
la interpretación de los resultados, la interpretación del perfil y la elaboración de las
conclusiones nos merece las mayores reservas. Hasta el momento podemos afirmar
que el ordenador no consigue integrar e interrelacionar los resultados obtenidos, no
siempre convergentes entre sí. Las disonancias momentáneas verificadas en pruebas
y momentos de la evaluación requieren de la formación básica y específica del psicó-
logo, además de su experiencia e intuición. Sólo así, y siempre relativamente, pode-
mos interrelacionar y describir coherentemente una individualidad psicológica eva-
luada. Un ejemplo de ello es la importancia que tiene la entrevista o la anamnesis que
el psicólogo debe incluir siempre como medio de evaluación psicológica. Otras in-
terpretaciones de este asunto, o la defensa de la evaluación psicológica “vía ordena-
dor”, proporcionaría más pronto o más tarde nuevos reveses o confusiones en la in-
vestigación y práctica de la psicología.
Por último, cabe analizar la actuación asumida por las universidades y por las
asociaciones científicas y profesionales de psicología. En nuestra opinión, estas insti-
tuciones deberían tener una opinión más fundamentada y una posición más incisiva
y pública acerca de los aspectos deontológicos de la evaluación psicológica, en una
lógica defensa tanto de la psicología y de los psicólogos como del público usuario.
Así, un aspecto que urge clarificar es el concepto de prueba psicológica. Varios ins-
trumentos de evaluación clínica, educacional y social son empleados en la actualidad
de modo indiscriminado por psicólogos y otros técnicos. Al mismo tiempo se verifi-
ca una gran proximidad entre evaluación psicológica y evaluación educacional, por
ejemplo, a nivel de infancia o en lo que respecta al desarrollo psicológico, o qué sig-
nifica en varios países su uso indiscriminado por los psicólogos, consejeros o profe-
sores (señálese que los standards de la APA cubren estos dos grupos de pruebas y es-
tos diferentes profesionales). Sería relevante distinguir aquí cuáles son pruebas
psicológicas y cuáles no, puesto que las primeras —por lo que hemos dicho a lo lar-
go del texto— sólo deben ser empleadas por el psicólogo. Las asociaciones científi-
cas y profesionales deben asumir respecto a la evaluación psicológica actitudes de
garantía de su calidad técnica y deontológica, incluyendo la penalización de los abu-
sos. Lo antes posible, los instrumentos de evaluación psicológica deberían estar de-
bidamente identificados, exigiendo el título de psicólogo para su empleo. Al mismo
tiempo deben asegurarse estudios de validación de las pruebas y de los procedimien-
tos de evaluación que mantengan actualizados sobre todo los parámetros normati-
vos de interpretación de sus resultados. La falta de tales preocupaciones respecto a la
mejoría técnica o a la ausencia de procedimientos de investigación más claros en re-
lación a la evaluación psicológica ha dado lugar a la aparición de prácticas desacredi-
tadoras de la psicología en general. Sin estudios de “control de calidad” como sucede
en otras áreas de la vida social (por ejemplo, el área de salud) se deteriorá la imagen
de la psicología y de los psicólogos. La evaluación psicológica es todavía una de las
referencias más sensibles e importantes de la práctica psicológica para que pueda ser
abandonada.
Almeida, L. S. y Cruz, M. O. (1985). A utilizagao dos tests psicológicos: Resultados de um

inquérito junto dos psicólogos portugueses. Jornal de Psicología, 4, 13-17.
American Psychological Association (1985). Standards for educational and psychological tes-
ting. Washington, D.C. APA.
Bersoff, D. N. (1981). Testing and the law. American Psychologist, 36, 1047-1058.
Brim, O. G., Neulinger,J. y Glass, D. C. (1965). Experiences and attitudes ofAmerican adults
concerning standardized intelligence tests. Nueva York. Russell Sage Foundation.
Cronbach, L. J. (1972). Fundamentos de la exploración psicológica. Madrid. Biblioteca
Nueva.
Pelechano, V. (1988). Del psicodiagnóstico clásico al análisis ecopsicológico (vol. 2). Valencia.
Alfaplús.
oa Y. H., Coetsier, P., Meuris, G., Miller, K. M., Samsonowitz, V., Seismedos, N. y
Schlegel, J. (1982). A survey attitudes towards tests among psychologists in sex western
European countries. International Revue of Applied Psychology, 31, 7-34.
American Psychological Association (1985). Standards for educational and psychological tes-
ting. Washington, D.C. APA. e es
Colegio Oficial de Psicólogos (1988). Código deontológico del psicólogo. Evaluación Psico-
logica/Psychological Assessment, 4, 113-121.
50%
me cal 4) ?
a y eri 4 007 usd
sí tl ia CP Mi.ea
DN ny:
pu
AE o ile ie—
aba e ya ed lana)
- pts -. pde
"IO 0 a S
1) 4 onertolaT
«F ,
A
4
í y 2 í 15
Y ' j: 120 H4
Lao! = 5
54 Ñ ”d 2
>
(
EA a
>
j
>
va7 i
L- - l
Li + ¿ a] )
34 Et
z y >
»
SEGUNDA PARTE
TÉCNICAS DE EVALUACIÓN PSICOLÓGICA

12, CLASIFICACIÓN DE LAS TÉCNICAS DE EVALUACIÓN
PSICOLÓGICA
CARMEN GARCÍA-MONTALVO
I. INTRODUCCIÓN
Dado el volumen de instrumentos y estrategias de evaluación existentes en la actua-

lidad, provocado por el desarrollo de la ciencia psicológica en general y de la discipli-
na que nos ocupa en particular, son muchos y notables los intentos de los investiga-
dores por poner algún tipo de orden entre dichos instrumentos. Sirva como dato
cuantitativo que demuestra el ingente número de pruebas existentes, el que nos ofre-
ce la novena edición del Mental measurement yearbook (Mitchell, 1985); sólo en el
contexto de la evaluación de la personalidad existen 350 pruebas y éstas suponen
únicamente el 24,80% de todos los tests revisados; además, de éstos, el 72% ha apa-
recido desde la edición anterior de este anuario (Keller, Butcher y Slutske, 1990). De
esos intentos se ha derivado una serie de clasificaciones, que analizaremos más ade-
lante en este capítulo, y que no han tenido otra finalidad que facilitar al usuario —es
decir, al evaluador— la comprensión y el conocimiento de los mismos, para que pu-
diera realizar, con la mayor facilidad y fiabilidad posibles, la elección de las pruebas
más adecuadas para cada ocasión o momento de evaluación.
Ni que decir tiene que no en todas las ocasiones los esfuerzos han tenido igual
aceptación y/o éxito, de tal forma que unas categorizaciones han resultado ser mu-
cho más conocidas (y reconocidas) a lo largo del tiempo que otras, del mismo modo
que algunas se han manifestado más útiles para el propósito anteriormente mencio-
nado. Asimismo, y como veremos, la aceptación de las clasificaciones ha dependido
en la mayoría de las ocasiones de la claridad y utilidad de los criterios utilizados para
llevarlas a cabo; es precisamente la imposibilidad de aunar todos esos criterios (for-
males, de contenido, finalistas, procesuales, etc.) lo que ha impedido a los investiga-
dores consensuar una sola propuesta.
Sin embargo, antes de entrar a describir las clasificaciones más comúnmente usa-
das y sus criterios subyacentes, nos gustaría aclarar algunas cuestiones que guardan
estrecha relación con el tema que nos ocupa y que, a nuestro juicio, permitirán pro-
bablemente al lector comprender con más facilidad los siguientes apartados de este
capítulo. La primera de estas cuestiones tiene que ver con una aclaración puramente
terminológica; estamos hablando hasta ahora de instrumentos de evaluación y lo ha-
cemos así precisamente para hacer ver que nos referimos a todo aquello que un eva-
luador puede utilizar como legítima fuente de datos acerca de un sujeto (no entra-
mos ahora a valorar ni la utilidad, ni el prestigio, ni la validez de un tipo de pruebas u
Universidad de Murcia.
252 Carmen García-Montalvo
otro). Por tanto, se trataría de «[...] aquellos procedimientos que, derivados de las
técnicas metódicas, permiten la obtención concreta de información y de datos» (Fer-
nández-Ballesteros, 1992, p. 41); de hecho, esta autora nos habla de «procedimientos
de recogida de información», al igual que otros autores utilizan la expresión «estra-
tegias de exploración». En esta misma línea, Pelechano (1988) define las técnicas de
evaluación psicológica como procedimientos utilizados tanto en el laboratorio
como en el mundo social para la realización de una evaluación psicológica. Esta acla-
ración está dirigida a diferenciar de forma coherente las técnicas de evaluación, vistas
así de forma general, de los tests, un tipo de técnica concreta, restringida por una se-
rie de características determinadas (todas ellas relacionadas con la estandarización
del material, administración y corrección...). Por su parte, Keller y cols. (1990) nos
ofrecen la siguiente definición: <[...] se caracterizan [los tests] por la naturaleza es-
tructurada y estandarizada de sus estímulos, de las opciones de respuesta que se pre-
sentan al sujeto y de las estrategias de puntuación e interpretación».
Junto a lo anterior, también resulta de interés establecer una distinción, porque
así parece haberse establecido en la realidad, entre aplicación de tests y evaluación.
En efecto, este último es ahora un concepto más amplio. En la actualidad los psicó-
logos no se limitan a administrar tests sino que realizan evaluaciones. Keller y cols.
(1990), autores de uno de los capítulos del Handbook of psychological assessment
[Manual de evaluación psicológica], afirman que el título de la obra se escogió deli-
beradamente y pretendía transmitir la idea de que no es simplemente un libro sobre
tests psicológicos —como tampoco lo es el que el lector tiene en sus manos. El tér-
mino evaluación implica que hay muchas formas de evaluar las características y dife-
rencias individuales. La aplicación de tests es una de las formas posibles, pero tam-
bién están las entrevistas, la observación y los registros psicofisiológicos, por citar
algunas.
La identificación entre psicodiagnóstico y tests se produjo inicialmente por ra-
zones históricas. El término psicodiagnóstico se enraizó en dos “orientaciones” cla-
ramente diferenciadas; una cualitativa, iniciada a partir de la propuesta de H. Rors-
chach sobre su test, y otra que pretendía paliar la fuerte carga cualitativa de la
anterior, la psicométrica. A partir del fuerte desarrollo que a lo largo de la historia de
esta disciplina adquirió esta segunda corriente se produjo pronto un olvido de cual-
quier otro aspecto relacionado con el psicodiagnóstico que no fueran los tests y, por
ende, una correspondencia entre ambos términos. Así, el psicodiagnóstico era y se
reducía a la “testología”, y ésta se convirtió en la única instrumentación “respetada”
dentro de aquélla.
Como ya hemos adelantado, y de forma afortunada a nuestro juicio, la evalua-
ción psicológica y/o el psicodiagnóstico (considerado el término en su acepción más
amplia) han logrado finalmente reconvertirse en un proceso bastante más amplio,
completo y exhaustivo que el mero “testar”, teniendo a su disposición una “tecnolo-
gía” que a su vez no se reduce al uso de tests, por más que éstos sigan considerándose
como técnicas de uso muy común dentro de nuestro ámbito y por más que un buen co-
nocimiento de ellos y de sus fundamentos técnicos y teóricos facilite en muchos
casos la tarea de evaluación.
Una vez comentado todo lo anterior como estrategia para ubicar al lector en es-
te capítulo y como toma de postura del autor frente al mismo, pasamos a describir
Clasificación de las técnicas de evaluación psicológica 253
a continuación algunas de las clasificaciones más habituales y los criterios que las
sustentan para finalizar después con un comentario acerca del estatus actual de las
mismas.
II. TÉCNICAS DE EVALUACIÓN. ACERCAMIENTO A TRAVÉS

DE LAS CLASIFICACIONES MÁS RELEVANTES
1.1. Clasificaciones según criterios (criterio único)

Parece obvio que para intentar establecer cualquier tipo de clasificación que agrupe
un número de objetos (en nuestro caso pruebas psicológicas) han de utilizarse cier-
tos criterios. Fernández-Ballesteros (1980), Silva (1982) y Pelechano (1988) enume-
ran de forma resumida algunos de los criterios que han servido para reunir en cate-
gorías las distintas técnicas de evaluación:
a. Criterios de contenido: tienen en cuenta aquellas funciones psicológicas
para cuya evaluación hayan sido construidas las técnicas (pensamiento, len-
guaje, percepción, memoria, emociones, motivaciones, etcétera).
b. Criterios en virtud del material utilizado en ellas: técnicas de lápiz y papel,
técnicas ejecutivas, etcétera.
Criterios en razón de las personas a las que van dirigidas (adultos, niños...).
A” Criterios basados en aspectos formales; se incluye el material analizado (cri-
terio b), modos de aplicación, tipos de respuesta que requieren, tipo de ren-
dimiento, etcétera.
e. Criterios basados en la especificidad de la función psicológica que pretenden
evaluar o en el lugar del proceso de evaluación en el que se utilizan (Pelecha-
no, 1988).
A continuación recogemos algunas de las clasificaciones más representativas de

alguno de los criterios anteriormente expuestos.
111. Clasificación según el grado de generalidad de las pruebas

Tal vez sea ésta una de las clasificaciones de carácter general más conocidas; está ba-
sada en sólo dos categorías elaboradas en función de la generalidad o especificidad
de lo que se pretende evaluar (Pelechano, 1988):
a. Estrategias generales: modos y maneras genéricas que existen en la evalua-
ción psicológica y que se vienen utilizando desde hace ya décadas. Aquí se incluyen
pruebas de inteligencia y personalidad tipo “ómnibus”, entrevistas en las que «pre-
domina la emisión de información más que la extracción de la misma» (Pelechano,
1988, p. 186) y la observación directa. Estas pruebas se utilizan en las primeras fases
del proceso de evaluación con el fin de recabar datos acerca del problema y definirlo
o ubicarlo de la mejor manera posible, de tal forma que posteriormente sea factible,
mediante otros instrumentos (los pertenecientes a la otra categoría que vamos a co-
mentar), estudiarlo en profundidad y operativizarlo para que sea tratado.
b. Estrategias específicas: van dirigidas al estudio y análisis de aquellos proble-
mas específicos que se han detectado a través de técnicas más generales y/o de otros
concomitantes que puedan estar determinándolos; se trata de autoinformes, inven-
tarios sobre variables concretas (miedos, temores, asertividad, ansiedad, depre-
sión...) que nos permiten evaluar de forma más fina y minuciosa lo que se ha deter-
minado como problemático en un primer acercamiento.
Como vemos claramente, se trata de una clasificación muy amplia que única-
mente nos aclara a grandes rasgos que a lo largo del proceso general de evaluación el
psicólogo dispone de dos tipos de estrategias que podrá utilizar según el momento
del proceso en que se encuentre.
1.12. Clasificación según el tipo de rendimiento

Está considerada como una de las clasificaciones más clásicas de las técnicas de eva-
luación psicológica. Se distinguen por una parte pruebas de rendimiento máximo y,
por otra, pruebas de rendimiento típico (Cronbach, 1972).
Pruebas de rendimiento máximo
Estas pruebas exigen al sujeto que las cumplimenta que rinda al máximo de sus posi-
bilidades (Pelechano, 1988). Por tanto, se pretende evaluar «la capacidad máxima de
ejecución por parte del sujeto» (Cronbach, 1972, p. 56); son usualmente pruebas de
inteligencia —Cronbach las denomina “tests de habilidad” o que pretenden evaluar
variables cognitivas como la atención, las aptitudes espaciales, verbales, mecánicas,
musicales, etc. Además, son pruebas en las que el sujeto puede rendir menos de lo
que le permiten sus capacidades pero nunca más que su propio límite (Pelechano,
1988). A su vez, esa falta de rendimiento puede estar motivada por multitud de fac-
tores (motivación, atención, fatiga...) que son ajenos al propio instrumento, ya que
éste no los puede controlar. Normalmente, estas pruebas incluyen tareas en las que
lo importante es el nivel de dificultad de los problemas.
Pruebas de rendimiento típico
Según Cronbach (1972), estas técnicas intentan precisar la conducta típica del sujeto
o, lo que es lo mismo, lo que acostumbra a hacer en una determinada situación o en
una amplia gama de circunstancias.
Por tanto, el nivel de exigencia en ellas es mucho menor que en las anteriores, ya
que la tarea solicitada a los sujetos es que encuentren la respuesta que primero se les
ocurra, que les parezca más habitual para ellos o para la persona que están enjuician-
do o que consideren verdadera (Pelechano, 1988). Normalmente, incluyen la evalua-
ción de rasgos temperamentales, emocionales o afectivo-actitudinales. Por otro
lado, la finalidad de la aplicación de este tipo de instrumentos que pretenden evaluar
la “conducta típica” de un sujeto es la predicción de su conducta futura con todas las

excepciones y dificultades que ello supone ya que «el ser humano no se haya sujeto a
leyes rígidas» (Cronbach, 1972, p. 59). Cronbach (1972) cita dos métodos de evalua-
ción de la ejecución típica: la observación en situaciones naturales o estandarizadas,
y la autobservación en la que el observado y el observador son la misma persona: el
propio sujeto.
Nos gustaría añadir en este punto que toda la exposición anterior tan aparente-
mente clara respecto a las técnicas que pertenecerían a un grupo u otro es en cierto
modo engañosa. El propio Pelechano (1988) nos recuerda que existe una serie de
pruebas en las que en la tarea a realizar por el sujeto no resulta muy claramente espe-
cificado si se trata de rendimiento máximo o típico. Cita textualmente el autor: «los
cuestionarios de personalidad (clasificados con toda claridad como rendimiento tí-
pico) escritos con un tipo de lenguaje complejo y refinado, si han de ser cumplimen-
tados por personas con un nivel cultural escaso y no acostumbradas a los tipos de
distinciones lingúísticas que se encuentran en los cuestionarios ¿se pueden calificar
como rendimiento típico?» (Pelechano, 1988, p. 89).
1.1.3. Clasificación según aspectos formales

Nos referimos aquí, básicamente, a un criterio material-funcional (Pelechano, 1988),
en el que predomina el estudio del tipo de material, de la manera concreta de aplica-
ción de la prueba, o bien del tipo de población a la que va dirigido. Por tanto, se ex-
cluyen criterios teóricos y de contenido.
Tipo de material
Cuando uno analiza las técnicas de evaluación psicológica desde la perspectiva del
tipo de material que utilizan es frecuente encontrarse con dos categorías: pruebas de
papel y lápiz, y pruebas ejecutivas o de “actuación” que generalmente implican el
uso de aparatos u objetos a manipular. Ahora bien, esta clasificación inicialmente di-
cotómica no lo es tanto, o al menos no lo es necesariamente. Así, Pelechano (1988)
—retomando a nuestro juicio la opinión de Cronbach (1972)— afirma que una clasi-
ficación más próxima a la realidad sería la siguiente: tests de papel y lápiz, man1pula-
tivos de objetos y de aparatos. Entre los primeros estaríamos incluyendo únicamen-
te aquellos tests en los que se utiliza de forma exclusiva material impreso, que el
sujeto tiene que leer y/o señalar con un lápiz o cualquier otro objeto; cuestionarios
de personalidad, pruebas de inteligencia (del tipo aptitudes), con series de números
y/o letras serían ejemplos de esta categoría. En segundo lugar, tendríamos las técni-
cas “ejecutivas”, que incluyen problemas en los que se utilizan distintos tipos de ma-
teriales (rompecabezas, historietas, construcción de bloques...). Finalmente, nos
quedarían todos aquellos instrumentos en los que se utilizan específicamente apara-
tos, como por ejemplo el taquistoscopio, el polirreactígrafo, lasilla vibrátil, eltorno
con receptor de trazado, etc., dirigidos a la evaluación de variables como el tiempo
de reacción, movimientos oculomotores, fenómenos perceptivos, etc. En la actuali-
dad resulta obligado incluir en esta categoría al ordenador, ya que éste ha traído con-
sigo una auténtica revolución en cuanto a estudios de simulación, potencia de cálcu-

lo y, aún más allá de eso, en cuanto a diseño de pruebas y métodos de corrección y
clasificación. Se especula, a partir de los planteamientos actuales, que en el futuro es
más que probable que la división clasificatoria comentada carecerá de sentido, si el
uso del ordenador se convierte en práctica tecnológica rutinaria y habitual dentro de
nuestra disciplina (Pelechano, 1988). 90
Antes de pasar a analizar otro tipo de clasificación nos vamos a referir a la distin-
ción entre pruebas verbales y no verbales, y lo hacemos en este punto para demos-
trar que su solapamiento con lo que acabamos de exponer es sólo parcial, merecien-
do la pena hacer alguna aclaración al respecto. Un test verbal lleva implicadas tareas
comprometidas con el lenguaje verbal o escrito (Pelechano, 1988); insistimos en el
término tareas porque hace referencia a «lo que el sujeto ha de hacer», y en este caso
debe utilizar el lenguaje verbal o escrito no sólo para comprender las instrucciones
sino también para responder, o lo que es lo mismo, para resolver el problema. Sin
embargo, un test no verbal utiliza o bien lenguaje gráfico o bien tareas relacionadas
con el razonamiento en las que el lenguaje verbal o escrito se usa con la única finali-
dad de plantear las instrucciones.
Modo de aplicación
Se trata, tal vez, de uno de los criterios de clasificación cuyo uso da como resultado
las dos categorías más evidentes y, probablemente, también las mejor definidas: tests
individuales y tests colectivos. Simplificando al máximo su definición, en el primer
caso un sujeto realiza el test y en el segundo un grupo de sujetos lleva a cabo el test
durante la misma sesión. Sin embargo, debemos enumerar, pese a la claridad de la di-
cotomía, algunas otras características de ambos tipos de pruebas (Pelechano, 1988):
a. Tests individuales:
— Tienden a exigir una mayor preparación por parte del evaluador.

— Llevan consigo una actuación bipersonal (salvo en el caso de la evaluación
por ordenador).
— Con frecuencia se suele obtener alguna información que no corresponde ex-
clusivamente al número de respuestas acertadas o no, o al número afirmativo
o negativo de respuestas a las cuestiones planteadas.
— Ese otro “tipo de datos” proviene precisamente de la interacción que se gene-
ra con el evaluador y está fundamentado en las respuestas no verbales, co-
mentarios relevantes, actitud de aceptación, grado de colaboración, interés o
rechazo.
— Generalmente no pueden administrarse de modo colectivo.
b. Tests colectivos:
— Suponen una economía de tiempo en la aplicación.

— Suponen, junto a ello, una pérdida de información respecto al comportamien-
to del sujeto en la situación de evaluación (depende del tamaño del grupo).
Clasificación de las técnicas de evaluación psicológica
257
— Suponen una situación social en la que se encuentran presentes elementos un

tanto distintos relacionados con factores psicológicos tales como la competi-
tividad.
— Suponen la pérdida de la relación bipersonal evaluador-evaluado.
— Pueden administrarse individualmente, aunque ha de tenerse en cuenta en-
tonces que no siempre son equiparables las respuestas de un test obtenidas en
situación grupal y en una situación individual, ni siquiera cuando se refieren
al mismo test y al mismo sujeto.
Tipo de población sobre la que se ha elaborado
Esta es también una categorización muy obvia en la mayoría de los casos, que
tradicionalmente divide los instrumentos de evaluación según los criterios que se
han utilizado en la elaboración, distribución y validación de los mismos, tales
como el nivel evolutivo o si se trata de poblaciones especiales (Pelechano, 1988).
De este modo, se habla de pruebas infantiles, pruebas de adultos y pruebas di-
rigidas a poblaciones especiales (ciegos, sordos, personas con deficiencias psí-
quicas...).
1.1.4. Clasificación según el tipo de construcción

Este criterio hace referencia al enfoque seguido en la construcción del instru-
mento (Anastasi, 1982) y tradicionalmente se trata de una clasificación que inclu-
ye sólo pruebas de personalidad. En general, se reconoce la existencia de tres en-
foques básicos: racional, empírico y factorial (Lanyon y Goodstein, 1977;
Anastasi, 1982).
Construcción racional
Llamada también en algunos manuales como teórico-racional (Lanyon y Goods-

tein, 1977), se basa tanto en la observación como en la teoría que sustenta las caracte-
rísticas que se pretenden evaluar (Martorell, 1988). Según Lanyon y Goodstein
(1977), en este enfoque se espera que los reactivos de la prueba actúen como estímu-
los para producir directamente la información en la que estamos interesados. Así, se
supone un paralelismo y/o correspondencia entre las respuestas a las pruebas y «los
estados internos» (Pelechano, 1988). Según el propio Pelechano (1988), este modo
de elaborar pruebas fue uno de los que primero se utilizó en el estudio científico de
la personalidad y se encuentra presente, en mayor o menor medida, en todos aque-
llos instrumentos en los que se apela como criterio de validación a la importancia
subjetiva, significación individual y/o diferencias entre grupos, con relación a res-
puestas sin criterio externo de identificación. Podrían incluirse dentro de esta cate-
goría instrumentos que van desde la Personal data sheet [Hoja de datos personales]
de Woodworth, hasta pruebas proyectivas como elRorschach o el TAT (véase Lan-
yon y Goodstein, 1977), aunque estas últimas se sitúan hacia el extremo racional del
continuo.
Construcción empírica
En este planteamiento, surgido en parte como reacción a los teóricos racionales

(Wiggins, 1973), no existe una decisión previa en relación con el contenido, y la refe-
rencia a un criterio exterior a la propia prueba es el elemento básico que lo define.
Lanyon y Goodstein (1977) explican los pasos que podría seguir la elaboración de
un cuestionario a partir de esta metodología:
a. Identificar un índice conductual nítido, es decir, formular una “definición

operacional” del rasgo o grupo de rasgos.
b. Obtener un grupo de personas que reúnan positivamente dicho índice con-
ductual (grupo criterio) y otro que no lo reúna (grupo control).
Seleccionar un número suficientemente amplio de reactivos.
a Pedir a los sujetos (ambos grupos) que respondan a los reactivos.
>
e. Identificar los reactivos que diferencian de manera fiable a los sujetos-crite-
rio con respecto a los sujetos-control.
f. Retener estos reactivos para la construcción del cuestionario y rechazar los
restantes.
g. Someter los reactivos seleccionados a validación cruzada.
Los ejemplos más representativos de técnicas construidas según este tipo de es-
trategia son el Inventario multifásico de personalidad de Minnesota, el Inventario
psicológico de California de Gough y el Inventario de intereses vocacionales de
Strong. En el capítulo dedicado a la evaluación de rasgos de personalidad se analiza-
rán muy detenidamente al menos la primera de estas pruebas que, por otro lado, sue-
le ser punto de referencia obligado para ejemplificar esta estrategia de construcción.
Construcción de consistencia interna o factorial
Se trata, sin lugar a dudas, de la estrategia que ha generado una mayor productividad
en el campo de la evaluación de la personalidad. No obstante, hay que aclarar que en
este enfoque intervienen implícitamente las estrategias anteriormente expuestas: teó-
rico-racional (selección de reactivos, denominación de los factores...) y empírica. Es el
empleo del análisis factorial el que define de forma diferencial este tipo de instrumen-
tos frente a los analizados hasta ahora. Mediante él, se agrupan los reactivos en torno a
ciertos factores o, lo que es lo mismo, lo que hace el análisis factorial es agrupar los re-
activos que tienen relación entre sí en unidades más generales. Con ello pretendía lle-
garse a la obtención de un número lo más exhaustivo posible de ítems que nos permi-
tiera obtener la totalidad de rasgos de nuestra personalidad. Sin embargo, el
planteamiento anterior, aparentemente sencillo, ha provocado multitud de contro-
versias, entre otras cosas porque la naturaleza completa del significado de un factor
no es posible aclararla por procedimientos estadísticos (Lanyon y Goodstein, 1977) y
porque, más allá de todo ello, aún cabría la pregunta considerada por Lanyon y Go-
odstein como la esencia psicológica de la personalidad: ¿son los factores rasgos reales?
La respuesta a esta pregunta ha provocado diversidad de posturas teóricas y, conse-
cuentemente, metodológicas, y como resultado se han aplicado métodos de factori-

zación diferentes que han conducido a resultados diferentes. Las pruebas de Guil-
ford, Cattell y Eysenck se consideran las más representativas de este enfoque.
Hasta aquí la exposición de las principales clasificaciones en función de un crite-
rio único. Á continuación vamos a comentar algunas otras que se caracterizan fun-
damentalmente por haber sido elaboradas a partir de una combinación de criterios,
como resultado de lo cual se han obtenido las diferentes categorías o ejes de clasifica-
ción. Las citaremos con el nombre de sus autores puesto que nos parece más didácti-
co, máxime cuando cada una de ellas responde a características diferentes y no pue-
den reunirse a la vez bajo epígrafes generales. Como veremos, en la mayoría de ellas
aparecen reflejadas, implícita o explícitamente, las clasificaciones ya comentadas.
12. Clasificaciones según autores (combinación de criterios)

112.1. Clasificación de Drenth (1969)
Este autor nos ofrece una clasificación basada en cuatro ejes, dentro de los cuales
aparece, a su vez, una serie de subcategorías. Veamos:
a. Primer eje: clasificación según tipo de instrucciones y modo de aplicación.
— Pruebas individuales y de grupo.

— Velocidad y potencia.
b. Segundo eje: según tipo de tarea requerida.
— Directas-indirectas.
— Respuesta libre o de elección.
— Con o sin influencia cultural.
c. Tercer eje: según grado de correspondencia con el criterio.
— Tests con idéntico criterio.

— Tests con relación empírica accidental con él.
d. Cuarto eje: según la finalidad.
— Rendimiento máximo.
— Rendimiento típico.
122. Clasificación de Adams (1964)
Este autor plantea una serie de alternativas que pasamos a exponer; tal vez su mayor
aportación es el reconocimiento de que las dicotomías planteadas son más bien po-
los de continuos, idea que aparece también en la clasificación de Cone que comenta-
remos más adelante.
a. Enrelación con el criterio: directas e indirectas.
b. Según el material: papel y lápiz, y rendimiento.
c. Según la finalidad: tests de velocidad y de potencia.
112.3. Clasificación de Brickenkamp (1975)

de las
Este autor realizó probablemente la revisión más exhaustiva y comprehensiva
técnicas de evaluación. A partir de esta revisión, basada en Irle (1956), Lienert
(1961), Hiiltmann (1966), Marsolek e Ingelkamp (1968) y Speck y Speck (1973), ter-
mina proponiendo su propio sistema clasificatorio con dos grandes categorías in1-
ciales y otras subclases incluidas en ellas; esas categorías primarias están basadas en la
idea del autor de que a la hora de ordenar los instrumentos de evaluación tenemos
una primera gran opción: centrarse en aspectos formales o de contenido (Silva,
1982). Así, resulta la siguiente clasificación:
a. Según aspectos formales de la prueba. Incluye modo de construcción, mate-

riales, modo de aplicación, tipo de reacción requerida y forma de valorar los
resultados.
b. Según aspectos de contenido.
— 'Tests de rendimiento.
— Tests psicométricos de personalidad.
— 'Tests creativos o expresivos de personalidad.
1.2.4. Clasificación de Fiske (1971)
La propuesta de este autor se centra en las respuestas que la persona da ante distintos
estímulos referidos a diferentes aspectos de la conducta, ya que ello requiere proce-
dimientos diferentes e independientes entre sí; es decir, cada procedimiento evalúa
una variable dada de forma distinta. Consecuentemente, Fiske propone las siguien-
tes categorías de clasificación:
Autodescripción del pasado.

Autodescripción de la experiencia presente.
Evaluación de capacidades.
Estimación de otro sujeto a partir de conductas o productos pasados.
Observación directa.
SISSI psicofisiológicos.
Registros
A poco que nos fijemos, nos daremos cuenta de que la propuesta de Fiske parece
incluir las diferentes posibilidades en cuanto a instrumentos que completarían una
valoración exhaustiva y global de un sujeto.
261
12.5. Clasificación de Cone (1978)

La característica central y básica de la propuesta de Cone —lo que supone en opi-
nión de algunos autores un avance muy importante— es situar los procedimientos
de evaluación a lo largo de un continuo, en un extremo del cual estarían los procedi-
mientos “directos” y en el otro los “indirectos”, con todos los niveles intermedios
posibles entre ambos, según la participación en mayor o menor cuantía respecto a al-
guno de los extremos (recuérdense los planteamientos de Adams). Además, Cone
añade un nuevo matiz al continuo, englobando dos sentidos: el grado en que se eva-
lúa la conducta misma en cuestión o un referente más o menos alejado de ella y el
grado en que se la evalúa en el tiempo y en el espacio de su incidencia natural. Silva
(1982) enumera tres procedimientos fundamentalmente indirectos y cinco funda-
mentalmente directos y los define basándose en Bornstein y cols. (1980) de la si-
guiente manera:
a. Entrevista (representaciones verbales de actividades pasadas).

b. Autoinforme (representaciones verbales retrospectivas estructuradas de ac-
tividades pasadas).
c. Estimación de otros (descripciones retrospectivas por parte de otros basadas
en la observación pasada de la conducta).
d. Autoobservación: autoapreciación de la conducta clínicamente relevante en
el momento en que ocurre.
e. Análogo: representación de papeles (observación de la conducta clínicamen-
te relevante en el momento en que ocurre en una situación análoga; al sujeto
se le dan instrucciones de “como s1”).
f. Análogo: conducta libre (observación directa de la conducta relevante en el
momento en que ocurre en una situación análoga; la conducta varía libremente).
g. Naturalista: representación de papeles (observación directa de la conducta
clínicamente relevante en el momento en que ocurre en un contexto natural,
pero con instrucciones de “como si”).
h. Naturalista: conducta libre (observación directa de la conducta clínicamente
relevante en el momento en que ocurre en el ambiente natural; la conducta
varía libremente).
Según Martorell (1988), Cone también relaciona, a su vez, los distintos procedi-
mientos con el grado de subjetividad (indirecto) u objetividad (directo), y de hecho
la ubicación de la autobservación en un lugar medio del continuo ejemplifica lo ante-
rior (Silva, 1982). Otra de las características del trabajo de Cone es que a partir de la
base clasificatoria anteriormente planteada, complica su continuo con un sistema or-
togonal que atiende por un lado a la fuente de información (uno mismo-otros) y por
otro a la “accesibilidad” a la conducta (privado-público). Añadiendo estos nuevos
criterios resulta que los autoinformes se encuentran en el cuadrante uno mismo-pri-
vado; la autobservación en el de uno mismo-público, las evaluaciones (estimaciones
y calificaciones) por otros en el cuadrante otros-privado y las observaciones directas
en el de otros-público.
Como vemos, la complejidad de las estrategias de evaluación enunciada de for-

ma muy somera en los planteamientos anteriores parece hacer difícil la utilización de
continuos únicos (al menos parece una solución excesivamente simplista) y, de he-
cho, Cone ofrece todavía otras muchas reflexiones respecto a los distintos métodos
y estrategias y complica aún más su propuesta. No obstante, éste no parece el lugar
idóneo para profundizar en ello, ya que el objetivo que nos hemos planteado fue
realizar una revisión general de las distintas clasificaciones. Al lector interesado le re-
comendamos la lectura de alguna de las obras de Cone recogidas en las referencias
bibliográficas del presente capítulo.
112.6. Las clasificaciones de Campbell (1967) y Pervin (1980)

La razón de incluir las propuestas de dos autores diferentes bajo el mismo epí-
grafe es doble; en primer lugar, porque ambas están consideradas como clasifi-
caciones amplias y de gran repercusión y, en segundo lugar, porque Pervin se
basó en los criterios propuestos por Campbell para elaborar sus propias cate-
gorías.
Clasificación de Campbell (1967)
Este autor utiliza para agrupar las técnicas de evaluación tres criterios dicotómicos
básicos:
a. Voluntario-objetivo: los primeros permiten dar respuestas voluntarias y

propias, mientras que los segundos exigen respuestas correctas; expresado de otro
modo, aceptación de toda respuesta versus respuestas correctas e incorrectas.
b. Indirectos-directos: el sujeto no conoce o sí conoce los propósitos que
persigue el test; en algunos manuales se utiliza la expresión disfrazado-no
disfrazado para hacer referencia igualmente al acuerdo o desacuerdo en la com-
prensión del propósito del test por parte del examinado y del psicólogo (Silva,
1982).
c. Estructurados-no estructurados: existen límites a las respuestas del sujeto o
no existen tales límites.
A partir de la combinación de estos tres criterios se obtienen las siguientes ca-

tegorías:
Voluntario-indirecto-respuesta libre.
Voluntario-indirecto-respuesta estructurada.
Voluntario-directo-respuesta libre.
Voluntario-directo-respuesta estructurada.
Objetivo-indirecto-respuesta libre.
Objetivo-indirecto-respuesta estructurada.
Objetivo-directo-respuesta libre.
309
HP
SA
AP Objetivo-directo-respuesta estructurada.
_ Las seis primeras categorías son más apropiadas para evaluar la personalidad,
mientras que las dos últimas son más adecuadas para evaluar habilidades y rendi-
miento (Silva, 1982; Martorell, 1988).
Clasificación de Pervin (1980)
Se trata, probablemente, de la clasificación con una aceptación más amplia y extendi-

da, tanto que aún en la actualidad aparece en muchos manuales como clasificación
única. Sus cuatro categorías elaboradas a partir de los tres criterios básicos de Camp-
bell tienen, hoy por hoy, bastante repercusión y, aunque su propuesta no permite
una diferenciación por procesos ni por finalidad, sí que aúna e integra con buen cri-
terio aspectos teóricos y metodológicos. Con todo, como ya veremos en el apartado
final de este capítulo, el propio desarrollo de la tecnología de evaluación ha dado lu-
gar a la “desintegración” de algunas de sus categorías (por la importancia que han
adquirido algunas pruebas pertenecientes a las mismas), aunque algunas otras toda-
vía continúan vigentes y en uso. A continuación, planteamos la clasificación de Per-
vin tal y como la concibió, con la única salvedad de emplear delante de cada catego-
ría el término técnica en lugar de test (Fernández-Ballesteros, 1980), por las razones
que explicamos en la introducción al tema.
a. Técnicas proyectivas. Son definidas como instrumentos que han sido consi-
derados como especialmente sensibles para revelar aspectos inconscientes de la con-
ducta, permitiendo provocar una amplia variedad de respuestas subjetivas; además,
son altamente multidimensionales y evocan respuestas y datos inusualmente ricos
con un mínimo de conocimiento por parte del sujeto del objetivo del test. Tal defini-
ción describe de manera implícita el marco teórico en el que han descansado este
tipo de instrumentos: las teorías dinámicas de la personalidad y su conceptualiza- -
ción de la misma como algo global, que se infiere a partir del comportamiento explí-
cito. Además, podemos caracterizarlas como enmascaradas y no voluntarias, aun-
que el material de estímulo es muy variado, lo que da lugar a diversas clasificaciones:
estructurales, temáticas, expresivas, CONStructivas y asociativas.
b. Técnicas psicómetricas. Se caracterizan por ser estructuradas, voluntarias y
asociadas con teorías de base empírica, que aceptan el informe verbal y se conocen
genéricamente bajo la denominación de tests. Fernández-Ballesteros (1980, p. 166)
las define como «tests que han sido elaborados a través de procedimientos estadísti-
cos altamente sofisticados, con material rigurosamente estandarizado y tipificado en
sus tres fases fundamentales: aplicación, corrección e interpretación».
c. Técnicas subjetivas. Sus característivas fundamentales son:
— La fuente de datos es el propio sujeto.

— El material suele ser semiestructurado.
— La respuesta es voluntaria. My
— La tarea consiste en que el sujeto describa, clasifique o califique a sí mismo o
a Otros. |
— El análisis de resultado s se efectúa a través de procedim ientos cualitativ os O
cuantitativos.
Este apartado incluye gran diversidad de pruebas, con enfoques teóricos subya-
centes también muy variados. De entre ellas, tal vez sea la entrevista la más utilizada,
la de más amplia tradición y la de un espectro mayor —téngase en cuenta que su uso
no se encuentra restringido a nuestra disciplina, sino que desempeña un papel pri-
mordial en otras ciencias: medicina, investigación social, pedagogía, industria, etc.
Además de la entrevista, se consideran pruebas subjetivas las listas de adjetivos, la
técnica Q, la “rejilla” de Kelly, el diferencial semántico de Osgood y el análisis de
documentos personales. Las listas de adjetivos (por ejemplo, la ACL de Gough, la
DACL de Lubin) permiten una evaluación tanto cualitativa como cuantitativa, califi-
cando, describiendo o clasificando a los sujetos en función de diferentes adjetivos
que le son propios, en tanto que le son asignados por sí mismos o por otros. En este
mismo sentido se orientan las técnicas “Q” (California Q-set, Evaluación del auto-
concepto, Ajuste personal), basadas todas ellas en la técnica original de Stephenson.
Por su parte, Osgood, a partir de la década de los años cincuenta, propone el Dife-
rencial semántico como técnica de evaluación de las valoraciones de estímulos se-
mánticos que hacen los sujetos a través de escalas de estimación, definidas por adjeti-
vos bipolares, con finalidades tan diversas como evaluación de percepciones,
investigación o valoración de programas de intervención. Finalmente, no sería justo
relegar de estas líneas los trabajos de Kelly, dirigidos a evaluar las construcciones que
los sujetos utilizan para definir y clasificar su entorno, para ordenar la realidad y las
relaciones interpersonales.
d. Técnicas objetivas. Estas pruebas tienen las siguientes características:
— Estructuración del material.

— Estímulo no enmascarado.
— No voluntariedad de respuesta por parte del sujeto.
Se trataría de pruebas básicamente apoyadas en la metodología experimental y

en teorías procedentes de la psicología del aprendizaje y psicología cognitiva. Así, si
buscamos las técnicas que reúnen rigurosamente todas las características formuladas
nos encontraríamos con pruebas de ejecución realizadas en situación de laboratorio
(por ejemplo, el Test del marco y la varilla, el tambor de memoria...), la observación
directa y los registros psicofisiológicos, sin olvidarnos de algunos instrumentos de
“lápiz y papel” como el Test de figuras enmascaradas de Witkin.
II. EL “STATUS” ACTUAL DE LAS TÉCNICAS DE EVALUACIÓN PSICOLÓGICA
Como ya hemos señalado con anterioridad, probablemente sea la clasificación pro-

puesta por Pervin la que ha despertado una mayor aceptación, de tal forma que se ha
utilizado con mucha frecuencia en manuales referidos a evaluación psicológica
como sistema para agrupar las distintas técnicas psicodiagnósticas. Sin embargo, el
avance de nuestra disciplina, paralelo al de la ciencia psicológica en general, ha dado
lugar a una serie de circunstancias dentro de la tecnología de evaluación que ha pro-
vocado un desarrollo importante en algunas técnicas específicas, incluidas hasta aho-
265
ra en categorías más amplias, así como un detrimento igualmente significativo en

otras, hasta el punto de hacerlas desaparecer del panorama de la evaluación psicoló-
gica, al menos desde un punto de vista didáctico, puesto que en la práctica cotidiana
ningún tipo de técnica parece rechazarse universalmente. Sirvan como ejemplo de lo
primero la entrevista, los tests psicofisiológicos, los tests neuropsicológicos, la ob-
servación y el análisis funcional, y, de lo segundo, las técnicas proyectivas. A conti-
nuación analizaremos brevemente las razones por las que las cinco primeras han pa-
sado a ser protagonistas en nuestra disciplina, mientras que la última ha quedado
relegada a un papel secundario.
La entrevista se ha considerado con frecuencia como una técnica subjetiva desde
el momento en que “cumplía” con los criterios de Pervin para esa categoría: material
semiestructurado y voluntariedad por parte del sujeto. En efecto, la entrevista co-
menzó como una conversación relativamente desestructurada con el paciente y tal
vez un “allegado”, con el objetivo de obtener un historial que ayudara a la formula-
ción de un diagnóstico. Con esta definición muchos veían esta técnica como un pro-
cedimiento subjetivo y poco fiable que no podía ser suficientemente validado. Sin
embargo, más recientemente, han ido apareciendo nuevos procedimientos de entre-
vista en los que la estructuración del material ha pasado a ser característica primordial,
lo que ha provocado casi de inmediato el establecimiento de una fiabilidad muy ade-
cuada (Goldstein y Hersen, 1990). De este modo, la acepción “entrevista” incluye, en
la actualidad, una serie de procedimientos que difícilmente podrían reunirse bajo la
etiqueta única de “técnicas subjetivas”. Ahora, las entrevistas utilizadas en evaluación
psicológica son bastante diferentes a las estrategias vagamente organizadas y a modo
de conversación que se utilizaban en el pasado. En resumen, éstas son algunas propie-
dades de la entrevista actual en evaluación psicológica (Goldstein y Hersen, 1990):
a. Suorganización tiende a ser estructurada.

b. Cumple, o al menos tiende a ello, requisitos psicométricos de fiabilidad y va-
lidez.
c. Está basada en conocimientos científicos contemporáneos de psicopatolo-
gía, psicología clínica, etcétera.
Por otro lado, las técnicas psicofisiológicas han aumentado su estatus de forma
muy significativa en los últimos años. Tal vez es por eso que, en muchos casos, apa-
recen separadas de la categoría que inicialmente las incluía: las técnicas objetivas. En
efecto, es obvio que en la actualidad no tienen la misma relevancia diagnóstica Otras
pruebas objetivas (por ejemplo, las dirigidas al estudio de variables cognitivas o mo-
toras) que éstas. Y esto era algo que ya se preveía desde que resurgió en nuestro ám-
bito un creciente interés por las variables biológicas. Este interés fue puesto de relie-
ve de forma clara en un trabajo de Carbonell, Carpintero y Silva (1988),en el que
recogían las opiniones de los autores más relevantes dentro de nuestra disciplina res-
pecto a las perspectivas futuras de la misma. En la actualidad se insiste en la necesi-
dad de integración de diferentes niveles de evaluación, necesidad en la que no pue-
den ni deben quedar excluidas las variables fisiológicas. Ni que decir tiene que una
toma de postura como la anterior provoca consecuentemente el desarrollo de técni-
cas que puedan evaluar esas variables de interés.
Algo similar ha sucedido con las técnicas neuropsicológicas, inicialmente consi-

deradas como psicométricas o clínicas. En el trabajo de Carbonell y cols. (1988) al
que hemos hecho referencia ya se ponía de manifiesto una valoración muy positiva
de los estudios que incidían en los concomitantes conductuales de los trastornos
neurológicos. El interés por el estudio de este tipo de alteraciones también ha sido
constatado por Goldstein y Hersen (1990), quienes consideran la fusión entre psico-
logía clínica y neurología conductual como el elemento clave para el desarrollo de la
evaluación neuropsicológica en general y de las técnicas de evaluación neuropsicoló-
gica en particular. Tal fusión se produjo cuando la sofisticación de los neurólogos en
las áreas de la función cerebral y de las enfermedades cerebrales se combinó con la
sofisticación psicométrica de la psicología clínica. De este modo, se empezaron a
usar instrumentos de medida fiables, válidos y bien estandarizados para dar respues-
ta a complejas cuestiones de diagnóstico neurológico y diagnóstico diferencial, lo
que culminó con la aparición de baterías de tests neuropsicológicos estándar como la
Halstead-Reitan (Reitan y Wolgson, 1985) y Luria-Nebraska (Golden, Hammeke y
Purisch, 1980). Posteriormente se han revisado baterías estándar; ya se dispone de
una forma alternativa de la Batería neuropsicológica Luria-Nebraska (Golden, Pu-
risch y Hammeke, 1985) y de una versión infantil (Golden, 1981). Asimismo, tam-
bién han proliferado las pruebas individuales, entre las que destacan la serie descrita
en detalle por Arthur Benton y colaboradores en «Contribuciones a la evaluación
neuropsicológica» (Benton y cols., 1983), Test de aprendizaje verbal de California
(Delis y cols., 1987) y la revisada y completamente reformulada Escala de Memoria
de Wechsler (WMS-R) (Wechsler, 1987).
Otro tanto ha sucedido con la observación, que puede considerarse como el mé-
todo básico de recogida de información, ya que a fin de cuentas cualquier procedi-
miento diagnóstico cuenta, en mayor o menor medida, con la observación que el
evaluador hace de la conducta, de la situación o de cualquier otra unidad de análisis.
Ello unido al auge de los procedimientos observacionales propiamente dichos, ha
provocado que en muchas ocasiones se les considere y analice de forma indepen-
diente a otras categorías más generales.
No podemos olvidar en este recorrido la presencia cada vez más frecuente del
análisis funcional dentro de los capítulos dedicados a las técnicas de evaluación psi-
cológica. Las aportaciones de la evaluación conductual, una vez superada la fase en la
que se intentó proponer como la solución a todos los problemas que se planteaban
en esta disciplina y la posterior época de desilusión, son innegables y como conse-
cuencia de ello, hoy se considera que el procedimiento de evaluación en ella utiliza-
do debe ser objeto de un análisis detallado y profundo.
La otra cara de la moneda en este panorama de desarrollo y potenciación de
determinados instrumentos está representada por las técnicas proyectivas. En efec-
to, el declive de éstas se ha producido de forma paralela al auge de aquéllas y las razo-
nes para ello son de tipo científico, práctico y filosófico, pudiendo resumirse de la si-
guiente manera (Goldstein y Hersen, 1990):
a. La mayor sofisticación científica creó un clima de escepticismo hacia estos

instrumentos. Su fiabilidad y su validez fueron puestas en duda por numerosos estu-
dios (Swensen, 1957, 1968; Zubin, 1967), y un segmento relevante de la comunidad
profesional pensó que las reivindicaciones que se hacían para estos tests no se podían
justificar.
b. Los avances en procedimientos alternativos, especialmente el Minnesota
multiphasic personality inventory (MMPI) y otros tests objetivos, convencieron a
muchos clínicos de que la información que antes se conseguía con los tests proyecti-
vos se podía obtener con mayor eficacia y menores costos utilizando los métodos
objetivos. En concreto, la voluminosa literatura de investigación sobre el MMPI ha
demostrado su utilidad en una variedad sumamente amplia de contextos clínicos y
de investigación. Cuando el MMPI y otras técnicas objetivas afines se confrontaron
con los tests proyectivos durante los días de la controversia “vidente versus signo”,
se demostró de forma generalizada que el signo era igual de bueno o de malo que el
vidente en la mayoría de los estudios realizados (Meehl, 1954).
Cc. En general, las técnicas proyectivas no son ateóricas y, de hecho, se suelen
ver como asociadas a una u otra rama de la teoría psicoanalítica.
Justo sería decir en este punto que tal vez el único superviviente del naufragio
descrito es el Rorschach. Muchos clínicos siguen usándolo y el trabajo de Exner y
sus colaboradores le ha dado una creciente respetabilidad científica.
En resumen, éste es el panorama que presenta el campo de la tecnología de eva-
luación psicológica en el momento actual. Ni que decir tiene que el análisis podría
hacerse desde otros puntos de vista y que es más que probable que existan perspecti-
vas que aquí no se han contemplado; sin embargo, pese a ello, creemos haber cum-
plido con el objetivo básico que un capítulo sobre clasificación de técnicas de evalua-
ción psicológica debe cubrir: que el lector, evaluador o futuro evaluador termine con
una visión ordenada de las principales posibilidades técnicas que tiene a su alcance
en la actualidad para realizar su trabajo; el resto, es decir, el conocimiento más dete-
nido de las distintas estrategias y la elección de las más adecuadas para cada tarea son
objetivos a cumplir por la totalidad de este manual.
Adams, G. S. (1964). Measurement and evaluation in education, psychology and guidance.

Nueva York. Holt, Rinehart and Winston.
Anastasi, A. (1982). Psychological testing. Nueva York. McMillan. lid
Benton, A. L., Hamsher, K. S., Varney, N. R. y Spreen, O. (1983). Contributions to neuropsy-
chological assessment: A clinical manual. Nueva York. Oxford University Press.
Bornstein, P. H., Bridgwater, C. A., Hickey, J. S. y Sweeney, TM: (1980). Characteristics
and trends in behavioral assessment: An archival analysis. Behavioral Assessment, 2, 125-
133. :
Brickenkamp, R. (1975). Handbuch psychologischer und padagogischer tests. Gotinga. Ho-
refe. :
Campbell, D. T. (1967). A tipology of tests, projective and otherwise. En D. N. Jackson y
S. Messick (dirs.), Problems in human assessment. Nueva York. McGraw-Hill.
Carbonell, E. ]., Carpintero, H. y Silva, F. (1988). La evaluación psicológica vista por los eva-
Cone, J. D. (1978). The behavioral assessment grid (BAG): A conceptual framework and a ta-
xonomy. Behavior Therapy, 9, 882-888. Las
Cronbach, L. ]. (1972). Fundamentos de la exploración psicológica. Madrid. Biblioteca Nueva.
Delis, D. C., Kramer, J. H., Kaplan, E. y Ober, B. A. (1987). CVLT: California verbal lear-
ning test: Research edition, manual. San Antonio. The Psychological Corporation Har-
court Brace Jovanovich.
Drenth, P.J. (1969). Der psychologische test. Múnich. Barth. 122980
Fernández-Ballesteros, R. (1980). Psicodiagnóstico. Concepto y metolología. Madrid. Cincel-
Kapelusz.
Hd Ban R. (1992). Conceptos y modelos básicos. En R. Fernández-Balleste-
ros (dir.), Introducción a la evaluación psicológica (vol. 1). Madrid. Pirámide.
Fiske, D. W. (1971). Measuring the concepts ofpersonality. Chicago. Aldine.
Golden, G. (1981). The Luria-Nebraska children's battery: Theory and formulation. En
G. W. Hynd y J. E. Obrzut (dirs.), Nexropsychological assessment and the school-aged
child: Issues and procedures. Nueva York. Grune and Stratton.
Golden, C. J., Hammeke, T. A. y Purisch, A. D. (1980). The Luria-Nebraska battery
manual. Los Ángeles. Western Psychological Services.
Golden, C. J., Purisch, A. D. y Hammeke, T. A. (1985). Luria-Nebraska neuropsychological
battery: Forms I and II, manual. Los Angeles. Western Psychological Services.
Goldstein, G. y Hersen, M. (1990). Historical perspectives. En G. Goldstein y M. Hersen
(dirs.), Handbook ofpsychological assessment. Nueva York. Pergamon Press.
Hiltmann, H. (1966). Kompendium der psychodiagnostischen tests. Berna. Huber.
Irle, M. (1956). Die klassifikation von tests. Diagnostika, 4, 61-66.
Keller, L. S., Butcher, J. N. y Slutske, W. S. (1990). Objetive personality assessment. En
G. Goldstein y M. Hersen (dirs.), Handbook of psychological assessment. Nueva York.
Pergamon Press.
Lanyon, R. 1. y Goodstein, L. D. (1977). Evaluación de la personalidad. México. El Manual
Moderno.
Lienert, G. A. (1961). Testaufbau und testanalyse. Weinheim. Beltz.
ad T. e Ingelkamp, K. (1968). Literatur úiber tests im bereich der schule. Weinheim.
Beltz.
Martorell, M. C. (1988). Técnicas de evaluación psicológica. Introducción (vol. 1). Valencia.
Promolibro.
Meehl, P. E. (1954). Clinical vs. statistical prediction. Minneápolis. University of Minnesota
Press.
Mitchell, J. V. (dir.) (1985). The ninth mental measurements yearbook. Lincoln. University of
Nebraska Press.
Pelechano, V. (1988). Del psicodiagnóstico clásico al análisis ecopsicológico (vols. 1 y 11). Valen-
cia. Alfaplús.
Pervin, L. A. (1980). Personality: Theory, assessment, and research. Nueva York. Wiley.
Reitan, R. M. y Wolgson, D. (1985). The Halstead-Reitan neuropsychological test battery:
Theory and clinical interpretation. Tucson. Neuropsychology Press.
Speck, D. y Speck, R. (1973). Klassifications-und darstellungsproblematik psychologischer
testvenfahren. Tesina de licenciatura. TV Berlín.
Swensen, C. H. (1957). Empirical evaluations of human figure drawings, 1957-1966. Psycho-
logical Bulletin, 54, 431-466.
Swensen, C. H. (1968). Empirical evaluations of human figure drawings. Psychological Bulle-
tin, 20, 20-44.
Wechsler, D. (1987). Wechsler memory scale-revised. Nueva York. Psychological Corpora-

tion.
Wigguns, J. S. (1973). Personality and prediction: Principles ofpersonality assessment. Reading.
Addison-Wesley. |
Zubin, J. (1967). Classification of the behavior disorders. Annual Review of Psychology, 18,
373-406.
Anastasi, A. (1982). Psychological testing. Nueva York. McMillan.

Cone, J. D. (1978). The behavioral assessment grid (BAG): A conceptual framework and a ta-
xonomy. Behavior Therapy, 9, 882-888.
Fernández-Ballesteros, R. (1980). Psicodiagnóstico. Concepto y metodología. Madrid. Cincel-
Kapelusz.
El. M. C. (1988). Técnicas de evaluación psicológica. Introducción (vol. 1). Valencia.
Promolibro.
Pelechano, V. (1988). Del psicodiagnóstico clásico al análisis ecopsicológico (vols. 1 y 11). Valen-
cia. Alfaplús.
Pervin, L. A. (1980). Personality: Theory, assessment, and research. Nueva York. Wiley.
CADDA
Ls Sl dd
SU
¿P9U A EN ft
> E 1011307 Ms A E
» Abire a ed 1, metro. 1.35Acgpcles, Webs
huir ries, M. CPARS EOrie
1 4
E í + , A
> o
¿ , h e As AAA:
sy mm AE Weihe 4
- Ñ A 5d. Y
, Lust errón (eel 15. Valen 3
of Minneñots.
ds
pr web .
L mn, TEM
f ' y
Vucns
Ñ mn.
o
, , ¡
á
d »
o
. A A
7
'
Ñ F
O. Le
.
13. LA ENTREVISTA
JORGE FERNÁNDEZ DEL VALLE
L INTRODUCCIÓN
De todas las técnicas de evaluación psicológica es la entrevista la que tiene una ma-
yor aplicación. De ella se ha dicho que es la espina dorsal de todas las profesiones de
la salud mental (Shea, 1990), la piedra angular del psicodiagnóstico (Wiens y Mata-
razzo, 1983) o la herramienta por excelencia para lograr el diagnóstico (Zubin,
1989). Su importancia va más allá del ámbito de la psicología, como afirma Kerlinger
(1975), ya que es el método principal cuando se trata de obtener información acerca
de las personas. El abogado, el médico, el periodista o el profesor la utilizan cotidia-
namente, aunque cada uno con su propia finalidad. Volviendo a la psicología, si re-
corriéramos sus ámbitos de aplicación, desde los más consolidados como el clínico,
el de las organizaciones o el escolar, a otros más recientes como la psicología del de-
porte o los servicios sociales, podríamos observar que en todos ellos es, de hecho,
una de las técnicas indispensables.
Por otra parte, los distintos enfoques teóricos han ido generando formas espe-
cíficas de intervención pero es difícil encontrar alguno que se haya propuesto, con
éxito, prescindir de la entrevista. Más bien resulta precisamente una de las grandes
complejidades de la misma el hecho de que las distintas posturas teóricas y metodoló-
gicas hayan ido desarrollando una gran diversidad de aplicaciones. A esto se debe
añadir la variabilidad de tipos de entrevista debida a los distintos ámbitos de interven-
ción (entrevista clínica, de selección...) e incluso a las distintas formas de intervenir
(entrevistas de evaluación, terapéuticas, de orientación...), lo que convierte la tarea de
realizar una clasificación exhaustiva de sus variantes en una labor realmente ardua.
Esta dispersidad de concepción y aplicación de la entrevista hace muy difícil rea-
lizar atribuciones de calidad para esta técnica en general. De hecho, su evolución his-
tórica está marcada por el tránsito desde su propuesta como herramienta básica e in-
discutible tomada del modelo médico, a una fuerte crítica cuando fue comparada
con las técnicas psicométricas, los estudios rigurosos de observación y otras medidas
más objetivas. Su falta de estandarización, la subjetividad del evaluador y su dificul-
tad de cuantificación la convirtieron en fácil blanco de muy diversos enfoques teóri-
cos (Maloney y Ward, 1976). Habrá que esperar hasta la década de los años sesenta
para que comiencen a explorarse rigurosamente los fundamentos de fiabilidad y va-
lidez de la entrevista como técnica de evaluación, logrando recuperar su valor como
tal (Zubin, 1989).
A pesar de sus avatares históricos, en los que llegó a ser desechadapor su carácter
subjetivo y mentalista, lo cierto es que en la actualidad algunos estudios muestran el
Universidad de Oviedo.
272 Jorge Fernández del Valle
creciente interés de los profesionales por el adecuado desarrollo de este instrumento

de evaluación psicológica. En un estudio de Langsley y Hollender (1982) realizado
con cerca de 500 profesionales de la salud mental, el 99,40% opinó que la entrevista
era una técnica necesaria, e incluso fue la que se valoró como más importante por de-
lante de un total de 32 técnicas. e y
Quiere decirse con todo ello que este capítulo afronta una de las técnicas más
controvertidas, pero a la vez más necesarias, de cuantas componen elbagaje del eva-
luador psicológico. Para su desarrollo, el capítulo incluye unas previas nociones his-
tóricas, conceptuales y de clasificación, para pasar a una revisión de algunas cuestio-
nes básicas de su aplicación en dos ámbitos fundamentales como son la psicología
clínica y la selección de personal. Se eligen ambos no sólo por su importancia en
cuanto a la frecuencia de aplicación de la técnica, sino también por representar dos
objetivos bien diferentes que nos permitirán comentar algunas cuestiones básicas
acerca de la finalidad de la entrevista y lo que implica para el evaluador. A continua-
ción se revisará, intentando darle un carácter práctico a la exposición, la situación de
entrevista como proceso de interacción de dos papeles: entrevistador y entrevistado,
deteniéndonos en cada uno de ellos para comentar cuestiones relevantes acerca del
buen desarrollo de la técnica. Finalmente, se comentarán algunas cuestiones acerca
de las garantías científicas de la entrevista.
II. ALGUNAS NOTAS HISTÓRICAS
Siguiendo la exposición histórica de Shea (1990), podríamos decir que la entrevista

comienza a tener relevancia en el ámbito clínico a partir del intento de clasificación
de las enfermedades mentales realizado por Kraepelin. De ahí se deriva la necesidad
de explorar minuciosamente conductas y síntomas que permitan realizar un diag-
nóstico diferencial. Adolf Meyer fue uno de los impulsores de esta técnica, subra-
yando la importancia de recoger una biografía del paciente en el sentido histórico
general pero también biológico, psicológico y social. En concreto, propuso la reco-
gida de datos a través de estilos semiestructurados de entrevista.
Una influencia muy importante fue desarrollada por la concepción psicotera-
péutica del psicoanálisis que hizo de la entrevista el soporte del proceso clínico, fun-
diéndose en él la evaluación y la terapia. En este caso, la entrevista adopta un forma-
to libre ya que potencia la comunicación espontánea del sujeto, un objetivo crucial
para el psicoanalista. Ya en la década de los años cincuenta, H. Stack Sullivan pro-
porciona otro impulso muy importante a esta técnica. Para este autor la entrevista
debía concebirse como una relación diádica, como un fenómeno social complejo, en
el que ambos interactúan y se influencian recíprocamente. Sullivan propuso formas
semiestructuradas de entrevista con determinados apartados y recalcó, entre otras
cuestiones operativas, la importancia de realizar adecuadas transiciones de unos a
otros.
Por otro lado, la influencia en esta técnica de la psicología fenomenológica de
Carl Rogers entre otros enfatiza el proceso interpersonal, la relación empática y la
capacidad de la entrevista para crear un marco de comprensión y cambio del sujeto.
La entrevista 273
Desde este punto de vista de la ayuda o el consejo se han elaborado importantes ma-
nuales (Cormier y Cormier, 1979).
Recientemente, la técnica de la entrevista ha sido impulsada desde dos enfoques
diferentes que se revisarán en posteriores apartados de este capítulo. El primero bus-
ca la clasificación diagnóstica y se desarrolla a partir de los sistemas diagnósticos
como el Research diagnostic criteria (RDC) de Spitzer, Endicott y Robins (1978) o los
Diagnostic and statistical manual of mental disorders (DSM) (American Psychiatric
Association, 1956, 1968, 1980, 1987, 1994). La entrevista adopta aquí formatos alta-
mente estructurados y sacrifica la libertad del evaluador en aras de una mayor fiabili-
dad en la conclusión diagnóstica. El segundo enfoque se refiere a la evaluación con-
ductual y la importancia que dentro de ella tiene la entrevista como medio de
focalizar las conductas problema y formular las primeras hipótesis de intervención.
HI. CONCEPTO Y CLASIFICACIÓN DE LAS ENTREVISTAS
La entrevista se enmarca en el grupo de técnicas denominadas de autoinforme (en

sentido amplio) que son aquellas que «[...] supone(n) un tipo de mensaje verbal que
un sujeto emite sobre cualquier tipo de manifestación propia» (Fernández-Balleste-
ros, 1992, p. 218). Dentro de los autoinformes, la entrevista reúne una serie de carac-
terísticas que la diferencian claramente de otras modalidades como los diferentes ti-
pos de cuestionarios (Fernández-Ballesteros, 1992):
a. Seadapta a cualquier contexto (clínico, escolar, investigación...).

b. Puede diferir en el grado de estructuración permitiendo adaptarse a las cir-
cunstancias de cada caso.
c. La participación personal del evaluador es importantísima, lo que supone
ventajas e inconvenientes que se analizarán más adelante.
d. Permite registrar la comunicación no verbal.
e. Esla técnica guía de la evaluación, ya que suele ser la primera en aplicarse y
permite establecer las primeras hipótesis.
f. Esuna técnica de utilización longitudinal ya que se emplea a lo largo de todo
el proceso evaluador e incluso del tratamiento.
En cuanto a su definición, existen muchas variaciones pero se podrían entresacar

unas características o cuestiones fundamentales que casi siempre están presentes:
a. Todas las definiciones coinciden en que la entrevista requiere una reunión

cara a cara de dos o más personas.
b. Existe un propósito o finalidad consciente, que lo diferencia de la conversa-
ción casual o informal.
c. Existe una distribución de papeles, donde una parte pretende obtener infor-
mación y la otra la aporta. Algunos autores hablan de relación jerárquica
(Zubin, 1989) o asimétrica (Silva, 1981), y se enfatiza la recíproca influencia
que entre ellos se establece (Pelechano, 1976; Párraga, 1986). En selección de
personal también se enfatiza el carácter bidireccional de la comunicación ya

que el profesional se sirve de la entrevista para informar al candidato de al-
gunos aspectos del puesto o de la organización a la que en ese momento re-
presenta (Morgan y Cogger, 1982). y
d. Énfasis en el intercambio verbal (Pelechano, 1976), al que se añade la situa-
ción de observación por parte del entrevistador de otras conductas no ver-
bales.
Podríamos concluir —reuniendo estos elementos y sin ánimo de construir una

definición ideal— señalando que la entrevista es la técnica que permite a través del
contacto cara a cara con el/los entrevistado/s obtener (o intercambiar) información
con alguna finalidad preestablecida, basándose tanto en la conducta verbal como no
verbal.
Pasamos a continuación a exponer las clasificaciones más importantes que se sue-
len realizar de esta técnica. Tratar de clasificar las entrevistas no es tarea sencilla debi-
do a la diversidad de aplicaciones y procedimientos que en ella caben. La práctica ha-
bitual consiste en recurrir a clasificaciones diferentes atendiendo a distintos criterios.
Un primer criterio, y en el que existe mayor unanimidad, es el que se refiere al
grado de estructuración de la entrevista. Desde este criterio cabe distinguir:
a. Entrevista no estructurada. El entrevistador tiene total libertad para explo-

rar las áreas de evaluación que considere oportunas, así como el modo de plantear las
cuestiones y su registro. En este caso se enfatiza la experiencia del profesional, quien
al hilo del propio contenido que va surgiendo de la entrevista va derivando los temas
por donde considere de mayor interés. Este formato tiene como ventaja la posibili-
dad de adaptar la técnica a cada caso en particular, así como la de poder desplegar los
recursos de la experiencia del profesional. Lógicamente, tiene la desventaja de que se
pueden estar pasando por alto lagunas de contenido que hubieran podido resultar
relevantes, o estar resaltando temáticas que a priori el evaluador considera importan-
tes. Consecuentemente, dificulta el acuerdo entre entrevistadores y con ello un as-
pecto importante de su fiabilidad.
b. Entrevista semiestructurada. En este caso el evaluador se debe ajustar a un
guión de áreas de contenido que se deben explorar obligadamente, si bien mantiene
un amplio margen de libertad para la forma concreta de abordar y verbalizar las
cuestiones, su grado de generalidad, la secuencia, etc. En este caso se resuelve al me-
nos parcialmente el sesgo de contenidos de la evaluación, intentando equilibrar la
ventaja de la flexibilidad con la desventaja de la pérdida de fiabilidad con respecto a
entrevistas más estructuradas.
c. Entrevista estructurada. Shea (1990) señala que el grado de estructura puede
referirse a dos cuestiones diferentes; por un lado, se puede referir a la especificación
previa de las áreas de información que se deben explorar o aspectos a evaluar, pero
además la estructura puede referirse a la secuencia y los propios términos en que se
plantean las cuestiones. Cuando todo ello está preestablecido se habla de entrevista
totalmente estructurada. En este caso, el entrevistador es una pieza perfectamente
recambiable en el uso de la técnica y que (teóricamente) no debería introducir im-
portantes variaciones en su aplicación.
La entrevista 275
A pesar de la claridad (engañosa, como se verá) de una clasificación como ésta, el

grado de estructuración de las entrevistas más bien debería entenderse como un gra-
diente continuo que oscilaría entre el formato totalmente libre y el totalmente es-
tructurado, tal como propone Silva (1981). Efectivamente, la proliferación de siste-
mas y formatos de entrevista ha dado lugar a una variedad de estilos en los que cabe
entresacar algunas características más, aparte de las ya citadas por Shea (1990), sobre
las que puede aplicarse el grado de estructuración. Tal como Schmidt y Kessler
(1976) distinguen, la estructuración puede afectar a preguntas, respuestas, adminis-
tración de la entrevista, registro de información e interpretación de la misma. En
tanto estén especificadas previamente cada una de estas cuestiones, la entrevista re-
sultará de mayor estructuración. Un aspecto que también conviene comentar es que
las entrevistas no estructuradas lo son en cuanto a la falta de estructura preestableci-
da explícita, ya que el entrevistador raramente desarrolla la técnica sin sus propias
ideas acerca de lo que le interesa explorar y sin una teoría a la que se adhiere para va-
lorar lo que es o no de interés.
El segundo criterio fundamental para la clasificación de las entrevistas es su fina-
lidad, aunque las categorías obtienen un menor consenso entre los diferentes auto-
res. Un primer objetivo cubierto por las entrevistas es el de investigación, donde se
suele hablar del término encuesta para referirse a este peculiar modo de aplicar la téc-
nica en el que normalmente existe un único contacto con el sujeto entrevistado y el
interés se centra en la recogida de información relevante para ser procesada poste-
riormente (Kahn y Cannell, 1964). Otra finalidad importante es la que Silva (1981)
denomina intervención, ampliando el término finalidad clínica de Pelechano (1976),
ya que es aplicable a otras áreas. Dentro de esta categoría cabe a su vez realizar varias
distinciones:
a. Entrevista inicial o de contacto, en la que el evaluador aborda por primera

vez el caso cara a cara (matizamos este aspecto porque en muchas ocasiones el profe-
sional cuenta con algún tipo de información previa, informes o datos de quien deriva
el caso, referencias de otras personas implicadas, etc.). El objetivo esencial es la iden-
tificación del sujeto y del problema que le lleva a buscar ayuda.
b. Entrevista anamnésica, centrada en la reconstrucción histórica de aspectos
relevantes de la vida del sujeto, incluyendo la evolución del problema o trastorno
que en la actualidad presenta.
c. Entrevista de planificación, que sería aquella sesión con el sujeto en la cual se
sondearían las posibilidades de continuidad del curso de la intervención, objetivos a
alcanzar, estrategias evaluadoras y/o terapéuticas, temporalización del proceso, etc.
Especialmente en algunos enfoques en los que se enfatiza la necesidad de un contra-
to terapéutico explícito (como es el caso de la terapia conductual) en elque terapeuta
y cliente acuerdan conjuntamente estos aspectos, este tipo de entrevista cobra la ma-
yor importancia por su efecto motivador y por las garantías de una correcta evalua-
ción de la intervención que aporta el establecimiento del proceso a prior.
d. Entrevista terapéutica, en la que el contacto cara a cara no sólo tiene, en el
ámbito clínico, una finalidad de obtener información. A través de las sesiones de en-
trevista con el cliente se desarrolla en muchos enfoques teóricos la mayor parte de la
terapia, como es el caso del enfoque rogeriano o de las diversas terapias psicodinámi-
cas. Ciertamente, en muchas ocasiones se va a hacer muy difícil diferenciar una en-
trevista de evaluación de una entrevista terapéutica ya que el efecto del cambio se fil-
tra de manera muy sutil a través de todo el proceso de intervención. En ocasiones,
incluso en una entrevista inicial, muchos sujetos abandonan la consulta del profesio-
nal con una sensación de alivio, aunque “Únicamente” han facilitado información.
Lógicamente, cabe pensar en otras finalidades que vienen clasificadas por el área de
intervención como es el caso de la entrevista de selección de personal, la entrevista clí-
nica, la entrevista de orientación escolar, o bien por su grado de compromiso para el
entrevistador (directivas, no directivas...). A continuación utilizaremos el criterio de
áreas de intervención para comentar algunas peculiaridades de los dos ámbitos de ma-
yor aplicación de la entrevista de evaluación: el clínico y el de la selección de personal.
IV. ENTREVISTAS CLÍNICAS
En la clasificación según el criterio de finalidad, se ha visto que dentro del proceso

clínico existe una entrevista terapéutica. En esta ocasión, en el marco de un manual
de evaluación psicológica, trataremos exclusivamente las entrevistas cuya finalidad
es precisamente evaluadora.
El uso de la entrevista como forma de evaluación de problemas psicológicos tie-
ne sus antecedentes en la medicina y en la psiquiatría tradicionales donde la anamne-
sis y la historia clínica configuraban una práctica común que permitía al profesional
situarse en la trayectoria de salud del sujeto y en sus circunstancias de vida y ambien-
tales. La entrevista tenía los siguientes fines en este contexto (Zubin, 1989):
a. Elicitar en lo posible información acerca de síntomas y antecedentes de los

episodios actuales.
b. Determinar los sentimientos y actitudes de los pacientes acerca de su situa-
ción y sintomatología.
c. Observar la conducta no verbal de interés que pueda ayudar al correcto
diagnóstico.
d. Tomar la conducta del sujeto en la entrevista como muestra que pueda ayu-
dar a aclarar la naturaleza del trastorno.
En la década de los años veinte los principales componentes de la entrevista diag-

nóstica ya estaban establecidos y sus áreas de contenido eran las siguientes (Shea,
1999):
Molestias principales.
Historia del trastorno que presenta actualmente.
Historia social.
Historia familiar.
Historia médica.
SS Estado mental.
$50
La entrevista 277
Esta primera delimitación de contenidos nos puede servir para realizar algunos
comentarios. Se podría decir que en la entrevista con fines diagnósticos la parcela-
ción de áreas de exploración perseguía en primer lugar la explicación, en los propios
términos del paciente, de la causa de su petición de ayuda mediante una descripción
verbal del problema. Es difícil concebir una mejor aproximación inicial en evalua-
ción y de ahí que este proceder sea habitual en diferentes enfoques de tratamiento.
En segundo lugar, se resaltan los aspectos del cuadro temporal que enmarca el
problema, lo que a su vez se hace a dos niveles. El primero de ellos referido a la histo-
ria del propio problema (comienzo, desarrollo, intermitencias, continuidad, agudi-
zaciones...). El segundo aspecto hace referencia al marco histórico del propio sujeto,
su evolución en las áreas más relevantes como la familiar, social y médica (desde una
tradición psiquiátrica organicista la importancia de lo médico era evidente). También
en este caso es difícil concebir otra técnica de evaluación que nos permita trazar me-
jor los aspectos más importantes de la evolución personal del sujeto. Desde el auge
de los enfoques ecopsicológicos en la actualidad, diríamos que la entrevista cobra
enorme importancia por su capacidad potencial para situar al sujeto en las coordena-
das ambientales (dentro de las cuales el tiempo es un factor de primer orden). Po-
dríamos señalar que la misión de la entrevista desde esta perspectiva sería la explora-
ción de los contextos relevantes del sujeto y de su comportamiento a través de ellos.
Un tercer aspecto del contenido es lo que se ha expresado como el estado mental
y que revela, a nuestro juicio, la intención de aprovechar la entrevista no sólo como
una exploración histórica y situacional del problema y del propio sujeto, sino tam-
bién como contacto personal para observar y evaluar aspectos psicológicos del suje-
to, que a la postre se constituían en el principal elemento de evaluación, antes del
desarrollo de otras técnicas diagnósticas. Siguiendo a Wiens (1990), en la exploración
del estado mental se pretende observar una serie de aspectos generales del funciona-
miento psicológico del paciente tales como:
Aspecto y comportamiento en general.

Estado de ánimo, sentimientos y emociones.
Percepción.
Expresión de lenguaje y pensamiento.
Sensibilidad y cognición.
Juicio.
Comprensión.
P5009
75
A
AD Sinceridad.
Este tipo de entrevistas tuvo su mayor problema en la falta de acuerdo en los re-
sultados diagnósticos que se derivaban de su uso. Efectivamente, al margen de que
las entrevistas en sí mismas carecían del rigor exigible a un instrumento de evalua-
ción, el resultado diagnóstico depende del desarrollo de las clasificaciones nosológi-
cas, desarrollo que solamente desde hace unas décadas ha comenzado a tener un
consenso significativo, especialmente a partir de las clasificaciones RDC yDSM ya cr-
tadas. Por otro lado, como apunta Shea (1990), las clasificaciones diagnósticas inicia-
les eran tan limitadas que no se requería un gran esfuerzo de discriminación ni de ex-
ploración.
En la actualidad, tal y como concluíamos en las anotaciones históricas, la entre-

vista de evaluación clínica parece tener dos grandes posibles enfoques que conviene
revisar: clasificación diagnóstica o conductual. No se quiere indicar con ello que las
entrevistas en el ámbito clínico se dicotomicen en estas dos vertientes, sino que pue-
den representar dos de los aspectos más discutidos y desarrollados en los últimos
años.
1v.1. Entrevista diagnóstica

La recuperación de la entrevista como técnica de evaluación diagnóstica coincide
con el desarrollo de categorías en psicopatología en las que se prioriza el logro de un
consenso entre los profesionales. Es a tenor de los avances en esta cuestión, cuando
se comienzan a elaborar formatos de entrevista cuyo objetivo primordial es la fiabili-
dad en cuanto al resultado diagnóstico. Por tanto, en la actualidad se aprecia una
apuesta por formas altamente estructuradas con las cuales no sólo el instrumento
puede alcanzar mejores índices de fiabilidad, sino que también se logra optimizar el
uso de la técnica al permitir la estructuración un recorrido amplio por los diversos
aspectos diagnósticos relevantes en un tiempo razonable.
A continuación, a modo de ejemplos, presentamos una breve reseña de algunas
de las entrevistas estructuradas de mayor uso en diagnóstico.
1v.1.1. «Schedule for affective disorders and schizofrenia (SADS)

[Entrevista estructurada para trastornos afectivos y esquizofrenia]»
de Endicott y Spitzer (1978)
El SADS es un protocolo de entrevista que permite cierta flexibilidad al profesional,

siendo por tanto calificada como semiestructurada. Su aplicación requiere dos horas
aproximadamente y consta de dos partes bien diferenciadas. La primera de ellas in-
tenta recabar información acerca del problema consultado, su comienzo, desarrollo,
tratamientos previos, etc., así como otras cuestiones que puedan revelar las circuns-
tancias personales del paciente. La segunda parte se refiere a la historia pasada del su-
jeto en relación a trastornos psiquiátricos y tratamientos recibidos, así como a un
amplio espectro de síntomas y problemas que pudieran observarse en el momento
actual.
Los síntomas que se exploran con la entrevista son calificados en una escala de
gravedad de O a 6 puntos en función del grado de intensidad, persistencia y otras di-
mensiones para las cuales existen ítems estructurados. Además, el síntoma es califi-
cado sobre dos cortes temporales; el primero referido a la semana en que el proble-
ma se presentaba en su máxima gravedad y el segundo referido a la semana anterior a
la entrevista. Esta última medida de gravedad puede servir como línea base para eva-
luar la mejora a lo largo del tratamiento.
Tanto los autores como otros trabajos posteriores (Keller, Lavori y Andreasen,
1981) informan de datos de fiabilidad adecuados. En Lemos (1991) se pueden en-
contrar referencias de diversos aspectos de validez de este instrumento. No obstan-
La entrevista
279
te, Vizcarro y cols. (1986) realizaron un estudio en España en el que el uso de esta en-
trevista no mejoró la fiabilidad interjueces en el diagnóstico en comparación con una
entrevista libre. En cualquier caso, hasta el momento, en España su uso está muy res-
tringido, sin que exista alguna versión de amplia difusión. Por tanto, la valoración de
sus garantías científicas requiere aún mucho tiempo e investigación.
Iv.1.2. «Diagnostic interview schedule (DIS) [Entrevista estructurada

diagnóstica)»
Esta entrevista, totalmente estructurada, fue desarrollada por Robins y cols. (1981) y
en un principio se concibió como un instrumento de recogida de información para
estudios epidemiológicos y detección de casos. Sin embargo, con el tiempo se ha
convertido en uno de los formatos de entrevista diagnóstica más utilizado ya que
permite realizar diagnósticos en relación a los sistemas DSM-111 y DSM-IILR.
La DIS está diseñada para sujetos mayores de dieciocho años y se administra en
una sola sesión que puede oscilar entre una y tres horas. Su grado de estructuración es
total por lo que se indica hasta el modo en que se enunciarán los ítems, registrando un
simple sí o no (probablemente esta rigidez obedezca a sus orígenes de encuesta reali-
zable incluso por no profesionales). Las cuestiones acerca de los síntomas que explora
cubren tanto su presencia o ausencia como su gravedad, incluyendo si se está toman-
do alguna medicación, si es supervisado por un profesional y el grado en que interfie-
re con la vida del paciente. Además, se intenta establecer la etiología del síntoma en
relación a causas tales como enfermedad física, lesiones, consumo de drogas o una
complicación en el uso de la medicación. También se recaba información acerca de la
evolución, incluyendo la edad de aparición del síntoma y su episodio más reciente.
A esta exploración basada en síntomas se añade un fondo de información demo-
gráfica que incluye aspectos tales como edad, sexo, estado civil, educación, ocupa-
ción, etc. Finalmente, se realiza una evaluación del funcionamiento del sujeto en una
serie de áreas referidas al último año, tales como el trabajo o el rendimiento escolar,
vida social, familiar, etcétera.
Un aspecto novedoso de la DIS es su versión para ordenador en la que el sujeto
puede ir respondiendo a un conjunto de cuestiones a través del teclado. Al final per-
mite imprimir aquellos aspectos diagnósticos del DSM-111 que reúnen los criterios
exigidos, con los detalles recogidos acerca de la sintomatología. Existen pocos estu-
dios de fiabilidad, aunque en alguno de ellos, como el de Wittchen, Semler y Von
Zerssen (1985) se obtienen buenos niveles de fiabilidad test-retest. En cuanto a la va-
lidez, algunos estudios criteriales han comparado este instrumento con otros proce-
dimientos de diagnóstico (Robins y cols., 1982; Hasin y Grant, 1987). Los resulta-
dos dependen en gran medida de las categorías diagnósticas de que se trate, siendo
mayor el acuerdo en alcoholismo o dependencia de drogas, así como en pacientes
psiquiátricos en comparación con estudios de tipo epidemiológico.
Otros cuestionarios estructurados para entrevista diagnóstica son el Present psy-
chiatric state (PSE) [Estado psiquiátrico actual] de Wing, Birley y Cooper (1967) o el
Structures clinical interview for DSM-III-R (SCID) [Entrevista clínica estructurada
para el DSM-111-R] de Spitzer, Williams y Gibbon (1987).
En la actualidad, un aspecto sobresaliente de este tipo de técnicas es la especiali-

zación que van tomando las entrevistas estructuradas, llegando a emplearse no ya
para temas tan amplios como la adaptación en adolescentes o problemas de ansie-
dad, sino para cuestiones tan específicas como entrevistas con agresores sexuales
(McGrath, 1990) o la detección de riesgo de piromanía en la infancia (Kolko y Kaz-
din, 1989), por citar algunos ejemplos significativos.
1v2. La entrevista conductual
Aunque en un principio —dado que se trata de una técnica de autoinforme— su-

frió importantes críticas desde el objetivismo y experimentalismo que guió alenfo-
que conductual, la entrevista se ha constituido en una de las técnicas esenciales de
la evaluación conductual (Kanfer y Grimm, 1977; Linehan, 1977; Haynes, 1978).
Su utilidad en este contexto no es precisamente la de conducir al evaluador hacia
un diagnóstico fiable, como ocurría con la aplicación que acabamos de ver en el
apartado anterior. Desde el enfoque conductual, la entrevista es una parte indispen-
sable del proceso de evaluación y terapia (desde el momento en que ambos se fun-
den de modo que el primero va validando las estrategias que se desarrollan en el se-
gundo, a modo de un sistema de retroalimentación permanente). Por otra parte,
inicialmente, la entrevista permite establecer la relación terapéutica, tomar las deci-
siones clínicas preliminares y posibilita que el terapeuta comience a recoger la in-
formación necesaria para determinar las metas y prioridades del tratamiento (Mor-
ganstern, 1988).
El papel de la entrevista se comprende mejor desde su aportación al principal ob-
jetivo de la evaluación conductual que es la certera y completa identificación de la/s
conducta/s problema/s, atendiendo tanto a su naturaleza como al contexto en el que
se produce/n (Morganstern, 1988). Este último aspecto del contexto es esencial para
el análisis funcional ya que tras la identificación de la naturaleza del problema con-
ductual es crucial el rastreo de las condiciones estimulares, tanto antecedentes como
consecuentes, que controlan esa conducta. Aunque una relación funcional más pre-
cisa se suele establecer a través de registros de observación o autoinformes específi-
cos, la entrevista permite una aproximación inicial rápida, flexible y económica que
posibilita al evaluador ir desarrollando las primeras hipótesis acerca del curso del
tratamiento. Si bien la aportación de la entrevista a este microanálisis de la conducta
problema es inicial y debe dar paso a registros de observación y otras técnicas, su va-
lor se incrementa notablemente a la hora de su contribución a aspectos de macroaná-
lisis, es decir, de relaciones entre los diferentes problemas que puede plantear el suje-
to (Emmelkamp, 1982). Esta visión más general del caso tiene mucho que ver con la
precaución que solicita Hersen (1983) ante la tendencia de algunos profesionales a
abordar la modificación de la primera o más aparente conducta problemática que se
aprecia y que es posible operacionalizar sin considerarla dentro del contexto global
del caso. Así, la entrevista permite sondear las relaciones de las posibles conductas
problema entre sí y los contextos donde se desarrollan, así como las consecuencias
para el funcionamiento adaptativo del sujeto, de modo que permite ir estableciendo
criterios de prioridad.
La entrevista 281
Siguiendo a Morganstern (1988), podríamos señalar algunos aspectos esenciales

en el proceso de la entrevista conductual:
a. Preparación del cliente para la evaluación; debido a la peculiaridad de la eva-

luación conductual como un proceso continuo y su ruptura con el papel del profe-
sional tradicional que busca por encima de todo la etiqueta diagnóstica, el evaluador
conductual debe exponer al sujeto estas peculiaridades y prepararle para un tipo de
proceso distinto del que sus expectativas pueden haber formado.
b. Especificación del problema; en muchas ocasiones los sujetos tienen dificul-
tades para exponer lo que les ocurre. Es frecuente encontrar expresiones muy vagas
e imprecisas y se hace necesario un esfuerzo por delimitar el problema para lo que
suele resultar útil solicitar una especificación a través de actividades o conductas
concretas, así como las coordenadas espaciales (lugares, situaciones sociales...) y
temporales (duración, comienzo...).
c. Redefinición del problema; obviamente es esencial para el evaluador redefi-
nir los trastornos en términos operativos dentro del marco conductual. Los sujetos
suelen tener sus propios conceptos acerca de lo que les ocurre, bien sea desde una
perspectiva muy personal o simplemente porque utilizan conceptos más o menos
conocidos como neurosis, estrés, etc. Una explicación sencilla acerca de la diferente
perspectiva que el enfoque conductual ofrece, aplicada al propio problema del sujeto
y sus posibilidades de evaluación e intervención, puede ser muy deseable.
d. Ampliación de la evaluación; si bien el objetivo inicial es la conducta proble-
ma, es indispensable evaluar el grado en que se ha generalizado y afecta al funciona-
miento del sujeto en los distintos contextos (familia, trabajo, relaciones sociales...) en
que se desenvuelve. Se requiere una exploración de estos diferentes aspectos que
permita observar la incidencia en ellos del problema, así como la presencia de otras
alteraciones. Un aspecto importante de este rastreo es valorar los recursos con los
que cuenta el propio sujeto tanto individualmente (conductas adaptativas, habilida-
des...), como física y socialmente (posibles personas que puedan cooperar si es con-
veniente, pareja, familiares, amigos...). Una guía práctica para la realización de este
tipo de entrevistas se puede encontrar en Llavona (1983).
En resumen, si bien la entrevista conductual hace de la identificación de la con-

ducta problema su principal objetivo, no se deben desechar otros aspectos propios
como es la información al cliente de las claves que le permitirán comprender lo que
supone el proceso conductual, favoreciendo así la motivación y la confianza, O as-
pectos de análisis de mayor perspectiva o de mayor molaridad que el análisis funcio-
nal de una determinada conducta.
V. LA ENTREVISTA EN SELECCIÓN DE PERSONAL
El trabajo del psicólogo en las organizaciones suele identificarse con su papel en la

selección de personal, aunque en los últimos tiempos el desarrollo en este ámbito ha
incrementado la importancia del profesional como formador y mediador, entre
otras posibilidades (Peiró, 1987). Por otra parte, la selección de personal ha evolu-
cionado cada vez más hacia la exigencia de técnicas más complejas que la entrevista
(análisis de tareas, profesiogramas...), aunque ésta no pierde su importancia en mo-
mentos cruciales de la toma de decisiones acerca de los candidatos.
La situación de entrevista en selección de personal presenta unas características
muy peculiares que se deben tener en cuenta y que comentamos muy brevemente
inspirándonos en el clásico trabajo de Nahoum (1961):
a. Elámbito social en que se desenvuelve es el de la organización, empresa o

institución que precisa incorporar nuevos trabajadores. Esto conduce a que el candi-
dato se presente ofreciendo su propio trabajo en competencia con los demás, por lo
que tratará de ofrecer una imagen muy positiva de sí mismo. El entrevistador en este
caso debe tomar la entrevista como un comportamiento a evaluar que puede no ser
representativo de la conducta del sujeto, y por tanto requiere una contrastación a
través de otras técnicas. En apartados posteriores veremos algunas estrategias del en-
trevistador que son especialmente relevantes en este tipo de entrevistas (clarifica-
ción, confrontación...).
b. El objetivo de la entrevista es emitir un juicio de adecuación del aspirante al
puesto de trabajo. Desde esta perspectiva se requiere encaminar el proceso más hacia
una valoración de idoneidad que hacia otros tipos de evaluación (para una discusión
de los conceptos de evaluación y valoración véase Fernández-Ballesteros, 1985; Pe-
lechano, 1988; o el capítulo sobre el concepto de evaluación psicológica en este mis-
mo manual). Las hipótesis que va desarrollando el evaluador en el curso de la entre-
vista se realizan no en términos de una identificación del problema, diagnóstico o
análisis funcional como en el ámbito clínico, sino en términos de una valoración o
juicio de calidad. Por otra parte, esto debiera reducir la exploración a aquellos aspec-
tos de preparación, habilidad, motivación o elementos de claro interés para la toma
de decisiones, sin explorar otros terrenos de intimidad de los sujetos (recuérdese la
fuerte polémica surgida en Estados Unidos con respecto a los abusos en la evalua-
ción de selección de personal y la intromisión en la intimidad de las personas).
c. Algunos autores como Morgan y Cogger (1982) han subrayado como finali-
dad de estas entrevistas la de proporcionar al candidato información sobre el puesto
de trabajo, requisitos, normas y costumbres, entendiendo que el profesional se con-
vierte en un representante de la organización y que la entrevista es un proceso de co-
municación que intenta averiguar si los intereses de ambas partes coinciden y se
ajustan.
d. Finalmente, y en términos más generales, el beneficiario de la intervención
es un tercero, esto es, la empresa u organización que solicita el trabajo de selección.
Esto marca unas claras diferencias con el trabajo en otros ámbitos donde el benefi-
ciario es el sujeto entrevistado.
Algunos aspectos tradicionales a evaluar en este tipo de entrevista son los si-
guientes (Morgan y Cogger, 1982):
a. Impresión inicial referida al aspecto, modales, expresión, grado de colabora-

ción, etcétera.
La entrevista
283
b. Experiencia profesional referida a aspectos como motivación en puestos de

trabajo anteriores, productividad, adaptabilidad, relaciones interpersonales,
experiencia de mando, promoción, etcétera.
c. Estudios y formación: currículo académico, versatilidad, intereses, trabajo
en equipo, relación con compañeros y profesores, etcétera.
d. Desarrollo personal: contexto familiar, nivel socioeconómico, evolución de
los intereses y actitudes laborales, etcétera.
e. Actividades e intereses actuales: motivaciones, intereses, trato social, auto-
imagen, etcétera.
En definitiva, tanto el contexto como la finalidad de la entrevista de selección de-

terminan una serie de peculiaridades que se han tratado de poner de relieve. Sin em-
bargo, la entrevista, como técnica de evaluación, tiene una serie de generalidades en
su desarrollo que serán materia de exposición en el próximo apartado. Considerare-
mos el proceso de interacción personal entre entrevistador y entrevistado, detenién-
donos en las implicaciones de cada uno de estos papeles.
VI. LA ENTREVISTA COMO INTERACCIÓN
A continuación se analizarán algunas de las cuestiones más importantes acerca de los

aspectos de la conducta interactiva que sucede en este escenario conductual (beha-
vioral setting), en términos de la psicología ecológica de Barker (1968), y que nos
servirán para examinar algunos fundamentos del proceso de esta técnica de evalua-
ción psicológica.
vI1. El papel del entrevistador

En pocas técnicas como en ésta la conducta del evaluador se convierte en una parte
esencial de la misma, aspecto que como hemos visto es uno de los que ha llevado a
importantes críticas en cuanto a las garantías científicas de la entrevista. De ahí la 1m-
portancia de detenernos en algunos aspectos sobresalientes de esta conducta.
Después de comentar la clasificación de la entrevista en función del grado de es-
tructura, se comprenderá que la variabilidad del comportamiento del entrevistador
depende en gran medida del grado de estructura de la entrevista. Como han afirma-
do Edelbrock y Costello (1990), las entrevistas totalmente estructuradas limitan has-
ta tal punto la conducta del evaluador que se torna en pieza perfectamente intercam-
biable dentro de la técnica, sin que el resultado tenga que variar significativamente
(obviamente, aparte estaría la comunicación no verbal; así por ejemplo, un entrevis-
tador cansado o malhumorado aun siguiendo la estructura puede influir en gran par-
te en las respuestas y por tanto en el resultado). En las entrevistas totalmente estruc-
turadas el papel del profesional se limita hasta tal punto que en muchas deellas existe
versión de aplicación para ordenador en la que es perfectamente sustituible por él.
En estos casos, en nuestra opinión, la entrevista se acerca más hacia los formatos de
cuestionario que a la propia entrevista ya que se pierde una parte esencial de la defi-
nición como es el encuentro cara a cara de dos o más personas (y con ello la posibili-
dad de registrar conducta no verbal). Por ello, a pesar de su interés desde otros crite-
rios, las versiones por ordenador de entrevistas estructuradas pierden una parte
esencial de la definición de esta técnica.
Sin embargo, en las entrevistas menos estructuradas es donde elpapel del evalua-
dor se convierte en algo crítico; es lo que se ha denominado el “estilo” de entrevista,
es decir, la forma específica que caracteriza la conducta de un entrevistador concreto,
lo que se convierte en fuente de error muy importante, pero también (y esto no deja
de ser relevante) en posibilidad de desarrollar especiales habilidades para obtener in-
formación, motivar al sujeto e impulsar el cambio de conducta. y
Ante esto cabe preguntarse ¿cuáles son las conductas o estrategias que suele uti-
lizar el entrevistador? A continuacón examinamos de modo ilustrativo algunas es-
trategias que puede adoptar el profesional para desarrollar sus objetivos de evalua-
ción.
Foley y Sharf (1981) señalan cinco criterios para el desarrollo de una buena en-
trevista: lograr que el sujeto se encuentre cómodo, obtener información, mantener el
control, mantener el rapport y concluir adecuadamente. Pasaremos a comentarlos
brevemente.
Para que el sujeto se encuentre cómodo es importante tener en cuenta una serie
de cuestiones. Con frecuencia el entrevistado se encuentra ansioso ante el hecho de
la consulta profesional y cualquier tiempo de espera adicional puede resultar espe-
cialmente molesto. Asimismo, las interrupciones de teléfono durante la entrevista o
una incorrecta disposición del mobiliario que no favorezca la interacción o sea ma-
nifiestamente incómodo pueden provocar efectos indeseados. Cuando el sujeto se
encuentra cómodo entra en disposición de colaborar más eficazmente y confiar en el
profesional.
Para obtener información de modo eficaz es importante que el entrevistador
permita en algunos momentos al sujeto expresar en sus propias palabras en qué con-
siste el problema o algunos aspectos de su historia, sin interrupciones innecesarias.
Como atirman Maloney y Ward (1976), esto permite evaluar la ambigijedad o los
conflictos que subyacen a la peculiar perspectiva de cada sujeto. No obstante, el en-
trevistador avezado ayuda al sujeto cuando éste no es capaz de aportar información
relevante o lo hace de un modo poco aprovechable. Se hace necesario entonces reali-
zar aclaraciones sobre aspectos confusos o inconsistente, repitiendo las cuestiones
o reformulándolas de modo más específico. Otra habilidad importante es la adapta-
ción del lenguaje a la edad y educación del sujeto. Tal como señalan Wiens y Mata-
razzo (1983), es importante tener en cuenta que si bien el evaluador es el experto en
el diagnóstico y el tratamiento, el sujeto es el experto en sí mismo y es él quien posee
la información relevante (al menos inicialmente) para la correcta orientación del
caso.
El mantenimiento del control supone aspectos como llevar el ritmo de la entre-
vista en función de las limitaciones de tiempo que existan. Un exceso de rapidez
puede convertir el encuentro en un brusco tiroteo de cuestiones que desanime a los
sujetos para expresarse libremente. Por el contrario, un ritmo excesivamente lento
La entrevista
285
puede conducir a la divagación y a perderse en trivialidades. Dentro del ritmo son

muy importantes las transiciones de unas cuestiones a otras, que pueden ser abor-
dadas con un breve resumen de la información obtenida en un apartado y la pre-
sentación del siguiente, indicando o reforzando en ocasiones el interés de abrir una
nueva área de contenido. Asimismo, el control implica saber actuar a tiempo inte-
rrumpiendo los discursos erráticos del sujeto y refocalizando la cuestión o el em-
pleo adecuado de pausas que faciliten sus respuestas. Si falla este cometido, nor-
malmente por pasividad del entrevistador, se corre el riesgo de que sea el
entrevistado el que domine la interacción invirtiendo así los papeles de la entre-
vista.
El mantenimiento del rapport implica el control por parte del entrevistador de
algunos aspectos de conducta no verbal como el mantener un contacto ocular ade-
cuado, postura, etc., que muestren un honesto interés por el sujeto. Es importante
también la aceptación de la propia concepción que desde sus personales valores hace
el sujeto acerca de sus sentimientos y del problema.
Por último, el evaluador debe saber concluir adecuadamente la entrevista. Éste es
un momento en el que es importante permitir que el sujeto plantee, a su vez, alguna
cuestión o duda. Por otro lado, es el momento en que el entrevistador informa acer-
ca de los pasos siguientes y en donde se debe aprovechar al máximo la ocasión para
motivar y animar a la participación posterior en el plan terapéutico, exponiendo si es
pertinente las alternativas posibles e implicando al paciente en alguna de ellas. Con
ello se da pie a la formulación de un aspecto esencial del proceso clínico como es el
contrato terapéutico.
Otros autores (por ejemplo, Maloney y Ward, 1976) también enuncian una serie
de acciones indispensables para el desarrollo del papel de entrevistador que nos pue-
den servir de complemento a lo expuesto. En primer lugar, y basándose especial-
mente en las preguntas iniciales más abiertas tales como «dígame qué le ocurre» o
«¿cuál es el problema?», el profesional debe dedicarse fundamentalmente a escuchar
y observar al sujeto, al mismo tiempo que combina estos datos para ir realizando al-
gún tipo de inferencias. A esta función básica se añaden tres actividades fundamenta-
les a desplegar: facilitación, clarificación y confrontación.
La facilitación se refiere a la necesidad de ayuda que se debe prestar al sujeto para

ir exponiendo adecuadamente su información en el autoinforme que se le pide. Nor-
malmente, basta con pequeños apoyos como peticiones de ampliación («¿puede de-
cirme algo más?» o «¿y después qué sucedió?») y en muchas ocasiones basta con li-
geros gestos de asentimiento verbales o no verbales que refuerzan el flujo de la
exposición. Obviamente con personas que tienen dificultades de exposición se re-
querirá mayor intervención de apoyo por parte del entrevistador, matizando más las
cuestiones, solicitando mayor concreción, etcétera. ns
La clarificación se refiere al esmero que el evaluador pone en no permitir que el
curso de la entrevista prosiga cuando un aspecto no ha quedado suficientemente diá-
fano. Algunas formas verbales como «no sé si le entiendo bien...» O «no estoy seguro
de lo que me quiere decir con...» cumplen el doble objetivo de solicitar una nueva
explicación y al mismo tiempo tener la precaución de no atribuir al sujeto la falta de
entendimiento, sino achacarla al propio entrevistador, de modo que no se pueda per-

cibir una crítica implícita a la capacidad de exposición de aquél.
La confrontación es un paso más elaborado en el intento que hace el evaluador
por organizar la información que está recibiendo. Se trata de analizar las inconsis-
tencias o los aspectos aparentemente contradictorios que se han recogido. Se pueden
referir a aspectos de contenido, cuando el sujeto comenta la misma cuestión en dos
momentos de forma diferente; también puede ser que se detecten datos improba-
bles, esto es, que se da una inconsistencia entre el relato y las expectativas que eleva-
luador se va formando (surge un dato extraño y no esperado por el hilo de la infor-
mación desarrollada hasta el momento); finalmente, puede haber contradicción o
falta de consistencia entre el contenido de la exposición y las manifestaciones no ver-
bales del sujeto (por ejemplo, un sujeto que comenta la pérdida de su empleo en tono
alegre).
Finalmente, uno de los aspectos más importantes en el desarrollo de la entrevista

es el registro de la información, ya que de su correcta realización va a depender una
buena parte de los resultados. Siguiendo la exposición de García Marcos (1983),
existirían las siguientes modalidades:
a. Recoger simultáneamente por escrito el contenido de la entrevista. Su venta-

ja es la menor pérdida de información, y su desventaja es la posible desatención al
entrevistado (falta de atención a su comunicación no verbal...).
b. Registrar la información una vez finalizada la entrevista. Es la situación
inversa a la anterior, por lo que resulta fácil que se tergiverse o se olvide una
buena parte de la información, aunque se pueda prestar mayor atención al suje-
to. Entre la postura anterior y ésta se puede realizar una modalidad mixta en la
que se recojan los datos más importantes textualmente en el momento y al ter-
minar se completen otros aspectos, permitiendo seguir la entrevista con especial
preocupación al mantenimiento del flujo de conversación y otros aspectos de in-
terés.
c. Grabaciones de la entrevista. Tanto en grabaciones de audio como de audio-
vídeo se logra el máximo de recogida de información a la vez que el evaluador puede
centrar sus esfuerzos en la relación con el cliente. Sin embargo, no está exenta de
problemas. En primer lugar, es necesario el consentimiento del sujeto por lo que pu-
diera no ser aceptado en algún caso. En segundo lugar, y más importante, la poste-
rior tarea de análisis del registro requiere un minucioso proceso cuyo coste en térmi-
nos de tiempo y esfuerzo puede ser excesivo para la práctica clínica cotidiana. No
obstante, su empleo es especialmente provechoso en tareas de investigación y entre-
namiento de esta técnica.
v12. El papel del entrevistado

En cuanto a la conducta del sujeto desde su papel de entrevistado, Cannel y Kahn
(1968) ya establecieron que para lograr una entrevista exitosa eran necesarias tres cir-
cunstancias:
La entrevista
287
a. La accesibilidad de los datos requeridos al sujeto, ya que en algunas ocasio-

nes se pueden estar planteando cuestiones cuya respuesta no está a su alcance, bien
por su edad (muy frecuente en niños y en ancianos), por su estado (por ejemplo,
trastornos graves que impliquen desorientación) o por otros motivos.
b. El conocimiento y la comprensión por parte del sujeto de su papel como
fuente de información y de los modos de transmisión de información que debe utili-
zar; en este caso es importante el ajuste de la entrevista al sujeto en aspectos tales
como la edad, el nivel cultural, el lenguaje, etcétera.
Cc. La motivación necesaria para asumir este papel, en donde se podrían analizar
tanto factores que incitan a la cooperación del sujeto como el deseo de agradar o la
necesidad de ayuda, como factores de inhibición cuando existe temor o inseguridad
sobre las consecuencias de transmitir información muy personal.
Más expresamente, Wiens (1990) expone varios aspectos del entrevistador que
pueden actuar como fuentes de error en la entrevista, de los cuales exponemos los
más significativos:
Deseabilidad social.
Falta de comprensión.
Lapsus de memoria.
Experimentar la situación de ser interrogado como algo estresante.
Ocultar las verdaderas opiniones.
OSO
SS La variabilidad de percepciones sobre la situación y el propósito de la entre-
vista.
Además de estas cuestiones acerca del comportamiento del entrevistado, conce-

bidas de un modo molar, existen estudios clásicos acerca de la conducta molecular
del entrevistado en relación al entrevistador. Nos referimos a los estudios que han
pasado a la historia como “efecto Greenspoon” y sus continuadores. Greenspoon
(1955, 1962) demostró que es posible aumentar de forma significativa ciertas emisio-
nes verbales (por ejemplo, los sustantivos plurales) si se utilizaban contingentemente
reforzadores verbales por parte del entrevistador (por ejemplo, la vocalización “mm
mm”). Posteriormente, se mostró la sutilidad y la complejidad de estos efectos que
pueden llegar a influir en la emisión de contenidos como las autorreferencias positi-
vas o negativas, verbalizaciones de hostilidad, etc. Este tipo de estudios experimen-
tales sobre la conducta verbal del entrevistado ponen de manifiesto, tal como afir-
man Kanfer y Phillips (1970) y recoge Silva (1981), que la información que el sujeto
elicita en la entrevista no sólo está determinada por su historia y sus propias elabora-
ciones perceptivas sobre el problema, sino también por la propia conducta del entre-
vistador y la situación de entrevista en general.
De manera más incisiva aún, Matarazzo y Wiens (1972) presentan extensos estu-
dios acerca de algunas variables como la verbalización (tiempo que emplea un sujeto
en emitir todas las palabras con las que construye un contenido comunicativo),
tiempo de reacción, latencia de tiempo de iniciativa e interrupciones. En este caso
también se concluye que el entrevistador de forma sutil establece una interacción de
mutua influencia que puede hacer variar estos parámetros.
En síntesis, la conducta del entrevistado es mucho más compleja que una simple
aportación de información, especialmente por el efecto que el entrevistador y la si-
tuación misma puede tener sobre él. Se hace necesario por parte del evaluador el
control de estos efectos como una parte esencial de la técnica, incluso en formatos al-
tamente estructurados.
vi3. Aprendizaje del papel de entrevistador

Durante muchos años se ha asumido que la entrevista es un arte al que se accede tras
muy larga experiencia, de lo que se concluía que no tenía mucho sentidolaconstruc-
ción de sistemas de enseñanza para esta técnica concreta. Este pensamiento estuvo
enormemente potenciado por los modelos dinámicos y humanistas en donde la au-
sencia de estructuración dejaba en el estilo del profesional la valía de la técnica. Ac-
tualmente, la preocupación por los sistemas de aprendizaje de las habilidades básicas
del entrevistador se deja notar en varias publicaciones donde se ensayan técnicas
como la representación de papeles (Balleweg, 1990) dirigidas al aprendizaje del con-
trol de situaciones de entrevista y conceptualización de problemas. En otros casos,
se trata de la incorporación de medios audiovisuales al entrenamiento (Veltum y
Miltenberger, 1989). Por su parte, Márquez, Rubio y Hernández (1987) realizaron
un estudio sobre la modificabilidad de las variables del entrevistador que intervienen
en el proceso, logrando mejorar varios aspectos mediante un plan de entrenamiento.
Es importante dejar claro que entrevistar no es un arte para el que sólo algunos
expertos estarían capacitados sino una habilidad en la que es posible progresar me-
diante el adecuado aprendizaje.
VI. GARANTÍAS CIENTÍFICAS DE LA ENTREVISTA
Es un tanto desolador el panorama que presenta la entrevista cuando uno mira “de-
bajo de la alfombra” y se pregunta acerca de sus garantías científicas. Ciertamente,
esta técnica encierra tal cantidad de aplicaciones, finalidades, formatos y encuadres
teóricos que probablemente sea imposible, tal como ya señaló Sundberg (1977), rea-
lizar generalizaciones sobre su fiabilidad y validez. Sin embargo, la cuestión es de-
masiado importante como para posponerla ya que está en juego nada menos que el
estatus científico de la técnica de más amplia aplicación en evaluación psicológica. Se
intentarán exponer brevemente algunos aspectos del estado de la cuestión, tanto en
relación a la fiabilidad como a la validez.
vii. Fiabilidad
El concepto clásico de fiabilidad hace referencia a la consistencia de las medidas

cuando a un sujeto se le aplica repetidamente el mismo instrumento. Este concepto
estaba claramente vinculado a las teorías internalistas (en la acepción de Bermúdez,
La entrevista 289
1986) que defienden los presupuestos de estabilidad y consistencia de la conducta.

Desde este punto de vista, la estabilidad y consistencia de la puntuación reflejaría el
hallazgo de la adecuada medida del constructo que se pretende evaluar. Desde esta
concepción más tradicional podríamos establecer que una primera cuestión sobre la
fiabilidad de la entrevista consiste en averiguar si la repetida aplicación tras un inter-
valo de tiempo arroja la misma información. Tradicionalmente, la fiabilidad incor-
pora también el estudio de la consistencia interna de los ítems del instrumento de
evaluación. En nuestro caso, para la entrevista, se trataría de averiguar hasta qué
punto la información obtenida en una parte de la entrevista es consistente con la ob-
tenida en otros apartados. Finalmente, la fiabilidad en el caso de algunas técnicas en
las que interviene decididamente el evaluador como parte esencial del proceso de re-
gistro, debe justificarse con una referencia al grado en que esta intervención no sesga
subjetivamente el material recogido. Tanto en las técnicas de observación como en la
entrevista, la fiabilidad del observador o del entrevistador se convierten en un tema
crucial. Desde esta perspectiva existe una clara ruptura con un clásico concepto de
fiabilidad psicométrica como consistencia temporal de las medidas u homogeneidad
de los ítems, ya que lo que se requiere es una prueba de objetividad. Tal como lo ha
expresado García Marcos (1983), en el caso de la entrevista la cuestión clave es si la
información obtenida por un determinado entrevistador es idéntica a la que obten-
dría otro entrevistador con el mismo sujeto. Lógicamente no es ésta una medida de
objetividad sino de intersubjetividad, ya que es el acuerdo entre distintas perspecti-
vas parciales el indicador de que se está reflejando una determinada “realidad”. Sin
embargo, la defensa de otro criterio de objetividad, ha resultado mucho más contro-
vertida. Por ejemplo, la exactitud, en el sentido en que la define Kazdin (1977), se
propone distinguir precisamente el aspecto de acuerdo entre evaluadores del con-
cepto de exactitud en los registros, que vendría definida por el grado en que éstos
son reflejo fiel del comportamiento del sujeto. Aunque ha sido defendido por Cone
(1987) en el ámbito de la evaluación conductual, la suposición de índices de contraste
incontrovertibles para asegurar la exactitud de lo registrado nos lleva a plantear la
evaluación de tales indicadores como un problema al menos tan serio como el que se
pretendía solucionar.
Otra forma de exponer las diferentes vertientes del problema es la clasificación
de las fuentes de error propuesta por Spitzer, Endicott y Robins (1975) con las que
podríamos describir algunos de los principales problemas que afectan a la fiabilidad:
a. Varianza del sujeto; el sujeto puede estar presentando distintas conductas

problemáticas en distintos momentos del tiempo, bien porque son etapas de un mis-
mo proceso (por ejemplo, trastorno maníaco-depresivo) bien porque realmente son
problemas distintos. :
b. Varianza de las fuentes de información; referida tanto a la cantidad de infor-
mación que obtiene cada profesional como a aspectos de utilización exhaustiva o no
de los recursos informantes (por ejemplo, consultar con otros familiares).
c. Varianza de observación; el entrevistador durante el proceso de observación y
registro puede utilizar procesos diferentes que den lugar a resultados también distintos.
d. Varianza de criterio; los profesionales pueden utilizar diferentes criterios
diagnósticos y por tanto llegar a conclusiones muy distintas en el mismo caso.
Para Spitzer y cols. (1975) la principal causa de desacuerdos es la varianza de cri-

terios, seguido de la varianza de información. Para reducir elprimero se ha intentado
disminuir su magnitud con el desarrollo de sistemas de clasificación nosológica bien
afinados y en los que los criterios sean consensuados (de ahí la importancia de los
sistemas DSM). En el segundo caso, la disminución viene de la mano del empleo de
entrevistas altamente estructuradas que aseguren que el entrevistador recorre una
misma ruta y de un modo estandarizado. yo
Si nos hemos extendido algo más en cuestiones teóricas acerca de la fiabilidad es
porque precisamente en la entrevista se hace especialmente difícil aplicar unívoca-
mente este concepto. En el ámbito de la evaluación diagnóstica, cuando se ha pre-
tendido fundamentar la fiabilidad de una entrevista la mayor importancia se ha con-
cedido a los índices de fiabilidad entendidos como acuerdo “interentrevistadores”.
El grado en que el uso de un determinado tipo de entrevista lograba acuerdos en el
diagnóstico con que concluían los evaluadores se ha juzgado el aspecto esencial. Ya
se comentó en apartados anteriores cómo las entrevistas estructuradas han ido con-
siguiendo, paralelamente al desarrollo de un consenso en las categorías diagnósticas,
una importante mejoría en su fiabilidad.
En cuanto a la evaluación conductual, la fiabilidad debería corresponder al
acuerdo entre evaluadores acerca de las conductas objetivo a seleccionar o en cuanto
a las hipótesis funcionales que se derivan de los datos recogidos. Sin-embargo, exis-
ten muy pocos trabajos que se refieran a estos aspectos, y alguno de ellos como el de
Hay y cols. (1979) informa de una muy escasa fiabilidad interentrevistadores para
detectar áreas problemáticas específicas.
Cuando se ha tratado de un modo más tradicional el concepto de fiabilidad, los
trabajos han intentado comprobar si la aplicación de una entrevista en dos diferentes
períodos de tiempo al mismo sujeto lograban los mismos resultados, obviamente en
cuanto a aspectos que deben ser estables (por ejemplo, referentes a cuestiones histó-
ricas O del desarrollo). En una revisión de algunos de estos trabajos, García Marcos
(1983) concluye que existen factores complejos como la motivación del sujeto, su ni-
vel de formación, el intervalo temporal transcurrido, etc., que inciden de manera de-
sigual y poco conocida en cuanto a sus interacciones recíprocas y su influencia sobre
los resultados obtenidos.
Un apartado especial que ha ocupado en los últimos años a un buen número de
investigadores se refiere a la ventaja de utilizar otros informantes y su aumento en la
fiabilidad. Ha habido recientes estudios en esta materia acerca de poblaciones o sec-
tores como los niños (Hodges y cols., 1987), los pacientes psiquiátricos (Brewin y
cols., 1990), los ancianos (Jorm y Korten, 1988) o los adultos con retraso mental
(Klein-Parris, Clermont-Michel y O"Neill, 1986).
En síntesis, la fiabilidad en las entrevistas ha alcanzado su éxito más espectacular
en su acepción de acuerdo “interjueces” en las entrevistas de finalidad diagnóstica
(como en el caso de la SADS o DIS), si bien su éxito se debe tanto a una alta estructura-
ción como, probablemente en su mayor parte, a un factor relativamente externo
como es el desarrollo de los sistemas de clasificación psicopatológica. Sin embargo,
los aspectos de la fiabilidad en su acepción más tradicional, como estabilidad de los
datos recogidos y como consistencia interna de los diferentes ítems planteados han
originado muy escasa investigación.
La entrevista 291
vIL2. Validez
Si la fiabilidad es un concepto con diferentes acepciones, la validez alcanza tal grado

de matización que su utilización sin adjetivación alguna (criterial, predictiva, discri-
minante) se va haciendo cada vez menos frecuente. En el caso de la entrevista algunas
de las vertientes del concepto de validez más importantes son las siguientes:
a. Validez de contenido; con ella se suele hacer referencia al grado en que el

conjunto de cuestiones planteadas en la entrevista representa adecuadamente el uni-
verso de situaciones que se desea sondear, aunque según Messick (1975) sería más
adecuado hablar de la representatividad de las respuestas recogidas a través de esas
cuestiones con el fin de que el término de validez esté plenamente justificado. Vista
así, la validez de contenido sería una valoración de la construcción de la entrevista en
cuanto a su capacidad para generar respuestas que representen el universo de aquello
que se pretende evaluar.
b. Validez de criterio; trata de expresar el grado en que la información recogida
con un instrumento puede utilizarse para inferir el rendimiento o el resultado en
otra variable diferente, tanto en el sentido de predicción futura (validez predictiva)
como de covariación sincrónica (validez concurrente). En la entrevista aparecen al-
gunos problemas específicos en relación con este tipo de validez ya que los criterios
a elegir suelen referirse en ocasiones a aspectos muy parciales, incluso ítems aislados
(puede establecerse la validez de un dato de la entrevista contrastándolo con un re-
gistro de archivo, como el peso al nacer), pero no siempre existen criterios para todas
las cuestiones. En la entrevista con finalidad diagnóstica se ha utilizado como crite-
rio la clasificación psicopatológica realizada mediante otras técnicas, como ya co-
mentamos en el correspondiente apartado de este capítulo (véase apartado de entre-
vistas diagnósticas).
c. Validez de constructo; desde las teorías psicométricas más actuales, y tal
como desarrolla Silva (1989) en su importante revisión del tema, este concepto tien-
de a erigirse en la verdadera clave del problema de la validez de un instrumento, has-
ta el punto de que parece haber un consenso cada vez mayor en que el resto de ver-
tientes de validez finalmente deben hacer referencia a esta validez de constructo.
Internarse en este intrincado campo conceptual excedería las pretensiones de este ca-
pítulo y por ello resumiremos, siguiendo a Nelson y Hayes (1979), en dos cuestio-
nes fundamentales la importancia de este criterio psicométrico:
— ¿Incrementa este procedimiento de evaluación nuestra comprensión del

comportamiento?
— ¿Nos permite sostener, extender, modificar o elaborar principios y supuestos
sobre el comportamiento?
A estas cuestiones, lógicamente, no se responde con un determinado índice nu-

mérico sino que es necesario estimar históricamente el conjunto de aportaciones rea-
lizadas con una determinada técnica de evaluación, en un proceso permanentemente
abierto, para poder estimar la validez de constructo.
Desgraciadamente, asunto tan central y candente en evaluación psicológica no

ha movido apenas a la investigación en lo que respecta a la entrevista. Sin soslayar su
importancia, cabe augurar un difícil camino si tenemos en cuenta ladiversidad de
concepciones teóricas o los diferentes entramados de redes nomológicas en los que
se puede ver ubicada esta técnica.
d. Finalmente, se ha hablado en ocasiones de la validez de tratamiento, que
hace referencia a la utilidad de una técnica de evaluación concreta para lograr un tra-
tamiento más efectivo o tomar decisiones más adecuadas. Normalmente, se trata de
demostrar hasta qué punto, en este caso la entrevista, añade una información rele-
vante para los fines de la evaluación en comparación con otras técnicas (lo que a su
vez se matiza con el término de validez incremental). Creemos que uno de los pro-
blemas cruciales, tal como resume McReynolds (1985), es que sobre este aspecto,
para las técnicas de evaluación en general, se ha escrito muy poco. En el caso concre-
to de la entrevista, una de las líneas importantes de investigación debería ser precisa-
mente ésta, es decir, explorar el tipo de información relevante que proporciona en
cada una de sus aplicaciones y las ventajas que supone con respecto a otras técnicas.
Más allá de la utilidad demostrada por su versatilidad y adaptación en todos los ám-
bitos, se requiere la investigación rigurosa de este aspecto de utilidad.
Finalmente, en el apartado concreto de la entrevista de selección de personal, en

la reciente revisión de Schmidt, Ones y Hunter (1992), se comentan los avances en
estudios de validez en este ámbito con aportaciones interesantes sobre la mejora de
este criterio a través del uso de entrevistas más estructuradas (Harris, 1989) o de la
revisión de los procedimientos utilizados para la validación (Dreher, Ash y Han-
cock, 1988).
En síntesis, las garantías científicas de la entrevista constituyen un aspecto espe-
cialmente deficitario. Las dificultades de la validación de una técnica tan versátil y de
tan amplia aplicación no se escapan a nadie, pero en cualquier caso, a tenor de los de-
sarrollos teóricos de los criterios psicométricos, en la actualidad puede ser un buen
momento para relanzar la investigación de los aspectos citados.
VII CONCLUSIONES
La entrevista es una técnica de evaluación, pero también es mucho más que esto.
Para la psicología es el marco en el que se desenvuelve la mayoría de sus intervencio-
nes, de modo que difícilmente puede convertirse en opción como instrumento y más
bien cabe hablar de una herramienta imprescindible. Su versatilidad y flexibilidad
permiten moldear una entrevista para cada finalidad y adaptarla incluso al marco
teórico del evaluador lo que le confiere gran ventaja respecto al resto de las técnicas
de evaluación psicológica. La facilidad y la economía de costes con que recoge as-
pectos como las coordenadas ambientales (temporales y espaciales) en las que se si-
túa la conducta a evaluar (aspectos biográficos, desarrollo, contexto familiar, laboral,
escolar, social...) suponen una ventaja reconocida en muy diversos enfoques de eva-
luación y sin demasiada competencia por parte de otras técnicas alternativas.
La entrevista 293
Los problemas de fiabilidad, especialmente en cuanto al acuerdo en el diagnósti-

co, parecen encaminarse a una solución como consecuencia del consenso en las clasi-
ficaciones psicopatológicas. En otras aplicaciones como la entrevista conductual la
cuestión no es tan clara y creemos que entra de lleno en el problema de los criterios
psicométricos de la evaluación conductual.
Se ha tratado de profundizar en este capítulo en los comportamientos más rele-
vantes que adoptan los dos sujetos que interactúan en una entrevista, cada uno en el
ejercicio de su propio papel. Se ha pretendido con ello mostrar algunas de las estrate-
glas que el evaluador debe emplear para asegurarse el máximo provecho de la entre-
vista. Es de esperar que la entrevista siga su afianzamiento tras las críticas de los pri-
meros años. En aspectos diagnósticos la mejora de las garantías científicas es un
hecho, en otras aplicaciones es de esperar que se produzcan.
American Psychiatric Association (1956). Diagnostic and statistical manual of mental disor-
ders (1* ed.). Washington DC. APA.
ders (3* ed. rev.). Washington DC. APA.
ders (4* ed). Washington DC. APA.
Balleweg, B. (1990). The interviewing team: An exercise for teaching assessment and concep-
tualization skills. Teaching of Psychology, 17, 241-243.
Barker, R. G. (1968). Ecological psychology: Concepts and methods for studying the environ-
ment of human behavior. Stanford. Stanford University Press.
Bermúdez, J. (1986). Teorías de la personalidad. Madrid. UNED.
Brewin, C., Veltro, F., Wing, J. K. y McCarthy, B. (1990). The assessment of psychiatric disa-
bility in the community: A comparison of clinical, staff, and family interviews. British
Journal of Psychiatry, 157, 671-674.
Cannel, C. F. y Kahn, R. L. (1968). Interviewing. En G. Lindzey y E. Aronson (dirs.), The
handbook of social psychology. Reading. Addison-Wesley.
Cone, J. D. (1987). Consideraciones psicométricas en la evaluación conductual. En R. Fer-
nández-Ballesteros y J. A. Carrobles (dirs.), Evaluación conductual. Metodología y apli-
caciones (2* ed.). Madrid. Pirámide.
Cormier, W. H. y Cormier, L. S. (1979). Interviewing strategies for helpers: A guide to assess-
ment, treatment, and evaluation. Monterrey. Brooks/Cole.
Dreher, G. F., Ash, R. A. y Hancock, P. (1988). The role of the traditional research design in
underestimating the validity of the employment interview. Personnel Psychology, 41, 315-
324.
Edelbrock, C. y Costello, A. J. (1990). Structured interviews for children and adolescents. En
Pergamon Press.
Emmelkamp, P. M. G. (1982). Phobic and obsessive-compulsive disorders: Theory research

and practice. Nueva York. Plenum Press. : o)
Endicott, ]. y Spitzer, R. L. (1978). A diagnostic interview: The Schedule for Affective Disor-
ders and Schizofrenia. Archives of General Psychiatry, 35, 837-844. E
Psicológica/Psychological Assessment, 1, 7-31.
Fernández-Ballesteros, R. (1992). Los autoinformes. En R. Fernández-Ballesteros (dir.), In-
troducción a la evaluación psicológica (vol. 1). Madrid. Pirámide.
Foley, R. y Sharf, B. F. (1981). The five interviewing techniques most frequently overlooked
by primary care physicians. Behavioral Medicine, 8, 26-31. y le anpriz
García Marcos, J. A. (1983). La entrevista. En R. Fernández-Ballesteros (dir.), Psicod1agnósti-
co. Madrid. UNED.
Greenspoon, J. (1955). The reinforcing effect of two spoken sounds on the frequency of two
responses. American Journal of Psychology, 68, 409-416.
Greenspoon, J. (1962). Verbal condictioning and clinical psychology. En A. J. Bachrach
(dir.), Experimental foundations of clinical psychology. Nueva York. Basic Books.
Harris, M. M. (1989). Reconsidering the employment interview: A review of recent literature
and sugestions for future research. Personnel Psychology, 42, 691-726.
Hasin, D. S. y Grant, B. F. (1987). Diagnosing depressive disorders in patients with alcohol
and drug problems: A comparison of the SADS-L and the DIS. Journal of Psychiatric Re-
search, 21, 301-311.
Hay, W. M., Hay, L. R., Nagle, H. V. y Nelson, R. O. (1979). The reliability of problem
identification in the behavioral interview. Behavioral Assessment, 1,107-108.
Hersen, M. (1983). Ontpatient behavior therapy: A clinical guide. Nueva York. Grune and
Stratton.
Hodges, K., McKnew, D., Burbach, D. J. y Roebuck, L. (1987). Diagnostic concordance bet-
ween the Child Assessment Schedule (CAS) and the Schedule for Affective Disorders and
Schizofrenia for School-Age (K-SADS) in an outpatient sample using lay interviewers.
Journal of the American Academy of Child and Adolescent Psichiatry, 26, 654-661.
Jorm, A. F. y Korten, A. E. (1988). Assessment of cognitive decline in the elderly by infor-
mant interview. British Journal of Psychiatry, 152, 209-213.
Kahn, R. L. y Cannell, C. F. (1964). Entrevista: investigación social. En Enciclopedia interna-
cional de las ciencias sociales. Madrid. Aguilar.
Kanfer, F. H. y Grimm, L. G. (1977). Behavioral analysis: Selecting target behaviors in the in-
terview. Behavior Modification, 1, 7-28.
Bares EF. H. y Phillips, J. S. (1970). Learning foundations of behavior therapy. Nueva York.
Wiley.
Kazdin, A. E. (1977). Artifact, bias, and complexity of assessment: The ABCs of reliability.
Journal ofApplied Behavior Analysis, 10, 141-150.
Keller, M. B., Lavori, P. W. y Andreasen, N. C. (1981). Test-Retest reliability of assessing psy-
chiatrically ill patients in a multicenter design. Journal of Psychiatric Research, 16, 213-227.
Kerlinger, F. N. (1975). Investigación del comportamiento. Técnicas y metodología. México.
Interamericana. (Orig. 1973).
Klein-Parris, C., Clermont-Michel, T. y O'Neill, J. (1986). Effectiveness and efficiency of
criterion testing versus interviewing for collecting functional assessment information.
American Journal of Occupational Therapy, 40, 486-491.
Kolko, D. J. y Kazdin, A. E. (1989). Assessment of dimensions of childhood firesetting
among patients and nonpatients: The firesetting risk interview. Journal of Abnormal
Child Psychology, 17, 157-176.
Langsley, D. G. y Hollender, M. H. (1982). The definition of a psychiatrist. American Jour-
nal of Psychiatry, 139, 81-85.
La entrevista
295
Lemos, S. (1991). Diagnóstico y clasificación en psicopatología. En A. Belloch y E. Ibáñez

_ (dirs.), Manual de psicopatología. Valencia. Promolibro.
Linehan, M. M. (1977). Issues in behavioral interview. En J. D. Cone y R. P. Hawkins (dirs.), Be-
havioral assessment. New directions in clinical psychology. Nueva York. Brunner-Mazel.
Llavona, L. (1983). Una guía práctica de la entrevista conductual. Revista Española de Tera-
pia de Conducta, 1, 171-198.
Maloney, M. P. y Ward, M. P. (1976). Psychological assessment. A conceptual approach. Nue-
va York. Oxford University Press.
Márquez, O., Rubio, V. J. y Hernández, J. M. (1987). Propuesta de entrenamiento sistemáti-
co en la entrevista: selección de variables modificables. Evaluación Psicológica/Psycholo-
Matarazzo,J.D. y Wiens, A. N. (1972). The interview. Research on its anatomy and structu-
re. Chicago. Aldine-Atherton.
McGrath, R. J. (1990). Assessment of sexual agressors: Practical clinical interviewing strate-
g1es. Journal of Interpersonal Violence, 5, 507-519.
McReynolds, P. (1985). Psychological assessment and clinical practice: Problems and pros-
pects. En J. N. Butcher y C. D. Spielberger (dirs.), Advances in personality assessment
(vol. 4). Hillsdale, Nueva Jersey. LEA.
Messick, S. (1975). The standard problem: Meaning and values in measurement and evalua-
tion. American Psychologist, 30, 955-966.
Morgan, H. H. y Cogger, J. W. (1982). Manual del entrevistador. Madrid. TEA Ediciones.
(Orig. 1972).
Morganstern, K. P. (1988). Behavioral interviewing. En A. S. Bellack y M. Hersen (dirs.), Be-
havioral assessment. A practical handbook. Nueva York. Pergamon Press.
Nahoum, C. (1961). La entrevista psicológica. Buenos Aires. Kapelusz.
Nelson, R. O. y Hayes, S. C. (1979). Some current dimensions of behavioral assessment. Be-
havioral Assessment, 1, 1-16.
Párraga, J. (1986). La entrevista en psicodiagnóstico. En A. Blanco (dir.), Apuntes de psico-
diagnóstico. Valencia. Promolibro.
Peiró,J.M. (1987). Psicología de la organización. Madrid. UNED.
Pelechano, V. (1988). Del psicodiagnóstico clásico al análisis ecopsicológico (vol. 1). Valencia.
Alfaplús.
Robins.L. N., Helzer,J.E., Croughan,J.y Ratcliff, K. S. (1981). National Institute of Mental
of General Psichiatry, 10, 41-46.
Robins, L. N., Helzer,J.E., Ratcliff, K. S. y Syfried, W. (1982). Validity of the Diagnostic In-
terview Schedule. Version II: DSM-I11 diagnoses. Psychological Medicine, 12, 855-870.
Schmidt, L. R. y Kessler, B. H. (1976). Anamnese: Metodische probleme, erhebungstrategien
und eschemata. Weinheim. Beltz.
Schmidt, F. L., Ones, D. S. y Hunter, J. E. (1992). Personnel Selection. Annual Review of
Psychology, 43, 627-670. :
Shea, S. C. (1990). Contemporary psychiatric interviewing; Integration of DSM-IIE-R, psycho-
dinamic concerns, and mental status. En G. Goldstein y M. Hersen (dirs.), Handbook of
psychological assessment. Nueva York. Pergamon Press.
Silva, F. (1981). La entrevista. En R. Fernández-Ballesteros y J. A. Carrobles (dirs.), Evalua-
ción conductual. Madrid. Pirámide. zo VARO,
Silva, F. (1992). La entrevista. En R. Fernández-Ballesteros (dir.), Introducción a la evalua-
ción psicológica (vol. 1). Madrid. Pirámide. mn ae '
Spitzer, R. G., Endicott, J. y Robins, E. (1975). Clinical criteria for diagnosis and DSM-111.
American Journal of Psychiatry, 35, 773-782.
Spitzer, R. L., Endicott, J. y Robbins, E. (1978). Research Diagnostic Criteria. Archives of

General Psychiatry, 35, 773-782.
Spitzer, R. L., Williams, J. B. W. y Gibbon, M. (1987). Instruction Manual for the Structured
Clinical Surgery Interview for DSM-IE-R (SCID, 4/1/87 revision). Nueva York. Biometrics
Research Department, New York State Psychiatric Institute.
Sundberg, N. D. (1977). Assessment ofpersons. Englewood Cliffs. Prentice Hall. )
Veltum, L. G. y Miltenberger, R. G. (1989). Evaluation of self-instructional package for trai-
ning initial assessment interviewing skills. Behavioral Assessment, 11, 165-177.
Vizcarro, C., León, O., Garcimartín, J., García, J., Llorente, G., Romero, ]. y Vargas JA
(1986). Aportaciones de una entrevista estructurada (SADS) al acuerdo interjueces en el
diagnóstico por medio de los criterios de diagnóstico para la investigación. Evaluación
Psicológica/Psychological Assessment, 2, 99-114.
Wiens, A. N. (1990). Structured clinical interviews for adults. En G. Goldstein y M. Hersen
Wiens, A. N. y Matarazzo, J. D. (1983). Diagnostic interviewing. En M. Hersen, A. E. Kaz-
din y A. S. Bellack (dirs.), The clinical psychology handbook. Nueva York. Pergamon
Press.
Wing, J. K., Birley, J. L. T. y Cooper, J. E. (1967). Reliability of a procedure for measuring
and clasifying “present psychiatric state”. British Journal of Psychiatry, 113, 449-515.
Wittchen, J. U., Semler, G. y Von Zerssen, D. (1985). A comparison of two diagnostic met-
hods. Clinical /CD diagnoses vs. DSM-I11 and Research Diagnostic Criteria using the Diag-
nostic Interview Schedule (version 2). Archives of General Psychiatry, 42, 677-684.
Zubin, J. (1989). Use of research instruments in psychopathological assessment: Some histo-
rical perspectives. En S. Wetzler (dir.), Measurimg mental illnes: Psychometrics assessment
for clinicians. Washington. American Psychiatric Press.
Bingham, W. y Moore, B. (1973). Cómo entrevistar. Madrid. Rialp.

Bruch, M. y Meyer, V. (1996). La entrevista conductual. En G. Buela-Casal, V. E. Caballo y
dde Sierra (dirs.), Manual de evaluación en psicología clínica y de la salud. Madrid. Si-
glo XXI.
Cardona, S. (1991). Entrevistas en selección de personal. Madrid. Díaz de Santos.
Edelbrock, C. y Costello, A. J. (1990). Structured interviews for children and adolescents. En
Pergamon Press.
Edelstein, B. y Yoman, J. (1991). La entrevista conductual. En V. E. Caballo (dir.), Manual de
técnicas de terapia y modificación de conducta. Madrid. Siglo XXI.
Morgan, H. H. y Cogger, J. W. (1982). Manual del entrevistador. Madrid. TEA Ediciones.
(Orig. 1972).
Morganstern, K. P. (1988). Behavioral interviewing. En A. S. Bellack y M. Hersen (dirs.), Be-
havioral assessment. A practical handbook. Nueva York. Pergamon Press.
Silva, F. (1992). La entrevista. En R. Fernández-Ballesteros (dir.), Introducción a la evalua-
ción psicológica (vol. 1). Madrid. Pirámide.
Villarreal, M. (1981). Fundamentos de la entrevista conductual. México. Trillas.
Wiens, A. N. (1990). Structured clinical interviews for adults. En G. Goldstein y M. Hersen
14. AUTOINFORMES
F. JAVIER PÉREZ-PAREJA
Il. INTRODUCCIÓN
Un autoinforme «supone un mensaje verbal que una persona emite sobre cualquier
tipo de manifestación propia» (Fernández-Ballesteros, 1992, p. 218); es decir, los
autoinformes son producto de la introspección o la autoobservación que una per-
sona realiza sobre su propia conducta. Como podemos comprobar, la propia defi-
nición de autoinforme contiene implícitamente una gran heterogeneidad concep-
tual sobre las posibles propiedades de los contenidos autoinformados. A esta
heterogeneidad en el contenido se suman las distintas elaboraciones que el evalua-
dor pueda realizar. El evaluador puede considerar la información obtenida a través
de un autoinforme como una simple respuesta verbal o como expresión verbal de
un evento encubierto o, incluso, como signo de un atributo interno. Por otra parte,
en cuanto a los contenidos, el autoinforme permite conocer y evaluar conductas
manifiestas y fisiológicas, las cuales son contrastables, así como conductas encu-
biertas a través de la autoobservación del sujeto. Asimismo, en muchos casos el in-
forme verbal es la única vía de transmisión de determinadas respuestas (pensamien-
tos, sentimientos...), de forma que a través de los autoinformes lo inobservable se
hace observable, es decir, se puede poner de manifiesto lo encubierto. De aquí sur-
ge la polémica en torno a los autoinformes, pues, como señala Lieberman (1979),
éstos han sido considerados como una manera de presentar renovadamente la in-
trospección. Así, como es de sobra conocido, la introspección supuso el método
por excelencia a la hora de elaborar la primera psicología científica, siendo poste-
riormente enormemente criticado y rechazado por enfoques más modernos de la
misma.
II. CONCEPTOS Y PRINCIPIOS BÁSICOS
Como indicábamos en el apartado anterior, pese a su utilidad, los autoinformes

como procedimiento de recogida de información han sido profusamente criticados,
fundamentalmente a partir de la aparición del modelo conductual. De este modo, tal
como señalan Jensen y Haynes (1986), desde la perspectiva del modelo conductual
los autoinformes han sido criticados tanto por razones teóricas como por motivos
de naturaleza empírica; entre estas razones destacan las siguientes:
Universidad de Las Islas Baleares.

298 F. Javier Pérez-Pareja
a. El carácter subjetivo de los datos obtenidos a través de los autoinformes

frente al énfasis que desde el modelo conductual se realiza acerca de la objetividad de
la evaluación (Haynes, 1978).
b. Lafalta de validez externa de los datos obtenidos por autoinforme (Mischel,
1968; Bellack y Hersen, 1977), lo cual implica cuestionar la validez de la información
subjetiva que afecta tanto a los autoinformes utilizados en contextos clínicos (Ran-
kin, 1990) como a los utilizados en investigación básica o en laboratorio (Baker y
Brandon, 1990).
c. La evaluación realizada a través de los mismos se dirige mayoritariamente a
la evaluación de rasgos de personalidad; es decir, con los cuestionarios se pretenden
evaluar fundamentalmente constructos.
Sin embargo, dichos autores igualmente indican que a pesar de las críticas recibi-
das, los autoinformes son utilizados en la formulación y análisis de gran cantidad de
problemas conductuales, tales como la falta de asertividad, problemas de interacción
social, ansiedad, ingesta de sustancias, hábitos de vida inadecuados, etc. Si bien, tal
como señala Fernández-Ballesteros (1992), no podemos generalizar la bondad ni la
inadecuación de dicha técnica, dado que el grado de adecuación de la misma vendrá
determinado por el tipo de manifestación o actividad a la que se refiera el informe,
así como a la forma de conceptualizarlo. Sin embargo, los autoinformes presentan
toda una serie de ventajas potenciales que han incrementado su uso; entre dichas
ventajas podríamos destacar las siguientes:
a. La relación entre su bajo coste temporal y económico, y la alta eficacia que

representa su uso.
b. Generalmente, poseen validez para determinados problemas conductuales,
resultando de enorme utilidad en su evaluación, debido principalmente a
que los informes subjetivos de las personas son una de las primeras razones
mediante las que se inicia una intervención psicológica.
c. Los autoinformes pueden poseer puntuaciones objetivas, lo cual minimiza
el nivel de inferencia por parte del evaluador.
d. Son aplicables a un amplio rango de población y a múltiples problemas de
conducta.
e. Pueden usarse para reunir datos en índices de respuesta múltiple.
Asimismo, y desde la perspectiva conductual, el uso de autoinformes cumple

con una serie de funciones entre las que cabe señalar las siguientes:
Recogida de información histórica y/o demográfica.

Investigación y diagnóstico.
Identificación y descripción de conductas.
PA
LN Identificación de variables de utilidad para el análisis funcional y para el di-
seño de programas de intervención.
Evaluación de los resultados de la intervención.
Evaluación del proceso terapéutico.
0 Evaluación de la validez social.
p
TA
Autoinformes
2939
Por otra parte, el reconocimiento de las ventajas, así como el extenso uso que de
los autoinformes se realiza desde la perspectiva conductual, no ha hecho más que in-
crementar la aparición de los problemas que se derivan del mismo y que fundamen-
talmente se centran en los siguientes aspectos:
a. Adopción de la técnica de autoinforme desde una perspectiva tradicional, no

conductual.
b. Aplicación inapropiada.
Cc. Menosprecio de las consideraciones y garantías de naturaleza psicométrica
(inconsistencia interna, ausencia de validación multimétodo de los construc-
tos utilizados...)
Junto a estos problemas potenciales aparece un problema adicional que afecta a

la mayoría de los autoinformes construidos o usados desde la perspectiva conduc-
tual. En muchas ocasiones, los datos obtenidos con estos instrumentos consisten en
el sumatorio de puntuaciones relativas a una serie de ítems que son conceptualizados
como una muestra representativa del universo de conductas o conductas problema.
Sin embargo, esta simple adición de puntuaciones no proporciona información so-
bre variables antecedentes, organísmicas y consecuentes asociadas a la conducta o
conductas problema.
En otro orden de cosas, es importante hacer notar que la validez del autoinforme
depende en gran medida de la naturaleza y concepto de la respuesta evaluada. Dicho
en otras palabras, y tal como señala Fernández-Ballesteros (1992), la información
verbal de las personas puede referirse tanto a manifestaciones de naturaleza externa
como interna; es decir, una persona a través de un autoinforme puede informar sobre
sus conductas motoras, sobre sus respuestas fisiológicas y/o sobre sus cogniciones.
Pero, del mismo modo podía manifestar su experiencia subjetiva relativa a lo que
hace, lo que dice o lo que siente o, incluso, sus atribuciones, expectativas, prediccio-
nes, etcétera.
Por otra parte, existe una enorme diferencia entre los datos aportados por las
distintas posibilidades de información verbal realizada. La diferencia estriba en el
grado de contrastabilidad; es decir, en la posibilidad de comprobación objetiva de los
datos aportados por cada uno de los distintos autoinformes emitidos. De este modo,
y siguiendo a Fernández-Ballesteros (1992), los autoinformes sobre conductas mo-
toras pueden contrastarse a través de la observación directa de las mismas; igualmen-
te, las respuestas fisiológicas de las que nos informa la persona pueden ser verificadas
por medio de técnicas basadas en registros psicofisiológicos. En ambos casos, existe
la posibilidad de una contrastación objetiva de los datos aportados por el informe
verbal de la persona que realiza las conductas. Sin embargo, la posibilidad de con-
traste de los autoinformes sobre la experiencia subjetiva de las respuestas motoras y
fisiológicas es prácticamente nula; es decir, no contamos con pruebas independientes
que nos sirvan de criterio para contrastar la información verbal proporcionada por
el sujeto. A pesar de ello, los autoinformes son la única vía posible para acceder a de-
terminadas manifestaciones encubiertas del individuo.
Ahora bien, no todas las manifestaciones encubiertas son igualmente accesibles.
Así, tal como recoge Fernández-Ballesteros (1992), el grado de accesibilidad de la di-
mensión cognitiva difiere en función de si nos referimos a contenidos, a procesos o a

estructuras cognitivas. Así, «los autoinformes son de gran utilidad a la hora de eva-
luar contenidos o productos mentales, resultan parcialmente útiles a la hora de evaluar
procesos cognitivos y son irrelevantes a la hora de dar razón de estructuras cogniti-
vas» (Fernández-Ballesteros, 1992, p. 221). Con todo, el problema de la contrasta-
ción de los autoinformes cognitivos sigue en pie. Sin embargo, aunque es cierto que
no contamos con métodos independientes de comprobación de las variables encu-
biertas que hacen referencia al mundo subjetivo de las personas, resulta absoluta-
mente necesario el conocimiento de dichos datos para poder evaluarlas.
En este contexto, y siguiendo a la misma autora, aun admitiendo que el autoin-
forme cognitivo supone un procedimiento de recogida de información que no cuen-
ta con criterios independientes de validación y, por lo tanto, presenta problemas en
su objetivización, este tipo de autoinformes sí puede ser parcialmente contrastable,
«en distintos momentos, para distintas tareas y mediante diferentes tipos de autoin-
formes, pudiéndose llegar así a una seudovalidación intrasubjetiva» (Fernández-
Ballesteros, 1992, p. 222). De esta manera, aunque no tengamos posibilidad de obtener
una contrastación independiente de los datos, sí obtendremos una semivalidación de
constructo o teórica de ese autoinforme en esa persona específica y para las situacio-
nes específicas estudiadas. Esta misma autora destaca una segunda posibilidad de
contrastación indirecta de los autoinformes cognitivos al señalar la posibilidad
de comprobar si se producen los correlatos fisiológicos y motores o los productos de
conducta esperados teóricamente. Sin embargo, la no existencia de correlación entre
dichos eventos y la experiencia subjetiva transmitida a través de autoinforme no se-
ría motivo para invalidar estos datos, pues como se ha evidenciado empíricamente
existe una cierta independencia entre las distintas modalidades de respuesta que im-
pide en cierta medida utilizar datos motores o fisiológicos como criterios de valida-
ción de los autoinformes sobre contenidos mentales. Por todo ello, Fernández-
Ballesteros (1992) propone los siguientes criterios para incrementar y garantizar la
calidad de los autoinformes:
a. Hacer uso de técnicas de autoinforme sobre cualquier tipo de conducta tan

sólo como un primer procedimiento de recogida de información.
b. El autoinforme sobre eventos internos debe ser considerado como datos
cognitivos y no como indicadores sobre atributos, características o estructu-
ras internas.
c. Contrastar la información obtenida a través de un tipo de autoinforme con
la información que se desprenda del uso de otros procedimientos de autoin-
forme relativos al mismo tipo de conducta. Igualmente, establecer relaciones
entre las tres modalidades de respuesta (cognitiva, fisiológica y motora).
d. Evitar predecir conductas motoras a partir de conductas cognitivas o vice-
versa sin contar con evidencias empíricas al respecto.
e. Sise utilizan procedimientos estandarizados o tests para evaluar dimensiones
de personalidad, éstos deben reunir las garantías psicométricas pertinentes.
Por otra parte, las clases de variables a las que hacen referencia los autoinformes
pueden ser (Fernández-Ballesteros, 1992):
Autoinformes 301
a. Rasgos, dimensiones o factores de personalidad. Los tests, fundamentalmente

los de personalidad, son autoinformes tipificados que han sido construidos a través
de complejos procedimientos psicométricos que permiten obtener una puntuación
diferencial de una determinada persona, a través de la cual se puede obtener la posi-
ción relativa que ocupa dicho sujeto en función de su grupo normativo y para una
variable de naturaleza intrapsíquica dada. Según dicha autora, las características de
estos autoinformes se pueden resumir en:
— La conducta de la que se informa es considerada como un indicador o signo

de un atributo o característica intrapsíquica, estable e inespecífica, poseída en distin-
ta medida por todas las personas.
— Los tests suponen procedimientos de medida indirectos de las características
antes señaladas.
— La construcción de los mismos se realiza a través de estrategias racionales,
empíricas o factoriales.
— Con independencia de la estrategia elegida para la construcción de este tipo
de autoinformes, dicha elaboración se ha realizado a través de diseños intersujeto.
— Los elementos o ítems que conforman los tests normalmente están formula-
dos desde la generalidad; es decir, en las instrucciones de tales tests se pide que el su-
jeto responda en la forma en que habitualmente se comporta, sin tener en cuenta la
especificidad situacional de la respuesta.
— La mayor parte de este tipo de autoinformes se ha construido desde los mo-
delos diferencialista y biomédico.
— Por último, este tipo de instrumentos nunca debe ser utilizado como proce-
dimiento de evaluación de signos o variables intrapsíquicas. Su uso sólo nos permite
establecer probabilidades de que suceda un determinado tipo de comportamiento a
tener en cuenta en la orientación, clasificación o selección de la persona evaluada.
b. Estados. Se trata de instrumentos de autoinforme construidos desde mode-

los en los que se enfatiza la especificidad del comportamiento. Así, desde estos enfo-
ques se entiende que una persona puede presentar una determinada respuesta ante
determinadas situaciones y no ante otras. Sus características fundamentales son:
— La respuesta al autoinforme es considerada como una muestra de conducta

que se refiere a la situación concreta que se presenta en el autoinforme.
— Los autoinformes relativos a estados se refieren en el caso de las conductas a
dimensiones específicas (ansiedad, dependencia, hostilidad...) y, en el caso de las si-
tuaciones, o bien se seleccionan en función de presupuestos teóricos preestablecidos
o bien son de naturaleza abierta para poder evaluar los estímulos y/o situaciones que
pueden resultar importantes a la persona objeto de evaluación.
c. Repertorios clínicos conductuales. A pesar de las críticas ya señaladas que des-

de el enfoque conductual se han venido realizando a los autoinformes y, fundamen-
talmente, a los referidos a dimensiones de personalidad, los evaluadores conductua-
les en general los vienen, no sólo aceptando, sino utilizando. Sin embargo, los
autoinformes desde esta perspectiva presentan una serie de características proptas:
— Gran parte de los mismos han sido desarrollados para explorar problemas
psicológicos de naturaleza clínica; la mayoría de ellos consta de un repertorio de res-
puestas cognitivas, fisiológicas y motoras seleccionadas en función de su frecuencia
de aparición en un determinado trastorno de conducta.
— Los datos conductuales obtenidos son considerados como muestra de con-
ducta y no como signo de otro tipo de variable encubierta.
— Las conductas están referidas a situaciones específicas.
— Su utilidad dependerá del tipo de datos que se pretendan evaluar; así, tanto
para especificar inicialmente un problema como para explorar las respuestas de na-
turaleza cognitiva, resultan imprescindibles.
d. Repertorios, procesos y estructuras cognitivas. Existe toda una serie de auto-

informes que han sido desarrollados con el objeto de evaluar constructos de natura-
leza cognitiva. Los tres tipos de autoinforme más utilizados sobre constructos cog-
nitivos son:
— Autoinformes referidos a la percepción que la persona tiene de su ambiente.

Las variables que se pretenden evaluar son creencias, atribuciones y habilidades rela-
cionadas con las capacidades imaginativas.
— Autoinformes que pretenden evaluar los automensajes o autoinstrucciones
en general. Aquí también se incluyen los autoinformes que pretenden inferir los
procesos o estrategias cognitivas que utiliza la persona para resolver una determina-
da tarea, así como las llamadas metacogniciones.
— Autoinformes relacionados con el funcionamiento motivacional que evalúan
generalmente expectativas, así como repertorios para estimar los eventos tanto inter-
nos como externos que resultan reforzantes para el sujeto.
Las características comunes a este tipo de autoinformes se pueden resumir del si-
guiente modo:
— Las respuestas a los mismos son consideradas tanto como muestra como sig-
no o indicador de supuestas variables o atributos internos; en el primer caso, la res-
puesta se evalúa en función de la situación problema propuesta y, en el segundo, no
se establecen referencias situacionales.
— Algunos de estos autoinformes no presentan suficientes garantías científicas
para su uso fuera del ámbito experimental.
— Este tipo de autoinforme es útil cuando el problema a evaluar es de naturale-
za, cuando los repertorios cognitivos se supone que explican trastornos motores o
fisiológicos, por lo que en estos casos dichos repertorios son utilizados como varia-
ble independiente que habrá de manipularse, y para evaluar ciertas habilidades re-
queridas en el tipo de intervención como el caso de la capacidad imaginativa en trata-
mientos encubiertos.
Por otro lado, otro factor a tener en cuenta son las condiciones bajo las cuales
tiene lugar el autoinforme; entre éstas merecen especial atención las siguientes:
Autoinformes 303
a. El tiempo. Uno delos aspectos fundamentales a la hora de considerar las res-

puestas emitidas a través de los autoinformes se refiere a la diferencia temporal entre
el momento en que ocurrieron los hechos y el informe sobre los mismos. De este
modo, los autoinformes según el momento de ocurrencia del evento sobre el que se
informa se clasifican en retrospectivos, concurrentes y futuros (Fernández-Balleste-
ros, 1992). Veamos brevemente cada uno de ellos.
— Autoinformes retrospectivos. Se refieren a sucesos pasados, siendo los más

numerosos. La mayoría de los autores está de acuerdo en que los autoinformes re-
trospectivos aumentan su fiabilidad a medida que se refieren a hechos del pasado
más próximo. Sin embargo, igualmente se señala la necesidad de verificar con otras
técnicas la información del pasado próximo. Por último, cuanto más específicos son
los autoinformes sobre conductas del pasado próximo, mayor es la fiabilidad de los
mismos.
— Autoinformes concurrentes. La persona informa de lo que está ocurrien-
do en el mismo instante. Sin embargo, en estos casos la información verbal del
sujeto sobre lo que está sucediendo en el instante es reactiva y puede alterar el
contenido de la misma. Por ello, con el fin de reducir el efecto de la reactividad
en los autoinformes concurrentes, se aconseja recoger la información sobre lo
ocurrido inmediatamente después de haberse producido el hecho y no durante el
transcurso del mismo. Por otra parte, la mayoría de este tipo de autoinformes se
suele emplear en situaciones artificiales o de laboratorio y desde enfoques funda-
mentalmente cognitivos interesados en investigar los eventos y estrategias inter-
nas que ocurren mientras se realiza una determinada tarea. No obstante, tal
como señala Fernández-Ballesteros (1991, p. 279) este tipo de autoinforme es
«perfectamente aplicable en el ámbito de la evaluación psicológica cuando nos
interesa conocer cómo nuestro sujeto de evaluación realiza determinadas tareas
intelectuales estándar o específicamente creadas para él». Igualmente, y desde la
perspectiva conductual, el énfasis que dicho modelo ha puesto en la evaluación
de la conducta de las personas en situaciones naturales y en el mismo momento
que ésta se produce ha propiciado la extensión de procedimientos tales como la
autoobservación o el autorregistro, que han supuesto una aportación fundamen-
tal a la evaluación psicológica.
— Autoinformes futuros. Se trata de informes verbales sobre lo que la per-
sona piensa que va a ocurrir. En este caso interesa el grado de predictibilidad
del informe, el cual tiende a incrementarse cuando se refiere a conductas moto-
ras, fisiológicas o cognitivas específicas y ligadas a situaciones concretas, cuando
las expectativas del sujeto se basan en experiencias anteriores, y cuando la di-
ferencia temporal entre lo que se informa esperar y los hechos reales no sea ex-
Cesiva.
Por último, cabría destacar que la exactitud del autoinforme parece ser directa-
mente proporcional al período de tiempo existente entre la ocurrencia del hecho in-
formado y su producción. Así, los autointormes concurrentes parecen presentar
mayores garantías que los retrospectivos, a pesar de los posibles problemas de reac-
tividad que pueden suscitar en las personas evaluadas.
b. La situación. Cualquier tipo de información a través de autoinformes sólo

puede ser obtenida o bien en situación artificial, es decir, en el laboratorio o en un
despacho o consulta, y en situación natural.
— Situación artificial (despacho, consulta...). En general, cualquier tipo de auto-

informe —comenzando por la entrevista— se aplica en situación artificial. Sin em-
bargo, en sentido estricto se considera autoinforme de laboratorio tan sólo a las ver-
balizaciones que una persona realiza sobre sí mismo en una situación experimental.
El interés de este tipo de registro a través de autoinformes de laboratorio se centra,
entre otras propiedades, en la mayor oportunidad y rapidez, y menor costo que és-
tos representan en relación a autoinformes obtenidos en situación natural. Por últi-
mo, para obtener este tipo de autoinformes se utilizan procedimientos tales como
tests situacionales, representación de papeles y tareas cognitivas.
— Situación natural. La persona puede informar en el mismo momento o poco
después de producirse en la vida real el evento sobre el que se pide información. Este
procedimiento se viene denominando autorregistro o autoobservación. (Véase el ca-
pítulo de Herbert y Nelson-Gray en este mismo manual.)
c. Las preguntas. Las preguntas, es decir, las instrucciones para realizar los auto-
informes, presentan múltiples posibilidades. Todas las posibles formas de recoger in-
formación a través de autoinformes implican distintos grados de estructuración en las
preguntas formuladas. Por ello, los autoinformes pueden ser considerados en fun-
ción del grado de estructuración de las preguntas.
— Preguntas estructuradas. La evidencia empírica demuestra que cuanto más

específico sea un autoinforme mayor valor predictivo posee; es decir, cuanto más es-
tructurada sea la pregunta y se refiera a situaciones y respuestas específicas, más va-
lor tendrá la información obtenida a través del autoinforme.
— Preguntas no estructuradas. En este caso la persona informa con total liber-
tad, como ocurre por ejemplo en la autobiografía, forma especial de entrevista o en la
técnica del pensamiento en voz alta.
Entre las preguntas estructuradas y las no estructuradas podríamos situar las se-
miestructuradas. Un autorregistro o una “escala de miedos” podrían considerarse
como instrumentos de autoinforme con preguntas semiestructuradas; en ellos es la
propia persona la que especifica la situación y no el evaluador.
d. Las respuestas. Como resulta evidente, las respuestas son función de los estí-
mulos, en este caso, de las preguntas. A veces, las preguntas más o menos estructuradas
pueden contestarse de forma abierta; en otras ocasiones, las respuestas son forzadas.
— Respuesta abierta. Por ejemplo, en la entrevista se permite a la persona eva-

luada responder de manera abierta a las preguntas que se le formulan.
— Respuesta dicotómica (Sí/No, Apropiado/No apropiado o Verdadero/Fal-
so). Las preguntas que contienen una afirmación suelen ir seguidas de una doble
alternativa de respuesta en términos de “sí” o “no”.
Autoinformes 305
— Respuestas escalares. En las escalas de apreciación el objetivo es contrastar

hasta qué punto una determinada sentencia es o no aplicable a un determinado suje-
to según un determinado rango. Este rango se expresa a través de escalas numéricas
(por ejemplo, de O a 7), escalas gráficas o escalas de adjetivos o adverbios.
— Alternativas ipsativas. En este caso la persona responde según un orden de
preferencia sobre al menos tres elementos que se refieren al grado en el que dichos
elementos le son aplicables o preferidos.
e. El tratamiento de los resultados. A la hora de construir un autoinforme o

cualquier otra técnica de evaluación disponemos de tres estrategias (Kelly, 1967): ra-
cionales, empíricas y factoriales. La mayor parte de los autoinformes procedentes de
las teorías de rasgos han sido construidos a través de estrategias empíricas o factoria-
les. Para ello se han realizado diseños grupales para poder encontrar y analizar dife-
rencias individuales. De este modo, la puntuación directa que obtiene una determi-
nada persona al responder a un determinado autoinforme ha de convertirse en una
puntuación que refleje la posición relativa de dicha persona en relación a su grupo de
referencia; es decir, en este tipo de autoinformes las respuestas de un sujeto sólo ad-
quieren significado al compararlas con las de los demás.
Por contra, en otros autoinformes —los repertorios conductuales— las puntua-
ciones obtenidas por los distintos sujetos no son comparables entre sí. En estos ca-
sos la puntuación obtenida sólo es relevante para conocer la conducta del propio su-
jeto evaluado y en función de los distintos parámetros que la definen: ocurrencia o
frecuencia, grado o intensidad, etcétera.
II. TIPOS DE AUTOINFORMES
Se pueden describir cuatro tipos de autoinforme: la entrevista; los cuestionarios, in-

ventarios y escalas; el autorregistro, y las técnicas de pensamiento en voz alta. En
este capítulo no nos ocuparemos ni de la entrevista ni del autorregistro, debido a que
ambos procedimientos son tratados de forma más precisa en otros capítulos de este
manual.
m1. Cuestionarios, inventarios y escalas
A los autoinformes estructurados que se presentan de manera integrada y en forma

de lista o formulación secuenciada se les denomina cuestionario o inventario, aun-
que igualmente se les denomina repertorio, listado o escala. Estos autoinformes es-
tán constituidos por un formulario de preguntas o aseveraciones ante las cuales el
sujeto ha de responder. Los cuestionarios implican respuestas expresadas dicotómi-
ca o nominalmente (sí/no, verdadero/falso...), los inventarios pueden responderse
tanto de manera nominal como ordinal (1.2, 2.2, 3.*, etc.) y en las escalas larespuesta
es ordinal o de intervalo (nada = 0; algo = 1; bastante = 2; mucho 00 muchísimo =4).
Estos autoinformes son los más extendidos en evaluación psicológica, tanto desde
una perspectiva tradicional en la evaluación de rasgos de personalidad como des-

de otras perspectivas en la evaluación de repertorios clínico-conductuales, y cons-
tructos cognitivos y motivacionales.
Siguiendo a Fernández-Ballesteros (1992), las características de este tipo de auto-
informes podrían resumirse del siguiente modo:
a. Presentan una forma estructurada, tanto en la formulación de las preguntas

como en el tipo de respuesta exigida.
b. Evalúan conductas especificadas de antemano.
c. Solicitan información sobre hechos que ocurren con alta frecuencia en la
vida real y cotidiana de las personas.
Por último, estos instrumentos se diferencian entre sí en dos aspectos; en primer

lugar, en el tipo de estrategia utilizada en su construcción y, en segundo lugar, en el
tipo de respuesta que se exige al sujeto (nominal, ordinal o de intervalo).
ma. Pensamiento en voz alta
Los autoinformes denominados “de pensamiento en voz alta” son procedimientos

de recogida de información sobre conductas fundamentalmente de naturaleza cog-
nitiva que generalmente se realizan en situaciones experimentales o de laboratorio.
Igualmente, constituyen técnicas no estructuradas, dado que a la persona se le per-
mite cualquier tipo de respuesta y, temporalmente, concurrentes.
Tal como expusimos en apartados anteriores, estas características implican pro-
blemas de reactividad en el sujeto evaluado y una clara limitación de la información
que éste suministra sobre sus pensamientos. Se pueden señalar tres procedimientos
básicos para registrar los “pensamientos en voz alta”:
a. Monólogo continuo. Se pide al sujeto evaluado que verbalice sus pensa-

mientos y/o sentimientos mientras está realizando una determinada tarea (general-
mente propuesta por el evaluador); este procedimiento puede aplicarse a cualquier
prueba manipulativa.
b. Muestras de pensamiento. El evaluador fija los intervalos de tiempo en los
que la conducta va a ser registrada y pide al sujeto evaluado que verbalice lo que
piensa o siente en cada uno de los momentos señalados.
c. Registro de eventos. Este procedimiento puede equipararse al autorregistro
de conductas cognitivas, puesto que el sujeto evaluado verbaliza sus cogniciones
cuando son de interés para el evaluador. El principal problema que presenta este
procedimiento es que la persona evaluada debe discriminar entre la información re-
levante e irrelevante.
Por último, se pueden registrar en magnetófono o en vídeo las distintas verbaliza-

ciones de los sujetos. Este procedimiento permite trasladar el registro de las verbali-
zaciones de acontecimientos internos a las situaciones naturales. Igualmente, es im-
portante hacer notar que el análisis de “los pensamientos en voz alta” presenta
Autoinformes
307
ciertas dificultades, ya que éste debe ser tanto cuantitativo como cualitativo y no
existe una vía normalizada de análisis. No obstante, Fernández-Ballesteros (1992)
señala algunas sugerencias al respecto:
a. Categorizar el contenido verbal en función del previo análisis de la tarea

asignada.
b. Clasificar las verbalizaciones del sujeto evaluado según las fases del proceso
cognitivo propuestas por Brown (1978):
— Análisis y caracterización del problema.

— Reflexiones sobre conocimientos que pueden ser aplicables en la solución de
la tarea.
— Planes para la resolución del problema.
— Comprobaciones.
— Análisis interjueces de los protocolos según los estilos de pensamiento implí-
citos en las verbalizaciones y con el apoyo de la técnica-Q de Meichenbaum
y Bluter (1979).
Según lo expuesto anteriormente, podemos afirmar que este tipo de autoinfor-

mes no cuenta con las suficientes garantías empíricas para demostrar su valor; no
obstante, tal como sucede con cualquier otra técnica de autoinforme, su utilidad está
en gran medida condicionada a la obtención de resultados similares con la utiliza-
ción de otras técnicas en la evaluación de las mismas respuestas.
IV. FACTORES QUE AFECTAN LA BONDAD DE LOS AUTOINFORMES
Como hemos visto, no es posible hablar de exactitud, fiabilidad, validez y utilidad

de los autoinformes en términos de globalidad debido a la enorme heterogeneidad
que presentan. Dicho en otras palabras, la bondad de los autointormes está en fun-
ción del tipo de variable evaluada, tipo de pregunta que contengan, tipo de respuesta
que exijan, etc. Todo ello imposibilita un tratamiento homogéneo de sus potenciales
propiedades psicométricas. Como destaca Fernández-Ballesteros (1991, p. 281), al
referirnos a las garantías psicométricas de los autoinformes nos podemos encontrar
al menos con «cinco clases generales de autoinformes dependiendo de dos paráme-
tros fundamentales: el grado de contrastabilidad de la información suministrada y el
nivel de inferencia con el que el psicólogo interpreta el autoinforme». Estas cinco
clases serían:
a. En primer lugar, podemos considerar la respuesta a un autoinforme como

una respuesta verbal frente a un estímulo concreto. En este caso no se realizan infe-
rencias, por lo que comprobar su estabilidad y generalidad no plantea ningún pro-
blema, aunque test y criterio serían la misma cosa. nm
b. Igualmente, se puede utilizar el autoinform e para evaluar eventos manifies-
tos, tanto presentes como pasados, sin inferir ningún tipo de variable interna, ni atri-
buto o constructo intrapsíquico. En este caso, la única inferencia que realizamos es

la de otorgar credibilidad a los datos que nos proporciona el sujeto evaluado. Por
ello, contar con un criterio independiente de contrastación empírica del automforme
es algo fundamental.
c. Una tercera posibilidad se refiere a los autoinformes sobre eventos que no
pueden observarse directamente ni registrarse a través de técnicasderegistro psicofi-
siológico. En este caso, el problema reside en que no existe criterio de validación in-
dependiente.
d. En cuarto lugar, existe la posibilidad de que el evaluador infiera ciertos atri-
butos o características intrapsíquicas a partir del autoinforme del sujeto evaluado.
En este caso, la respuesta al autoinforme pretende validar la propia existencia del
constructo que se infiere.
e. Por último, la respuesta del autoinforme puede considerarse con valor pro-
pio sin conceder importancia a su contenido y analizarse como expresión de un atri-
buto o característica propia del sujeto evaluado. En este caso, como sucedía en el an-
terior, lo importante es validar no la veracidad del autoinforme sino su intervención
en la estructura a la que se supone pertenece.
En resumen, al buscar las garantías científicas de los tres primeros tipos de auto-
informe «estaremos, en el mejor de los casos, examinando la veracidad de la infor-
mación suministrada por el sujeto», mientras que en los otros casos estaremos
«comprobando la validez del constructo propuesto por la teoría» (Fernández-
Ballesteros, 1991, p. 283).
A lo anteriormente expuesto se suman los problemas producidos por la “ten-
dencia de respuesta”, que constituye uno de los factores distorsionantes de los resul-
tados de los autoinformes. Se han intentado eliminar dichas distorsiones mediante
variables correctoras, así como a través de modificaciones en la formulación de las
instrucciones o en los elementos del autoinforme. De forma paralela, los estilos de
respuesta se pueden considerar como variables de personalidad, es decir, como pa-
trones conductuales que provocan respuestas consistentes en los individuos. Entre
las principales fuentes de distorsión destacan las siguientes:
a. El sujeto evaluado de forma intencionada intenta falsear el resultado del auto-

informe.
b. El sujeto evaluado de forma involuntaria se autodescribe según una imagen
socialmente adecuada.
c. La respuesta del sujeto evaluado depende más del tipo de alternativa de res-
puesta que ofrece el autoinforme que del contenido de la pregunta formu-
lada.
Dichas fuentes dan lugar a los siguientes fenómenos:
a. Simulación. Hablamos de simulación, falseamiento o engaño, o de su con-

trario “sinceridad”, al referirnos al deseo deliberado del evaluado de falsear sus res-
puestas. Sin embargo, a pesar de que la simulación es una de las principales fuentes
de error de los autoinformes, se ha tratado de reducir sus efectos tanto mediante las
Autoinformes E
instrucciones de la prueba y el contacto personal con el sujeto evaluado, solicitando

su cooperación y honestidad, como con la introducción de escalas de sinceridad.
Asimismo, algunos autores sugieren que este tipo de distorsión constituye una im-
portante variable de personalidad del sujeto, si bien éste no es motivo para no inten-
tar reducir al máximo sus efectos en los resultados del autoinforme.
b. Deseabilidad social. El hecho de responder de acuerdo con lo que se cree so-
cialmente aceptable no sólo tenemos que considerarlo como una importante fuente
de error de los autoinformes, sino también como un indicador de la adaptación so-
cial del sujeto evaluado.
c. Tendencias de respuesta. En esta fuente de error podemos distinguir dos
subtipos que dependen del formato de respuesta elegido:
— Asentimiento, definido como la tendencia del sujeto evaluado a responder

“sí” o “verdadero” en los autoinformes de respuesta dicotómica, independiente-
mente del contenido de las preguntas formuladas.
— Errores escalares propios de la utilización de escalas, generalmente adjetiva-
das, de tres o más alternativas que permiten la gradación de la respuesta; entre los
errores escalares más frecuentes cabe destacar dos. Por un lado, la tendencia a res-
ponder en el centro o tendencia central —también denominada restricción de ran-
gos— que consiste en dar respuestas tales como «algunas veces sí, y otras veces no»,
«ni de acuerdo, ni en desacuerdo»; es decir, implica responder de forma “no com-
prometida” o pobremente definida ya que la persona no elige direcciones favorables
o desfavorables. Por otro lado, la tendencia a responder en los extremos de la escala,
lo cual viene definido por la severidad de las respuestas; entre este tipo de tendencia
encontramos respuestas tales como “nunca” y “nada” o “siempre” y “muchísimo”.
Asimismo, es importante hacer notar que si bien existen estadísticos para anali-
zar y controlar dichas distorsiones en diseños de grupo y dentro de los que podría-
mos denominar autoinformes psicométricos tradicionales, esto no es así en el caso
de los autoinformes conductuales. En efecto, Fernández-Ballesteros (1991) informa
que en una búsqueda bibliográfica de trabajos realizados sobre autoinformes, el
33% de los publicados entre 1977 y 1987 se dedicaba al estudio de la incidencia que
las distintas fuentes de error (entre las que cabe destacar la deseabilidad y la sincer1-
dad) tenían sobre este procedimiento de evaluación. Sin embargo, entre estos traba-
jos son mucho menos frecuentes los que se dirigen a estudiar dichos problemas me-
todológicos en autoinformes construidos desde la perspectiva conductual. Entre las
razones que podrían explicar esta laguna cabrían destacarse, tal como señalan Fer-
nández-Ballesteros, Pérez-Pareja y Maciá (1981), las siguientes:
a. Por un lado, puede deberse al hecho de considerar estas variables de error

como disposiciones o variables intrapsíquicas y, por tanto, sin interés desde la pers-
pectiva conductual.
b. Deotro lado, al considerar desde el modelo conductual a las respuestas auto-
informadas como datos de un diseño intraindividual se supone que este tipo de estu-
dios resultan innecesarios puesto que las distorsiones de respuesta actuarían tanto
antes como después de la aplicación del tratamiento.
c. Por último, desde el enfoque conductual se parte fundamentalmente del he-

cho de que los autoinformes no son más que fuentes de datos y no las más importan-
tes; de ello se deduciría una cierta desatención hacia los problemas metodológicos de
este procedimiento de evaluación psicológica.
Sin embargo, si bien todos estos supuestos son perfectamente asumibles, si-
guiendo a los mismos autores, hemos de señalar que esto no justifica la ausencia de
investigaciones al respecto; ello responde a los siguientes motivos:
a. En primer lugar, porque un gran número de trabajos realizados desde la eva-

luación y modificación de conducta se han llevado a cabo con diseños grupales e im-
tentando elaborar autoinformes generales, por lo que estaríamos en un supuesto si-
milar a la construcción de autoinformes desde un enfoque tradicional psicométrico.
b. En segundo lugar, porque aunque los autoinformes no se consideren gene-
ralmente como la única fuente de datos en evaluación y modificación de conducta, la
realidad ha venido demostrando que en la práctica cotidiana en muchas ocasiones
los propios psicólogos que se confiesan seguidores del mencionado modelo utilizan
la información obtenida a través de autoinformes como fuente fundamental de in-
formación, si no la única.
c. Asimismo, para ciertos trastornos los autoinformes pueden ser la fuente más
importante de información.
d. Igualmente, cuando se intentan relacionar los distintos métodos de evalua-
ción psicológica (autoinforme, observación y registros psicofisiológicos) para eva-
luar una misma conducta o clase de conductas y no se encuentra concordancia entre
ellos, cabría preguntarse si tal ausencia de covariación no está mediatizada por las
distintas fuentes de error que los planteamientos de la psicometría clásica ha demos-
trado que existen en determinados procedimientos de recogida de información.
Así, y a modo de ejemplo, Fernández-Ballesteros y cols. (1981) comprobaron

que en los autoinformes conductuales la distorsión de respuesta denominada desea-
bilidad social influía muy significativamente en las respuestas dadas a los mismos.
Por último, tal como señala Silva (1989), una de las polémicas más candentes que
se mantienen en el campo metodológico de la evaluación psicológica hace referencia
ala posibilidad y conveniencia de integrar los principios y criterios psicométricos en
los procedimientos propios de la evaluación conductual y, puntualmente, en los auto-
informes conductuales. La mayoría de los autores parece apoyar esta posibilidad,
pero otros la rechazan claramente. Este rechazo, según Silva (1989), sería debido a la
disparidad en los supuestos de consistencia y estabilidad de la conducta que implica
la teoría de los tests en su forma clásica, al nivel de análisis en el que se trabaja (grupal
en la orientación psicométrica e individual [N=1] en el enfoque conductual), al dife-
rente modelo de causalidad que utilizan (estructural intrapsíquico o R-R propio de
la vertiente psicométrica y modelo funcional E-R propio de la vertiente conductual)
(Hayes, Nelson y Jarret, 1986). Sin embargo, tal y como propone Silva (1989), un
examen de las críticas a la vertiente psicométrica revela una serie de malentendidos y
sobre todo algún desconocimiento de sus desarrollos más recientes. Así, la polémica
en torno a la integración evaluación conductual y evaluación psicométrica se en-
Autoinformes
311
cuentra en un momento de revisión y análisis profundo. Tal vez el punto central de

la polémica podría centrarse en los problemas de fiabilidad y validez que la propia
evaluación conductual presenta. Así, desde este enfoque se ha defendido que los mé-
todos conductuales no necesitan de los mismos tipos de validez que los métodos tra-
dicionales. Con independencia de la bondad de esta afirmación, pues como es evi-
dente en sentido estricto no existe validez de línea base, pues el criterio y la conducta
son la misma cosa, esta afirmación sólo resulta cierta para algunas conductas, pero
no sería válida para los códigos de observación, los autoinformes y las respuestas
psicofisiológicas. Además, siguiendo a Fernández-Ballesteros (1979), los datos obte-
nidos por estas técnicas deberían cumplir los cinco universos de generalización para
eliminar problemas metodológicos; a saber:
a. Puntuaciones; lo que observa el sujeto evaluado y lo que observa el evalua-

dor coinciden, es decir, es válido para todos.
b. Contenido o ítems; lo que el evaluador obtiene como muestra de conducta
del sujeto evaluado es representativo del universo de conductas del sujeto (validez de
contenido).
c. Temporal; hasta qué punto la selección de respuestas que hace el evaluador
del sujeto evaluado se mantiene a lo largo del tiempo; es decir, hasta qué punto la po-
sible modificación de la conducta de un sujeto se produce como efecto del trata-
miento o sólo es fruto del paso del tiempo.
d. Métodos; implica que lo que se obtiene con un método de evaluación se va a
obtener con otro; es decir, que es necesario que exista correlación entre los distintos
métodos que se utilicen para evaluar una misma conducta.
e. Dimensiones; normalmente en evaluación conductual no se pretende eva-
luar dimensiones, pero en los casos que sí se utilizan tiene que existir correlación.
En todo caso, y con independencia de lo indicado hasta aquí, estamos ante una
polémica abierta y de difícil solución a lo largo de estas páginas.
Por otra parte, tal como hemos expuesto en los párrafos anteriores, si bien se ha
investigado con cierta profusión sobre autoinformes desde una perspectiva correla-
cional o psicométrica, los trabajos realizados desde una perspectiva experimental
han sido muy escasos. Es definitiva, se ha tratado de garantizar y estudiar los proble-
mas de validez y fiabilidad de los autoinformes, se ha intentado conocer y controlar
sus fundamentales fuentes de error, pero poco se ha hecho a través de la manipula-
ción y control de las distintas variables que influyen en los autoinformes. Entre los
pocos trabajos de corte experimental realizados con autoinformes cabe señalar el de
Fernández-Ballesteros y cols. (1981). En dicho trabajo se pone de manifiesto, por un
lado, la falta de consistencia en los autoinformes de los sujetos antes y después de la
situación experimental sobre la que informan, lo que demostraría la importancia de
la temporalidad en la realización de los autoinformes; por otro lado, se destaca la es-
casa relación entre los tres métodos de evaluación utilizados (observación, autoin-
forme y registro psicofisiológico) para evaluar una misma conducta, lo cual eviden-
cia la dificultad de comparación de tales métodos, que cuentan con fuentes de error
muy diversas e incluso es posible que para una misma conducta se estén evaluando
cosas distintas en función del método de evaluación utilizado.
Por otra parte, Fernández-Ballesteros (1991, 1992) propone algunas condiciones

para mejorar la calidad de los autoinformes:
a. Noutilizar los autoinformes como único procedimiento de recogida de in-

formación.
La persona evaluada debe está motivada para dar información exacta.
c. Informar sobre eventos actuales, concurrentes, o al menos lo más próximos
posibles a los propios eventos.
d. Los evaluadores deben inferir lo menos posible sobre los datos del autoin-
forme.
e. Las preguntas planteadas serán específicas y la información solicitada accesi-
ble y de bajo nivel de elaboración.
f. Los protocolos deberán estar codificados, utilizando procedimientos rigu-
rosos de análisis.
Por otra parte, no podemos olvidar que la utilidad y bondad de los autoinformes
dependen en gran medida, no sólo de la conducta o de los eventos que se evalúan,
sino también de cómo se evalúan. Tradicionalmente, la mayoría de los datos para
cuestiones clínicas que preceden y siguen a la intervención terapéutica, consiste en
autoinformes (informes verbales y cuestionarios). Así por ejemplo, la Sexual expe-
riencie scale (SES) [Escala de Experiencias Sexuales] de Derogatis y Melisaratos
(1979), tal como indican Andersen y Broffitt (1988), presenta grandes problemas en
la identificación de cambios conductuales, en la ocurrencia de disfunciones sexuales
y en la evaluación de la satisfacción de la vida sexual. Igualmente, esta escala presenta
poca estabilidad en su estructura factorial entre grupos y a lo largo del tiempo. Entre
las principales causas de estos problemas hay que destacar que la SES evalúa la ocu-
rrencia de conductas, más que su frecuencia, de forma que su medida podría ser más
sensible si se utilizaran escalas de frecuencia más que evaluar la presencia-ausencia
de determinadas conductas. Así, podemos nuevamente destacar que los aspectos
formales en la construcción de los autoinformes resultan de gran importancia ya que
de ellos dependerá, en gran medida, la bondad de los datos obtenidos.
En esta línea se encuentran los trabajos realizados por Borrás Sansaloni (1992)
sobre el síndrome premenstrual (SPM), quien utilizando el Inventario de cambios
premenstruales (ICP) encontró diferencias significativas respecto a los resultados ob-
tenidos por Logue y Moos (1986) usando el Mestrual distress questionnaire (MDQ)
de Moos (1968). Como concluye dicha autora, estas diferencias serían únicamente
atribuibles al instrumento, pues mientras el /CP presenta las respuestas en forma es-
calar, el MDQ tan sólo evalúa presencia o ausencia de respuesta.
En conclusión, podemos inferir que gran parte de las diferencias que se encuen-
tran al comparar resultados de distintas investigaciones realizadas con el uso de auto-
informes podría atribuirse a sesgos relativos a los propios instrumentos. Así, desde
nuestro punto de vista, parece más adecuado el uso de inventarios y escalas frente al
de cuestionarios, al menos en cuanto al tipo de resultados que presentan.
En los estudios en los que se han comparado los efectos del tratamiento y del
placebo generalmente se han aceptado sin ningún tipo de reserva los datos obtenidos
mediante autoinformes, si bien, tal como señala Shapiro (1981), el placebo influye
Autoinformes 313
principalmente en los informes subjetivos. Por lo cual, se puede afirmar que los auto-
informes presentan ciertas dificultades de interpretación asociadas a la mejora tera-
péutica. En cualquier caso, hay que señalar que los efectos placebo sobre los auto-
informes acerca de la terapia pueden variar según la naturaleza y severidad de la
conducta problema, por lo que los problemas señalados no son del todo generaliza-
bles. Sin embargo, esta preocupación por la mejora terapéutica nos llevaría a lo que
Nelson y Hayes (1979) denominan validez de tratamiento. Sin embargo, la validez
de tratamiento no es un tipo fundamentalmente diferente de validez. Además, tal se-
paración hay que entenderla en el marco de algunas tradiciones diagnósticas donde
evaluación y tratamiento aparecen como dos procesos independientes. En esta línea,
tal como señala Silva (1989, p. 172) «será necesario un replanteamiento de los instru-
mentos de evaluación». Sin entrar en la polémica sobre la utilidad de la evaluación en
función de la validez del tratamiento pensamos, tal como indican Hayes y cols.
(1986), que la validez de tratamiento se aplica a todos y cada uno de los aspectos y
etapas de la evaluación y que evidentemente incluye a los procedimientos e instru-
mentos utilizados en los mismos. En todo caso, y tal como concluye Silva (1989,
p. 181), se necesitaría de los criterios (psico)métricos de calidad «si se quiere evitar
entrar en el callejón, sin salida, de intentar juzgar la calidad de una evaluación en fun-
ción de la utilidad de tratamiento, cuando esta última debe a su vez estimarse a través
de una evaluación que ofrezca garantías de calidad».
Por último, parece oportuno señalar que además de las garantías de validez y fia-
bilidad que han de poseer los autoinformes, así como el control de aspectos tales
como sinceridad, deseabilidad social o tendencia de respuesta, creemos que también
se han de tener en cuenta los aspectos relativos a su construcción formal, debido a
que dichos aspectos afectan a la validez y fiabilidad del instrumento en cuestión.
Andersen, B. L. y Broffitt, B. (1988). Is there a reliable and valid self-report measure of sexual
behavior? Archives ofSexual Behavior, 17, 509-525.
Baker, T. B. y Brandon, T. H. (1990). Validity of self-reports in basic research. Behavioral
Assessment, 12, 33-51. 0
Bellack, A. S. y Hersen, M. (1977). Self-report inventores in behavioral assessment. En D. T.
Cone y R. P. Hawkins (dirs.), Behavioral assessment. Nueva York. Brunner-Mazel,
Borrás Sansaloni, C. (1992). Respuestas de ansiedad, ciclo menstrual y síndrome premenstrual
(spM). Algunos aspectos conceptuales, metodológicos y de evaluación. Memoria de licencia-
tura inédita. Universidad de Las Islas Baleares. hb TON
Brown, A. L. (1978). Knowing when, where, and how to remember. Illinois. University ot
lllinois. 159
Derogatis, L. B. y Melisaratos, N. (1979). The DSFI: A multidimensional measure of sexual
functioning. Journal ofSex Marital Therapy, 5, 244-281.
aa elos R. (1979). Los métodos en evaluación conductual. Madrid. Pablo del
Río.
Fernández-Ballesteros, R. (1991). Anatomía de los autoinformes. Evaluación Psicológica!

Psychological Assessment, 7, 263-290.
Fernández-Ballesteros, R. (1992). Los autoinformes. En R. Fernández-Ballesteros (dir.), [n-
troducción a la evaluación psicológica (vol. 1). Madrid. Pirámide. .
Fernández-Ballesteros, R., Díaz Verga, P., Fernández de Troconiz, M., Maciá Antón, A. y
Pérez-Pareja, F. J. (1981). Relaciones entre métodos de evaluación y modalidades de res-
puesta. En R. Fernández-Ballesteros (dir.), Nuevas aportaciones en evaluación conduc-
tual. Valencia. Alfaplús. ?
Fernández-Ballesteros, R., Pérez-Pareja, F. J. y Maciá, A. (1981). Distorsiones de respuesta
en autoinformes conductuales. En R. Fernández Ballesteros (dir.), Nuevas aportaciones
en evaluación conductual. Valencia. Alfaplús.
Hayes, S. C., Nelson, R. O. y Jarret, R. B. (1986). Evaluating the quality of behavioral assess-
Haynes, S. N. (1978). Principles of behavioral assessment. Nueva York. Gardner.
Jensen, B. J. y Haynes, S. N. (1986). Self-report questionnaire and inventories. En A. R. Ci-
minero, K. S. Calhoun y H. E. Adams (dirs.), Handbook of behavioral assessment
(2.* ed.). Nueva York. Wiley.
Kelly, L. (1967). Assessment of human characteristics. Beltmont. Brooks/Cole.
Lieberman, D. A. (1979). Behaviorism and the mind: A (limited) call for a return to intros-
pection. American Psychologist, 34, 319-333.
Logue, C. M. y Moos, R. H. (1986). Perimenstrual symptoms: Prevalence and risk factors.
Psychosomatic Medicine, 48, 388-414.
Meichenbaum, D. y Bluter, L. (1979). Cognitive ethology: Assessing the strams of cognition
and emotion. En 1. Sarason (dir.), Test anxiety: Theory, research and applications. Hillsda-
le. Lawrence Erlbaum Publisher.
Moos, R. H. (1968). The development of a menstrual distress questionnaire. Psychosomatic
Medicine, 30, 852-867.
Rankin, H. (1990). Validity of self-reports in clinical settings. Behavioral Assessment, 12,
107-116.
Shapiro, A. K. (1981). Review of brody's placebos and the philosophy of medicine. Social
Science and Medicine, 15, 96-97.
Fernández-Ballesteros, R. (1991). Anatomía de los autoinformes. Evaluación Psicológica!

Psychological Assessment, 7, 263-290.
Fernández-Ballesteros, R. (1992). Los autoinformes. En R. Fernández-Ballesteros (dir.), In-
Hayes, S. C., Nelson, R. O. y Jarret, R. B. (1986). Evaluating the quality of behavioral assess-
Jensen, B. J. (1996). Los cuestionarios de autoinforme en la evaluación conductual. En
G. Buela-Casal, V. E. Caballo y J. C. Sierra (dirs.), Manual de evaluación en psicología clí-
nica y de la salud. Madrid. Siglo XXI.
15. LA OBSERVACIÓN
VICENC QUERA y JÚLIA BEHAR
I.. DEFINICIÓN Y CARACTERÍSTICAS DE LA METODOLOGÍA OBSERVACIONAL
En psicología existen áreas de estudio en las que el comportamiento de los sujetos

no puede investigarse mediante ninguna de las estrategias tradicionales, como las
metodologías experimental y selectiva o correlacional, sino que únicamente es ac-
cesible a través de la observación. Esto es así porque la observación sistemática es
una estrategia científica que permite cuantificar la conducta espontánea de los suje-
tos en el momento en que se produce y en su entorno natural, sin introducir ele-
mentos de distorsión (Hutt y Hutt, 1970; Sackett, Ruppenthal y Gluck, 1978). Las
características fundamentales de la metodología observacional son (Wright, 1960;
Weick, 1968; Anguera, 1981, 1985; McRae, 1995; Bakeman, 1997; Bakeman y
Gottman, 1997):
a. Se aplica al estudio del comportamiento espontáneo, por lo que no existe

una manipulación de variables con el propósito de averiguar cómo afectan al com-
portamiento. Por el contrario se registran, de un modo controlado, los valores de las
variables, tanto ambientales como conductuales, y a continuación se analizan sus co-
variaciones. La ausencia de manipulación garantiza que no existe distorsión en el
comportamiento registrado.
b. Se emplean observadores adiestrados que registran la conducta en el mo-
mento en que se produce, y lo hacen ciñéndose a unos códigos conductuales que han
sido definidos de forma objetiva por el investigador, y siguiendo unas reglas de re-
gistro y de muestreo determinadas.
c. Los observadores son entrenados periódicamente y se controla la calidad de
los datos que obtienen mediante técnicas de análisis de la fiabilidad y la precisión de
sus registros.
d. El investigador o investigadores dirigen y planifican el estudio, pero no ac-
túan como observadores. Los observadores son personas adiestradas en ese fin con-
creto, a las que no se les suministra información acerca de las hipótesis y los objeti-
vos de la investigación, con el propósito de evitar o minimizar sus expectativas, que
falsearían, los datos obtenidos.
e. Debe evitarse o reducirse el intrusismo del observador con el fin de que ello
no provoque reactividad en el comportamiento de los sujetos observados, y su con-
secuente falta de espontaneidad.
f. Permite estudiar conductas que no sería ético provocar (por ejemplo, el pá-
NICO).
Universidad de Barcelona
316 Vicenc Quera y Júlia Behar
g. La observación suele estructurarse de forma tal que de cada sujeto o grupo

de sujetos recoja secuencias largas de códigos conductuales en cada sesión de obser-
vación. Puesto que el interés del investigador consiste en averiguar qué covarlacio-
nes existen entre el comportamiento y las variables externas a él, o entre diferentes ti-
pos de comportamiento, es necesario que en los datos se refleje una amplia
heterogeneidad de variables conductuales, aspecto que sólo es posible lograr obte-
niendo muchos datos de cada sujeto, es decir, observándolo durante largo tiempo.
Los datos obtenidos al aplicar la metodología observacional pueden analizarse de
muy diversas formas, siempre de acuerdo a las hipótesis y los objetivos prefijados;
sin embargo, debido a que estos datos tienen la forma de secuencias temporales, un
tipo de análisis idóneo es el llamado “análisis secuencial”, que permite averiguar cuál
es la dinámica temporal del comportamiento.
La metodología observacional se aplica muchas veces en investigaciones de

corte inductivo, y, por lo tanto, no basadas en teorías. Ello ha alimentado la creen-
cia errónea de que la observación sistemática sólo debe emplearse en ausencia de
hipótesis concretas. No obstante, la metodología observacional no es intrínseca-
mente inductiva, como tampoco la experimentación es intrínsecamente hipotético-
deductiva. Sea cual sea la forma de proceder (inductiva o deductiva), el investigador
observacional plantea objetivos y establece conjeturas acerca de qué espera encon-
trar en los datos. Si estas conjeturas se derivan de una teoría por deducción lógica,
entonces se denominan, con todo rigor, hipótesis. Si se establecen sin que exista
una teoría previa, basándolas, por ejemplo, en resultados de investigaciones ante-
riores, entonces pueden denominarse también hipótesis, con menos rigor, o sim-
plemente conjeturas, lo cual no comporta que la investigación se deprecie o sea de
rango menor. En cualquier caso, cada hipótesis que se plantea en la metodología
observacional relaciona, como toda hipótesis, al menos dos variables totalmente
operativizadas. En esta disciplina las variables que se utilizan son de tres tipos
(Johnston y Pennypacker, 1980):
a. Variables conductuales. Son códigos conductuales que toman dos valores,

presencia y ausencia, y que el observador asigna a los segmentos de conducta del su-
jeto observado (Sackett y cols., 1978). Cada código es un tipo de conducta que el in-
vestigador ha definido de modo objetivo de acuerdo con los fines de su investiga-
ción. A lo largo de una sesión de observación se espera que cada uno de los códigos
presente variabilidad.
b. Variables ambientales. Son propiedades susceptibles de evaluación del en-
torno natural de los sujetos observados, que el investigador considera que pueden
estar relacionadas con su comportamiento (por ejemplo, la presencia o la ausencia
del maestro cuando se estudia la conducta de un alumno durante un examen).
c. Variables de sujeto. Son atributos de los sujetos observados que no sufren
variabilidad intrasujeto ni pueden ser alterados durante la investigación (por ejem-
plo, la edad, las variables de personalidad o el sexo).
Como mínimo, una de las variables entre las cuales se establece relación en las hi-
pótesis debe ser una variable conductual. Por ejemplo:
La observación 317
a. «¿Lloran más los bebés de madres primíparas que los de madres no primípa-
ras?». Una variable conductual, “el bebé llora”, y una variable de sujeto,
“primiparidad”.
b. «¿Disminuye la probabilidad de que el bebé llore después de que la madre le
hable?». Dos variables conductuales, «el bebé llora» y «la madre habla».
c. «¿La disminución de la probabilidad de que el bebé llore después de que la
madre le hable es mayor cuando el padre está ausente que cuando está pre-
sente?». Las mismas variables conductuales que en el ejemplo anterior, más
una variable ambiental, “presencia del padre”.
Es necesario que todas las variables estén operativizadas, lo que implica que sean
medibles de forma totalmente objetiva. Por lo tanto, es de capital importancia que
las variables o códigos conductuales que se emplean en la investigación estén defini-
dos de manera que los observadores no puedan efectuar interpretaciones subjetivas
o idiosincrásicas de las mismas. Ello requiere una especial atención cuando los códi-
gos son de naturaleza molar e inferencial (por ejemplo, códigos como “agrede”, “in-
teracción positiva”, etc.). Por tanto, la codificación de la conducta a observar es una
etapa no sólo necesaria sino crucial en cualquier investigación observacional, puesto
que, junto con los observadores entrenados, constituye el instrumento de medida en
la metodología observacional (Behar, 1991).
II. CODIFICACIÓN DE LA CONDUCTA
La metodología observacional debe enfrentarse a un material de enorme compleji-

dad, la conducta, que es preciso acotar y cuantificar. Cualquier intento por alcanzar
un conocimiento objetivo de la conducta debe pasar, como en toda ciencia, por la
obtención de unidades definibles y diferenciables. Si, con objeto de obtener infor-
mación sobre la conducta, se realizan únicamente observaciones no estructuradas,
procediendo simplemente a anotar los eventos que se suceden, y utilizando para ello
el lenguaje habitual, es muy difícil captar la estructura de la conducta o establecer re-
lación entre diversos aspectos de la misma. Por esta razón es necesario, para conse-
guir una información objetiva y cuantificada de la conducta, ajustarse a ciertas nor-
mas y, de este modo, la elaboración de un sistema de categorías de conducta es una
fase fundamental. En este apartado se trata de cómo transformar el flujo conductual
en datos objetivos a partir de los cuales sea posible contrastar las hipótesis o conje-
turas.
mi. Elección de las conductas a observar
Diversos autores (Hawkins, 1982; Suen y Ary, 1989; Bakeman, 1997; Bakeman Mi
Gottman, 1997) coinciden en considerar que los objetivos de la investigación COnsti-
tuyen un criterio importante en el que basarse para proceder a la segmentación de la
conducta de forma adecuada y disponer así de unidades conductuales. La respuesta a
la cuestión ¿qué es lo que deseamos conocer, cuál es el problema planteado? lleva a

delimitar ciertos aspectos del flujo conductual, a elegir unas partes de un todo; en de-
finitiva, a realizar un muestreo conductual. Una vez concretado el objetivo, un pri-
mer paso aconsejable es proceder a una observación no sistemática de la conducta
(León y Montero, 1995). En esta etapa el observador no realiza ningún control y se
limita a recoger aquello que considera relevante para posibilitar la diferenciación de
unos eventos de otros, y estimar cuáles guardan relación con las preguntas plantea-
das. Sin esta precisión, y ante la duda de lo que es realmente importante, se recogería
un número excesivo de datos que en realidad no guardarían relación con el objeto de
la investigación. Esta fase de observación preliminar, cuyos datos no deben incluirse
en el análisis final, proporciona material en bruto para plantearse cuestiones y for-
mular hipótesis y asimismo facilita una aproximación a la conducta objeto de estu-
dio que resulta imprescindible para proceder posteriormente a la codificación de la
misma (Martin y Bateson, 1986). Los datos obtenidos en esta primera fase presentan
las características de un sistema verbal (Fassnacht, 1982), con signos propios del len-
guaje y con una relación entre los signos correspondiente a la sintaxis. El uso del len-
guaje cotidiano en el registro y la ausencia de cualquier tipo de norma o limitación
en cuanto a qué registrar y cómo registrarlo implica:
a. Subjetividad en la elección de las conductas a observar.

b. No comparabilidad de los registros de observadores distintos, ya que pue-
den estar utilizando expresiones diferentes para describir una misma reali-
dad.
c. Dificultad en la cuantificación.
Desde una perspectiva histórica los sistemas verbales fueron los primeros en ser
utilizados en la observación, en una época en que la metodología observacional care-
cía de la entidad actual. En la actualidad, los sistemas verbales son una forma de re-
gistro inicial y casi imprescindible en toda investigación observacional, pues facilitan
un primer abordaje de las conductas que serán objeto de estudio.
1.2. Unidades conductuales
El material obtenido a partir de la observación no sistemática debe ser estudiado

analizado con objeto de segmentar el flujo conductual y obtener así las unidades
conductuales. Esta segmentación no puede ser arbitraria y debe apoyarse en deter-
minados indicios. Existen diversos indicadores de segmentación en función de dis-
tintos criterios. Sulzer-Azarof y Reese (1982) proponen analizar las tareas y subdivi-
dirlas en diversos componentes o segmentos. Por ejemplo, la tarea “conducir un
automóvil” podría subdividirse en los componentes: abrir la puerta, sentarse, cerrar
la puerta, abrocharse el cinturón de seguridad, poner la llave de contacto, etc. Rosen-
blum (1978) sugiere tener en cuenta dos dimensiones: un cambio marcado en la in-
tensidad motriz y un cambio en la orientación del sujeto durante la conducta. En el
segundo criterio considera también la existencia de contacto con un objeto, ya sea
inanimado o social.
La observación 310
El tamaño de las unidades, es decir, su molaridad o molecularidad, viene también

dictado en cierta medida por el objetivo de la investigación. Por ejemplo, si se desean
estudiar las pautas motrices del recién nacido se impondrán de forma natural unida-
des moleculares que recojan con el mayor detalle posible los diversos movimientos
que los bebés sean capaces de realizar. En cambio, en una investigación sobre habili-
dades sociales las unidades deberían reflejar conductas de mayor complejidad, que,
al incluir diversos segmentos conductuales, implican mayor molaridad. Sin embar-
go, a pesar de esta determinación inicial, el investigador toma su propia decisión so-
bre el tamaño de las unidades a utilizar, y, aun respetando la orientación derivada del
objetivo de la investigación, marca el grado de molaridad o de molecularidad. De
este modo, en sistemas de codificación empleados para captar la interacción en la pa-
reja es posible hallar desde sistemas como el MICS-111 (Weiss, 1985), con unidades de
relativa molaridad, hasta otros como el DCS (Julien y cols., 1989), en el que cada uni-
dad abarca 20 minutos. Si, por el carácter exploratorio del trabajo, los objetivos no
están claramente definidos, es preferible codificar conductas moleculares y, poste-
riormente y si se considera oportuno, combinarlas para conseguir unidades molares.
Por otra parte, en función de su contenido las unidades pueden clasificarse en es-
tructurales (o morfológicas) y funcionales. Las primeras corresponden a localizacio-
nes concretas en el dominio espacio-temporal (Schleidt, 1982). Por ejemplo, “dar
patadas”: golpe dado con la planta del pie; “acariciar”: rozar suavemente alguna par-
te del cuerpo del otro con la mano. En estas unidades se realiza una descripción por
operación. Las unidades funcionales se definen por las consecuencias que producen
en el entorno físico o social, es decir, no por los movimientos que componen las ac-
ciones sino por los productos de dichas acciones. Se trata de descripciones por con-
secuencia; por ejemplo, “coser un vestido”, “escribir un libro” o “hacer un progra-
ma de radio”. Sean de uno u otro tipo, las unidades de conducta deben definirse de
forma objetiva y completa. Objetiva, utilizando en la definición características ob-
servables de la conducta y evitando en todo momento cualquier tipo de interpreta-
ción; y completa, precisando los límites de la unidad, para de este modo facilitar la
discriminación entre las diversas unidades. En la definición deben emplearse expre-
siones claras y sencillas que eviten la ambigúedad. De acuerdo con su duración, las
unidades de conducta se consideran eventos cuando son segmentos de duración
muy pequeña, o menor que la unidad de tiempo fijada por el investigador, y se consi-
deran estados cuando su duración es mayor que esa unidad. En general, son eventos
todos aquellos segmentos que son transitorios (por ejemplo, “levantar las cejas”,
“Salir de casa”, “sentarse”), y estados, todos aquellos segmentos que representan una
permanencia (por ejemplo, “dormir”, “estar sentado”, “llorar”).
13. Sistemas de categorías

Las unidades de conducta deben articularse en un sistema o conjunto de manera que
resulten claras las relaciones conceptuales entre ellas; asimismo, es aconsejable en
ocasiones establecer separaciones temporales disyuntivas entre las unidades. Estas
relaciones entre unidades de conducta son la mutua exclusividad y la exhaustividad.
Un conjunto de unidades mutuamente excluyentes entre sí (tanto conceptual como
320 Vicens Quera y Júlia Behar
temporalmente) y además exhaustivas (como mínimo conceptualmente) se denomi-

na sistema de categorías de conducta. Un sistema de categorías es un sistema nomi-
nal (Fassnacht, 1982). Un conjunto de unidades en las que no exista exclusividad
mutua entre todas ellas y/o no sean conceptualmente exhaustivas recibe a veces el
nombre de sistema de rasgos distintivos. Mientras que un sistema de categorías es
cerrado, un sistema de rasgos distintivos puede considerarse abierto o incompleto.
Definir sistemas de categorías es de especial utilidad, pues facilita el trabajo observar
y registrar en vivo y permite llevar a cabo más cómodamente determinados análisis
de los datos. Cuando las unidades de conducta son categorías, registrar una de ellas
hace imposible registrar otra simultáneamente. Asimismo, siempre existirá una cate-
goría para registrar los segmentos conductuales relacionados con el objetivo de la im-
vestigación, ya que el sistema debe ser conceptualmente exhaustivo. Es también po-
sible, pero no siempre necesaria, la exhaustividad temporal. En cada categoría es
posible diferenciar un núcleo conceptual y un nivel de plasticidad o grado de apertu-
ra (Anguera, 1991). El núcleo conceptual de una categoría está compuesto por los
elementos comunes que existen en los diversos segmentos conductuales que son cla-
sificados en la misma. Este núcleo confiere significado a la categoría y la identifica y
diferencia respecto a otras categorías. El nivel de plasticidad o grado de apertura de
una categoría es el grado de diversidad de los diferentes segmentos conductuales
adscritos a ella. Si tras poner a prueba el sistema de categorías se verifica que éste no
cumple los requisitos de exhaustividad conceptual y de mutua exclusividad de las ca-
tegorías, es posible reelaborar el sistema hasta conseguirlo. De este modo, si se pro-
duce coocurrencia entre dos categorías (ausencia de exclusividad) cabe recurrir a dos
procedimientos:
a. Establecer prioridades. Si dos unidades de conducta tienden a ocurrir simul-

táneamente, entonces se establece cuál de ellas debe registrarse, en detrimen-
to de la otra; ello supone una pérdida de información.
b. Crear una nueva categoría. Se mantienen ambas categorías en el sistema, y se
define una nueva categoría por agrupación de las dos, lo que implica un in-
cremento de la información.
Si el problema es de falta de exhaustividad, cabe recurrir a:
a. Creación de categorías vacías, que recogerán las ocurrencias de segmentos

conductuales que se consideran irrelevantes y que son excluyentes con el
resto de las categorías.
b. Creación de categorías “cajón de sastre”, que incluirán segmentos heterogé-
neos que, aun guardando relación con el objetivo de la investigación, ocu-
rren raras veces y son poco importantes para el objetivo de la investigación.
- Utilizar sistemas de categorías es especialmente aconsejable cuando la observa-

ción ha de realizarse en vivo. Sin embargo, el comportamiento no es en sí mismo
mutuamente excluyente en un sentido temporal. Por ejemplo, si se observa la inte-
racción entre dos personas, las conductas de una y otra pueden perfectamente sola-
parse en el tiempo. Si la observación se efectúa con imágenes grabadas en vídeo, cabe
La observación
321
la posibilidad, si así lo exigen los objetivos de la investigación, de definir unidades de

conducta que coocurran, pues pueden registrarse a partir del vídeo con facilidad. La
disponibilidad de sistemas de registro observacional informatizados (por ejemplo
The Observer de Noldus [1992] permite trabajar con unidades de conducta ES
turadas en varios sistemas de categorías paralelos en el tiempo, por ejemplo, uno de
expresion facial, otro de conducta verbal y otro de control postural de un indivi-
duo). Asimismo, las técnicas de análisis de datos observacionales más actuales facili-
tan el tratamiento de secuencias de conducta en las que existen unidades con solapa-
miento temporal (por ejemplo, Bakeman y Quera, 19954). Por lo tanto, no siempre
puede considerarse indispensable imponer la restricción de mutua exclusividad tem-
poral cuando es claro que el fenónemo conductual que se investiga puede analizarse
con mayor profundidad empleando unidades de conducta que se solapan temporal-
mente.
I!L.. RECOGIDA DE DATOS OBSERVACIONALES
m1. Medidas conductuales
La finalidad de la recogida de datos en la observación sistemática es la obtención de

un registro conductual del que poder extraer medidas de la conducta que tengan va-
riabilidad a lo largo de las sesiones de observación o dentro de una misma sesión de
observación. Las medidas conductuales pueden dividirse en primarias y secundarias.
Las medidas primarias son la frecuencia y la duración de las categorías (Johnston y
Pennypacker, 1980; Barrett, Johnston y Pennypacker, 1986). La frecuencia de una
categoría a lo largo de un período de observación es el número de segmentos con-
ductuales a los que se ha asignado dicha categoría, o, en otras palabras, es el número
de veces que ha ocurrido la categoría. Se trata de una medida absoluta que se expresa
en una escala de razón absoluta (cero y unidad no transformables). La unidad de me-
dida de la frecuencia es el ciclo o “número de veces”, aunque, puesto que el ciclo no
es una dimensión física, se considera que la frecuencia es una medida adimensional.
Es posible calcular frecuencias tanto de categorías estado como de categorías evento.
La duración de ocurrencia es el tiempo ocupado por la ocurrencia de una categoría.
Sumando las duraciones de todas las ocurrencias de una categoría a lo largo de un
eríodo de observación obtenemos su duración. Ambos tipos de duración son tam-
bién medidas absolutas, expresadas en una escala de razón (cero absoluto, pero uni-
dad transformable). La unidad de medida más corriente es el segundo (s). Sólo es po-
sible obtener duraciones de categorías estado, pues las ocurrencias de una categoría
evento tienen duración nula por definición. Otros tipos de duración son: el intervalo
o lapso entre ocurrencias, o el tiempo transcurrido desde que finaliza una ocurrencia
de una categoría hasta que se inicia la siguiente ocurrencia de la misma categoría; y la
latencia, o tiempo transcurrido desde que ocurre un cierto evento hasta el inicio de la
primera ocurrencia de una categoría. El evento en cuestión puede ser la emisión de
un estímulo, la ocurrencia de un evento en la conducta de otro individuo, etc. La fre-
cuencia y la duración (en cualquiera de sus formas) no son útiles si no se proporcio-
322 Viceng Quera y Júlia Belar
na información acerca del tiempo total que ha durado el período de observación o si

no se relacionan una con otra. Por este motivo existen medidas relativas o secunda-
rias, directamente interpretables, que se derivan de las anteriores. Las más empleadas
son la tasa (frecuencia dividida por el tiempo total de observación), la frecuencia re-
lativa (frecuencia dividida por la suma de las frecuencias de todas las categorías), la
duración relativa (duración dividida por la suma de las duraciones de todas las cate-
gorías) y duración media (duración dividida por frecuencia). Todas las medidas ante-
riores caracterizan las categorías de una forma estática, es decir, se emplean para %re-
sumir” la conducta que se produce durante un cierto período de observación. Sin
embargo, para contrastar ciertas hipótesis es necesario caracterizar las categorías de
forma dinámica: cuantificar cómo cambia la conducta momento a momento durante
el período de observación (Bakeman y Gottman, 1997). El análisis del cambio con-
ductual momento a momento se llama análisis secuencial, y sus características prin-
cipales se exponen en un apartado posterior de este capítulo.
Las medidas dinámicas básicas son la frecuencia de transición y la frecuencia re-
lativa de transición (Castellan, 1979; Van Hooff, 1982). La frecuencia de transición
es el número de veces que ocurre una transición entre un par de categorías. Para unas
categorías A y B la frecuencia de transición de A a B es el número de veces que des-
pués de A ocurre B en la secuencia de datos. La frecuencia relativa de transición en-
tre dos categorías A y B es la proporción de todas las transiciones desde A que ter-
minan en B, o la estimación de la probabilidad de que después de A ocurra B, y se
calcula dividiendo la frecuencia de transición entre A y B por el número total de
transiciones observadas desde A.
112. Muestreo observacional y sesiones de observación

Para contrastar las hipótesis de una investigación, rara vez es posible acceder a toda
la población de individuos a la que se desean generalizar los resultados. En la obser-
vación sistemática existen diversas poblaciones de interés que es imposible estudiar
en su totalidad. Las principales son la población de sujetos y la población de tiempo.
Ambas están delimitadas por los objetivos de la investigación. Así, en un estudio
acerca de las interacciones entre madre y recién nacido durante el primer mes de vida
del niño, la población de sujetos está compuesta por todas las parejas madre-recién
nacido, y la población temporal consta de todas las unidades de tiempo comprendi-
das desde el momento del nacimiento hasta el término del primer mes de vida del
bebé. Puesto que ni una ni otra población pueden estudiarse en su totalidad, es nece-
sario seleccionar muestras de ambas que representen adecuadamente las poblaciones
respectivas. Las selecciones posibles son las siguientes, de las cuales las tres primeras
son necesarias y la cuarta es opcional:
a. Muestreo de sujetos. Consiste en seleccionar una muestra representativa de

sujetos a partir de la población a la que se quieren generalizar los resultados (Suen y
Ary, 1989). En el ejemplo anterior se concretaría en seleccionar un grupo de parejas
de madre y recién nacido. Este tipo de muestreo es común a todas las metodologías
de investigación.
La observación PE
' b. Muestreo intrasesional de sujetos (Suen y Ary, 1989). Cuando se observa a

más de un sujeto y se juzga imposible que el observador pueda mantener su atención
en la conducta de todos a la vez, debe determinarse de antemano qué sujetos del gru-
po serán observados durante la sesión, y/o en qué orden van a ser observados.
c. Muestreo intersesional de tiempo. Consiste en seleccionar los períodos o se-
siones durante los cuales los sujetos van a ser observados, lo que implica seleccionar
tanto la cantidad de sesiones como los momentos en que éstas se inician y terminan.
d. Muestreo intrasesional de tiempo. Si se decide segmentar el flujo conductual
en unidades de tiempo (véase el apartado 111.1), entonces la conducta de los sujetos
será registrada de forma discontinua durante la sesión de observación, realizándose
un muestreo del tiempo dentro de la misma. La alternativa es observar y registrar de
modo continuo dentro de la sesión, sin efectuar ningún tipo de muestreo temporal.
La sesión de observación es el período de tiempo durante el cual se observa y se

registra siguiendo siempre la misma regla de muestreo intrasesional de sujetos y uti-
lizando la misma técnica de registro (véase el apartado 111.3). Cada sesión es una
muestra del período de estudio o período de tiempo de la vida de los sujetos al cual
se quieren generalizar los resultados de la investigación. Como ejemplos de períodos
de estudio empleados por los investigadores podemos citar: el posparto, el primer
curso de universidad, el año posterior a la jubilación, etc. Cuando el período de estu-
dio es largo (por ejemplo, días, meses, años), es necesario extraer muestras de él por-
que es imposible permanecer observando a los sujetos durante días enteros, debido
tanto a la disponibilidad del observador como a la disponibilidad de los sujetos. La
duración de las sesiones dependerá de:
a. Eltipo de conducta a observar. La duración de las sesiones tiene que ser su-
ficientemente larga para que en ellas tenga lugar una variabilidad aceptable en el
comportamiento observado, es decir, para que ocurra un número grande de transi-
ciones entre ocurrencias de categorías de conducta. Ello depende a su vez del grado
de molaridad de las categorías y de sus duraciones medias. La duración total de la
sesión ha de ser mucho mayor que las duraciones medias de las categorías conduc-
tuales.
b. La fatiga del observador. La atención constante repercute en un aumento de
la fatiga y un descenso de la calidad de los datos. Sin embargo, la utilización del vídeo
en la observación sistemática permite grabar sesiones de larga duración que después
pueden ser observadas durante sesiones de trabajo de menor duración. En laobser-
vación en vivo de sujetos humanos en interacción social una duración de sesión indi-
cativa oscila entre 30 y 60 minutos.
La cantidad total de sesiones ha de ser suficiente para que el volumen de datos re-
cogidos permita poner a prueba las hipótesis de investigación (Yarrow y Waxler,
1979). Cuantas más categorías de conducta se hayan definido y cuanto menor tasa
tengan, más largas habrán de ser las sesiones y/o mayor número de ellas deberá ha-
ber para que las medidas de las categorías obtenidas sean aptas para realizar los análi-
en E averiguar si la.
: e ASinteresados
sis estadísticos pertinentes. Así por : ejemplo, si estamos
categoría “interacción verbal positiva de la madre” (A) activa secuencialmente la ca
tegoría “interacción verbal positiva del hijo” (B), necesitaremos observar el número
de sesiones suficiente para que, en la pareja o en la totalidad de la muestra, las fre-
cuencias totales de A y de B sean grandes para poder estimar adecuadamente la pro-
babilidad de que a A siga B y compararla con la probabilidad no condicionada de
que ocurra B. Las técnicas estadísticas mediante las que se compararán dichas esti-
maciones de probabilidad exigirán que las frecuencias aludidas alcancen un mínimo,
que puede ser 30 aproximadamente. Para que la conducta registrada en una sesión
sea representativa de toda la conducta restante que ocurre fuera de lasesión y no es
observada, deben programarse adecuadamente los inicios y finalizaciones de las se-
siones que van a realizarse con el fin de que no dependan de las preferencias del ob-
servador. Ello significa que los inicios han de ser seleccionados de forma que todos
los puntos temporales del período de estudio tengan la misma probabilidad de ser
inicios de sesiones, siempre que haya transcurrido un tiempo determinado desde el
inicio de la sesión anterior. El muestreo intersesional de tiempo suele adoptar una de
estas formas (Altmann, 1974):
a. Muestreo aleatorio. Si se seleccionan los inicios de sesión mediante mues-

treo aleatorio dentro del período de estudio se da por supuesto que tanto los suje-
tos como el observador estarán disponibles en cualquier momento. Esta situación
puede ser realista en casos muy concretos, como por ejemplo, si el período de es-
tudio es de un día, o si es posible obtener una grabación audiovisual permanente
de los sujetos, pero en general cabe suponer que observador y observado están
disponibles únicamente en ciertos subperíodos de la fase de estudio, es decir, a
ciertas horas. En tal caso el muestreo intersesional ha de restringirse a dichos sub-
períodos y, por lo tanto, puede producirse algún sesgo en la muestra de conducta
observada.
b. Selección fija. También pueden iniciarse las sesiones siempre a las mismas
horas del día. Ello tiene la ventaja de que es más cómodo para el observador pero
sólo permite recoger datos representativos de esas horas. Por lo tanto, la muestra de
los flujos conductuales que se obtiene puede estar sesgada.
c. Criterios comportamentales. El observador permanece atento al comporta-
miento de los sujetos sin registrarlo, hasta que ocurre por primera vez una determi-
nada categoría conductual de interés, momento en el cual se inicia la sesión. Asimis-
mo, la finalización de la sesión puede determinarse por la presencia o ausencia de
otra cierta categoría. La selección por criterios comportamentales posee la desventa-
ja de que la muestra de conducta que se obtiene Únicamente es representativa de los
períodos iniciados y terminados por las categorías en cuestión y, por lo tanto, puede
contener un sesgo importante si lo que se desea es generalizar los resultados al resto
del período de estudio. No obstante, si el período de estudio se define en función de
la aparición de tales categorías, la selección por criterios comportamentales dará lu-
gar a una muestra de conducta representativa. A modo de ejemplo, si estamos intere-
sados en investigar las secuencias de agresión en una cierta especie animal bastará
con que iniciemos las sesiones en el momento en que tiene lugar una cierta categoría
que presumimos desencadenará la agresión (por ejemplo, una amenaza) y las termi-
nemos en elmomento en que los individuos se alejen unos de otros o inicien otro
tipo de actividad (por ejemplo, comer).
La observación
325
IL. Reglas de muestreo intrasesional de sujetos y reglas de registro

Las reglas de muestreo intrasesional de sujetos especifican qué sujetos han de obser-
varse y cuándo, dentro de la sesión de observación. Si el registro va a realizarse en
una díada o en un grupo, si ha de realizarse en vivo (porque no puede grabarse en ví-
deo para verlo posteriormente), y si el observador no puede prestar atención simul-
tánea a la conducta de todos los sujetos, entonces es preciso aplicar una de las reglas
que e especifican a continuación (Altmann, 1974; Martin y Bateson, 1986; Quera,
1991):
a. Muestreo focal. El observador únicamente mantiene su atención centrada en

el comportamiento de un individuo, sea un sujeto en un grupo, una díada en un gru-
po de díadas, o un subgrupo en un grupo formado por varios subgrupos similares. Si
la investigación está orientada a obtener datos de sujetos individuales cuando se en-
cuentran solos, el muestreo de sujetos siempre es focal. Se utiliza la denominación
“focal” porque es más corriente observar sujetos que se encuentran en grupos que
sujetos solitarios e interesa destacar que, ocurra lo que ocurra en el grupo, el obser-
vador centra su atención exclusivamente en uno de los sujetos.
b. Muestreo de barrido o multifocal. El observador focaliza su atención en cada
uno de los individuos durante un intervalo de tiempo corto y por turnos, de forma
rotatoria. Durante la sesión, el barrido se efectúa un gran número de veces, razón
por la cual el intervalo dedicado a cada individuo cuando se le observa es muy pe-
queño en comparación con la duración de la sesión. Todos los intervalos tienen
siempre la misma duración. El orden en que los individuos son observados es siem-
pre el mismo en cada turno, y se establece de antemano.
Las reglas de registro especifican qué propiedades de las categorías de conducta

han de ser registradas y en qué momentos. En cada sesión de observación se combi-
na una regla de registro y una regla de muestreo intrasesional de sujetos. Las reglas
de registro observacional son las siguientes (Martin y Bateson, 1986; Quera, 1991;
Bakeman y Gottman, 1997):
a. Registro activado por transiciones (RAT). El observador anota todas las ocu-
rrencias de las categorías del individuo focal o de los individuos que son multifocali-
zados, en la secuencia en que se producen; además el observador puede anotar en
qué momento termina una categoría y se inicia la siguiente. Decimos que el registro
está activado por transiciones porque el observador únicamente anota en aquellos
momentos en que se produce una transición entre ocurrencias de categorías, efec-
tuando por consiguiente una segmentación conductual del flujo. El RAT permite ob-
tener información completa y precisa acerca de la frecuencia, la duración y la secuen-
cia u orden temporal de las categorías de conducta.
b. Registro activado por unidades de tiempo (RAUT). El observador anota las
coocurrencias de las categorías de conducta del individuo focal o de cada uno de los
individuos multifocalizados rigiéndose por unidades de tiempo llamadas intervalos.
Mientras que en el RAT es la unidad de conducta la que determina la anotación, en el
326 : Vicens Quera y Júlia Behar
n cada unidad de tiempo

registro activado por unidades de tiempo es la finalizacióde
o intervalo, indicada por un metrónomo o reloj, lo que activa al observador para que
anote. Por lo tanto, se realiza una segmentación temporal y no conductual del flujo.
El RAUT recibe a veces el nombre de “muestreo de tiempo” en referencia a que, se-
gún la técnica concreta que se emplee (véanse los párrafos siguientes), el observador
puede prescindir de mantener la atención sobre los sujetos mientras no haya trans-
currido la unidad de tiempo pertinente; se trata pues de un muestreo intrasesional
del tiempo. Los tres tipos de RAUT más comunes son (Hansen, 1966; Altmann, 1974;
Powell, Martindale y Kulp, 1975; Ary y Suen, 1983; Bakeman y Gottman, 1987;
Suen y Ary, 1989):
a. Muestreo instantáneo, momentáneo o puntual. La sesión de observación se

divide en N intervalos de duración constante (longitud de intervalo) y el observador
sólo registra cuál de las categorías está ocurriendo al término del intervalo o punto
de muestreo. La distancia entre puntos de muestreo (o longitud de intervalo 7) ha de
ser pequeña en comparación con la duración de la sesión (T'), por lo que la cantidad
de puntos de muestreo o intervalos (N) suele ser un número grande. Para cada una
de las categorías el registro que se obtiene es una secuencia de unos y ceros que indi-
can respectivamente la presencia y la ausencia de la categoría en los puntos de mues-
treo. Al utilizar el muestreo instantáneo se parte del supuesto de que todas las ocu-
rrencias de las categorías de conducta poseen duración y que las transiciones entre
ellas son instantáneas. Por lo tanto, el muestreo instantáneo es totalmente inadecua-
do cuando las categorías son eventos.
b. Muestreo de intervalo parcial, de Hansen o “uno-cero”. La sesión se divide
también en N intervalos y el observador registra en cada uno de ellos qué catego-
rías han ocurrido, prescindiendo de cuántas veces han ocurrido, cuánto han durado
sus Ocurrencias, y en qué momentos han tenido lugar dentro del intervalo. Para
cada categoría es un registro “todo o nada” o “uno-cero”; es decir, sólo interesa te-
ner constancia de si la categoría se ha dado o no en el intervalo. Se trata de un RAUT
no restrictivo porque basta que una categoría ocurra en cualquier instante de un in-
tervalo para que sea registrada en el mismo. El observador no ha de esperar necesa-
riamente hasta que termine el intervalo para anotar; basta que anote cada categoría
cuando ocurre por primera vez dentro del intervalo. También en este caso el pro-
ducto del registro es un conjunto de secuencias binarias, una por categoría. Este
muestreo es utilizable tanto si las categorías de conducta son eventos como si son
estados.
c. Muestreo de intervalo total. La sesión se divide en N intervalos y el obser-
vador anota en cada uno de ellos cuál ha sido la categoría que ha ocupado la totali-
dad del intervalo. Se trata de un RAUT totalmente restrictivo porque no permite re-
gistrar categorías que ocurran sólo en una parte del intervalo. Si en un intervalo se
produce una transición entre categorías entonces ninguna de ellas es registrada.
Sólo los intervalos sin transiciones dan lugar a registro. Esta forma de registro no
es adecuada cuando las categorías son eventos. Si tiene lugar una transición durante
el intervalo el observador puede sustraer su atención de la conducta de los sujetos,
no registrar nada, y esperar a que se inicie el siguiente intervalo para volver a ob-
servar.
La observación 027
En comparación con el RAT, el RAUT posee las siguientes ventajas:
a. Produce menor fatiga en el observador, lo cual repercute en que tiene menos

errores y los datos tienden a ser más fiables (Sackett, 1978; Mehm y Knutson, 1987).
b. Los observadores pueden ser adiestrados más rápidamente (Bakeman y
Gottman, 1987). Es más fácil de utilizar que el RAT porque el observador simplemente
ha de anotar a intervalos regulares, en lugar de decidir cuándo hay o no transiciones
entre categorías. Por lo tanto, en general, utilizar un RAUT repercute en un menor cos-
te para la investigación (Sackett, 1978; Klesges, Woolfrey y Vollmer, 1985).
En contrapartida, la desventaja del RAUT es que no produce una representación

fidedigna de los cambios que ocurren en los flujos conductuales (Altmann, 1974;
Suen y Ary, 1989). Por lo tanto, no proporciona valores exactos de la frecuencia y la
duración de las conductas, ni permite obtener información acerca de las secuencias.
Sin embargo, si la longitud del intervalo es pequeña en comparación con las duracio-
nes medias de las conductas, el registro obtenido se aproxima al que proporcionaría
un RAT. Además, a partir de un RAUT es posible realizar estimaciones de las frecuen-
cias y las duraciones mediante técnicas específicas (Suen y Ary, 1986, 1989; Quera,
1989, 1990, 1991).
1.4. Obtención de medidas conductuales a partir del registro

En el RAT la información acerca de la frecuencia, duración y secuencia es inmediata a
partir del registro. Por ejemplo, supongamos que se definió este sistema de catego-
rías para el intercambio verbal en una pareja: (M+, M=, Mo, H+, H=, Ho), donde M
simboliza Mujer, H Hombre, + “intervención positiva”, - “intervención negativa” y
0 “intervención neutra”. Un RAT efectuado con este sistema podría dar como resul-
tado estos datos en los que el primer elemento de cada par simboliza una categoría
de conducta, y el segundo el tiempo en que se inició, correspondiendo el cero al co-
mienzo de la sesión:
Meos ER H015 M+17- Ho 24 M-31" H-35
La última unidad de tiempo de la sesión fue la unidad 39 (en total, 40 unidades de

tiempo). La secuencia de categorías es, obviamente, M+ H+ Ho M+ Ho M- H-. Las
frecuencias (F) y duraciones (D) de las categorías son:
M+ M- Mo H+ H= Ho
Es 2 1 0 1 1 z
ls 19 4 0) 3 5 9
En el RAUT la frecuencia y la duración de las conductas pueden estimarse me-

diante fórmulas a partir de las medidas proporcionadas por este tipo de registro. Las
medidas proporcionadas por un RAUT son:
a. Frecuencia modificada (0). La frecuencia modificada de una categoría de

conducta es la cantidad de unos de su secuencia binaria, es decir, el número de inter-
valos en los que la categoría ha sido anotada conforme a la regla de registro (Sackett,
1978).
b. Sendofrecuencia (f). La seudofrecuencia de una categoría de conducta es el
número de pares 01 de su secuencia binaria, esto es, la cantidad de ráfagas de unos de
la misma (Suen y Ary, 1989; Quera, 1991). Si en una misma sesión se aplicasen simul-
táneamente los tres tipos de RAUT con la misma longitud de intervalo, las frecuencias
modificadas obtenidas para cada conducta no coincidirían necesariamente. Lo mis-
mo ocurriría con las seudofrecuencias. Luego, para la interpretación de ambas me-
didas se necesita conocer qué tipo de RAUT las ha producido y con qué longitud de
intervalo. La frecuencia modificada no es en absoluto una estimación ni de la fre-
cuencia ni de la duración de la conducta.
Por ejemplo, supongamos que se ha efectuado un muestreo de intervalo parcial
con las categorías A, B, C, D en una sesión de 120 s. La figura 15.1 es una representa-
ción gráfica de la segmentación conductual verdadera, que habría proporcionado un
RAT, así como el resultado del muestreo de intervalo parcial con intervalos de longi-
FIGURA 15.1. (a) Un registro activado por transiciones de las categorías de conducta A, B, C,
D en una sesión de 120 unidades de tiempo. Los trazos gruesos indican ocu-
rrencias de las categorías. En la parte inferior se indican las unidades de tiempo
en que tienen lugar las transiciones. (b) Muestreo de intervalo parcial efectua-
do simultáneamente en la misma sesión de observación que el registro de (a),
empleando intervalos de 5 unidades de tiempo
a)
0 10 20 30 40 50 60 70 80 90 100 110 120

—-—— > 55% 4
A pt
B o — e —_——_ A
E —— E ln e
_——, 6 SS 26 34 45 68 ARES! 95 102 109 11 8

Transiciones En 38 48 105 115
b)
Puntos de
muestreo
La observación 329
tud 7=5 s. Las frecuencias y duraciones verdaderas de las conductas que habría su-
ministrado un RATy las seudofrecuencias y frecuencias modificadas que proporcio-
na el muestreo realizado se observan en el cuadro 15.1.
CUADRO 15.1.
Medidas conductuales obtenidas para las categorías A, B, C, D, según los re-
gistros presentado en la figura 15.1
.
S _AE I A s T A E9 OA
Categorías
a A B E D
Frecuencias 6 4 4 5
Duraciones 49 24 22 25
Seudofrecuencias 6 4 3 4
Frecuencias modificadas 3 Y TÍ 9
Si se cumplen las siguientes condiciones, entonces la seudofrecuencia de una

conducta es exactamente igual a su frecuencia verdadera (f = E) (Suen y Ary, 1986):
en el muestreo instantáneo, 7 < min min(x), min(y); en el parcial, p < min min(x),
min(y)/2; y en el total, 7 < min min(x)/2, min(y), siendo min(x) la mínima duración
de ocurrencia de la conducta, y min(y) el mínimo lapso de tiempo entre dos ocu-
rrencias consecutivas de la conducta. Si las condiciones se cumplen para todas y cada
una de las categorías de conducta, entonces la secuencia de conducta queda registra-
da de forma fidedigna mediante el RAUT en cuestión. Obviamente, para elegir el va-
lor de 7 según estos criterios ha de disponerse de información previa acerca de los
mínimos, la cual sólo puede conocerse llevando a cabo una o varias sesiones piloto
previas empleando un RAT. Si las condiciones anteriores no se cumplen para una
conducta concreta, entonces, para esa conducta el RAUT suministra una seudofre-
cuencia que es menor o igual que su frecuencia verdadera (f < F). La duración de
cada conducta se estima de forma diferente según cuál sea el RAUT utilizado, em-
pleando las fórmulas propuestas por Suen y Ary (1986, 1989); en el muestreo instan-
táneo, D= 07, en el muestreo de intervalo parcial, D= (8 - f)r, y en el muestreo de in-
tervalo total, D = (0 + f)7. Aplicando la segunda de estas expresiones, en el ejemplo
del muestreo parcial de las conductas A, B, C, D presentado antes, los valores esti-
mados son, respectivamente, 35 s, 15 s, 20 s y 25 s. Obsérvese que estos valores pre-
sentan diferencias con respecto a los verdaderos, debido a que las estimaciones tie-
nen error. El error de estimación puede reducirse aumentando la duración de la
sesión de observación y, por lo tanto, aumentando el número de intervalos, lo que
lleva consigo un aumento del tamaño de la muestra.
IV. CONTROL DE LA CALIDAD DE LOS DATOS
Como en toda ciencia, en psicología y específicamente en la metodología observa-

cional, una fase fundamental del proceso de investigación es la dedicada al control de
calidad de los datos. Carece de sentido y puede dar lugar a conclusiones falsas aplicar
330 Viceng Quera y Júlia Behar
sofisticadas técnicas estadísticas si no es posible disponer previamente de una cierta

garantía de que los datos procedentes de la observación reflejan la realidad. Para rea-
lizar dicho control de calidad se dispone en metodología observacional de procedi-
mientos como la evaluación de la fiabilidad, la precisión y la validez de los datos.
Además, puesto que se conocen las fuentes de los sesgos posibles del observador y
del observado, es factible intentar evitar que éstos se produzcan. Á continuación se
realiza una somera aproximación a cada uno de estos conceptos. Para un tratamiento
más detallado de la calidad de los datos observacionales, se remite al lector a los tex-
tos de Suen (1988) y Bakeman (1997).
Ivi. Fiabilidad
Aun en el caso de que los registros observacionales se realicen con la ayuda de vídeo
y computadores portátiles, en último término la intervención del observador es in-
dispensable para determinar si se ha producido o no una cierta categoría de conduc-
ta, por lo que la tarea a desempeñar por el mismo es sumamente importante. Del ob-
servador depende en gran medida el grado de calidad de los datos. Es necesario que
la observación la realicen como mínimo dos observadores con objeto de comparar
sus registros y poseer así un control del grado de subjetividad incorporado al regis-
tro por cada uno de ellos y conseguir de este modo datos sin sesgo. Tal como indican
Suen y Ary (1989, p. 100), «la evidencia de fiabilidad en los datos de observación con-
ductual es necesaria para demostrar públicamente que los datos reflejan la realidad».
En la metodología observacional se define la fiabilidad como el grado de concordan-
cia entre los datos proporcionados por dos o más observadores cuando registran in-
dependientemente la misma conducta en la misma ocasión (fiabilidad interobserva-
dores); o bien, como la concordancia entre dos registros de una misma sesión
obtenidos por el mismo observador en dos momentos diferentes, gracias a la graba-
ción en vídeo (fiabilidad intraobservador o consistencia del observador) (House y
House, 1979).
Existe una amplia gama de índices estadísticos empleados como coeficientes de
fiabilidad. La elección de cualquiera de ellos debe venir marcada por el objetivo de la
investigación y por la escala de medida a la que pertenecen los datos (Hartmann,
1977). Pueden distinguirse tres clases de coeficientes de fiabilidad:
a Coeficientes globales o de sesión. Son correlaciones entre medidas globales

como la tasa, la duración relativa, etc., de las categorías de conducta, obtenidas por
dos observadores diferentes. Esta clase de coeficiente es el que deberá calcularse
cuando las hipótesis relacionen variables expresadas en forma de medidas globales
(véase el concepto de macroanálisis en el apartado V).
b. Coeficientes secuenciales. Son correlaciones entre las frecuencias de transi-
ción obtenidas por dos observadores diferentes. Estos coeficientes son los que han
de calcularse cuando las hipótesis aluden a la existencia de relaciones secuenciales
entre categorías (véase el concepto de microanálisis en el apartado v).
c. Coeficientes punto por punto. Son proporciones de concordancia momento
a momento entre los observadores, y deben calcularse cuando las hipótesis aluden a
La observación 56
relaciones temporales entre unidades de tiempo ocupadas por las categorías, dentro
de la sesión de observación. Estos coeficientes son más estrictos que los de las dos
clases anteriores. Para calcularlos es necesario construir una tabla o matriz de confu-
sión cuyas filas corresponden a las categorías tal como son registradas por uno de los
observadores, y cuyas columnas corresponden a las categorías tal como son registra-
das por el otro. En las casillas de la matriz se incluyen segmentos temporales, de
modo que cada unidad de tiempo de la sesión se asigna a una casilla de la tabla. En el
cuadro 15.2 se muestra una hipotética matriz de confusión.
CUADRO 15.2. Matriz de confusión entre dos observadores simultáneos para ciertas catego-
rías A, B, C. Los efectivos de la tabla son unidades de tiempo
o ts e A es e ia e e A A NT a is tn
Observador2
: A 19 e bel B (Es Total
A biie uimomacina
Observador 1 E o a b É
Total 13 4 5 22
En dicha matriz, de las siete unidades de tiempo que, según el observador 1, han
estado ocupadas por la categoría B, dos unidades fueron ocupadas por la categoría A
según el observador 2. Cuando la concordancia es perfecta, todas las casillas de la ta-
bla que no pertenecen a su diagonal principal contienen valores nulos. De entre los
numerosos coeficientes existentes para la evaluación de la fiabilidad punto por pun-
to, resumidos por Frick y Semmel (1978) o Wallace y Elder (1980), destaca el coefi-
ciente Kappa de Cohen (1960), que es una proporción de concordancia en la que se
corrige la concordancia que es posible lograr por azar. Para su cálculo se utilizan la
proporción de concordancia total obtenida y la proporción de concordancia aleato-
ria esperada. Esto lo hace preferible a los diversos tipos de porcentajes de acuerdo
ampliamente utilizados en metodología observacional (Hanley, 1987). El coeficiente
Kappa se calcula así: k = (P, - P)/(1 - P,), donde P, es la proporción de concordan-
cia observada y P, es la proporción de concordancia aleatoria. En el ejemplo del
cuadro 15.2, P._= (10+4+4)/22 = 0,818, P. = (10x13+7x4+5x5)/22* = 0,378,
ls (0,818-0,378)/(1-0,378) =0,707. El grado de concordancia es mayor cuanto más
próximo a la unidad es el valor del coeficiente obtenido.
Iv2. Precisión
La precisión se define como el grado de concordancia entre un observador y un cri-

terio establecido o registro estándar (Landis, 1975; Green, 1982). Fiabilidad y preci-
sión están íntimamente relacionadas sin que ninguna de ellas implique la otra. En un
registro puede ocurrir que la fiabilidad interobservadores sea alta pero la precisión
baja, por haber cometido igual tipo de errores ambos observadores. Por ello se acon-
seja frecuentemente evaluar la precisión en lugar de la fiabilidad inter o intraobserva-
dores (Foster y Cone, 1980; Johnston y Pennypacker, 1980). Sin embargo, la dificul-
tad de disponer de registros estándar lleva a que se calcule elcoeficiente de precisión
en pocas ocasiones. Para el cálculo de la precisión pueden utilizarse las mismas técni-
cas que en la evaluación de la fiabilidad, con la única diferencia de que en lugar de
evaluar la concordancia entre dos observadores con igual grado de adiestramiento,
se evalúa la concordancia entre un observador considerado falible y un observador
estándar. Además, existen coeficientes de precisión punto por punto específicos para
la evaluación de la precisión:
a. El coeficiente de sensibilidad, o la proporción de unidades de tiempo en las

que verdaderamente ocurre la categoría, que son registradas correctamente por el
observador falible; esta proporción es la estimación de la probabilidad de que el ob-
servador falible registre la conducta cuando debe hacerlo.
b. El coeficiente de especificidad, o proporción de unidades de tiempo en las
que verdaderamente no ocurre la categoría, que no son registradas por el observador
falible; esta proporción es la estimación de la probabilidad de que el observador fali-
ble no registre la conducta cuando no debe hacerlo.
1v3. Validez
En su acepción más común la validez se refiere a la relación existente entre lo que se

evalúa y lo que se desea evaluar (Martin y Bateson, 1986). Por lo tanto, debe estable-
cerse la relación entre una variable, como la medida de una conducta, y otra variable
externa, indicativa del objeto de la medida. En la metodología observacional se trata
de comprobar la validez del sistema de categorías. Pese a la importancia del concep-
to, la metodología observacional no ha dedicado al mismo ni análisis teóricos fre-
cuentes, ni su comprobación regular en las investigaciones. Posiblemente, dado que
la conducta se observa directamente, sin intermediarios (tests, cuestionarios, autoin-
formes...), sin manipulación de variables independientes y sin realizar inferencias, no
se pone en cuestión la validez de los datos obtenidos. Cuando en las definiciones de
las categorías se realizan inferencias, por la utilización de categorías molares, la vali-
dez no es tan inmediata y se trata entonces de comprobar si las categorías son buenas
definiciones operacionales de los elementos implicados en el problema. La vía ópti-
ma es comparar el registro del observador con una medida independiente de la mis-
ma variable. Si este procedimiento no es viable por la dificultad de conseguir dicho
criterio externo, entonces puede procederse a hallar el grado en que los registros de
los observadores son los mismos que si estuvieran determinados por una posición
teórica bien formada y documentada (Anguera, 1985).
IvV.4. Sesgos del observador y de la observación

La existencia del error de medida es un problema común al proceso de recogida de
datos en cualquier disciplina científica. Los sesgos del observador son aquellos erro-
res de medida que se deben al observador o al instrumento de observación, registro
La observación En
J
o medición, y se reflejan en los datos en forma de problemas de fiabilidad y/o preci-

sión. Los sesgos de la observación son aquellos errores que se deben a fallos de dise-
ño o de procedimiento que alteran la situación del registro y por lo tanto la conducta
del sujeto observado, y que limitan la generalización de los resultados (Behar vRib
(Behar y Riba,
1993). Son sesgos del observador:
a. Errores mecánicos de registro, debidos a la complejidad de la tarea a realizar.

b. Errores de interpretación del sistema de categorías, debidos a la deriva del
observador, consensuada o no, que consiste en que los observadores desarrollan ver-
siones idiosincrásicas de las definiciones originales de las categorías de conducta
(Kazdin, 1977); o debidos a la complejidad del sistema de categorías, existiendo una
relación inversa entre la complejidad y el grado de precisión (Mash y McElwee,
1974).
Cc. Errores perceptivos, entre ellos el efecto de halo, que transforma la percep-
ción presente en función de la evaluación antecedente (Muchielli, 1974).
d. Efectos biosociales, como la incidencia de la edad, del sexo y de la etnia del
observador en los datos que obtiene (Rosenthal, 1967).
e. Efectos biográficos, psicosociales y situacionales, debidos a que la historia
personal del observador, su situación familiar y social, su ideología y sus rasgos psi-
cológicos parecen influir sobre sus registros, al percibir la realidad a través de su
prisma personal.
f. Expectancia, o tendencia del observador a obtener datos que se ajustan a las
expectativas iniciales fruto de una teoría implícita o explícita.
En la metodología observacional existe la posibilidad de controlar los sesgos del

observador, siendo los procedimientos más eficaces y relevantes:
a. La diferenciación entre investigador y observador a fin de que este último

desconozca el objetivo final de la investigación y se evite así el sesgo de expectancia.
b. La definición de sistemas de categorías no excesivamente molares, no ambi-
guas, especificadas clara y detalladamente, para evitar la subjetividad del observador
en el registro.
c. La elaboración de un manual de instrucciones, que al suministrar pautas es-
pecíficas sobre el contexto en que debe realizarse el registro y sobre el inicio y finali-
zación del mismo, proporciona rigor y homogeneidad a la observación.
d. El adiestramiento y entrenamiento del observador, conlafinalidad de con-
seguir y mantener el aprendizaje, por parte del observador, del sistema de categorías
del manual de instrucciones y disponer de este modo de un instrumento que per-
mita la objetividad en la medida. Tener en cuenta estos requisitos y evitar O reducir
los posibles errores del observador es velar por la fiabilidad de los datos.
Por lo que se refiere a los sesgos de la observación, éstos pueden resumirse en la

noción de reactividad o cambios que puede sufrir la conducta de un individuo cuan-
do desempeña el papel de sujeto en una investigación psicológica (Behar y Riba,
1993). Se trata de una noción propia y exclusiva de las ciencias delcomportamiento.
puesto
Kazdin (1977), Kent y Foster (1977) y Baum, Forehand y Zegiob (1979) han
334 Viceng Quera y Júlia Behar
en evidencia que la conducta de los sujetos observados es cualitativaycuantitativa-

mente distinta a la que se hubiese producido si el observador no hubiese estado pre-
sente, y el sujeto no se hubiese sentido observado (]acob, Tennenbaum y Krahn,
1987). Según Behar y Riba (1993), la reactividad viene modificada por diversos fac-
tores: el ambiente, los sujetos y la conducta. Las configuraciones ambientales com-
plejas, en las que el observador desarrolla su tarea habitualmente, suscitan reactivi-
dad cuando se produce algún tipo de cambio en sus elementos. El mismo
observador forma parte de estas configuraciones ambientales y en función de sus ca-
racterísticas personales, de sus rasgos físicos —como talla, peso, edad, sexo, etnia—
y psicológicos, afecta de forma distinta al sujeto observado y da lugar a mayor o me-
nor reactividad. No todos los sujetos presentan igual grado de reactividad, debido a
sus rasgos de personalidad y a sus experiencias previas. La reactividad comporta re-
sistencias del sujeto observado que lo llevan a inhibirse, sobreactuar o engañar. Ási-
mismo, unas conductas son más sensibles que otras a la reactividad. Las conductas
automáticas o involuntarias, las inducidas por mediadores hormonales, los hábitos,
etc., presentan una reactividad prácticamente nula. Por el contrario, la conducta vo-
luntaria, especialmente la verbal, con un objetivo preciso, es más sensible a la reacti-
vidad. La reactividad puede manifestarse en forma de conductas nuevas, que no for-
maban parte de las variables dependientes o del sistema de categorías previsto, o bien
en la desaparición de conductas previas y esperadas en el contexto de la observación.
En todo caso la reactividad no afecta únicamente a las frecuencias y a las tasas de las
conductas sino que pueden modificar su latencia y su duración.
Es posible minimizar el sesgo de reactividad:
a. Haciendo que el observador permanezca oculto, o bien que sepa inspirar

confianza al sujeto observado para que éste se comporte de forma sincera y natural.
b. Manteniendo al sujeto observado en la ignorancia del objetivo real de la in-
vestigación.
c. Consiguiendo que el observador pase a ser un observador olvidado, es decir,
que el sujeto observado llegue a habituarse a su presencia. La utilización de estos pro-
cedimientos no reactivos, especialmente el del observador oculto, está asociada a cues-
tiones éticas que pueden resumirse en el derecho de cualquier persona a no ser objeto
de una observación, al igual que ocurre en cualquier investigación con humanos.
V. CLASES DE ANÁLISIS DE DATOS
La elección de una técnica concreta de análisis de datos observacionales depende de

la clase de hipótesis que se desee verificar y de la escala de medida en la que se hayan
expresado las variables. Podemos distinguir dos clases de análisis de datos en este
contexto (Quera, 1986, 1993), que son complementarios porque hacen posible des-
cubrir distintos tipos de relaciones o regularidades en los datos:
a. Macroanálisis. Las variables conductuales implicadas en las hipótesis están

expresadas en forma de frecuencias, duraciones, tasas, etc., es decir, medidas “globa-
La observación $03
les” y “estáticas” en general. El término “global” se refiere al hecho de que dichas

medidas son “resúmenes” de sesiones de observación, y para calcular sus valores no
es necesario conocer la secuencia de códigos a lo largo de la misma. Como técnicas
estadísticas aplicables pueden citarse los contrastes de medias, la correlación, el aná-
lisis de covariancia, el análisis de agrupamiento, el análisis factorial, etc. (véase Gott-
man, 1978), técnicas también utilizadas para analizar datos obtenidos mediante otras
metodologías.
La hipótesis «¿los niños de 5 años invierten mayor cantidad de tiempo en juego
paralelo que los niños de 4 años?» puede ponerse a prueba a través de un macroaná-
lisis; esta hipótesis relaciona una variable de sujeto, la edad, con una variable conduc-
tual, el juego paralelo (Bakeman y Gottman, 1997), la cual se expresa en forma de
duración, o mejor, la duración relativa o prevalencia. Para contrastar esta hipótesis
compararíamos las duraciones relativas de la conducta “juego paralelo”, obtenida a
lo largo de unas sesiones de observación, en dos grupos de niños, uno de 4 años y
otro de 5. La técnica estadística concreta podría ser, por ejemplo, el cálculo de un
contraste + de Student entre los valores medios de las duraciones relativas de los dos
grupos. Otro ejemplo de macroanálisis es el siguiente. Supóngase que las variables
de una investigación sobre la interacción materno-filial son “primiparidad”, “pre-
maturidad”, “tasa de vocalizaciones de la madre” y “tasa de lloro del bebé”. Ade-
más, ambas tasas han sido obtenidas para cada pareja madre-hijo en dos puntos tem-
porales, al final de la primera semana y al final de la cuarta semana de vida del bebé.
Por tanto, en conjunto existen variables, cuatro de ellas conductuales, acerca de cu-
yas relaciones binarias, ternarias, etc., es posible formular hipótesis. Puesto que estas
variables conductuales se evalúan en forma de tasas, se trata de un macroanálisis.
Una de las hipótesis que podrían plantearse es «cuanto mayor es la tasa de vocaliza-
ción de la madre en la primera semana, menor es la tasa de lloro del bebé en la cuar-
ta». Otra hipótesis es «en las madres no primíparas, cuanto mayor es la tasa de voca-
lización de la madre en la primera semana, menor es la tasa de lloro del bebé en la
cuarta, mientras que en las madres primíparas dichas variables no están relaciona-
das». Estas hipótesis podrían ponerse a prueba calculando las correlaciones entre las
variables conductuales a partir de los datos de una muestra de parejas madre-hio.
En ambos casos, se trataría de un análisis longitudinal, pues se estaría averiguando la
relación que existe entre variables evaluadas en puntos temporales diferentes.
b. Microanálisis. Las variables conductuales están evaluadas en forma de fre-
cuencias de transición, absolutas o relativas, o de frecuencias de coocurrencia, todas
ellas medidas “dinámicas”, esto es, que expresan el cambio conductual dentro de la
sesión de observación (Kaye, 1982). Las técnicas estadísticas aplicables en este caso
se engloban bajo el epígrafe de “análisis secuencial”, y se basan en la aplicación de la
teoría de los procesos estocásticos y de contrastes para tablas de contingencia bio
multivariadas (estadísticos chi-cuadrado, modelos log-lineales) (Gottman y Roy,
1990). He aquí un ejemplo de microanálisis. Las variables de una investigación acer-
ca de la interacción verbal en parejas son “tipo de pareja” (con dos valores, proble-
mática” y “no problemática”), “intervención positiva del hombre”, “intervención
neutra del hombre”, “intervención negativa del hombre”, “intervención positiva de
DES
la mujer”, “intervención neutra de la mujer”, “intervención negativa de la mujer”.

al es, por
Una hipótesis para cuya contrastación es necesario el análisis secuenci
ejemplo, «¿las parejas problemáticas tienen más reciprocidad negativa que positiva,
al contrario de las no problemáticas, que tienen más reciprocidad positiva que nega-
tiva?». La reciprocidad negativa puede definirse como la tendencia de cada miembro
de la pareja a intervenir negativamente después de que el otro miembro haya interve-
nido negativamente, y la reciprocidad positiva, como la tendencia a intervenir positi-
vamente después de una intervención positiva. Para contrastar dichas hipótesis de-
beríamos obtener las frecuencias de transición entre los códigos conductuales
definidos para el hombre y la mujer, en nuestras parejas problemáticas y no proble-
máticas a lo largo de un conjunto de sesiones de observación. Estas frecuencias po-
drían disponerse en una tabla de contingencia de tres dimensiones: A (“tipo de pare-
ja”) x B (“tipo de conducta antes de la transición”) x C (“tipo de conducta después
de la transición”), donde cada una de estas dos últimas variables tiene dos valores,
“intervención positiva (del hombre o de la mujer)” o “intervención negativa (del
hombre o de la mujer)”. Por tanto, se trataría de una tabla de contingencia con
2x2 x 2 =8 casillas, con la que es posible evaluar el ajuste de un modelo log-lineal
acorde con la hipótesis, mediante un contraste chi-cuadrado. El análisis secuencial es
pues la técnica adecuada cuando las variables implicadas en la hipótesis son códigos
conductuales registrados en secuencia. Se trata de una técnica que ha sido objeto de
una atención especial por parte de los investigadores durante los últimos años. El
lector interesado tanto en los fundamentos metodológicos y estadísticos del análisis
secuencial como en el tratamiento informático de los datos secuenciales puede con-
sultar los textos de Van Hooff (1982), Gottman y Roy (1990), Bakeman y Quera
(1992, 1995a, 1995b), Quera (1993), Bakeman, Robinson y Quera (1996) y Bakeman
y Gottman (1997).
VI. ÁREAS DE APLICACIÓN DE LA METODOLOGÍA OBSERVACIONAL
Las áreas de aplicación de la metodología observacional son tantas como los ámbitos
de actuación de la psicología. En tanto que la metodología observacional se ocupa de
la conducta espontánea tal como ésta se produce, los únicos límites vienen marcados
por el propio repertorio conductual, humano o animal y por la privacidad de deter-
minadas conductas. Existen investigaciones en el marco familiar, como la de Bake-
man y Brown (1977) que analiza la interacción madre-hijo, o la de Noack (1992) que
estudia las relaciones que se establecen durante la primera adolescencia con los pa-
dres y con los iguales; en el marco escolar, sobre el rendimiento académico (Huston-
Stein, Friedrick-Coffer y Susman, 1977), sobre el desarrollo del lenguaje, la adapta-
ción escolar en niños de preescolar (Zazzo, 1978), la interacción con iguales en la
adolescencia durante la hora de recreo (Behar, 1987); en instituciones penitenciarias
se ha utilizado para evaluar la evolución individual y grupal en un programa para
tratar conductas adictivas (Pleite e Ibern, 1991). Abikoff, Gittelman y Klein (1980)
desarrollaron un sistema de codificación para la observación en el aula de la conduc-
ta de niños hiperactivos entre 6 y 12 años. Se consideraron hiperactivos aquellos ni-
ños alos que el maestro y los padres valoraban como tales y que no presentaban nin-
gún otro diagnóstico psiquiátrico. En total fueron observados 57 chicos y 4 chicas
La observación
337
con estas características, con una media de edad de 8 años, 4 meses y una desviación
upo de 1 año y 4 meses. Asimismo, se observó un número igual de niños no hiperci-
néticos del mismo nivel escolar, para proceder a la comparación con los anteriores.
Se utilizó un sistema de codificación de 11 categorías conductuales y la observación
se realizó durante situaciones estructuradas de explicación del profesor y durante
períodos de trabajo académico independiente bajo la supervisión del profesor. Cada
niño fue observado al menos en tres sesiones de 16 minutos cada una. Los datos fue-
ron recogidos por cuatro observadores que desconocían el objetivo de la investiga-
ción y las características clínicas de los sujetos estudiados. Para evitar la reactividad,
los observadores se situaban siempre al final del aula, en ángulo con los sujetos a ob-
servar, para disponer de una vista de perfil de los mismos, pero estar fuera de su área
de visión. Se obtuvo una mayor frecuencia en los niños hiperactivos que en el grupo
control de todas las categorías de observación consideradas, como agresión verbal a
los compañeros, agresión verbal al profesor o permanecer fuera de la silla.
Para dar respuesta a la pregunta de si los padres proporcionan diferente sociali-
zación a niños y niñas, Fagot y Hagan (1991) realizaron una investigación observa-
cional. La muestra estaba formada por 50 niños y 42 niñas de 12 meses, al inicio de la
observación, y 42 niños y 40 niñas de 18 meses, también al iniciar la observación.
Diez de los niños de 12 meses y doce de los niños de 18 meses vivían sólo con la ma-
dre, y el resto pertenecía a familias con padres casados o que vivían juntos, en pro-
medio, desde hacía 4 años. Los datos se recogieron en casa de las familias, al volver el
niño de la guardería, y cuando todos los miembros de la familia estaban presentes. A
éstos se les pedía que no miraran la televisión, que atendieran al teléfono con la ma-
yor brevedad posible, y que actuasen con la máxima normalidad. Para cada niño se
realizaron cuatro sesiones de observación de una hora cada una. El sistema de cate-
gorías incluía cinco secciones diferenciadas: categorías de contexto o de actividades,
categorías interactivas, receptores, reactores y reacciones. El niño era siempre el ob-
jetivo de la observación. Se codificaba la actividad del niño y su interacción, y a con-
tinuación el receptor de dicha interacción, el sujeto que reaccionaba y el tipo de reac-
ción. Los observadores fueron adiestrados en el sistema de categorías durante un
período antes de iniciar la recogida de datos, y para ser considerados fiables debían
alcanzar un grado de concordancia del 90% (proporción de concordancia no corre-
gida por el efecto del azar). Debido a la baja frecuencia de algunas de las conductas
observadas en los niños se hicieron agrupaciones de las mismas: conductas motrices
amplias, juegos típicos de niños y de niñas, comunicación con los adultos y conduc-
tas agresivas. Por su parte, las categorías de reacciones se agruparon en respuestas
instructivas, respuestas positivas y respuestas negativas. Asimismo, se realizaron
agrupaciones empíricas de aquellas conductas que ofrecían diferencias significativas
entre niños y niñas. De entre los resultados que se obtuvieron cabe destacar los si-
guientes. Los padres tenían reacciones diferentes ante niños y niñas, con reacciones
más positivas ante los niños cuando éstos desarrollaban conductas agresivas y cuan-
do jugaban con juguetes típicamente masculinos. Las madres presentaban reaccio-
nes más positivas que los padres hacia los juguetes típicamente femeninos. Ásimis-
mo, los niños recibían reacciones más negativas que las niñas cuando intentaban
comunicarse; los niños recibían reacciones más positivas al jugar con juguetes típica-
mente masculinos, y al realizar conductas agresivas. Las niñas recibían respuestas
más positivas por intentar comunicarse. A pesar de la diversidad de las aplicaciones

reseñadas, se constata que en ellas los datos se obtienen directamente de la realidad,
sin utilización de instrumentos intermediarios, y que se siguen las fases propias del
método científico. Al mismo tiempo, presentan características propias y diferencia-
les respecto a otras metodologías, como la elaboración del sistema de categorías, el
adiestramiento de los observadores y el control de los sesgos del observador y de la
observación.
Abikoff, H., Gittelman, R. y Klein, D. F. (1980). Classroom observation code for hyperactive
children: A replication of validity. Joxrnal of Consulting and Clinical Psychology, 48, 555-
565.
Altmamn, J. (1974). Observational study of behavior: Sampling methods. Behaviour, 49, 227-
267.
Anguera, M. T. (1981). La observación (I): Problemas metodológicos. En R. Fernández-Ba-
lesteros y J. A. Carrobles (dirs.), Evaluación conductual: metodología y aplicaciones. Ma-
drid. Pirámide.
Anguera, M. T. (1985). Metodología de la observación en las ciencias humanas (3* ed.). Ma-
drid. Cátedra.
Anguera, M. T. (1991). Proceso de categorización. En M. T. Anguera (dir.), Metodología ob-
servacional en la investigación psicológica (vol. 1). Barcelona. PPU.
Ary, D. y Suen, H. K. (1983). The use of momentary time sampling to assess both frequency
and duration of behavior. Journal of Behavioral Assessment, 5, 143-150.
Bakeman, R. (1997). Behavioral observations and coding. En H. T. Reis y C. K. Judd (dirs.),
Handbook of research methods in social psychology. Nueva York. Cambridge University
Press.
Bakeman, R. y Brown, J. V. (1977). Behavioral dialogues: An approach to the assessment of
mother-infant interaction. Child Development, 48, 195-203.
Bakeman, R. y Gottman, J. M. (1987). Applying observational methods: A systematic re-
o En J. D. Osofsky (dir.), Handbook of Infant Development (2* ed.). Nueva York.
Wiley.
Bakeman, R. y Gottman, J. M. (1997). Observing interaction: An introduction to sequential
analysis (2* ed.). Nueva York. Cambridge University Press.
Bakeman, R. y Quera, V. (1992). SDIS: A sequential data interchange standard. Behavior Re-
search Methods, Instruments, E Computers, 24, 554-559.
Bakeman, R. y Quera, V. (19954). Analyzing interaction: Sequential analysis with SDIS and
GSEQ. Nueva York. Cambridge University Press.
Bakeman, R. y Quera, V. (1995b). Log-linear approaches to lag-sequential analysis when
consecutive codes may and cannot repeat. Psychological Bulletin, 118, 272-284.
Bakeman, R., Robinson, B. F. y Quera, V. (1996). Testing sequential association: Estimating
p values using sampled permutations. Psychological Methods, 1, 4-15.
Barrett, B. H., Johnston, J. M. y Pennypacker, H. S. (1986). Behavior: Its units, dimensions,
and measurements. En R. O. Nelson y S. C. Hayes (dirs.), Conceptual foundations of be-
havioral assessment. Nueva York. Guilford Press.
La observación
339
Baum, C. G., Forehand, R. y Zegiob, L. E. (1979). A review of observer reactivity in adult-

child interactions. Journal of Behavioral Assessment, 1, 167-178.
Behar, J. (1987). La interacción con iguales en la adolescencia. Estudio observacional. Comu-
nicación presentada en el II Congreso de Evaluación Psicológica. Madrid, España.
Behar, J. (1991). Observación y análisis de la producción verbal de la conducta. En M. T. An-
cia (dir.), Metodología observacional en la investigación psicológica (vol. 1). Barcelona.
Behar, J. y Riba, C. (1993). Sesgos del observador y de la observación. En M. T. Anguera

(dir.), Metodología observacional en la investigación psicológica (vol. 11). Barcelona. PPU.
Castellan, N. J. (1979). The analysis of behavior sequences. En R. B. Cairns (dir.), The analy-
sis of social interactions. Hillsdale. Lawrence Erlbaum.
Cohen, J. (1960). A coefficient of agreement for nominal scales. Educational and Psychologi-
cal Measurement, 20, 37-46.
Cone, J. D. (1982). Validity of direct observation assessment procedures. En D. P. Hartmann
(dir.), Using observers to study behavior. San Francisco. Jossey Bass.
Fagot, B. I. y Hagan, R. (1991). Observation of parent reactions to sex-stereotyped beha-
viors: Age and sex effects. Child Development, 62, 617-628.
Fassnacht, G. (1982). Theory and practice of observing behavior. Londres. Academic Press.
Foster, S. L. y Cone, J. D. (1980). Current issues in direct observation. Behavioral Assess-
ment, 2, 313-338.
Erick, T. y Semmel, M. I. (1978). Observer agreement and reliabilities of classroom observa-
tional measures. Review of Educational Research, 48, 157-184.
Gottman,J.M. (1978). Nonsequential analysis techniques in observational research. En G. P.
Sackett (dir.), Observing behavior (vol. 11): Data collection and analysis methods. Balti-
more. University Park Press.
Gottman, J. M. y Roy, A. K. (1990). Sequential analysis. A guide for behavioral scientists.
Nueva York. Cambridge University Press.
Green, S. B., McCoy,J.F., Burns, R. P. y Smith, A. C. (1982). Accuracy of observational data
with whole interval, partial interval and momentary time-sampling recording techniques.
Journal of Behavioral Assessment, 4, 103-118.
Hanley, J. A. (1987). Standard error of the kappa statistic. Psychological Bulletin, 102, 315-
$21
Hansen, E. W. (1966). The development of maternal and infant behavior in the rhesus mon-
key. Behaviour, 27, 107-149.
Hartmann, D. P. (1977). Considerations in the choice of interobserver reliability estimates.
Journal ofApplied Behavior Analysis, 10, 103-116.
Hawkins, R. P. (1982). Developing a behavior code. En D. P. Hartmann (dir.), Using obser-
vers to study behavior. San Francisco. Jossey Bass. y
House, B. J. y House A. E. (1979). Frequency, complexity, and clarity as covariates of obser-
ver reliability. Journal of Behavioral Assessment, 1, 149-165.
Huston-Stein, A., Friedrick-Coffer, L. y Susman, E. J. (1977). The relation of classroom
structure to social behavior, imaginative play and self-regulation of economically disad-
vantaged children. Child Development, 48, 908-916. 907) Y cr
Hutt, S. J. y Hutt, C. (1970). Direct observation and measurement of behavior. Springfield.
C. Thomas.
Jacob, T., Tennenbaum, D. L. y Krahn, G. (1987). Factors influencing the reliability and vali-
dity of observation data. En T. Jacob (dir.), Family interaction and psychopatholog). Theo-
ries, methods and findings. Nueva York. Plenum Press.
Johnston, J. M. y Pennypacker, J. M. (1980). Strategies and tactics of human behavioral re-
search. Hillsdale (NJ). Lawrence Erlbaum. 0.
Julien, D., Markman, H. J., Lindahl, K., Johnson, H. M. y Van Videnfelt, B. (1989). Interac-
" tional Dimensions Coding System. Researchers? Mannal. Denver. University of Denver.
Kaye, K. (1982). The moral philosophy of microanalysis. En T. Field y A. Fogel (dirs.), Emo-
tion and early interaction. Hillsdale. Lawrence Erlbaum. : EA
Kazdin, A. E. (1977). Artifact, bias and complexity of assessment: The ABC's of reliability.
Journal ofApplied Behavior Analysis, 10, 141-150. ce
Kent, R. N. y Foster, S. L. (1997). Direct observational procedures: Methodological issues in
naturalistic settings. En A. R: Ciminero, K. S. Calhoun y H. E. Adams (dirs.), Handbook
of behavioral assessment. Nueva York. Wiley. ' . ,
Klesges, R. C., Woolfrey, J. y Vollmer, J. (1985). An evaluation of time sampling versus con-
tinous observation data collection. Journal of Behavioral Therapy and Experimental Psy-
chiatry, 16, 303-307.
Landis, J. R. (1975). A general methodology for the measurement of the observer agreement
when the data are categorial. (Institute of Statistics, Mimeo Series No. 1022). Chapel Hill.
University of North Carolina. ;
León, O. G. y Montero, 1. (1995). Diseño de investigaciones: introducción a la lógica de la in-
vestigación en psicología y educación. Madrid. McGraw-Hill.
Martin, P. y Bateson, P. (1986). Measuring behaviour: An introductory guide. Londres. Cam-
bridge University Press.
Mash, E. J. yMcElwee,J.M. (1974). Situational effects on observer accuracy: Behavioral pre-
dictability, prior experience and complexity of coding categories. Child Development, 45,
367-377.
McRae, S. (1995). Modelos y métodos para las ciencias del comportamiento. Barcelona. Ariel.
Mehm, J. G. y Knutson, J. F. (1987). A comparison of event and interval strategies for obser-
vational data analysis and assessment of observer agreement. Behavioral Assessment, 9,
151-167. 1
Muchielli, R. (1974). L'observation psychologique et psychosociologique. Librairies Techni-
ques Les Editions ESF.
Noack, P. (1992). Parent-child relationships in early adolescence: Interpersonal interactions
and perceived relationship quality. Comunicación presentada en el Third European
Workshop on Adolescence. Bolonia, Italia.
Noldus, L. P. J. J. (1992). The Observer: A software system for collection and analysis of ob-
servational data. Behavior Research Methods, Instruments, and Computers, 23, 415-429.
Pleite, A. e Ibern, 1. (1991). Registro de evaluación de hechos. Un modelo de evaluación e in-
tervención conductual en prisiones. Comunicación presentada en el II Congreso Interna-
cional Latini Dios. Sitges, Barcelona.
Powell, J., Martindale, A. y Kulp, S. (1975). An evaluation of time sampling measures of be-
havior. Journal ofApplied Behavior Analysis, 8, 463-469.
Quera, V. (1986). Micro-análisis de la conducta interactiva: una aplicación a la interacción
materno-filial en chimpancés. Tesis doctoral inédita. Universidad de Barcelona.
Quera, V. (1989). Estimación de frecuencia y duración en el muestreo temporal de la conduc-
ta. Anuario de Psicología, 43, 33-62.
Quera, V. (1990). A generalized technique to estimate frequency and duration in time sam-
pling. Behavioral Assessment, 12, 409-424.
Quera, V. (1991). Muestreo y registro observacional. En M. T. Anguera (dir.), Metodología
observacional en la investigación psicológica (vol. 1). Barcelona. PPU.
Quera, V. (1993). Análisis secuencial. En M. T. Anguera (dir.), Metodología observacional en
la investigación psicológica (vol. 11). Barcelona. PPU.
Rosenblum, L. A. (1978). The creation of a behavioral taxonomy. En G. P. Sackett (dir.), Ob-
seas behavior (vol. 11): Data collection and analysis methods. Baltimore. University
ark Press.
Rosenthal, R. (1967). Covert communication in the phsychological experiment. Psychologi-
cal Bulletin, 67, 357-367.
Sackett, G. P. (1978). Measurement in observational research. En G. P. Sackett (dir.), Obser-
La observación 3%
e behavior (vol. 11): Data collection and analysis methods. Baltimore. University Park
ress.
Sackett, G. P., Ruppenthal, G. C. y Gluck, J. (1978). An overview of methodological and sta-
tustical problems is observational research. En G. P. Sackett (dir.), Observing behavior
(vol. 11): Data collection and analysis methods. Baltimore. University Park Press.
Schleidt, W. M. (1982). Stereotyped features variables are essential constituents of behavior
patterns. Behaviour, 69, 231-238.
Suen, H. K. (1988). Agreement, reliability, accuracy, and validity: Toward a clarification. Be-
Suen, H. K. y Ary, D. (1986). A post hoc correction procedure for systematic errors in time
sampling duration estimates. Jonrnal of Psychopathology and Behavioral Assessment, 8,
31-38.
Suen, H. K. y Ary, D. (1989). Analyzing quantitative behavioral observation data. Hillsdale.
Lawrence Erlbaum.
Sulzer-Azarof, B. y Reese, E. P. (1982). Analyzing behavior analysis: A program for develo-
ping professional competence. Nueva York. Rinehart and Winston.
Van Hooff,J.A. R. A. M. (1982). Categories and sequences of behavior: Methods of descrip-
tion and analysis. En K. R. Scherer e L Vine (dirs.), Handbook of methods in nonverbal
behavior research. Cambridge. Cambridge University Press.
Wallace, C. P. y Elder, J. P. (1980). Statistics to evaluate measurement accuracy and treate-
ment effects in single subject research designs. En M. Hersen, R. M. Eisler y P. M. Miller
(dirs.), Progress in behavior modification (vol. 10). Nueva York. Academic Press.
Weick, K. E. (1968). Systematic observational methods. En G. Lindzey y E. Aronson (dirs.),
Handbook of social psychology (vol. 2). Reading. Addison-Wesley.
Weiss, R. L. (1985). MICS-111. Marital Interaction Coding System. Oregón. University of
Oregon.
Wright H. F. (1960). Observational child study. En P. H. Mussen (dir.), Handbook of re-
search methods in child development. Nueva York. Wiley.
Yarrow, W. R. y Waxler, C. Z. (1979). Observing interaction: Confrontation with methodo-
logy. En R. B. Cairns (dir.), The analysis of social interactions. Hillsdale (NJ). Lawrence
Erlbaum.
Zazzo, B. (1978). La adaptación escolar: un estudio experimental. Infancia y Aprendizaje, 1,
41-65.
Anguera, M. T. (dir.) (1991). Metodología observacional en la investigación psicológica

(vol. 1). Barcelona. PPU. e A
Anguera, M. T. (dir.) (1993). Metodología observacional en la investigación psicológica
(vol. 2). Barcelona. PPU. M ra
Bakeman, R. y Gottman,J.M. (1989). Observación de la interacción. Introducción al análisis
secuencial. Madrid. Morata. | Pa
Bakeman, R. y Quera, V. (1993). Analyzing interaction: Sequential analysis using SDIS and
GSEQ. Nueva York. Cambridge University Press. : e
Gottman, J. M. y Roy, A. K. (1990). Sequential analysis. A guide for behavioral scientists.
Nueva York. Cambridge University Press. >
Martin, P. y Bateson, P. (1991). La medición del comportamiento. Madrid. Alianza.
Suen, H. K. y Ary, D. (1989). Analyzing quantitative behavioral observation data. Hillsdale.
Lawrence Erlbaum.
A
j pa
a id
AS, a
o e
TS
A
es FRA O E ÓN > ql E, A - ds!

( e
pp edo
A
An pREDIZA
n 4 >.
Pie IDEA A
pt
w AA A
ATA,
E
ao e pone Comunica ida pressenada Mega Ñ
La castusnoo Ote o
ce
ts Anal) brainCAAd
TA
CON
MOTO ÚS ¡aer Aaci AA
o a SA man
A AO Y 1 temer rmedo e ch e.Al, TM

o mas FA UE
bros ni sarrcind A a
Nay Ue e IL m WAN PRA E aNy 00 y A arca
st Adi O tip
0 ad ar Da Mé (A AR ML ro
Ci ri ES rr
0 ERA dt rca Dai ARA
UA od CIAO | Lv,A out
, DE FÍA Rologca Ivo
coeh EaE,Pide (dión; Oleo.
16. LA AUTOOBSERVACIÓN
JAMES D. HERBERT Y ROSEMERY O. NELSON-GRAY
L INTRODUCCIÓN Y DEFINICIONES
Desde el principio la evaluación conductual ha estado asociada al modelo conduc-

tual tanto en la teoría como en su práctica. En su nivel más esencial, la evaluación
conductual intenta proporcionar datos útiles que faciliten la mejora del funciona-
miento del paciente por la reducción de las conductas problemáticas, el aumento de
las conductas de adaptación, o los dos aspectos. La evaluación se concibe como un
proceso en curso que informa y depende del resultado del tratamiento.
Una de las bases de la evaluación conductual es el procedimiento de la autoob-
servación o autorregistro, el cual se refiere al sujeto que observa y recoge las veces
que tienen lugar sus conductas '. La conducta se refiere a cualquier cosa que hace el
paciente, lo que incluye acciones motoras externas y sucesos cognitivos internos
(por ejemplo, una preocupación excesiva) que son objeto de tratamiento. El autorre-
gistro se emplea con fines de evaluación y terapéuticos. Cuando se recogen datos de
evaluación por medio de un autorregistro, su exactitud es una cuestión importante.
Una parte de este capítulo proporciona ejemplos de la exactitud variable del autorre-
gistro y describe procedimientos que la aumentan. Cuando se emplea el autorregis-
tro con propósitos terapéuticos, su reactividad también es importante; así, otra parte
de este capítulo describe las variables que afectan a la reactividad.
Gran parte de la investigación básica del procedimiento de autorregistro se reali-
zó en la década de los setenta. Aunque la investigación en esta técnica ha disminuido
desde entonces, se ha producido una explosión en sus aplicaciones clínicas. El auto-
rregistro se ha aplicado a la evaluación de una amplia gama de trastornos de la con-
ducta, incluyendo la conducta antisocial (Becker y Heimberg, 1988), trastornos de
ansiedad (Nietzel, Bernstein y Russell, 1988), trastornos alimenticios (Schlundt,
Johnson yJarrell, 1985), el síndrome de Tourette (Peterson y Azrin, 1992) y el abuso
de alcohol (Samo, Tucker y Vuchinich, 1989; Sobell y cols., 1989). Más aún, el auto-
rregistro se ha convertido en un componente más en muchos de los programas de te-
rapia y evaluación conductual.
Esta popularidad es congruente con varias líneas de la terapia de conducta con-
temporánea. Un sello característico de ésta es su énfasis en el empirismo. Una fuente
Hahnemann University (EE UU) y University of North Carolina at Greensboro (EE UU).
1 Tal como se usa en este capítulo, el término autorregistro se refiere al procedimiento asociado al
enfoque conductual de la evaluación clínica, que consiste en discriminar y registrar la presencia de una
conducta propia. En los últimos quince años, los psicólogos sociales han empleado el término “autorre-
gistro” de forma muy distinta para describir un tipo de personalidad asociado a una gran preocupación
por adaptar el modo de presentación de uno mismo a las situaciones sociales (Snyder y Gangestad, 1986;
Gangestad y Snyder, 1991).
344 James D. Herbert y Rosemery O. Nelson-Gray
primaria de datos de inferencia relativamente baja lo constituyen las observaciones

de informadores independientes entrenados. Esto es especialmente cierto cuando la
conducta es privada, como la conducta sexual. Las observaciones de informadores
entrenados son, por supuesto, imposibles con conductas cognitivas. Una alternativa
a los observadores es la recogida de datos por el propio paciente. En teoría, los auto-
informadores pueden ser capaces de proporcionar datos más completos que los ob-
servadores porque son testigos de todo el conjunto de conductas, en contraste con la
muestra que presencian los observadores (Kazdin, 1974a).
Tres tendencias relacionadas de la terapia conductual marcan la importancia del
autorregistro: el crecimiento de programas de autocontrol, el crecimiento de la te-
rapia cognitiva y la expansión de la evaluación conductual tradicional para incluir
focos simultáneos de varias conductas (Barrios, 1988). Con relación a los comien-
zos de la terapia de conducta, estos tres desarrollos representan una relativa dismi-
nución del control de agentes externos. El autorregistro es una característica clave
de todos los programas de autocontrol. Como se ha observado antes, los procedi-
mientos de la terapia cognitiva están condicionados por su propia naturaleza a ba-
sarse en las propias observaciones. Se está dando una tendencia en terapia conduc-
tual hacia la selección de las conductas más significativas clínicamente, más que
basar la selección de conductas en lo que es más cómodo para el terapeuta. Esto da
lugar con frecuencia a la atención simultánea a objetivos de tratamiento múltiples.
Muchas conductas significativas son internas (por ejemplo, cogniciones autodes-
preciativas en el caso de la depresión), y que por tanto requieren algún tipo de
autorregistro y autoinforme.
El autorregistro es un proceso que incluye dos fases; en primer lugar, el sujeto o
paciente debe observar o discriminar aspectos de su propia conducta, esto es, deter-
minar que la conducta en efecto ha ocurrido y, en segundo lugar, debe responder con
el autorregistro, esto es, emplear el procedimiento que recoge los casos de una con-
ducta determinada. El autoinformador debe realizar ambas cosas para producir auto-
rregistros exactos. El hecho de realizar tan sólo la primera conducta ya puede provo-
car cambios conductuales. A efectos de investigación, teóricos y clínicos, es útil
tener presente que el autorregistro tiene dos fases distintas (Simkins, 1971).
Il. FUNCIONES DEL AUTORREGISTRO
El autorregistro es útil tanto para la evaluación como para fines terapéuticos. Con
respecto a la evaluación, el autorregistro puede emplearse para obtener datos duran-
te dos fases del contacto terapéutico. Durante la primera fase, es importante deter-
minar las conductas y sus variables dominantes. Se pide al paciente que realice un
diario de conductas, anotando los sucesos problemáticos y las circunstancias que los
rodean. A partir de esta información, se pueden establecer patrones consistentes que
conduzcan a la selección de conductas y posibles técnicas de tratamiento. En la fase
siguiente de contacto terapéutico, el autorregistro se vuelve a emplear en la línea base
e intervención para registrar la frecuencia de las conductas seleccionadas para eva-
luar el éxito o fracaso del tratamiento.
La autoobservación
345
Además de las funciones de evaluación, el autorregistro tiene generalmente una

función terapéutica. Cuando se emplea para la obtención de datos, el procedimiento
de autorregistro no sólo proporciona la frecuencia de la conducta sino que puede
dar lugar a cambios en la misma. En otras palabras, el hecho mismo de autorregistrar
una conducta hace a menudo que cambie la frecuencia de esa conducta. Esta reactivi-
dad demuestra ser terapéutica porque los cambios de conducta que tienen lugar lo
hacen en la dirección deseada. Por medio del autorregistro, las conductas evaluadas
positivamente aumentan y, por el contrario, las evaluadas negativamente disminu-
yen (Broden, Hall y Mitts, 1971; Kazdin, 1974a; Cavior y Marabotto, 1976; Nelson,
Lipinski y Black, 1976; Sieck y McFall, 1976). Dado lo deseable de estos cambios de
las conductas, el autorregistro ha sido empleado principalmente con fines terapéuti-
cos, esto es, alterar la frecuencia de una conducta. Aunque la reactividad del autorre-
gistro puede ser útil terapéuticamente, también es un condicionante cuando está en
juego la exactitud de los datos. Se hace muy difícil obtener unos datos de línea base
estables cuando la frecuencia de la conducta es cambiante. Igualmente, es difícil eva-
luar la eficacia de una técnica de tratamiento cuando tanto la técnica como los proce-
dimientos de obtención de datos contribuyen al cambio de la conducta. Las dos fun-
ciones del autorregistro, terapia y evaluación, son examinadas con más detalle en el
resto de este capítulo.
TI. PROCEDIMIENTOS DE AUTORREGISTRO
No hay suficientes investigaciones que proporcionen directrices firmes acerca de los

procedimientos e instrumentos más útiles de autorregistro. La discusión que sigue
se basa por tanto en prácticas frecuentes y en meditadas especulaciones. En primer
lugar, discutiremos algunas directrices generales para la selección del procedimiento
de autorregistro y, a continuación, describiremos varios métodos.
Una de las consideraciones más importantes en la selección de un procedimiento
de autorregistro es que se ajuste a la conducta que se registra. Por ejemplo, si se pide
a un paciente que autorregistre una conducta de gran frecuencia o cas! continua por
medio de registros de frecuencia es probable que deje de hacerlo por lo tedioso que
resulta la tarea. En este caso, un procedimiento de muestreo temporal probablemen-
te sería más recomendable. Del mismo modo, un paciente obeso al que se pide que
autorregistre sólo el peso diario puede desalentarse por las típicas fluctuaciones y e
lento avance; así, la ingestión de calorías puede ser una conducta más apropiada para
pacientes obesos (Romanczyk, 1974).
Otros factores a considerar en la elección del procedimiento de autorregistro son
la comodidad y accesibilidad. Como se ha observado, el autorregistro tiene dos fases
(discriminar y registrar las veces que ocurre una conducta). Si el procedimiento de
autorregistro es demasiado difícil, el paciente puede discriminar casos de la conducta
pero fracasar al dar la respuesta del autorregistro, con el resultado de una mínima
exactitud. Alternativamente, el paciente puede “almacenar” los casos de la conducta
y registrarlos sólo aperiódicamente. Frederiksen, Epsten y Kosevsky (1975) descu-
brieron que los autorregistros inmediatos de los cigarrillos fumados eran más exac-
tos y ocasionaban mayor reducción en la conducta de fumar que los autorregistros

nocturnos o semanales.
Finalmente, ha de considerarse el coste y lo llamativo del procedimiento como
factores de selección del tipo de autorregistro. La mayoría de los instrumentos im-
plica pocos costos económicos, de hecho, los medios más corrientes consisten sim-
plemente en la anotación de los casos de una conducta en un impreso. No obstante,
en otras ocasiones se emplean instrumentos mecánicos como contadores de pulsera
o relojes de pulsera electrónicos que pueden resultar más costosos. Hay diferentes
opiniones con respecto a las ventajas de los instrumentos de autorregistro llamati-
vos. Thoresen y Mahoney (1974) recomiendan generalmente instrumentos peque-
ños y discretos. Sin embargo, un instrumento llamativo puede convertirse en un es-
tímulo discriminativo para realizar un autorregistro exacto y provocar cambios de
conducta. Así por ejemplo, Maletzky (1974) observó que la frecuencia de las con-
ductas no deseadas autorregistradas comenzaba a disminuir cuando se quitaban los
contadores de muñeca. Un fenómeno similar fue observado por Broden y cols.
(1971); la presencia de los trozos de papel empleados para registrar la conducta de
estudiar parecía provocar un aumento de esta conducta, incluso cuando el sujeto no
producía la respuesta del autorregistro.
Como se ha dicho anteriomente, un requisito para los procedimientos de autorre-
gistro es que se ajusten a la conducta que se registra. A continuación revisamos los dis-
tintos métodos de autorregistro, incluyendo narraciones, cuentas de frecuencia, regis-
tros de duración, procedimientos de muestreo en el tiempo y registros mecánicos.
m.1. Narraciones
Un objetivo de las primeras fases de la evaluación conductual de un paciente no es

sólo seleccionar las conductas sino determinar las variables asociadas con su presen-
cia, proceso que se conoce como análisis funcional. Por ello, una de las formas más
frecuentes de autorregistro, especialmente durante las primeras fases de la evalua-
ción, es un diario de conducta en el que se registran los casos de conductas potencia-
les de análisis junto con las circunstancias que rodean a estos sucesos (antecedentes y
consecuentes). Los diarios conductuales pueden hacerse sin estructura o proporcio-
narse directrices estructuradas. Quizá el ejemplo más conocido de diario conductual
estructurado sea el autorregistro de pensamientos automáticos empleado en la tera-
pia cognitiva de la depresión (Beck y cols., 1979; Burns, 1980). Aunque hay variacio-
nes de este formato, la práctica común es que los pacientes atiendan primero a las
fluctuaciones de su estado de ánimo. Tras experimentar un sentido creciente de dis-
foria en relación con la línea base, el paciente atiende y registra sucesos ambientales
externos que preceden al cambio y pensamientos acerca de estos sucesos. Otro
ejemplo del uso de un diario de autorregistro lo proporcionan Barlow y cols. (1984);
en este caso, pacientes con trastorno de pánico o trastorno de ansiedad generalizado
estiman su grado de ansiedad y número de ataques de pánico en varios momentos a
lo largo del día. Por su parte, más recientemente, Beidel, Neal y Laderer (1991) han
empleado un diario para evaluar el ámbito y frecuencia de sucesos de ansiedad en ni-
ños pequeños.
La autoobservación
347
nL2. Registro de frecuencias »

El registro de frecuencias es un procedimiento adecuado cuando la conducta es dis-
creta, esto es, cuando las duraciones de cada caso de la conducta no varían mucho.
Para que un registro de frecuencias pueda compararse con otro debe emplearse la
misma unidad de tiempo. Una forma común de autorregistrar es hacer marcas en un
trozo de papel; por ejemplo, en un papel dentro del celofán de un paquete de cigarri-
llos en el que se registra la frecuencia de los cigarrillos fumados al día. Watson y
Tharp (1972) presentaron varios procedimientos simples de autorregistro; por ejem-
plo, pasar un palillo de dientes o una moneda de un compartimento de su monedero
a otro cada vez que una conducta ocurre. Las frecuencias de la conducta también se
han registrado con una serie de instrumentos (Lindsley, 1968; Mattos, 1968; Maho-
ney, 1974a; Sheehan y Casey, 1974). :
m3. Registros de la duración

Mientras que los registros de frecuencias se emplean con conductas discretas, el
tiempo de duración de cada ocurrencia de alguna conducta puede variar considera-
blemente. Ejemplos de tales conductas pueden ser la duración del tiempo en que se
ve la televisión o que se estudia. Un registro de duración es más sensible a estos in-
tervalos variables de tiempo que los registros de frecuencia. La duración puede auto-
rregistrarse por medio de un cronómetro. Muchos relojes de pulsera comerciales
incluyen cronómetro y su precio se ha reducido considerablemente en los últimos
años.
11.4. Muestreo en el tiempo

Como alternativa al registro de la duración, el muestreo en el tiempo puede usarse
para registrar conductas no discretas en aquellos casos en los que registrar cada vez
que ocurre la conducta sería tedioso. En el muestreo de intervalos de tiempo, una
unidad mayor (por ejemplo, un día) se subdivide en unidades más pequeñas (por
ejemplo, intervalos de media hora). El autoinformador simplemente anota si lacon-
ducta tuvo lugar o no en este intervalo. Aunque el muestreo es adecuado, su incon-
veniente es que cada intervalo marcado como positivo puede no contener frecuen-
cias o intensidades de la conducta comparables. Una forma más refinada de
muestreo temporal es el descrito por Stumphauzer (1974); se usa una escala de esti-
mación de 4 puntos, donde cada intervalo se marca como 0, 1,2603, dependiendo de
si la conducta no ha ocurrido, ha ocurrido ocasionalmente, a menudo, o muy a me-
nudo en ese intervalo.
Otra forma de muestreo temporal es un muestreo momentáneo (Kubany y
Sloggett, 1973). Un instrumento de cronometraje se ajusta para varios intervalos de
tiempo. Cuando suena, el autoinformador anota simplemente si la conducta está
ocurriendo en ese momento. En el muestreo momentáneo se registra el porcentaje:
348 James D. Herbert yRosemery O. Nelson-Gray
el número de comprobaciones en las que ocurrió la conducta dividido por elnúmero

total de comprobaciones realizadas. Los instrumentos de cronometraje incluyen
despertadores, relojes de pulsera con alarma y relojes de cocina. Si es posible, el ins-
trumento de cronometraje debería ajustarse a un intervalo variable. El muestreo mo-
mentáneo fue usado en un estudio de Williams y Rappoport (1983) para registrar los
pensamientos de pacientes con agorafobia sometidos a terapia de exposición y tera-
pia cognitiva.
ms. Procedimientos de autorregistro pasivos y/o mecánicos

Varios procedimientos mecánicos de autorregistro no tienen otra respuesta del in-
formador más que el compromiso de usar el instrumento de autorregistro. Por
ejemplo, Azrin y Powell (1968) desarrollaron una pitillera que registraba automát1-
camente el número de veces que era abierta. Si un sujeto cogía sólo un cigarrillo cada
vez, y sólo fumaba cigarrillos de esta pitillera, se obtenía un registro automático de
los cigarrillos fumados. Igualmente, Azrin y cols. (1968) desarrollaron un aparato
que contabilizaba el número de veces que una persona adoptaba una postura inade-
cuada. Schwitzgebel y Kolb (1974) describen una variedad de otros instrumentos
automáticos que, dada la cooperación del sujeto, registran aspectos específicos de su
conducta.
Otra forma de autorregistro pasivo es el registro de productos de conducta u
otros derivados conductuales (McFall, 1976). Por ejemplo, un sujeto puede conta-
bilizar el número de cigarrillos que ha fumado contando el número de colillas del
cenicero. En estudios de control de peso, los cambios del peso corporal reflejan in-
directamente los cambios en las conductas alimenticias. De forma similar, la longi-
tud de las uñas puede emplearse como un índice de medida en la onicofagia (Mc-
Namara, 1972), la longitud del pelo como una medida en la tricotilomanía
(McLaughlin y Nay, 1975) y las calificaciones escolares como resultado de la con-
ducta de estudio (Johnson y White, 1971). Las medidas del resultado fisiológico
también pueden usarse; por ejemplo, el nivel de alcohol en la sangre puede consti-
tuir una medida del consumo de alcohol (Miller y cols., 1974), el análisis de orina
sirve para detectar el consumo de drogas (Goldstein y Brown, 1970) y el monóxi-
do de carbono en el aliento permite evaluar la conducta de fumar (Lando, 1975).
Merall (1976) sugirió como forma de autorregistro pasivo los informes de archivo;
por ejemplo, las facturas del teléfono, los estados de cuentas o cheques bancarios,
etcétera.
Todas estas modalidades de autorregistro, procedimientos mecánicos, produc-
tos de conducta e informes de archivo son pasivos en tanto que el paciente no nece-
sita registrar una respuesta tras cada ocurrencia de la conducta concreta. No se sabe si
tales procedimientos pasivos producen reactividad. Sin embargo, puede conjeturar-
se que habría una menor reactividad que con el autorregistro activo. Otra caracterís-
tica común de los procedimientos pasivos es que permiten retrasar la retroalimenta-
ción. Un lapso de tiempo considerable puede transcurrir entre la conducta y su
registro. Este retraso puede también atenuar la reactividad que generalmente produ-
ce el autorregistro.
La autoobservación
349
UL. Autorregistro informatizado

Una tendencia reciente de la evaluación conductual es el uso de pequeños ordenado-
res personales para el autorregistro. Tombari, Fitzpatrick y Childress (1985) emplea-
ron con éxito un sistema de autorregistro informatizado de la conducta de levantarse
del asiento de un niño de sexto curso. Agras y cols. (1990) hicieron que pacientes
obesos autorregistraran su ingesta de comida y conducta de ejercicio en un pequeño
ordenador manual. Además de registrar cada conducta, los ordenadores se están em-
pleando también para resumir y analizar datos producidos por los procedimientos
tradicionales de autorregistro (Schlundt, 1988). Farrell (1991) observa que los orde-
nadores tienen una serie de ventajas sobre los procedimientos tradicionales de auto-
registro de lápiz y papel. El tiempo de registro de los datos se graba automática-
mente asegurando que los pacientes no completan el trabajo de autorregistro justo
antes de la sesión de terapia. Los ordenadores también pueden programarse para que
indiquen a qué intervalos deben realizar los pacientes el autorregistro. Finalmente,
los ordenadores pueden mejorar la exactitud.
m7. Gráficos
Con independencia del procedimiento de autorregistro empleado, una forma ade-
cuada de resumir los datos del autorregistro es un gráfico de la conducta. General-
mente, las unidades de tiempo aparecen en la abscisa, mientras que la ordenada refle-
ja unidades de medida de la conducta (por ejemplo, frecuencia, porcentaje o tiempo).
IV. EXACTITUD DE LOS DATOS DE AUTORREGISTRO

1v.1. Exactitud de la conducta externa autorregistrada
La exactitud de los datos del autorregistro se determina con uno de los tres procedi-
mientos siguientes. El primero, y más frecuente, es comparar los registros simultá-
neos hechos por autoinformadores y otros observadores. Por ejemplo, Herbert y
Baer (1972) compararon los datos de un observador con los de dos madres para de-
terminar la exactitud de sus autorregistros de atención a conductas infantiles apro-
piadas. El segundo procedimiento es comparar los registros simultáneos hechos por
autoinformadores y por procedimientos mecánicos. Por ejemplo, una máquina em-
pleada por Mahoney y cols. (1973) anotaba automáticamente las respuestas de los
alumnos mientras que éstos registraban sus propias respuestas correctas; la exactitud
del autorregistro se determinaba comparando sus respuestas con las de la máquina,
El tercer procedimiento consiste en comparar los datos de los autorregistros con un
producto de conducta. Por ejemplo, cambios de peso reflejan de forma indirecta
cambios de hábitos alimenticios; cuando los hábitos alimenticios son autorregistra-
dos, el peso corporal puede emplearse como comprobación de la exactitud.
Como se observó anteriormente, los procedimientos más frecuentes para eva-

luar la exactitud de datos de un autorregistro son comparar sus datos con registros
hechos por uno o más observadores externos. Sin embargo, es importante tener en
cuenta que dos observadores pueden estar de acuerdo y sus registros pueden no re-
flejar verdaderamente la frecuencia actual de la conducta (Lipinski y Nelson, 1974).
Además, el acuerdo entre autorregistro y datos proporcionados por observadores
puede depender de quién es el observador. Por ejemplo, Fixsen, Phillips y Wolf
(1972) descubrieron que los autorregistros hechos por niños de conductas de lim-
pieza de sus habitaciones coincidía en un 76% con los informes de sus compañeros.
Sin embargo, sus autorregistros y los registros de las habitaciones de sus compañe-
ros coincidían con los registros de observadores adultos sólo en un 50%. Aunque
los índices verdaderos de exactitud requieren que los datos autorregistrados sean
comparados con registros mecánicos o de criterio, tales registros son a menudo poco
prácticos o imposibles de obtener. En la literatura sobre la técnica de autorregistro,
la exactitud se infiere generalmente del acuerdo entre informadores. Además, se pre-
supone normalmente que los datos de los observadores son más exactos que los de
los autoinformadores, una concepción que requiere más investigaciones.
Una serie de estudios ha examinado el grado de acuerdo entre datos de autorre-
gistro y de registros de observadores. Algunos estudios han encontrado un gran
acuerdo (Azrin y Powell, 1969; Mahoney y cols., 1973; McKenzie y Rushall, 1974;
Shaw, Peterson y Cone, 1974; Samo y cols., 1989), mientras que otros han hallado un
escaso acuerdo (McFall, 1970; Herbert y Baer, 1972; Hendricks, Thoresen y Hub-
bard, 1973; Cavior y Marabotto, 1976). Aunque Kazdin (1974b) concluye que los
pacientes tienden a minimizar los casos de conductas no deseables y sobrevalorar las
deseables con respecto a los observadores, este patrón no es el resultado de otros es-
tudios (Nelson y cols., 1977; Nelson, Lipinski y Boykin, 1978). En el apartado si-
guiente examinamos algunas de las variables que afectan a la exactitud de los datos
del autorregistro.
1v2. Exactitud de la conducta interna autorregistrada

Como se ha hecho notar, los datos directos de la frecuencia de los sucesos internos
dependen por definición de algún tipo de autorregistro. Como consecuencia de la
creciente expansión de la terapia cognitiva, los procedimientos de autorregistro se
emplean con frecuencia para registrar cogniciones. Se instruye a los pacientes para
que registren una clase de cogniciones (por ejemplo, pensamientos de autocrítica en
casos de depresión, preocupaciones obsesivas en los trastornos de ansiedad...) más
que la frecuencia de una sola cognición. Al igual que sucedía con las conductas exter-
nas, el autorregistro de cogniciones se emplea tanto en la fase de evaluación inicial
como durante el tratamiento.
Existen dos problemas relacionados con el uso del autorregistro para obtener
datos de la frecuencia de sucesos cognitivos. El primero es la reactividad; no se ha es-
tablecido empíricamente que las conductas cognitivas sean reactivas al autorregistro
del mismo modo que lo son las conductas externas. Sin embargo, la experiencia clí-
nica sugiere que ésta es una realidad. Esta reactividad hace difícil establecer una línea
La autoobservación 351
base estable de la clase de conducta. Además, la eficacia de la técnica de tratamiento

sola no puede establecerse puesto que los cambios de la frecuencia de las cogniciones
registradas sólo pueden atribuirse a la interacción de la técnica de tratamiento y el
autorregistro. Estas cuestiones serán discutidas con detalle más adelante. El segundo
problema es establecer la exactitud del autorregistro de las cogniciones. Los sucesos
internos son por definición observables sólo por el propio sujeto. Los intentos de
corroborar indirectamente el autorregistro de cogniciones se han centrado en las co-
relaciones entre la cognición y sucesos observables potencialmente relacionados.
Varios estudios que correlacionan las frecuencias de sucesos internos y externos po-
tencialmente relacionados han tenido diferentes resultados. Williams (1976) encon-
tró una óptima correspondencia entre autorregistros de pensamientos paranoides y
episodios de esofagitis, y Barlow, Leitenberg y Agras (1969) entre los autorregistros
de impulsos sexuales específicos y una medida de tipos de cartas. Una reacción in-
versa esperada entre autorregistros de depresión y autorrefuerzo fue demostrada
por Jackson (1972). No obstante, Hannum, Thoresen y Hubbard (1974) sólo en-
contraron una reacción mínima entre autocríticas positivas y negativas de profesores
y su conducta en clase registrada por observadores. Por su parte, Horan y Johnson
(1971) encontraron una correlación de 0,27 entre pérdida de peso y frecuencia de
cogniciones relacionadas con el peso. Nelson, Hay y Hay (1977) encontraron sólo
una relación moderada entre pensamientos de estudio autorregistrados y tiempo de
estudio autorregistrado.
La baja correlación entre la frecuencia de cogniciones autorregistradas y la fre-
cuencia de sucesos externos supuestamente relacionados tiene dos explicaciones po-
sibles. Una es que la relación entre las dos es realmente débil; esta opinión es consis-
tente con la formulación de Lang (1968) de la relativa independencia entre conductas
interna, autónoma y externa. Una segunda explicación de las bajas correlaciones es
que las conductas están de hecho muy correlacionadas pero que las frecuencias re-
gistradas por los autoinformadores de sus conductas internas son inexactas, dando
lugar así a la baja correlación. En conclusión, una alta correlación entre la frecuencia
autorregistrada de un suceso interno y la frecuencia observada de un suceso externo
puede dar algún crédito a los datos autorregistrados. Sin embargo, una baja correla-
ción no puede tomarse como evidencia de un autorregistro inexacto puesto que se
puede asumir que los dos grupos de conductas estén estrechamente relacionados.
V. VARIABLES QUE AFECTAN A LA EXACTITUD DEL AUTORREGISTRO
vai. Conciencia de la evaluación de la exactitud
Una variable que influye en la exactitud del autorregistro es la conciencia de la eva-

luación de la exactitud. El autorregistro es más exacto cuando los autoinformadores
son conscientes de que su exactitud está siendo registrada más que cuando lo es de
forma encubierta. Este hallazgo ha sido refutado en varios estudios (Lipinski y Nel-
son, 1974; Santogrossi, 1974; Lipinski, Black, Nelson y Ciminero, 1975; Nelson, Li-
pinski y Black, 1975; Bailey y Peterson, 1977).
va. Refuerzo dependiente de la exactitud

Otra variable que se ha demostrado que influye en la exactitud de los datos de auto-
rregistro es el refuerzo dependiente de la exactitud. Fixsen y cols. (1972) hallaron
que un coeficiente de 0,76 de acuerdo entre autoinformes e informes de compañeros
acerca de la conducta de la limpieza podía mejorarse hasta un 0,86 por medio de re-
fuerzo dependiente. Otros estudios han encontrado efectos similares del refuerzo de
la exactitud del autorregistro (Flowers, 1972; Lipinski y cols., 1975; Peterson, House
y Alford, 1975; Nelson y cols., 1976). Además, del mismo modo en que se ha de-
mostrado que el refuerzo positivo aumenta la exactitud de los datos del autorregis-
tro, se ha demostrado que el castigo reduce la discrepancia de los autorregistros
(Seymour y Stokes, 1976).
Dado que las consecuencias dependientes alteran la exactitud del autorregistro,
otra cuestión es si estas consecuencias pueden eliminarse gradualmente mantenien-
do una gran exactitud. Drabman, Spitalnik y O'Leary (1973) y Turkewitz, O'Leary
y Ironsmith (1975) presentan intentos fracasados de mantener una gran exactitud de
las autoestimaciones de conductas de clase eliminando gradualmente las comproba-
ciones de exactitud y refuerzo. En estos dos estudios, se fue reduciendo el número
de niños cuyas autoestimaciones se examinaban. No obstante, cuando el número de
días en que se comprobaba la exactitud del autoinftorme y consiguientemente se re-
ducía empleando un programa de proporción variable, la exactitud del autorregistro
se mantenía (Layne y cols., 1976).
v3. Naturaleza de la conducta
Mientras que se ha demostrado que la conciencia de la evaluación de la exactitud y el

refuerzo a los datos autorregistrados incrementan la exactitud del autorregistro, las
restantes variables discutidas tienen mucho menor apoyo empírico. Una de estas va-
riables es la naturaleza de la conducta autorregistrada. Bailey y Peterson (1977) pro-
pusieron que las respuestas verbales pueden ser más difíciles de autorregistrar con
exactitud que las respuestas motoras. El apoyo preliminar a esta hipótesis fue dado
por los estudios de Peterson y cols. (1975), Cavior y Marabotto (1976), y Hayes y
Cavior (1977). Por el contrario, Willis y Nelson (1982) no encontraron diferencias
de exactitud en el autorregistro entre conductas verbales y motoras en un estudio
análogo. Sin duda, se necesitan más investigaciones para determinar la dificultad re-
lativa de autorregistrar otros tipos de conductas.
v.4. Registro de respuestas concurrentes

Cavior y Marabotto (1976) demostraron que la exactitud del autorregistro era de
0,37 cuando los sujetos autorregistraban sus conductas verbales mientras entablaban
una interacción entre dos participantes, elevándose a 0,89 cuando se les daba la opor-
tunidad de autorregistrar sus conductas verbales en cintas de vídeo. Es posible que
La autoobservación
353
los sujetos no pudieran realizar el autorregistro en la interacción de dos participantes

por la interferencia de conductas concurrentes. Los efectos perjudiciales de la respues-
ta concurrente en la exactitud del autorregistro fueron confirmados por los experi-
mentos de Epstein, Webster y Miller (1975) y Epstein, Miller y Webster (1976). Los
sujetos cometían menos errores en su autorregistro de la respiración cuando estaban
atareados sólo con el autorregistro que cuando realizaban una tarea concurrente
consistente en presionar una palanca.
v.5. Plan del autorregistro

Erederiksen y cols. (1975) demostraron que cuando los sujetos autorregistraban
cada cigarrillo fumado, su exactitud de autorregistro era mayor (93,59%) que cuan-
do autorregistraban el número de cigarrillos fumados al final del día (85,77%) o al fi-
nal de la semana (87,32%).
v.6. Valencia de la conducta
Kanter (1976) sugirió a los sujetos realizar autorregistros menos exactos de con-
ductas con valencia negativa que de conductas con valencia positiva. Puesto que la
atención a conductas negativas puede producir una autoevaluación negativa, los
pacientes pueden evitar atender a conductas no deseadas, produciendo entonces
datos inexactos. La sugerencia de Kanfer ha recibido algún apoyo científico. Por
ejemplo, Nelson y cols. (1976) encontraron un mayor índice de acuerdo entre auto-
informadores adultos retardados y observadores en la conducta positiva de la con-
versación social que en la conducta negativa de tocarse la cara. Resultados similares
obtuvieron Nelson y cols. (1977) y Nelson y cols. (1980). En cambio, Willis y Nel-
son (1982) encontraron que las conductas con valencia negativa se autorregistraban
con mayor exactitud que las de valencia positiva en el caso de estudiantes univers1-
tarias.
vz. Entrenamiento en autorregistro
En un intento por aumentar la escasa exactitud con la que sus sujetos registraban la
frase you know, Peterson y cols. (1975) les pidieron que practicaran el autorregistro
en vídeo. Mientras que este procedimiento era eficaz para elevar la exactitud aun
62% en el autorregistro, el entrenamiento no se extendió a la conversación en vivo,
donde la exactitud descendió al 20%. Para el entrenamiento de sujetos adolescentes
retardados, Nelson y cols. (1978) emplearon tanto práctica de vídeo como práctica
en situación de clase; cuatro sujetos entrenados autorregistraron con mayor exacti-
tud sus intervenciones de clase apropiadas (0,91) que cinco sujetos menos entrena-
dos (0,78). Hamilton y Bornstein (1977) también encontraron que la práctica en el
autorregistro de faltas de fluidez en el habla de cinta de audio y situaciones en vivo
producía mayor exactitud del autorregistro que una condición de control. Sin em-
bargo, se requiere más investigación para delimitar los componentes de procedi-

mientos eficaces de entrenamiento.
vs. Características del instrumento de autorregistro

Como se ha descrito anteriormente, hay una gran variedad de instrumentos de auto-
registro. Sin embargo, las características de estos instrumentos que pueden afectar a
la exactitud del autorregistro casi no han recibido atención empírica. Aunque se ha
sugerido que lo llamativo del instrumento de autorregistro afecta a la exactitud, Nel-
son y cols. (1978) no encontraron diferencias en la exactitud entre un llamativo con-
tador manual y otro más discreto llevado en el cinturón. Es necesaria mayor investi
gación para proporcionar directrices establecidas experimentalmente para que la
selección de los instrumentos de autorregistro aumente la exactitud de los datos re-
sultantes.
En resumen, la exactitud de los datos del autorregistro es desigual. Se han defini-
do algunas variables que afectan a la exactitud de los datos del autorregistro. Existe
un amplio apoyo empírico para los efectos de algunas de estas variables (por ejem-
plo, la conciencia de la evaluación de la exactitud y el refuerzo de la exactitud). Sin
embargo, hace falta más investigación para estudiar otras variables que puedan me-
jorar la exactitud de esta técnica de evaluación psicológica.
VI. PROCEDIMIENTOS PARA MEJORAR EL EMPLEO DEL AUTORREGISTRO
Una cuestión más importante aún que inducir a los pacientes para que produzcan
datos de autorregistro exactos es persuadirlos para el autorregistro mismo. Algunas
sugerencias prácticas para asegurar la recogida consistente de datos han sido aporta-
das por Mahoney (1977). Una de sus sugerencias es proporcionar al sujeto un instru-
mento simple y fiable que sea compatible con la conducta. Igualmente, el procedi-
miento de medida, esto es, registro de frecuencias o de duración, debe ser adecuado
para la conducta. Un paciente puede dejar el autorregistro si el procedimiento de
medida no es apropiado para la conducta o si no se adecua al procedimiento de me-
dida y la conducta. Los terapeutas han de ser creativos e ingeniosos para hacer frente
a las necesidades de los pacientes. Por ejemplo, un magnetófono puede emplearse
para mejorar el autorregistro de pacientes a los que disgusta escribir.
Otra cuestión es determinar qué pacientes son adecuados para los procedimien-
tos de autorregistro. En nuestra experiencia, la mayoría de los pacientes es capaz de
proporcionar datos útiles por medio de algún tipo de autorregistro, en tanto que se
adapte la estrategia de evaluación al paciente. A algunos pacientes hay que analizar-
los cuidadosamente antes de iniciar el autorregistro. Por ejemplo, puede ser poco
acertado prescribir el autoinforme en pacientes cuya cuantificación es sospechosa.
Igualmente, algunos pacientes con trastornos obsesivo-compulsivos pueden emplear
demasiado tiempo en el autorregistro, hasta el punto de que la tarea se convierta en
un problema. Tras determinar que un paciente es apto para el autorregistro, debe en-
La autoobservación
355
trenársele para discriminar las ocurrencias de la conducta y usar el instrumento de

autorregistro. Mahoney (1977) propórciona unos pasos para este entrenam
iento:
Dar definiciones explícitas y ejemplos de las conductas a registrar.
Proporcionar instrucciones de autorregistro explícitas.
Mostrar el uso adecuado del instrumento de autorregistro.
Pedir al paciente que repita las definiciones e instrucciones del autorregistro.
IES
Hacer que el paciente autorregistre varios casos de la conducta tal como lo
describió el terapeuta.
Mahoney (1977) también propuso que se autorregistraran conductas positivas

en vez de negativas cuando fuera posible y que el terapeuta motivara y reforzara al
paciente para la producción de datos de autorregistro. La motivación del terapeuta
puede llevar consigo la afirmación de la importancia del autorregistro o el ejemplo
del propio uso de la estrategia por parte del terapeuta.
VII. ESTIMACIÓN DE FRECUENCIAS
Un presupuesto tácito de los procedimientos de autorregistro es que producen da-

tos más exactos que los que resultarían de las meras preguntas al paciente sobre la es-
timación de la frecuencia de una conducta en un período de tiempo específico. Sin
embargo, existen dudas sobre este presupuesto por el fenómeno conocido como
“procesamiento automático”, descrito en la literatura de psicología cognitiva (Has-
her y Zacks, 1984). El procesamiento automático se refiere a que la frecuencia de
ciertos datos es registrada automáticamente sin la conciencia del individuo. La inves-
tigación básica empleando paradigmas experimentales análogos ha demostrado que
los sujetos son sorprendentemente exactos cuando se les pide que estimen la fre-
cuencia de distintos sujetos que no han contado (Hasher y Zacks, 1979, 1984). Apli-
cando este trabajo a la evaluación conductual, Nelson-Gray y cols. (1990) hicieron
que un grupo de sujetos autorregistraran la frecuencia de una conducta verbal du-
rante una conversación con un pariente, mientras que otro grupo simplemente est1-
mó la frecuencia de la conducta tras la conversación. Aunque el grupo del autorre-
gistro produjo datos más fiables que el de la estimación, las estimaciones de estos
últimos no se desviaban mucho de la frecuencia real de la conducta. No obstante, en
otro estudio, Farmer y Nelson-Gray (1990) hallaron que las estimaciones de los su-
jetos se desviaban sustancialmente de la frecuencia real y que las conductas de baja
frecuencia se estimaban con menor exactitud que las de frecuencia moderada o alta.
En conjunto, estos estudios sugieren que la estimación de frecuencia puede pro-
porcionar datos suficientemente exactos para fines clínicos, pero sólo bajo ciertas
condiciones. La estimación de la frecuencia es obviamente un trabajo menos intenso
que el autorregistro y elimina las dificultades asociadas con la obediencia del pacien-
te al autorregistro. Sin embargo, se requiere mucha más investigación para delimitar
las condiciones bajo las que la estimación de la frecuencia puede ser una alternativa
viable al autorregistro.
VIIL. FUNCIONES TERAPÉUTICAS DEL AUTORREGISTRO
Tal como hemos visto, la acción misma del autorregistro tiende a producir cambios
en la conducta misma, proceso conocido como reactividad. Aunque este fenómeno
presenta evidentes problemas cuando la exactitud de los datos está en juego, la reac-
tividad del autorregistro es útil en terapia puesto que la dirección del cambio es nor-
malmente positiva, esto es, las conductas deseables tienden a aumentar en frecuencia
cuando se autorregistran, mientras que las no deseables tienden a disminuir. En este
apartado revisaremos brevemente varios estudios que muestran el fenómeno de la
reactividad y a continuación examinaremos las variables que influyen en ella.
Los efectos de reactividad del autorregistro han sido refutados en numerosas
ocasiones por medio de estudios de casos, en diseños experimentales intra e inter-
sujeto. Las siguientes conductas relevantes clínicamente han sido alteradas por el
autorregistro: alucinaciones (Rutner y Bugle, 1969), tricotilomanía (Bayer, 1972),
morderse los labios (Ernst, 1973), consumo de alcohol (Sobell y Sobell, 1973), con-
ductas motoras repetitivas (Maletzky, 1974), pensamientos obsesivos (Frederiksen,
1975), insomnio (Jason, 1975), ideas paranoides (Williams, 1976) y consumo de an-
fetaminas y pensamientos relacionados con las drogas (Hay, Hay y Angle, 1977).
Los diseños experimentales de N= 1 incluyen la demostración B-A-B de Leiten-
ber y cols. (1968) en la que un paciente con claustrofobia aumentaba el tiempo que
estaba en una pequeña habitación cuando usaba un cronómetro para determinar el
tiempo transcurrido en cada prueba. Usando un diseño inverso, Herbert y Baer
(1972) hallaron que el autorregistro aumentaba la atención materna dependiente
y conductas infantiles apropiadas. Por su parte, McKenzie y Rushall (1974) infor-
man de dos experimentos, uno empleando un diseño de línea base múltiple y otro un
diseño inverso; ambos estudios demostraron que los nadadores podían emplear
autorregistros para mejorar varios aspectos de la natación. Usando diseños de línea
de base múltiple en varias conductas de dos personas con tics motores, Thomas,
Abrams y Johnson (1971) y Hutzell, Platzek y Logue (1974) demostraron que la fre-
cuencia de éstos se reducía eficazmente por medio de su autorregistro. Finalmente,
un diseño de lína base múltiple en distintas situaciones fue empleado por Seymour y
Stokes (1976) para demostrar que el autorregistro aumentaba la frecuencia de las
conductas de trabajo en chicas delincuentes.
Los diseños experimentales entresujeto han demostrado también los efectos re-
activos del autorregistro. Así, estudiantes universitarios que autorregistraron sus ac-
tividades de estudio obtenían mejores calificaciones que los sujetos de un grupo
control y los sujetos que autorregistraban sus salidas (Johnson y White, 1971). Var-
gas y Adesso (1976) encontraron una longitud de uñas mayor en onicófagos que auto-
registraban el comerse las uñas que en aquellos que no se autorregistraban.
Finalmente, una serie de estudios ha comparado los efectos reactivos del
autorregistro con cambios de conducta producidos por otras técnicas terapéuticas.
Nelson y cols. (1976) hallaron que el autorregistro de adultos retardados era más efi-
caz que la economía de fichas para incrementar la frecuencia de tres conductas desea-
bles: conversación social, limpieza de la habitación y participación en actividades re-
creativas. En otro diseño entresujeto, se demostró que el autorregistro en pacientes
La autoobservación
007
con agorafobia producía tanto tiempo en el exterior como el refuerzo diferencial

para excursiones largas (Emmelkamp y Ultee, 1974) y como la inundación en imagl-
nación y en vivo (Emmelkamp, 1974). Se ha demostrado que una combinación de
autorregistro y autorrefuerzo produce una mayor pérdida de peso que el autorregis-
tro sólo (Mahoney, Moura y Wade, 1973; Mahoney, 1974b; Bellack, 1976). Igual-
mente, Silber y Haynes (1992) han encontrado que el autorregistro combinado con
una modificación de hábitos produce reducciones significativas de la onicofagia,
mientras que el autorregistro sólo no lo hace.
Aunque todos los estudios anteriores demostraron los efectos reactivos del
autorregistro, en otros estudios no se produjo dicho efecto (Mahoney, 1971; Jack-
son, 1972; McNamara, 1972; Sobell y cols., 1989). Los resultados variables del auto-
registro fueron tipificados por Zimmerman y Levitt (1975); de veintidós pacientes a
los que catorce terapeutas distintos pidieron que se autorregistraran, se produjeron
cambios reactivos en ocho de ellos dirigidos por siete terapeutas distintos. McFall
(1976) comentó que contabilizar el número de estudios en los que el autorregistro es
reactivo o no es probablemente algo poco productivo en términos de comprensión
de efectos inconsistentes. Un enfoque más fructífero es examinar las variables espe-
cíficas que parecen controlar la reactividad del autorregistro.
IX. VARIABLES QUE AFECTAN A LA REACTIVIDAD DEL AUTORREGISTRO

1x1. Motivación para el cambio de conducta
La sugerencia de que la motivación para un cambio de conducta influye en la reacti-
vidad del autorregistro se basa en gran medida en estudios de tabaquismo. Los suje-
tos seleccionados por McFall y Hammen (1971) fueron estudiantes que informaron
estar muy motivados para dejar de fumar. Bajo estas condiciones, los cuatro grupos
de sujetos redujeron la cantidad de cigarrillos con independencia del procedimiento
específico de autorregistro empleado. Por el contrario, los sujetos de McFall (1970)
eran fumadores que cuando no estaban motivados para dejar de fumar realizaban un
autorregistro del número de cigarrillos fumados superior al real, aunque el autorre-
gistro de impulsos resistidos hacía disminuir la frecuencia de fumar. Una compara-
ción específica de fumadores motivados y no motivados fue realizada por Lipinski y
cols. (1975); el autorregistro reducía la conducta de fumar sólo en los fumadores mo-
tivados. La influencia de la motivación en la reactividad del autorregistro fue verifi-
cada con una conducta distinta por Komaki y Dore-Boyce (1978); el autorregistro
aumentaba la participación verbal sólo de los estudiantes que habían expresado su
interés en modificar esta conducta.
1x2. Valencia de la conducta
Mientras que la motivación de los pacientes puede determinar si cambios reactivos

tienen lugar con el autorregistro, la valencia de la conducta puede determinar la di-
rección de dichos cambios. El autorregistro aumenta normalmente la frecuencia de

las conductas deseables y disminuye la de las no deseables. Esta conclusión se confir-
mó en dos estudios de laboratorio donde se asignaron valencias positivas O negativas
a la misma conducta. El autorregistro aumentó las autocríticas cuando se les asigna-
ba una valencia positiva y las reducía cuando se les asignaba una valencia negativa
(Kazdin, 19744). Resultados similares fueron obtenidos por Siecek y MeFall (1976)
cuando se asignaban valencias positivas o negativas al número de parpadeos. Un tercer
estudio de Cavior y Marabotto (1976) también obtuvo resultados consistentes cuan-
do los sujetos mismos seleccionaban una conducta verbal que consideraban positiva
o negativa. En un entorno natural, Broden y cols. (1971) hallaron que el autorregis-
tro aumentaba la conducta de estudio de una niña de doce años y, contrariamente,
reducía las intervenciones inadecuadas de su compañera en clase. Igualmente, con
adultos retardados, Nelson y cols. (1976) demostraron que el autorregistro de una
conducta positiva (la conversación social) aumentaba su frecuencia y, por el contra-
rio, el de una negativa (tocarse la cara) disminuía.
Ix.3. Instrucciones del experimentador

Además de las instrucciones concernientes a la valencia de las conductas descritas
arriba, se han examinado otros dos tipos de instrucciones del experimentador: la ex-
pectativa acerca de la dirección del cambio de conducta y la demanda de cambio de
conducta diferencial. No se ha demostrado que estos dos tipos de instrucciones pro-
duzcan un cambio de conducta diferencial en los sujetos. Ya se dijera a los sujetos
que el autorregistro disminuiría, aumentaría o dejaría igual la frecuencia con que se
tocaban la cara, el autorregistro claramente redujo la frecuencia en todos los grupos
(Nelson y cols., 1975). Por su parte, Orne (1970) y Kazdin (1974b) sugirieron que la
demanda implícita o explícita para producir un cambio de conducta diferencial pue-
de contribuir a la reactividad del autorregistro. De todas las instrucciones investigadas
hasta ahora, sólo la inducción de la valencia ha tenido éxito en la producción de cam-
bios de conducta diferenciales durante el autorregistro.
1Ix.4. Objetivos, refuerzo y retroalimentación

Otro grupo de variables que contribuyen a la reactividad del autorregistro es el en-
torno de los objetivos de actuación y el refuerzo o retroalimentación dependiente de
la actuación del autoinformador. En un estudio de Kazdin (1974), los sujetos a los
que se dio un objetivo específico de entre las autocríticas posibles durante el autorre-
gistro produjeron más afirmaciones que un grupo de registro al que no se le instru-
yó. Kazdin (1974a) también alteró la cantidad de retroalimentación dada a sus suje-
tos autoinformadores; los autoinformadores a los que se permitió ver el contador
con que se autorregistraban hicieron más autocríticas que los que tenían tapados los
contadores. La importancia de la retroalimentación en la contribución a la reactivi-
dad del autorregistro también fue demostrada por Richards y cols. (1976); los estu-
diantes que eran relativamente inconscientes del tiempo que pasaban estudiando se
la autoobservación
359
beneficiaron más de la retroalimentación producida por el autorregistro del tiempo

de estudio que los que ya eran conscientes de la duración de este tiempo. Por otro
lado, Kolb, Winter y Berlew (1968) encontraron un cambio de conducta mayor en
los autoinformadores que se reunían semanalmente para discutir sus proyectos indi-
viduales. Cuando los autoinformadores adultos retardados creían que los refuerzos
comestibles dependían de los cambios de frecuencia de la respuesta, aumentaban la
frecuencia de las veces que hablaban y que tocaban objetos del entorno y normal-
mente disminuían las veces que se tocaban la cara (Nelson y cols., 1976). Igualmente,
el refuerzo monetario dependiente de la disminución de tocarse la cara produjo re-
ducciones por debajo de los niveles de la línea base en estudiantes universitarios (Li-
pinski y cols., 1975).
Ix5. Número de conductas que se autorregistran conjuntamente

Hayes y Cavior (1977) pidieron a un grupo de sujetos que autorregistraran una, dos
O tres conductas a la vez; usando la proporción de cambio como medida dependien-
te, encontraron que los efectos reactivos del autorregistro eran mayores cuando sólo
se autorregistraba una sola conducta; el autorregistro de dos o tres conductas no
producía una reactividad significativa.
1x6. Naturaleza de la conducta
Peterson y cols. (1975) sugirieron que el autorregistro es más reactivo cuando la con-
ducta es no verbal que cuando es verbal. En su estudio, el autorregistro produjo ma-
yores cambios en la frecuencia de tocarse la cara que en la frecuencia de dos expre-
siones verbales. Similares resultados fueron obtenidos posteriormente por Hayes y
Cavior (1977). Otros estudios han demostrado que la reactividad depende de la con-
ducta específica que se asigne para el autorregistro. Romanczyk (1974) encontró que
el registro del peso diario y de la ingestión de calorías producía mayor pérdida de
peso que únicamente el registro del peso. Por su parte, Gottman y McFall (1972) de-
mostraron que el autorregistro de la participación en clase aumentaba la frecuencia
de la conducta, mientras que el autorregistro de impulsos no realizados de participar
disminuía su frecuencia.
1x7. Momento del autorregistro

La reactividad del autorregistro también parece estar afectada por el momento en el
que se realiza el autorregistro en relación a la conducta registrada. Kanfer (1976) se-
ñaló que registrar antes de la aparición de la conducta en vez de hacerlo después pro-
ducía una mayor reactividad porque la respuesta del autorregistro interrumpe una
cadena de conducta y proporciona una alternativa a ésta. Estos resultados los confir-
maron Bellack, Rozensky y Schwartz (1974), quienes consiguieron una mayor pér-
dida de peso en un grupo de sujetos que autorregistraba la información de la inges-
tión de comida antes de comer. Sin embargo, con niños pequeños, Nelson y cols.
(1977) hallaron que el autorregistro previo o posterior a las intervenciones en clase
no afectaba diferencialmente a la reactividad de las intervenciones apropiadas o ina-
propiadas.
1x8. Plan del autorregistro

Mahoney y cols. (1973) hallaron que un autorregistro continuo de respuestas co-
rrectas producía sesiones de estudio más largas que el autorregistro intermitente
(por ejemplo, registrar cada tres respuestas correctas). Igualmente, Frederiksen y
cols. (1975) encontraron mayores reducciones en la conducta de fumar cuando se re-
gistraba cada cigarrillo que cuando se hacían registros totales diarios o semanales.
1x9. Naturaleza de los procedimientos de autorregistro

El procedimiento mismo de autorregistro puede servir como estímulo discriminati-
vo que controla la frecuencia de la respuesta registrada. Los resultados presentados
por Nelson y cols. (1978) sugerían que un instrumento más llamativo puede produ-
cir mayor reactividad que otro menos llamativo. Asimismo, Kirby, Fowler y Baer
(1991) han hallado recientemente mayor reactividad en la actuación de niños en ma-
temáticas cuando se empleaba un instrumento más llamativo de autorregistro.
Puesto que el autorregistro produce cambios de conducta en direcciones desea-
bles, el objetivo en situaciones terapéuticas debería ser incrementar la reactividad.
Las siguientes sugerencias para mejorar la reactividad están basadas en la investiga-
ción descrita anteriormente:
a. La reactividad es más probable cuando los pacientes están muy motivados

para cambiar la conducta y cuando se les dan objetivos de actuación específicos con
retroalimentación y refuerzo para cumplir esos objetivos.
b. El instrumento de autorregistro debería ser relativamente llamativo y selec-
cionar sólo una conducta de autorregistro en un intervalo.
c. Deberegistrarse cada ocurrencia de la conducta y el registro de conductas no
deseables debería hacerse antes de la conducta en vez de después.
Como resulta obvio de la discusión anterior, muchos de los factores que afectan
a la exactitud del autorregistro también influyen en el grado de reactividad produci-
do por el procedimiento. Esto plantea la cuestión de si la reactividad es estrictamente
dependiente de la exactitud. Nelson y McReynolds (1971) sugieren que aunque el
autorregistro pueda ser inexacto, puede no obstante producir efectos reactivos con-
sistentes. Esta sugerencia fue confirmada experimentalmente por Broden y cols.
(1971), Fixsen y cols. (1972), Herbert y Baer (1972) y Lipinski y Nelson (1974), de-
mostrando todos ellos que el autorregistro producía efectos reactivos aunque fuera
inexacto con respecto a las observaciones externas. Además, Hayes y Cavior (1977)
concluyeron que la exactitud del autorregistro no se correlacionaba con la magnitud
La autoobservación
361
de sus efectos reactivos. Así, a pesar de la superposición de variables que contribu-

yen a la exactitud y reactividad de los datos autorregistrados, los dos aspectos pare-
cen ser independientes en gran medida. No se sabe si esta discrepancia se debe a
errores de discriminacion de la conducta o a la respuesta de registro.
X. CONCLUSIONES
El autorregistro sigue siendo uno de los pilares del enfoque conductual de la evalua-
ción y tratamiento de una amplia gama de fenómenos conductuales y clínicos. Se ha
identificado una serie de variables que afecta a la exactitud y reactividad de los datos
autorregistrados, pero es necesaria más investigación a este respecto. Aunque la in-
vestigación básica de los mecanismos que subyacen al autorregistro ha ido disminu-
yendo en la última década, las aplicaciones clínicas del autorregistro se han extendi-
do ampliamente. En relación con los comienzos de la evaluación conductual, en los
que el autorregistro se aplicaba principalmente a conductas discretas y observables,
ha habido una tendencia a la aplicación del procedimiento a una amplia gama de
conductas que son importantes clínicamente aunque difíciles de evaluar. Por ejem-
plo, el autorregistro se emplea cada vez con más frecuencia para evaluar simultá-
neamente conductas múltiples que covarían (por ejemplo, síndromes clínicos), así
como para evaluar cogniciones. La llegada del ordenador personal ha comenzado a
dejar su marca en el procedimiento a medida que se desarrollan procedimientos de
autorregistro. Es probable que éstos y otros avances den lugar al aumento de popu-
laridad del autorregistro como importante instrumento clínico y de investigación.
Agras, W. S., Taylor, C. B., Feldman, D. E., Losch, M. y Burnett, K. I-. (1990). Developing
computer-assisted therapy for the treatment of obesity. Behavior 1herapy, 21, 99-109.
Azrin, N. H. y Powell, J. (1968). Behavioral engineering: The reduction of smoking behavior
by a conditioning apparatus and procedure. Journal of Applied Behavior Analysis, 1, 193-
200.
Azrin, N. H. y Powell, J. (1969). Behavioral engineering: The use of response priming to im-
prove self-medication. Journal ofApplied Behavior Analysis, 2, 39-42. des
Azrin, N. H., Rubin, H., O'Brien, F., Ayllon, T. y Roll, D. (1968). Behavioral engineering:
Postural control by a portable operant apparatus. Journal ofApplied Behavioral Analysis,
1,99-108.
Bailey, M. 1 y Peterson, G. L. (1977). Reactivity and accuracy of self-monitored verbal res-
ponses. Manuscrito inédito.
Barlow, D. H., Cohen, A. S., Waddell, M. T., Vermilyea, B. B., Klosko, J. S., Blanchard, E. B.
y DiNardo, P. A. (1984). Panic and generalized anxiety disorders: Nature and treatment.
Behavior Therapy, 15, 431-449.
Barlow, D. H., Leitenberg, H. y Agras, W. S. (1969). Experimental control of sexual devia-

tion through manipulation of the noxious scene in covert sensitization. Journal ofAbnor-
mal Psychology, 74, 596-601.
Barrios, B. A. (1988). On the changing nature of behavioral assessment. En A. S. Bellack y
gamon Press. ! p Ñ
Bayer, C. A. (1972). Self-monitoring and mild aversion treatment by trichotillomania. Jonr-
nal of Behavior Therapy and Experimental Psychiatry, 3, 139-141.
Beck, A. T., Rush, J., Shaw, B. y Emery, G. (1979). Cognitive therapy of depression. Nueva
York. Guilford Press. '
Becker, R. E. y Heimberg, R. G. (1988). Assessment of social skills. En A. S. Bellack y
gamon Press. 4 1
Beidel, D. C., Neal, A. M. y Lederer, A. S. (1991). The feasibility and validity of a daily diary
for the assessment of anxiety in children. Behavior Therapy, 22, 505-517.
Bellack, A. S. (1976). A comparison of self-reinforcement and self-monitoring in a weight re-
duction program. Behavior Therapy, 7, 68-75.
Bellack, A. S., Rozensky, R. y Schwartz, J. (1974). A comparison of two forms of self-moni-
toring in a behavioral weight reduction program. Behavior Therapy, 5, 523-530.
Broden, M., Hall, R. V. y Mitts, B. (1971). The effect of self-recording on the classroom beha-
vior of two eighth-grade students. Journal ofApplied Analysis, 4, 191-199.
Burns, D. (1980). Feeling good. Nueva York. Morrow.
Cavior, N. y Marabotto, C. M. (1976). Monitoring verbal behaviors in a dyadic interaction:
Valence of target behavior, type, timing, and reactivity to monitoring. Journal of Consul-
ting and Clinical Psychology, 44, 68-76.
Drabman, R. S., Spitalnik, R. y O'Leary, K. D. (1973). Teaching self-control to disruptive
children. Journal ofAbnormal Psychology, 82, 10-16.
Emmelkamp, P. M. G. (1974). Self-observation versus flooding in the treatment of agorapho-
bia. Behaviour Research and Therapy, 12, 229-237.
Emmelkamp, P. M. G. y Ultee, K. A. (1974). A comparison of “successive approximation”
and “selt-observation” in the treatment of agoraphobia. Behavior Therapy, 5, 606-613.
Epstein, L. H., Miller, P. M. y Webster, J. S. (1976). The effects of reinforcing concurrent be-
havior on self-monitoring. Behavior Therapy, 7, 89-95.
Epstein, L. H., Webster, J. S. y Miller, P. M. (1975). Accuracy and controlling effects of self-
monitoring as a function of concurrent responding and reinforcement. Behavior The-
rapy, 6, 654- 666.
Ernst, F. (1973). Self-recording and counterconditioning of a self-mutilative compulsion. Be-
havior Therapy, 4, 144-146.
Farmer, R. y Nelson-Gray, R. O. (1990). The accuracy of counting versus estimating event
frequency in behavioral assessment: The effects of behavior frequency, number of beha-
viors monitored, and time delay. Behavioral Assessment, 12, 425-442.
Farrell, A. D. (1991). Computers and behavioral assessment: Current applications, future
possibilities, and obstacles to routine use. Behavioral Assessment, 13, 159-179.
Fixsen, D. L., Phillips, E. L. y Wolf, M. M. (1972). Achievement Place: The reliability of self-
reporting and peer-reporting and their effects on behavior. Journal of Applied Behavior
Analysis, 5, 19-30.
Flowers, J. V. (1972). Behavior modification of cheating in an elementary school student: A
brief note. Behavior Therapy, 3, 311-312.
Frederiksen, L. W. (1975). Treatment of ruminative thinking by self- monitoring. Journal of
Behavior Therapy and Experimental Psychiatry, 6, 258-259.
Frederiksen, L. W., Epstein, L. H. y Kosevsky, B. P. (1975). Reliability and controlling ef-
fects of three procedures for self-monitoring smoking. Psychological Record, 25, 255-264.
La autoobservación
363
ic, 5;yay Snyder, M. (1991). Taxonomic analysis redux: Some statistical considerations
or testing a latent class model. /:ournal ofPersonality and Social Psychology, 61, 141-146.
Goldstein, A. y Brown, B. W. (1970). Urine testing schedules in methadone maintenance treat-
3 of q a Journal of the American Medical Association, 214, 311-315.
MA a eee> toES
logy, 39, 273-281.
Hamilton, S. B. y Bornstein, P. H. (1977). Increasing the accuracy of self-recording in speech
anxious undergraduates through the use of self-monitoring training and reliability enhan-
cement procedures. Journal of Consulting and Clinical Psychology, 45, 1076-1085.
Hannunm, J. W., Thoresen, C. E. y Hubbard, D. R. (1974). A behavioral study of self-esteem
with elementary teachers. En M. J. Mahoney y C. E. Thoresen (dirs.), Self control: Power
to the person. Monterrey. Brooks-Cole.
Hasher, L. y Zacks, R. T. (1979). Automatic and effortful processes in memory. Journal of
Experimental Psychology: General, 108, 356-388.
Hasher, L. y Zacks, R. T. (1984). Automatic processing of fundamental information. Ameri-
can Psychologist, 39, 1372-1388.
Hay, L. R., Hay, W. M. y Angle, H. V. (1977). The reactivity of self-recording: A case report
of a drug abuser. Behavior Therapy, 8, 1004-1007.
Hayes, S. C. y Cavior, N. (1977). Multiple tracking and the reactivity of self-monitoring; L.
Negative behaviors. Behavior Therapy, 8, 819-831.
Hendricks, C. G., Thoresen, C. E. y Hubbard, D. R. (1973). Effects of behavioral self-obser-
vation on elementary teachers and students. Manuscrito inédito.
Herbert, E. Y. y Baer, D. M. (1972). Training parents as behavior modifier: Self-recording of
contingent attention. Journal ofApplied Behavior Analysis, 5, 139-149.
Horan, J. J. y Johnson, R. G. (1971). Coverant conditioning through a self-management ap-
plication of the Premack principle: Its effect on weight reduction. Journal of Behavior
Therapy and Experimental Psychiatry, 2, 243-249.
Hutzell, R. R., Platzek, D. y Logue, P. E. (1974). Control of symptoms of Gilles de la Tou-
E Syndrome by self-monitoring. Journal of Behavior Therapy and Experimental
Psychiatry, 5, 71-76.
Jackson, B. (1972). Treatment of depression by self-reinforcement. Behavior Therapy, 3,
298-307.
Jason, L. (1975). Rapid improvement in insomnia following self- monitoring. Journal of Be-
havior Therapy and Experimental Psychiatry, 6, 349-350,
Johnson, S. M. y White, G. (1971). Self-observation as an agent of behavioral change. Beha-
vior Therapy, 2, 488-497.
Kanfer, F. 11-976) The many faces of self-control, or behavior modification changes its fo-
cus. Comunicación presentada en The Eighth International Banff Conference.
Kazdin, A. E. (1974a). Reactive self-monitoring: The effects of response desirability, goal set-
ting, and feedback. Journal of Consulting and Clinical Psychology, 42, 704-716.
Kazdin, A. E. (1974b). Self-monitoring and behavior change. En M. J. Mahoney y C. E. Tho-
resen (dirs.), Self-control: Power to the person. Monterrey. Brooks-Cole.
Kirby, K. C., Fowler, S. A. y Baer, D. M. (1991). Reactivity in self-recording: Obtrusiveness
of recording procedure and peer comments. Journal of Applied Behavior Analysis, 24,
487-498.
Kolb, D. A., Winter, S. K. y Berlew, D. E. (1968). Self-directed behavior change: Two stu-
dies. Journal ofApplied Behavior Science, 4, 453-471.
Komaki,].y Dore-Boyce, K. (1978). Self-recording; Its effects on individuals high and low in
motivation. Behavior Therapy, 9, 65-72. )
Kubany, E. S. y Sloggett, B. B. (1973). Coding procedures for teachers. Journal of Applied
Behavior Analysis, 6, 339-344.
Lando, H. A. (1975). An objective check upon self-reported smoking levels: A preliminary

report. Behavior Therapy, 6, 547-549. |
Lang, P. J. (1968). Fear reduction and fear behavior: Problems in treating a construct. Re-
search in Psychotherapy, 3, 90-102.
Layne, C. C., Rickard, H. C., Jones, M. T. y Lyman, R. D. (1976). Accuracy of self-monito-
ring on a variable ratio schedule of observer verification. Behavior Therapy, 7, 481-488.
Leitenberg, H., Agras, W. S., Thompson, L. E. y Wright, D. E. (1968). Feedback in behavior
modification: Án experimental analysis in two phobic cases. Journal of Applied Behavior
Analysis, 1, 131-137. :
Lennox, R. (1988). The problem with self-monitoring: A two-sided scale and a one-sided
theory. Journal of Personality Assessment, 52, 58-73. |
Lindsley, O. R. (1968). A reliable wrist counter for recording behavior rates. Journal of Ap-
plied Behavior Analysis, 1, 77-78.
Lipinski, D. P., Black, J. L., Nelson, R. O. y Ciminero, A. R. (1975). The influence of motiva-
tional variables on the reactivity and reliability of self-recording. Journal of Consulting
and Clinical Psychology, 43, 637-646. :
Lipinski, D. P. y Nelson, R. O. (1974). Problems in the use of naturalistic observation as a
means of behavioral assessment. Behavior Therapy, 42, 118-123.
Mahoney, M. J. (1971). The self-management of covert behavior: A case study. Behavior
Therapy, 2, 575-578.
Mahoney, M. J. (1974a). Count on it: A simple self-monitoring device. Behavior Therapy, 5,
701-703.
Mahoney, M. J. (1974b). Self-reward and self-monitoring techniques for weight control. Be-
Mahoney, M. J. (1977). Some applied issues in self-monitoring. En J. D. Cone y R. P. Haw-
kins (dirs.), Behavioral assessment: New directions in clinical psychology. Nueva York.
Brunner/Mazel.
Mahoney, M. J., Moore, B. S., Wade, T. C. y Moura, N. G. M. (1973). The effects of conti-
nuous and intermittent self-monitoring on academic behavior. Journal of Consulting and
Mahoney, M. J., Moura, N. G. M. y Wade, T. C. (1973). The relative efficacy of self-reward,
self-punishment, and self-monitoring techniques for weight loss. Journal of Consulting
and Clinical Psychology, 40, 404-407.
Maletzky, B. M. (1974). Behavior recording as treatment: A brief note. Behavior Therapy, 5,
107-111.
Martin, G. L. y Hrydowy, E. R. (1989). Self-monitoring and self-managed reinforcement
procedures for improving work productivity of developmentally disabled workers: A re-
view. Behavior Modification, 13, 322-339.
Mattos, R. L. (1968). A manual counter for recording multiple behavior. Journal of Applied
Behavior Analysis, 1, 130.
McFall, R. M. (1970). Effects of self- monitoring on normal smoking behavior. Journal of
Consulting and Clinical Psychology, 35, 135-142.
McFall, R. M. (1976). Parameters of self-monitoring. Comunicación presentada en The
Eighth International Banff Conference on Behavior Modification.
Mckall, R. M. y Hammen, C. L. (1971). Motivation, structure, and self-monitoring: Role of
nonspecific factors in smoking reduction. Journal of Consulting and Clinical Psycholo
37, 80-86. A
McKenzie, T. L. y Rushall, B. S. (1974). Effects of self-recording on attendance and perfor-
mance 1n a competitive Swimming training environment. Journal of Applied Behavior
Analysis, 7, 199-206.
McLaughlin, J. G. y Nay, W. R. (1975). Treatment of trichotillomania using positive cove-
rants and response cost: A case report. Behavior Therapy, 6, 87-91.
La autoobservación
365
McNamara, J. R. (1972). The use of self-monitoring techniques to treat nail biting. Behavionr
Research an Therapy, 10, 193-194.
Miller, P. M., Hersen, M., Eisler, R. M. y Watts, J. G. (1974). Contingent reinforcement of
lo-
wered blood alcohol levels in an outpatient chronic alcoholic. Behaviour Research and
Therapy, 12, 261-263.
Nelson, R. O., Hay, L. R. y Hay, W. M. (1977). Cue versus consequence functions of high
probability behaviors in the modification of self-monitored study coverants and study
time. Psychological Record, 3, 589-599.
Nelson, R. O., Hay, L. R., Hay, W. M. y Carstens, C. B. (1977). The reactivity and accuracy
ice self-monitoring of positive and negative classroom verbalizations. Behavior
erapy, 8, 972-985.
Nelson, R. O., Hay, L. R., Devany, ]. y Koslow-Green, L. (1980). The reactivity and accu-
racy of children's self-monitoring: Three experiments. Child Behavior Therapy, 2, 1-24.
Nelson, R. O., Lipinski, D. P. y Black,].L. (1975). The effects of expectancy on the reactivity
of self-recording. Behavior Therapy, 6, 337-349.
Nelson, R. O., Lipinski, D. P. y Black, J. L. (1976). The relative reactivity of external observa-
tions and self-monitoring. Behavior Therapy, 7, 314-321.
Nelson, R. O., Lipinski, D. P. y Boykin, R. A. (1978). The effects of self-recorders” training
and the obtrusiveness of the self-recording device on the accuracy and reactivity of self-
monitoring. Behavior Therapy, 9, 200-208.
Nelson, C. M. y McReynolds, W. T. (1971). Self-recording and control of behavior: A reply
to Simkins. Behavior Therapy, 2, 594-597.
Nelson-Gray, R. O., Herbert, D. L., Herbert, J. D., Farmer, R., Badawi, I. y Lin, K. (1990).
The accuracy of frequency estimation as compared with actual counting 1n behavioral as-
sessment. Behavioral Assessment, 12, 157-178.
Nietzel, M. T., Bernstein, D. A. y Russell, R. L. (1988). Assessment of anxiety and fear. En
A. S. Bellack y M. Hersen (dirs.), Behavioral assessment: A practical handbook (3.2 ed.).
Nueva York. Pergamon Press. 4
Orne, M. T. (1970). From the subject's point of view, when is behavior private and when is it
public: Problems of inference. Journal of Consulting and Clinical Psychology, 35, 143-147.
Peterson, A. L. y Azrin, N. H. (1992). An evaluation of behavioral treatments for Tourette
syndrome. Behaviour Research and Therapy, 30, 167-174.
Peterson, G. L., House, A. E. y Alford, H. F. (1975). Self-monitoring: Accuracy and reacti-
vity in a patients's recording of three clinically targeted behaviors. Comunicación presen-
tada en The Sutheastern Psychological Association. Atlanta, EEUU.
Richards, C. S., McReynolds, W. T., Holt, S. y Sexton, T. (1976). Effects of information feed-
back and self-administered consequences on self-monitoring study behavior. Journal of
Counseling Psychology, 23, 316-321.
Romanczyk, R. G. (1974). Self-monitoring in the treatment of obesity: Parameters of reacti-
vity. Behavior Therapy, 5, 531-540. e a
Rutner, 1. T. y Bugle, C. (1969). An experimental procedure for the modification of psycho-
tic behavior. Journal of Consulting and Clinical Psychology, 33, 651-653. 12
Samo, J. A., Tucker, J. A. y Vuchinich, R. E. (1989). Agreement between self-monitoring, re-
call, and collateral observation measures of alcohol consumption in older adults. Beha-
vioral Assessment, 11, 391-409. bil
Santogrossi, D. A. (1974). Selfereinforcement and external monitoring of perfomance on an
academic task. Comunicación presentadaenThe Fifty Annual Conference on Applie
Behavior Analysis in Education, Kansas City, EE UU. as
Schlundt, D. G. (1988). Self-monitoring analysis system. En M. Hersen y A.S. Bellack (dirs.),
Dictionary of behavioral assessment techniques. Nueva York. Pergamon Press. pá
o
Schlundt, D. G., Johnson, W. G. y Jarrell, M. P. (1985). A naturalistic functional analysis
eating behavior in bulimia. Advances in Behavior Research and Therapy, 7, 149-162.
Schwitzgebel, R. K. y Kolb, D. A. (1974). Changing human behavior: Principles ofplanned

intervention. Nueva York. McGraw-Hill. y cer ol,
Seymour, F. W. y Stokes, T. F. (1976). Self-recording in training girls to increase work and
evoke staff praise in an institution for offenders. Journal of Applied Behavior Analysis, 9,
41-54.
Shaw, D. L., Peterson, G. L. y Cone, J. D. (1974). Aides” reports of behavior modification
training: Experimental analysis of their validity. Comunicación presentada en The Sout-
heastern Psychological Association. Hollywood, EE UU.
Sheehan, D. J. y Casey, B. (1974). Communication. Journal of Applied Behavior Analysis, 7,
446.
Sieck, W. A. y McFall, R. M. (1976). Some determinants of self-monitoring effects. Journal of
Consulting and Clinical Psychology, 44, 958-965. .
Silber, K. P. y Haynes, C. E. (1992). Treating nailbiting: A comparative analysis of mild aver-
sion and competing rersponse therapies. Behavionr Research and Therapy, 30, 15-22.
Simkins, L. (1971). The reliability of self-recorded behaviors. Behavior Therapy, 2, 83-87.
Snyder, M. y Gangestad, S. (1986). On the nature of self- monitoring: Matters of assessment,
matters of validity. Journal of Personality and Social Psychology, 51, 125-139.
Sobell, L. C. y Sobell, M. B. (1973). A self-feedback technique to monitor drinking behavior
in alcoholics. Behavionr Research and Therapy, 11, 237-238.
Sobell, M. B., Bogardis, J., Schuller, R., Leo, G. I. y Sobell, L. C. (1989). Is self-monitoring of
alcohol consumption reactive? Behavioral Assessment, 11, 447-458.
Stumphauzer, J. S. (1974). Daily behavior card. Venice. Behaviometrics.
Thomas, D. R. (1971). Preliminary findings on self-monitoring for modifying teaching beha-
viors. En E. A. Ramp y B. L. Hopkins (dirs.), A new direction for education: Behavior
analysis. Lawrence. University of Kansas
Thomas, E. J., Abrams, K. S. y Johnson, J. B. (1971). Self-monitoring and reciprocal inhibi-
tion in the modification of multiple tics of Gilles de la Tourette's syndrome. Journal of
Behavior Therapy and Experimental Psychiatry, 2, 159-171.
Thoresen, C. E. y Mahoney, M. J. (1974). Behavioral self-control. Nueva York. Holt.
Tombari, M. L., Fitzpatrick, S. J. y Childress, W. (1985). Using computers as contingency
managers in self-monitoring interventions: A case study. Computers in Human Behavior,
1, 75-82.
Turkewitz, H., O'Leary, K. D. e Ironsmith, M. (1975). Generalization and maintenance of
appropriate behavior through self-control. Journal of Consulting and Clinical Psycho-
logy, 43, 577-583.
Vargas, J. M. y Adesso, V. J. (1976). A comparison of aversion therapies for nailbiting beha-
vior. Behavior Therapy, 7, 322-329.
Watson, E. y Tharp, R. (1972). Self-directed behavior: Self-modification for personal adjust-
ment. Monterrey. Brooks-Cole.
Williams, J. E. (1976). Self-monitoring of paranoid behavior. Behavior Therapy, 7, 562.
Williams, S. L. y Rappoport, A. (1983). Cognitive treatment in the natural environment for
agoraphobics. Behavior Therapy, 14, 299-313.
Willis, S. E. y Nelson, R. O. (1982). The effects of valence and nature of target behavior on
_ the accuracy and reactivity of self-monitoring. Behavioral Assessment, 4, 401-412.
Zimmerman, J. y Levitt, E. E. (1975). Why not give your client a counter: A survey of what
happened when we did. Behaviour Research and Therapy, 13, 333-337.
Avia,M. D. (1989). La autoobservación. En R. Fernández-Ballesteros y J. A. Carrobles

(dirs.), Evaluación conductual (5.* ed.). Madrid. Pirámide.
La autoobservación 367
Bornstein, P. H., Hamilton, S. B. y Bornstein, M. T (1986). Self-monitoring procedures. En

A.R. Ciminero, K. S. Calhoun y H. E. Adams (dirs.), Handbook of behavioral assessment
(2* ed.). Nueva York. Wiley.
De la Puente, M. L., Labrador, F. J.y De Arce, F. (1993). La autoobservación. En F. J. Labra-
dor, J. A. Cruzado y M. Muñoz (dirs.), Manual de modificación y terapia de conducta.
Madrid. Pirámide.
Ibáñez, I. (1993). La auto-observación. En W. Peñate, P. Matud e I. Ibáñez (dirs.), Evalua-
Nelson, R. O. (1977). Methodological issues in assessment via self- monitoring. En J. D.
Cone y R. P. Hawkins (dirs.), Behavioral assessment: New directions in clinical psycho-
logy. Nueva York. Brunner/Mazel.
Pérez-Alvarez, M. (1994). Teoría y técnicas de la autoobservación. En R. Fernández-Balles-
teros (dir.), Evaluación conductual hoy. Un enfoque para el cambio en psicología clínica y
de la salud. Madrid. Pirámide.
: 4debarioó "Rescerbad She Me
AA Schaller, E e Ly Sobel
: re? Bel , A
De harta cad,Yer
ho
rr EOS 007 “fren 3 nt oe ardeLio é
E Hai me Cl TA. ¿A aro derestian fa edo
p - Ps o
. y « sy OS
X AS 8 dJ> me EEN
Ú ha me e A Topas EY
NE » á = 50 al $
1] Z ú pa sra] ST
a mputera a
, ¡LÓ Fe ME E »
¿d.C Hd ki LA
] de AN
22 0On sad walírien vé
aseo Cinicas á
17. TÉCNICAS DE REGISTRO DE LA ACTIVIDAD MOTORA
WARREN W. TRYON
IL INTRODUCCIÓN
El comportamiento acarrea movimiento, conocido comúnmente como actividad.

Los monitores de la actividad responden a las fuerzas físicas asociadas a su localiza-
ción. Toda conducta externa, incluyendo permanecer inmóvil, tiene consecuencias
físicas. Por tanto, toda conducta motora influye en los datos de la actividad. La am-
plia relación inherente entre conducta y actividad confiere relevancia al estudio de la
actividad en cualquier investigación sobre la conducta. La actividad normal se carac-
teriza por el ritmo circadiano de períodos de sueño, descritos básicamente como
inactividad, y períodos de vigilia, que muestran una amplia gama de niveles de activi-
dad dependientes de la conducta del sujeto. Muestras de conducta suficientemente
amplias revelan diferencias individuales de actividad. Trastornos de la conducta
como las manías pueden reducir o incrementar la actividad, e igualmente pueden al-
terar los ritmos de sueño y vigilia. En resumen, la actividad motora es un atributo
esencial de las conductas normales y anormales. El objetivo de este capítulo es dar a
conocer el instrumental disponible para registrar la actividad motora, así como su
utilización y una selección de sus aplicaciones.
El registro de los movimientos constituyó el primer procedimiento para evaluar
la actividad motora; éstos son fáciles de obtener y no requieren una preparación, mé-
todo ni equipo especiales. Normalmente, estos registros son realizados por los pa-
dres, los profesores, los compañeros, e incluso los propios sujetos. La mayoría de las
escalas de estimación de la actividad ha sido desarrollada para evaluar a niños consi-
derados hiperactivos. Entre las escalas más comunes para evaluar la actividad se en-
cuentran las siguientes: la Conners teacher rating scale (CTRS) [Escala Conners de es-
timación del profesor] (Conners, 1969; Werry, Sprague y Cohen, 1975; Goyette,
Conners y Ulrich, 1978), la Revised behavior problem checklist (RBPC) [Lista revisa-
da de problemas de conducta] (Quay y Peterson, 1987), y el Teacher report form
(TRE) [Cuestionario-informe del profesor] (Edelbrock y Achenbach, 1984). Desgra-
ciadamente, las estimaciones eran el método menos objetivo, en particular cuando
las realizaba la misma persona en estudio.
Dos de las consecuencias físicas más importantes de la actividad son el movi-
miento en el espacio y la aceleración (la estimación del cambio de movimiento por
unidad de tiempo). En este capítulo describiremos varios aparatos que registran el
movimiento y la aceleración de modo constante. El registro instrumental de la acti-
vidad motora está justificado por ocho motivos:
Fordham University (EE UD).

370 Warren W. Tryon
a. Los datos obtenidos son objetivos ya que los aparatos no están influidos por
las características raciales, de sexo o sociales.
b. Lafiabilidad de los aparatos de registro de la actividad motora se ha demos-
trado en condiciones de laboratorio (Tryon, 1985, 1991).
c. Los registros han sido validados en condiciones de laboratorio (Tryon,
1985, 1991).
d. A diferencia de las escalas de estimación, que confunden actividad con agre-
sión (Hinshaw, 1987), los datos instrumentales de la actividad motora son
unidimensionales.
e. Los aparatos de registro son portátiles y por consiguiente permiten obtener
datos útiles del colegio, la casa y/o el trabajo.
f.. Las características de operación de los aparatos son más estables en el tiem-
po que los observadores.
g. Los aparatos no violan la intimidad de los sujetos como sucede con los ob-
servadores.
h. Los datos instrumentales de la actividad motora constituyen en la actualidad
una buena inversión (Tryon, 1991).
Comenzaremos nuestra discusión considerando el papel teórico que juega la ac-

tividad en el temperamento, el desarrollo de la personalidad y la psicopatología.
Realizaremos una revisión de los instrumentos disponibles seguida de una discusión
de su fiabilidad y validez. La fiabilidad instrumental es independiente de la refuta-
ción clínica, que depende ampliamente de los sujetos portadores de los aparatos.
Describiremos los procedimientos para obtener medidas de la actividad que inclu-
yen la selección del instrumental y su lugar de colocación. Asimismo, se discutirán
ejemplos de situación y la duración del muestreo. Finalmente, se considerarán las
aplicaciones relacionadas con los trastornos del sueño en niños y adultos.
11. La actividad como factor del temperamento

Zuckerman (1991) relaciona la actividad motora con el temperamento y la persona-
lidad, sosteniendo que la actividad es uno de los nueve rasgos que definen al del tem-
peramento y que es evaluado como el segundo más fiable; este autor identifica la ac-
tividad como uno de los cinco factores primarios de la personalidad. Por su parte,
Buss y Plomin (1984) concluyen que la actividad es uno de los “tres grandes” facto-
res de la personalidad. Por su parte, Kagan y Snidman (1991) también discuten la im-
portancia de la actividad motora en el temperamento infantil.
12. La hiperactividad como factor de externalización de trastornos

en la infancia
La psicopatología infantil se divide generalmente en dos tipos: trastornos internos
(introversión, ansiedad, inhibición...) y trastornos externos (agresividad, hiperactivi-
dad...) (Hinshaw, 1987, 1992). Veintisiete de los cuarenta y seis factores presentes en
Técnicas de registro de la actividad motora 371
estudios de psicopatología infantil revelan un factor de hiperactividad; deficiencias

metodológicas en la mayoría de los estudios restantes impidió que se descubriera
este factor. Los intentos por aislar la hiperactividad como factor independiente del
déficit de atención y la agresión han estado obstaculizados por el uso de escalas para
evaluar las tres variables a la vez. Las medidas instrumentales de la actividad están
dotadas de la necesaria independencia metodológica, validez de contenido y sensibi-
lidad para evaluar adecuadamente el grado en que la actividad es independiente de
los déficit de atención y la agresión. Los trabajos publicados deben reelaborarse em-
pleando monitores de la actividad para obtener muestras de conducta representati-
vas antes de extraer conclusiones firmes sobre la independencia factorial del exceso
de movimiento.
13. ElDSM
Tryon (1986, 1989, 1991) ha revisado el importante papel que juega la actividad mo-
tora en los manuales de diagnóstico DSM-I, DSM-II, DSM-I11 y DSM-IIER en niños y
adultos. La lista más completa que considera a la actividad motora como criterio de
inclusión y exclusión aparece en Tryon (1989), llegando a identificar 46 categorías en
el DSM-II1-R (American Psychiatric Association, 1987) que incluyen la actividad mo-
tora en sus criterios de inclusión. Esta lista puede ampliarse considerando los crite-
rios de diagnóstico diferencial.
La actividad en el sueño merece una especial atención. Actígrafos basados en la
variable tiempo obtienen y registran medidas de la actividad a intervalos prefijados
(épocas). La vigilancia (o insomnio) puede determinarse registrando la actividad de
la muñeca (Tryon, 1991). Por tanto, es posible determinar el tiempo en que el movi-
miento se reduce a niveles afines al sueño. La vigilancia periódica durante la noche se
detecta por el incremento de la actividad de la muñeca. Tales datos pueden detectar
también los trastornos del ritmo sueño-vigilia, el sonambulismo, la ansiedad durante
el sueño y los terrores nocturnos.
IU. INSTRUMENTOS PARA EL REGISTRO DE LA ACTIVIDAD MOTORA
Existe en el mercado una amplia gama de instrumentos para la medida objetiva de la

actividad (Tryon, 1985, 1991). Por limitación de espacio nos ceñtiremos a unos co-
mentarios sobre cada aparato. El propósito de esta sección es identificar elmodo en
que cada instrumento registra la actividad y por tanto aclarar lo que registra cada
uno de ellos, ayudando así a seleccionar el más adecuado.
11. Podómetros
Los podómetros tradicionales son dispositivos mecánicos que se llevan en la cintura

cin-
y permiten registrar la distancia recorrida. El caminar hace elevar y descender la
372 Warren W. Tryon
tura regularmente; este movimiento vertical incrementa la cuenta de un dial o una

pantalla digital en proporción directa al ajuste de los pasos. Asimismo, cualquier
movimiento vertical de la cintura o cualquier otra parte del cuerpo a laque se ajuste
se registrará en el contador, incluyendo el arrodillarse o ponerse de pie. Los podó-
metros ignoran el movimiento en los otros dos planos.
Si se selecciona un kilómetro como unidad de medida, el paso debe ajustarse para
que la persona camine una distancia fija. Este procedimiento se repite hasta que el
dial lea la distancia fijada. Caminar a una mayor distancia produce unos ajustes del
paso más exactos. El mejor procedimiento es ajustar el regulador del paso al máximo
de forma que el dispositivo tenga la mayor respuesta. Se hace caminar al sujeto una
distancia fija una vez y se registra la medida del podómetro. Si tras caminar 500 me-
tros indica 700 habrá que multiplicar todas las lecturas posteriores por 500/700 =
0,71 para obtener los metros recorridos.
El contador de pasos (por ejemplo, Radio Shack 63-671 Micronta Walkmate) es
similar al podómetro en el tipo de registro del movimiento vertical pero su pantalla
es superior. La pantalla de cinco dígitos proporciona un registro exacto de los movi-
mientos verticales. Estos registros pueden convertirse en distancias caminando dis-
tancias fijadas. Los podómetros y contadores de pasos son contadores de la frecuen-
cia del movimiento insensibles a la intensidad del mismo.
12. Medidores de la inclinación
La unidad de Large scale integrated (LSI) [Gran escala integrada '] contiene un único
interruptor de mercurio que responde a una inclinación de 5 grados a partir del pla-
no horizontal (McPartland, Kupfer y Foster, 1976; McPartland y cols., 1976). Schul-
man, Stevens y Kupst (1977) describen un sistema tridimensional basado en tres in-
terruptores situados a 120 grados uno de otro. Estos dispositivos son también
contadores de frecuencia de movimiento y son insensibles a la intensidad del mismo.
Si un medidor de la inclinación de un solo eje se ajusta a la cintura de forma que res-
ponda al movimiento vertical, funcionará como los contadores de pasos. El ajuste a
la muñeca o al tobillo permite registrar el movimiento en otros planos puesto que el
lugar de ajuste pasa por estos planos en el movimiento.
13. Medidores del movimiento
Los medidores del movimiento son relojes automáticos modificados de forma que el
rotor que da cuerda mueve directamente el minutero. Schulman y Reisman (1959)
describieron el medidor de movimiento por primera vez, y Tryon (1985) describe el
mecanismo de funcionamiento con detalle. Los movimientos fuertes en los dos pla-
nos en que opera el rotor harán que se mueva más que movimientos suaves o mode-
rados. Su único inconveniente reside en que no están disponibles comercialmente.
' GMM Electronics, Inc., 1200 Riverview Drive, Verona (Pa). 15147.
Técnicas de registro de la actividad motora
373
En la era de los relojes digitales, los relojes automáticos son difíciles de encontrar y
han de ser modificados por un relojero o por uno mismo.
14. Medidores de la aceleración
El prototipo del Motionlogger? es un monitor de actividad informatizado (6,4 x 8,9

x 1,9 cm de tamaño y 85 gr de peso) que se ajusta a la muñeca, la cintura o el tobillo.
Redmond y Hegge (1985) describen un prototipo de este aparato. Su sensor es un
balancín voladizo uniaxial que responde al movimiento con una vibración. Lleva un
reloj interior que puede programarse para iniciar el registro de datos en una fecha ya
una hora y minuto determinado. Recoge los datos de un usuario en un período que
va de un segundo a 99 minutos y 99 segundos, y almacena los resultados en una me-
moria de 16 kilobits (K). Unidades más modernas llevan una memoria de 32K de la
que 28K se dedican a datos y 4K a programas. Al conectar el aparato, el usuario pue-
de seleccionar dos modos de funcionamiento. En el modo más frecuente, cruce del
cero, los cambios por unidad de tiempo del voltaje de la polaridad asociados a las os-
cilaciones del sensor de la vibración son contados y almacenados en la memoria
siempre que la intensidad del movimiento exceda el umbral de 0,1 g (g= 9,8 m/s) tras
ser procesado por un filtro con espectro de banda entre 0,1 y 3,0 Hz. También se
puede obtener la medida analógica bruta del balancín piezoeléctrico. Este aparato es
insensible a la magnitud del movimiento.
El Mini-motionlogger? es una versión más pequeña, ligera y avanzada del ante-
rior. Sus medidas son 3,8 x 3,3 x 1,0 cm, y se ajusta a la muñeca con una correa de re-
loj. Pesa 57 gramos y tiene una memoria de 32K de los que aproximadamente 28K
son para datos y 4K para programas. El usuario selecciona varias opciones al conec-
tar el aparato: de uno a cinco filtros de espectro de banda (0,1-1,0 Hz; 0,1-3,0 Hz;
0,1-9,0 Hz; 2,0-3,0 Hz; 2,0-9,0 Hz), un umbral elevado (0,1 g) o bajo (0,25 g) y un
incremento alto o bajo (escala 5:1). Los períodos de recogida de datos se pueden se-
leccionar desde un segundo a una hora. Los datos de cruce del cero y del tiempo por
encima del umbral se recogen simultáneamente. También se realiza la lectura analó-
gica bruta del balancín piezoeléctrico. Un botón de verificación de marcha produce
un pitido que permite comprobar el funcionamiento. Existe un equipo impermeable
que funciona con baterías de botón de 3,0 voltios. Una batería tiene una duración de
diez días empleando un período de grabación de un minuto antes de que el aparato
se autoconecte a baja potencia durante dos semanas en las que se pueden obtener los
datos sin pérdidas. >
Borbely (1986) describe un aparato de medida del movimiento ambulatorio que
filtra con un espectro de banda (0,25 a 3,0 Hz) la señal analógica y registra la activi-
dad superior al umbral de 1 g en períodos superiores a 30 segundos, almacenando la
suma resultante en 32K de memoria.
Cuando el Motionlogger y el Mini-motionlogger están grabando en modo um-
bral, los movimientos por encima del umbral ponen en marcha un contador de
NY 10502.
2 Marca registrada de Ambulatory Monitoring, Inc., 731 Saw Mill River Road, Ardsley,
3 Marca registrada de Ambulator y Monitoring , Inc.
374 Warren W. Tryon
10Hz. Los registros de esta actividad se acumulan en el intervalo seleccionado y se

almacenan en la memoria. Cada unidad registra 0,1 segundos por encima del umbral
por lo que se trata de una medida de duración. y
El Actilume* contiene un medidor de la aceleración lineal de 0,1 a 5 g antichoque. Su
lectura es digitalizada 20 veces por segundo (20 Hz) por un chip analógico-digital de 8
bits que le permite distinguir entre 2* = 256 niveles de intensidad del movimiento. La
suma de todos los movimientos y el movimiento máximo registrado en cada período
(seleccionable por el usuario de dos segundos a una hora) se almacenan en una memoria
de 32K. Su circuito A/D de 4 canales también registra las lecturas de un fotodiodo (de
0,01 a 100000 luxes con filtro verde) a intervalos de un segundo (1 Hz). El aparato tiene
un tamaño de 7,0x 3,8 x 2,2 cm y pesa 100 gr (Cole, Kripke y Gruen, 1990).
El Caltrac? contiene un medidor de la aceleración lineal y circuitos que registran
el movimiento o el consumo de calorías estimado con arreglo a los datos del peso,
estatura y edad introducidos con su teclado.
III. FIABILIDAD
Los intentos por establecer la fiabilidad de los aparatos de medida del movimiento
por métodos de ensayo y reensayo están condenados a fallar ya que no se puede es-
perar que los sujetos respondan dos veces con movimientos idénticos de los miem-
bros y del tronco. Una consecuencia deseable de la utilización de equipos para regis-
trar el movimiento es que se puede evaluar su fiabilidad en condiciones de
laboratorio bien controladas, independientes de la conducta del sujeto de estudio.
Este es el único método fiable para evaluar las características de respuesta de un ins-
trumento. A menudo se confunde la fiabilidad con la replicabilidad. A continuación
intentamos aclarar la diferencia.
mi. Fiabilidad instrumental
La consistencia con la que un monitor del movimiento responde puede ser evaluada
mejor sometiéndolo repetidamente al mismo estímulo bien definido. Tal ensayo
debe realizarse en condiciones de laboratorio y con un equipo de precisión.
111.11. Podómetros
Saunders, Goldstein y Stein (1978) hicieron vibrar mecánicamente 36 podómetros a

una distancia media de 37,5 millas y obtuvieron un margen de coincidencia de
0,5 millas, que resulta en 0,5 x 37,5 = 1,3% de error. Para que 1 — 7” sea 0,013, r debe
ser igual a 0,99. En un estudio similar, Heiser, Epstein y Wing (1981) señalan que el
* Marca registrada de Ambulatory Monitoring, Inc.

> Hemokinetics, Inc., 2923 Osmundsen Road, Madison, W1 53771.
375
91% de los podómetros estaba dentro del 5% de 6 millas tras 30 minutos de vibra-
ción. Tryon, Pinto y Morrison (1991) hicieron oscilar 7000 veces 19 podómetros di-
gitales en siete pruebas con el resultado de un 4,75% de error de media; para 1-7
igual a 0,0475, r debe ser igual a 0,98.
111.1.2.. Medidores de la inclinación
Debido a que la unidad Large scale integrated (LS1) descrita anteriormente incre-
menta el registro en una unidad cada 15 registros, existe una imprecisión adicional de
15 unidades. McGowan y cols. (1984) hicieron oscilar dos unidades LS7 a 160 movi-
mientos horizontales por minuto en dos pruebas de 30 minutos. El primer aparato
dio unos registros de 4896 y 4864 en las dos pruebas. La diferencia de 32 registros
proporciona una fiabilidad de 99,34% [1-32/((4896 + 4864)/2)]; el segundo aparato
dio registros idénticos de 4768 en ambas pruebas con un 100% de fiabilidad.
111.13. Medidores del movimiento
Tryon (1985) describió la fabricación de un oscilador mecánico y obtuvo los datos

de fiabilidad de cuatro medidores del movimiento estudiados en 10 pruebas en cada
uno de los 8 niveles de movimiento acelerado; las equivalencias correlativas de los
coeficientes de variación observados oscilaban entre 0,88 y 0,99.
111.1.4. Medidores de la aceleración
Tryon (1991) evaluó la fiabilidad del Motionlogger empleando un péndulo disponi-

ble en el mercado (Precision Control Design, Inc.), y presenta gráficas de resultados
que muestran que el Motionlogger es altamente consistente y fiable tanto en el modo
cruce del cero como en el de umbral. La fiabilidad del Mini-motionlogger y el apara-
to de Borbely han de ser igualmente fiables. Este mismo autor presenta gráficas de
resultados de cuatro pruebas con péndulo del Actilume; los cuatro gráficos del
modo Sum son extremadamente parecidos a los cuatro del modo Max. No se han
encontrado evaluaciones en laboratorio del Caltrac pero probablemente serán alta-
mente fiables puesto que emplea un medidor de la aceleración lineal como sensor.
m2. Refutación clínica

El grado con el que la repetición de las medidas del movimiento produce los mismos
resultados depende en parte de la consistencia con la que el instrumento registra
exactamente la misma entrada y el grado con que la entrada permanece constante. La
consistencia instrumental (fiabilidad) se evalúa mejor en el laboratorio. Como los
instrumentos de precisión son muy consistentes, la mayor parte de la variación re-
sultante de las medidas de la conducta se debe a variación en el sujeto.
376 Warren W. Tryon
Unas poblaciones de sujetos son más variables que otras. La variación de con-
ducta de niños hipercinéticos y retardados es bien conocida. Se pueden obtener me-
didas de actividad refutables de tales sujetos de dos modos. El primero es colocarlos
en circunstancias muy poco representativas que requieran un nivel de movimiento
específico. La escasa validez de este enfoque es problemática. El segundo es extender
la muestra de conducta en proporción directa a la variación observada y consiguien-
temente producir un resultado medio de refutación. La investigación previa y/o los
datos piloto determinarán mejor la duración del intervalo de muestra necesario para
producir resultados refutables. Tryon (1991) presenta datos que indican que mues-
tras de conducta del movimiento de muñeca de una semana y especialmente de dos
empleando medidores del movimiento coinciden con muestras de conducta de un
mes de forma consistente.
IV. VALIDEZ
Iv.1. Podómetros y contadores de pasos
Como los podómetros responden al movimiento vertical asociado a la locomoción,
el caminar distancias mayores siempre producirá valores más altos que caminar dis-
tancias más cortas. Los dos aspectos más importantes son la escala y la sensibilidad.
a. Escala. Los podómetros tienen ajustes del paso que determinan cuánto cam-
biará el contador en respuesta a cada movimiento vertical. Se puede hacer caminar al
sujeto repetidamente y ajustar el índice del paso hasta lograr el grado de precisión
deseado, o bien se puede ajustar el índice del paso al máximo y determinar una cons-
tante de conversión empírica para cada sujeto. Si caminar un kilómetro produce una
lectura de 1,4 kilómetros, todos los valores siguientes se dividen por 1,4 para obtener
los kilómetros caminados. Con los contadores de pasos se puede determinar directa-
mente los pasos/millas caminando una distancia fija (1/4 ó 1/2 milla) y extrapolando.
Caminar una sola vez es suficiente, cuanta más distancia mejor.
b. Sensibilidad. Aquí nos interesa la diferencia de movimiento más pequeña
que puede registrar cada aparato. Los contadores de pasos son extremadamente sen-
sibles porque muestran digitalmente cada movimiento que detectan. Los podóme-
tros varían en el grado en que sus indicadores cambian perceptiblemente en respues-
ta al movimiento. Es probable que dos personas lean los indicadores de los
podómetros de forma diferente. Esto no ocurre con los contadores de pasos y cons-
tituye una razón de peso para preferirlos a los podómetros.
1v2. Medidores de la inclinación
Estos aparatos contienen interruptores de mercurio y registran los cambios de posi-

ción con respecto al eje horizontal de un mínimo de 5 grados. Los resultados de fia-
bilidad presentados antes (McGowan y cols., 1984) de 4896, 4864 y 4768 estaban
377
muy próximosa los valores esperados de 30 min x 160 movim. horiz/min = 4800
re-
gistros de movimiento. Sin embargo, los interruptores de mercurio de los medidores
de la inclinación no pueden determinar si el movimiento fue más de 5 grados o si fue
rápido o lento (Tryon, 1985, 1991).
1V3. Medidores de la aceleración
La disminución de movimiento de un péndulo de baja fricción se puede comprobar

con exactitud en los modos de cruce del cero y umbral del Motionlogger. La medida
de error asociada a los convertidores A/D normalmente se ajusta a 1 bit, lo que hace al
Actilume exacto hasta 1/256 =0,0039, ó 99,61% (Tryon, 1991). Cuando los investiga-
dores examinan la validez de un monitor del movimiento se interesan por la medida
de otros datos de interés distintos de los correlatos físicos del movimiento para el que
fue diseñado (validez de constructo). Por ejemplo, Montoye y cols. (1983) obtuvie-
ron una correlación de 0,79 entre la aceleración vertical y el consumo de oxígeno.
V. PROCEDIMIENTO
El registro de la actividad motora requiere de un procedimiento que incluye diferen-

tes pasos: selección de un aparato, seleccionar el lugar de fijación, obtención de me-
didas válidas y continuar la evaluación hasta obtener datos representativos.
v.1. Selección del aparato

Si no fuera por el precio, siempre se seleccionaría el aparato que suministrase más in-
formación; por ejemplo, el Actilume es un aparato capaz de discriminar entre 256 ni-
veles de movimiento, registra con precisión datos en períodos de tiempo fijos duran-
te 24 horas al día en días múltiples, dependiendo de la selección de tiempo y
almacena los datos en la memoria para el posterior análisis. La elección del resto de
los aparatos se hace de acuerdo con las propiedades de una o más medidas.
El Motionlogger, el Mini-motionlogger, el aparato de Boberly, los contadores de
pasos, los podómetros y los medidores de la inclinación son insensibles a la magni-
tud del movimiento. El Caltrac, y hasta cierto punto el medidor de la aceleración, re-
tienen la proporcionalidad en que los movimientos más vigorosos producen lecturas
mayores. Afortunadamente, los excesos motrices parecen caracterizarse tanto por
movimiento frecuente como intenso. En este caso ha de decidirse si nos podemos
permitir ignorar la intensidad del movimiento. Unicamente el Actilume, el Motion-
logger, el Mini-motionlogger, el aparato de Boberly y la unidad LS] registran y alma-
cenan los datos del movimiento en períodos prefijados. Todos los demás aparatos
dependen del sujeto o de otra persona para registrar la hora del día del comienzo de
la medida, la hora a la que se toman medidas posteriores y la hora a la que finaliza la
medida.
378 Warren W. Tryon
Algunos niños y adultos realizan autorregistros de hasta dos semanas con preci-
sión. También se puede emplear personal entrenado. La mayoría de los padres y
profesores aporta datos útiles. Los sujetos con grandes depresiones a menudo fraca-
san en las pruebas más simples de autorregistro del movimiento. El movimiento du-
rante el sueño y el despertar de madrugada es especialmente difícil de registrar con
exactitud sin una base temporal.
Los datos basados en el tiempo permiten posteriormente localizar períodos de
especial interés, en combinación con los datos de la actividad diaria, y hacer compa-
raciones cuantitativas entre dichos intervalos. El análisis de series temporales presu-
pone períodos iguales a lo largo de toda la duración del estudio. Sólo los aparatos
que se basan en el tiempo pueden satisfacer con rigor este requisito metodológico.
Los aparatos que se basan en el tiempo no son necesarios cuando sólo se requiere
una única medida acumulada del movimiento por día. Por ejemplo, se registra el
tiempo y los pasos de un sujeto desde que se viste por la mañana hasta que se desvis-
te para acostarse. Se pueden calcular los pasos por minuto del tiempo que pasa vest1-
do y así distinguir con claridad los días más activos de los menos activos.
A veces el precio constituye el factor primordial de elección; bien porque se dis-
pone de un presupuesto limitado o por el riesgo de desperfectos en el aparato. Los
podómetros y contadores de pasos con pantallas de cuarzo líquido Micronta tienen
un precio aproximado de 2000 pesetas, y están protegidos por una funda de plástico
que se ajusta a la cintura y se lleva con comodidad.
v2. Lugar de fijación

Los monitores del movimiento registran la fuerza física en el lugar de colocación.
No todas las partes del cuerpo son igualmente activas durante todo el tiempo; de ahí
que haya que seleccionar el lugar del cuerpo más idóneo. Entre las zonas corporales
más comunes destacamos las siguientes:
a. Cintura. El caminar acarrea movimientos verticales de la cintura. Aunque

los movimientos de la muñeca y los tobillos también están asociados al caminar, es-
tas partes del cuerpo se mueven igualmente cuando el sujeto está sentado. Al estar la
cintura asociada al centro de gravedad corporal se convierte en mejor índice del gas-
to de energía que los movimientos de la muñeca o el tobillo.
b. Muñeca. La capacidad de los pacientes internos para moverse libremente
está frecuentemente limitada; pueden pasar mucho tiempo sentados, en cuyo caso el
movimiento de la muñeca puede reflejar su estado clínico mejor que el movimiento
de cintura. Por ejemplo, es especialmente importante no infravalorar el movimiento
en el caso de la depresión. Kripke y cols. (1978) encontraron que la muñeca era el
mejor sitio de ajuste para discriminar la vigilia del sueño.
c. Tobillo. Los movimientos que realizan los niños hiperactivos y esquizofré-
nicos pueden detectarse perfectamente por medio del registro del movimiento del
tobillo.
v.3. Muestreo de situaciones (validez de los resultados)

La finalidad de la evaluación de la actividad motora es obtener medidas representati-
vas. S1 se desea conocer el grado de actividad de un niño en el colegio, las muestras de
conducta deben tomarse en ambientes escolares; si se desea sacar conclusiones de la
actividad en casa después del colegio o durante los fines de semana, las muestras han
de tomarse en estas situaciones. En resumen, han de muestrearse las situaciones a las
que se van a generalizar los resultados. El muestreo directo del campo de interés ase-
gura la validez de los resultados (Nelson y Hayes, 1979, 1981; Linehan, 1980; Stro-
sahl y Linehan, 1981). Otra cuestión es establecer el tiempo que debe continuar la
recogida de datos, lo cual se verá en el siguiente apartado. El muestreo de situaciones
es necesario por el grado en que factores contextuales y sociales determinan la con-
ducta.
La mayor parte de las evaluaciones de la actividad motora han sido realizadas
desde una perspectiva teórica de trazos fijos. Se diseñan entornos análogos artificia-
les que guardan escaso parecido con el espectro completo de situaciones naturales a
las que se generalizarán los resultados; todo ello por conveniencia del investigador y
para permitir una observación estándar. Este problema se agrava al seleccionar pe-
ríodos de medida breves. El peso de la prueba reside para los defensores de la analo-
gía en demostrar que las muestras de actividad motora resultantes permiten una bue-
na generalización a entornos naturales; de este modo consideran que las medidas
ambulatorias no añaden información significativa.
Tryon (1993) señala que la creencia actual de que en el DSM-II1-R el exceso en la
actividad motora es sólo uno de los muchos síntomas asociados al trastorno del défi-
cit hiperactivo de la atención está basada en datos de evaluaciones de actividades
analógicas breves. Registros de la actividad motora realizados de forma global reve-
lan que los niños que presentan este déficit son hiperactivos de forma consistente en
distintas situaciones.
v3.1. Duración (sensibilidad)
Las evaluaciones analógicas breves pueden detectar a veces grandes diferencias de

actividad. Sin embargo, el fracaso al detectar niveles anormales de actividad, las dife-
rencias en la actividad entre dos grupos de sujetos o las diferencias en varraciones de
conducta bajo estas condiciones constituyen otra cuestión importante. La falta de
hallazgos significativos podría deberse a la falta de validez o al reducido intervalo de
muestreo, normalmente entre 5 y 30 minutos. El fracaso en la detección de anorma-
lidades en la actividad motora sólo es apremiante cuando se han obtenido datos con
amplia validez de contenido. ah
Una ventaja concreta del registro instrumenta l de la actividad motora es que la
sensibilidad de las medidas de la conducta pueden incrementar se prolongand o el pe-
ríodo de evaluación. Del mismo modo que los astrónomos pueden observar estrellas
débiles en una película aumentand o el tiempo de exposición, la probabilida d de
detectar diferencias de la actividad puede incrementarse ampliando el tiempo de re-
380 Warren W. Tryon
istro. Las muestras de actividad extremadamente cortas obtenidas en condiciones

clínicas o de laboratorio restringen aún más la validez de las evaluaciones análogas.
Las personas responden de manera distinta a las mismas situaciones. Lleva tiempo
evaluar adecuadamente la media del movimiento y la varianza. Las muestras de mo-
vimiento breves carecen de una base temporal adecuada para evaluar la conducta
normal, por no decir la conducta asociada al trastorno hiperactivo del déficit de
atención y el retraso mental —conocidos ambos trastornos por su excesiva varla-
ción. La principal excepción está en la evaluación del estereotipo de conducta que
tiene una tasa media regular y poca variación.
v3.2. Cuestiones clínicas
Mientras que los investigadores se pueden permitir errores sustanciales porque estu-
dian grupos de sujetos y hacen sus razonamientos a partir de medias de resultados, los
psicólogos clínicos son responsables de dar el mejor cuidado posible a cada cliente. Si
una correlación significativa se establece entre la evaluación de actividad análoga y
natural, el clínico debe interesarse por su magnitud. La significación estadística no
implica gran importancia. Normalmente, la proporción de error de varianza (1-7)
excede la cifra proporcional de varianza previsible (»?). Obtener una medida de la ac-
tividad exacta mientras se administran psicoestimulantes es especialmente importante
dado sus potenciales efectos secundarios a nivel cognitivo (Swanson y cols., 1991).
Las medidas del movimiento de la muñeca basadas en el tiempo tomadas durante
la noche pueden documentar el momento del inicio y del fin del sueño (y por tanto
la duración) además de los despertares nocturnos.
VI. APLICACIONES
Al ser la actividad motora una propiedad fundamental de toda conducta manifiesta,

el espectro de aplicación de su registro cubre toda la conducta observable. El estudio
del comportamiento normal de sueño y vigilia es importante porque proporciona el
contexto para entender conductas anormales de sueño y vigilia.
vL1. Aplicación en niños

La actividad motora es un aspecto hereditario importante del temperamento (Zuc-
kerman, 1991), y por tanto de gran importancia para todos aquéllos interesados en el
desarrollo normal de la conducta y sus alteraciones. Tryon (1991) ha revisado la es-
casa literatura acerca de las diferencias normales de sexo en la actividad motora, sien-
do los niños más activos que las niñas hasta la adolescencia. No obstante, queda mu-
cho por investigar; por ejemplo, aún tenemos que conocer el modo en que el ciclo
circadiano descanso-vigilia normal se desarrolla desde la infancia, edad en la que se
dan muchos de estos ciclos al día.
Fécnicas de registro de la actividad motora
381
Los trastornos de la infancia podrían agruparse en dos tipos: el tipo que se exte-
rioriza y el que se hace interno; la hiperactividad está asociada al último (Tryon,
1993), pero la hipoactividad también puede asociarse al primero. Trastornos de la
conducta en el sueño pueden asociarse a ambas categorías.
vI2. Aplicaciones en adultos

Los patrones de conducta de sueño-vigilia se desarrollan durante la vida pero en la
actualidad todavía sabemos poco acerca de tales cambios. Los ciclos de sueño-vigilia
normales pueden alterarse por rotaciones en los turnos del trabajo, viajes en avión, y
Otros trastornos físicos y psicológicos. En ocasiones se interna a personas mayores
sólo porque sus patrones de sueño-vigilia están cambiados. Tryon (1989) identificó
46 categorías en el DSM-111-R que emplean la actividad motora como uno delos crite-
rios de inclusión, lo que revela líneas múltiples de investigación y aplicación.
La fatiga es una queja médica común que probablemente hace reducir la activi-
dad en proporción a su gravedad dentro de las limitaciones impuestas de modo ex-
terno como el trabajo, el cuidado de los niños, la compra, etc. Registros de la activi-
dad motora durante las veinticuatro horas del día tomadas en momentos de una
salud Óptima diferirán muy probablemente de las mismas medidas tomadas durante
períodos de extrema fatiga o enfermedad. Las medidas de la actividad motora po-
drían emplearse para realizar un seguimiento del deterioro funcional en pacientes
con sida. Su nivel de actividad en el momento del diagnóstico se reducirá probable-
mente a medida que los síntomas agudos aparecen y aumentará en períodos de remi-
sión. El grado de recuperación en su nivel de actividad durante las veinticuatro horas
tendrá seguramente gran relevancia en su estado clínico funcional. La depresión
compromete el sistema inmunológico y reduce la actividad motora. De ahí que la
caída en los niveles de actividad constituya un factor de riesgo adicional.
La inactividad nos coloca en disposición de sufrir enfermedades de corazón y
cáncer de colon (Gerhardsson y cols., 1986; Slattery y cols., 1988). Slattery, Jacobs y
Nichaman (1989) observan que el ejercicio moderado reduce la mortalidad por cual-
quier enfermedad. Los estudios sobre la salud no han empleado aún la medida de la
actividad motora, de modo que es probable que tengamos un mayor conocimiento
acerca de ella cuando dispongamos de más datos.
VI... CONCLUSIONES
La actividad motora es una propiedad fundamental de la conducta que se refleja en

muchos modelos conductuales/psicológicos/biológicos de conducta normal y anor-
mal. La fuerza física asociada a la actividad puede registrarse de modo continuo em-
pleando alguno de los aparatos existentes en el mercado. Ello permite obtener mues-
tras naturales de la actividad motora con valores sustanciales y por consiguiente
evaluar mejor las hipótesis científicas pertinentes en relación con un amplio espectro
de trastornos médicos y psicológicos. Las estimaciones del movimiento y los diarios
382 Warren W. Tryon
fueron importantes en su día pero la disponibilidad de monitores objetivos (y eco-

nómicos) del movimiento deja poco espacio para su uso en la actualidad. Los clíni-
cos habrán de verificar informes de padres y profesores sobre trastornos de la activi-
dad en niños del mismo modo que habrán de verificar autorregistros similares en
adultos.
La historia de la ciencia, y de la medicina moderna, lleva consigo el desarrollo del
instrumental. La medicina moderna completa los autorregistros con el examen físico
y el análisis de muestras por métodos de laboratorio. La enfermedad se formula en
términos de las medidas resultantes. La medida de la actividad motora ofrece las
mismas oportunidades para científicos y psicólogos clínicos que basan su práctica en
la ciencia conductual.
ders (3* ed. rev.). Washington. APA.
- Borbely, A. A. (1986). New techniques for the analysis of the human sleep-wake cycle. Brain
Development, 8, 482-488.
Buss, A. H. y Plomin, R. (1984). Temperament: Early developing personality traits. Hillsdale,
Erlbaum.
Cole, R. J., Kripke, D. J. y Gruen, W. (1990). Ambulatory monitoring of light exposure:
Comparison of forehead and wrist. Sleep Research, 19, 364.
Conners, C. K. (1969). A Teacher Rating Scale for use in drug studies with children. Amer:-
can Journal of Psychiatry, 126, 884-888.
Edelbrock, C. S. y Achenbach, T. M. (1984). The teacher version of the Child Behavior Pro-
file: 1. Boys age 6-11. Journal of Consulting and Clinical Psychology, 52, 207-217.
Gehardsson, M., Norell, S. E., Kiviranta, H., Pedersen, N. L. y Ahlbom, A. (1986). Sedentary
jobs and colon cancer. American Journal of Epidemiology, 123, 775-780.
Goyette, C. H., Conners, C. K. y Ulrich, R. F. (1978 ). Normative data on revised Conners
Parent and Teacher Rating Scales. Journal of Abnormal Child Psychology, 6, 221-236.
Heiser, J. R., Epstein, L. H. y Wing, R. R. (1981). Technical reliability of pedometers. The
Behavior Therapist, 4, 21-22. :
Hinshaw, S. P. (1987). On the distinction between attentional deficit/hyperactivity and con-
duct problems/aggression in child psychopathology. Psychological Bulletin, 101, 443-
463.
Hinshaw, S. P. (1992). Externalizing behavior problems and academic underachievement in
childhood and adolescence: Causal relationships and underlying mechanisms. Psycholo-
gical Bulletin, 111, 127-155.
Kagan, J. y Snidman, N. (1991). Temperamental factors in human development. American
Kripke, D. F., Mullaney, D. J., Messin, S. y Wyborney, V. G. (1978). Wrist actigraphic mea-
ES e sleep and rhythms. Electroencephalography and Clinical Neurophysiology, 44,
Linehan, M. M. (1980). Content validity: Its relevance to behavioral assessment. Behavioral

Me hoRS e C. M., ie L. H., Kupfer, D. J. y Robertson, R. ]. (1984). The

use ol the large-scale integrated sensor (LSI) to estimate energy expenditure.
Behavioral vieses 6, 51-57. pa A CTO yr b
McPartland, R. J., Foster, F. G., Kupfer, D. J. y Weiss, B. (1976). Activity sensors for use in
psychiatric evaluation. /EZE Transactions on Biomedical Enqineering, 23, 175-178.
McPartland, R. J., Kupfer, D. J. y Foster, F. G. (1976). The movement activated recording
monitor: A third-generation motor activity monitoring system. Behavior Research Met-
hods and Instrumentation, 8, 357-360.
Montoye, H. J., Washburn, R., Servais, S., Ertl, A., Webster, J. C. y Nagle, F. J. (1983). Esti-
mation of energy expenditure by a portable accelerometer. Medicine and Science in Sports
and Exercise, 13, 403-407.
Nelson, R. O. y Hayes, S. C. (1981). Nature of behavioral assessment. En M. Hersen y
A. S. Bellack (dirs.), Behavioral assessment: A practical handbook (2* ed.). Nueva York.
Pergamon Press.
Quay, H. C. y Peterson, D. R. (1987). Manual for the Revised Behavior Problem Checklist.
University of Miami, Coral Gables.
Redmond, D. P. y Hegge, F. W. (1985). Observations on the design and specification of a
wrist-worn human activity monitoring system. Behavior Research Methods Instruments,
and Computers, 17, 659-669.
Saunders, K. J., Goldstein, M. K. y Stein, G. H. (1978). Automatic measurement of patient
activity on a hospital rehabilitation ward. Archives of Physical Medicine and Rehabilita-
tion 59 255-257.
Schulman, R. L. y Reisman, J. M. (1959). An objective measure of hyperactivity. American
Journal of Mental Deviance, 64, 455-456.
Schulman, R. L., Stevens, T. M. y Kupst, M. J. (1977). The biomotometer: A new device for
the measurement and remediation of hyperactivity. Child Development, 48, 1152-1154.
Slattery, M. L., Jacobs Jr., D. R. y Nichaman, M. A. (1989). Leisure time physical activity and
coronary heart disease death: The US Railroad study. Circulation, 79, 304-311.
Slattery, M. L., Schumacher, M. C., Smith, K. R., West, D. W. y Abd-Elghany, N. (1988).
Physical activity, diet, and risk of colon cancer in Utah. American Journal of Epidemio-
logy, 128, 989-999.
Strosahl, K. D. y Linehan, M. M. (1981). Basic issues in behavioral assessment. En A. R. C1r-
minero, K. S. Calhoun y H. E. Adams (dirs.), Handbook of behavioral assessment (2* ed.).
Nueva York. Wiley. :
Swanson, J. M., Cantwell, D., Lerner, M., McBurnett, K. y Hanna, G. (1991). Effects of sti-
mulant medication on learning in children with ADHD. Journal of Learning Disabilitzes,
24, 219-230.
Tryon, W. W. (1985). Measurement of human activity. En W. W. Tryon (dir.), Behavioral
assessment in behavioral medicine. Nueva York. Springer.
Tryon, W. W. (1986). Motor activity measurements and DSM-111. Progress in Behavior Modi-
fication, 20, 36-66.
Tryon, W. W. (1989). Motor activity and DSM-R. En M. Hersen y 5. M. Turner (dirs.), Adult
psychopathology and diagnosis. Nueva York. Wiley. de
Tryon, W. W. (1991). Activity measurement in psychology and medicine. Nueva York. Ple-
num Press. pos
Tryon, W. W. (1993). The role of motor excess and instrumented activity measurement in
Attention-deficit Hyperactivity Disorder. Behavior Modification, 17, 371-406.
Tryon, W. W., Pinto, L. P. y Morrison, D. F. (1991) Reliability assessment of pedometer acti-
vity measurements. Journal of Psychopathology and Behavioral Assessment, 13, 27-44.
Werry, J. S., Sprague, R. L. y Cohen, M. N. (1975). Conners' Teacher Rating Scale for use in
384 Warren W. Tryon
drug studies with children: An empirical study. Jomrnal ofAbnormal Child Psychology, 3,
217-229,
Zuckerman, M. (1991). Psychobiology of personality. Cambridge. Cambridge University
Press.
Tryon, W. W. (1985). Measurement of human activity. En W. W. Tryon (dir.), Behavioral

assessment in behavioral medicine. Nueva York. Springer.
Tryon, W. W. (1985). Human activity: A review of quantitative findings. En W. W. Tryon
(dir.), Behavioral assessment in behavioral medicine. Nueva York. Springer.
Tryon, W. W. (1989). Motor activity and DSM-R. En M. Hersen y S. M. Turner (dirs.), Adult
psychopathology and diagnosis. Nueva York. Wiley.
Tryon, W. W. (1991). Activity measurement in psychology and medicine. Nueva York. Ple-
num Press.
18.. TÉCNICAS PSICOFISIOLÓGICAS
JOSÉ A. CARROBLES y GUALBERTO BUELA-CASAL
1. INTRODUCCIÓN
La relación entre la conducta humana y su base biológica, y paralelamente el acerca-

miento entre las ciencias biológicas y las ciencias de la conducta, constituye desde
hace años uno de los principales centros de interés dentro del mundo científico, como
lo prueba el hecho de la proliferación de nuevas disciplinas, con denominaciones tan
elocuentes como “Sociobiología”, “Antropología biológica”, “Sociología médica”,
“Psicobiología”, “Psiquiatría biológica”, “Medicina conductual”, “Psicofisiología
humana”, “Psicofisiología clínica”, “Psicofisiología cognitiva”, etc. Este interés, evi-
dentemente, no es casual, sino que responde sencillamente al importante cambio al
que estamos asistiendo en el modo de pensar respecto a la relación entre la conducta y
la biología (o entre la Psicología y la Biología), cambio que algunos autores (como
Schwartz, 1978) calificaron de auténtica revolución, en el propio sentido planteado
por Kuhn (1962), para indicar el extraordinario intento que actualmente se está reali-
zando para integrar las clásicas y caducas teorías dicotómicas de mente-conducta, ce-
rebro-cuerpo, y ello tanto en relación con la salud como con la enfermedad.
Esta evolución fue especialmente notable en la Psicología clínica, donde el inte-
rés entre los psicólogos clínicos por la utilización de procedimientos psicofisiológi-
cos, tanto en evaluación como en intervenciones terapéuticas, ha crecido notable-
mente, fenómeno que queda claramente reflejado en los dos principales campos de
desarrollo actual de la Psicología clínica, el de la evaluación conductual, y el de la te-
rapia de conducta, y dentro de ésta el importante campo del biofeedback o retroali-
mentación biológica.
No hay una única definición de la Psicofisiología, pues ésta es definida en fun-
ción del método, o del procedimiento de registro utilizado, o de los mecanismos que
sirven de base alos procesos registrados. No obstante, existe cierto grado de acuerdo
en definir la Psicofisiología como el estudio de la relación entre factores psicofisioló-
gicos y factores psicológicos o conductuales (Kallman y Feuerstein, 1977; Haynes,
1978; Carretié e Iglesias, 1995). Dentro de la Psicofisiología, como campo general de
estudio de estas relaciones, cobra una importancia fundamental la evaluación o
cuantificación de los factores fisiológicos o biológicos intervinientes en tanto que re-
lacionados con las otras variables psicológicas o conductuales, y entre las que po-
drán establecerse, finalmente, criterios de dependencia mutua que sirvan al propósi-
to de su contrastabilidad y validación recíproca.
Ciertamente, una de las funciones principales de la Psicología es la de proporcio-
nar medidas objetivas en las que apoyar las funciones psicológicas, y a esta caracte-
Universidad Autónoma de Madrid y Universidad de Granada.

386 José A. Carrobles y Gualberto Buela-Casal
rística se puede atribuir el importante auge que la evaluación de procesos fisiológicos

está experimentando en la Psicología clínica en los últimos años. En el área delaeva-
luación conductual, el registro de procesos fisiológicos experimentó en los últimos
años un gran avance motivado por la cada vez más sólida posición de la teoría que
afirma la existencia de tres sistemas o componentes diferentes de respuesta (cogniti-
vo, motor y fisiológico) con los que el individuo reacciona ante cada situación esti-
mular concreta (Lang, 1968, 1971, 1977). Dentro de esta concepción, y especialmen-
te alentada por el auge de la evaluación conductual, los registros psicofisiológicos
cobran cada día un mayor interés como parte del quehacer del psicólogo, tanto
como elemento de evaluación como de intervención terapéutica. En la actualidad, en
España existe un número considerable de publicaciones sobre técnicas psicofisiolo-
gicas, entre las que hay que resaltar los libros de Buela-Casal y Navarro (1990), Ca-
rretié e Iglesias (1995), Martínez-Selva (1995) y Vila (1996). A nivel internacional,
existen diversas revistas específicas, entre las que hay que destacar Psychophystology,
International Journal of Psychophysiology, Biofeedback and Self Regulations, que
sin duda son buena muestra del actual interés y aplicaciones de estas técnicas.
Il. ELREGISTRO DE LAS VARIABLES PSICOFISIOLÓGICAS
El proceso de registro de las variables psicofisiológicas, aunque variable en nivel de

complejidad de acuerdo con las características físicas de la variable de que se trate, si-
gue, en general, unos principios y fases comunes, que pueden sintetizarse en las si-
guientes:
a. Detección
b. Transformación o transducción
c. Amplificación
d. Registro
e. Conversión
Este proceso puede verse de forma gráfica, y con algo más de detalle, en la figu-
ra 18.1.
En la primera de estas fases, tiene lugar la detección o captación de la señal o acti-
vidad procedente del organismo por medio de las sondas o sensores adecuados, en-
cargados de transmitir la señal al instrumento que habrá de procesar la misma.
En la fase siguiente, la señal captada es transformada o transducida, en caso nece-
sario, a señales eléctricas por medio de los transductores apropiados. Sin embargo,
no es necesario transformar todas las señales psicofisiológicas, pues de los tres tipos
básicos en que suelen dividirse éstas, uno de ellos adopta la forma directa de un po-
tencial eléctrico al ser registrada en la periferia del organismo, merced al proceso
previo de traducción que ha tenido lugar internamente en el mismo a través del pro-
ceso metabólico, al convertir los procesos físicos o químicos subyacentes en poten-
ciales eléctricos. Esta señal, por tanto, sólo ha de ser captada y conducida directa-
387
JOPNu39AUOY
10peoyduy
ozv
091/8160
JoperBaju]
e JOSu9s
epelua ap O
E: JOJONPSUBA | 0po/]993/3
e)
J0J9NPSUB1| JOpeo11 duieslg

ousIueBlO
UOIDINPSULI uOIDe1deoO
Técnicas psicofisiológicas
UOISISAUOL) onsibay Uco Ma A EE EDI:

S v E Py Fo e pepinoy
sox80]0151f sorsomdso. ap 01351894 19 vand o01d1 vuLazsis un ap soazua3uoquuos (sasp] *1'8] VANDIA
mente desde los electrodos detectores hasta el sistema de amplificación. A este tipo
de fenómenos psicofisiológicos pertenece la actividad eléctrica generada directa-
mente por el corazón, la musculatura estriada periférica, el estómago, la piel o el pro-
pio cerebro. : '
Un segundo tipo de fenómeno psicofisiológico lo constituyen los fenómenos
bioeléctricos transformados o transducidos que, sin ser una actividad eléctrica direc-
ta de un órgano o de un tejido, constituyen propiedades eléctricas de los mismos que
pueden ser medidas de forma indirecta. Ejemplos de fenómenos bioeléctricos trans-
formados son la resistencia eléctrica de la piel, la impedancia eléctrica de la piel, o el
pletismograma, reoencefalograma y neumograma de impedancia. :
Un tercer y último tipo de fenómeno psicofisiológico son los fenómenos bio-
lógicos físicos, o propiedades físicas o mecánicas de los mismos, y que como tales
pueden ser cuantificados o analizados por los mismos métodos utilizados por las
ciencias físicas. Dentro de este tipo de fenómenos, que han de ser igualmente trans-
ducidos de forma diversa, se cuentan la temperatura corporal, la presión sanguínea o
el movimiento, entre otros.
La fase tercera de amplificación de la señal es la fase más importante en el proce-
so de registro de variables fisiológicas. El proceso de amplificación se lleva a cabo
normalmente en dos etapas, o a través de dos tipos básicos de amplificadores: el pre-
amplificador y el amplificador. En la primera de estas etapas, la de preamplificación,
tiene lugar el incremento del nivel de la baja señal de entrada procedente del organis-
mo procurando la mínima distorsión de la misma. El preamplificador opera sobre
los dos parámetros básicos de toda función fisiológica, la magnitud y la frecuencia,
regulando, por un lado, el grado de amplificación o de ganancia de la señal a través de
los controles de sensibilidad con que normalmente van equiparados, y modulando,
por otro, el espectro de frecuencias de la señal de entrada, filtrando las frecuencias
que no alcancen o que sobrepasen (bajas o altas frecuencias) el nivel de frecuencia en
el que el preamplificador opera, según su diseño, con un máximo de eficacia. Otra
característica importante del preamplificador es el acoplamiento o conexión al mis-
mo de la señal, y que determina el tipo de respuesta que recibe. Este acoplamiento de
entrada puede ser directo, permitiendo entonces la entrada y amplificación de seña-
les de frecuencia muy bajas, como las señales unidireccionales de la corriente conti-
nua (CC); o, por el contrario, el acoplamiento puede realizarse a través de un con-
densador, en cuyo caso la frecuencia de respuesta no desciende hasta la de corriente
continua, siendo filtrados estos componentes de la señal, y permitiéndose sólo el
paso de los componentes bidireccionales de elevada frecuencia. El acoplamiento de
entrada del amplificador es un factor fundamental a tener en cuenta en el registro de
toda respuesta, pues en uno u otro caso puede cambiar el significado de la misma.
Algunas respuestas fisiológicas, como la electrodérmica, participan de ambos com-
ponentes: lentos o tónicos (CC), y rápidos o fásicos (CA), que pueden ser registrados
a través de los mismos electrodos. En estos casos, el amplificador suele estar equipa-
do con un tipo especial de interruptor electrónico o electromecánico que permite
cambiar el acoplamiento de la señal de un amplificador de CC (que registra las seña-
les de baja frecuencia, como el nivel de resistencia eléctrica de la piel) a otro de CA,
que posibilita la obtención de señales de mayor frecuencia, como la respuesta de re-
sistencia eléctrica de la piel. En la segunda etapa de amplificación la señal es única-
Técnicas psicofisiológicas 389
mente incrementada aún más a través del amplificador de potencia hasta alcanzar un
nivel suficientemente elevado como para accionar el transductor de salida o registra-
dor gráfico, que normalmente es un oscilógrafo.
La cuarta fase en el proceso de registro de variables psicofisiológicas la constitu-
ye la fase de registro propiamente dicha, en la cual tiene lugar la reconversión, a tra-
vés del transductor de salida, de la señal eléctrica previamente amplificada en otra se-
ñal de modalidad distinta para que pueda ser registrada de forma observable,
normalmente gráfica, a través de un oscilógrafo o aparatos similares, con una pluma
móvil que traza la señal sobre una lámina de papel que se desplaza a una velocidad
constante (registrador x-t). Este gráfico así registrado de forma permanente permite
el análisis posterior de la señal.
Normalmente, el proceso de registro de respuestas psicofisiológicas incluye una
última fase, estrechamente vinculada a la anterior, de conversión de la señal gráfica
registrada en otras formas que faciliten el análisis posterior de la misma. Entre las
principales transformaciones a que habitualmente se somete la señal, están la inte-
gración de la misma en conjuntos temporales de la señal individual y la conversión
de la misma de forma gráfica análoga a la respuesta fisiológica registrada (continua) a
forma digital (discontinua), a través de un convertidor analógico-digital para facilitar
su análisis posterior estadístico o computarizado.
Los avances tecnológicos alcanzados en los ultimos años han permitido facilitar
el registro de las variables psicofisiológicas mediante el sistema computarizado, el
cual es utilizado en la actualidad tanto a nivel clínico como de investigación. Este sis-
tema de registro está basado en el empleo de una computadora como dispositivo de
salida del polígrafo. El uso de un microcomputador en los registros psicofisiológicos
exige previamente la transformación de la señal analógica procedente del polígrafo
en una señal digital comprensible al computador. Por ello, es necesario conectar un
interfaz o conversor analógico-digital entre el polígrafo y el microcomputador; éste
a su vez puede incluir como posibles salidas una impresora o cinta magnética.
II. SISTEMAS CLASIFICATORIOS DE LAS VARIABLES PSICOFISIOLÓGICAS
Existen diversas clasificaciones para agrupar las variables psicofisiológicas. Sin em-
bargo, los criterios más utilizados para clasificar han sido las características de la se-
ñal y los sistemas biológicos en los que se agrupan las variables. Según el primer cri-
terio, el de la naturaleza de las respuestas fisiológicas registradas, autores como
Brown (1972) clasifican éstas en las tres categorías de señales bioeléctricas directas,
fenómenos bioeléctricos transducidos y fenómenos biológicos físicos que necesitan
igualmente ser tansducidos. Aunque nosotros, por las razones que expondremos
posteriormente, no seguiremos en nuestra descripción de las variables esta clasifica-
ción, vamos, no obstante, a incluirla (véase el cuadro 18.1) por lo que de clarificador
pueda tener respecto a la indicación de la naturaleza de cada variable. Una ventaja im-
discutible, por otro lado, de este tipo de clasificación es el agrupamiento que ofrece
de las señales en función de los instrumentos utilizados para medirlas, lo que permite
una mejor comprensión de la función y utilización de los mismos.
CUADRO 18.1 Sistema clasificatorio de las variables psicofisiológicas atendiendo a la natura-

leza de las mismas e a id
A ic a
A. Señales bioeléctricas directas
—Electrocardiograma (ECG O EKG).
—Electroencefalograma (EEG).
—Electromiograma (EMG).
—Electrooculograma (E0G).
—Electrogastrograma (EGG).
—Potencial dérmico (PD).
B. Señales bioeléctricas transducidas

—Resistencia dérmica (RD).
—Conductancia dérmica (CD).
—Impedancia dérmica (ZD).
—Admitancia dérmica (AD)
—Pletismograma de impedancia.
—Neumografía de impedancia.
—Reoencefalograma.
C. Señales biológicas físicas

—Temperatura.
—Volumen pletismográfico.
—Movimiento.
—Motilidad gástrica.
—Presión sanguínea (PS).
—Flujo sanguíneo (FS).
La definición tradicional de la Psicofisiología, en función del método o procedi-

miento de registro utilizado, además de apartarse de la esencia y objetivos propios de
la Psicofisiología, marcando diferencias entre los dos componentes que la integran,
Psicología y Fisiología, en lugar de aproximarlos, no aporta tampoco ningún ele-
mento a la clarificación del principal objetivo de la Psicofisiología, el de la determi-
nación de los mecanismos o procesos fisiológicos básicos subyacentes al conjunto
integrado de componentes que la forman, sean éstos conductuales, fisiológicos, cog-
nitivos o neurológicos (Schwartz, 1978). Por tanto, al elaborar una clasificación de
las respuestas psicofisiológicas, es preferible seguir el criterio que hace referencia a
los sistemas biológicos que sirven de base a tales respuestas. Varios autores han uti-
lizado un sistema de agrupación de este tipo, aunque no con demasiada sistemati-
zación, al intentar describir estas respuestas. No incluimos aquí estos diferentes
esquemas por su escasa relevancia y por lo inapropiado de tal planteamiento, limi-
tándonos simplemente a reseñar un esquema elaborado por nosotros, que viene a ser
una síntesis de los diferentes esquemas propuestos, y que responde básicamente al
criterio antes mencionado de referir las distintas variables psicofisiológicas al sistema
biológico del que dependen. El esquema clasificatorio propuesto puede verse en el
cuadro 18.2.
CUADRO 18.2. Sistema clasificatorio de las variables psicofisiológicas según los sistemas bio-
A
lógicos que las producen
e A II A, BAG
A. Variables del sistema somático
—Actividad electromiográfica (EMG).
—Actividad electrooculográfica (E0G).
—Actividad respiratoria.
B. Variables del sistema nervioso autónomo

—Sistema cardiovascular:
—Actividad electrocardiográfica (ECG O EKG y TC).
—Presión sanguínea (PS).
—Flujo sanguíneo (FS).
—Temperatura corporal (TC).
—Actividad sexual: pletismografía del pene y de la vagina.
—Actividad electrodérmica (AED):
—Nivel del potencial dérmico (NPD).
—Nivel de resistencia dérmica (NRD).
—Nivel de conductancia dérmica (NCD).
—Respuesta de potencial dérmico (RPD).
—Respuesta de resistencia dérmica (RRD).
—Respuesta de la conductancia dérmica (RCD).
—Actividad pupilográtfica.
—Actividad gastrointestinal: motilidad y pH.
—Actividad salivar.
—Actividad de sudoración.
C. Variables del sistema nervioso central

—Actividad electroencefalográfica espontánea (EEG).
—Actividad electroencefalográfica evocada (PEP):
—Respuestas medias evocadas.
—Variación negativa contingente.
D. Variables del sistema endocrino y bioquímico
m1. Variables del sistema somático
En este apartado se incluyen aquellas variables en las que el sistema muscular esque-
lético es el principal sistema biológico implicado, como en el caso de la actividad
EMG y EOG, o su intervención es especialmente notable, como ocurre con la respira-
ción. Estas variables son susceptibles, en gran parte, de control voluntario por parte
del sujeto a través de la inervación directa del sistema muscular periférico por el sis-
tema nervioso central.
1.1.1. Actividad electromiográfica (EMG)
Entre las señales incluidas en esta categoría, tenemos, en primer lugar, la señal elec-
tromiográfica o electromiograma, cuya abreviatura es EMG. Ésta consiste en el regis.
tro de la actividad eléctrica asociada con la contracción muscular o, más específica
mente, que precede a la contracción muscular, procedente de los potenciales de
acción generados por las unidades motoras. La forma típica de registro utilizada en
Psicofisiología es a través del registro bipolar con electrodos de superficie que detec-
tan simultáneamente la actividad de múltiples unidades motoras, dependiendo la
amplitud y la frecuencia del registro electromiográfico (EMG) del número de unida-
des motoras activadas. Para más detalle véase Carretié e Iglesias (1995).
La actividad muscular corporal también es influida por factores emocionales y
motivacionales, y por tanto su medida puede servir igualmente como evaluación del
nivel de relajación o activación de un sujeto. La zona de registro normalmente elegi-
da en estos casos suele ser el músculo frontal. Otras actividades musculares, como el
temblor muscular de algunas zonas como los dedos, o las variaciones rítmicas de pe-
queña amplitud son, asimismo, de gran interés como medida de la actividad motora
(vease el capítulo de Tryon en este mismo libro).
111.1.2. Actividad electrooculográfica

La principal variable incluida en esta categoría son los movimientos oculares, entre
los que se distinguen las fijaciones y los cambios de fijación en la visión de un objeto,
el seguimiento de un punto móvil y la rotación de los ojos hacia arriba durante el
parpadeo.
Entre los métodos utilizados para medir los movimientos oculares cabe resaltar,
entre las técnicas no eléctricas, el registro a través de una pequeña luz reflejada por la
córnea (oftalmógrafo), obtenido modernamente por medio de su proyección en una
pantalla de televisión, y el método fotoeléctrico, consistente en el registro por medio
de una fotocélula de los cambios en la luz infrarroja reflejada por un punto enfocado
en la unión del iris y la esclerótica. El método eléctrico, conocido con el nombre de
electrooculografía (EOG), está basado en la existencia de una diferencia de potencial
mantenida entre la parte anterior y posterior del ojo (el potencial córneo-retiniano);
este potencial varía con los movimientos del ojo y los cambios pueden ser detectados
y convertidos en movimientos horizontales y verticales por medio de electrodos co-
locados alrededor de las órbitas del ojo. El registro de los movimientos oculares no
sólo está relacionado con fenómenos psicológicos propios de la vigilia, sino que
también es uno de los registros clave para realizar el análisis del sueño, conocido
como registro polisomnográfico. Para más información véase Buela-Casal y Nava-
rro (1990), y Buela-Casal y Sierra (19944).
393
TIL1.3. Actividad respiratoria

La respiración está compuesta fundamentalmente por dos parámetros: el volumen de
la respiración y la tasa respiratoria, combinados en ocasiones para obtener el volumen
de aire inspirado por minuto. La función respiratoria, aunque pertenece al sistema so-
mático, está controlada por el sistema nervioso central a través de la médula y de nú-
cleos del tronco del encéfalo, siendo igualmente alterada por los estados emocionales.
En cuanto a los principales procedimientos de medida más interesantes para el
psicofisiólogo (todos los cuales requieren, dada la naturaleza física del fenómeno
respiratorio, algún tipo de transformación o transducción) están, en primer lugar, las
técnicas clásicas de medida de los cambios de volumen en las zonas intercostal y ab-
dominal (neumografía) a través de un cinturón de goma en forma de fuelle, que
transmite neumáticamente los movimientos del pecho a una pluma que registra los
cambios en un papel. Esta misma técnica se utiliza actualmente sustituyendo el siste-
ma neumático por un transductor lineal hecho de un tubo delgado en forma de ani-
llo flexible y relleno de mercurio que se coloca rodeando el diafragma. Otro proce-
dimiento bastante sencillo de utilizar consiste en derivar una medida respiratoria a
través de la transformación (por medio de los transductores apropiados: termistores
o termopares) de las variaciones de temperatura que tienen lugar en el aire durante el
proceso de inspiración-espiración, para lo cual se coloca un termistor en el interior de
los orificios respiratorios. Actualmente, también se utilizan, para obtener medidas
respiratorias, métodos eléctricos como la pletismografía de impedancia a través de
electrodos fijados en el pecho que registran los cambios en la impedancia eléctrica
del tórax producida por la ventilación pulmonar. En ocasiones se combina el registro
de la respiracion nasal y la abdominal, como es por ejemplo el caso del diagnóstico
de algunos trastornos respiratorios durante el sueño.
m2. Variables del sistema nervioso autónomo
El sistema nervioso autónomo, también denominado sistema neurovegetativo, con-

trola la actividad de las glándulas y vísceras que componen el medio interno del or-
ganismo a través de las dos ramas o subsistemas en que se encuentra dividido, el sis-
tema nervioso simpático y el sistema nervioso parasimpático. Ambos sistemas son
considerados de forma algo elemental y esquemática como desempeñando funcio-
nes antagónicas: de activación y movilización de energía en elcaso del sistema sim-
pático, y de inhibición y conservación de energía en el del sistema parasimpático,
Ambos sistemas, por otro lado, utilizan, en su comunicación con las vísceras, UN
neurotransmisor diferente, noradrenalina en el caso del sistema simpático y acetilco-
lina en el del parasimpático, lo que hace que también se designe a ambos sistemas
con los nombres de sistema adrenérgico y sistema colinérgico, respectivamente.
Normalmente, las distintas vísceras son inervadas por fibras procedentes de ambos
sistemas que regulan su actividad, adecuándola a las demandas de cada situación, a
excepción de las glándulas sudoríparas y el sistema vascular periférico, que sólo pa-
recen estar inervadas por el sistema simpático.
12.1. Actividad cardiovascular
El sistema cardiovascular está formado por el corazón, los vasos sanguíneos y el tej1-
do linfático. A través de los vasos sanguíneos tiene lugar la aportación de oxígeno a
los diferentes tejidos y la eliminación de los productos de desecho de órganos y tej1-
dos por medio de la sangre que circula por ellos impulsada por el corazón, que actúa
como una bomba. La función cardiovascular puede ser evaluada a través de diferen-
tes parámetros. Para la psicofisiología, las medidas más relevantes son la tasa cardía-
ca, la presión sanguínea y el flujo sanguíneo: volumen sanguíneo, pulso del volumen
sanguíneo y velocidad de tránsito del pulso sanguíneo (véase Carretié e Iglesias,
1995, para más detalle).
a. Tasa cardíaca
La primera variable a considerar entre las que componen el sistema cardiovascular es

la tasa cardíaca, una de las medidas autonómicas más utilizadas en psicofisiología.
Para la obtención de esta respuesta se utilizan, fundamentalmente, dos métodos di-
ferentes: la electrocardiografía y la pletismografía de pulso.
La electrocardiografía, designada indistintamente de forma abreviada como EKG
O ECG, está basada en la detección directa de los cambios en los potenciales de acción
eléctricos que acompañan la actividad del corazón. La tasa cardíaca se obtiene con-
tando los ciclos de respuesta cardíaca (sístole-diástole), apoyándose normalmente en
las grandes espigas asociadas con la contracción ventricular y prescindiendo del res-
to de la información facilitada por la forma de la onda del ECG, de gran utilidad en la
patología cardíaca. Por esta razón, en psicofisiología no es especialmente importante
el lugar de colocación de los electrodos, prefiriéndose la elección de las extremidades
más distantes entre sí, como el registro brazo derecho-pierna izquierda, que produce
las espigas ventriculares mayores. Los electrodos para el registro de ECG suelen ser
de gran superficie (unos 10 cm?), de forma curva para adaptarse a las extremidades y
fabricados en plata o acero inoxidable. Los aparatos para el registro de la respuesta
ECG van equipados, normalmente, de contadores automáticos que convierte la señal
ECG en un voltaje proporcional a la tasa cardíaca.
La pletismografía de pulso, el otro método de la tasa cardíaca, consiste, por el
contrario, en la detección indirecta de los cambios de volumen que tiene lugar con
cada latido del corazón en los órganos periféricos. Estos cambios de volumen pueden
detectarse tanto mecánica como fotoeléctricamente. La detección mecánica tiene lu-
gar a través de calibradores elásticos en forma de anillo y construidos con un pequeño
tubo de silicona relleno de mercurio, que al colocarse alrededor de la yema de un
dedo transforma los cambios en la longitud de la circunferencia del calibrador en va-
riaciones de resistencia de la columna de mercurio contenida en el calibrador al paso
de una pequeña corriente que circula por ella. Como la contracción de los vasos san-
guíneos periféricos es producida simpáticamente, los incrementos en volumen del
dedo, y paralelamente en la resistencia del calibrador, son indicativos de una enorme
activación simpática. En la detección fotoeléctrica una pequeña luz ilumina la zona de
la piel que se va a utilizar en la medición, normalmente la yema del dedo o el lóbulo de
395
la oreja, al tiempo que una célula fotoconductora detecta los cambios producidos en
la densidad óptica del tejido, bien por medio de la transmisión de la luz a través del
dedo o de la oreja, o bien a través de la reflexión de la misma por el tejido.
b. Presión sanguínea
La presión sanguínea depende de varios factores, de los cuales los más importantes
son la fuerza o la frecuencia de las contracciones del corazón y la elasticidad de los
vasos sanguíneos. La eyección de sangre producida por el corazón al contraerse da
lugar a una elevación en el nivel de presión dentro del sistema arterial (presión sistó-
lica), sobreimpuesta a un determinado nivel de presión medio mínimo (presión dias-
tólica), mantenido dentro del sistema por la elasticidad del mismo, que hace que se
almacene parte de la energía movilizada en cada ciclo cardíaco. La diferencia entre
los dos tipos de presión se denomina presión de pulso.
La presión sanguínea puede medirse directamente, a través de la inserción de un
transductor de presión en forma de cánula dentro de la arteria, como se realiza en la
evaluación de pacientes cardíacos, pero por las dificultades y riesgos que entraña no
es muy aconsejable su uso en psicofisiología, recurriéndose en este caso a medidas
indirectas que no suponen traspasar la barrera corporal. Entre estas medidas indirec-
tas, el procedimiento más comúnmente utilizado es el clásico esfigmomanómetro,
consistente en un manguito de goma inflable unido por medio de un tubo flexible a
un manómetro de mercurio. El manguito se coloca alrededor del antebrazo y es in-
flado por medio de una bomba manual por encima de la presión sistólica, interrum-
piendo la circulación sanguínea por la arteria branquial. La presión del manguito se
reduce entonces lenta y gradualmente abriendo una válvula que deja salir el aire con-
tenido en el manguito, al tiempo que se aplica un estetoscopio sobre la arteria bra-
quial por debajo del manguito en la parte interior del codo, hasta oír unos sonidos
característicos (sonidos Korotkoff) producidos por el paso de la sangre a través de la
arteria. La presión indicada por el manómetro, en el momento en que empiezan a
oírse los sonidos, es la presión sistólica (aproximadamente, de unos 120 mm de mer-
curio). La presión diastólica viene indicada por un ensordecimiento brusco del soni-
do, al continuar desinflando lentamente el manguito (unos 80 mm de mercurio,
aproximadamente).
Actualmente se dispone de métodos automáticos para la obtención de la presión,
consistente en un dispositivo que infla y desinfla el manguito a intervalos regulares,
al tiempo que un micrófono de contacto (normalmente de tipo piezoeléctrico) de-
tecta los sonidos Korotkoff y los transfiere a un aparato de registro. Otro procedi-
miento automático de registro, utilizado también como dispositivo de biofeedback,
consiste en el ajuste de la presión del manguito hasta un punto intermedio entre la
presión sistólica y la diastólica, para la detección del 50% de los sonidos Korotkoff.
c. Flujo sanguíneo
La medida del flujo sanguíneo representa la afluencia o circulación de sangre a través

de un determinado tejido producida por las contracciones del corazón. Bajo los
efectos de estados emocionales tiene lugar una redistribución del flujo sanguíneo,
con una menor afluencia de sangre al tejido periférico de la piel y un incremento en

el volumen de sangre que afluye a los músculos. En relación con el flujo sanguíneo
que afluye a un determinado miembro, se distinguen dos tipos diferentes de medida:
el volumen de sangre (VS) y el pulso del volumen de sangre (PVS). El volumen de san-
gre se refiere a la cantidad total de sangre contenida en el tejido, mientras que la me-
dida del volumen del pulso, o pulso del volumen de sangre, representa los cambios
en la afluencia de sangre a un miembro por efecto de las contracciones cardíacas. El
volumen de sangre se considera el componente tónico y el pulso del volumen de
sangre el componente fásico de la respuesta vasomotora. Otro parámetro del flujo
sanguíneo es la velocidad de tránsito del pulso sanguíneo, que consiste en la detec-
ción del tiempo que tarda el pulso sanguíneo en pasar por dos puntos del cuerpo, así,
al relacionarlo con la distancia entre los puntos se obtiene la velocidad del pulso.
En cuanto a los procedimientos utilizados para medir estas variables en psicofi-
siología, los más frecuentes son los métodos pletismográficos, sean éstos por medio
del clásico calibrador de mercurio (pletismografía de Girth) o a través del procedi-
miento fotoeléctrico de la fotopletismografía, métodos que ya fueron descritos ante-
riormente. Otro procedimiento bastante versátil de obtención de estas medidas es a
través del método de la impedancia eléctrica, basado en las variaciones en la impen-
dencia producidas por los cambios de volumen cuando se expone el tejido a una co-
rriente alterna de alta frecuencia. Una aplicación de este mismo método es la reoen-
cefalografía, consistente en la medida del flujo sanguíneo cerebral por medio de la
pletismogratía de impedancia de radio-frecuencia. Por ultimo, otro método, adapta-
do para ser utilizado en psicofisiología como medida de la tasa de flujo sanguíneo, es
el de los transductores ultrasónicos que utilizan el efecto Doppler.
112.2. Temperatura corporal

La temperatura de la piel, que está regulada principalmente por el sistema vascular
periférico, puede ser medida igualmente de forma directa por medio del empleo de
un termómetro o, indirectamente, caso más frecuente en psicofisiología, a través del
empleo de transductores, como el termistor o el termopar, que convierten la tempe-
ratura en señal eléctrica. La temperatura de la piel se ha utilizado, asimismo, como
una medida indirecta del flujo sanguíneo, aunque no resulta fácil en este caso la in-
terpretación de los resultados.
Es importante tener en cuenta que el nivel basal de la temperatura corporal varía
en función de la zona donde se registre. Así, mientras la temperatura axilar oscila en
torno a los 36,5 grados centígrados, la temperatura periférica registrada sobre la pri-
mera falange de los dedos oscila entre los 26-31 grados centígrados.
11123. Actividad sexual: pletismografía de pene y vagina

La erección del pene, en el caso del hombre, y la tumefacción de la vulva y vagina, en
el de la mujer, denotan excitación sexual en ambos sexos y pueden ser medidas a tra-
vés de los procedimientos pletismográficos ya descritos.
397
La técnica utilizada en el registro de la respuesta genital masculina se denomina

pletismografía del pene; dicha técnica evalúa la respuesta de erección a partir de la me-
dida de la circunferencia del pene. En la actualidad, se utilizan dos procedimientos di-
ferentes: la técnica de Barlow (Barlow y cols., 1970) y la técnica de Bancroft (Ban-
croft, Jones y Pullan, 1966). En la primera se mide la circunferencia del pene por
medio de un calibrador electromecánico formado por dos muelles en forma de arco
unidos por dos sensores mecánicos; la técnica de Bancroft consiste en un calibrador
de mercurio introducido en un tubo de silicona o plástico que registra los cambios en
el pene a partir de los cambios paralelos producidos en la resistencia eléctrica del hilo
de mercurio al variar su diámetro y su longitud (Carrobles y Sanz, 1991; Sierra, 1996).
En el registro de la respuesta genital femenina se pueden utilizar tres metodolo-
gías diferentes: métodos basados en la vasoconstricción genital, registro de la tempe-
ratura vaginal y medida de la tensión del músculo pubococcígeo. Para la medida de
la vasocongestión vaginal se emplean técnicas fotométricas: se proyecta una luz so-
bre las paredes vaginales, captando el reflejo de la misma por medio de una célula fo-
todetectora; los diferentes grados de vasocongestión de las paredes vaginales se rela-
cionan con cambios en la luz reflejada. El fotómetro vaginal suele ir montado sobre
un tampón de plástico (Carrobles, 1990). Otra técnica que se utiliza es el registro de
los cambios volumétricos del clítoris por medio de células fotoeléctricas o de galgas
extensiométricas (Cáceres, 1990). Para la evaluación de los cambios de temperatura
vaginal se puede utilizar un diafragma con dos microtermistores que se fijan a las pa-
redes laterales de la vagina, un termistor clitoral o un sistema de detección de la tem-
peratura de los labios menores (Carrobles, 1990). Por último, otra técnica de la eva-
luación de la excitación femenina es la medida de la tensión del músculo
pubococcígeo que rodea la entrada vaginal mediante un sensor electromiográfico
(Carrobles, 1990). Para una mayor información sobre la evaluación psicofisiológica
de la sexualidada humana puede consultarse Cáceres (1990).
112.4. Actividad electrodérmica
La expresión actividad electrodérmica (AED) designa, de manera general, las mani-

festaciones eléctricas de la piel, sin tener en cuenta el procedimiento electrodérmico
utilizado, ni si se trata de nivel basal o de respuesta. La técnica de registro de la activi-
dad electrodérmica se denomina electrodermografía (EDG). Anteriormente se utili-
zaba la expresión registro psicogalvánico, pero su uso es inapropiado pues no todos
los parámetros electrodérmicos son registrados con corriente continua.
El registro de la actividad electrodérmica es una de las medidas más utilizadas en
Psicofisiología, especialmente la resistencia eléctrica de la piel. Estas medidas pare-
cen reflejar principalmente, aunque no con exclusividad, la actividad de las glándulas
sudoríparas y son consideradas medidas fundamenta lmente del sistema nervioso
simpático. Es importante resaltar que la actividad electrodérm ica no es un índice de
la sudoración, como en algún tiempo se pensó, sino la actividad presecretora de las
glándulas sudoríparas. sb:
Existen métodos directos para estimar la actividad de las glándulas sudoríparas,
basados en distintos procedim ientos de recuento de las glándulas activas segregando
sudor en un momento determinado; sin embargo, por las desventajas que entrañan
éstos, son más utilizados los métodos eléctricos indirectos, que probablemente sean
indicadores psicofisiológicos más sensibles y reflejen mejor distintos fenómenos
psicológicos. ad
Recientemente Freixa iBaqué (1993) ha propuesto una nueva clasificación y no-
menclatura de la actividad electrodérmica; ésta se recoge en los cuadros 18.3 y 18.4.
CUADRO 18.3. Componentes electrodérmicos
A A A
Componentes Notación Notación
general específica
Nivel NED Potencial: NPD

electrodérmico Resistencia: NRD
Conductancia: NCD
Impedancia: NZD
Admitancia: NAD
Respuesta RED Potencial: RPD

electrodérmica Resistencia: RRD
Conductancia: RCD
Impedancia: RZD
Admitancia: RAD
CUADRO 18.4. Procedimientos y tipos de actividad electrodérmica

Procedimiento Notación Origen eléctrico Unidades
Potencial PD Diferencia de potencial mv/cm?

dérmico bioeléctrico (endógeno)
Resistencia RD Corriente continua KO/cm?

dérmica (exógeno)
Conductancia CD Corriente continua umho/cm?

dérmica (exógeno) uS/cm?
Impedancia ZD Corriente alterna KO/cm?

dérmica (exógeno)
Admitancia AD Corriente alterna umho/cm?

dérmica (exógeno) uS/ecm?
€
NOTA: Z es la inicial usada a nivel internacional para designar la impedancia. Para designar la conduc-
tancia se puede usar mho que es la inversion de la unidad de resistencia ohm, o también Siemens,
en honor al científico Siemens que fue quien propuso esta medida.
La clasificación más general de los métodos de obtención de las respuestas elec-

trodérmicas es la que hace referencia a la fuente de procedencia de la corriente eléctri-
ca que sirve de base al registro de las respuestas, y que pueden tener lugar, de modo
natural, en forma de potencial bioeléctrico en el propio organismo (método endoso-
mático), o representar cambios en la resistencia o conductancia de la piel al paso de
una pequeña corriente eléctrica aplicada externamente (método exosomático). Por

tanto, las medidas de resistencia y conductancia son obtenidas por medio del método
exosomático, mientras que las medidas de potencial lo son por el endosomático. En el
método exosomático se puede utilizar corriente continua, obteniendo así la resisten-
cia dérmica (RD) y la conductancia dérmica (CD); o se puede utilizar corriente alterna,
denominándose entonces estos componentes como impedancia dérmica (ZD) y ad-
mitancia dérmica (AD). En el cuadro 18.4 se recogen los distintos tipos de procedi-
mientos utilizados, el origen eléctrico de la señal y las unidades de medida.
Las variables electrodérmicas son, asimismo, divididas en medidas tónicas y fási-
cas, refiriéndose en el primer caso a los niveles básicos de resistencia o conductancia
y de potencial de la piel, y en el segundo a los cambios bruscos o graduales produci-
dos en esos niveles como efecto de la presentación de determinados estímulos.
En la medida de las variables electrodérmicas pueden utilizarse, a su vez, dos
procedimientos diferentes: el método de la corriente constante y el método del vol-
taje constante. En el primer método, y siguiendo la ley de Ohm (V=IR), se mantiene
constante la intensidad de la corriente (1), y se registra el voltaje que pasa a través del
organismo que funciona como una resistencia. Utilizando este método, la medida
que se obtiene es la resistencia de la piel. En el segundo método, el voltaje se mantie-
ne constante, registrándose la corriente que fluye a través de la resistencia (I=V/R).
Este segundo método es el apropiado para obtener la medida de la conductancia de
la piel. En general, puede decirse que la conductancia es mejor método de medida
que la resistencia, ofreciendo las ventajas de proporcionar una medida lineal y direc-
ta de la actividad de las glándulas sudoríparas y una representación visual más apro-
piada en el registro poligráfico. El registro de la resistencia ofrece, por su parte, ven-
tajas que pueden hacerle aconsejable en ocasiones, como el requerir una menor
amplificación. En cualquier caso, las medidas de resistencia pueden transformarse
recíprocamente en medidas de conductancia por medio de un procedimiento mate-
mático. En cuanto a la significación psicológica puede decirse que el incremento del
nivel basal de resistencia o impedancia se asocia con un decremento en el nivel de an-
siedad del sujeto; mientras que, por el contrario, el incremento del nivel basal de
conductancia o admitancia se relaciona con un incremento del nivel de ansiedad. Por
ello, la actividad electrodérmica ha sido considerada como una de las mejores medi-
das en los procedimentos clásicos de la “detección de mentiras”
Todas las medidas exosomáticas, tanto tónicas como fásicas (NPD, NRD, NCD,
NZD, NAD, RPD, RRD, RCD, RZD, RAD), pueden obtenerse a través de los mismos
electrodos, por medio del empleo de sistemas independientes de acoplamiento del
amplificador, utilizando un acoplamiento CC de mayor frecuencia para los cambios
lentos de nivel de resistencia, y un acoplamiento CA de baja frecuencia para los cam-
bios rápidos de la respuesta de resistencia de la piel.
Para el análisis de los niveles basales de potencial, resistencia (impedancia) o con-
ductancia (admitancia), es suficiente con registrar el valor de cada parámetro en un mo-
mento dado. Sin embargo, para el análisis de las respuestas de estos componentes es ne-
cesario tener en cuenta diversos parámetros tales como amplitud, amplitud relativa,
latencia, frecuencia, morfología, etc. Para más información véase Frerxa 1 Baqué (1993).
nL2.5. Actividad pupilográfica

Las variaciones en el tamaño de la pupila también han sido utilizadas como una me-
dida de activación emocional. Las actuales técnicas de medida de esta respuesta se di-
viden básicamente en dos métodos: los que utilizan técnicas fotográficas, con pelícu-
las sensibles a la luz o por medio de sistemas de rayos ultravioletas o infrarrojos, para
fotografiar el ojo, y los que utilizan la técnica fotoeléctrica a través de un haz de ra-
yos infrarrojos dirigido al ojo y controlado electrónicamente para examinarlo.
12.6. Actividad gastrointestinal

La actividad gastrointestinal es sensible a los cambios emocionales, y como tal es
igualmente una medida utilizada en psicofisiología. Dos son las principales medidas
de la actividad gastrointestinal empleadas: la motilidad gástrica y la acidez estomacal
o nivel del pH del estómago.
A las técnicas clásicas del tubo gástrico introducido en el sujeto para aspirar el
contenido del estómago, del mismo tubo con un balón hinchable en un extremo
para medir la presión intragástrica, han sucedido recientemente técnicas más sofisti-
cadas, como la radio-telemetría, para obtener medidas de la presión, del contenido
del ácido y del pH estomacal a través de una radiosonda del tamaño de una píldora
que el sujeto puede tragar, y que a través de los apropiados transductores convierte
las medidas en señales eléctricas. Otros procedimientos de medida de la actividad
gastrointestinal están basados en el registro directo de la actividad eléctrica (EMG)
del estómago a través de electrodos externos colocados sobre el abdomen, obtenién-
dose así el trazado típico denominado electrogastrograma (EGG). Para más informa-
ción véase Simón (1996).
112.7. Actividad salivar
Los tres pares de glándulas salivares existentes (las parótidas, las submaxilares y las
submandibulares) son inervadas de forma compleja tanto por fibras simpáticas
como parasimpáticas. Los métodos de obtención de esta respuesta van desde el em-
pleo de las clásicas torundas dentales, que después de empapadas en saliva pueden
ser pesadas para obtener la medida de la saliva segregada, hasta las distintas técnicas
de succión directa de la saliva y el correspondiente cálculo de la cantidad segregada.
112.8. Actividad de sudoración
El sudor es un fenómeno que tiene su base en el sistema neurohormonal, por lo cual

es susceptible de múltiples efectos. Así, puede ser afectado por los centros hipotalá-
micos, la irrigación sanguínea cutánea y factores psicológicos relacionados con la an-
siedad. Por tanto, a pesar de no ser una medida utilizada habitualmente en Psicofisio-
401
logía, sin sal puede tener cierto interés. Existen pocos instrumentos para registrar
esta variable; no obstante, elmás conocido es la “cámara de Roy”, que consiste en una
pequeña cámara que permite medir el cambio de resistencia de un elemento sensible a
lahumedad del aire contenido en la cámara. Dicha cámara se fija a la piel y el aire seco
circula con un caudal que permite mantener constante el nivel de humedad elegido.
Así, cualquier cambio en la sudoración modifica el nivel y éste es restablecido me-
diante un servomecanismo que actúa sobre el flujo de aire. Por tanto, las variaciones
del caudal de aire que circula son indicativas de los cambios en el nivel de sudoración.
11.3. Actividad del sistema nervioso central
113.1. Actividad cerebral espontánea

La actividad eléctrica del cerebro puede ser registrada a través de las técnicas electro-
encefalográficas (EEG) que detectan los potenciales eléctricos producidos por las
neuronas corticales durante su actividad, y tanto los potenciales de base (CC) como
las variaciones de potencial (CA).
La señal resultante de un registro electroencefalográfico puede definirse primor-
dialmente por su irregularidad, pues en realidad resulta muy difícil encontrar algún
patrón regular en su morfología.
El electroencefalograma (EEG) es obtenido a través de electrodos externos fija-
dos al cuero cabelludo, representando, por ello, una medida un tanto rudimentaria
de la actividad de un gran número de neuronas corticales, e incluso subcorticales, si-
tuadas en la zona próxima a la situación del electrodo. El lugar de colocación de los
electrodos está establecido a nivel internacional, por un sistema que se conoce como
«sistema internacional 10-20» y que básicamente distribuye la colocación de los di-
versos electrodos en una especie de matriz.
En Psicofisiología sólo interesa normalmente el registro de las variaciones en la
diferencia de potencial entre dos puntos de la superficie del cerebro, por lo que la
técnica de medida utilizada es fundamentalmente en CA.
El registro EEG es una onda compleja, variable, difícil de describir y analizar.
Una primera clasificación de la actividad EEG es en términos de frecuencia de la
onda obtenida. De acuerdo con este criterio, el utilizado en el análisis visual del
EEG, se distinguen básicamente cuatro bandas de frecuencia denominadas beta,
alfa, theta (o zeta) y delta. El ritmo beta tiene una frecuencia entre 13 y 30 Hz por
segundo y una amplitud de hasta 20 microvoltios (1V), siendo característica de los
estados de alerta. La frecuencia alfa oscila entre los 8 y 12 Hz y en una amplitud de
entre 25 y 100 pV, asociándose al estado de relajación. El ritmo theta tiene una fre-
cuencia de 4 a 7 Hz y una amplitud superior a 20 pV, constituyendo en los adultos
un ritmo propio de los estados de relajación profunda o somnolencia. En la fre-
cuencia delta se incluyen las ondas de menos de 4 Hz, siendo el ritmo propio de
los estado de sueño profundo. Aunque existe cierto acuerdo respecto a los estados
subjetivos que hemos mencionado asociados a cada banda de frecuencias, el tema
no está exento de controversias, pues, en realidad, los ritmos no aparecen de forma
pura, sino entremezclados, predominando alguno de ellos, en función de cada esta-
do de activación-somnolencia y del lugar de situación de los electrodos. Por ejem-

plo, en la zona frontal predomina el ritmo beta, mientras que en la zona occipital es
más fácil registrar el ritmo alfa. '
Además de los cuatro ritmos básicos que acabamos de describir, cabe mencionar
otros dos tipos de ritmos; la frecuencia gamma utilizada para describir todo tipo de
onda por encima de los 35 Hz, y el ritmo sensoriomotor, que aunque su frecuencia
(12-14 Hz) se aproxima al ritmo alfa, su localización en la corteza sensomotora es
claramente distinta.
Algunos autores establecen la distinción entre los términos “frecuencias alfa” y
“ritmo alfa”, reservando este último término para la onda de idéntica frecuencia (8-
12Hz) registrada de forma dominante en el área occipital de un sujeto cuando per-
manece con los ojos cerrados. No obstante, esta clasificación de ritmos cerebrales
por su frecuencia y amplitud, es algo arbitraria y ha sido establecida de forma bas-
tante artificial, pues en realidad podríamos también hablar de un único ritmo cere-
bral cuya frecuencia oscila entre 0,5-35 Hz.
De una forma muy general, se puede afirmar que en la actividad eléctrica cere-
bral hay una relación inversa entre frecuencia y amplitud, pues cuanto menor es la
frecuencia, mayor suele ser la amplitud. Así, podría decirse que un elevado estado de
alerta se caracteriza por ritmos de alta frecuencia y baja amplitud, mientras que el
sueño profundo se caracteriza por ritmos de muy baja frecuencia y elevada ampli-
tud. Para una descripcion más detallada, véase Buela-Casal y Navarro (1990), y Bue-
la-Casal y Sierra (1994a).
Al método de análisis visual de los registros EEG que acabamos de describir, se
añaden actualmente otros métodos de análisis automáticos a través de filtros, inte-
gradores, o de análisis matemáticos por computadora del registro EEG. Del mismo
modo, también se han desarrollado métodos espacio-temporales o toposcópicos
que, a través del análisis en computadora, proporciona un cuadro gráfico del campo
potencial del cerebro de un sujeto; esta técnica se conoce con el nombre de mapas ce-
rebrales. Recientemente se estan aplicando técnicas de inteligencia artificial para el
análisis automático del registro electroencefalográfico.
11132. Actividad cerebral evocada
El cerebro está en permanente actividad, independientemente de cualquier tipo de

estimulación externa, este tipo de actividad es lo que se conoce como “espontánea” o
“de fondo”. Sin embargo, el cerebro también responde de una forma concreta a los
estímulos externos, pero dichas respuestas no son observables en el registro EEG de-
bido a que el trazado correspondiente con la respuesta concreta a un estímulo queda
enmascarado por la actividad cerebral espontánea. Por tanto, ha sido necesario desa-
rrollar técnicas para detectar las respuestas EEG de corta duración ante estímulos
concretos sensoriales (auditivos, visuales o táctiles) que proporcionan una informa-
ción adicional a los cambios relativamente lentos obtenidos a través del registro de
los trazados EEG normalizados. Estas respuestas son denominadas respuestas me-
días evocadas o potenciales evocados promediados (PEP).
Los PEP son unas respuestas sobreimpuestas a la actividad EEG de base, que es
preciso eliminar, producidas por la presentación repetida de un mismo estímulo. Las

respuestas sucesivas al estímulo son sumadas y promediadas para obtener la onda
característica de estas respuestas y filtrar la actividad EEG de fondo. Esto se consigue
debido a que la actividad cerebral espontánea oscila entre componentes positivos y
negativos, manteniendo una relación constante entre negativos y positivos, mientras
que la respuesta concreta del cerebro a un estímulo concreto, tiene un trazado con
una morfología característica, que se repite sistemáticamente a cada presentación del
estímulo. Esto permite que al promediar los registros EEG captados durante la pre-
sentación repetida de un estímulo, la actividad espontánea desaparece y se obtiene
así el trazado “limpio” de la respuesta del cerebro a dicho estímulo.
Las respuestas evocadas pueden, a su vez, dividirse en respuestas específicas y
respuestas inespecíficas. Las respuestas específicas son respuestas de baja latencia
(inferior a 50 milisegundos) que tienen lugar en el área cortical de proyección prima-
ria de cada estímulo sensorial específico utilizado, mientras que las respuestas ines-
pecíficas, de mayor interés en Psicofisiología por su relación con variables psicológi-
cas, como la atención o el estado de alerta o expectación, son respuestas de mayor
latencia y registradas en distintas zonas de la corteza cerebral. Para más información
véase Buela-Casal y Navarro (1989).
Un fenómeno relacionado con las respuestas evocadas es la “variación negativa
contingente” (CNV) u “onda de expectación”, como también es denominada, y que
consiste en un cambio lento de potencial negativo, obtenido entre dos estímulos,
uno de ellos utilizado como señal, en una tarea de tiempos de reacción y después de
presentarse apareados ambos estímulos cierto número de veces. Los cambios EEG,
registrados principalmente en la región frontal, han de ser, asimismo, promediados
para cuantificarlos y eliminar la actividad EEG de fondo.
Para el registro de los potenciales evocados promediados hay que tener en cuenta,
que si bien el cerebro siempre emite la misma respuesta a un estímulo concreto, hay di-
versos factores que pueden afectar a los parámetros y/o a la morfología del trazado del
potencial evocado. Entre éstos, hay que resaltar las características físicas del estímulo,
el significado que el estímulo pueda tener para el sujeto, si es un estímulo esperado o
inesperado, la situación estimular previa a la presentación del estímulo, etcétera.
A diferencia de la actividad cerebral espontánea, en la cual la frecuencia era el
principal parámetro para su análisis, en los PEP la frecuencia carece de sentido, pues
lo que interesa es el análisis cuantitativo y morfológico de un único trazado. Así, los
parámetros utilizados en el análisis de los PEP son la latencia, la secuencia, la polari-
dad y la amplitud.
La polaridad hace referencia al signo positivo o negativo de los componentes,
utilizándose las letras mayúsculas P y N para designar las oscilaciones positivas y ne-
gativas, respectivamente. La polaridad de los registros se invierte en estos trazados,
de forma que los componentes ascendentes son negativos y los descendentes positi-
vos. Se ha observado que cuando se realizan registros intracraneales de potenciales
evocados, al introducir lentamente el electrodo explorador en la corteza, se puede
observar que la onda positiva de la respuesta primaria que se produce inmediata-
mente después de la presentación del estímulo, se va debilitando, cambiando su po-
laridad hasta el punto de que en el nivel de las capas III y 1V el electrodo explorado:
registra un potencial negativo.
FIGURA 18.2. Trazado EEG de un potencial evocado promediado
Presentación
del estímulo
uV
Nz (135)
10
N;5 (300)
N> (90) Na (200)
(3) N;
2)
=
E
as
>
< P,
Pa (140) Es(325)
P4 (220)
P> (120)
-10
0 250 500 750

milisegundos
LATENCIA
La latencia alude al período de tiempo transcurrido desde el momento en que se

produce el estímulo hasta que se produce el pico de la oscilación. Según este paráme-
tro de latencia, los componentes se identifican en función del tiempo de aparición,
en relación a la presentación del estímulo, expresándose con un subíndice en milise-
gundos (por ejemplo, P,.., Nyo.»-).
La secuencia identifica a los componentes por orden de aparición; este orden
suele identificarse con letras o números latinos, siendo este sistema el más utilizado
(por ejemplo, N,, N,, P., P,....).
La amplitud (voltaje) se expresa en microvoltios. Cuando se considera desde la
línea base se denomina voltaje de pico, mientras que si se considera la amplitud total
de la señal, es decir, la diferencia entre dos puntas consecutivas de distinta fase, tene-
mos el voltaje pico a pico.
405
Actualmente no existe un sistema estándar para designar los componentes de los

potenciales evocados. Aunque todos los autores coinciden en la necesidad de definir
el parámetro polaridad, no ocurre lo mismo con la latencia y la secuencia. Algunos
autores defienden que el criterio de latencia es más preciso que el de secuencia, ya
que si se utiliza sólo este segundo parámetro, no se dispone de información sobre el
momento en que aparece cada componente, en relación a la presentación del estímu-
lo. Otros autores se inclinan por el parámetro de secuencia, argumentando que si se
utiliza la latencia no se puede saber cuántos componentes preceden a un componen-
te dado. Nosotros consideramos que un sistema mixto de los dos anteriores sería el
más adecuado, pues recogería información sobre la polaridad, la secuencia y la laten-
cia. En resumen, consistiría en denominar a un componente con una letra mayúscula
según la polaridad, a continuación un número latino que indica el orden de aparición
y seguido de un subíndice entre paréntesis que indica la latencia en milisegundos
(por ejemplo, P3 ¿.,).
nL4. Actividad del sistema endocrino y bioquímico

En Psicofisiología, cada día cobra más énfasis la atención prestada a los factores en-
docrinos y bioquímicos como parte de una consideración integrada del organismo
como un todo que la caracteriza. En el área de la Psiconeuroendocrinología y de la
Bioquímica cerebral, por otro lado, están teniendo lugar importantes progresos ten-
dentes a desvelar la función de las diferentes hormonas y neurotransmisores y su re-
lación con los distintos procesos conductuales, tanto en el organismo normal como
en el afectado por una diversidad de trastornos. No podemos entrar aquí, por límites
de espacio, en la consideración de estos factores, sin embargo, a modo de ejemplo
puede verse en Buela-Casal y Navarro (1990) la aplicacion de estas técnicas al estu-
dio del sueño.
IV. REGISTROS PSICOFISIOLÓGICOS EN SITUACIONES NATURALES: TELEMETRÍA

Y APARATOS DE REGISTRO PORTÁTIL
Una de las principales limitaciones de la evaluación psicotisiológica es la necesidad

de que ésta se realice en una situación de laboratorio, manteniendo a los sujetos en
una posición de inmovilidad, con el fin de evitar los posibles artefactos. Esta limita-
ción es, en buena medida, responsable de la dificultad de establecer relaciones entre
las medidas fisiológicas y las demás modalidades de respuesta, especialmente con las
conductas motoras, sobre las que apenas existen estudios relacionándolas (véase el
capítulo de Tryon en este libro). TES 190
La conveniencia del registro de estas respuestas fisiológica s en situaciones natu-
rales de la vida real resulta obvia, y a la consecuci ón de este objetivo se han dedicado
amplios esfuerzos que ya han empezado a dar sus frutos. Entre las soluciones parcia-
les aportadas al tema podemos hablar del biofeedback, de la telemetría y de los regis-
tros portátiles de frecuencia modulada.
Dentro de la considerable investigación que se ha realizando en el área del bio-

feedback, e indudablemente impulsada por ella, ha sido posible el desarrollo de bio-
amplificadores de pequeño tamaño que han permitido reducir considerablemente el
volumen de los aparatos de registro. Ello ha hecho posible, junto con el abarata-
miento de sus costes, el que los departamentos de Psicología puedan disponer, por
un lado, de un mayor número de aparatos de este tipo y, por otro, el que los mismos
puedan ser utilizados en situaciones algo diferentes del laboratorio, como el despa-
cho del terapeuta o la propia casa del paciente, con cierta facilidad y sin demasiadas
alteraciones. Equipos portátiles de biofeedback han sido utilizados, igualmente, en
la identificación de estímulos estresantes en situaciones naturales.
El otro campo que citábamos, ya con cierta historia en Psicofisiología, es el de la
“telemetría” o “radio-telemetría”. Entre las aplicaciones de la telemetría en la Psico-
logía clínica, destacan cuatro de tipo general:
a. Registro de funciones psicofisiológicas no asequibles por métodos normales

de registro
b. Registro en situaciones naturales
c. Modificación de problemas de conducta
d. Entrenamiento profesional de psicólogos
Vamos a hacer algún comentario a los dos primeros tipos de aplicaciones por su
importancia en el tema de la evaluación psicofisiológica que aquí estamos conside-
rando.
La primera aplicación se refiere al registro de funciones psicofisiológicas no ase-
quibles directamente con las técnicas poligráficas normales, como puede ser el caso
del registro directo de la actividad, la presión o la temperatura de ciertas vísceras in-
ternas, como el estómago o el intestino, a través de endorradiosondas o transmisores
ingeribles (radio pills).
En cuanto a la segunda aplicación, y más importante, hace referencia al uso más
genuino de las técnicas telemétricas, el de obtener registros psicofisiológicos de suje-
tos no limitados en su actividad o que se desenvuelven en su medio natural. Esta po-
sibilidad, por otra parte, es de una importancia fundamental, pues permite resolver
algunas de las más importantes limitaciones que afectan a la Psicofisiología, como
son, por un lado, la obtención de registros en sujetos que por su condición patológi-
ca no se prestan a una evaluación en condiciones de inmovilidad como los niños hi-
peractivos, los psicóticos o los pacientes con lesiones cerebrales, y, por otro lado, el
poder comparar las respuestas psicofisiológicas con las demás modalidades de res-
puesta, objetivo primordial de la Psicofisiología, al permitir obtener registros más
prolongados y en situaciones naturales, lo cual, sin duda, aumenta considerablemen-
te su validez ecológica.
La telemetría, no obstante, presenta aún serios problemas que podemos al me-
nos enumerar. Entre estos problemas se encuentra el radio de transmisión de la se-
ñal, aún limitado y muy dependiente de las condiciones físicas, atmosféricas y geo-
gráficas del medio, e, igualmente, las múltiples causas de interferencia en la recepción
de la señal, procedentes de las variadas fuentes de emisión de ondas eléctricas presen-
tes en el medio en que tiene lugar el registro. Un problema también importante es el
407/
de que algunas respuestas requieren para un registro una tecnología especialmente

compleja, lo que no las hace demasiado recomendables, por el momento, para esta
modalidad de registro. Sin embargo, muchas respuestas son ya en la actualidad sus-
ceptibles de un registro telemétrico, entre las que se cuentan la presión sanguínea, la
tasa depulso, la tasa cardíaca, la resistencia eléctrica de la piel y la tasa respiratoria y
la actividad cerebral. Un último problema, igualmente importante, puede constituir-
lo la perturbación, más o menos grande, que la artificialidad de la situación de regis-
tro siga suponiendo para el sujeto.
En la solución de estos problemas se ha trabajado en los ultimos años. Así, de for-
ma considerable y gradualmente se han ido aportando soluciones a los mismos. En
esta línea se encuentran los aparatos portátiles de registro de frecuencia modulada que,
en lugar de transmitir la señal, la almacenan en una pequeña grabadora de cinta magné-
tica, con lo que se evitan los problemas de transmisión e interferencias. En algunos de
estos equipos se han prescindido incluso de los pequeños cables que unen los electro-
dos y la unidad de registro, con lo que se facilita la fijación y ocultación de los mismos.
Estos aparatos permiten hoy el registro simultáneo de hasta tres o más respuestas, y
gozan de autonomías de veinticuatro horas y hasta de una semana en las unidades en
que los registros se almacenan en memoria en lugar de hacerlo en cinta magnética.
V. ALGUNOS CONCEPTOS Y PROBLEMAS RELACIONADOS

CON LA EVALUACIÓN DE VARIABLES PSICOFISIOLÓGICAS
Una de las principales aplicaciones de las técnicas psicofisiológicas es la de servir de so-

porte empírico en la evaluación de las demás formas de conducta, motoras, cognitivas,
afectivas, e igualmente la posibilidad de definir de forma igualmente objetiva los dife-
rentes trastornos postulados desde la investigación clínica. Sin embargo, en la satistac-
ción de estos objetivos, la Psicofisiología se enfrenta con serios problemas que afectan
tanto a la evaluación en sí de las variables fisiológicas como a algunos de los conceptos
en que se apoya la Psicofisiología, y que están aún siendo objeto de discusión.
En cuanto al primero de estos problemas, el de la evaluación de las variables psi-
cofisiológicas, su consideración nos enfrenta con la dificultad de establecer en toda
situación experimental relaciones paramétricas claras y precisas entre estas respues-
tas y las condiciones estimulares con las que pretendemos establecer su posible rela-
ción, por lo sensible de las medidas psicofisiológicas a diferentes tipos de estímulos.
A este problema, designado generalmente con el nombre de “artefactos” de medida,
le dedicaremos atención en primer lugar en este apartado. El otro problema, el de los
conceptos y principios en que se apoya la Psicofisiología, merece asimismo, por su
importancia, una consideración especial. A algunos de estos conceptos y problemas
dedicaremos cierta atención en este apartado, con objeto de adoptar cierta perspecti-
va en la consideración de los datos proporcionados por la Psicofisiología. Entre los
conceptos y características que serán considerados están los de activación, emoción,
homeostasis y balance autonómico, estrés, síndrome general de adaptación, respues-
tas de orientación, habituación y adaptación, la ley de los valores iniciales, patrón de
respuesta y especificidad de respuesta, fraccionamiento de respuestas y biofeedback.
+08 José A. Carrobles y Gualberto Buela-Casal
va. Principales artefactos en los registros psicofistológicos

El problema principal en la obtención de registros psicofisiológicos estriba en la po-
sibilidad de atribuir de forma directa los cambios observados en las diferentes varia-
bles psicofisiológicas a los estímulos a los que son expuestos los sujetos. El estableci-
miento de este tipo de relaciones paramétricas entre los estímulos y las respuestas
psicofisiológicas presenta, ciertamente, importantes dificultades, derivadas del he-
cho de que las variables psicofisiológicas son sensibles a múltiples factores que pue-
den alterar su nivel de actividad. A este conjunto de factores ajenos a la estimulación,
cuya relación con las respuestas fisiológicas queremos medir y que pueden alterar
los registros psicofisiológicos, se denomina genéricamente con el nombre de artefac-
tos, siendo sumamente importante el poder descartar éstos de cualquier protocolo
clínico o de investigación psicofisiológica.
Los artefactos pueden clasificarse, atendiendo a su fuente de procedencia, en cin-
co categorías principales:
Artefactos ambientales y de registro
Artefactos debidos a la instrumentación
Artefactos procedentes del organismo
Artefactos debidos a la ritmicidad temporal de las variables psicofisiológicas
PEAD
SA Artefactos de interpretación
v.1.1. Artefactos ambientales y de registro

La primera de estas categorías, los artefactos ambientales y de registro, se refiere a las
condiciones físicas del medio en el que son obtenidos los registros psicofisiológicos.
Estas condiciones han de mantenerse constantes, pues su variación puede alterar sen-
siblemente los registros, especialmente los de mayor ganancia (EEG, EMG). Entre es-
tos estímulos ambientales hay que destacar el ruido, la luz, la temperatura ambiental,
la humedad, los olores, la estimulación táctil y la hora del día en la que se realizan los
registros. Sin embargo, el principal artefacto ambiental lo constituyen los campos
eléctricos variables que pueden afectar a la sala de medida procedentes de la red eléc-
trica, de luces fluorescentes o de los mismos equipos electromecánicos de programa-
ción. Estas interferencias eléctricas pueden eliminarse, bien derivando al propio suje-
to experimental a tierra, o bien aislando eléctricamente la sala de experimentación,
convirtiéndola en una cámara farádica a través de una malla metálica introducida en
las paredes, suelo y techo de la habitación. Tambien es imprescindible que la red eléc-
trica de la sala donde se realizan los registros tenga una adecuada conexion de tierra.
v.1.2. Artefactos debidos a la instrumentación
Los artefactos debidos a la instrumentacion se refieren fundamentalmente al tipo y

calidad de los electrodos y pasta o gel conductor utilizados, así como también a su
adecuada colocación.
409
Loselectrodos, al estar en contacto con una solución salina (bien sea la piel o la
sustancia conductora), alteran su polaridad produciendo artefactos en el registro.
Por ello, cuando se trate de registros prolongados se recomienda utilizar electrodos
de oro o en su defecto de plata clorurada.
La pasta o gel conductor debe ser el adecuado según la duración del registro y el
tipo de variable psicofisiológica registrada. Así, en registros prolongados (por ejem-
plo, los registros polisomnográficos) se debe utilizar una pasta conductora lo sufi-
cientemente densa para que no sea absorbida por la piel, como ocurriría en el caso de
utilizar un gel conductor muy acuoso. También es importante utilizar la cantidad
exacta de gel o pasta conductora, lo cual está en función del tamaño, tipo y morfolo-
gía del electrodo.
La colocación adecuada de los electrodos se refiere tanto a la situación anatómica
adecuada, según esté especificado en las normas internacionales, como a la adecuada
fijación bien por anillos adhesivos, cintas de velcro, elementos elásticos, o el clásico
sistema del colodión. Por último, no hay que olvidar que es imprescindible una pre-
paración adecuada del lugar donde será colocado el electrodo, para lo cual se reco-
mienda su limpieza con un algodón humedecido en alcohol o acetona.
v.1.3. Artefactos procedentes del organismo

En cuanto a los artefactos procedentes del organismo, la fuente fundamental de los
mismos suele ser el movimiento producido por el sujeto durante la situación de re-
gistro. Estos artefactos por movimientos suelen producir alteraciones en la zona de
contacto entre el sujeto y los electrodos, suficientes para afectar el registro, y la me-
jor forma de evitarlos es mantener al sujeto inmóvil en una posición cómoda y rela-
jada. Una forma indirecta de controlar estos artefactos es la de observar al sujeto du-
rante la situación de medida anotando los movimientos habidos en el mismo papel
de registro poligráfico mediante la correspondiente pluma indicadora de que nor-
malmente van provistos los aparatos de registro. No obstante, el problema del movi-
miento ha dejado de ser un hándicap en Psicofisiología con el desarrollo de las mo-
dernas técnicas telemétricas que permiten obtener registros del sujeto en interacción
con el medio. Otro artefacto importante es el efecto que los distintos sistemas psico-
fisiológicos puede tener sobre el sistema que está siendo registrado; para evitar este
artefacto hay que utilizar un adecuado protocolo experimental.
v1.4. Artefactos debidos a la ritmicidad temporal de las variables

psicofisiológicas
Todas las variables psicofisiológicas están sujetas a una influencia de la ritmicidad
temporal. Fundamentalmente los ritmos circadianos y ultradianos son los que tie-
nen un mayor efecto sobre los niveles basales y las respuestas de las distintas varia-
bles psicofisiológicas. Así, el ritmo circadiano determina que cada variable tenga un
mínimo (nadir) y un máximo (acrofase) en cada período de 24 horas, con oscilacio-
nes ascendentes y/o descendentes a lo largo del día. Por otra parte, estas oscilaciones
+10 José A. Carrobles y Gualberto Buela-Casal
circadianas pueden estar modificadas por un ritmo ultradiano (de mayor frecuencia)
que se superpone a las variaciones circadianas (para más información véase Buela-
Casal y Sierra, 1994b). Por ello, es fundamental que en los registros psicofisiológicos
se controle la hora del día en la que se realizan.
v.1.5. Artefactos de interpretación

La última categoría de artefactos, la concerniente a problemas de interpretación, se
refiere a un tipo distinto de variables relacionado con los diferentes principios y ca-
racterísticas, teóricos y empíricos, que afectan a los registros psicofisiológicos, limi-
tando su utilidad y su interpretación, y que han de ser tenidos en cuenta al evaluar
estas medidas en su relación con determinadas situaciones estimulares. Estos arte-
factos de interpretación entrañan una mayor importancia, por ser mucho más nu-
merosos y más difíciles de descartar que los anteriores. Entre los principales concep-
tos y problemas a considerar aquí, hay que resaltar el concepto de activación, el
concepto de homeostasis y balance autonómico, la respuesta de orientación, el con-
cepto de habituación y adaptación, la ley de los valores iniciales, el concepto de emo-
ción, el patrón de respuesta y la especificidad de la respuesta y el concepto del frac-
cionamiento de la respuesta. Una descripción detallada de estos conceptos puede
verse en Carrobles (1987).
v2. Fiabilidad y validez de las medidas psicofisiológicas

La fiabilidad y la validez de las medidas psicofisiológicas no han sido aún definitiva-
mente establecidas, y puede afirmarse que principalmente por deficiencias en los cri-
terios tradicionales empleados.
Por un lado, se ha observado un escaso nivel de fiabilidad entre las diferentes res-
puestas fisiológicas respecto de las correlaciones entre sujetos propias de los estudios
de grupo, procedimiento éste al parecer no el más apropiado, a la vista de los abun-
dantes datos existentes avalando el concepto de estereotipia de respuesta o patrón
específico individual de respuesta. Efectivamente, estos datos confirman que el
modo más apropiado de medir la fiabilidad de las respuestas fisiológicas es a través
de la obtención de medidas repetidas en un mismo sujeto y ante las mismas situacio-
nes experimentales. No obstante, dejando de lado el clásico concepto de fiabilidad,
cuya aplicación no sería muy adecuada en este tipo de variables, podría afirmarse
que las medidas psicofisiológicas tienen una fiabilidad total en cuanto miden varia-
bles físicas, susceptibles de calibrarse de una forma exacta.
En la evaluación de la validez se encuentran, asimismo, importantes dificultades.
Los resultados obtenidos en el pasado al intentar establecer la validez de las medidas
psicofisiológicas correlacionándolas con pruebas psicométricas, no se han mostrado
muy clarificadores. Las bajas correlaciones obtenidas en general en estos casos pue-
den ser debidas tanto a los propios problemas de fiabilidad y validez que afectan a
estas pruebas como a problemas inherentes a la propia artificialidad de la situación
de prueba, dado que las variables psicofisiológicas parecen estar determinadas situa-
411
cionalmente y relacionadas con acontecimientos ambientales psicobiológicamente

relevantes. Por tanto, es un problema más del criterio que de la propia medida.
Para determinar la validez parecen más apropiados otros procedimientos. Éstos
han de consistir fundamentalmente en la obtención de medidas psicofisiológicas con-
currentes con Otras medidas más precisas y objetivas, como las conductas motoras
manifiestas, posibilidad que empieza a vislumbrase con los progresos que están te-
niendo lugar en el campo de los registros telemétricos. Por otra parte, si hablamos és-
pecíficamente de la validez de las medidas, al igual que en el caso de la fiabilidad, al
tratarse de medidas físicas (por ejemplo, actividad eléctrica) no hay ningún problema
de validez, y por tanto, según esto podríamos hablar de una validez total, otra cosa di-
ferente sería la validez de la significación psicológica que pueda tener cada variable
psicofisiológica.
VI. LOS REGISTROS PSICOFISIOLÓGICOS EN EVALUACIÓN CONDUCTUAL
vL1. Relación entre las medidas psicofisiológicas y otras modalidades

de respuesta
La relación entre las distintas modalidades de respuesta se incluye dentro del proble-
ma del fraccionamiento o desincronización de respuestas pues la baja correlación
entre las distintas medidas puede tener lugar tanto entre respuestas psicofisiológicas
y las demás modalidades de respuesta (motoras, cognitivas o subjetivas) como entre
las mismas respuestas psicofisiológicas entre sí. A estos distintos tipos de relación
vamos a dedicar una atención más detallada en este apartado.
Un primer tipo de desincronía a considerar es el fraccionamiento observado en-
tre distintas medidas psicofisiológicas. Diferentes estudios (véase el clásico trabajo
de Haynes y Wilson, 1979) han aclarado en parte la relación entre las diferentes me-
didas psicofisiológicas entre sí. En relación con este problema han aparecido en los
últimos años abundantes trabajos, algunos con resultados contradictorios, que no
podemos detenernos aquí a revisar con cierto detalle. Las implicaciones que a modo
de resumen podemos extraer de estos hallazgos para la utilización de las medidas
psicofisiológicas en evaluación conductual son las siguientes:
a. No.es posible utilizar ninguna medida psicofisiológica como índice genera-

lizado del funcionamiento fisiológico global.
. Por ello, es conveniente tomar medidas múltiples siempre que sea posible.
c. Enla selección de medidas psicofisiológicas se deben tener especialmente en
cuenta los efectos que se desean alcanzar como resultado de la intervención
terapéutica o experimental,
d. Al seleccionar las medidas debe tenerse igualmente en cuenta la diferente
sensibilidad de las diversas medidas ante las distintas manipulaciones.
e. Del mismo modo, al seleccionar las medidas deben tomarse, asimismo, en
consideración y ser comprendidos los diferentes mecanismos fisiológicos
subyacentes de las mismas.
Otro campo importante en el que también se manifiesta plausiblemente el frac-

cionamiento de respuestas, es en las relaciones entre medidas psicofisiológicas y los
informes subjetivos facilitados por los sujetos. En múltiples estudios se ha demos-
trado una baja correlación en estados como los de relajación y ansiedad, entre medi-
das de autoinforme y medidas psicofisiológicas, correlaciones que sólo parecen ele-
varse bajo altos niveles de activación psicofisiológica. No obstante, estos resultados
deben considerarse con cierta reserva, pues como es sabido los autoinformes tienen
importantes limitaciones, una de las cuales es su gran dependencia de numerosas va-
riables, entre las cuales destacan las demandas y las expectativas respecto de la situa-
ción de evaluación, el procesamiento cognitivo de la situación experimental por par-
te del sujeto, las atribuciones formalizadas por el mismo sujeto respecto de su
estado, las autopercepciones de control o no control en la situación (locus of control)
y la experiencia previa del sujeto respecto de situaciones análogas. Por otro lado, la
mayoría de las investigaciones psicofisiológicas realizadas sobre el tema del fraccio-
namiento de respuestas ha utilizado diseños factoriales de grupo, lo que ha determi-
nado el que no se hayan estudiado las diferencias individuales respecto al tema, dife-
rencias que parecen ser importantes, dándose una gran variabilidad entre los sujetos
respecto al grado de sincronización entre diferentes medidas de respuesta, parecien-
do ser estas correlaciones altas en algunos sujetos y escasas o inversas en otros. No
obstante, también hay que tener en consideración que en la mayoría de los trabajos
realizados con registros psicofisiológicos se utiliza un número muy reducido de su-
jetos, lo cual puede ser una de las posibles explicaciones a las bajas correlaciones en-
contradas. De hecho, recientes investigaciones realizadas por el grupo de Buela-Ca-
sal ponen de manifiesto que cuando se incrementa el numero de sujetos en los
estudios se pueden obtener altas correlaciones (significativas) entre variables psicofi-
siológicas y la activación autormformada.
Por otra parte, cabe mencionar los recientes datos existentes respecto a la rela-
ción entre factores cognitivos y psicofisiológicos. En esta área, al contrario de lo que
ocurre en las anteriormente citadas, se encuentra normalmente una covariación sig-
nificativa entre manipulaciones cognitivas y variables psicofisiológicas. Estas corre-
laciones directas se han encontrado en tareas tan diferentes como la producción de
imágenes variadas, ansiógenas y no ansiógenas, en tratamientos conductuales cogni-
tivos de problemas fóbicos, e incluso ante simples tareas intelectuales, como el Test
de Halsted-Reitan (véase, para una revisión, el trabajo de Haynes y Wilson, 1979).
Respecto a estos hallazgos cabe hacer la misma recomendación anterior de conside-
rarlos con prudencia, pues pueden estar afectados tanto por la naturaleza de los fac-
tores cognitivos en sí como por diferentes defectos en la forma en que han sido deri-
vados, tales como el tipo de paradigma experimental utilizado normalmente para
obtenerlos, consistente en la manipulación de los factores cognitivos como variable
independiente y en la observación de los cambios observados concurrentemente en
las variables psicofisiológicas, a diferencia de lo observado en los anteriores estudios
para medir la correlación entre informes subjetivos y medidas psicofisiológicas, en
los que ambos factores eran utilizados como variables dependientes. Otro factor a
tener en cuenta es la diferente sensibilidad que las distintas variables psicofisiológi-
cas parecen presentar ante la manipulación de factores cognitivos, lo que hace nece-
lécnicas psicofisiológicas
413
sario mirar con cautela los resultados hasta que no dispongamos de datos más siste-
máticos sobre la sensibilidad diferencial de estas medidas.
En relación con la sincronía entre factores cognitivos y psicofisiológicos, cabe
mencionar, asimismo, los ya clásicos trabajos en forma de libros publicados por Mc-
Guigan (1978, 1979) sobre la utilización de medidas psicofisiológicas en el registro y
evaluación directa de conductas de dimensiones sumamente pequeñas (conductas
encubiertas), como el registro electromiográfico de la lengua o los labios, y que al
constituir correlatos directos de actividades cognitivas pueden permitirnos la eva-
luación objetiva de éstas.
Para finalizar este apartado podemos concluir que el principal resultado deriva-
do de estos estudios ha sido el considerable énfasis que ha adquirido la evaluación
multimodal de amplio espectro, que utiliza diferentes procedimientos de medida
para la evaluación de los distintos componentes de respuesta, con el fin de identificar
y comprender lo más adecuadamente posible las conductas-problema presentes en
un determinado sujeto y poder diseñar, en función de ello, el plan de intervención
más adecuado.
vI2. El registro de respuestas psicofistológicas en el diseño y evaluación

del tratamiento conductual
Uno de los principales usos de los registros psicofisiológicos, como ya se comentó
anteriormente, estriba en la utilidad de los mismos en la selección de las principales
conductas-problema que habrán de ser modificadas a través de la consiguiente apli-
cación del tratamiento. Con este propósito, suele procederse a la evaluación simultá-
nea de distintos componentes relacionados con las tres modalidades de respuesta
con objeto de determinar la interacción mutua y el peso relativo de los mismos en el
problema que afectan al sujeto.
En algunos casos el problema presentado por un paciente tiene que ver, primaria-
mente, con algún trastorno psicofisiológico (también llamados trastornos psicosomá-
ticos) del tipo de la cefalea de tensión, el asma o la hipertensión, en cuyo caso la varia-
ble psicofisiológica alterada determina en gran parte tanto la evaluación como la
intervención terapéutica. Sin embargo, en otros casos, como en la ansiedad, la depre-
sión, la obesidad o las disfunciones sexuales, los componentes psicofisiológicos son
sólo factores concurrentes, con diferentes tipos de relación con las principales conduc-
tas-problema, relación que es igualmente preciso evaluar. En este contexto, como afir-
ma Haynes (1978), la evaluación psicofisiológica puede desempeñar funciones diag-
nósticas, sirviendo tanto a la identificación del problema como a la selección del tipo
de tratamiento más apropiado (véase el capítulo de O'Brien y Haynes en este libro).
Otra aplicación importante de la evaluación psicofisiológica es la de servir de
auxiliar tanto en la planificación como en la ejecución del tratamiento (Epstein,
1976). Así por ejemplo, las medidas psicofisiológicas pueden ser de gran utilidad en
la predicción del éxito de un determinado tipo de tratamiento, como en elcaso de las
fobias, donde ante los distintos tratamiento disponibles (desensibilización, implo-
sión, modelado, reestructuración cognitiva) se hace necesario anticipar el posible re-
sultado de cada uno de ellos con objeto de seleccionar el más apropiado. En el caso
de sujetos fóbicos, se ha encontrado que aquellos sujetos que manifiestan signos de

activación psicofisiológica, además de la conducta manifiesta de evitación, pueden
beneficiarse más de un tratamiento de desensibilización que aquellos que sólo pre-
sentan los componentes de evitación (Lang, Melamed y Hart, 1970). Las medidas
psicofisiológicas también pueden utilizarse para ordenar jerárquicamente los ítems
de ansiedad presentados por un sujeto antes de proceder a su desensibilización.
Los registros psicofisiológicos pueden igualmente ser de gran utilidad en la eva-
luación del resultado de un determinado tratamiento. En estos casos, la medida de la
respuesta psicofisiológica suele utilizarse como variable dependiente con la finalidad
de demostrar objetivamente la eficacia del tratamiento empleado como variable in-
dependiente. Este uso de las medidas fisiológicas está especialmente indicado para
los casos en que existe una correlación entre la medida psicofisiológica y la respuesta
de modalidad diferente elegida como objetivo de la intervención terapéutica. Esto
nos remite al problema, ya discutido anteriormente, de la sincronización o desincro-
nización observada entre los diferentes tipos de respuestas, y a la necesidad de utili-
zar evaluaciones múltiples o multimodales con objeto de observar las correlaciones
existentes entre las mismas y determinar igualmente el patrón específico de respues-
ta particular presentado por determinado sujeto.
En este contexto, diversos estudios han demostrado relaciones entre algunos tras-
tornos clínicos y diferentes respuestas psicofisiológicas. Así, el estado de miedo o an-
siedad ha sido puesto en relación con diferentes medidas de activación simpática, es-
pecialmente el incremento en la tasa cardíaca. Por otra parte, Schwartz (1977) ha
encontrado la existencia en diferentes sujetos de un patrón consistente de elevación
de la tasa cardíaca y del potencial EMG del músculo frontal. En sujetos depresivos se
ha encontrado una elevada responsividad psicofisiológica ante estímulos ligeramente
aversivos. En sujetos depresivos, Schwartz (1975) ha encontrado diferencias respecto
de sujetos no depresivos en el mapa de activación electromiográfica de los músculos
de la cara. En psicópatas, es de antiguo conocido su escasa responsividad psicofisioló-
gica ante situaciones aversivas. En todos estos casos las variables fisiológicas relacio-
nadas con los distintos trastornos pueden ser utilizadas como controles indicadores
del progreso del tratamiento al que pueden ser expuestos los diferentes sujetos.
vI3. La evaluación indirecta de las variables psicofisiológicas

La evaluacion de las variables psicofisiológicas tiene lugar, normalmente, de forma
directa a través de los distintos procedimientos de registro que hemos descrito a lo
largo de este capítulo. Este método de obtención directa de medidas psicofisiológi-
cas constituye, naturalmente, y salvando las dificultades y problemas que hemos
enumerado, la mejor forma de evaluación de las mismas. Sin embargo, hay ocasiones
en las que bien por dificultades técnicas (no disponibilidad de aparato, situaciones de
interacción en el medio natural, etc.), o bien por requerimiento de la propia situación
experimental, sea necesario recurrir a la evaluación indirecta de índices psicofisioló-
gicos. Entre los procedimientos de evaluación indirecta de variables psicofisiológi-
cas pueden distinguirse los tres siguientes: la observación, el autorregistro y el auto-
informe.
vI3.1. La observación
Una forma de evaluar variables psicofisiológicas puede tener lugar a través de la ob-
servación directa de manifestaciones físicas o conductuales externas, relacionadas
con una determinada variable o problema. Este procedimiento sólo es aplicable, evi-
dentemente, cuando existen manifestaciones externas discriminables, como suele ser
el caso, por ejemplo, de los tartamudos en estado crónico, que presentan una con-
tracción bastante generalizada de los músculos de la cara y cuello. Los principios por
los que se ha de regir esta observación son los mismos descritos ampliamente en el
capítulo de la técnica de observación en este libro.
vI3.2. El autorregistro
En el autorregistro de respuestas psicofisiológicas debe diferenciarse entre el regis-
tro de los síntomas asociados a una determinada respuesta psicofisiológica y el re-
gistro de la respuesta en sí misma. Mientras que los síntomas asociados a determina-
dos estados fisiológicos pueden ser fácilmente detectables para un sujeto y, por
tanto, son susceptibles de evaluación a través del autorregistro, no ocurre lo mismo
con la evaluación del propio estado fisiológico respecto al cual diferentes estudios
(véase Epstein, 1976, para una revisión del tema) han demostrado la existencia de ba-
jas correlaciones entre los autorregistros y los registros directos de las variables psi-
cofisiológicas. La detección por parte de los sujetos de estos estados fisiológicos
puede mejorarse a través de un entrenamiento adecuado de los mismos, como han
demostrado varios autores, en variables tales como la tasa cardíaca, las ondas cere-
brales y la actividad electrodérmica (Epstein, 1976).
VL3.3. Autoinformes
Otro procedimiento que también puede utilizarse para evaluar variables psicofisio-
lógicas es a través de la confección de cuestionarios o inventarios, bien generales o
bien específicos, en los que se enumera una serie de manifestaciones psicofisiológicas
y se pide al sujeto con determinados problemas que lasconsidere y señale las que se
aplican a su caso. Aunque no existen muchos cuestionarios de este tipo, principal-
mente por los problemas que entraña esta forma de evaluación, relacionado con las
medidas de autoinforme, agravados en el caso de las variables psicofisiológicas por
las dificultades de discriminación de estos estados por parte de los sujetos. Sin em-
bargo, en las dos últimas décadas han aparecido algunos cuestionarios relacionados
principalmente con determinados problemas clínicos, como la ansiedad. Una rela-
ción de los principales cuestionarios se facilita, a continuación, en el cuadro 18.5.
CUADRO 18.5. Principales cuestionarios para la evaluación de variables fisiológicas

Cuestionario sobre percepción autonómica Mandler y Kremen
(Autonomic Perception Questionnaire)
Inventario de indicadores psicofisiológicos Cautela y Upper
Inventario de ansiedad E-R Endler, Hunt y Rosenstein

(S-R Inventory of Anxivusness)
Cuestionarios de síntomas menstruales Chesney y Tasto

(Menstrual Symptom Questionnaire)
Síntomas de los estados de ansiedad de la Hamilton

escala de Hamilton
Nueva lista de síntomas para evaluación médica Free

(New Physicians Rating List)
VIL LOS REGISTROS PSICOFISIOLÓGICOS EN EL TRATAMIENTO CONDUCTUAL:

EL BIOFEEDBACK
El biofeedback es una técnica nacida en el ámbito de la psicología del aprendizaje,

aunque en la actualidad, debido a la gran aceptación que ha tenido por los psicólogos
de la salud, tanto a nivel aplicado, como de investigación, tiende a considerarse como
una técnica de terapia de conducta. El biofeedback puede definirse como una técnica
psicofisiológica mediante la cual un sujeto aprende a controlar un proceso fisiológi-
co sobre el que no tiene control voluntario.
Los fundamentos del biofeedback pueden encontrarse en una serie de estudios
en animales y humanos. Entre los primeros, destaca el ya clásico trabajo de Miller y
Carmona (1967) sobre el condicionamiento operante de la respuesta salivar en pe-
rros, y el de Miller y Dicara (1967), donde se demuestra la especificidad del aprendi-
zaje en relación al sistema fisiológico reforzado, aunque no se debe olvidar que estos
trabajos han tenido serias críticas por su metodología y por la dificultad de su aplica-
ción. En la investigación con humanos, a modo de ejemplo, podemos mencionar los
trabajos de Kimmel y Kimmel (1963) sobre el condicionamiento instrumental de la
actividad electrodérmica, y el de Kamiya (1962) sobre la actividad electroencefalo-
gráfica. Es importante resaltar que ya desde los primeros estudios sobre condiciona-
miento instrumental de respuestas del sistema nervioso autónomo en humanos, ade-
más del refuerzo, se utilizaba de forma complementaria información auditiva o
visual sobre el estado de los procesos fisiológicos a modificar, lo cual resulta más
efectivo que la simple administración del refuerzo, puesto que facilita la relación de
contingencia entre las respuestas fisiológicas y los refuerzos. En la década de los
años setenta, la mayoría de las investigaciones con humanos tan sólo utiliza la infor-
mación sobre el estado fisiológico. Esta información no puede ser considerada como
un refuerzo, a no ser que se aceptase la definición pragmática del refuerzo como
todo estímulo que al seguir a una respuesta incrementa la probabilidad de que se re-
417
pita dicha respuesta. Para muchos autores esto no puede considerarse un refuerzo en
el sentido estricto, por lo que este procedimiento ya no puede ser explicado en tér-
minos del modelo operante, ajustándose más a un modelo cibernético de control de
sistemas. Este tipo de procedimiento es el que actualmente se considera específica-
mente como biofeedback.
vIL1. El proceso de biofeedback

En el proceso de biofeedback se siguen las mismas fases que en el proceso de registro
e las respuestas psicofisiológicas, más una fase adicional consistente en la transfor-
mación de los datos registrados para informar al sujeto.
La primera fase consiste en la captación de la señal por medio de los electrodos o
transductores apropiados, según se trate de señales bioeléctricas directas o transdu-
cidas.
En la segunda fase se amplifica la señal captada. Esta amplificación se realiza en
dos niveles: preamplificación y amplificación. En el primer nivel se produce el filtra-
do y la ganancia de la señal por medio de preamplificadores, y en un segundo nivel se
incrementa la amplificación hasta un umbral suficientemente alto como para accio-
nar el dispositivo de salida.
La tercera fase consiste en simplificar e integrar la señal, es decir, se trata de pro-
cesar la señal acumulando y promediando señales aisladas que se producen en un in-
tervalo determinado de tiempo, o bien procesando la señal sólo cuando ésta supere
un umbral de respuesta seleccionado previamente.
En la cuarta fase se realiza la conversión de la señal a otra modalidad que pueda
ser fácilmente procesada por el sujeto. Las modalidades sensoriales más utilizadas
son la visual y la auditiva.
La última fase consiste en facilitar al sujeto la información relevante (de modo
inmediato) sobre el estado del mecanismo fisiológico que está tratando.
vi2. Tipos de biofeedback

El biofeedback puede clasificarse en función de:
a. Las dimensiones de la respuesta que se utiliza para informar al paciente

b. La modalidad sensorial de dicha respuesta
c. Eltipo de mecanismo fisiológico sobre el que se interviene
En lo que respecta a la dimensión de la respuesta, el biofeedback puede ser clasi-

ficado en función de la relación de cantidad de información entre la señal registrada
y la facilitada al sujeto, o en función de la forma en que se presenta la información en
relación al tiempo. Eq '
Relativo a la primera categoría, el biofeedba ck puede ser binario o proporcio nal.
En el primero, los valores de la señal registrada se comparan con un umbral fijado de
antemano, de esta forma, el sujeto sabe si se encuentra por encima O por debajo del
criterio. La dimensión proporcional permite una información más precisa sobre la

actividad fisiológica que está siendo registrada, dado que la información que recibe
el sujeto es proporcional a las variaciones experimentadas en las respuestas fisiológi-
cas. Esta proporcionalidad puede ser directa, es decir, incrementos de la variable re-
gistrada se corresponden con incrementos en la respuesta facilitada al sujeto (y vice-
versa), e indirecta cuando a incrementos de la variable de entrada se corresponden
decrementos en la variable de salida (y viceversa).
En cuanto a la segunda categoría, la señal de salida puede ser discreta o continua.
En la primera, cada intervalo de la señal de salida se corresponde con un intervalo
(con más de una unidad de variación) de la señal de entrada; por ejemplo, el sujeto
recibe una señal cada cinco segundos sobre el promedio de su tasa cardíaca durante
ese intervalo. En la señal continua, el sujeto recibe información de forma permanen-
te sobre cada unidad de la señal de entrada.
Combinando ambas categorías, tenemos seis tipos de biofeedback:
a. Binario discreto, donde el promedio de un conjunto de unidades de entrada

se compara con el umbral criterio.
b. Binario continuo, donde cada unidad de la señal de entrada se compara con
el umbral criterio.
c. Proporcional directo y continuo, incrementos de la señal de entrada se co-
rresponden con incrementos directamente proporcionales en la señal de sa-
lida (y viceversa), la cual se presenta de forma continua.
d. Proporcional directo y discreto, incrementos de los promedios en la señal
de entrada se corresponden con incrementos directamente proporcionales
en la señal de salida (y viceversa), siendo por tanto de forma discreta.
e. Proporcional indirecto y continuo, incrementos de la señal de entrada se
asocian con decrementos proporcionales en la señal de salida (y viceversa),
presentando la información de forma continua.
f. Proporcional indirecto y discreto, incrementos de los promedios en la señal
de entrada se corresponden con decrementos proporcionales en la señal de
salida (y viceversa), presentándose ésta de forma discreta.
En función de la modalidad sensorial de la información facilitada al sujeto, las

modalidades más utilizadas han sido de tipo visual y auditivo. Entre los estímulos
visuales más empleados están los dígitos, el desplazamiento de una aguja sobre una
escala de intervalos, una serie de luces de diferentes colores o de un mismo color con
distintas tonalidades (en estos casos se interpreta como una escala ordinal), o la pues-
ta en marcha de un dispositivo (en el caso del biofeedback binario), etc. En la moda-
lidad auditiva, el estímulo más utilizado es la presentación de un tono, variando la
intensidad y/o la frecuencia (en el biofeedback proporcional), o la presencia o ausen-
cia de un tono (en el biofeedback binario).
Por último, según el sistema fisiológico sobre el que se interviene, el biofeedback
puede clasificarse en función de tres sistemas:
a. Biofeedback de las respuestas del sistema nervioso somático, fundamental-
mente EMG y EOG.
b. Biofeedback de las respuestas del sistema nervioso autónomo, incluyendo la

tasa cardíaca, presión sanguínea, flujo sanguíneo, actividad electrodérmica,
temperatura, pletismografía del pene y de la vagina, actividad pupilográfica
y pH estomacal.
c. Biofeedback de las respuestas del sistema nervioso central: ritmo theta (4-7
Hz), ritmo alfa (8-12 Hz), ritmo SM (13-16 Hz) y ritmo MU (9-11 Hz).
Bancroft, J. H., Jones, J. G. y Pullan, B. B. (1966). A simple transducer for measuring penile
erection with comments an its use in the treatment of sexual disorder. Behaviour Re-
search and Therapy, 4, 230-241.
Barlow, D. H., Becker, R., Leitenberg, H. y Agras, W. S. (1970). A mechanical strain gauge
for recording penile circunference change. Journal ofApplied Behavior Analysis, 3, 73-76.
Brown, C. C. (1972). Instruments in psychophysiology. En N. S. Greenfield y R. A. Stern-
bach (dirs.), Handbook of psychophysiology. Nueva York. Holt, Rinehart and Winston.
Buela-Casal, G. y Navarro, J. F. (1989). Evaluación psicofisiológica de la inteligencia. En
H. Marrero, G. Buela-Casal, L. Fernández y J. F. Navarro (dirs.), La inteligencia huma-
na: más allá de lo que miden los tests. Barcelona. Labor.
Buela-Casal, G. y Navarro, J. F. (1990). Avances en la investigación del sueño y sus trastornos.
Madrid. Siglo XXT.
Buela-Casal, G. y Sierra, J. C. (1994a). Los trastornos del sueño en la infancia y adolescencia.
Madrid. Piramide
Buela-Casal, G. y Sierra, J. C. (1994b). Ritmo circadiano de la activacion psicofisiológica. Ar-
chivos de Neurobiología, 58, 82-96.
Cáceres, J. (1990). Evaluación psicofisiológica de la sexualidad humana. Barcelona. Martínez-
Roca.
Carretié, L. e Iglesias, J. (1995). Psicofisiología. Fundamentos metodológicos. Madrid. Pirá-
mide.
Carrobles, J. A. (1987). Registros psicofisiológicos. En R. Fernández-Ballesteros y J. A. Ca-
rrobles (dirs.), Evaluación conductual. Madrid. Pirámide.
Carrobles, J. A. (1990). Biología y psicofisiología de la conducta sexual. Madrid. Fundación
Universidad-Empresa.
Carrobles, J. A. y Sanz, A. (1991). Terapia sexual. Madrid. Fundación Universidad-Empresa.
Epstein, L. H. (1976). Psychophysiological measurement in assessment. En M. Hersen y
A. S. Bellack (dirs.), Behavioral assessment: A practical handbook. Oxford. Pergamon
Press.
Freixa i Baqué, E. (1993). Nueva clasificación y nomenclatura de la actividad electrodérmica.
Psicología Conductual, 1, 157-170.
Haynes, S. N. y Wilson, C. C. (1979). Behavioral assessment. Recent advances in methods,
concepts and implications. San Francisco. Jossey-Bass. ña,
Kallman, W. M. y Feuerstein, M. (1977). Psychophysiological procedures. En A. R. Cimine-
ro, K. S. Calhoun y H. E. Adams (dirs.), Handbook of behavioral assessment. Nueva
York. Wiley.
Kamiya, J. (1962). Conditional discrimination of the EEG alpha rhythminhumans. Comuni-
cacion presentada en el Western Physiological Association. San Francisco (EE UU).
Kimmel, E. y Kimmel, H. D. (1963). A replication of operant conditioning of the GSR. Jomr-

nal of Experimental Psychology, 65, 212-213. ¿har?
Kuhn, T. S. (1962). The structure of scientific revolutions. Chicago. University of Chicago
Press.
Lang, P. J. (1968). Fear reduction and fear behavior: Problems in treating a construct. En
J. M. Shlien (dir.), Research in psychotherapy (vol. 111), Washington, D. C. APA.
Lang, P. J. (1971). The aplication of psycho-physiological methods to the study of psycho-
therapy and behavior modification. En A. E. Bergin y S. L. Garfield (dirs.), Handbook of
psychotherapy and behavior change. Nueva York. Wiley. (e COma
Lang, P. J. (1977). The psychophysiology of anxiety. En H. Akiskal (dir), Psychiatric diagno-
sis: Exploration and biological criteria. Nueva York. Spectrum. ”
Lang, P. J., Melamed, B. G. y Hart, J. (1970). A psychophysiological analysis of fear modifi-
cation using and automated desensitization procedure. Journal of Abnormal Psychology,
76, 220-234.
Martínez-Selva (1995). Psicofisiología. Madrid. Síntesis.
McGuigan, F. J. (1978). Cognitive psychophysiology: Principles of covert behavior. Englewod
Cliffs. Prentice Hall Inc.
McGuigan, F. J. (1979). Psychopysiological measurement of covert behavior: A guide for the
laboratory. Nueva York. Lawrence Erlbaum Associates.
Miller, N. E. y Carmona, A. (1967). Modification of a visceral response. Salization in a
thirthy dogs by instrumental with water reward. Journal of Comparative and Physiologi-
cal Psychology, 63, 1-6.
Miller, N. E. y Dicara, L. V. (1967). Instrumental learning of urine formations by rats: chan-
ges in renal blood flow. American Journal of Psychology, 215, 667-683.
Schwartz, G. E. (1975). Bio-feedback, self-regulation and the patterning of physiological
process. American Scientists, 63, 314-324.
Schwartz, G. E. (1977). Biofeedback and patterning of autonomic and central process. Nueva
Schwartz, G. E. (1978). Psychobiological foundations of psychotherapy and behavior chan-
ge. En S. L. Garfield y A. E. Bergin (dirs.), Handbook of psychotherapy and behavior
change. Nueva York. Wiley.
Sierra, J. C. (1996). Registro da tumescéncia genital noturna. En R. Reimao (dir.), Sono. Estu-
do abragante. Sao Paulo. Atheneu.
Simón, M. A. (1996). Evaluación de los trastornos gastrointestinales. En G. Buela-Casal,
V. E. Caballo y J. C. Sierra (dirs.), Manual de evaluación en psicología clínica y de la salud.
Madrid. Siglo XXI.
Vila, J. (1996). Una introducción a la psicofisiología clínica. Madrid. Pirámide.
Buela-Casal, G. y Navarro, J. F. (1990). Avances en la investigación del sueño y sus trastornos.

Madrid. Siglo XXI
Carretié, L. e Iglesias, J. (1995). Psicofisiología. Fundamentos metodológicos. Madrid. Pirá-
mide.
Carrobles, J. A. (1987). Registros psicofisiológicos. En R. Fernández-Ballesteros y ]. A. Ca-
Kallman, W. M. y Feuerstein, M. (1977). Psychophysiological procedures. En A. R. Cimine-
ro, K. S. Calhoun y H. E. Adams (dirs.), Handbook of behavioral assessment. Nueva
York. Wiley.
Martínez-Selva (1995). Psicofisiología. Madrid. Síntesis.
Vila, J. (1996). Una introducción a la psicofisiología clínica. Madrid. Pirámide.
19. TÉCNICAS NEUROPSICOLÓGICAS
Jordi PEÑA-CASANOVA, M. T. HERNÁNDEZ y Adolf JARNE
L INTRODUCCIÓN
Generalmente los pacientes con lesión cerebral suelen presentar alteraciones neuro-
psicológicas, siendo importante que estos aspectos sean evaluados. Actualmente,
aunque existen técnicas de neuroimagen cada vez más sofisticadas, como la Tomo-
grafía Axial Computarizada (TAC), la Resonancia Nuclear Magnética (RNM) o la
Tomografía por Emisión de Positrones (TEP), la evaluación neuropsicológica en mu-
chos casos es determinante. Por otro lado, una topografía lesional concreta delimita-
da por técnicas de neuroimagen no implica una obligada manifestación neuropsico-
lógica, mi en estructura ni en intensidad. Sin embargo, en ciertos casos el objetivo de
la exploración neuropsicológica puede ser la colaboración en la realización de un
diagnóstico topográfico (Peña-Casanova, 1991). Más aún, la evaluación neuropsico-
lógica de los cambios cognitivos y de la personalidad en ocasiones resulta ser más
sensible, por ejemplo en la detección de manifestaciones tempranas de ciertos tras-
tornos neurológicos (Incagnoli, Goldstein y Golden, 1986).
En suma, aunque los avances tecnológicos han modificado y modifican constan-
temente la evaluación de los trastornos del sistema nervioso central, la evaluación
neuropsicológica conserva su importancia en los siguientes aspectos:
a. Establecimiento del diagnóstico y del diagnóstico diferencial entre trastor-

nos neurológicos y psiquiátricos (Walsh, 1991); por ejemplo, en el estudio del sector
geriátrico de la población se requiere la evaluación neuropsicológica para diferenciar
entre las alteraciones propias del envejecimiento, demencia y depresión, particular-
mente en situaciones iniciales.
b. Puede aportar un perfil cuantitativo y cualitativo de las funciones mentales
superiores alteradas y conservadas; en un paciente, la interpretación adecuada de es-
tos resultados, además de utilizarse como apoyo diagnóstico, es indispensable para
diseñar programas de rehabilitación.
c. Estudios de seguimiento con técnicas de evaluación neuropsicológica pue-
den aportar datos acerca de la evolución natural del trastorno, del programa de reha-
bilitación que aplicamos, de los efectos de un tratamiento farmacológico y/o de la
efectividad de una intervención neuroquirúrgica como el implantar una válvula en
una hidrocefalia arreabsortiva.
d. Laevaluación del desarrollo de las funciones mentales superiores, es decir, la
neuropsicología infantil, adquiere un papel importante como apoyo a la evaluación
pediátrica.
Universidad Autónoma de Barcelona.

422 Jordi Peña-Casanova, M. T. Hernández y Adolf Jarne
e. Enel plano legal, ayuda a tomar decisiones acerca del grado de responsabili-
dad de los acusados en un delito, probar incapacidad intelectual para ejercer ciertos
derechos, etcétera.
f. Tiene un papel fundamental en la investigación y estudio científico de la or-
ganización y el funcionamiento del sistema nervioso y del comportamiento humano
(Lezak, 1987).
La evaluación neuropsicológica se desarrolló a partir del estudio de las enferme-

dades psiquiátricas y de las enfermedades cerebrales orgánicas. Esto ha implicado
una constante interacción entre diversas disciplinas como la neurología, la psiquia-
tría, la neurocirugía, la psicología, la lingisística, la neurobiología y la fisiología, fun-
damentalmente. Durante el siglo XIX se empezaron a describir sistemáticamente sín-
dromes de las disfunciones cognitivas que acompañan a una lesión cerebral
localizada. La evaluación del estado mental se centró en las funciones relacionadas
con el lenguaje y el estudio de lo que ahora conocemos como afasia, alexia, agrafia,
agnosia y apraxia. En el siglo XX, la teoría de las tres unidades o bloques funcionales
de Luria (1973) permitió establecer las bases para el análisis componencial de la acti-
vidad neuropsicológica, facilitando el diseño del esquema de las funciones que han
de ser exploradas. La introducción del concepto de sistema funcional complejo, sín-
tesis de la clásica discusión entre localizacionistas y antilocalizacionistas, permitió
comprender la complejidad de la actividad mental. Las funciones mentales superio-
res se organizan en sistemas de zonas cerebrales que trabajan de forma concertada,
ejerciendo cada una un papel específico dentro del sistema (Luria, 1973). Las altera-
ciones de uno o más componentes se manifestarán en las actividades que requieren
su participación (Peña-Casanova, 1987). Estas teorías constituyen la base de la apro-
ximación clínica o cualitativa de la evaluación neuropsicológica, uno de cuyos prin-
cipales representantes fue Luria (Incagnoli, Goldstein y Golden, 1986). La aproxi-
mación cuantitativa y estadística se desarrolló a partir de los primeros intentos por
crear pruebas que discriminaran pacientes orgánicos y funcionales (Walsh, 1991). El
paradigma de este intento ateórico lo constituye la Batería Halstead-Reitan. Actual-
mente, es posible hacer una primera evaluación que comprenda un amplio espectro
de las funciones cognitivas en relativamente poco tiempo. El reciente interés por el
estudio de los trastornos neuroconductuales ha fomentado la creación de diversas
formas de evaluar signos y síntomas orgánicos, incluyendo la integración de datos
cuantitativos y cualitativos provenientes de todas las áreas que aportan información
al estudio multidisciplinario (Strub y Black, 1985).
IL. CONCEPTO DE EVALUACIÓN NEUROPSICOLÓGICA
La evaluación neuropsicológica es un conjunto de técnicas que permiten obtener e

integrar datos tanto cualitativos como cuantitativos sobre las diversas funciones
mentales superiores del hombre. En esencia, se trata de un proceso de evaluación mí-
nimamente estructurado aunque no estandarizado del todo, cuya duración es varia-
ble según los objetivos planteados. Sus componentes principales son la historia clíni-
Técnicas neuropsicológicas
423
ca, la observación de la conducta y las pruebas neuropsicológicas. La evaluación

neuropsicológica es similar en algunos aspectos a la evaluación psicológica conven-
cional, pero con un enfoque diferente, ya que se intenta identificar deficiencias cog-
nitivas, emocionales y/o en el control que se manifiestan en la conducta del paciente
con lesión cerebral (Lezak, 1983). En algunos casos el déficit puede ser sutil y mani-
festarse Únicamente en tareas de juicio complejo o bajo condiciones emocionales es-
tresantes. En otros casos, los efectos conductuales directos del déficit son tan discre-
tos que no son observables bajo condiciones ordinarias, por ejemplo, el paciente
explica dificultades vagas, inesperadas y poco comunes. Es importante resaltar que
los efectos de la lesión cerebral rara vez inciden en una única dimensión conductual
y/o sistema funcional.
11. Objetivos y propósitos de la evaluación neuropsicológica

Se espera que la exploración neuropsicológica aporte datos sobre los siguientes as-
pectos:
a. Acerca del estado neuropsicológico del paciente y, cuando sea posible, pro-
porcionar un diagnóstico (Lezak, 1983; Peña-Casanova, 1987, 1991). Aunque es
poco probable concluir un diagnóstico topográfico únicamente a partir de la evalua-
ción neuropsicológica, ésta aporta datos valiosos. Hasta ahora se han utilizado cate-
gorías diagnósticas para concluir que el paciente presenta determinado trastorno; sin
embargo, la práctica clínica muestra que pocos pacientes coinciden exactamente con
la descripción de los cuadros clásicos. La evaluación neuropsicológica actual tiende
al estudio detallado del caso individual y su evolución.
b. Facilitar la toma de decisiones en cuanto al pronóstico, tratamiento y reha-
bilitación del paciente (Lezak, 1983; Peña-Casanova, 1987, 1991).
c. Proporcionar datos cualitativos y cuantitativos obtenidos sistemáticamente
con finalidad investigadora.
En toda evaluación neuropsicológica casi siempre existe un objetivo central y

varios objetivos periféricos (Lezak, 1983). El examinador ha de dirigir la evalua-
ción neuropsicológica adaptándola a las necesidades y capacidades del paciente
(Peña-Casanova, 1987). El examinador debe tener claro el propósito de la evalua-
ción de cada paciente. Las personas que la solicitan pueden no tenerlo del todo cla-
ro, de tal forma que el examinador siempre ha de reevaluarlo; por ejemplo, se pue-
de solicitar un examen para determinar si el paciente está capacitado para regresar a
su puesto de trabajo después de un accidente cerebrovascular. Sin embargo, el exa-
minador puede percatarse de que además podría beneficiarse con un programa de
rehabilitación. Le
Las preguntas específicas que se realizan en una exploració n de esta naturaleza
estarán determinadas principalm ente por el propósito de la evaluación y, en general,
pueden ser diagnóstica s o descriptiva s. Cuando la finalidad de la evaluación es diag-
nóstica se necesita poner a prueba diversas hipótesis comparand o cada una con la
condición actual del paciente (historia, conducta y ejecución en las pruebas aplica-
+24 Jordi Peña-Casanova, M. T. Hernández y Adolf Jarne
das). La finalidad de la evaluación es descriptiva cuando es importante detallar las

funciones neuropsicológicas conservadas y deficitarias. Las cuestiones diagnósticas
se suelen plantear en forma de diagnóstico diferencial, ayudan a discriminar entre
pacientes neurológicos y psiquiátricos o entre diversas patologías. También se utili-
zan para determinar el nivel actual de funcionamiento del paciente en combinación
con datos de su historia personal y familiar, por ejemplo, ¿alguien en la familia tiene
la misma condición?, ¿cómo, cuándo y en qué circunstancias se inició el padecimien-
to?, ¿el cuadro del paciente coincide con el de alguna enfermedad orgánica?, ¿qué
funciones están comprometidas, cuáles intactas y cómo sus déficit específicos expli-
can su condición actual? (Lezak, 1983). La exploración neuropsicológica no realiza
un diagnóstico neurológico; sin embargo, puede aportar datos y formulaciones
diagnósticas importantes que pueden pasar por alto en la exploración neurológica o
psiquiátrica (Tunks, 1976). :
Las preguntas descriptivas se utilizan para investigar las capacidades específicas
de cada paciente, para orientarle con respecto a aspectos vocacionales y educativos o
para establecer si el paciente a pesar de posibles secuelas puede desempeñar su traba-
jo anterior, si puede seguir conduciendo, etc. Aunque en estos casos el informe neu-
ropsicológico no es tan amplio, es importante describir claramente las habilidades
conservadas y las deterioradas. Las descripciones son importantes en estudios longi-
tudinales para describir el nivel de funcionamiento premórbido y hablar de deterio-
ro o mejoría. El uso de uno u otro tipo de preguntas está determinado por las necesi-
dades de cada estudio. En el transcurso de la evaluación neuropsicológica surgirán
tanto hipótesis diagnósticas como hipótesis descriptivas que deben irse confirmando
o rechazando.
1.2. Fundamentos de la evaluación neuropsicológica

Al igual que en psicología, en neuropsicología, al hablar de “déficit conductual”, se
presupone la comparación del desempeño del paciente con el desempeño o nivel de
funcionamiento “esperado”, “ideal” o “normal”. En la evaluación neuropsicológica,
para establecer los déficit se utilizan básicamente dos estándares de comparación: el
normativo o grupal y el individual o premórbido. La utilización de uno u otro se de-
cide de acuerdo a la función o actividad que se está evaluando y de acuerdo al propó-
sito u objetivo de la evaluación. En neuropsicología, la población “norma” es útil en
la evaluación de funciones que se desarrollan durante la infancia. Aunque algunas de
estas funciones parecen estar poco ligadas a la educación y/o a la habilidad intelec-
tual, como la coordinación visomotora, es importante tratar de contar con un “ gru-
po normativo” para diversos grados de escolaridad y/o habilidad intelectual. Los es-
tándares de comparación individual se refieren a la aplicación de la batería
neuropsicológica dos o más veces, y con intervalos espaciados, al mismo sujeto, per-
mitiendo contar con un parámetro de comparación firme para obtener un segul-
miento secuencial de su funcionamiento neuropsicológico y posibilitando estudiar
la evolución de su mejoría o deterioro en diversas funciones mentales superiores, así
como los efectos de programas de rehabilitación y tratamiento farmacológico (Le-
zak, 1983).
425
IL. TIPOS DE EVALUACIÓN NEUROPSICOLÓGICA
La evaluación de las funciones mentales superiores puede realizarse siguiendo diver-

sas orientaciones. Veamos estas distintas posibilidades.
"Li. Evaluacion flexible versus fija

La evaluación neuropsicológica flexible implica la selección de un conjunto de prue-
bas que se adapte a los problemas y necesidades del paciente que será evaluado
(Goodglass y Kaplan, 1979). Tanto la aproximación de Benton y cols. (1983) como
la de Lezak (1983) corresponden a este tipo de evaluación. Esta modalidad de eva-
luación tiene la ventaja de omitir la redundancia, evaluando las funciones requeridas,
además permite incorporar hallazgos de nuevas investigaciones para ponerlos a
prueba. También facilita la comparación de resultados de diversos pacientes con el
fin de obtener patrones o perfiles neuropsicológicos aplicando técnicas estadísticas
complejas. Sin embargo, la selección de pruebas depende en gran medida de la habi-
lidad y experiencia del examinador. Esto puede resultar algo difícil en el examinador
no especializado.
La evaluación neuropsicológica fija se refiere a la aplicación de una batería están-
dar en forma rutinaria a todos los pacientes evaluados. La aproximación de Halstead
y Reitan con su batería constituye el ejemplo típico. Aunque es poco probable que
una batería evalúe exhaustivamente todas las funciones mentales superiores, una
ventaja de este enfoque es que con una batería se puede evaluar el mayor número de
funciones posible. Por otro lado, tienen información redundante y como no se
adaptan al paciente, en casos muy específicos algunas funciones pueden quedar sin
evaluar, mientras otras quedan excesivamente evaluadas. El uso rígido de cualquier
instrumento mediatiza las conclusiones. Estas limitaciones pueden compensarse en
cierta medida aplicando pruebas específicas.
m2. Evaluación cualitativa y cuantitativa

La dimensión cualitativa-cuantitativa se refiere a la forma en que los datos son evalua-
dos más que a un método específico de administración. La dimensión cuantitativa
evalúa si la tarea ha sido resuelta correctamente o no y el tiempo de realización. La ca-
lificación obtenida es comparada con una calificación de referencia que pretende re-
presentar un punto de corte, es decir, la óptima separación entre grupos de personas,
con alteraciones neuropsicológicas o sin ellas, en dicha tarea. El enfoque cualitativo
evalúa cómo se resuelve el problema independientemente de que el paciente haya fa-
llado o no. Se analizan los procesos mentales que respaldan cada tipo de respuesta
para conocer a fondo qué funciones podrían estar fallando y por qué. El ejemplo clá-
sico de este enfoque son los trabajos de “cualificación del síntoma” de Luria.
La evaluación cuantitativa y cualitativa no son mutuamente excluyentes. Rusell
(1984) destaca las ventajas de integrarlas en una evaluación neuropsicológica, mien-
tras que Lezak (1983) considera que es indispensable utilizar ambas dimensiones.
Las líneas generales para la evaluación se pueden resumir según Lezak (1983) en
construir la evaluación neuropsicológica de acuerdo a las necesidades, habilidades y
limitaciones de cada paciente y no al revés, con esto se busca obtener datos realmen-
te más significativos del paciente y proponer enfoques de tratamiento que realmente
le beneficien. En suma, la evaluación neuropsicológica implica la integración de las
evaluaciones cuantitativas y cualitativas realizadas desde el primer contacto con el
paciente. Esto requiere flexibilidad y experiencia por parte del examinador (Peña-
Casanova, 1991).
IV. LA EXPLORACIÓN NEUROPSICOLÓGICA
No existen reglas rígidas en la evaluación neuropsicológica. La gran variedad de

condiciones neurológicas, capacidades del paciente y propósitos de la evaluación
exigen un enfoque flexible, abierto e imaginativo. Para realizar una adecuada eva-
luación neuropsicológica, el examinador ha de tener una amplia comprensión del
funcionamiento cerebral y sus correlatos neuroanatómicos, es decir, tener conoci-
mientos sólidos de neuropatología, neuroanatomía y neurofisiología, así como po-
seer un entrenamiento clínico o experiencia suficiente. Difícilmente se puede esta-
blecer una relación unívoca y directa entre las puntuaciones de una prueba, la
semiología y la topografía cerebral (Peña-Casanova, 1991). Un conocimiento gene-
ral de los factores que condicionan o influyen en la evaluación de las funciones
mentales superiores permite delimitar, comprender, interpretar y controlar mejor
los hallazgos exploratorios. Según Peña-Casanova (1991), las variables que influ-
yen en la evaluación neuropsicológica son las características del paciente y las ca-
racterísticas de la lesión.
v1. Características del paciente

Las variables del paciente que influyen en forma importante en los resultados de la
evaluación neuropsicológica son de diferente naturaleza y su incidencia plantea al
clínico diversos problemas (Peña-Casanova, 1991). Las variables más importantes
son las siguientes:
a. Edad. Las modificaciones morfológicas, macroscópicas, microscópicas y

bioquímicas que va sufriendo el cerebro con el paso del tiempo implican cierto gra-
do de deterioro o defecto funcional. Distintas enfermedades aparecen con mayor o
menor frecuencia a distintas edades; por ejemplo, las demencias y los accidentes ce-
rebrovasculares. La pérdida neuronal durante el proceso de envejecimiento normal
no es suficiente como para provocar una demencia, pero sí se manifiesta en diversas
pruebas neuropsicológicas. Por esta razón las manifestaciones neuropsicológicas se
han de evaluar en función de un grupo de edad equivalente o respecto al desempeño
premórbido de cada paciente.
427
b. Sexo. Algunos estudios insisten en la existencia de diferencias sexuales res-

pecto a la organización cerebral. Las mujeres parecen presentar mejores resultados
en tareas verbales (Petersen y Witting, 1979) y puntúan más bajo en tareas espaciales
(McGee, 1979). Otros estudios no encuentran diferencias significativas entre hom-
bres y mujeres en pruebas neuropsicológicas ni psicológicas como el WA7S (Wechs-
ler, 1955). Ciertas alteraciones neuropsicológicas son más frecuentes en hombres
que en mujeres, como por ejemplo los trastornos del desarrollo del lenguaje, inclu-
yendo lectura y escritura (dislexia de evolución) y disfemia. También la zurdería es
más frecuente en hombres que en mujeres (Geschwind y Galaburda, 1985).
Cc. Dominancia manual. Ciertas lesiones cerebrales producen alteraciones neu-
ropsicológicas cualitativamente diferentes en zurdos y en diestros (Kertezs, 1979).
Específicamente, para la evaluación neuropsicológica es importante considerar
siempre que la dominancia manual derecha no implica necesariamente una localiza-
ción izquierda del lenguaje. Así nos podemos encontrar con casos de “lateralidad in-
vertida”, es decir, diestros con lesiones izquierdas y sintomatología propia de lesio-
nes del hemisferio derecho. Considerar la dominancia manual es especialmente
importante en la evaluación de pacientes afásicos.
d. Escolaridad y nivel sociocultural. Es evidente que en las pruebas que eva-
lúan las funciones mentales superiores más abstractas, así como en tareas que exigen
conocimientos adquiridos en la escuela, los individuos con nivel sociocultural más
bajo están en desventaja. Tareas que implican el uso de lápiz y papel, ya sea para es-
cribir o para realizar algún dibujo, crean dificultad a las personas que no practican
estas habilidades, por ejemplo, tareas de praxis constructiva, dictado de palabras o
frases, narración escrita; en tareas de cálculo, algunas personas realizan sumas o res-
tas pero no multiplican ni dividen. Al realizar una exploración neuropsicológica es
indispensable considerar el nivel de escolarización de estos individuos y tener claro
el nivel esperado en cada caso. Toda evaluación ha de considerar esta variable, de lo
contrario la interpretación de los resultados será errónea.
e. Lengua materna. Monolingúes, bilingies y políglotas presentan clínicamen-
te diversas características neuropsicológicas que se han de observar, anotar y evaluar
adecuadamente (Peña-Casanova, 1991). Bilingúes y políglotas no son grupos homo-
éneos ya que difieren en la forma de adquisición de las lenguas (formal o informal),
modalidad (oral y/o escrita), método (oral y/o escrito), edad de adquisición, grados
de dominio de cada lengua, frecuencia de uso y especificidad organizativa de cada
lengua. Por lo tanto, en la evaluación neuropsicológica de estos pacientes se defini-
rán al máximo estas variables para cada una de las lenguas.
f. Personalidad y biografía. Si la personalidad es considerada como la organi-
zación dinámica e integradora de los procesos cognitivos, afectivos y pulsionales del
individuo, en tanto que presenten características diferenciales permanentes de éste
(carácter, temperamento, intereses, necesidades, etc.), es evidente que larespuesta del
individuo a las lesiones cerebrales depende también de sus características específicas.
Este hecho tiene una importancia capital en pacientes con lesiones frontales o con
demencia. e i
g. Condiciones especiales. El paciente puede presentar características propias
que influyen en la evaluación neuropsicológica; por ejemplo, puede no ser coopera-
dor, ser simulador, estar ansioso, presentar trastornos afectivos como la depresión o
+28 Jordi Peña-Casanova, M. T. Hernández y Adolf Jarne
manía, somatizar, tener conductas inapropiadas, psicosis. En estos casos, los datos
obtenidos en la exploración pueden resultar inválidos. Para evaluar los resultados de
estos pacientes es indispensable un evaluador flexible que utilice, como parámetro
de comparación y control, el estado premórbido del paciente y la evolución que ha
tenido (Peña-Casanova, 1991). Es relativamente frecuente que pacientes atendidos
en neuropsicología presenten limitaciones sensoriales y/o motoras; en estos casos el
acceso a las funciones mentales superiores por vía convencional está limitado. Sin
embargo, un problema sensorial y/o motor no debe predisponer alexaminador a
pasar por alto la evaluación de aquellas variables que no dependan directamente de
las modalidades afectadas (Lezak, 1983). Hay pruebas que ya están estandarizadas
para la población con determinados defectos; por ejemplo, a pacientes hipoacúsicos
se les pueden administrar pruebas escritas para evaluar funciones verbales y aritmé-
ticas, razonamiento abstracto y comprensión de relaciones espaciales. Si no existen,
el neuropsicólogo ha de crearlos.
1v2. Características de la lesión
Las manifestaciones neuropsicológicas dependen entre otras cosas de las caracterís-

ticas propias de la lesión (localización, tamaño, etiología, etc.). Las lesiones cerebra-
les pueden ser focales y/o difusas.
Iv2.1. Lesiones difusas
Este tipo de lesiones altera distintas funciones mentales superiores y en diversas in-
tensidades. Sus principales manifestaciones clínicas parecen afectar la memoria, la
atención, la concentración, las capacidades abstractas y la esfera emocional. En la
evaluación neuropsicológica se aprecia un decremento global en las funciones men-
tales superiores evaluadas. Estas alteraciones pueden ser agudas, como un estado
confusional, o crónicas, como la demencia tipo Alzheimer. Un estado confusional
agudo puede evolucionar hacia un deterioro crónico, pudiendo ser éste irreversible
(Peña-Casanova, 1987, 1991).
Iv.2.2. Lesiones focales
Estas lesiones pueden ser provocadas por tumores, accidentes cerebrovasculares,

traumatismos craneales y algunas enfermedades infecciosas, y afectan parcialmente
las actividades mentales superiores, presentando las características específicas de la to-
pografía lesional correspondiente. Es poco probable que una lesión focal afecte una
sola estructura cerebral, por lo tanto sus manifestaciones conductuales pueden ser
muy variadas. Para comprender sus efectos habrá que considerar su delimitación y
dimensión, así como si existen más lesiones, si son corticales y/o subcorticales. Las
manifestaciones propias de las lesiones focales son las afasias, las apraxias y las agno-
sias, generalmente acompañadas de signos de lateralización como defectos motores,
: 429
sensitivos O campimétricos unilaterales. Habrá una disociación entre las alteraci

ones
específicas observadas y la preservación de las demás capacidades como el
nivel de
conciencia, la capacidad de aprendizaje y la orientación (Peña-Casanova, 1987, 1991)
IV3. Etapas de la evaluación neuropsicológica

IV3.1. Contacto preliminar y planificación inicial
Se aborda al paciente mediante preguntas y tareas sencillas, no estandarizadas. Lo
más importante en esta fase es la evaluación cualitativa del mismo, mediante la cual el
examinador realiza una aproximación global al problema. El evaluador determina
provisionalmente el rango de funciones que examinará, la magnitud en que se han de
explorar las áreas psicosociales y los factores de la personalidad, el nivel de sofistica-
ción, complejidad y abstracción en el que la evaluación ha de realizarse y las limita-
ciones establecidas por las incapacidades del paciente. De aquí se derivan hipótesis a
probar y técnicas que se utilizarán en etapas posteriores (Lezak, 1983). Durante los
15 ó 20 primeros minutos se determina la capacidad del paciente para realizar las
pruebas de la evaluación neuropsicológica y se le prepara para ellas.
a. Historia clínica
La historia clínica ha de recoger especialmente el curso de la enfermedad, su inicio

(agudo o insidioso) y los síntomas, así como los rasgos de personalidad previos y las
modificaciones en los mismos.
b. Observaciones conductuales
La observación de la conducta del paciente es fundamental. Una cuidadosa observa-

ción ayuda a diferenciar entre trastornos orgánicos y/o psiquiátricos, así como al
diagnóstico de ciertos síndromes neuroconductuales, como un estado confusional
agudo, un síndrome de Balint o un síndrome frontal. Es importante comparar nues-
tras observaciones con las de la familia, de conocidos y del personal de enfermería.
Strub y Black (1985, 1988) proponen la observación de la apariencia física, el estado
emocional, la presencia de un trastorno del pensamiento, las interacciones con el
examinador y otras personas y la presencia de posibles indicadores de síndromes
conductuales específicos, como estado confusional agudo (delirium), síndrome
frontal, negligencia unilateral o una depresión funcional. La observación del estilo
de respuesta del paciente, su actitud ante la evaluación, el grado de conciencia sobre
su estado actual y las razones que motivaron el examen son aspectos que también se
han de considerar (Orsini, Van Gorp y Boone, 1988).
e. Datos neurológicos y médicos

,
Es importante contar con los resultados de la exploración neurológica del paciente
de pares cranea-
es decir, saber si presenta defectos motores, sensoriales, alteraciones
les, etc. Es imposible conocer las funciones mentales superiores sin saber si hay alte-
raciones a niveles funcionales más básicos. Datos neurológicos pueden dar sentido a
ciertos hallazgos neuropsicológicos. También son importantes los datos aportados
por las técnicas de neuroimagen como la TAC, la RNM, etc., así como los resultados
de evaluaciones psicológicas y neuropsicológicas anteriores (Orsini, Van Gorp y
Boone, 1988).
1v.3.2. Fases de la exploración neuropsicológica sistemática
La exploración sistemática se refiere a la aplicación de las pruebas o instrumentos de

evaluación neuropsicológica siguiendo una lógica de lo general a lo particular y que
se realiza en tres fases (Peña-Casanova, 1991).
a. Primera fase o fase de exploración uniforme general
Se examinan diferentes modalidades de procesos neuropsicológicos, como orienta-

ción, atención, lenguaje, praxis, gnosias, memoria, pensamiento, etc., a través de
pruebas clínicas sencillas, como por ejemplo preguntando el nombre, en dónde se
encuentra, la fecha, la hora aproximada, se le pide que cuente o que diga los meses
del año en forma directa e inversa, se le hace hablar y dibujar algún objeto, etc. Esta
primera fase corresponde al “examen del estado mental” propuesto por Strub y
Black (1985, 1988). Se trata de una evaluación cualitativa diseñada para evaluar en
general las funciones cognitivas básicas más frecuentemente afectadas por lesiones
cerebrales (Strub y Black, 1988). Aunque la idea de realizar este tipo de evaluación
tuvo su origen en las “pruebas de detección general”, no se trata de una prueba de
este tipo. Su utilidad clínica depende mucho de la habilidad y experiencia del exami-
nador. Las áreas que aborda el examen del estado mental propuesto por Strub y
Black (1985, 1988) se resumen en el cuadro 19.1.
Muchos clínicos usan el Mini-mental status examination de Folstein como prue-
ba de “detección general” y como parte del “examen del estado mental”. Es relati-
vamente útil como primera aproximación al estudio de las funciones mentales supe-
riores.
b. Segunda fase o fase de tests, baterías y sub-baterías estándar
En neuropsicología es importante contar con una metodología de exploración lo

más objetiva posible para obtener datos sobre el funcionamiento neuropsicológico
actual del paciente. Una aproximación clínica basada en síndromes neuropsicológi-
cos clásicos puede tener interés para la actividad clínica práctica y en un primer acer-
camiento al paciente, pero carece de entidad cuando se desean explicar los trastornos
de un paciente determinado en términos de hipótesis sobre la afectación del sistema
cognitivo normal. Dadas las características de los síndromes clínicos clásicos es fácil
cuestionarse en qué condiciones podemos asumir que dos pacientes presentan de-
fectos neuropsicológicos equivalentes. Este hecho es fundamental; cuando se afirma
que un paciente tiene una afasia tipo Broca no se hace más que una referencia a un
431
CUADRO 19.1. Áreas evaluadas en el examen del estado mental (Strub y Black,
1985, 1988)
con su correspondiente fuente tradicional de información
.
Áreas Fuente
. Nivel de conciencia Medicina clínica (neurología y neuroci-
rugía)
. Observaciones conductuales Psiquiatría, neurología (especialmente en

PS frontal y negligencia) y psico-
ogía
. Atención y vigilancia Psicología experimental y clínica, neurolo-
gía clínica
Lenguaje A partir del «Examen para el diagnóstico

de las afasias de Boston» (Boston diag-
nostic aphasia examination)
Memoria
5.1. Orientación Neurología clínica y psiquiatria

5.2. Nuevos aprendizajes Neurología clínica y psicología
Habilidad constructiva A partir de los modelos clínicos de neuro-

logía clínica y el enfoque estructural en
psicología
Funciones cognitivas superiores
AMAS a IcUÍo Educación y psicología

7.2. Abstracción Psicología clínica y psiquiatria
Funciones corticales superiores Neurología clínica
concepto muy amplio que no especifica el problema cognitivo concreto del paciente,
ni aporta ningún conocimiento sobre su fisiopatología. La mayoría de los síndromes
neuropsicológicos clásicos constituye categorías arbitrarias que se fundamentan más
en características anatómicas que afectan a una serie más o menos amplia de procesa-
dores neuropsicológicos que en principios fisiopatológicos funcionales cognitivos
específicos. A pesar de esta crítica, una fase de exploración clásica es necesaria por in-
tereses clínicos y por representar una primera aproximación para establecer qué acti-
vidades están preservadas y qué actividades están alteradas y fundamentar la siguien-
te fase de evaluación. En esta fase se seleccionan y aplican diversos métodos e
instrumentos para la evaluación neuropsicológica. Se cuenta con baterías neuropsi-
cológicas y/o pruebas específicas. La selección y combinación de estos instrumentos
se decide a partir del estado concreto del paciente, del objetivo de la exploración y de
las hipótesis diagnósticas planteadas en el transcurso de la exploración cualitativa
inicial y la historia clínica. En el cuadro 19.2 se presenta un resumen de las pruebas
específicas más utilizadas en la actualidad (Spreen y Strauss, 19917
CUADRO 19.2. Pruebas neuropsicológicas específicas por áreas (referencias detalladas en Le-
zak, 1983 y en Spreen y Strauss, 1991). Las fechas que aparecen en el cuadro
no se corresponden necesariamente con la primera publicación de laprueba.
Las pruebas se han clasificado de acuerdo con la finalidad u objetivo prina-
pal con que fueron creadas; sin embargo, de algunas de ellas se pueden obte-
ner otros datos ya que, por lo general, una prueba suele requerir diversas fun-
ciones básicas y superiores para su realización satisfactoria
1. ACTIVIDADES MENTALES BÁSICAS Y DE EJECUCIÓN Y CONTROL
USE Orientación
a) Temporal orientation test (Prueba de orientación temporal) (Benton y cols.,
1983).
b) Subtests de orientación en persona, espacio y tiempo del test Barcelona
c) Time estimation test (Prueba de estimación temporal de Benton).
122 Atención y/o concentración

a) Continuous performance test (Prueba de ejecución continua) (Rosvold, Mirsky
y Sarasan, 1956).
b) Retención de dígitos (Digit span) (Wechsler, 1955). Objetivo específico: eva-
luar atención verbal.
c) Prueba de los bloques de Corsi (Corsi cube test, Corsi's block-tapping board).
Objetivo específico: evaluar atención no verbal.
d) Prueba de la “A” (Strub y Black, 1985). Objetivo específico: evaluar atención
verbal inmediata.
e) Prueba de repetición o recitación seriada. Objetivo específico: evaluar aten-
ción y concentración a partir de la habilidad para el control mental.
Distribución espacial de la atención:

a) Estimulación bilateral simultánea.
b) Prueba de cancelación de estímulos no verbales de Albert (Albert, 1973).
Existe una versión modificada en el Plen-Test Barcelona (Peña-Casanova,
1990, 1991).
c) Blind folded manual exploration (Prueba de palpación con los ojos tapados).
163, Ejecución y control

a) Trail making Test “B” (Armitage test) (parte del Army individual test battery,
1944). Objetivo específico: evaluar la capacidad para resistir la interferencia
e inhibir respuestas.
b) Prueba de Stroop (Stroop test) (Stroop, 1935). Objetivo específico: resistencia
a la interferencia e inhibición de respuesta.
c) Wisconsin card sorting test (wcsT) de Berg. Objetivo específico: evaluar la for-
mación de conceptos abstractos, cambiar o mantener la regla perceptual y la
respuesta que demanda.
c) Prueba de alternancia gráfica (Luria, 1973). Incluida en el Piem-Test Barcelona
* Go-no go paradigm (Paradigma Go-no go).
A A —_A —_ _>->>» DAA EE EO el A E AAA
433
CUADRO 19.2. (Continuación.)

A _ÁAOO>_—MP—H>> AA
2. GNOSIAS
2.1. Pruebas visuales y visomotoras

a) Developmental test of visual-motor integration (vn (Beery test) (Prueba del
desarrollo de la integración visomotora). Objetivo específico: evaluar la capa-
cidad visomotora.
b) Embedded figures test (Hidden figures y Figures ground test). Prueba de figu-
ras sobrepuestas) (Spreen y Benton, 1969). Objetivo específico: evaluar la bús-
queda visual de una figura inmersa en un fondo. Tarea perceptiva compleja.
c) Facial recognition test (Prueba de reconocimiento de caras) (Benton y cols.,
1983). Objetivo específico: evaluar la habilidad para reconocer caras. Tarea
perceptiva compleja.
d) Hooper visual organization test (vor) (Prueba de organización visual de Hoo-
per) (Hooper, 1958). Objetivo específico: evaluar la capacidad para ordenar
dibujos reconociendo figuras.
e) Judgment of line orientation test (Test de evaluación de la orientación de líneas)
(Benton y cols., 1983). Objetivo específico: estudio de la capacidad de reco-
nocer, por comparación, la orientación de líneas.
f) Prueba gestáltica visomotora de Bender (Bender, 1955). Objetivo específico:
estudio de la capacidad perceptiva y constructiva de figuras.
2.2. Pruebas auditivas
a) Escucha dicótica (Broadbent, 1958; Kimura, 1961). Objetivo específico: indi-

cador de lateralización del lenguaje y medida de integridad funcional del ló-
bulo temporal y fibras callosas.
b) Sound recognition test, Acoustic recognition test o Nonverbal auditory per-
ception test (Test de reconocimiento de sonidos de Spreen y Benton). Objeti-
vo específico: evaluar el reconocimiento de sonidos ambientales familiares
(reconocimiento auditivo del objeto).
Cc) Seashore test of musical talent de Seashore.
2.3. Pruebas táctiles, táctil-visuales y táctil-motoras

a) Aesthesiometer, preassure aesthesiometer model 1 PR-/I (Estesiómetro)
(Semmes y cols., 1960). Objetivo específico: evaluación de umbrales táctiles.
b) Finger localization test (Prueba de localización digital) (Benton y cols.,
1983).Objetivo específico: evaluar la identificación, denominación y localización
digital. Estudio del síndrome de Gerstmann y de lesiones parietales inferiores.
c) Form perception testo Astereognosis test (Prueba de asterognosia) (en Ben-
ton y cols., 1983). Objetivo específico: reconocimiento táctil de la forma e
imagen mental de un objeto.
d) Tactual performance test (TPT), Form board test O Seguin-goddard formboard
(Prueba de ejecución táctil) (Halstead, 1947). Objetivo específico: evaluar el
reconocimiento táctil y memoria de formas, localización espacial, solución
psicomotriz de problemas. ANA
e) Prueba de discriminación entre dos puntos (Two-point discrimination test;
Two-point aesthesiometer). Objetivo específico: evaluar el umbral de discrimi- :
nación entre dos puntos.
434 Jordi Peña-Casanova, M. T. Hernández y Adolf Jarnc

3. ACTIVIDAD MOTORA, PRAXIAS Y CONSTRUCCIÓN
3.1. Pruebas de dominancia y destreza manual

a) Finger tapping test (FTT) o Finger oscilation test (Prueba de oscilación digital)
(Reitan, 1969). Objetivo específico: evaluar la velocidad motora del dedo índi-
ce de ambas manos.
b) Hand dinamometer o Grip strenght (Dinamómetro manual) (Reitan y Davison,
1974). Objetivo específico: evaluar la fuerza o intensidad de movimientos vo-
luntarios de ambas manos.
c) Hand performance test o Annett handness questionnaire (Prueba de prefe-
rencia manual) (Annett, 1970).
d) The Edinburgh inventory. Inventario de Edimburgo (Olfield, 1971). Objetivo
específico: evaluación de la extremidad dominante a través de un cuestio-
nario.
e) Purdue pegboard test (Tiffin, 1968). Objetivo específico: evaluar la destreza
digital y manual.
3.2. Pruebas de praxias

a) Gestos simbólicos espontáneamente y a la imitación: en Lezak (1983), en el
PIEN-Test Barcelona (Peña-Casanova, 1990, 1991). Objetivo específico: eva-
luar la apraxia ideomotora e ideatoria.
b) Uso de objetos espontáneamente y a la imitación: en Lezak (1983), en el PIEN-
Test Barcelona (Peña-Casanova, 1990, 1991). Objetivo específico: evaluar la
apraxia ideomotora.
c) Pruebas de organización dinámica del acto motor de Luria (Christensen, 1979).
3.3 Pruebas constructivas
a) Dibujo del reloj (Clock drawing) (Strub y Black, 1985). Objetivo específico:
detección clínica de trastornos visoespaciales, planificación y secuencia.
b) Porteus maze test (Prueba de laberintos de Porteus). Objetivo específico: pla-
nificación y secuencia.
c) Subprueba de cubos (WAIS, WAIS-R y WAIS-R NI). Objetivo específico: planifica-
ción y secuencia. Construcción tridimensional. Capacidad abstracta.
d) Three-dimensional block construction (3-D) o Three-dimensional constructio-
nal praxis test (Construcción tridimensional de bloques) (Benton y cols.,
1983). Objetivo específico: evaluar la habilidad visoconstructiva copiando
construcciones tridimensionales.
e) Test de copie d'une figure complexe. Rey-Osterrieth complex figure test (Test
de copia de una figura compleja) (Rey, 1941; Osterrieth, 1944).
f) Copia de un cubo, una margarita, una bicicleta y una casa: prueba clásica en
neurología (normas en Lezak, 1983).
4. MEMORIA Y APRENDIZAJE
a)
Benton visual retention test-revised (BvaT-R) (Prueba de retención visual de
Benton) (Benton, 1974). Objetivo específico: evaluar la memoria y percepción
visual y habilidades visoconstructivas.
x_——_
a e
435

x_ C— — _o _ _— _ __ _
b) Buschke selective reminding test (sar) (Prueba de recuerdo selectivo
de
Buschke) (Buschke, 1973; Buschke y Fuld, 1974). Objetivo específico: eva-
luar el aprendizaje verbal y memoria durante una tarea de ensayos múltiples
para aprender una lista de palabras.
Concentration endurance test (d2 Test) (Prueba de concentración sostenida
de Brickenkamp). Objetivo específico: evaluar la atención sostenida y habili-
dad de rastreo o búsqueda visual.
Paced auditory serial addition test (PASAT) (Prueba de adición serial auditiva)
(Gronwall, 1977). Objetivo específico: valorar velocidad de procesamiento de
la información y atención sostenida.
Rey auditory-verbal learning test (RavLT) (Prueba de aprendizaje auditivo-ver-
bal) (Lezak, 1983). Objetivo específico: evaluar el aprendizaje y memoria verbal.
Test de copie d'une figure complexe. Rey-Osterrieth complex figure test (Test
de copia de una figura compleja) (Rey, 1941; Osterrieth, 1944). Objetivo es-
pecífico: evaluar la memoria visual (y capacidad constructiva).
Rey visual design learning test (RVDLT) (Prueba de aprendizaje de diseños
visuales de Rey). Objetivo específico: evaluar el aprendizaje no verbal y me-
moria.
Sentence repetition (Prueba de repetición de frases) (Spreen y Benton, 1991).
Objetivo específico: evaluar la repetición inmediata de frases cada vez más
largas.
Wechsler memory scale-revised (wms-R) (Escala de memoria de Wechsler-re-
visada). Objetivo específico: evaluar varios aspectos de la función mnésica.
Batterie d'efficience mnésique. BEmM 144 (Batería de eficiencia mnésica. BEM
144) Signoret (1991). Objetivo específico: evaluar diversos aspectos de me-
moria verbal y no verbal, así como ciertos aspectos del aprendizaje.
Prueba de aprendizaje de un párrafo (Babcock story recall test) o cualquier
texto con 20-25 unidades. Esta prueba se halla en la WmS, wms-f y en el PIEN-
Test Barcelona.
5. LENGUAJE Y AFASIAS
a) Boston diagnostic Aphasia Examination (BDA£) de Goodglass y Kaplan. Obje-

tivo específico: evaluación de la afasia siguiendo los criterios y clasificacio-
nes clásicas.
b) Neurosensory center comprehensive examination for aphasia (NCCEA) (Spreen
y Benton, 1965). Objetivo específico: evaluación general y detallada del len-
guaje oral, lectura y escritura en el paciente afásico. a
Western aphasia battery (waB) (Kertezs, 1979). Objetivo específico: evalua-
ción de la afasia siguiendo los criterios y clasificaciones clásicas; permite ob-
tener una puntuación global de afasia. de
Aphasia diagnostic profiles (ADP) (Helm-Estabrooks, 1992). Objetivo: evalua-
ción de la afasia realizando perfiles clínicos de aproximación a las formas clí-
nicas tradicionales de afasia.
del
e) Boston naming test (BNT) (Prueba de denominación de Boston) (parte
examinati on (8DAE) de Goodglas s y Kaplan. Obje-
Boston diagnostic aphasia
tivo específico: evaluar la denominación de dibujos de objetos.
O A A AAA AA A
+36 Jordi Peña-Casanova, M. T. Hernández y Adolf Jarnc
CUADRO 19.2.
A (Continuación.)
A AS A A A LS AA
f) Porch index of communicative ability (PICA) (Porch, 1981). Objetivo: estudio
de la capacidad comunicativa oral, lectura, escritura y comprensión.
g) Communicative abilities in daily living (CADL) (Prueba de habilidades de comu-
nicación en la vida diaria) (Holland, 1980). Objetivo específico: evaluar las ha-
bilidades comunicativas cotidianas en pacientes afásicos o con trastornos de
lenguaje similares.
h) Prueba de evocación categorial (animales y palabras iniciadas con la letra
“o” o similares). Se puede usar en el contexto de la evaluación de una afasia
o en una evaluación general (incluido en el test de Boston para el diagnóstico
de la afasia y en el PlEN-Test Barcelona). Objetivo específico: evaluar la aten-
ción y concentración. También evalúa la capacidad de léxico, capacidad de
mantenimiento en una tarea y memoria a corto plazo.
i). Peabody picture vocabulary test-revised (PPvT-R) (Prueba de vocabulario re-
ceptivo de Peabody) (Dunn y Dunn, 1981). Objetivo específico: evaluar la
comprensión auditiva de nombres de animales o cosas.
j) Token test (Prueba de fichas). Objetivo específico: evaluar la comprensión de
órdenes de complejidad creciente.
k) Bilingual aphasia test (Test para la afasia en bilingúes). Objetivo específico:
estudio de la afectación diferencial de las lenguas en bilingúes y políglotas.
Disponible en más de 50 lenguas, entre ellas en castellano, catalán, vasco y
gallego.
ll) Psycholinguistic assessments of language processing in aphasia (PALPA), Eva-
luaciones psicolinguísticas del procesamiento del lenguaje en la afasia. Objeti-
vo: estudio psicolingúístico del lenguaje oral, la lectura y la escritura, siguiendo
un modelo teórico psicolingúístico contrastado.
6. FUNCIONES COGNITIVAS Y ABSTRACCIÓN
a) Prueba de categorías (Categories Test) (Halstead, 1947). Objetivo específico:

evaluar la capacidad de abstracción y capacidad para formación de concep-
tos.
b) North American adult reading test (NAART O NART-R). Objetivo específico: test
de lectura elaborado para predecir el nivel cognitivo premórbido.
c) Prueba de matrices progresivas de Raven.
d) Colored progressive matrices (CPM) (Raven, 1947). Objetivo específico: eva-
luar el razonamiento en modalidad visual.
e) Subpruebas de aritmética, comprensión, semejanzas del wa/s-A MI (Kaplan y
cols., 1991).
f) Subpruebas de cálculo, solución de problemas, comprensión-abstracción y
semejanzas-comprensión del PIen-Barcelona (Peña-Casanova, 1986).
9) Object and form sorting tasks (Tareas de selección de formas y objetos). Ob-
jeto: estudio de la capacidad de selección de objetos y formas.
h) Prueba de substracción seriada de sietes (sss). Objetivo específico: estudio
de la atención, concentración, cálculo y memoria.
1) Symbol digit modalities test (spmT). Objetivo específico: comparación entre
modalidad oral y gráfica de la prueba de claves. Modificación de la subprue-
ba de claves del Wa/s.
Dg
ADEO
lecnicas neuropsicológicas
437 vA
c. Tercera fase o fase de exploración idiográfica (cognitiva)
Después de haber aplicado una batería neuropsicológica o tests dirigidos, se deben

practicar pruebas específicas para estudiar el patrón de las capacidades cognitivas del
paciente, siguiendo un modelo funcional cognitivo. Las fases previas no representan
más que una primera aproximación a la exploración de la tercera fase, que constituye
la “verdadera exploración adaptada a la problemática del paciente”. Para este objeti-
vo no existen normas.
Tal como reconocía Luria en el terreno de la neurolingúística, el objetivo de la
evaluación es distinguir los componentes básicos del proceso de la conducta lingúís-
tica, hallar los factores básicos necesarios para su realización y estudiar el papel que
Juegan las distintas partes del cerebro en proporcionar estos factores. Esta concep-
tualización es coincidente con las aproximaciones de la neuropsicología cognitiva
actual (véase Ellis y Young, 1992). Se trata de realizar una caracterización formal de
las operaciones alteradas que están en la base de la clínica observada. Por tanto, el
objeto no debe ser clasificar a los pacientes con criterios sindrómicos clásicos. La
clave está en considerar que en la exploración neuropsicológica existe una variable
desconocida (la lesión funcional) que debe ser inferida a partir de los datos de la ex-
ploración (Caramazza y McCloskey, 1991). Una exploración metodológicamente
cerrada y en función de definir síndromes neuropsicológicos clásicos tiene un míni-
mo interés cognitivo (Peña-Casanova, en prensa a).
d. Actividades mentales superiores a evaluar en una exploración sistemática
a. Orientación. Se evalúa en tres esferas (persona, lugar y tiempo) con preguntas

sencillas y/o con pruebas específicas. La orientación temporal se altera con mayor
facilidad que las otras dos.
b. Atención y concentración. Se evalúa utilizando series de cifras, palabras o
frases y/o con pruebas específicas. La concentración se refiere a la capacidad para di-
rigir y mantener la atención durante un lapso de tiempo determinado.
c. Funciones de ejecución y control. La presencia o ausencia del comporta-
miento autorregulador y autocorrector se tiene en cuenta constantemente durante
todo el proceso de la evaluación; para ello también hay pruebas específicas.
d. Gnosias. Se han de evaluar las modalidades perceptivas principales (visual,
auditiva y táctil) después de haber descartado cualquier defecto sensorial primario,
como defectos campimétricos, audiométricos, etc., solicitando los exámenes corres-
pondientes (Lezak, 1983, 1987).
e. —Praxias. Las praxias se refieren a la dificultad para realizar secuencias de mo-
vimientos previamente aprendidas, como gestos O acciones finas. Una apraxia de
construcción se refiere a la incapacidad para diseñar espontáneamente o copiar un
modelo (dibujo o diseño con cubos). No se debe a una deficiencia motora fina, sino
a dificultades visoespaciales de percepción u organización, o a una dificultad para
1983,
transformar un concepto visoespacial en una producción concreta (Lezak,
1987). Observar no sólo si lo hace bien o mal, sino cómo lo hace, permite estudiar el
problema específico del paciente.
f. Memoria y aprendizaje. Se ha de evaluar la memoria inmediata, a cortoy a

largo plazo, así como el recuerdo de la información, seguido de una interferencia O
de un intervalo de tiempo (aprendizaje). Se ha de examinar la memoria verbal y la
memoria no verbal.
g. Lenguaje. Se ha de evaluar en todos sus aspectos (véase Arasanz y Dueñas,
1987; Peña-Casanova, en prensa h): expresión oral (espontánea, repetición), compren-
sión (de materiales de distinta complejidad), denominación, evocación categorial (nom-
bres de animales o de palabras iniciadas por una letra determinada, durante un tiempo
dado), escritura (espontánea, dictado, copia), lectura (producción y comprensión).
h. Funciones abstractas. Se ha de evaluar la capacidad de razonamiento, por
ejemplo, a través de las habilidades de cálculo y solución de problemas, así como la
capacidad de abstracción (formación de conceptos), por ejemplo, a través de pruebas
de comprensión-abstracción y semejanzas-abstracción, como las de las escalas de
Wechsler y las del Programa Integrado de Exploración Neuropsicológica-Test Bar-
celona (Peña-Casanova, 1986).
1. — Informe final. La valoración de estas áreas finalmente sirve como guía para
la elaboración del informe final, adquiriendo las características propias de cada caso
particular. El informe final ha de especificar claramente tanto aspectos afectados
como los preservados relevantes del funcionamiento neuropsicológico del paciente,
así como las pruebas con que dichas funciones fueron evaluadas (Walsh, 1991). Orsi-
ni, Van Gorp y Boone (1988) sugieren que el informe neuropsicológico deba incluir
información sobre los siguientes aspectos:
—*Ficha de identificación: nombre, fecha de nacimiento, fecha de la evaluación,
edad, escolaridad, sexo, número de historia, etcétera.
—Motivo de consulta y fuente de referencia.
—Estado actual: síntomas conductuales, cognitivos y/o neurológicos que pre-
senta el paciente.
—Antecedentes relevantes.
—Observaciones conductuales durante la evaluación.
—Pruebas aplicadas.
—Resultados e interpretación de las pruebas aplicadas por sistema funcional, es
decir, de las áreas más relevantes antes mencionadas (inteligencia, memoria, etc.).
—Resumen, impresiones, conclusiones y recomendaciones.
V. BATERÍAS NEUROPSICOLÓGICAS
Una batería neuropsicológica está formada por un conjunto de pruebas publicadas,

informales y/o procedimientos experimentales a partir de los cuales se pueden obte-
ner datos cuantitativos y cualitativos de cada paciente. La selección de pruebas que la
constituyen dependerá principalmente del paciente y del objetivo de la exploración
(Walsh, 1991). Aportan una sistematización a la evaluación neuropsicológica; algunas
tienen un fundamento teórico sólido mientras otras lo tienen en menor grado (Walsh,
1991). Aunque una batería puede guiar la evaluación neuropsicológica de examinado-
res novatos, su abuso conduce a serios errores (Peña-Casanova, 1987). Para Lezak
439
(1983) los objetivos principales de una batería neuropsicológica deben ser su capaci-
dad diagnóstica (predicción) y su capacidad para facilitar la comprensión de las altera-
ciones orgánicas. Asimismo, debe ser idónea (adecuarse a las necesidades del pacien-
te), factible (práctica, sencilla y posible de aplicar) y útil (para el paciente y para el
explorador). No existe “la batería ideal” que abarque y evalúe sin error todas las fun-
ciones mentales superiores, de manera que la creatividad y la experiencia del examina-
dor entran constantemente en juego al rediseñarla en cada caso. Las baterías neuro-
psicológicas pueden ser de tres tipos (véase Tarter y Edwards, 1986).
v.1. Baterías generales

Formadas por diversas subpruebas que en conjunto buscan evaluar diversas funcio-
nes mentales superiores y aportan un perfil del funcionamiento neuropsicológico
general del paciente. La diferenciación fundamental entre las baterías está en el mo-
delo funcional en que están basadas desde baterías ateóricas como la de Halstead-
Rertan hasta baterías con una gran base teórica como la de Luria. Las baterías gene-
rales más comúnmente utilizadas se exponen a continuación.
v.1.1. Batería neuropsicológica de Halstead-Reitan

Fue desarrollada por Halstead y modificada y ampliada por Reitan (véase Peña-
Casanova, 1991). Está constituida por las siguentes pruebas:
a. Batería Halstead: categorías (categories test), estimulación luminosa e inter-

mitente (critical flicker fusion test), ejecuciones táctiles (tactual performance
test), ritmo (rhythm test), reconocimiento de sílabas (speech sounds percep-
tion test), golpeteo digital (finger oscilation test o finger tapping test) y apre-
ciación del tiempo (time sense test).
b. Escala de inteligencia de Wechsler (WA75) (Wechsler, 1955).
c. Prueba de detección de afasia (modificación del Aphasia screening test de
Halstead y Wepman, 1959).
d. Inventario multifásico de la personalidad (MMP1) (Minnesota Multiphasic
Personality Inventory) de Hathaway y McKinley, 1951).
e. Prueba de Reitan-Klove (Reztan-Klove Test).
f£. Exploración de la dominancia lateral,
Se administra en siete u ocho horas, siendo una de las baterías más utilizadas en
Estados Unidos, tanto en investigación como en práctica clínica. Fue creada con la
idea de discriminar entre organicidad y no organicidad. Ha sido criticada básica-
mente porque sus estándares de medida son cuantitativos y estrictos, incluso para la
población americana, por lo tanto puede resultar poco adecuada para Otro tipo de
poblaciones, sobre todo aquéllas con desventajas educativas y socioculturales. Di-
versos investigadores han añadido o suprimido y modificado sus pruebas y su forma
de puntuación (Matthews, 1981). Algunas pruebas pueden ser útiles en forma aisla-
da, y sobre todo si el experimentador es capaz de interpretar los resultados cualitati-

vamente. La prueba de trazado (tral making test), ejecuciones táctiles (tactual per-
formance test) y la de golpeteo digital (tapping test) son sensibles para detectar alte-
raciones neuropsicológicas finas. El índice de deterioro de esta batería presenta el
problema general de las puntuaciones globales en neuropsicología; cuando se suman
o se promedian los resultados de las subpruebas se pierde información sobre los as-
pectos clínicos explorados. También se corre el riesgo de mezclar puntuaciones re-
presentativas de diferentes aspectos de una función y/o funciones totalmente distin-
tas, desvirtuando los resultados.
v.12. Escala de inteligencia de Wechsler (WA75S) (Wechsler, 1955)

y su versión neuropsicológica
A pesar de ser una prueba ampliamente utilizada en neuropsicología, no fue origi-
nalmente diseñada para evaluar alteraciones neuropsicológicas en pacientes con dis-
funciones conocidas o sospechadas (Lezak, 1987). Se utiliza con frecuencia como
parte de la exploración de las funciones mentales superiores, básicamente porque
está estandarizada y normalizada para diversas poblaciones. El uso de cocientes glo-
bales tiene poca utilidad en neuropsicología, pero aporta datos importantes si se ana-
lizan las subpruebas por separado y si se tienen en cuenta los aspectos semiológicos
cualitativos, es decir, cómo el paciente realizó las tareas. Kaplan y cols. (1991) propo-
nen el WA7S-R como un instrumento neuropsicológico (WA7S-R NI); no es más que el
WAJS-R con variaciones en su administración, calificación e interpretación. Las prin-
cipales modificaciones son la aplicación de todas las preguntas de cada subprueba
independientemente del número de respuestas erróneas, supresión o inclusión del
registro del tiempo, agregar versiones de opción múltiple o aplicación por computa-
dora para algunas subpruebas, etc. y, sobre todo, la sugerencia de una evaluación
cualitativa del rendimiento del paciente. Se adecua más a las necesidades del neuro-
psicólogo, ya que permite desarrollar programas de tratamiento individualizado, se-
guir los cambios en la evolución del funcionamiento cognitivo del paciente y, en al-
gunos casos, hacer inferencias sobre la naturaleza y las funciones del sistema
nervioso afectadas en la patología.
v.13. La metodología neuropsicológica de Luria

La metodología básicamente cualitativa de Luria fue expuesta por él mismo en su li-
bro La afasia traumática (1970). Posteriormente, se realizaron varios intentos por
sistematizarla, como el de Christensen (1979), quién incluye las siguientes secciones:
Funciones motoras
Organización acústico-motora
Funciones cutáneas y cinestésicas superiores
Funciones visuales superiores
Lenguaje receptivo
SS Lenguaje expresivo
SS
441
Escritura y lectura
Habilidades aritméticas
Procesos mnésicos
nm Procesos intelectivos
=>
5508
Esta versión ha sido especialmente criticada por omitir pruebas de atención, con-
centración, seguimiento mental y evocación de la información, y evalúa pobremente la
memoria no verbal y la formación de conceptos no verbales (Lezak, 1983); asimismo,
algunas pruebas son lo suficientemente difíciles como para captar alteraciones sutiles.
A pesar de ello, fue una de las primeras baterías que hizo ver la necesidad de la integra-
ción de aspectos cuantitativos y cualitativos en una evaluación neuropsicológica.
La Batería Luria-Nebraska (Golden y cols., 1980) constituye un segundo inten-
to de sistematización. Incluye una selección de preguntas y materiales ya descritos
por Christensen (1979). Presenta once apartados, los mismos diez de Christensen
pero separando escritura de lectura. El aspecto más criticado de esta batería es la
confusión entre funciones y sistemas funcionales ya que suma en una misma escala
resultados de pruebas que implican distintos estratos funcionales. Su organización
práctica no sigue las conceptualizaciones de Luria.
v.1.4. Programa integrado de exploración neuropsicológica-Test Barcelona

Lo compone una selección de pruebas organizadas de manera que permiten realizar
una exploración neuropsicológica sistematizada (Peña-Casanova, 1991). Su objetivo
es la exploración de las funciones mentales superiores que permita avanzar en el co-
nocimiento clínico de los pacientes neuropsicológicos. Para lograrlo, introduce una
sistematización metodológica. Tiene en cuenta los principios de idoneidad, factibili-
dad y utilidad necesarios para el mejor funcionamiento de una batería (Lezak, 1983).
Considera la complejidad de las funciones mentales superiores y evita una aprox1-
mación global. Busca no exceder el tiempo “razonable” para realizar una explora-
ción completa. Integra aportaciones de otros investigadores. Considera grupos con-
trol adecuados, teniendo en cuenta variables como la escolaridad y la edad. También
estima el factor tiempo en el análisis de las respuestas. Cuenta con criterios y estu-
dios básicos de fiabilidad y validez. Su aplicación dura entre dos y tres horas. Las
pruebas o tareas en que consiste evalúan las siguientes áreas:
a. Orientación
b. Atención y concentración
c. Lenguaje (oral, escritura y lectura)
d. Praxias
e. Gnosias
f. Memoria
g. Abstracción
h. Cálculo y solución de problemas
En el cuadro 19.3 se exponen las subpruebas que incluye.

CUADRO 19.3. Subpruebas del Programa integrado de exploración neuropsicológica-Test

Barcelona (Peña-Casanova, 1990, 1991)
BE
HF
SUBPRUEBA CARACTERÍSTICAS
A e 5 5 5 5 5
1. Lenguaje espontáneo En un primer contacto con el paciente

evalúa la capacidad verbal, conversación
y narrativa, conocimiento (gnosis) de su
enfermedad y capacidad de colaboración.
Permite enfocar la exploración.
2. Fluencia y contenido Evalúa la capacidad comunicativa a partir

del apartado anterior. Integra y adapta las
escalas de fluencia y contenido informati-
vo de la Western aphasia battery (wAB) de
Kertezs (1979).
3. Prosodia Se evalúa ritmo y melodía. Indica altera-

ciones expresivas independientes de la
capacidad gramatical o contenidos.
4. Orientación Aporta una prueba original. Es de especial

importancia: sus elementos se incluyen en
el Minimental, en la prueba de atención,
concentración y memoria de Blessed y en
la prueba de orientación temporal de Ben-
ton y cols. (1983). Evalúa persona, espa-
cio y tiempo.
5. Dígitos directos e invertidos Índice de atención y concentración. Se

puntúan por separado directos e inversos
por tener estructuras neuropsicológicas
distintas.
6. Lenguaje automático, control mental Evalúa la capacidad de expresar e invertir

series automáticas. Aporta un índice de la
capacidad de lenguaje fluido y control
mental en general. Interesa evidenciar su
disociación.
7. Praxis orofonatoria Evalúa posibles afectaciones del lenguaje

motor, como disartrias generalmente en
pacientes con afasias tipo Broca. Se inclu-
ye la imitación como alternativa a proble-
mas de comprensión de órdenes.
8. Repetición verbal Se solicita la repetición de letras, sílabas,

pares de sílabas, logatomos (seudopala-
bras), palabras y frases. Permite analizar
detalladamente problemas de lenguaje y
EA
diferenciar
E Ad
tipos de
II
disecofemias.
AAA
Técnicas neuropsicológicas 443
CUADRO 19.3. (Continuación)
PP
e o II tc al TOBIA st Plieecat0
_ _ ____ A A A SR ER
9. Repetición de errores semánticos Evalúa la conducta ante los errores se-

mánticos de las frases presentadas.
10. Denominación visoverbal Incluye denominación de imágenes, obje-
tos y partes del cuerpo. Evalúa el sistema
funcional de la denominación y permite
orientar los distintos tipos de anomias.
¡EE Denominación verboverbal Incluye tareas de respuesta denominando
y completamiento denominando. Útiles
para pacientes con defectos visuales que
no puedan resolver las tareas anteriores.
12. Evocación categorial Útil para obtener datos en el caso de le-

siones frontales y en etapas iniciales de
demencia. Incluye decir nombres de ani-
males (1 min.) y palabras que empiecen
con 'p' (3 mins.).
13. Comprensión verbal Aspecto básico a evaluar en toda explora-

ción neuropsicológica. Las subpruebas
que lo forman son una modificación de la
prueba de Boston para el diagnóstico de
las afasias.
14. Lectura-verbalización Consta de cinco subpruebas para leer y

verbalizar letras, números, logatomos, pa-
labras, frases y un texto. Permite enfocar
los principales tipos de alexias.
lo; Comprensión lectora Subpruebas para obtener una muestra de

los procesos de discriminación y extrac-
ción semántica en la lectura.
16. Mecánica de la escritura Evalúa la capacidad de ejecución gráfica:

automatismos de la escritura, realización
de letras y su organización en palabras y
frases.
17. Dictado Permite conocer el estado funcional de la

transcodificación acusticográfica. Las sub-
pruebas específicas (letras, números, loga-
tomos, palabras y frases) son útiles para
establecer diferenciaciones semiológicas.
18. Escritura espontánea Evalúa la denominación escrita, escritura

narrativa. Permite estudiar la capacidad
de extracción lexical a partir de imágenes.
KK AAA
A E A A A e E RA
19. Gesto simbólico Estudia la capacidad de evocación y
realización de actos de la comunicación.
Se diferencia entre derecha e izquierda
para detectar alteraciones lateralizadas y
entre orden e imitación para detectar en-
tre nivel simbólico y nivel de ejecución,
así como defectos en la comprensión
verbal.
20. Mímica de uso de objetos Comparte las características de la sub-

prueba anterior, pero se exige la abstrac-
ción del objeto a partir de su “representa-
ción mental”.
21. Uso secuencial de objetos Evalúa la praxis ideatoria, es decir, la ca-

pacidad para seguir una secuencia lógica
de los componentes gestuales para alcan-
zar un objetivo.
22. Imitación de posturas Evalúa la capacidad de ejecución motora

sin objetivo específico. En esta prueba se
considera como una actividad indepen-
diente de la praxis ideomotora. Prueba
equivalente a los logatomos del lenguaje
oral.
23. Secuencias de posturas Evalúa la capacidad de pasar de una po-

sición a otra, es decir, la capacidad diná-
mica y de seriación de los síntomas moto-
res sin objetivo específico.
24. Praxis constructiva Estudia aspectos graficomotores (dibujo a

la copia y a la orden verbal) y manipulati-
vos (diseños con cubos).
25. Atención visográfica Es una tarea de tachado de figuras inspi-

rada en la Prueba de Albert (Albert, 1973)
para detectar y analizar casos de negli-
gencia espacial lateralizada o no.
26. Orientación topográfica Se requiere de cierto nivel de conocimien-

to geográfico-cultural (Benton, Levin y Van
Allen, 1974). Es útil en lesiones parietales
en las que se puede alterar la capacidad
de reconocimiento y manipulación de las
coordenadas visoespaciales y la repre-
sentación geográfica.
(A EEE mz
445
TU --_- —__—————_
27. Imágenes superpuestas Evalúa la capacidad para discriminar imá-

genes superpuestas con una prueba tipo
Poppelreuter (Poppelreuter, 1917).
28. Apareamiento de caras Para detectar dificultades de identificación

y apareamiento de caras.
29. Colores Explora las alteraciones clínicas en la dis-

criminación y el reconocimiento de colores
a través de cinco subpruebas: elección
del color específico, apareamiento de co-
lores, denominación, comprensión verbal
(señalando el color) y respuesta denomi-
nando. Se estudian las funciones visuales
y sus conexiones verbales.
30. Analizador táctil Aporta datos sobre la función parietal eva-

luando grafestesia, morfognosia y estereog-
nosia.
31. Reconocimiento digital Se utiliza el método de reconocimiento di-

gital de Benton (Benton y cols., 1983).
Aporta datos sobre el lóbulo parietal infe-
rior.
32. Orientación derecha-izquierda Es una modificación de la prueba de

orientación derecha-izquierda de Benton
(Benton y cols., 1983) para evaluar com-
ponentes anatómicos del cuerpo (soma-
tognosia) y la identificación lateral reque-
rida.
33. Gnosis auditiva Es una prueba no verbal del analizador

auditivo para detectar agnosia auditiva
que normalmente está asociada a una sor-
dera verbal. Prueba muy simple.
34. Memoria verbal de textos Se explora mediante el recuerdo espon-

táneo y por preguntas de dos textos. Se
repite la misma tarea para explorar me-
moria de textos inmediata y diferida. Es
similar a la subprueba de memoria lógica
de la “Escala de Memoria de Wechsler”,
pero se puntúa sumando por separado el
recuerdo espontáneo y por preguntas
tanto inmediato como diferido de ambos
textos.
A P——————2—2—0—0—— gq 2 >

e 55 5 5 PPP _—_————————
EAS
ir A A
35. Aprendizaje seriado de palabras Prueba utilizada inicialmente por Luria.
Permite estudiar el proceso de memoriza-
ción, las estrategias que utiliza, la curva
de aprendizaje y la actitud ante posibles
errores.
36. Memoria visual Evalúa la capacidad de registro de mate-

rial no verbal a través de tareas de elec-
ción inmediata y de memoria visual de re-
producción inspiradas en las figuras de la
Prueba de retención visual de Benton
(Benton, 1974) y en algunas preguntas
usadas por Strub y Black (1977, 1985)
respectivamente.
37. Cálculo Aporta datos sobre el cálculo indepen-

dientemente del razonamiento implicado
en los problemas aritméticos.
38. Problemas aritméticos Prueba compleja que implica diversas ca-

pacidades: desde la atención y la memo-
ria hasta el razonamiento verbal. Se si-
guen los esquemas del wa/s y de Luria
(Christensen, 1979).
39. Información Aporta un índice del grado de escolari-

dad, del nivel premórbido hipotético y de
la memoria remota. Esta subprueba es
una adaptación de la subprueba de infor-
mación del Wwa/s.
40. Abstracción verbal Constituido por dos tareas: semejanzas-

abstracción y comprensión-abstracción
(proverbios). Es una modificación de la
subprueba de semejanzas del was. Útil en
la detección de lesiones hemisféricas ¡z-
quierdas.
41. Clave de números Modificación de la subprueba del wa/s. En

caso de lesión cerebral es uno de los sub-
tests más afectados.
42. Cubos Explora el razonamiento no verbal y la or-

ganización visoespacial. Es parte de la
sistematización de Strub y Black (1985) y
del wa/s.
A _OKEAA>AI>- A AIN ¿AAA A
Su normalización fue realizada con una muestra de 129 pacientes no neurológi-

cos. A partir del análisis de esta muestra se diseñó una hoja de registro final de datos
o perfil sumario de las subpruebas, donde se registran las puntuaciones obtenidas
por el paciente, obteniendo así su perfil neuropsicológico, es decir, la representación
grática de los resultados de la prueba. Así se han definido cinco perfiles de normali-
zación, diferenciando edad y escolaridad. Un perfil presenta el listado de las sub-
pruebas separadas por áreas funcionales; tiene una zona de puntuaciones normales y
otra de puntuaciones anormales, todas distribuidas en percentiles. Una de sus apor-
taciones principales consiste en su sistema de calificación. Además de contar con una
puntuación independiente para cada una de las subpruebas, se obtienen pares de
puntuaciones cuantitativas: directas (lo resolvió o no) y por tiempo (en cuánto tiem-
po realizó cada respuesta). En patologías como la demencia-sida, el fenómeno de la
lentificación cognitiva es claramente delimitado por este método. Este programa
cuenta con estudios de validez de contenido y confiabilidad, así como con una ver-
sión reducida, cuyos detalles están en estudio.
El PIEN-Barcelona puede utilizarse en forma distinta dentro de la exploración
neuropsicológica, por ejemplo como «prueba de detección general» (screening test)
en una primera fase de exploración o como prueba categorial para evaluar lenguaje.
No es un instrumento para discriminar entre “lesionados” y “no lesionados” cere-
brales, sino para realizar una exploración más detallada del comportamiento del pa-
ciente en diversas tareas que implican diversas funciones mentales superiores. Con-
tribuye al conocimiento de cada paciente y permite el diseño de programas de
rehabilitación individuales. Las figuras 19.1 y 19.2 presentan la organización de la
prueba con el objetivo de destacar disociaciones clínicas y diferenciaciones semioló-
gicas fundamentales para proseguir estudios ulteriores.
v2. Baterías modal-uniformes (intramodales)
Estas baterías se utilizan para evaluar una modalidad determinada de los procesos
neuropsicológicos (procesos visuales, auditivos, psicomotores, etc.).
va. Tests y baterías categorial-uniformes (intercategoriales)

Se emplean para evaluar determinadas categorías de procesos (memoria, percepción,
lenguaje, etc.). Asimismo, se pueden diseñar para evaluar procesos patológicos espe-
cíficos, tales como demencias, hidrocefalias, síndrome frontal, etcétera. Ss
Los dos últimos tipos de baterías sirven para evaluar aspectos específicosdelas
funciones mentales superiores y han de elegirse de acuerdoacada caso en particular;
por ejemplo, si el paciente presenta un problema en lenguaje escrito, se aplicaría una
batería específica para evaluar escritura; sin embargo, antes de llegar a este punto se
deben haber aplicado baterías neuropsicológicas generales.
FIGURA 19.1. Perfil clínico de afasia nominal de tipo semántico (paciente OMR). Destaca
una pobreza discreta en fluencia y contenido informativo del lenguaje, con un
ritmo y melodía normales. Existe una lentificación discreta en la realización
e series inversas. Los fallos son patentes en la denominación y en la com-
prensión
40 50 60 70 80 9 95
SUBTEST MÁXIMO
CONVERSACIÓN-NARRACIÓN .....
NARRACIÓN TEMÁTICA ............
a
FLUENCIA Y GRAMÁTICA .............
CONTENIDO INFORMATIVO .........
ORIENTACIÓN PERSONA............
ORIENTACIÓN ESPACIO..............
ORIENTACIÓN TIEMPO. .............
DÍGITOS DIRECTOS...
DÍGITOS INVERSOS...................
SERIES ORDEN DIRECTO .............
SERIES ORDEN DIRECTO T.
A
ANL
SERIES:INVERSAS 5. otura:
SERIES INVERSAS T. ............
IA
E [0.2] Eo)
REPET. PARES SÍLABAS................

RERETLOCA TOMOS de cacas
REPET. PALAB. PARES MÍN. ......... 7
REPET. [PALABRAS rositatas
REPET. FRASES hy 60 [53
DENOMINACIÓN IMÁGENES ........

DENOM. IMÁGENES T. .........
DENOM. OBJETOS ....................
DENOM. OBJETOS T. ............
DENOM. PARTES CUERPO ..........
DENOM. PARTES CUERPO T. Nire
s|
de
RESPUESTA DENOMINANDO
RESP. DENOMINANDO 7. ......
COMPLETAMIENTO DENOM. .......
COMPLET. DENOMINANDO T. —É
paña
¿E
+oO0mn
o»)
Ho.
[coo
000
EVOC. CATEGORIAL ANIM. 1m. . ASA ete 23 25 28 30 31

EVOC. CATEG. «P» 3m. ............... 12 18:28:24 229 nm
¡S7)
0¡SM)
CO! 35 36. 37 88 40 45 46 SU
COMP. PALABRAS (SEÑALAR)
COMP. PALABRAS T. 36
COMP. PARTES CUERPO. ............
COMP. PARTES CUERPO T. .
COMP. REALIZACIÓN ÓRDENES.
MATERIAL VERBAL COMPLEJO...
MAT. VERB. COMPLEJO T. .. NS) aan
mno =>
0)
y
Y019]
0
O
Y
¡ERE
FIGURA 19.2. Perfil clínico de una anomia pura en el contexto de una buena comprensión
(paciente MAA). Secuela de un accidente vascular cerebral por malformación
arteriovenosa. La expresión presenta una anomia discreta-moderada. Obsér-
vese la normalidad de la repetición
40 50 60 70 80 9 95
SUBTEST MÁXIMO
CONVERSACIÓN-NARRACIÓN..... | 0.24 5
NARRACIÓN TEMÁTICA ............. OEI ME
DESCRIPCIÓN. cocotero E
SOS
00
O
ORIENTACIÓN PERSONA...
ORIENTACIÓN ESPACIO............
ORIENTACIÓN TIEMPO ................ 10]
pa
|
DÍGITOS DIRECTOS...................
DÍGITOS INVERSOS................... 00
Y [o.Kco)
SERIES ORDEN DIRECTO .............

SERIES ORDEN DIRECTO 7.
SERIESINVERSAS.... no cesnes
SERIES INVERSAS T. ............
PRAXIS OROFONATORIA................
REPETICIÓN SÍLABAS ...............
REPET. PARES SÍLABAS...
REPET. LOGATOMOS a... ccoo.
REPET. PALAB. PARES MÍN, .......
REPET. PALABRAS ccociciiiio
REPET FRASES lomos. sario
REPET. ERROR SEMÁNTICO.........
DENOMINACIÓN IMÁGENES ........
DENOM. IMÁGENES T. .........
DENOM. OBJETOS ..........ccoooo.
DENOM. OBJETOS T..............
DENOM. PARTES CUERPO ..........
DENOM. PARTES CUERPO T.
RESPUESTA DENOMINANDO .......
IO
E
RESP. DENOMINANDO T. ......
COMPLETAMIENTO DENOM. .......
COMPLET. DENOMINANDO T. Mo»)
[ooo
00000
EVOC. CATEGORIAL ANIM. 1m. . e) 23 25 28-30 31>

EVOG. .CATEGI«P ASMA aan oo MN
[SAS
MN
UN
ON
>— =x
L
[e.) No](90) SOLO 3/88 40 45 46>
COMP. PALABRAS (SEÑALAR)...

COMP. PALABRAS T. ........... A
COMP. PARTES CUERPO..........

COMP. PARTES CUERPO 7. . ewm =ky
COMP. REALIZACIÓN ÓRDENES.

MATERIAL VERBAL COMPLEJO .. [o.)]
MAT. VERB. COMPLEJO T. . . 0NN

1.
UN
0
O
0
[9] 4
no) Nkl[e]
[97]
VL EVALUACIÓN NEUROPSICOLÓGICA INTEGRADA
La complejidad de la exploración, del diagnóstico, del pronóstico, del tratamiento y

de la rehabilitación de las funciones mentales superiores requiere un enfoque inte-
gral, es decir, la integración de datos cuantitativos y cualitativos relevantes del pa-
ciente obtenidos a partir de su historia clínica, las observaciones realizadas durante
toda la evaluación y los resultados de las pruebas, así como la consideración de estos
resultados en el estudio interdisciplinario. La evaluación neuropsicológica no se
puede reducir exclusivamente a la aplicación de pruebas formales, ni a la cualifica-
ción de los síntomas sin seguir un estudio sistemático. La flexibilidad, creatividad y
la experiencia del examinador son características importantes para lograr una evalua-
ción neuropsicológica adecuada.
Aunque la evaluación neuropsicológica se organiza de tal forma que intenta in-
cluir todas las pruebas necesarias para obtener el máximo de datos, el examinador ha
de tener siempre en mente que la organización cerebral es mucho más compleja que
lo que pueda obtener en cualquier evaluación. Una prueba refleja única y exclusiva-
mente una pequeña muestra del funcionamiento del paciente, su ejecución en el mo-
mento de la aplicación. La ejecución de toda persona puede fluctuar en el tiempo.
Por éstas, y muchas razones más, no se puede generalizar el desempeño de una sola
evaluación.
La tendencia actual de la evaluación neuropsicológica apunta claramente hacia el
estudio detallado de casos individuales más que al uso obligado de etiquetas nosoló-
gicas clásicas. Para cada paciente se busca la comprensión de patrones de ejecución
en la evaluación neuropsicológica, en función de la etiología, datos demográficos,
habilidades y variables de tratamiento. En este contexto es necesario que el neuro-
psicólogo aplique técnicas metodológicas y estadísticas más poderosas que permitan
el control de múltiples variables a la vez; la informática brinda un excelente apoyo
para lograr este objetivo (Incagnoli, Goldstein y Golden, 1986; Rourke y cols.,
1991). La evaluación neuropsicológica cada vez es más sofisticada, las pruebas incor-
poran técnicas estadísticas complejas y nuevos conceptos de teoría de la medida a sus
formas de calificación. Sin embargo, en neuropsicología la cuantificación no lo es
todo, así como tampoco lo es la cualificación. Existen diversas formas de evaluación
que requieren diversas estrategias de medida; las pruebas han de estandarizarse, pero
sólo en el grado en que les corresponda (Franzen, 1989).
Albert, M. L. (1973). A simple test for visual neglect. Nexrology, 23, 658-664.
Annett M. (1970). A classification of hand preference by association analysis. British Journal
of Psychology, 61, 303-321.
Técnicas nenropsicológicas
451
Aransanz Latorre, C. y Dueñas, C. (1987). La exploración del lenguaje y las afasias. Ponencia
presentada en el VII Congreso de la Sociedad Española de Neurología. Oviedo, España.
Badock, H. (1930). An experiment in the measurement of mental deterioration. Archives of
Psychology, 117-125.
Badock, H. y Levy, L. (1940). The measurement of efficiency of mental functioning (revised
examination). Test and manual of directions. Chicago. C. H. Stoelting.
Bender, L. (1955). Visnal motor gestalt test. Nueva York. American Orthopsychiatric Cor-
poration.
Benton, A. L. (1971). Introducción a la neuropsicología. Barcelona. Fontanella.
Benton, A. L. (1974). The revised Visual retention test. Nueva York. Psychological Corporation.
Benton, A. L., Levin, H. S. y Van Allen, M. W. (1974). Geographic orientation in patients
with unilateral cerebral disease. Neuropsychología, 12, 183-191.
Benton, A. L., Hamsher, K., Varney, N. R. y Spreen, O. (1983). Contributions to nNEeuropsy-
chological assessment. Nueva York. Oxford University Press.
pa pd (1990). Malingering following minor head trauma. Clinical Neuropsychology,
Broadbent, D. E. (1958). Perception and communication. Oxford. Pergamon Press.

Buschke, H. (1973). Selective reminding for analysis of memory and learning. Journal of Ver-
bal Learning and Verbal Behavior, 12, 543-550.
Buschke, H. y Fuld P. A. (1974). Evaluating storage, retention, and retrieval in disorderd me-
mory and learning. Neurology, 24, 1019-1025. :
Caramazza, A. y McCloskey, M. (1991). The poverty of methodology. Behavioral and Brain
Sciences, 14, 444-445.
Christensen, A. L. (1979). Luria's neuropsychological investigation. Copenhague. Munks-
aard.
De da E. y Flaglioni, P. (1978). Normative data and screening power of a shortened ver-
sion of the Token test. Cortex, 14, 41-49.
Dunn, L. M. (1965). Expanded manual for the Peabody picture vocabulary test. Minneápolis.
American Guidance Service. : :
Dunn, L. M. y Dunn, L. M. (1981). Peabody picture vocabulary test revised. Minnesota.
American Guidance Service, Circle Pines.
Ellis A. y Young A. (1992). Neuropsicología cognitiva humana. Barcelona. Masson.
Franzen, M. D. (1989). Reliability and validity in neuropsychological assessment. Nueva
York. Plenum Press. ; cd
Geschwind, N. y Galaburda, A. M. (1985). Cerebral lateralization. Biological mechanisms,
associations and pathology: II. An hypothesis and a program for research. Archives of
Neurology, 42, 521-552.
Golden, C. ]., Hemmeke, T. A. y Purisch, A. D. (1980). The Luria-Nebraska neuropsycholo-
gical battery. Los Ángeles. Western Psychologic Services. v3
Goodglass, H. y Kaplan, E. (1974). Evaluación de la afasia y trastornos similares. Buenos
Aires. Panamericana. de des noite
Goodglass, H. y Kaplan, E. (1979). Assessment of cognitive deficit in the brain injured pa-
tient. En M. S. Gassaniga (dir.), Neuropsychology. Nueva York. Plenum Press.
Goodglass, H. y Kaplan, E. (1983). The assessment of aphasia and related disorders. Filadel-
fia. Lea and Febiger. u
Gronwall, D. M. A. (1977). Paced auditory serial-addition task: A measure of recovery from
concussion. Perceptual and Motor Skills, 44, SS EN 94)
Halstead, W. C. (1947). Brain and intelligence. Chicago. University of Chicago Press.
Halstead, W. C. y Wepman, J. M. edo The ed pd LM aphasia screening test.
eech and Hearing Disabilities, 14, 9-15.
pil e y Mckinley, J. GC,(1951). The Minnesota M ultiphasic Personality Inventory
Manual (revised). Nueva York. Psychological Corporation.
Helm-Estabrooks, N. (1992). Aphasia diagnostic prophiles. Normed edition. Manual. Chica-

go. The Riverside Publishing Company. : pa
Holland, A. (1980). Communicative abilities in daily living. Baltimore. University Park
Press.
Hooper, H. E. (1958). The Hooper visual organization test: Manual. Beverly Hills. Western
Psychological Services. :
Incagnoli, T., Goldstein, G. y Golden, C. (1986). Clinical application of neuropsychological
test batteries. Nueva York. Plenum Press.
Jackson, J. H. (1931). Selected writings 1 y HI. En J. Taylor (dir.), Selected writings. Londres.
Hoder and Stoughton. rl
Kaplan, E., Fein, D., Morris, R. y Delis, D. C. (1991). WAIS-R as a neuropsychological instru-
ment. Nueva York. The Psychological Corporation. Harcourt Brace Jovanovich.
Kaplan, E., Goodglass, H. y Weintraub, S. (1983). The Boston naming test (experimental edi-
tion). Filadelfia. Lea and Febiger.
Kertezs, A. (1979). Aphasia and associated disorders. Nueva York. Grune and Straton.
Kertezs, A. y Poole, E. (1974). The aphasia quitient: The taxonomic approach to measure-
ment of aphasic disability. Canadian Journal ofNeurological Sciences, 1, 7-16.
Kimura D. (1961). Cerebral dominance and the perception of verbal stimuli. Canadian Jour-
nal of Psychology, 15, 166-171.
Lezak, M. D. (1983). Neuropsychological assessment. Nueva York. Oxford University Press.
Lezak, M. D. (1987). L'évaluation neuropsychologique. En M. 1. Botez (dir.), Nenropsycho-
logie clinique et neurologie du comportament. Montreal. Les Presses de Université de
Montréal Masson.
Luria, A. R. (1970). Traumatic aphasia, its syndromes psychology and treatment. La Haya.
Mouton.
Luria, A. R. (1973). The working brain. An introduction to neuropsychology. Nueva York.
Basic Books.
Luria A. R. (1977). Language and the brain. Towards the basic problems of neurolinguistics.
En A. R. Luria (dir.), Nexropsychological studies in aphasia. Neurolinguistics, 6. Ámster-
dam. Swets and Zeitlinger.
Matthews, C. G. (1981). Neuropsychology practice in a hospital setting. En S. B. Filskov y
T. J. Boll (dirs.), Handbook of clinical neuropsychology. Nueva York. John Wiley and
Sons.
McGee, M. G. (1979). Human spatial abilities. Nueva York. Praeger.
Olfield R. C. (1971). The assessment and analysis of handedness: The Edinburgh Inventory.
Neuropsychologia, 9, 97-113.
Orsini, D. L., Van Gorp, W. G. y Boone, K. B. (1988). The neuropsychology casebook. Nueva
York. Springer-Verlag.
Osterrieth, P. A. (1944). Les test de copie d'una figure complexe: Contribution a l'étude de la
perception et de la mémoire. Archives de Psychologie, 30, 286-356.
Peña-Casanova, J. (1976). La apraxia constructiva y problemas de desarrollo y aprendizaje en
neurología. Revista de Neurología, 17, 267-273.
Peña-Casanova, J. (1984). Historia de la afasiología. En J. Perelló Gilberga (dir.), Perturba-
ciones del lenguaje. Barcelona. Científico Médica.
Peña-Casanova, J. (1986). Programa integrado de exploración neuropsicológica computariza-
da. PIENC, Barcelona-86. Tesis doctoral inédita. Universidad de Navarra.
Peña-Casanova, J. (1987). La evaluación nenropsicológica. Comunicación presentada en el
VII Congreso Nacional de Neurología. Oviedo.
Peña-Casanova, J. (1990). Programa integrado de exploración neuropsicológica “Test Barce-
lona”. Manual. Barcelona. Masson.
lona”. Normalidad, semiología y patología neuropsicológicas. Barcelona. Masson.
Peña-Casanova, ]. (en prensa a). Limitaciones de los grupos y de los síndromes neuropsico-
lógicos clásicos en neurología. Neurología
Peña-Casanova, J. (en prensa b). Introducción a la exploración de las afasias (De la cabecera
del paciente a la exploración idiográfica). Revista SeNeurología, 20.
Petersen, A. C. y Witting, M. A. (1979). Sex-related differences in cognitive functioning.
Nueva York. Academic Press.
Porch, B. E. (1981). Porch index of communicative ability (vol. 11): Administration, sCoring
and interpretation (3* ed.). Palo Alto. Consulting Psychologists Press.
Raven, J. C. (1947). Colored progressive matrices. Londres. K. H. Lewis.
Raven, J. C. (1960). Guide to use standard progressive matrices. Londres. K. H. Lewis.
Reitan R. M. y Davison, L. A. (1974). Clinical neuropsychology: Current status and applica-
tions. Washington, D.C. V.H. Vinston.
Reitan R. M. y Woltfson, D. (1985). The Halstead-Reitan neuropsychological test battery:
Theory and interpretation. Tucson. Neuropsychology Press.
Rey, A. (1941). L'examen psychologique dans les cas d'encéphalopathie traumatique. Archi
ves de Psychologie, 28, 286-340.
Rey, A. (1959). Test de copie et de reproduction de mémoire de figures geométriques comple-
xes. París. Les Editions du Centre de Psychologie Appliquée.
Rourke, B. P., Costa, L. C., Adams, K. M. y Plasterk, K. J. (1991). Methodological and biosta-
tistical foundations of clinical neuropsychology. Amsterdam. Swets and Zeitlinger.
Rusell, E. W. (1984). Theory and development of pattern analysis method related to the
Halstead-Reitan Battery. En P. E. Logue y J. M. Schear (dirs.), Clinical neuropsycholog).
A multidisciplinary aproach. Springfield. Charles C. Thomas.
Semmes, J., Weinstein, S., Ghent, L. y Teuber, H. L. (1960). Somatosensory changes after pe-
netrating head wounds in man. Cambridge. Harvard University Press.
Signoret,J.L. (1991). Batterie d'efficience mnésique BEM 144. París. Elsevier.
Signoret, J. L. y North, P. (1979). Les apraxies gestuelles. Comunicación presentada en el
Congrés de Psychiatrie et de Neurologie de Langue Frangaise. París.
Smith, A. (1981). Principles underlying human brain functions in neuropsychologic sequelae
of different neuropathological processes. En S. B. Filskov y T. J. Boll (dirs.), Handbook of
clinical neuropsychology. Nueva York. Wiley.
Spreen, O. y Benton, A. L. (1969). Neurosensory center comprehensive examination ofApha-
sia. Victoria BC. University of Victoria Neuropsychology Laboratory.
Spreen, O. y Strauss, E. (1991). A compendium of neuropsychological tests. Administration,
norms and commentary. Nueva York. Oxford University Press.
Stroop, J. R. (1935). Studies of interference in serial verbal reaction. Journal of Experimental
Psychology, 18, 643-662. :
Strub, R. L. y Black, F. W. (1985). The mental status examination in neurology. Filadelfia.
F. A. Davis and Company.
Strub, R. L. y Black, F. W. (1988). The bedside mental status examination. En F. Boller y
F. Grafman (dirs.), Handbook of neuropsychology (vol. 1). Nueva York. Elsevier Sciences
Publishers, B. V.
Tarter, R. E. y Edwards, K. L. (1986). Neuropsychological batteries. En T. Incagnoli,
G. Goldstein y C. J. Golden (dirs.), Clinical application of nenropsychological test batte-
ries. Nueva York. Plenum Press.
Tiffin J. (1968). Purdue pegboard: Examiner manual. Chicago. Science Research Associates.
Tunks, E. (1976). Nenropsychiatric examination procedures: A criterion-sensivity problem.
Ponencia presentada en el IV Encuentro Anual de la International Neuropsychological
Society. Toronto, Canadá. Fara
Walsh, K. W. (1991). Understandin g brain damage. Londres. Churchill Livingstone.
Wechsler, D. A. (1955). Wechsler adult intelligence scale. Nueva York. Psychological Corporation.
Weinsenburg, T. S. y McBride, K. L. (1935). Aphasia. Nueva York. Commonwealth Fund.
Benton, A. L. (1983). Contributions to neuropsychological assessment. Nueva York. Oxford

University Press.
lona”: normalidad, semiología y patología neuropsicológicas. Barcelona. Masson.
Spreen, O. y Strauss, E. (1991). A compendium of neuropsychological tests. Administration,
norms and commentary. Nueva York. Oxford University Press.
Strub, R. L. y Black, F. W. (1988). The bedside status examination. En F. Boller y F. Grafman
(dirs.), Handbook of neuropsychology (vol. 1). Nueva York. Elsevier.
20. TÉCNICAS SUBJETIVAS
WENCESLAO PEÑATE y PILAR MATUD
Il. INTRODUCCIÓN
Resulta complicado señalar el origen y características de las denominadas técnicas

subjetivas debido a que, dependiendo de la tradición que se tome en cuenta, se pue-
den entender de modos claramente contrapuestos, lo que lleva aparejados conteni-
dos distintos para esas técnicas subjetivas.
En una primera clasificación, cabe señalar dos grandes tradiciones en el uso de
procedimientos subjetivos.
a. La primera de ellas considera a las técnicas subjetivas como sinónimas de

técnicas proyectivas, en un doble sentido. Por un lado, el hecho de que las técnicas
proyectivas faciliten la libre expresión del individuo, sin mediatizaciones, permite
obtener la versión más original y genuina, subjetiva, de la persona evaluada. En este
caso el carácter subjetivo vendría indicado por la persona evaluada. Por otro lado,
una de las críticas que continúan haciéndose a las técnicas proyectivas consiste en las
garantías de certeza del calificador-evaluador. Dado que las respuestas originales del
cliente hay que interpretarlas de acuerdo con una teoría basal o con una serie de nor-
mas de análisis de contenido, con frecuencia resulta que cuesta poner de acuerdo en
la interpretación a dos evaluadores distintos (fiabilidad intercalificadores o fiabilidad
del diagnóstico), lo que en último término califica a estas técnicas como subjetivas,
dándole en este caso el carácter subjetivo la interpretación que hace el examinador.
De acuerdo con esta última consideración, las técnicas proyectivas han sufrido
transformaciones que hace difícil generalizar el comentario anterior a todas ellas (al-
gunas como las manchas de tinta de Rorschach o el Test de apercepción temática han
hecho esfuerzos por disminuir la subjetividad del evaluador en la interpretación de
los contenidos verbales del cliente). Sin embargo (véase Anastasi, 1988), la existencia
de estas pruebas ha hecho posible que se definan otras como objetivas, ya que, frente
a la subjetividad de los procedimientos proyectivos, ofertan unos referentes no en-
mascarados, de respuesta cerrada y de interpretación tipificada.
b. La segunda tradición es más difusa. De acuerdo con Pervin (1975) y Fernán-
dez-Ballesteros (1983), desde la tradición fenomenológica se ha venido proponiendo
un modo de análisis diferenciado de los análisis psicométricos tradicionales, en aras
de facilitar una mejor evaluación de sus presupuestos teóricos. La idea principal de
este análisis consistía en que fuera capaz de captar la versión genuina de la persona
evaluada, de acuerdo con unos conceptos-estímulos. Las técnicas y procedimientos
derivados de los planteamientos fenomenológicos pretendían facilitar el conocimien-
Universidad de La Laguna.
456 Wenceslao Peñate y Pilar Matud
to de cómo el individuo percibía el mundo y a sí mismo, sin esquemas previosni

planteamientos nomotéticos, sólo la versión de la persona de acuerdo con sus propias
percepciones. Por ello, no interesaba tanto en qué medida una persona compartía con
otras (con las que se le comparaba) una serie de características personales, como las
características propias de esa persona que llevara a un mejor conocimiento de ella: co-
nocer cómo una persona percibe y estructura el mundo que le rodea, sin esquemas ni
sesgos de partida, lleva a que se la pueda comprender con mayor facilidad y precisión.
En relación con esta tradición fenomenológica se han venido elaborando distin-
tos modos o técnicas de evaluación, orientadas originalmente hacia esa medida ge-
nuina del sí mismo y que, posteriormente, se han reconvertido para la evaluación de
otros contenidos. Ejemplos de estas técnicas son la técnica Q de Stephenson (1953) y
la técnica de rejilla (GRID) derivada del Test del repertorio de constructos personales
(REP) de Kelly (1955). El carácter subjetivo de estos procedimientos, técnicas o mo-
dos de evaluación le viene dado por permitir el conocimiento de cómo cada indivi-
duo percibe y estructura el medio que le rodea (los otros significativos) y a sí mismo,
sin necesidad de comparaciones intersujetos ni esquemas previos que sesguen o
“contaminen” ese conocimiento único y personal. Estos planteamientos se plasman
en la elaboración de técnicas de evaluación que se caracterizan por ser no estructura-
das, no enmascaradas y voluntarias, lo que posibilita que la persona evaluada emita
un informe relativo a su propia personalidad en una situación no tipificada, de acuer-
do con los criterios clasificatorios propuestos por Pervin (1975).
De acuerdo con esta clasificación, las técnicas subjetivas estarían caracterizadas

por permitir un amplio abanico de respuestas (no estructuradas), mostrar claramen-
te sus propósitos de evaluación (no enmascaradas), y no existir respuestas correctas
o incorrectas. Estas características las harían distintas de las pruebas proyectivas de-
bido a su carácter no enmascarado, y las separaría de los tests de personalidad de tra-
dición psicométrica debido a su carácter no estructurado, permitiendo unas mayo-
res posibilidades y alternativas de respuesta.
Es esta alternativa fenomenológica la que mayor apoyo recibe a la hora de situar
a las técnicas subjetivas, en la medida en que no sólo las separa de las técnicas proyec-
tivas, con las que comparte elementos comunes, sino que las diferencia de la otra al-
ternativa de evaluación tradicional: la psicométrica. Ello supondría entonces que
todo estaría claro y las técnicas de evaluación subjetivas se hallarían perfectamente
ancladas y definidas. Los problemas empiezan cuando se intenta traducir esas técni-
cas en procedimientos de evaluación concretos. En el siguiente apartado se analiza-
rán las dificultades que supone definir determinadas técnicas como subjetivas, frente
a la existencia de Otras categorías.
Il. CARACTERÍSTICAS
Como se ha señalado más atrás, las características definicionales de las técnicas subje-
tivas serían las de no enmascaramiento, no estructuración y voluntariedad, lo que les
daría señas de identidad diferenciada frente a otro tipo de procedimientos de análisis.
Técnicas subjetivas
457
Pormenorizando estas características, la primera de ellas hace referencia a que los

contenidos son explícitos, no existe interés en disfrazar esos contenidos ni de engañar
a lapersona evaluada con respecto a los verdaderos propósitos de la prueba. Caracte-
rística esta que es común a toda la tradición psicométrica clásica, alrededor de la teoría
de tests, donde siempre se han hecho explícitos los contenidos de las pruebas. Por
tanto, el no enmascaramiento de los propósitos de una prueba es una característica
compartida con la tradición psicométrica y que les separa de las técnicas proyectivas.
_ La característica de no estructuración hace referencia a la menor o mayor dispo-
nibilidad de respuestas. Al ser las técnicas subjetivas no estructuradas permiten una
mayor libertad de respuestas, tal como ocurre con las técnicas proyectivas. Pero,
además, dentro del enfoque psicométrico existen pruebas concretas donde se permi-
te que la persona evaluada responda libremente, sin que se le someta a un número
determinado de alternativas de elección forzosa, categorizando posteriormente las
respuestas (Pelechano, 1991).
Llegados a este punto se podría argumentar que lo que caracteriza a las técnicas
subjetivas es que siempre son no estructuradas, lo que las diferenciaría de las de tra-
dición psicométrica debido a ese carácter exclusivo de disponer de unas mayores al-
ternativas de respuesta.
La tercera característica habla de la voluntariedad de la elección de la alternativa
de respuesta, frente a pruebas donde las alternativas a elegir suponen errar o acertar,
de acuerdo con la respuesta elegida. Si utilizáramos la terminología de la teoría de
test (Pelechano, 1988), las técnicas subjetivas estarían orientadas a la evaluación de
constructos, frente a otras pruebas orientadas a criterio. De nuevo esta característica
no es exclusiva de las técnicas subjetivas, sino que es totalmente compartida por las
técnicas proyectivas y por los tests de evaluación de constructos.
Visto el panorama, las técnicas subjetivas, definidas desde la orientación fenome-
nológica, poseen una identidad débil frente a otro tipo de procedimientos de análisis,
ya que la única característica propia consiste en que se de conjuntamente una serie de
ellas, que por separado también se encuentran en otros procedimientos diagnósti-
cos, lo que lleva a autores como Fernández-Ballesteros (1983) a indicar cómo estas
técnicas podrían ser englobadas en las técnicas de autoinforme (cuando se trate de
una autoaplicación), o de las técnicas de observación (cuando la evaluación la hacen
personas distintas de la que es objeto de evaluación).
Sin embargo, y a la luz de la aplicación de las técnicas subjetivas más importantes
(la técnica de rejilla, la clasificación Q, el diferencial semántico o las listas de adjeti-
vos), caben hacer otras apreciaciones que pueden aclarar más la situación conceptual
de estas técnicas.
Así, una cuarta característica vendría definida por su utilización intrasujeto. En
ese sentido se situarían dentro de la tradición ideográfica-ipsativa, donde interesa
apresar la percepción que un individuo posee de sí mismo o de otras personas O
eventos, sin que necesariamente se tenga que comparar esa percepción con laque
poseen otros y, mucho menos, considerar si esa percepción cae dentro de unadistri-
bución normal determinada. La autopercepción tiene valor en sí misma, facilitando
por un lado, en la terminología fenomenológica, la comprensión del individuo; y
por otro, servir de criterio para monitorizar el proceso de cambio de ese individuo,
de acuerdo con las distintas estrategias de intervención que se puedan llevar a cabo.
+58 Wenceslao Peñate y Pilar Matud
Esta consideración intrasujeto-ideográfica, frente a los planteamientos intersuje-

to-nomotéticos, tiene dos consideraciones que hacer: por un lado, el hecho de su uso
preferencial intrasujeto no quiere decir que algunas técnicas también hayan desarro-
llado aplicaciones de comparación interindividuos, como se verá posteriormente. Y,
por otro, tampoco ésta es una característica exclusiva de las técnicas subjetivas, ya
que el planteamiento de comparación intrasujeto es compartido por técnicas deriva-
das de la denominada evaluación conductual (Goldfried y Kent, 1972; Barrios,
1988).
Finalmente, una última característica tiene en cuenta la propia consideración me-
todológica de las técnicas mencionadas. Hay que tener presente que se trata de una
técnica, no de pruebas de evaluación concretas, por lo que se trataría de modos espe-
cíficos de evaluación que se pueden plasmar en distintos formatos concretos, depen-
diendo en parte de la naturaleza de lo que se quiere evaluar y en parte de la mayor o
menor estructuración de la prueba. Pero aún es más complejo, las técnicas subjetivas
no sólo pueden tener una plasmación diversificada en formatos de prueba concretos,
sino que técnicas subjetivas es un concepto más amplio que engloba a técnicas que
mantienen entre sí elementos comunes (como los cuatro citados hasta aquí), pero
que, cuando dan pie a formatos concretos, también mantienen elementos diferencia-
dores, lo que da un conjunto heterogéneo de pruebas que difícilmente podríamos
definir como constitutivas de un modo de análisis único y distinto.
Este estado de la cuestión permite señalar que las técnicas subjetivas son un con-
junto de procedimientos, originalmente insertos en la corriente fenomenológica,
autoevaluativos o de evaluación por otros, dentro de formatos explícitos que permi-
ten una amplia variedad de respuestas en aras a obtener una medida genuina de
cómo los individuos se perciben a sí mismos y/o de cómo perciben y estructuran el
medio que les rodea (los otros significativos).
Evidentemente, en esta definición no sólo caben las técnicas subjetivas señaladas
más atrás, sino que pueden ser incluidas las entrevistas, las escalas de calificación (ra-
ting scales) conductuales, los protocolos de autoobservación y autorregistro e, inchu-
so, el análisis de documentos personales. Sin embargo, tanto las entrevistas como la
observación y las escalas de calificación tienen la suficiente entidad para tener un
desarrollo capitular propio. Por otro lado, hemos preferido situar aquí aquellas téc-
nicas que, en mayor o menor medida, son representativas de la tradición fenomeno-
lógica, con el fin de dar coherencia a la presentación de las técnicas más significativas.
III. LA TÉCNICA DE CLASIFICACIÓN Q
De acuerdo con Block (1978), cuando en 1953 William Stephenson propone la me-
todología de análisis Q, lo hace con la finalidad de ofertar una alternativa a la meto-
dología correlacional (metodología R) dominante en la época. La metodología Q
pretendía ofertar un análisis de personas frente al análisis de ítems de la metodología
R, ala vez que ofertaba una técnica de evaluación para el estudio del caso individual.
En síntesis, la técnica de clasificación Q consiste en que una persona se autoeva-
lúe o evalúe a otros de acuerdo con una serie de ítems, normalmente comprendidos
459
entre 60 y 120, conteniendo cada uno de ellos frases, afirmaciones, juicios, etc. El
evaluado deberá indicar en qué medida esos referentes verbales son aplicables a la
persona enjuiciada, normalmente de acuerdo con una escala de nueve puntos, aun-
que pueden ir de siete a once, que van desde la ausencia de aplicabilidad (1) a la máxi-
ma aplicabilidad (9) (Kerlinger, 1973). No se trata de acertar en la elección ni de dar
con la respuesta correcta, sino de ofrecer la versión que un individuo tiene de sí mis-
mo o de cómo percibe a otras personas allegadas.
Hasta aquí la metodología Q no se diferenciaría de la metodología R en la cons-
trucción de tests. Sin embargo, hay que hacer tres precisiones:
a. La distribución de los ítems de acuerdo con las nueve categorías de respuesta

está establecida previamente, adecuándose a una distribución normal según la cual el
mayor número de ítems debe caer en las categorías intermedias (cuatro, cinco, seis),
disminuyendo progresivamente el número de ítems a medida que las categorías de
respuesta se extreman, siendo esta condición lo que le da la denominación de clasifi-
caciones Q.
b. Como consecuencia de lo anterior, las respuestas a los ítems se hacen inter-
dependientes, de tal forma que al tener estipulado un número fijo de ítems por cate-
goría, el evaluado debe decidir qué ítems precisos van al cupo de cada categoría en
menoscabo de otros ítems que deben ir al cupo de otras, desde una visión global de
toda la prueba.
c. La técnica tiene un claro carácter ipsativo-ideográfico, devolviendo el argu-
mento de la metodología psicométrica-nomotética: en lugar de una distribución
normal de personas, se propone una distribución normal de los ítems. Quizás con-
venga desarrollar un poco más esta idea.
Uno de los fundamentos de la teoría clásica de tests consiste en aceptar que las
características psicológicas se distribuyen según un modelo de curva normal. Así, si
evaluamos cualquier característica, aproximadamente el 68% de la población se si-
tuará a una desviación típica, en cualquier dirección, con respecto de la puntuación
media en esa característica; el 95% deberá situarse a dos desviaciones típicas y el
99% se situará a tres desviaciones típicas. En el caso de la metodología Q, la lógica
indica que de un número determinado de juicios valorativos sobre una persona, la
mayoría de ellos será medianamente aplicable a ella y sólo un pequeño grupo de esos
juicios será, por un lado, de total aplicación, y, por otro, no lo será en absoluto.
Tomando como ejemplo una prueba Q sobre cualquier dimensión personal (auto-
concepto, neuroticismo, estilo de vida, etc.) compuesta por 100 declaraciones verba-
les, donde la persona evaluada deberá responder en una escala de nueve puntos, que
van desde el máximo acuerdo con la declaración hasta el total desacuerdo, la distri-
bución de las respuestas debería seguir un modelo como el que se presenta en la fi-
gura 20.1. : ADELA
Observando la gráfica, se puede encontrar la misma distribución señalada antes
para los individuos en la metodología R, sólo que en este caso la distribución corres-
ponde a los ítems. Así, la persona evaluada deberá situar la mayoría de ellos entre
las puntuaciones intermedias (4, 5 y 6), lo que deberá equivaler al 68% sobre el total
de los ítems (una desviación típica); una menor cantidad de ítems (26) deberá res-
FIGURA 20.1. Distribución Ripatétisa de una prueba de clasificación Q, conteniendo 100

ítems y nueve a ternativas de respuesta
25
do 20
>
1)
AE
u 15
E
O
mm 10
>
y)
za
máx. desacuerdo X máx. acuerdo
ALTERNATIVAS DE RESPUESTA
ponderlos dentro de las categorías 2, 3, 7 y 8, lo que supone, sumado el porcentaje

anterior, el 95% aproximadamente de los ítems (dos desviaciones típicas); y por últi-
mo sólo seis deberá situarlos en las categorías extremas (1 y 9), lo que supone alcan-
zar el 100% del total de los ítems (sobre las tres desviaciones típicas).
Lo que se ha relatado es un ejemplo hipotético de distribución, las pruebas con-
cretas de acuerdo con la metodología Q generan sus propias distribuciones, pudien-
do aumentar o disminuir el número de categorías, así como el número de ítems que
deben ser adscritos a cada una de ellas, aunque siempre teniendo en cuenta el princi-
pio genérico de distribución normal. Veamos en el siguiente apartado la puesta en
práctica de esta técnica de evaluación.
Li. Modelos de administración de las clasificaciones Q

De acuerdo con los principios señalados más arriba, la metodología Q ha permitido
el desarrollo de pruebas concretas, en los ámbitos más diversos.
Con respecto al formato, el más usual consiste en una serie de tarjetas individua-
les, conteniendo cada una de ellas un ítem relativo a lo que se quiere medir (Rogers y
Dymond, 1954; Block, 1978; Stephen y Harrison, 1986). El formato en tarjetas,
frente al de papel y lápiz, tiene la ventaja importante de que se hace mucho más ma-
nejable, en la medida en que las instrucciones de administración obligan a elegir un
461
número determinado de ítems dentro de cada categoría de respuesta. Siguiendo el

último ejemplo citado, la Prueba Q de estilos comunicativos (CSQS, The communi-
cation style Q-set) de Stephen y Harrison consiste en 100 tarjetas sobre contenidos
relativos a estilos individuales de comunicación (control sobre lo que dice, tono de
voz, utilización del lenguaje no verbal, etc.). La persona evaluada debe asignar estas
100 tarjetas de acuerdo con nueve montones, que van desde la categoría «poco carac-
terístico en mí» (1), a la de «muy característico en mí»(9). Las tarjetas han de distri-
buirse en las pilas de acuerdo con el cuadro siguiente:
A SS AS A AA TY AAA ARA AAA
Categorías por respuestas
Poco caract. il 2 3 4 IS) 6 7 8 9 Muy caract.
da 00 ña 16 18 16 12 8 S
Número de tarjetas por categoría
Siguiendo esta distribución, la persona evaluada deberá asignar cinco tarjetas a

las categorías una y nueve, ocho a las categorías dos y ocho, y así sucesivamente se-
gún el cuadro anterior. El hecho de presentarse en tarjetas facilita esta asignación en
montones, pudiendo remover tarjetas de una categoría a otra en el caso de sobrepa-
sar el cupo. Hecho este que sería realmente complejo en una prueba de papel y lápiz
y 100 ítems por contestar en nueve categorías.
Siguiendo el comentario anterior, el modo de administración consiste en que la
persona deposite la cantidad de tarjetas señaladas para cada montón, según la escala
de respuestas que se indique. Sin embargo, algún autor ([hompson, 1980) ha pro-
puesto una mejora con respecto al sistema de clasificación de las tarjetas en pilas o
montones, añadiendo una nueva clasificación dentro de cada montón-rango. Ello
supone que, una vez que la persona ha clasificado todas las tarjetas, deberá de nuevo
volver a clasificarlas dentro de cada pila, ordenándolas de mayor a menor pertenen-
cia a ese montón-categoría. Con ello parece lograrse una mayor precisión en la clasi-
ficación (se puede obtener así una clasificación ordenada de la primera a la última
tarjeta), aunque parece evidente que en clasificaciones alrededor de 100 tarjetas
(como suele ser habitual) supone una finura excesiva y una tarea cognitivamente
compleja que puede generar clasificaciones artefactuales: si una categoría comprende
10 tarjetas, las últimas clasificadas posiblemente tengan tanto que ver con esta cate-
goría original como con las primeras tarjetas clasificadas en la categoría inmediata-
mente siguiente. : E
Por último, con respecto a quién se evalúa, la clasificación Q puede utilizarse de
dos amplias formas:
a. Como una prueba de autoevaluación, donde la persona se autoaplica los

contenidos de las tarjetas, pudiendo referirse a una amplia variedad de temas, carac-
terísticas o dimensiones personales, en distintas condiciones (real, simulada, actual,
informe retrospectivo, etc.).
b. Como una escala de calificación sobre personas allegadas, que pueden tam-
bién ser situaciones concretas como ambiente familiar o condiciones escolares (Ker-
linger, 1973). En este segundo modo, la calificación de otros significativos puede ha-
cerse mediante un informe valorativo a través de la relación o conocimiento que se
tenga de ellos, o como un sistema de observación y registro de conductas, donde las
tarjetas son descripciones de conductas observables (Smith-Wampler y cols., 1989).
ma. El análisis de los datos
El modo de responder a una prueba Q puede hacer un tanto complejo comprender

cómo se analizan las respuestas. Veamos algunos modos de análisis, emplazando al
lector a los textos de Kerlinger (1973) y Block (1978) para una mayor profundización.
Desde un punto de vista meramente descriptivo, cuando la prueba es unidirec-
cional (evalúa una única dimensión, constructo o factor), el análisis consiste en valo-
rar aquellas tarjetas situadas en los extremos, en la medida en que estas tarjetas dis-
criminan perfectamente entre las características de esa dimensión aplicables y no
aplicables a un individuo. Lógicamente se trata de un análisis cualitativo, a partir de
una diferenciación categorial cuantitativa.
Este análisis descriptivo se hace mucho más complejo cuando la prueba Q evalúa
más de un rasgo, constructo o factor (bidireccional, tridireccional, etc.). En esos ca-
sos, el análisis anterior hay que pormenorizarlo para cada factor, pudiéndose ahora
acompañar por análisis cuantitativos, ya que se puede obtener una puntuación par-
cial por categorías (o grupo de ellas), así como una puntuación total por factor, com-
parándose las puntuaciones obtenidas en cada factor y cómo se distribuyen en cada
una de las categorías de respuesta.
También se pueden realizar análisis inferenciales a partir de los datos obtenidos
por una misma persona en dos situaciones o condiciones diferentes (condiciones si-
muladas, tiempos distintos, proceso psicoterapéutico), o cuando se contrasta el perfil
obtenido por una persona con un perfil-modelo determinado (Bem y Funder, 1978).
Para ello, de nuevo se puede realizar un análisis de contenidos, categoría a categoría,
observando cómo los contenidos de cada categoría cambian de acuerdo con las modi-
ficaciones implementadas. Sin embargo, el análisis más usual consiste en relacionar
ambos pases de prueba (o, en el caso del perfil modelo, cómo se ajustan los dos perfi-
les). Para ello se ordenan por rangos los ítems, identificando rango con categoría de
respuesta. Una vez ordenados, se emparejan los ítems del primer pase con el rango
obtenido en el segundo pase (o modelo), de acuerdo con el esquema siguiente:
—_—_—__ A AAA
Pases de prueba
2 92
ltems
E Cr AAA 1 RANGO-CATEGORÍA
A AN O 9 E
(e o VI o 3 »
AEREO
Adell MB AAA N S
4653
Una vez ordenados por rangos, de acuerdo con la categoría elegida para cada tar-
Jeta-ítem, se puede aplicar un estadístico de correlación para datos ordenados por
rangos (coeficiente rho), donde los sujetos son sustituidos por ítems, relacionándose
a personas en dos tiempos distintos. En este caso los coeficientes positivos indican
consistencia en las respuestas y los negativos cambios en las respuestas dadas por un
mismo individuo en dos ocasiones distintas (para el caso del perfil-modelo en el pri-
mer caso se habla de ajuste y en el segundo de desajuste). Además, como también se
ha señalado para los análisis descriptivos, se pueden realizar análisis similares cuan-
do la prueba Q evalúe más de una dimensión o factor. Evidentemente, el análisis es-
tadístico puede ir mucho más allá del análisis correlacional, pudiendo ampliarse a
otros procedimentos más complejos, y que escapan alos propósitos de este capítulo.
Por último, este procedimiento inferencial también puede utilizarse en diseños
no ipsativos, permitiendo comparaciones intersujetos, utilizándose como un sistema
de E más dentro de la metodología experimental (Kerlinger, 1973; Stephen,
1985).
m3. Aplicaciones de la clasificación Q

Como se ha venido comentando hasta aquí, las aplicaciones de la técnica Q han sido
tan amplias como la mayoría de los instrumentos diagnósticos al uso.
A las aplicaciones como medida del autoconcepto y como monitorización del
proceso psicoterapéutico (Rogers y Dymond, 1954), les ha seguido su aplicación en
una amplia variedad de temas (tantas como el propio autor, Stephenson [1983], con-
tinúa defendiendo), amén de las múltiples aplicaciones clínicas o escolares que esta
técnica ha tenido y que cada evaluador habrá desarrollado para sus cometidos con-
cretos. Lo que ha posibilitado que su uso científico haya ido desde el análisis de la
autoimagen inconsciente (Schlicht y cols., 1969), hasta el más reciente y prometedor
uso como una técnica de evaluación de la adecuación al puesto de trabajo (Caldwell
y O”Reilly, 1990), utilizando la alternativa del perfil-modelo de Bem y Funder
(1978), ya citada.
De esas aplicaciones, y a modo de ejemplo, se quisiera destacar algunas que han
consolidado unos contenidos específicos, a partir de una cuidada elaboración y va-
lidación. Block (1978) crea la Clasificación Q de California (CQ-set, California
Q-set), con la finalidad de ofertar un lenguaje común a la evaluación de la personali-
dad por parte de los profesionales. La prueba consiste en 100 ítems, de contenidos
psicopatológicos con orientación dinámico-fenomenológica, que cada profesional
utiliza como una escala de calificación una vez que ha mantenido contacto con el
cliente (a través de entrevistas, de descripciones proporcionadas por otras fuentes o
de observaciones de su comportamiento), en un rango de nueve categorías, como es
característico de las pruebas Q.
Los fundamentos para los contenidos psicopatológicos de la CQ-set no han es-
tado del todo claros. En contraposición, Graham (1967) y Aronson y Akamatsu
(1981) han propuesto la Prueba de clasificación Q-MMPI(MMPI Q-sort task), basada
en los contenidos del inventario mencionado incluye cincuenta ítems y se utiliza
también como escala de calificación o como validación criterial a perfiles del MMP.
Recientemente, las pruebas de clasificación Q se han dirigido alámbito fami-

liar, escolar y de relaciones humanas, mostrando una preocupación mayor por
someterlas a criterios de validación rigurosos. Así por ejemplo, la Prueba Q de es-
tilos comunicativos de Stephen y Harrison, ya citada, es una prueba bien validada
con respecto a habilidades de interacción verbal y no verbal. Compuesta de 100
tarjetas (alguna de las cuales las toman de los ítems correspondientes a esas habili-
dades de la CQ-set de Block), ofrece índices de validación psicométrica bastante
apreciables. Ai
En el mismo sentido anterior, la Clasificación Q de funcionamiento familiar de
Georgia (The Georgia family Q-sort), de Smith-Wampler y cols. (1989) ofrece una
prueba Q sobre las dimensiones de cohesión, adaptabilidad y comunicación fami-
liar, que es otro ejemplo de cómo una prueba basada en esa metodología puede ajus-
tarse a los cánones de validación psicométrica tradicionalmente exigibles a las prue-
bas de evaluación psicológica. Lo que hace prometedor el desarrollo de la
metodología Q, en la medida en que las pruebas que se deriven de ella puedan some-
terse a las exigencias de rigor psicométrico, sin que ello suponga renunciar a los prin-
cipios que la sustentan.
m4. Bondad psicométrica de las clasificaciones Q

Hablar genéricamente de la fiabilidad y validez de una técnica carece de sentido, ya
que lo usual no es hablar de la bondad psicométrica de una técnica, sino de las
pruebas específicas a las que diera lugar. En ese sentido hay que decir que una
prueba de clasificación Q se ajusta (en sus versiones autoadministradas) a los crite-
rios de un autoinforme, por lo que los requisitos psicométricos no tienen por qué
variar.
Con respecto a la fiabilidad, las clasificaciones Q, tanto unidireccionales como
polidireccionales (dimensiones, factores, clusters, etc.), se ajustan perfectamente a
análisis de consistencia interna y de estabilidad temporal test-retest. En el caso de
utilizarse como escala de calificación por otros o técnica observacional también pue-
de ajustarse al prerrequisito del acuerdo intercalificadores (Smith-Wampler y cols.,
1989).
En lo que concierne a la validez, los mayores problemas se han presentado a la
hora de definir el universo de contenidos. La representatividad de los contenidos en
cualquier caso es una decisión científica y lo que se espera es que los referentes ver-
bales utilizados estén de acuerdo con algún criterio. Tales son los casos, ya citados,
de la clasificación Q para evaluar las destrezas en el análisis de perfiles del MMP1
(Aronson y Akamatsu, 1981) o la CSQS de Stephen y Harrison (1986).
Con respecto a otros tipos de validez, normalmente las variables evaluadas tie-
nen también su versión en cuestionarios o inventarios, con lo que se posibilita la va-
lidez convergente. La validez de contenido y la validez convergente, unidas normal-
mente a las extracciones factoriales o clusters, permiten definir mejor la validez de
constructo. Sin embargo, si bien la validez de constructo tiene sentido, la validez cri-
terial podría ir en contra de la propia definición de la clasificación (no hay ordena-
ciones correctas e incorrectas y no existen comparaciones intersujeto), salvo en el
465
caso de utilizarse como perfil-modelo, donde una clasificación se hace coincidir con
una clasificación predeterminada, donde la mayor o menor coincidencia indicaría el
ajuste con el perfil-criterio, como pueden ser los casos de su utilización en el análisis
de puestos de trabajo; donde, además, esa coincidencia-correlación sería un predic-
tor de buen-mal desempeño del puesto (Caldwell y O'Reilly, 1990).
Sin querer agotar las posibilidades de validación con este resumen (existen datos
sobre validez aparente, discriminante, de tratamiento, etc.), sirve para ilustrar cómo
una técnica denominada subjetiva se puede someter con el mayor rigor a análisis de-
nominados objetivos, con lo que el carácter oscurantista con el que en alguna oca-
sión se ha querido ver a estas técnicas carece de sentido en clasificaciones bien esta-
blecidas y validadas.
IV. LA TÉCNICA DE REJILLA
Se podría decir que, dentro de la tradición fenomenológica, la técnica Q tiene su ori-

gen en una oferta alternativa a la metodología tradicional de tests, mientras que la
técnica de evaluación de los repertorios personales, de la que es un desarrollo la téc-
nica de rejilla, tiene como origen el ofertar una técnica que posibilitara la verificación
de la teoría de los constructos personales de George Kelly. Así, mientras que el ori-
gen de la clasificación Q es de carácter metodológico, el origen de la técnica de rejilla
es de carácter conceptual.
Escapa a los propósitos de este tema, al tiempo que se extendería en exceso,
un relato aproximado de la teoría de Kelly (1955), para lo que el lector dispone
de revistas especializadas (por ejemplo, International Journal of Personal Cons-
truct Psychology), de monografías como las del autor o la de Adams-Webber
(1979), o de series anuales como la iniciada y compilada por Neimeyer y Neime-
yer (1989).
Para nuestro interés, la teoría de los constructos personales postula que cada
individuo construye y estructura el mundo que le rodea de una forma única,
participando la experiencia en esa construcción, lo que hace que las personas se
diferencien en la forma de construir y estructurar su mundo perceptivo, ya que
dos personas no participan y perciben por igual una misma situación. A partir de
ese proceso se generan los constructos, que son modos de organizar ciertas cosas
y hechos que mantienen algún grado de similitud entre sí y que, al mismo tiem-
po, se diferencian de otras cosas y hechos. De este modo, los constructos permi-
ten a un individuo analizar su sistema relacional, al tiempo que le dan una identi-
dad única.
Siguiendo a Kelly (1955), el modelo clásico de evaluación (metodología R o psi-
cométrica, dependiendo de la terminología que se tome en cuenta), donde se trata de
situar a la persona evaluada dentro de ciertas dimensiones o rasgos que le clasifican
en alguna taxonomía psicopatológica preestablecida, no es el adecuado para evaluar
una serie de constructos personales idiosincrásicos. Mientras que el modelo psico-
métrico presupone que existe una serie de constructo, dimensiones, rasgos O facto-
res en los que es posible situar a cualquier persona, siendo las diferencias intersujeto
las posiciones que ocupa cada uno en esas variables; el modelo de constructos perso-
nales no asume esa distribución normal de los constructos, no presuponiendo que
los que una persona haya sido capaz de construir tengan que ser compartidos por
otros, así como el modo en cómo organiza cada persona los constructos tampoco
tiene por qué serlo. Se huye de los planteamientos nomotéticos y se defiende la un:-
cidad ideográfica.
Ante este estado de la cuestión, la teoría de tests no da respuesta a la evaluación
de los repertorios de constructos de una persona, y es aquí donde Kelly propone el
REP-test (Role construct repertory test), del que se deriva la técnica de rejilla (Grid
test). Con esta técnica el autor oferta un procedimiento de evaluación que posibilita
poner a prueba su teoría de los constructos personales.
Los fundamentos de esta técnica son los siguientes:
a. A través de un procedimiento de intercambio verbal (entrevista) es posible

conocer qué constructos ha elaborado una persona.
b. Si le pedimos que analice el medio que le rodea, será posible conocer su re-
pertorio de constructos, ya que éstos y su organización son los que utiliza para ese
análisis.
c. El conocimiento de los constructos es mucho más preciso si le pedimos que
analice a personas o situaciones significativas y familiares, que si le pedimos que ana-
lice personas o hechos con los que apenas ha tenido experiencias o no ha prestado
apenas atención.
d. El modo más sencillo de aflorar esos constructos es a través del contraste sz-
militud-diferencia.
e. Para ese contraste de similitud y diferencias se necesita que la persona com-
pare, al menos, pares de elementos, que pueden ser personas o situaciones significati-
vas en su vida.
f. Los constructos así obtenidos deben permitir su dimensionalización en dos
polos contrarios.
g. Elrepertorio de constructos que una persona utiliza debe servir para que ella
misma se sitúe e identifique.
Con estos presupuestos básicos en mente, veamos cómo se elabora una prueba
con la técnica de rejilla, conocimiento que el lector puede profundizar en obras
como las de Beail (1985), Fransella y Bannister (1977) o Bannister y Maier (1968).
1v1. Elaboración de un modelo de evaluación
Como se ha señalado en las características definicionales para todas las técnicas

subjetivas, el REP-test no es una prueba específica, sino que es un procedimiento
de análisis que posibilita el conocimiento y la medida del repertorio de construc-
tos de una persona en particular. Además, debido al propio planteamiento de la
teoría en la que se sustenta, hay que elaborar un REP-test para cada individuo, ya
que el repertorio es único y, a su vez, sólo sirve para evaluar a ese individuo en
particular.
| 467
Específicamente, la técnica de rejilla consiste en una serie de pasos que vamos a

enumerar de forma cronológica.
El primer paso consiste en pedirle a la persona evaluada que indique un número

determinado de elementos. Estos elementos pueden ser personas, situaciones o hechos
significativos en la vida de alguien, que permitirán elicitar el repertorio de constructos.
Usualmente estos elementos son personas allegadas en algún sentido al individuo eva-
luado (madre, padre, esposo-a), aunque pueden ser también roles genéricos, sin que se
especifiquen personas, como pueden ser “alguien que te disgusta” o “alguien que res-
petas”. El número de estos elementos pueden llegar a 30, aunque lo usual es 10.
Una vez determinados los elementos (que, para ilustrar el texto, podemos supo-
ner que se trata de 10 personas significativas en la vida del evaluado), se continúa con
el segundo paso. La tarea ahora consiste en elegir tríadas de elementos e ir estable-
ciendo constructos a través del procedimiento citado de similitud-contraste. Con-
cretamente, consiste en pedirle que de los tres elementos de la tríada indique en qué
se parecen (similitud) dos de ellos frente al tercero (contraste), tal ycomo el evaluado
quiera agruparlos. "Tanto la similitud como el contraste debe requerírsele que los
haga sobre cualidades psicológicamente significativas, no accesorias. De esa forma
obtenemos el primer constructo que ha de ser bipolar. En nuestro ejemplo, si le faci-
litáramos una tríada con los roles de “padre”, “terapeuta” y “amigo” la persona po-
dría agrupar a los dos últimos como personas que comparten flexibilidad frente a la
figura paterna que representa la autoridad. Con ello tendríamos el primer construc-
to “flexibilidad-autoridad” (normalmente, en el proceso terapéutico los constructos
y su bipolaridad no tienen por qué ser lógicos y racionales como el ejemplo citado).
Una vez elicitado el primer constructo continuaríamos de igual forma con una se-
gunda tríada (donde pueden volver a formar parte elementos de la primera), elicitan-
do el segundo constructo. Y así hasta completar el número de constructos deseado,
que normalmente se sitúan en 10.
Lo relatado para el segundo paso es el procedimiento propuesto usualmente
(Kelly, 1955; Pervin, 1975), sin embargo, puede eliminarse el procedimiento de tría-
das de elementos, sustituyéndose por díadas, previamente decididas por el terapeuta
(Menasco y Curran, 1978; Neimeyer y Neimeyer, 1981). En estos casos se le pide a
la persona evaluada que indique en qué se parecen o diferencian ambos elementos de
la díada. Siguiendo las instrucciones propuestas por Neimeyer y Neimeyer (1981),
el procedimiento sería de esta forma:
Bien, [nombre del evaluado-a], quiero que pienses en [primer elemento de la díada] y en
[segundo elemento de la díada]. ¿Los ves parecidos u opuestos en algún aspecto importan-
te? La similitud o diferencia puede ser cualquier cosa. Podría tener que ver con la clase de
personas que ellos son o con la forma de sentir, actuar, mirar, o pensar [...], cualquier cosa
en la que se parezcan uno a otro o se diferencien, tanto como te parezca importante para tl
[p. 196].
Una vez que la persona ha decidido en qué se parecen O diferencian, se le pide

que indique cuál es la idea contraria a esa primera, para buscar el otro polo del cons-
tructo. Si la persona nos dice que los dos elementos son muy parecidos en que «tie-
nen mucha fuerza de voluntad», ahora se le pediría cuál sería para ella la idea contra-
ria a “fuerza de voluntad”. Supongamos que dice “timidez”, con lo que tenemos el
primer constructo “fuerza de voluntad-timidez”.
Sea un procedimiento (tríada) u otro (díada), con el segundo paso se deben te-
ner elicitados la cantidad de constructos bipolares deseados. El tercer paso consiste
en pedirle que enjuicie de forma positiva, negativa o neutra (algunos modelos su-
primen el valor neutro) los polos de cada constructo. Así, para los ejemplos cita-
dos, en el constructo “flexibilidad-autoridad” la persona puede evaluar positiva-
mente el primer polo y negativamente el segundo, y en caso del constructo “fuerza
de voluntad-timidez” ha podido enjuiciarlo también en el mismo sentido anterior.
Esta valoración es de suma importancia a la hora de enjuiciar cualitativamente el
tipo de repertorio presentado, así como para facilitar el análisis cuantitativo del
mismo.
El cuarto paso no requiere de la participación de la persona evaluada. En este

caso es el evaluador el que elabora una escala de calificación tipo Likert con los cons-
tructos bipolares. Dos son las formas más usuales: una escala de siete puntos o una
escala de trece. En el caso de la escala de siete puntos la puntuación es como sigue:
[primer polo del constructo] (3) (22) (41) (0) (+1) (+2) (+3) [segundo polo del cons-
tructo]. Para el caso de 13 puntos el rango va de (-6) a (+6). Es necesario aquí balan-
cear los constructos para que los polos positivos y negativos no estén espacialmente
siempre en el mismo lugar, evitando así sesgos debidos a la posición. Algunos auto-
res incluso recomiendan no poner dígitos en la graduación de la escala (Menasco y
Curran, 1978), sustituyéndolos por letras para evitar la existencia de números prefe-
ridos.
S1 continuáramos con el ejemplo y tuviéramos 10 elementos y 10 constructos

(una rejilla de 10 x 10), y una escala de calificación de 7 puntos, ya estamos en condi-
ciones de dar el último paso, consistente en administrar la rejilla a la persona evalua-
da, pidiéndole que responda a los constructos bipolares según la escala, aplicándolos
a cada uno de los elementos. Desde el punto de vista de análisis psicoterapéutico es
imprescindible que uno de esos elementos sea el propio individuo, aunque es reco-
mendable que la persona evaluada responda en tercera persona (como si fuera otra),
con el fin de darle una mayor perspectiva, al tiempo que puede ser útil que responda
también como la persona que le gustaría ser (el yo ideal). Si todo ha ido correctamen-
te ahora tendríamos una rejilla completa de 10 elementos por 10 constructos. En el
cuadro 20.1 se recoge un ejemplo de esta rejilla.
Como puede observarse, cada intersección de elemento/constructo (E x C) ge-
nera una casilla. En ella se consignará la puntuación otorgada en ese constructo
para ese elemento, de acuerdo con la escala utilizada. Si continuáramos con nuestro
ejemplo, considerando que el primer constructo fuera “flexibilidad(+)-autori-
dad(-)” y el segundo “fuerza de voluntad(+)-timidez(-)”y el elemento a calificar
fuera “padre”, la persona evaluada podría haber situado a este elemento en (-2)
para el primer constructo (bastante autoritaria) y en (+2) en el segundo (con bas-
469
CUADRO 20.1. Ejemplo de una rejilla de 10 elementos por 10 constructos
CONSTRUCTOS
C1 C2 C3 C4 C5 C6 C7 C8 C9 Cc10
a EAA N
AA A
Son ire oc bota alda lla a Li E
Eoceno. parcado de[2co0s|ves]sa ue q
¿dcoclicacdo Przaleddelnerto [coco delmec memo
YN
Ai ico AU A Ml ll la IA
=
tá
uy
lc MS CE [SD [E [E PS
A ICI PEA O E
soba] [O Lo a cal rl
ER PO Ae
tante fuerza de voluntad). Con ello tenemos puntuadas las casillas C1 x El (22) y
C2 x El (+2). El resto de las casillas se continúan rellenando de esta forma hasta
completarlas, finalizando así el proceso de elaboración de un REP-test, a través de la
técnica de rejilla.
Este es un proceso de elaboración general; sin embargo, la técnica puede tener
otras expresiones y modificaciones que pueden ser consultadas en las obras de refe-
rencia citadas. Aquí sólo se comentarán algunas a modo de ejemplo.
1V.1.1. Algunas variaciones en la técnica de rejilla

Una primera variación no es tal en la medida en que no supone ninguna modifica-
ción en los pasos propuestos, sino que, de alguna forma, supone “ahorrarse” alguno
de estos pasos.
Bieri y cols. (1966) propusieron una forma de rejilla de 10 x 10 que pretendía
reunir los elementos y constructos más útiles para evaluar los constructos persona-
les, dentro del ámbito clínico. Lógicamente, la sola idea de proponer unos construc-
tos y elementos generales se contrapone con los planteamientos ideográficos de los
constructos personales: no se puede proponer una serie de constructos personales
generales, con intenciones nomotéticas, cuando la propia técnica indica que se tienen
que buscar los constructos teniendo en cuenta cómo cada persona analiza y estruc-
tura el mundo que le rodea. La propuesta genérica de Bieri podría quedar como si-
gue (siempre sujeta a pequeñas modificaciones):
A
Roles (elementos).
Tú mismo
Persona que te disgusta
Madre
Persona a la que te gustaría ayudar
Padre
Amigo del mismo sexo
Amigo de distinto sexo (puede ser esposo-a)
Persona con la que te sientes más incómodo
NS
SS
ES El jefe
10. Persona a la que te cuesta comprender.
Adjetivos bipolares (constructos).
1. Interesante =3 27 1 0 +1 +2 +3 Aburrido
2. Independiente —3+-=2 A E +2 +3 Dependiente
3. Extrovertido 3 2 A 0 +1 +2 +3 Tímido
4. Desajustado 3 2 -1 O +1 +2 +3 Ajustado
5. Autoabsorbido E 0 +1 +2 +3 Interesado en otros
6. Decidido 3 2 -—1 0 +1 +2 +3 Indeciso
7. Desconsiderado 3 2 A O —-+1 +2 +3 Considerado
8. Malhumorado 3 2 A OPTA +2 +3 Alegre
9. Irresponsable 3 2 -— O +1 +2 +3 Responsable
10. Tranquilo 3 2 0 +1 +2 +3 Excitable.
Esta rejilla 10 x 10 es calificada de acuerdo con una escala de 7 puntos, lo que le

convierte más que en un REP-test en un diferencial semántico (técnica que se verá en
el apartado siguiente). Sin embargo, como ilustración y como generadora de hipóte-
sis, la propuesta de constructos de Bieri y cols. (1966) puede ser útil, al tiempo que
servirá para facilitar el mantenimiento de un lenguaje lo más común posible. Por lo
demás, es factible pensar que los elementos de personas significativas no diferirán
mucho de los enunciados aquí. Elementos como “padre”, “madre”, “uno mismo” o
“amigo” pueden ser elementos significativos para cualquiera, pero debe ser la perso-
na evaluada quien lo corrobore.
En el sentido anterior de mantener un lenguaje común dada la diversidad de con-
tenidos que cada rejilla puede generar, Landfield (1971) elaboró un sistema de análi-
sis de contenidos de 32 categorías (fortaleza, activación emocional, autosuficiencia,
etc.), que pudiera traducir cualquier rejilla a un lenguaje unificado, a través de la pos-
codificación de los constructos. Evidentemente, el desarrollo temático de ese sistema
excede de los límites razonables de este capítulo, por lo que se remite al lector a la
obra de referencia.
Una variación que se utiliza con fines interpretativos consiste en pedirle a la per-
sona evaluada que ordene sus constructos desde el que tiene mayor significación
para ella hasta el que tiene menos. Es posible que todos los constructos no jueguen el
mismo papel en el esquema psicológico de un individuo, por lo que es plausible
aceptar que unos son más centrales y otros más accesorios. Leitner y Cado (1982)
encuentran en esta ordenación una forma ingeniosa de determinar situaciones de
amenaza o estrés: es mucho más estresante que la persona esté psicológicamente
471
amenazada en aquellos constructos que considera de alta significación, que en aque-

llos que no tienen tan alto valor, como así parecen haber probado los autores.
Existe una ordenación en la técnica de rejilla que ha obtenido cierta popularidad
y que sustituye o se utiliza conjuntamente con el escalamiento de los constructos,
obteniendo relevancia para el caso de rejillas orientadas al proceso terapéutico o vo-
cacionales (Neimeyer y Neimeyer, 1981; Neimeyer, 1989). Se suele denominar a este
tipo como rejilla ordenada por rangos (Rank order grid). Básicamente consiste en
pedirle a la persona evaluada que ordene diferencialmente los elementos de acuerdo
con su asociación de uno de los polos de cada constructo. Es decir, la tarea consiste
en que los elementos se ordenen en un rango de primero a enésimo (cantidad de ele-
mentos en la rejilla), para cada uno de los constructos, exactamente para uno de los
polos de cada constructo, de acuerdo con el valor que le asigne, donde la mayor rela-
ción se califica con 1 y para el elemento de ese polo del constructo menos caracterís-
tico, el valor 7 (cantidad de elementos). Tal clasificación permite una serie de análisis
que no podrían hacerse de otra forma, y que relataremos en el siguiente subapartado.
Para ilustrar este procedimiento, se puede tomar como ejemplo la propuesta de
Bieri anteriormente citada. Ahora se le pedirá que indique qué constructos son más
característicos, definitorios, significativos según qué elementos. Tomando el primer
constructo, “interesante-aburrido”, se elige uno de los polos (“interesante”) y se le
pide que indique para cuál de los 10 roles de personas el constructo “interesante” (el
que sea una persona interesante) es más definitorio, le va mejor, etc. Supongamos
que responde el elemento 7 (“amigo de distinto sexo”), entonces se anota en la rejilla,
en la casilla de la intersección del constructo 1 con el elemento 7, el número 1. Nue-
vamente se le pide que, quitando ese elemento, realice la misma operación. Si ahora
indica que el siguiente mejor definido es “padre” anotaremos en la rejilla el 2, en la
intersección del constructo 1 con el elemento 5. Y así hasta ordenar todos los ele-
mentos en todos los constructos, pudiendo quedar una rejilla como la que aparece
en el cuadro 20.2 (sólo para los dos primeros y el último de los constructos).
Tanto este sistema de responder a una prueba de rejilla, como la más usual de es-
calar cada elemento-constructo en unos intervalos determinados, el siguiente paso
consiste en interpretar los datos. También en este caso son varias las posibilidades de
análisis. Posibilidades que se resumen a continuación.
1v2. El análisis de datos
El primer análisis de una rejilla pasa lógicamente por un análisis cualitativo de los
contenidos de los constructos. Aspectos tales como la diversidad de los constructos,
su recurrencia temática, su complejidad o simpleza pueden ser formas de análisis,
ue podrían ser sistematizadas utilizando modelos de codificación como el ya citado
de Landfield (1971), u otros sistemas (Neimeyer, 1989).
Por otro lado, si se le ha pedido que señale el grado de centralidad o importancia
de cada constructo, podemos tener información sobre su sistema jerarquizado de
análisis, así como identificar las situaciones o los hechos más amenazantes (aquellos
que cuestionan a los constructos más centrales), o menos amenazantes (los que cues-
tionan a los constructos más accesorios). Además, si el sistema para completar la re-
CUADRO 20.2. Ejemplo ficticio (parcial) de una rejilla ordenada por rangos, según los ele-
mentos y constructos de Bieri y cols. (1966)
CONSTRUCTOS
Interesante Independiente ... Tranquilo
ELEMENTOS
1. Túmismo
2. Persona que te
disgusta
3. Madre
4. Persona a la que te
gustaría ayudar
5. Padre
6. Amigo del mismo

sexo
7. Amigo de distinto
sexo
8. Persona ... te sientes

más incómodo
9. Eljefe
10. Persona ... te cuesta

comprender.
jilla ha sido el de ordenación por rangos, obtendríamos perfiles de los elementos ele-
gidos.
Claro está que un análisis cualitativo tiene tanto de valioso como de cuestiona-
ble, por lo que el análisis se debe orientar hacia su cuantificación, aunque, como es
obvio, ambos acercamientos no son excluyentes. Existen varios paquetes estadísti-
cos que analizan los datos de una rejilla (por ejemplo, el Circumgrids de Chambers y
Grice, 1986), facilitando la tarea de evaluación, así como permitir realizar análisis
más complejos.
El análisis cuantitativo más sencillo consiste en calcular porcentajes. Como se re-
cordará, la persona evaluada debía indicar cuál era para ella el polo positivo y el polo
negativo de cada constructo. Una vez completada la rejilla (teniendo en cuenta que
hemos balanceado la posición de los polos positivos y negativos) podemos contar el
número de casillas con valoraciones positivas frente a las negativas y hallar el por-
473
centaje sobre el total de casillas (que si se utiliza una rejilla de 10 x 10, lógicamente
el
cálculo es directo). Con ello tenemos un índice muy genérico de cómo
construye,
que se puede especificar más si se realiza para cada elemento. Esto es realmente va-
lioso cuando existen problemas (conflictos) y dentro de ésos está la propia persona
evaluada y personas significativas (como debe ser, por otro lado).
- Otro indicador cuantitativo sencillo podría denominarse significatividad [mea-
ningfulness]. La significatividad se obtiene analizando las puntuaciones extremas, vi-
niendo a ser una versión cuantitativa de la ordenación que el propio evaluado puede
hacer de los constructos, según la importancia o centralidad. A grandes rasgos, con-
siste en elanálisis de las puntuaciones extremas, entendiendo que una persona utiliza
puntuaciones extremas para calificar un elemento en la medida en que considera el
constructo como significativo, mientras que los constructos donde aparecen pun-
tuaciones intermedias son menos relevantes para su análisis de los elementos. La sig-
nificatividad se expresa en valores absolutos y puede ir desde O (no significatividad)
hasta N (total significación), donde N es la puntuación máxima del sumatorio de
cada constructo por los valores absolutos de su calificación. En una rejilla de 10 x 10
y una escala de (3) a (+3) el valor máximo sería 30 (3 x 10). Existen datos que avalan
este indicador y que pueden ser consultados en las monografías de referencia ya ci-
tadas.
Otro indicador, también sencillo, es el denominado complejidad cognitiva de
Bieri, entendida como la cantidad de constructos diferentes utilizados en la evalua-
ción de un número determinado de elementos. La complejidad cognitiva de un indi-
viuo es mayor cuanto más constructos utiliza, o, más específicamente, cuantas más
puntuaciones distintas sea capaz de generar frente a un número de elementos. Una
forma de cuantificarlo consiste en contar el número de calificaciones idénticas hechas
sobre un mismo elemento. Las puntuaciones posibles son una función de la cantidad
de constructos y de la escala utilizada para calificar. Si de nuevo tomáramos el ejem-
plo de la rejilla de 10 x 10 y una escala de 7 puntos, sabemos que hay que calificar
cada elemento en diez constructos según una escala de 7 puntos. Ello hace que exis-
tan, obligatoriamente, tres coincidencias en la calificación, con lo que la puntuación
mínima por elemento sería 3, lo que hace una puntuación mínima de 30 para el total
de los 10 elementos. Por otro lado, la puntuación máxima por elemento sería de 10
(calificar en el mismo nivel a los 10 constructos), lo que hace una puntuación máxi-
ma total de 100. A medida que las puntuaciones son más elevadas, menor es la com-
plejidad cognitiva del individuo, ya que ello representaría su incapacidad para discri-
minar un elemento en unas dimensiones representadas por los constructos. Una
forma más elaborada de evaluar la similitud-diversidad de las respuestas ha sido di-
señada por Landfield y Cannell (1988) a través del programa de Construcciones fun-
cionalmente independientes (FIC, Functionally independent constructions). Este pro-
rama analiza agrupaciones (clusters) de patrones de calificaciones, lo que hace
posible el análisis de equivalencia funcional de los constructos, en la medida en que
se observen patrones de respuestas similares entre diferentes clusters. lo
En el caso de la ordenación por rangos, se pueden determin ar los coeficien tes de
correlación por rangos, lo que permite agrupar construc tos funciona lmente equiva-
lentes para clasificar distintos elementos. Una forma más compleja consiste en deter-
la matriz de co-
minar el “índice de intensidad”. Para ello se obtiene la totalidad de
relaciones, se eleva al cuadrado cada una de ellas y se multiplican por 100. El índice
de intensidad se obtiene sumándolas todas, como una medida de varianza común ex-
plicada. A medida que los índices son más elevados (sistema integrado) la ordena-
ción de los constructos se hace más predictiva, mientras que los índices bajos (siste-
ma diferenciado) son indicadores de una gran dispersión, disminuyendo la
capacidad predictiva. De alguna forma los índices elevados permiten predecir la or-
denación de unos constructos, conociendo cómo han sido ordenados otros; sin em-
bargo, ese conocimiento no permite hacer predicciones cuando los índices son bajos
(lo que significa que los índices de correlación han sido bajos). Nuevamente, con es-
tos datos se pueden obtener agrupaciones de constructos que nos proporcionan una
suerte de componentes principales en su ordenación.
Evidentemente, son muchos más los análisis que se pueden hacer. Serán las nece-
sidades de evaluación clínica o experimentales las que orientarán el tipo de análisis a
realizar. Por lo demás, el lector tiene a disposición las referencias para profundizar
en este cometido.
1v3. Análisis de la técnica de rejilla

Posiblemente sea la técnica de rejilla la que más se ajuste a las características defini-
cionales que aquí hemos establecido para las técnicas subjetivas. Es la técnica 1psativa
por excelencia, ya que hay que elaborar una rejilla para cada persona. Ello supone
una obvia ventaja porque la prueba es aplicable en su totalidad a la persona evaluada.
Sin embargo, también supone inconvenientes.
El carácter idiosincrásico del procedimiento no está exento de críticas con res-
pecto a esa total libertad en cómo se generan los constructos. Axiomas como el que
todos poseemos un número limitado de constructos y que éstos son bipolares cues-
tionan la total libertad, al margen de lo sensato de tales presupuestos. Esto conlleva
uno de los inconvenientes que más se cita (y que es general en todas las técnicas sub-
jetivas), como es el de la validez de contenido de los constructos-elementos. Por un
lado, se cuestiona si son sólo ésos (los diez, veinte o treinta) o si pueden ser más; por
otro, se cuestiona la estabilidad de dichos constructos.
Con respecto al primer punto, la representatividad, parece que sólo un grupo de
los constructos de cada rejilla permite realmente diferenciar entre varios elementos,
al tiempo que los procedimientos jerárquicos han mostrado la subordinación de unos
constructos en otros de categorías más amplias (Landfield y Cannell, 1988; Neime-
yer, 1989). Por otro lado, se ha encontrado una persistente constancia en la diferen-
ciación entre la calificación de “sí mismo” y de “otros”, que se sitúa en un 37% de
diferenciación, cualquiera que sea el “otro” (Adams-Webber y Davidson, 1979).
El segundo punto, la estabilidad, suele ser contestado aduciendo la constancia de
las rejillas a través del tiempo (se sitúa alrededor del 70% la coincidencia de los cons-
tructos, obtenidos en dos tiempos distintos), así como a la discriminación que un in-
dividuo hace entre el recuerdo de sus constructos y los constructos enunciados por
otros (Neimeyer, 1989).
Lógicamente, tanto la ordenación jerárquica como la estabilidad son buenos ar-
gumentos para defender la existencia de un número limitado de constructos y su re-
475
presentatividad. Sin embargo, por el mismo procedimiento podríamos terminar di-

ciendo que existe un constructo supraordinado (positivo frente a negativo, por
ejemplo), con lo que empezaríamos a hablar en un lenguaje nomotético (otros po-
drían argumentar que la categoría sería la de introversión-extroversión), en lugar de
uno ideográfico, pudiendo perder sus señas de identidad. Y lo que es peor, dejar de
ser una alternativa plausible en el mundo clínico al análisis estático intersujeto. Por
ello, análisis de validez convergente permitirían situar los constructos personales, sin
que suponga el establecimiento de los datos nomotéticos como criterio, sino como
información complementaria significativa.
“Sin embargo, a pesar de lo dicho anteriormente, la constante generación de hipó-
tesis que esta técnica tiene como una de sus virtudes, la hacen continuar siendo una
de las más prometedoras tanto en el mundo clínico como el experimental e, incluso,
laboral.
V. EL DIFERENCIAL SEMÁNTICO
El diferencial semántico es una técnica de evaluación elaborada por Osgood y sus

colaboradores (Osgood, 1952; Osgood, Suci y Tannenbaum, 1957; Snider y Os-
good, 1959) en un intento de evaluar cuantitativa y sistemáticamente la significación
semántica que posee un determinado concepto para una persona (o grupo de perso-
nas). Su aplicación es muy amplia y variada, existiendo múltiple bibliografía (Anas-
tasi en 1988 estima en 1 500 las referencias acerca del diferencial semántico).
Partiendo de que la conducta de una persona en una situación depende en gran
medida de lo que esa situación represente o signifique para ella, Osgood conceptua-
liza el significado como un proceso de mediación representacional, dividiendo el pa-
radigma E > R en dos etapas; a la primera la denominan descodificación, y consiste
en la asociación de signos con los mediadores representacionales, y la segunda (que
denomina codificación) consiste en la asociación entre la autoestimulación mediado-
ra y las respuestas instrumentales manifiestas, pudiendo servir el diferencial semánti-
co como índice de los procesos representacionales de la conducta lingúística. Por ello,
se intenta elaborar una medida del “significado psicológico”, considerada como un
proceso o estado de la conducta de los organismos que utilizan signos, siendo una
consecuencia de la recepción de un signo (el estímulo) y un antecedente necesario
para la producción de la respuesta. Respecto a los determinantes de la naturaleza de
los procesos representacionales (y por tanto, del significado psicológico), se consi-
dera que es la consistencia entre situaciones y conductas en la experiencia humana,
incluyendo también la experiencia de ver y oír series de mensajes. Los significados
de diferentes individuos hacia los mismos signos serán distintos en la medida en que
varíen sus conductas hacia las cosas significadas, reflejando además los significados
de muchos signos la idiosincrasia de la experiencia individual. DES
Partiendo de que la función básica del lenguaje es la comunicación del significado,
es decir, la «expresión de ideas», Osgood considera la codificación lingúística como
índice del significado, afirmando que la selección entre pares sucesivos de opuestos
verbales comunes permitirá aislar gradualmente el “significado” del signo-estímulo.
Para aumentar la sensibilidad del instrumento de medida, se incluye entre cada par de
términos una escala de siete puntos que permita que el examinado pueda indicar la in-
tensidad de cada juicio. Por tanto, el diferencial semántico es una combinación de aso-
ciaciones controladas y procedimientos de escala (Osgood y cols., 1957) y consiste en
presentar al sujeto un determinado concepto y un conjunto de escalas de adjetivos bi-
polares, debiendo indicar la dirección y la intensidad de su asociación en una escala de
siete puntos. Uno de los aspectos claves del método es la selección de la muestra de
los términos polares descriptivos, que debería ser lo más representativa de todas las
formas posibles en que los juicios de significación puedan variar (pero manteniendo
una magnitud adecuada) e insensible a otras fuentes de variación.
Osgood y sus colaboradores postulan la existencia de un espacio semántico mul-
tidimensional y suponen que cada escala semántica (definida por un par de adjetivos
de significado opuesto) representa una función lineal directa que pasa por el origen
de este espacio, estando mejor definido el espacio semántico cuanto más amplia y re-
presentativa sea la muestra de escalas. Los juicios realizados de un determinado con-
cepto podrán ser operacionalizados mediante su localización como un punto en este
espacio semántico, que además permitirá la reproducción de los juicios originales
mediante su proyección ortogonal sobre una línea que pasa por el origen del espacio.
La diferencia en el significado de dos conceptos será una función de las diferencias
entre sus localizaciones respectivas dentro del mismo espacio.
Respecto a la dimensionalidad del espacio semántico, realizaron varios análisis
factoriales que les permitieron concluir:
a. Quelos significados varían multidimensionalmente.

b. La existencia de tres factores estables, que parecen ser independientes del
tipo de conceptos evaluados, muestras y cultura de los sujetos de estudio (Osgood y
cols., 1957; Osgood, 1964): un factor evaluativo, en el que alcanzan saturaciones al-
tas escalas como bueno-malo, bondadoso-cruel o sucio-limpio y que explican la ma-
yor parte de la varianza extraída; un factor de potencia, en el que saturan de forma
elevada escalas como fuerte-débil, grande-pequeño o pesado-ligero y que explica
aproximadamente la mitad de varianza en relación al primer factor; y un factor de ac-
tividad, en el que saturan escalas como activo-pasivo, rápido-lento y agudo-obtuso
y cuya varianza explicada es similar o ligeramente inferior a la del factor de potencia.
c. Modificabilidad del espacio semántico en función de los tipos de conceptos
que se juzgan, pudiendo variar la importancia relativa de los factores y sus relacio-
nes.
d. Los tres grandes factores de evaluación, potencia y actividad (EPA) no ago-
tan los modos en que pueden variar los significados, apareciendo en los diferentes
estudios una estimable proporción de varianza total sin explicar y un número varia-
ble de dimensiones que indica la multidimensionalidad del espacio semántico.
v.1. Construcción y administración de un diferencial semántico

Como ya se ha indicado para las otras técnicas, el diferencial semántico es un proce-
dimiento general de medida, que debe de adaptarse a las exigencias del problema al
Técnicas subjetivas 477
que se aplica, no existiendo conceptosni escalas típicas, sino que los conceptos y las
escalas utilizadas dependerán de los propósitos del investigador. Si bien es posible
realizar formas particulares de diferencial semántico con conceptos y escalas norma-
lizadas para algunas áreas de medida como la psicoterapia o las actitudes, no existe
ningún “test” del diferencial semántico, sino que su normalización y su comparabi-
lidad se basan en la colocación de los conceptos en un espacio semántico común, de-
finido por un conjunto de factores generales comunes, pese a la variabilidad de los
conceptos y escalas particulares utilizadas (Osgood y cols., 1957).
El contenido de un diferencial semántico consta del estímulo que provocará en el
sujeto la respuesta terminal (al que los autores de la técnica denominan concepto) y
las escalas de medida.
Los conceptos variarán ampliamente dependiendo de los intereses del investiga-
dor, pudiendo ser estímulos lingúísticos (hablados o —con mayor frecuencia— es-
critos) tales como verbos, sustantivos, adjetivos..., frases (por ejemplo «mi yo ideal»)
o de otro tipo, tal como láminas de tests como el TAT o el Rorschach, cuadros o es-
culturas. Dado que las limitaciones de tiempo y sujetos no permiten cubrir comple-
tamente los conceptos relevantes de una determinada área, deberá realizarse un
muestreo, debiendo ser los objetos del juicio representativos del área de interés y re-
levantes teóricamente. Además, la selección de conceptos deberá realizarse teniendo
en cuenta que se esperen diferencias individuales considerables, que tengan un signi-
ficado unitario para el individuo (es decir, que no varíe en lo que está juzgando) y
que los conceptos sean familiares para todos los sujetos del caso.
Respecto a la selección de escalas, aunque deberá realizarse en función de los pro-
pósitos de la evaluación, Osgood y sus colaboradores recomiendan utilizar una pe-
queña muestra de escalas muy relacionadas con cada uno de los factores del espacio
semántico (típicamente EPA, aunque también podrán incluirse otras si se considera
adecuado), sin olvidar la relevancia de las escalas para los conceptos que se juzgan.
Además, señalan otro criterio más difícil de cumplir y para el que no existen aún da-
tos adecuados: las escalas deben ser lineales, estar ancladas en polos opuestos y pasar a
través del origen, suponiendo sus autores que las escalas definidas por opuestos fami-
liares y comunes cumplen estas propiedades. En cuanto al número de escalas a utili-
zar, Anastasi (1988) afirma que suelen utilizarse un mínimo de 15 para cada concepto.
El emparejamiento de un determinado concepto y una escala lo denominan
ítem, siendo el número de ítems de un determinado diferencial semántico igual al
número de escalas por el número de conceptos. Respecto al tiempo de aplicación,
sugieren que se deben dar de 10 a 15 minutos para una prueba de 100 ítems, si bien el
tiempo varía en función de los sujetos, conceptos y escalas utilizadas.
Hay varias formas de diferencial, utilizándose mayoritariamente dos formas grá-
ficas, que parecen no ofrecer resultados significativamente distintos. En la primera,
se sitúa el concepto escrito en mayúscula en la misma línea de la escala según la que
se va a juzgar, combinando los conceptos y las escalas tal como se ve en el siguiente
ejemplo:
YO MISMO justo z : a : g : injusto

PADRE fuerte z ; A E , ; débil
SEXO bueno malo, etc.
La ventaja de esta forma es que, al cambiar constantemente de concepto a con-

cepto, el sujeto no puede comparar fácilmente los juicios en las diferentes escalas,
minimizando la posibilidad del efecto de “halo”, pero puede suceder que elsignifi-
cado del concepto que está juzgando pueda cambiar en las diferentes ocasiones en
que lo juzga.
En la otra forma se utiliza una hoja para cada uno de los conceptos, que son sl-
tuados en la parte superior, colocando todas las escalas seguidas y provocando los
juicios de forma secuencial. Esta forma es la más usada y tiene una serie de ventajas
como la facilidad en la elaboración y puntuación, manteniéndose más constante el
significado de lo que se juzga. Un ejemplo de este tipo de escala es el siguiente:
YO MISMO
justo injusto
fuerte 3 Ñ ; : E : débil
bueno ; 3 : : a : malo
En cuanto a las instrucciones proporcionadas a las personas objeto de evaluación,

en primer lugar se les da una orientación general del tipo de tarea a realizar, indicán-
doles que se basen en las primeras impresiones, trabajen con bastante rapidez y que
realicen cada juicio de forma independiente, poniendo una cruz en aquella posición
que indique su juicio del concepto. Así, si consideran que está muy estrechamente
relacionado con un extremo de la escala deberían situarlo en el primer intervalo, si
bastante relacionado en el segundo, si débilmente relacionado en el tercero y si con-
sidera que el concepto es neutral o si la escala es completamente irrelevante para ese
concepto, deberán colocar la cruz en la mitad de la escala. Ambos lados están igual-
mente asociados tal como se muestra de forma secuencial en el siguiente ejemplo:
YO MISMO
justo DE E a E E : injusto
fuerte : : E E IO débil
bueno E A OE: : y : malo
Activo : a iS z 4 Pasivo
v2. Análisis de los datos
A cada una de las siete posiciones sobre las escalas se les asigna un dígito de forma arbi-
traria, pudiendo ser 1, 2, 3, 4, 5, 6 y 7 ó bien +3, +2, +1, 0,1, 2 y 3, siendo el centro
del espacio semántico el O ó el 4 en la primera forma de puntuación, que corresponde a
la posición neutral sobre las escalas. Las escalas asociadas a las categorías factoriales de
evaluación, potencia, actividad u otras que se hayan considerado relevantes deberán
sumarse y promediarse, obteniéndose puntuaciones de los factores para cada concepto
Juzgado por cada sujeto. Si estamos interesados más que en personas en grupos, se
promediarán los datos de los sujetos, utilizando la media o la mediana como represen-
tativa del grupo y alguna medida de dispersión o variabilidad como índice de la consis-
tencia del significado de ese concepto en el grupo citado. De este modo, se obtienen las
puntuaciones en el factor, como puede observarse en el ejemplo siguiente, que corres-

ponde a la clasificación de cinco conceptos por una sola persona.
CONCEPTOS: Evaluación Potencia Actividad
Héroe 8 3 3
Destino 1 0 —2
Sueño 2 0 2
Vida S E) 3
Fracaso 3 2 —2
También puede efectuarse un análisis descriptivo mediante la realización de un

perfil de puntuaciones, que permite un análisis visual rápido y fácil, tal y como se
muestra en la figura 0.2, pudiéndose realizar diferentes comparaciones de los perfi-
les, como la comparación de distintos conceptos según sus posiciones sobre los fac-
tores y/o escalas en un momento determinado, comparar los juicios de diferentes
sujetos para un mismo concepto o comparaciones de los conceptos en dos momen-
tos diferentes, por ejemplo, antes y después de un tratamiento determinado.
FIGURA 20.2. Perfiles correspondientes a los juicios de tres conceptos, A (amor), B (destino) y
C (sueño), evaluados sobre cinco escalas
Activo ; : z ; ; o Pasivo
Relajado
480 Wenceslao Peñate y Pilar Matucl
También se puede representar espacialmente el significado de un concepto para

un individuo o un grupo, mediante la representación del punto del espacio semánti-
co delimitado por sus coordenadas sobre los diversos factores, pudiendo observar
de forma simultánea la semejanza entre varios conceptos sobre todos los factores.
Con este tipo de representación podríamos, por ejemplo, observar la consistencia
del significado para un grupo determinado por medio de la dispersión de los puntos
de cada uno de los individuos alrededor de su tendencia central.
Además, también pueden realizarse análisis cuantitativos de las diferencias y se-
mejanzas en el significado. Dadas las características de espacio semántico postulado,
algunas medidas clásicas de relación entre variables tal como la correlación produc-
to-momento son inadecuadas, pudiendo distorsionar gravemente la información.
Para la expresión de la semejanza semántica precisan medidas de relación que tengan
en cuenta tanto la covariación del perfil como las discrepancias entre las medias de
los perfiles, afirmando Osgood y cols. que tal medida la proporciona la fórmula de la
distancia generalizada de la geometría sólida:
D;= 2d,
donde D, es la distancia lineal entre los puntos del espacio semántico que representa
los conceptos i y j y d, es la diferencia algebraica entre las coordenadas 2 y ¡ sobre la
misma dimensión, sumándose posteriormente las k dimensiones. Así, en el ejemplo
anterior, la D entre héroe y destino se hallaría calculando la diferencia entre las pun-
tuaciones de los dos conceptos en cada uno de los factores, elevando al cuadrado esta
diferencia (3 — 1) + (3 — 0) + (3 — 2)?, sumando estos cuadrados y calculando la raíz
cuadrada de esta suma, siendo en este ejemplo 7,07 la distancia encontrada.
Además de servir para indicar la distancia (y la semejanza) entre conceptos juz-
gados por un individuo o grupo, también sirve para comparar dos personas, dos
grupos de individuos o los juicios realizados en dos momentos distintos, así como
para determinar la distancia entre pares de individuos o escalas, tratando los concep-
tos como un conjunto de variables y permitiéndonos —por ejemplo— encontrar
agrupaciones de individuos que tienen juicios semejantes de esos conceptos. Otras
aplicaciones de D incluyen el análisis simultáneo de todos los pares de conceptos (o
de personas), que permite el encontrar una matriz de (m) x (m) distancias entre to-
dos los conceptos enjuiciados (siendo m el número de conceptos), que a su vez —si
los juicios de la persona no son superiores a tres factores— podrá ser representado
espacialmente, obteniéndose un modelo de su estructura conceptual, en el que las
agrupaciones de conceptos, sus distancias relativas y su ordenación pueden visuali-
zarse de forma directa y simultánea. Además, Osgood y sus colaboradores también
ofrecen otras posibilidades de análisis y de relaciones de D con otros estadísticos,
que pueden ser consultados en el manual de 1957 citado.
v3. Aplicaciones del diferencial semántico

Como ya comentábamos, son múltiples las aplicaciones del diferencial semántico,
habiéndose utilizado entre 1952 y 1976 con mayor frecuencia en las siguientes áreas
481
(Finstuen, 1977): en personalidad y psicología social, para el estudio de cuestiones

tales como estereotipos, roles, actitudes, autoconcepto, consistencia cognitiva, per-
cepción de personas, formación de impresiones, cambio de actitudes o congruencia.
En psicología clínica: en psicoterapia, en estudios de personalidad múltiple, en psi-
copatología y en relación con otras técnicas de evaluación tal como el Rorschach, el
MMPI O la Escala de preferencia personal de Edwards. En estudios relacionados con
la medida y la psicometría, en estudios analítico-factoriales, estudios de contenido,
técnicas de escalamiento, fiabilidad, validez, y distancias geométricas y espaciales.
En estudios lingúísticos y transculturales, en el área educativa (en educación espe-
cial, inteligencia, lenguaje, etc.). En psicofisiología (en relación con la medida de la
tasa cardíaca, respuesta psicogalvánica, aprendizaje y memoria, por ejemplo). En
psicología laboral (en la satisfacción laboral, percepción del trabajo, relaciones labo-
rales...) y en otras tales como el arte o la política. Además, recientemente también se
ha aplicado en otras áreas, como por ejemplo en la percepción de sucesos vitales
(Fish, 1986), percepción del estado de salud (Gardner y Gibson, 1989) y evaluación
de psicoterapia (Bovet, Spagnoli y Gillieron, 1991).
Además, los conceptos pueden referirse a múltiples cuestiones, pudiendo califi-
carse una persona a sí misma o a otras (por ejemplo, amigos, familiares, figuras pú-
blicas...), a diferentes profesionales, a miembros de otras culturas o etnias, a activida-
des, a ideas abstractas, a productos comerciales, programas de radio o televisión y a
la percepción de ambientes.
También se han utilizado versiones no verbales, en las que las escalas de adjetivos
bipolares se sustituyen por estímulos gráficos (Bentler y Lavoie, 1972; French,
1977), permitiendo la evaluación de poblaciones tales como niños, miembros de cul-
turas no occidentalizadas, o personas con daño cerebral en las áreas del lenguaje.
va. Análisis del diferencial semántico

Aunque el diferencial semántico es una técnica relativamente fácil de construir y uti-
lizar, presentando una gran flexibilidad en su aplicación, no está exenta de críticas,
permaneciendo aún varias cuestiones sin una respuesta adecuada.
Muchas de las críticas se centran en sus asunciones psicométricas, tales como el
origen común de las escalas, la naturaleza bipolar del espacio semántico o las interac-
ciones de la escala con el tipo de concepto utilizado o con las personas evaluadas
(Crockett y Nidorf, 1967; Everett, 1973), así como la estabilidad y consistencia de
los factores EPA, que parecen no ser independientes de la población, mi de los con-
ceptos y tipo de análisis utilizado (Piotrowska, 1983; Piotrowski y Dunham, 1984).
En cuanto a otras características psicométricas de la técnica, Osgood y sus cola-
boradores afirman la objetividad del diferencial semántico, ya que sus procedimien-
tos de medida son explícitos y pueden ser repetidos: dos investigadores podrán ob-
tener las mismas estructuras conceptuales a partir de los mismos protocolos de
respuesta, si bien reconocen que la interpretación de estos resultados es un hecho
subjetivo. Respecto a su fiabilidad, existe una amplia disparidad de resultados, debi-
do principalmente a su flexibilidad, que hace que cualquier dato presentado dependa
en gran medida del estudio revisado, así como del tipo de índice utilizado.
VL ELLISTADO DE ADJETIVOS
Esta técnica de evaluación surgió dentro del área de estudio de la personalidad, ha-
biéndose utilizado ya en los años treinta en los estudios de Hartshorne y May para la
calificación por los profesores de la conducta de los niños, siendo posteriormente
utilizada por otros autores como Allport y Odbert (1936) o Cattell (1943), existien-
do actualmente múltiple bibliografía y aproximaciones un tanto distintas. Ejemplo
de ello es el recuento de aproximadamente 50 listados diferentes citados por Master-
son en una revisión de la técnica realizada en 1975.
Como en el caso de las otras técnicas subjetivas, los listados de adjetivos más que
una prueba concreta es un procedimiento general de evaluación, consistiendo bási-
camente en la presentación de un listado de adjetivos que sean capaces de describir la
conducta o conductas que se pretende evaluar, conductas que a su vez pueden ser ca-
lificadas en términos generales, o referirse a situaciones específicas. Además, este lis-
tado puede ser cumplimentado por la misma persona evaluada o bien por un obser-
vador externo.
Aunque sintetizar en unas pocas páginas una técnica tan prolífica no es tarea fá-
cil, presentaremos algunas características generales de la técnica, describiendo poste-
riormente de forma breve aquellos listados que aparecen con mayor frecuencia en la
bibliografía.
vL1. Características generales

Como afirman sus promotores, el listado de adjetivos permite obtener gran cantidad
de información, siendo relativamente fácil su administración y puntuación, apare-
ciendo ante la persona que lo cumplimenta como significativa y poco amenazante, y
puede ser aplicada a múltiples situaciones, personas y contextos. Pero los diferentes
listados de adjetivos existentes varían ampliamente en su forma de construcción, ad-
ministración, longitud y características psicométricas; algunos están estandarizados,
presentando amplia información acerca de su finalidad, diseño, forma de adminis-
tración y corrección, fiabilidad, validez y normas de tipificación, mientras que en
otras no se da apenas información de ninguna de estas características.
Respecto al procedimiento de cumplimentación y puntuación, aunque el modo
típico consiste en que el sujeto responda ante una lista de adjetivos colocando o no
una señal en cada uno de ellos, existen diferentes formatos. Así, en algunos se pide a
la persona evaluada que señale un número determinado de adjetivos, en otros el for-
mato de respuesta es de verdadero o falso, mientras que en otros se le pide que escri-
ba “sí” o “no” en cada adjetivo según le sea o no aplicable, dejando en blanco los no
relevantes. Otros autores han desarrollado escalas de respuesta de varios puntos que
permiten graduar la presencia de la característica afirmada, mientras que otros lista-
dos están formados por adjetivos bipolares, debiendo la persona señalar un adjetivo
de cada par, aunque en ningún caso la bipolaridad y el escalamiento son característi-
cas definicionales. Además, en algunos casos los mismos listados de adjetivos se han
utilizado con diferentes instrucciones de cumplimentación, y el procedimiento de
485
O.
puntuación también varía en buena medida en los diferentes listados, lo que invita a
una reflexión acerca de la equivalencia de las puntuaciones obtenidas. En cuanto al
tiempo de aplicación suele ser muy breve, no soliendo durar más de 15 minutos.
En cuanto a la frabilidad de la técnica, los coeficientes de fiabilidad test-retest
obtenidos suelen ser moderados. Por ejemplo, Gough y Heilbrun (1965) encontra-
ron en un intervalo temporal de 6 meses índices que oscilaron entre 0,01 y 0,86 y una
media de 0,54, pero estos datos pueden ser interpretados tanto como una caracterís-
tica del método de medida como un índice de su sensibilidad al cambio. Por ello, al
juzgar los índices test-retest como una medida de la fiabilidad de la prueba, habrá
que tener en cuenta si ésta pretende la evaluación de características poco estables (en
cuyo caso se deberán obtener bajos coeficientes) o pretende evaluar rasgos estables
de personalidad, en cuyo caso los coeficientes deberán ser elevados. Respecto a la
consistencia interna, son varios los estudios que muestran inconsistencias en las res-
puestas de los evaluados, no señalando de forma coherente adjetivos que se presen-
tan de forma repetida y habiendo encontrado que en algunos casos los sujetos seña-
lan antónimos (Parker, 1969). Estos problemas de consistencia han llevado a
cuestionarse una asunción básica de la escala: que cada adjetivo-estímulo tiene un
significado común, existiendo la posibilidad de connotaciones distintas tanto en
función de la interpretación idiosincrásica como del contexto donde se desarrolle la
interpretación (Parker, 1969; Parker y Veldman, 1969), de variables situacionales
(buen ejemplo de ello es el estudio de Jacobs, Capek y Meehan en 1959, que encon-
traron correlación entre el número de adjetivos señalados y la exposición a diferen-
tes situaciones experimentales) e incluso de la estructura concreta de una determina-
da lista de adjetivos, cuestiones que aún no han sido convenientemente analizadas.
Respecto a la validez, difiere en gran medida en función del listado de adjetivos
analizado, si bien parece existir cierta evidencia acerca de menor capacidad discrimi-
nante que otras medidas de personalidad (Masterson, 1975).
vL2. Aplicaciones más usuales

Son múltiples las listas de adjetivos diseñadas para la evaluación de lapersonalidad.
Algunas lo han sido para evaluar la personalidad total, como por ejemplolaACL
(Adjetive check list, de Gough y Heilbrun, 1965, 1983), mientras que la finalidad de
la construcción de otras ha sido la validación empírica de determinados modelos,
como, por ejemplo, el Personality adjective check list (PACL) desarrollado por Strack
(1987) para la evaluación de los tipos de personalidad de Millon o el Leary interper-
sonal check list, diseñado por LaForge y Suczek (1955) para evaluar la conducta in-
terpersonal según la teoría de Leary. £
La meta de otras listas es la cuantificación de dimension es específicas como, por
ejemplo, el MAACL de Zuckerman y Lubin (1965) para evaluar los estados afectivos,
el AD-ACL de Thayer (1967, 1986) que pretende evaluar el estado de activación, el
n-
Motivational adjective check list (MACL) de Sciortino (1968) sobre motivació
la-
incentivo. También hay escalas diseñadas para evaluar lapersonalidad en el área
adjective check list (AVA) de Clarke (1956), y
boral, como el Activity vector analysis
evaluación de niños, como por ejemplo Lipsitt (1958)
también se han utilizado en la
para la evaluación del autoconcepto. Además de ser una técnica utilizada para la eva-
luación del autoconcepto de una persona determinada, las listas de adjetivos también
han sido empleadas para la evaluación del autoconcepto de grupos de personas,
como por ejemplo personas alcohólicas (Vanderpool, 1969), y de las percepciones
que tienen unas personas de otras, como por ejemplo, los padres de sus hijos, los
clientes de sus terapeutas o los empleados de sus jefes.
Dada la facilidad de aplicación de la técnica, ha sido muy utilizada para la com-
paración de medidas, tanto entre diferentes conceptos como del mismo concepto a
lo largo del tiempo, en diferentes situaciones o de las percepciones de distintas per-
sonas (por ejemplo, es posible comparar la percepción de uno mismo y cómo lo per-
cibe su jefe) y para evaluar los efectos de diferentes intervenciones, permitiendo la
evaluación a lo largo de todo el proceso terapéutico, ya que el listado de adjetivos pa-
rece ser particularmente útil en la evaluación del cambio (Masterson, 1975), aunque
también se ha cuestionado su sensibilidad al cambio cuando el formato de respuesta
únicamente es de presencia-ausencia, pudiendo darse cambios en la gradación de la
característica que no podría recoger este tipo de formato.
Otras aplicaciones incluyen la medida de las conceptualizaciones que una perso-
na tiene acerca de objetos inanimados, percepciones de ciudades, estereotipos ocu-
pacionales, personajes históricos o percepción de roles.
vL3. Listas de adjetivos más consolidadas

Uno de los listados de adjetivos utilizados con mayor frecuencia es la Lista de Adje-
tivos (ACL). Aunque fue construida para su utilización en un programa de investiga-
ción del Instituto de Evaluación e Investigación de la Personalidad por Gough y
Heilbrun (1965, 1983), fue posteriomente comercializada, existiendo asimismo una
versión española.
Consta de 300 adjetivos que se utilizan habitualmente para describir a las perso-
nas (por ejemplo, activo, poderoso, tonto), ordenados alfabéticamente, siendo la ta-
rea del sujeto señalar todos aquellos que considera descriptivos de sí mismo, aunque
también ha sido utilizada para la calificación por parte de otras personas y en el estu-
dio de personajes célebres (Welsh, 1975), e incluso para describir objetos inani-
mados.
En la versión actual consta de 37 escalas, de las que cuatro (denominadas modus
operandi en el manual de la prueba) se refieren a características de respuesta tales
como el número de adjetivos señalado, el número de éstos que son favorables, el nú-
mero de desfavorables y una puntuación de comunalidad basada en la frecuencia de
elección de los adjetivos. Quince de las escalas fueron derivadas de forma racional
generando adjetivos para la evaluación de cada una de las 15 necesidades propuestas
por Murray, tales como logro, dominancia, afiliación, orden o autonomía, mientras
que nueve escalas fueron derivadas de forma empírica según su capacidad de evaluar
varios rasgos que se consideraron como relevantes en la conducta interpersonal, ta-
les como autocontrol, autoconfianza o ajuste personal. Las nueve escalas restantes se
diseñaron a partir de teorías específicas de personalidad, diseñándose cinco escalas
para evaluar la teoría de personalidad y psicopatología propuesta por Berne y las
cuatro escalas restantes se construyeron mediante la selección empírica de ítems que

se ajustaban a los criterios de la teoría de la inteligencia y creatividad de Welsh.
Todas las escalas han sido validadas empíricamente, constando en el manual de la
prueba las características de las personas que puntúan alto y bajo en cada escala. Las
puntuaciones directas en el ACZ se convierten en puntuaciones típicas mediante una
serie de tablas para controlar el efecto del número de adjetivos señalados.
El Listado múltiple de adjetivos depresivos (MAACL) (Zuckerman y Lubin, 1965)
es otro de los listados de adjetivos utilizados con mayor frecuencia, citando Lubin y
Zuckerman, en 1982, 637 estudios en los que se utilizaba esta técnica o su preceden-
te, el Listado de adjetivos depresivos (AACL, Zuckerman, 1960) (Zuckerman, Lubin
y Rinck, 1983).
Consta de 132 adjetivos que evalúan la ansiedad, depresión y hostilidad, exis-
tiendo dos formas: una que evalúa los rasgos, en la que se le pide al sujeto que señale
aquellas palabras que describan cómo se siente generalmente, y otra para la evalua-
ción de los estados, en la que se le pide al sujeto que señale las palabras que describen
cómo se siente “ahora-hoy”. Las tres escalas fueron derivadas empíricamente, no
eran independientes y sí bipolares, siendo el afecto positivo el polo opuesto de la es-
cala que evaluaba el afecto negativo. Posteriormente, Zuckerman y cols. (1983) pre-
sentaron nuevas escalas obtenidas por medio del análisis factorial, proponiendo cin-
co escalas básicas: depresión, ansiedad, hostilidad, afecto positivo y búsqueda de
sensaciones y dos derivadas. Dado que las tres primeras escalas estaban moderada-
mente correlacionadas, proponen una puntuación derivada de su adición a la que de-
nominaron “disforia”, mientras que “afecto positivo” y “búsqueda de sensaciones”
también correlacionan, proponiendo asimismo una puntuación con la suma de am-
bas (que denominan PASS). Las puntuaciones en cada escala se convierten en puntua-
ciones estandarizadas que permiten controlar la aquiescencia de respuesta. Para más
información acerca de esta nueva versión de la escala, véase Zuckerman y cols.
(1983) y Hunsley (1990).
VIL. OTRAS TÉCNICAS SUBJETIVAS: DOCUMENTOS PERSONALES
Además de las citadas, son varias las técnicas de evaluación que pueden englobarse
dentro de la categoría de subjetivas, haciendo imposible poner límites. Técnicas
como las de Autocaracterización (Kelly, 1955), procedimientos como el de Frases in-
completas de Rotter, o los propios cuestionarios biográficos pueden ser incluidos en
un apartado sobre técnicas subjetivas. Sin embargo, existe un material de análisis psi-
cológico, posiblemente el más subjetivo de todos, que apenas ha sido tratado y al
que le vamos a dedicar sucintamente este espacio: el análisis de los documentos per-
sonales. :
Allport (1942, 1963) entiende por Documento personal todo escrito O manifesta-
ción verbal del propio individuo que nos proporcione (de forma intencionada O no)
información relativa a la estructura y dinámica de su vida, incluyendo las autobio-.
grafías, ya sean generales o limitadas a un aspecto de la vida, los diarios personales y
otras anotaciones, los cuestionarios libres, las manifestaciones verbales provenientes
de entrevistas y determinadas composiciones literarias, en las que se pueden incluir

las cartas. En general, diarios, cartas y autobiografías son los documentos personales
más al uso. Antes de analizar estos documentos hay que tener presentes las siguien-
tes consideraciones:
a. Cuál fue el motivo que llevó al autor a producir ese documento. Motivos
como la justificación de algo, aclaración, interés científico, por dinero, exhibicionis-
mo, búsqueda de la inmortalidad o “necesidad de comunicarse” son muy útiles a la
hora del análisis e interpretación de los datos.
b. A quién va dirigido el documento. Los diarios personales normalmente es-
tán escritos para uno mismo (o para un “lector imaginario”). Las cartas suelen tener
un destinatario restringido. En cambio, las biografías se escriben posiblemente pen-
sando en unos lectores más heterogéneos. En cualquier caso, dependiendo del desti-
natario, el autor tenderá a dar una versión u otra (análisis introspectivo, buena ima-
gen, darse a conocer en sus aficiones, etc.).
c. Lo mediato-inmediato del documento. Lógicamente no se pueden interpre-
tar y no pueden llevar a las mismas conclusiones documentos personales recientes
que documentos producidos hace bastante tiempo. Así como tampoco tienen una
misma interpretación un documento que se ha redactado día a día, que uno que se
basa en el recuerdo más o menos lejano de una serie de acontecimientos o de com-
portamientos.
En el análisis del contenido de este tipo de información personal es posible utili-

zar diferentes técnicas, entre las que pueden encontrarse algunas ya citadas como la
técnica de rejilla (Ferxas, 1990). Para ello se deben tratar los documentos personales
como si respondieran a preguntas específicas. Así, se pueden rellenar hipotéticas reji-
llas, contestar clasificaciones Q o localizarlos entre distintos adjetivos. En cualquier
caso, el análisis puede seguir los pasos de un análisis formal de contenidos (Kerlin-
ger, 1973).
Respecto a su utilidad, ésta es muy variada, facilitando, entre otros, el análisis en
investigaciones fenomenológicas, autoanálisis, diagnósticos históricos, exámenes
psiquiátricos, efectos de ciertas condiciones y/o enfermedades físicas, análisis de re-
laciones interpersonales, estudios de procesos de creación, etcétera.
Como era de esperar, el análisis de este tipo de material puede generar una serie
de problemas, entre los que nos encontraríamos los siguientes: carencia de objetivi-
dad y dificultad de contrastación, errores y deformaciones por los recuerdos, falta de
perspectiva en la evaluación de acontecimientos recientes, conceptualizaciones im-
plícitas y arbitrarias en el escrito, desconocimiento de los motivos, engaño y autoen-
gaño y falta de representatividad muestral, personal y de contenidos. Sin embargo,
razonablemente, hay que entenderla como una técnica complementaria, por lo que,
dada su utilidad, no debería soslayarse, siempre y cuando se disponga de un material
de este tipo.
487
VIH. LAS TÉCNICAS SUBJETIVAS Y LA EVALUACIÓN PSICOLÓGICA
Una vez repasadas algunas técnicas de las denominadas subjetivas, la pregunta es

cuál es su lugar en la evaluación psicológica, cuál es su utilidad. Lo que parece evi-
dente es que en general son técnicas que llevan mucho tiempo coexistiendo dentro
de la disciplina. La mayoría de ellas se gestó hace cuatro o cinco décadas, lo que viene
a indicar su utilidad, al menos en la psicología aplicada (aunque hay excepciones y
Justificaciones, el uso de una técnica es un indicador de su adecuación). Lo que sí ha
ocurrido es que estas técnicas han sido relegadas con el dominio de la teoría clásica
de los tests, con la oferta de pruebas objetivas rigurosamente validadas para la eva-
luación de variados cometidos. Con ello ofertaban dos características competitivas:
por un lado, la rigurosidad del procedimiento, que no siempre estaba claro en la uti-
lización de las técnicas subjetivas; y, por otro, el ahorro de tener que elaborar prue-
bas específicas para cada persona.
Sin embargo, el carácter nomotético de los tests psicológicos clásicos iba a entrar
en crisis con la aparición de la alternativa comportamental, que defendía los plantea-
mientos ipsativos, al margen de cuestionar la propia existencia de los rasgos evalua-
dos. La propuesta ideográfica N= 1 de los diseños conductuales era coincidente con
los planteamientos “subjetivos”. Sin embargo, ello no supuso una recuperación de
las técnicas subjetivas, más allá de su uso cotidiano. Posiblemente, la herencia feno-
menológica y la dificultad en esos momentos de separarlas de las técnicas proyecti-
vas, conjuntamente con un uso un tanto asilvestrado, tuvieron la responsabilidad
mayor en esa falta de recuperación.
Las técnicas subjetivas son susceptibles, como ha sido ampliadamente probado,
de aplicarles procedimientos científicos de validación, al tiempo que defienden los
diseños N'= 1 en la medida en que, pese a ser más laboriosas y costosas, la informa-
ción que se obtiene es de una alta relevancia psicológica.
Lo que no debe ser una pretensión de las técnicas subjetivas es agotar el campo
de la evaluación en psicología, ya que sus aplicaciones, aunque pueden llegar a los te-
mas más variados, tienen limitaciones conceptuales (no pueden agotar todo campo
evaluativo de un elemento determinado), y estructurales (utilícese la técnica que se
utilice, no consiguen completar una matriz multirrasgo-multimétodo). Sin embar-
go, hoy día representan una complementariedad diagnóstica, especialmente en el
área evaluativa donde se recoge la propia versión del cliente (conjuntamente con la
entrevista, naturalmente). ie
En este sentido de complementariedad es como se proponen las técnicas subjeti-
vas. Hay que enfatizar el rigor en su validación: las pruebas a que dé lugar la aplica-
ción de una técnica subjetiva deben someterse al rigor del análisis de su exactitud,
fiabilidad y validez. Ello redundará en que, conjuntamente con ese prestigio que tie-
nen en ciertos ambientes aplicados, sean reconocidas (algunas ya lo están) como ins-
trumentos de evaluación dentro del esquema general del análisis psicológico, sea*.'
cual sea la escuela o el modelo dominante.
Adams-Webber, ]. (1979). Personal construct theory: Concepts and applications. Nueva York.
Wiley. ,
a DO ]. y Davidson, D. (1979). Maximum contrast between self and others in per-
sonal judgment: A repertory grid study. British Journal of Psychology, 70, 517-518.
Allport, G. (1942). The use of personal documents in psychological science. Social Science
Research Council Bulletin, 49,
Allport, G. W. (1963). Pattern and growth in personality. Nueva York. Holt, Rinehart and
Winston.
Allport, G. W. y Odbert, H. (1936). Trait names: A psycho-lexical study. Psychological Mo-
nographs, 47, 1-211.
Anastasi, A. (1988). Psychological testing. (6* ed.) Nueva York. McMillan. '
Aronson, D. y Akamatsu, J. (1981). Validation of a Q-sort task to assess MMPI skills. Journal
of Clinical Psychology, 37, 831-837.
Bannister, D. y Maier, ]. (1968). The evaluation of personal construct. Londres. Academic
Press.
Barrios, B. (1988). On the changing nature of behavioral assessment. En A. Bellack y M. Her-
sen (dirs.), Behavioral assessment. A practical handbook. (3* ed.) Nueva York. Pergamon
Press.
Beail, N. (dir.) (1985). Repertory grid techniques and personal constructs. Cambridge. Broo-
kline Books.
Bem, D. y Funder, D. (1978). Predicting more of the people more of the time: Assessing the
personality situation. Psychological Review, 85, 485-501.
Bentler, P. M. y Lavoie, A. L. (1972). A nonverbal semantic differential. Journal of Verbal
Learning and Verbal Behavior, 11, 491-496.
Bieri, J., Atkins, A., Briar, S., Leaman, R., Miller, H. y Tripodi, T. (1966). Clinical and social
judgments. Nueva York. Wiley.
Block, J. (1978) The Q-sort method in personality assessment and psyquiatric research. Palo
Alto. Counseling Psychologist Press.
Bovet, J., Spagnol;, J. y Gillieron, E. (1991). Psychotherapeutic treatments evaluated with
two instruments: Clinical questionnaire and semantic differential. Psychotherapy and
Psychosomatics, 55, 9-23.
Caldwell, D. y O'Reilly (1D), C. (1990). Measuring person-job fit with a profile-comparison
process. Journal ofApplied Psychology, 75, 648-657.
Cattell, R. B. (1943). The description of personality: 2. Basic traits resolved into clusters.
Journal of Abnormal and Social Psychology, 41, 374-394.
Chambers, W. y Grice, J. (1986). Circumgrids: A repertory grid packcage for personal com-
puters. Behavioral Research Methods, Instruments, and Computer, 28, 468.
Clarke, W. U. (1956). The construction of an industrial selection personality test. Journal of
Psychology, 41, 374-394.
Crockett, W. H. y Nidorf, L. J. (1967). Individual differences in response to the semantic dif-
ferential. Journal of Social Psychology, 73, 211-218.
Everett, A. V. (1973). Personality assessment at the individual level using the semantic diffe-
rential. Educational and Psychological Measurement, 33, 837-844.
Feixas, G. (1990). Evaluación de textos autobiográficos. Aplicación de un diseño metodoló-
gico basado en la teoría de los constructos personales de Kelly: el caso de Pablo Neruda.
Evaluación Psicológica/Psychological Assessment, 6, 289-326.
Fernández-Ballesteros, R. (1983) Técnicas subjetivas. En R. Fernández-Ballesteros (dir.). Psi-
codiagnóstico. Madrid. UNED.
Fierro, A. (1982). Técnicas de investigación de la personalidad. Salamanca. ICE.
489
o K. (1977). Use of Osgood's semantic differential. Psychological Reports, 41, 1219-
Fish, T. (1986). Semantic differential assessment of benign, threat, and challenge appraisals of
life events. Canadian Journal of Behavioral Science, 18, 1-14.
o E. y Bamnister, D. (1977). A manual for repertory grid technique. Londres. Acade-
mic Press.
French, P. L. (1977). Nonverbal measurement of affect: The graphic differential. Journal of
Psycholinguistic Research, 6, 337-347.
Gardner, A. y Gibson, S. (1989). Semantic differential techniques in the identification of indi-
viduals assessment of health state: A case study of a patient within a homeopathic regime.
Counselling Psychology Quarterly, 2, 273-288.
Goldfried, M. y Kent, R. (1972). Traditional versus behavioral assessment: a comparison of
methodological and theoretical assumptions. Psychological Bulletin, 77, 409-420.
Gough, H. G. y Heilbrun, A. B. (1965). The Adjective Check list Manual. Palo Alto. Consul-
tng Psychologists Press.
Gough, H. G. y Heilbrun, A. B. (1983). The Adjective Check list Manual (edición revisada).
Palo Alto. Consulting Psychologists Press.
Graham, J. (1967). Q-sort study of the accuracy of clinical descriptions based on the MMPL.
Journal of Psychiatry Research, 5, 297-305.
Hunsley, J. (1990). Dimensionality of the multiple affect adjective check list-revised: A com-
parison of factor analytic procedures. Journal of Psychopathology and Behavioral Assess-
ment, 8, 103-117.
Jacobs, A., Capek, L. y Meehan, J. P. (1959). The development of an adjective check list to
measure affective states. Psychological Newsletter, 12, 515-520.
Kelly, G. (1955). The psychology ofpersonal construct. Nueva York. Norton.
Kerlinger, F. (1973). Foundations of behavioral research (2* ed.). Nueva York. Holt, Rinehart
and Winston [trad. castellana, México. Interamericana. 1975].
Lackson, D. y Minton, H. (1963). A forced-choice adjective preference scale for personality
assessment. Psychological Reports, 12, 515-520.
LaForge, R. y Suczek, R. (1955). The interpersonal dimension of personality: HI. An inter-
personal checklist. Journal of Personality, 24, 94-112.
Landfield, A. (1971). Personal construct systems in psychotherapy. Chicago. Rand-McNally.
Landfield, A. y Cannell, J. (1988). Ways of assessing functionally independent construction,
meaningfulness and construction in hierarchy. En J. Mancuso y M. Shaw (dirs.), Cogn:-
tion and personal structure. Nueva York. Praeger.
Leitner, L. y Cado, S. (1982). Personal constructs and homosexual stress. Journal of Persona-
lity and Social Psychology, 43, 869-872.
Lipsitt, L. P. (1958). A self-concept scale for children and its relationship to the children's
form of the manifest anxiety scale. Child Development, 29, 463-472.
Masterson, S. (1975). The adjective checklist technique; a review and critique. En P. McRey-
nolds (dir.), Advances in Psychological Assessment. (Vol. 111). San Francisco. Jossey-Bass.
Menasco, M. y Curran, D. (1978). An assessment of the Role Construct Repertory Test. Ap-
plied Pocboligrad Measurement, 2, 361-369. ici : :
Neimeyer, G. (1988). Cognitive integration and differentiation in vocational behavior. The
Counseling Psychologist, 16, 440-475.
Neimeyer, G. (1989). Application of repertory grid technique to vocational assessment.
Journal ofCounseling and Development, 67, 585-589. e
Neimeyer, G. y Neimeyer, R. (1981). Personal construct perspectives On cognitive assess-
ment. En T. Merluzzi, C. Glass y M. Genest (dirs.), Cognitive assessment. Nueva York.
Guilford Press.
Neimeyer, G. y Neimeyer, R. (comps.) (1989). Advances in personal construct theory. (Vol1).
Greenwich. JAI Press.
Osgood, C. E. (1952). The nature and measurement of meaning. Psychological Bulletin, 49,
226-233.
Osgood, C. E. (1964). Semantic Differential Technique in the comparative study of cultures.
American Anthropologist, 66, 171-200.
Osgood, C. E., Suci, G. y Tannenbaum, P. (1957). The measurement of meaning. Urbana.
University of Illinois Press.
Parker, G. V. (1969). Sex differences in self-description on the adjective check list. Educatio-
nal and Psychological Measurement, 29, 99-113.
Parker, G. V. y Veldman, D. J. (1969). Item factor structure of the adjective check list. Educa-
tional and Psychological Measurement, 29, 605-613.
Pelechano, V. (1988). Del psicodiagnóstico clásico al análisis ecopsicológico. (Vol. 1). Valencia.
Alfaplús.
PS V. (dir.) (1991). Habilidades interpersonales en ancianos. Conceptualización y
evaluación. Valencia. Alfaplús.
Pervin, L. (1975). Personality. Theory, assessment and research. Nueva York. Wiley.
Piotrowski, C. (1983). Factor structure on the semantic differential as a function of method
of analysis. Educational and Psychological Measurement, 43, 283-288.
Piotrowski, C. y Dunham, F. Y. (1984). Stability of factor structure on the semantic differen-
tial: retest data. Educational and Psychological Measurement, 44, 449-454.
Rogers, C. y Dymond, R. (dirs.) (1954). Psychotherapy and personality change. Chicago.
University of Chicago Press.
Schlicht, W/. (jr.), Carlson, H., Skeen, D. y Skurdal, M. (1969). Self-images without awareness
and projective methods of personality assessment. Journal of Projective Techniques and
Personality Assessment, 33, 419-423.
Sciortino, R. (1968). Analysis of factor variance of motivational self-ratings by male and fe-
male subjects. Journal of Psychology, 69, 169-174.
Smith-Wampler, K., Halverson, C., Moore, J. y Henley-Walters, L. (1989). The Georgia Fa-
mily Q-sort: an observational measure of family functioning. Family Process, 28, 223-238.
daa J. G. y Osgood, C. E. (1959). Semantic differential technique: a sourcebook. Chicago.
Aldine.
Stephen, T. (1985). Q-methodology in communication science: an introduction. Communi-
cation Quarterly, 33, 193-203.
Stephen, T. y Harrison, T. (1986). Assessing communication style: a new measure. The Ame-
rican Journal of Family Therapy, 14, 213-234.
Stephenson, W. (1953). The study of behavior: A-technique and its methodology. Chicago.
Stephenson, W. (1983). Against interpretation. Operant Subjetivity, 6, 109-125.
Strack, S. (1987). Development and validation of an Adjective check list to assess the Millon
personality types in a normal population. Journal of Personality Assessment, 51, 572-587.
rs Eió Measurement of activation through self-report. Psychological Reports,
, -678.
Thayer, R. E. (1986). Activation-Deactivation adjective check list: current overview and
structural analysis. Psychological Reports, 58, 607-614.
Thompson, B. (1980). Comparison of two strategies for collecting Q-sort data. Psychological
Reports, 47, 547-551.
Vanderpool, J. A. (1969). Alcoholism and the self-concept. Quarterly Journal of Studies on
Alcoholism, 30, 59-77.
Welsh, G. S. (1975). Adjective check list descriptions of Freud and Jung. Journal of Persona-
lity Assessment, 39, 160-168.
Zuckerman, M. (1960). The development of an affect Adjective check list for the measure-
ment of anxiety. Journal of Consulting Psychology, 24, 457-462.
Zuckerman, M. y Lubin, B. (1965). Manual for the multiple affect adjective check list. San
Diego. EITS.
Zuckerman, M,, Lubin, B. y Rinck, C. (1983). Construction of new scales for the multiple af-
fect adjective check list. Journal of Behavioral Assessment, 5, 119-128.
Anastasi, A. (1988). Psychological testing. (6* ed.) Nueva York, McMillan.

Fernández-Ballesteros, R. (1983). Técnicas subjetivas. En R. Fernández-Ballesteros (dir.),
Psicodiagnóstico. Madrid. UNED.
> Sidrar AN |
cleio d Ever 2d Ñ vhs ptr E CAPAS
Raga Cy Trla Plá (050 Fra » nde
A A
Lerro aos i ds a <>
Himtrz Y. (1 Citi +, Ss Y eSirdi, MA Ha ' do
e rs al in SE foresmal fre cto; inten
Pera AAA ME as! > DA apt
oro, E. 0
0 dsd
y j
di "
o 20smonisacionl Selcaigo
y males
NM 0 vs bi A san O) SEN 14
MIU =D ss Pu * 4 MA C Mi AA y W Plerdey- Wibvera, LAN

rd mier MU Nica y hr hinenating Party
prod E IRA Dei rental iD nebo €
rn orrtteracinan elite: E nation,
> PU e
PS
á
E A
E GrIrución el oty le; ote raue The Amé:
o ru Doddoy Ciiéagos
¿Devk listro sets de Millon

1 LD q í PAG? 3 A! 57.
NI put. Pyr "Hrob racial Report,
/ MACUTVONTE OTTO vd
X y EN HI CILA
A A VEO cad
L
paar Ol AISIOs 0%
7
A 3 o á E l
aid. z. formal ol Persona
21. ANÁLISIS FUNCIONAL DE LA CONDUCTA
WILLIAM H. O'BRIEN Y STEPHEN N. HAYNES
Il. INTRODUCCIÓN
Con frecuencia se recurre a los analistas de conducta 'con el objetivo de diseñar tra-
tamientos individualizados para pacientes que presentan un amplio espectro de tras-
tornos conductuales, cognitivos y psicofisiológicos. El análisis funcional, básica-
mente derivado de la evaluación previa al tratamiento, es un modelo conceptual que
resume la información sobre los factores situacionales y conductuales que controlan
varios aspectos topográficos? de las conductas en cuestión. A su vez, esta informa-
ción puede emplearse para diseñar una intervención que altere la topografía de las
conductas analizadas modificando los factores determinantes. De este modo, el aná-
lisis funcional es uno de los mayores determinantes de los tratamientos conductuales
1diográficos (Evans, 1985; Kanfer, 1985; Nelson y Hayes, 1986; Nelson, 1988; Hay-
nes y O'Brien, 1990; Haynes, 1992; Krasner, 1992).
Aunque se reconoce generalmente que el análisis funcional es un componente
importante del diseño del tratamiento, parece que los analistas de conducta lo reali-
zan con poca frecuencia. En una revisión de 127 estudios de evaluación y tratamien-
to de trastornos de conducta N= 1 publicados entre 1985 y 1987 en prestigiosas re-
vistas conductuales (Behavioral Assessment, Behavior Modification, Behaviour
Research and Therapy, Behavior Therapy y Journal of Applied Behavior Analysis),
Haynes y O'Brien (1990) encontraron que sólo el 20,5% reflejaba haber usado aná-
lisis funcionales para orientar su diseño de tratamiento. Una segunda revisión de es-
tas publicaciones entre los años 1990 a 1992 (otros 132 estudios de caso) mostró que
el uso del análisis funcional previo al tratamiento descendió a un 18% ?. Estos por-
centajes, aunque bajos, son significativamente mayores que el 6% indicado por
Singh y cols. (1991) en su revisión de 17 estudios de intervención conductual en es-
tudiantes con trastornos emocionales. Por ello, es razonable suponer que sólo unas
pocas de las mejor diseñadas intervenciones conductuales emplean análisis funcio-
nales para guiar el diseño del tratamiento, y que no hay pruebas acerca de una ten-
dencia de aumento de su uso a pesar de la reiterada recomendación por parte de los
autores conductuales. A A da
Hay muchas explicaciones posibles de la escasa realización de análisis funciona-
les por parte de los analistas de conducta. En nuestra opinión existen dos motivos
University of Bowling Green Ohio (EE UU) y University of Hawai (EE UU). UA
1 “Analista de conducta” es el término general referido al investigador o persona en ejercicio que se
dedica al estudio y tratamiento de los trastornos de conducta.
2 “Topografía” se refiere a la forma de la conducta en cuestión. ;
3 Los autores desean agradecer los esfuerzos de Rachel Cheyne y James Toth por su completa revi-
sión bibliográfica.
+94 William H. O'Brien y Stephen N. Haynes
importantes; en primer lugar, a medida que la investigación de los trastornos de con-

ducta se ha extendido y ha evolucionado, las explicaciones conductuales de muchos
trastornos se han hecho más complejas y, como consecuencia, laderivación de la ma-
yoría de los análisis funcionales se ha convertido en una tarea difícil tanto metodoló-
gica como conceptualmente (Nelson y Hayes, 1986; Cone, 1988; Delprato y
McGlynn, 1988); en segundo lugar, las complejas relaciones entre los factores deter-
minantes y las conductas estudiadas deben organizarse de una forma clínica útil,
pero hay una escasez de métodos sistemáticos y refutables para completar esta tarea
(Kanfer, 1985; Haynes y O'Brien, 1990; Hayes y Follette, 1992).
Los objetivos principales de este capítulo son familiarizar al lector con las for-
mulaciones conductuales actuales de los trastornos de conducta, con una definición
de análisis funcional que sea global y consistente con las formulaciones conductuales
actuales, con los tipos de variables que comúnmente se integran en el análisis funcio-
nal, con los métodos de evaluación conductual básicos empleados para identificar y
cuantificar las relaciones funcionales y, por último, con la realización de modelos de
análisis causales funcionales, un procedimiento diseñado para integrar y organizar
datos de evaluación complejos.
IL FORMULACIONES CONDUCTUALES ACTUALES DE LOS TRASTORNOS

DE CONDUCTA
Los sistemas de ideas conductuales * se han caracterizado históricamente por cuatro

presupuestos principales sobre los trastornos de conducta. Los dos primeros presu-
puestos establecen que las conductas problemáticas están determinadas por interac-
ciones idiosincrásicas entre hechos del entorno? y las respuestas individuales cogni-
tivas, afectivas, fisiológicas y motoras (Hollandsworth, 1986; Strosahl y Linehan, 1986;
Barrios, 1988; Delprato y Midgley, 1992; Krasner, 1992). Un tercer presupuesto es
que las interacciones entre los sucesos del entorno y las conductas problemáticas
pueden ser evaluadas más eficazmente empleando metodologías empíricas de infe-
rencia mínima (Barlow y Hersen, 1984; Cone, 1988). El cuarto es presuponer que las
conductas problemáticas son modificables por medio de la aplicación de principios
de aprendizaje (Kazdin, 1984; Eysenck, 1988).
A medida que ha evolucionado la investigación en evaluación y terapia conduc-
tual se han incorporado algunos presupuestos adicionales sobre los trastornos de
* El término “sistema de ideas conductuales” refleja la diversidad de opiniones existentes en la litera-

tura conductual en relación con el papel de las teorías en la ciencia de la conducta humana. Muchos con-
ductistas radicales han afirmado que las teorías interfieren en la observación objetiva y en la identifica-
ción de los factores que gobiernan la conducta; sin embargo, adoptan el uso de “reglas” científicas o
constructos que sistematizan las investigaciones. Debido a que intentamos tratar todo el espectro del
pensamiento conductual, que incluye esta posición ateórica, se usa un término alternativo que implica
un sistema organizado de investigación sin la referencia explícita de la teoría terminológica.
? “Sucesos del entorno” se emplea aquí como término general que denota la presencia de variables
situacionales y/o internas del individuo (por ejemplo, respuestas cognitivas, fisiológicas, respuestas mo-
trices externas...) que preceden, coinciden o siguen a la realización de una conducta concreta. Un sub-
grupo del universo de sucesos del contexto ejerce una influencia determinante sobre la conducta.
Análisis funcional de la conducta
495
conducta a los sistemas de ideas conductuales. Un supuesto de causalidad variada

múltiple propone que las conductas tienen a menudo causas múltiples y que además
varían en combinación con otras conductas (Voeltz y Evans, 1982; Evans,
1985;
Cone, 1988; Delprato y McGlynn, 1988). Un presupuesto dinámico estipula que las
causas de muchos trastornos cambian con el tiempo (Hayes y Follette, 1992; Hay-
nes, 1992). Un presupuesto bidireccional establece que las variables determinantes
designadas (por ejemplo, disputas de pareja) y las conductas (por ejemplo, la depre-
sión) comparten a menudo una relación de causalidad recíproca (Bandura, 1981;
Beach, Sandeen y O'Leary, 1990). Finalmente, un presupuesto no lineal propone
que la fuerza de una relación causal puede diferir en los valores correspondientes de
una variable determinante y una conducta. Por ejemplo, hay literatura sobre los me-
canismos de activación, las mesetas funcionales, efectos de “incubación” y relaciones
causales curvilíneas (Haynes, 1992).
La aceptación de modelos deterministas, idiográficos, empíricos, de variación
múltiple, dinámicos y no lineales de causalidad conductual se refleja en las explica-
ciones conductuales actuales de muchos trastornos. Por ejemplo, los modelos de
vulnerabilidad al estrés del trastorno de pánico (Barlow, 1988), trastornos bipolares
(Goodwin y Jamison, 1990), déficit de las habilidades sociales (Morrison, 1990) y
trastornos psicofisiológicos (Haynes y Gannon, 1981) proponen que las interaccio-
nes complejas entre características genéticas, los períodos sensibles del desarrollo y
las condiciones ambientales causantes de estrés explican parcialmente el inicio, man-
tenimiento, magnitud y fin de los síntomas de los distintos trastornos.
La gran complejidad de las formulaciones conceptuales de los trastornos de con-
ducta requieren que una amplia gama de variables sea incorporada a un análisis fun-
cional relativamente completo. Como consecuencia, los analistas de conducta han de
tomar importantes decisiones en cuanto a cómo pueden usarse datos diversos de eva-
luación para identificar y cuantificar las relaciones entre los factores determinantes y
las conductas, y cómo puede organizarse significativamente la información resultante
para ayudar a diseñar la intervención. El resto de este capítulo tratará de proporcionar
algunas soluciones a estas cuestiones de la evaluación. Sin embargo, previamente se
requiere una definición y discusión más completas del análisis funcional.
II. DEFINICIÓN DEL ANÁLISIS FUNCIONAL
El término análisis funcional aparece destacado en muchos artículos de investiga-

ción, capítulos y libros de texto sobre condicionamiento operante, conductismo,
evaluación conductual y terapia de conducta (Haynes, 1978; Ciminero, Calhoun y
Adams, 1986; Nelson y Hayes, 1986; Bellack y Hersen, 1988). En efecto, Delprato y
Midgley (1992) y Krasner (1992) señalan que el análisis funcional es la metodología
eva-
fundamental de investigación del conductismo. Además, numerosos autores de
luación conductual han advertido que un análisis funcional incompleto oincorrecto
podría llevar a un diseño de intervención inútil, ineficaz y/o perjudicial (Evans,
Jarret,
Nelson y
1985; Hawkins, 1986; Nelson y Hayes, 1986; Axelrod, 1987; Hayes,
1987; Haynes y O'Brien, 1988, 1990; Mash y Hunsley, 1990).
496 William H. O'Brien y Stephen N. Haynes
Aunque el análisis funcional ha desempeñado un papel central en la literatura

conductual, ha sido empleado para caracterizar un amplio conjunto de actividades
de evaluación de conducta que incluyen:
a. Laidentificación y organización de la topografía de la conducta (Craighead,

Kazdin y Mahoney, 1981; Bornstein, Borkovec y Coles, 1986).
b. La organización de los factores situacionales o determinantes relacionados
con las conductas (Maisto, 1985; Taylor y Carr, 1992a, 1992b).
c. La observación de cambios en la conducta después de que los factores deter-
minantes hipotéticos son manipulados empleando diseños de caso único
(Peterson, Homer y Wonderlich, 1982; Smith y cols., 1992).
d. La cuantificación de las relaciones entre estímulo y respuesta O respuesta y
respuesta (Hawkins, 1986).
e. La evaluación de estados motivacionales y factores de desarrollo (Kanfer y
Phillips, 1970).
f. Las predicciones acerca de los casos de conducta (Turkat y Maisto, 1985).
g. Laintegración general de conductas y factores determinantes bien organiza-
dos (Correa y Sutker, 1986; Nelson, 1988; Hayes y Follette, 1992).
Debido a este uso ambiguo del término, hace poco que propusimos que el análi-
sis funcional fuera definido formalmente como «la identificación de relaciones fun-
cionales causales, controlables e importantes aplicables a un conjunto específico de
conductas de un paciente individual» (Haynes y O'Brien, 1990, p. 654). Esta defini-
ción de análisis funcional lleva consigo varios aspectos implícitos y explícitos. En
primer lugar, una relación funcional implica sólo que una fórmula matemática (por
ejemplo, y = a + bx + e) puede describir la asociación entre dos o más variables (Bla-
lock, 1964, 1969; James, Mulaik y Brett, 1982; Haynes, 1992). En la mayoría de las
aplicaciones de la evaluación conductual, la presencia de una relación funcional se
basa en una observación de covariación y/o elevada probabilidad condicional (Ar-
kes, 1981). Algunas de estas relaciones funcionales son causales mientras que otras
están estrictamente correlacionadas.
Un análisis funcional que haga énfasis en las relaciones funcionales causales ge-
nera información de total relevancia para el diseño del tratamiento (Haynes y
O'Brien, 1990; Haynes, 1992). Esto se debe a que las conductas con distintas topo-
grafías pueden estar controladas por distintos factores causales. Por ejemplo, las esti-
maciones subjetivas de dolor y depresión de un paciente pueden correlacionarse con
fiabilidad. No obstante, la correlación estre estas conductas de distinta topografía
puede deberse a factores causales comunes tales como niveles reducidos de actividad
y refuerzo social de “conducta de dolor” (por ejemplo, hacer muecas, expresiones
frecuentes de estados negativos físicos y emocionales, posturas...). En este caso, un
tratamiento diseñado para reducir el dolor consistente en la modificación de la de-
presión subjetiva no sería tan eficaz como otro que modifique los niveles de activi-
dad y reorganice las contingencias del refuerzo (Feurstein, Labbe y Kuczmierczyk,
1986). Alternativamente, una única conducta como la reactividad cardiovascular
puede estar asociada a sucesos determinantes de mala adaptación en ciertas ocasio-
nes (por ejemplo, exposición a factores de estrés) y sucesos determinantes de adapta-
497
ción (por ejemplo, ejercicios de gimnasia) en otras ocasiones (Hollander y Seganian

,
1984; Julius y Weder, 1989; Fredrikson y Matthews, 1990; Pickering y Gerin, 1990).
Una intervención que no distinga estas respuestas similares en topografía pero cau-
salmente distintas puede enfocarse a la supresión de todos los casos de reactividad
cardiovascular. Tal intervención sería ineficaz, por no decir perjudicial. En su lugar,
una intervención más apropiada se enfocaría sólo hacia los casos de mala adaptación
de la reactividad cardiovascular.
A menudo, muchas variables tienen relaciones funcionales causales con una con-
ducta. Sin embargo, no todas estas variables son relevantes para el diseño de la inter-
vención. Por ejemplo, los sistemas de retroalimentación del sistema nervioso autó-
nomo, el estrés diario, los niveles de actividad física, el sodio y potasio de la dieta, el
consumo de alcohol, el grado de obesidad, el funcionamiento del riñón, los niveles
de catecolaminas y los niveles de angiotensina pueden ejercer una influencia causal
en los niveles de presión sanguínea en un paciente hipertenso (Kaplan, 1986). Sin
embargo, el subgrupo de relaciones funcionales causales que explican la mayor pro-
porción de variación en la topografía de la conducta es más relevante al diseño de in-
tervenciones conductuales efectivas (Haynes, 1986, 1988). Por tanto, una segunda
característica del análisis funcional es el énfasis en la identificación de relaciones fun-
cionales causales importantes.
En muchos casos las relaciones funcionales causales importantes son incontrola-
bles. Sucesos históricos significativos (por ejemplo, experiencias traumáticas como
la muerte de un pariente o una catástrofe natural), características biológicas (por
ejemplo, el genotipo, lesiones antiguas, intervenciones quirúrgicas) y características
sociodemográficas (por ejemplo, la edad o el nivel cultural) son tres clases de facto-
res causales potencialmente importantes que no pueden modificarse. Debido a que
las intervenciones conductuales están diseñadas para producir un cambio por medio
de la modificación de las relaciones causales importantes entre conducta y factores
determinantes, un análisis funcional se reducirá a la identificación de relaciones fun-
cionales causales controlables.
Una cuarta característica del análisis funcional es su interés por identificar rela-
ciones funcionales causales aplicables a conductas específicas para pacientes indivi-
duales. Este énfasis idiográfico es consistente con el axioma conductual de que exis-
ten diferencias dentro de la persona y entre las personas que determinan la conducta
(Haynes, 1978; Craighead y cols., 1981; Hawkins, 1986; Kazdin, 1984; Cone, 1988).
Por tanto, es impropio asumir que un análisis funcional concreto será generalizable a
otras conductas, otros entornos u otros pacientes. P la wit
Finalmente, es importante observar que el análisis funcional está sin definir con
respecto a la metodología , tipos de variables cuantificabl es y número de relaciones
funcionales evaluables. Dada la complejidad de modelos causales de trastornos de
conducta mencionada antes, es importante que los analistas de conducta empleen
métodos de evaluación diversos, muestreen ampliamente el universode factores de-
terminantes y topografía de las conductas y traten de evaluar las múltiples relaciones
dentro de, y entre estos conjuntos de variables (Delprato y McGlynn, 1988; Pinal
y Wai Alae, 1994). Por tanto, muchos análisis funcionales pueden necesitar inclui
amente en
información sobre variables que se han rechazado o minimizado históric
afecti-
las evaluaciones conductuales tradicionales (por ejemplo, cogniciones, estados
498 William H. O”Brien y Stephen N. Haynes
vos, respuestas psicopatológicas...) (Hollandsworth, 1986; Mash y Hunsley, 1990),

relaciones entre variables determinantes (Gump, 1977; Haynes y O'Brien, 1990) y
“efectos secundarios” previstos de conductas correlacionadas o factores determi-
nantes que pueden resultar de modificaciones del problema de conducta (Voeltz y
Evans, 1982; Evans, 1985).
IV. VARIABLES COMÚNMENTE INCLUIDAS EN LOS ANÁLISIS FUNCIONALES
Las conductas y sus factores determinantes son los dos conjuntos más importantes
de variables que se incluyen en los análisis funcionales. En una descripción topográ-
fica, el analista produce organizaciones precisas y cuantificables de conductas y fac-
tores determinantes. La evaluación y organización precisa de la topografía de estas
variables es el primer paso hacia la identificación y cuantificación de las relaciones
causales funcionales (Blalock, 1964, 1969; Cook y Campbell, 1979; James y cols.,
1982). En esta sección se revisarán las principales dimensiones topográficas de los
trastornos de conducta y sus factores determinantes.
1v.1. Topografía de las conductas analizadas

La conducta humana puede organizarse en torno a una serie de dimensiones; no
obstante, para los analistas de conducta en situaciones clínicas las características to-
pográficas más relevantes entran en las siguientes categorías:
a. Contenido, que se divide normalmente en el triple sistema de respuesta cog-

nitivo-verbal, afectivo-fisiológica y motor.
b. Magnitud, tal como nivel máximo de respuesta o grado de cambio de una
condición comparable (normalmente, línea base o condiciones de reposo).
Cc. Características temporales, tales como la frecuencia, duración, tiempo entre
respuestas y nivel de cambio.
Variabilidad.
e. Nivel de reducción, que puede dividirse en individual, esto es, conductas or-
ganizadas a nivel individual, e intraorgánicas, esto es, respuestas organizadas
de los sistemas de órganos o niveles inferiores (Scott, 1978; Hollandsworth,
1986; Schwartz, 1986; O'Brien y Haynes, 1996).
Aunque todas las dimensiones topográficas señaladas pueden organizarse e in-

corporarse en un análisis funcional, en un caso dado se evalúan combinaciones de
variables. Por ejemplo, Durand y Carr (1991) diseñaron análisis funcionales para
tres niños discapacitados en su desarrollo que presentaban conductas autolesivas y
agresivas; su descripción topográfica se restringía a las frecuencias de respuestas mo-
toras. Igualmente, la descripción topográfica realizada por Miller (1991) de un vete-
rano de guerra con estrés postraumático y fobia a los aviones cuantificaba el autorre-
gistro de ansiedad, una respuesta afectivo-fisiológica, empleando sólo una medida
499
de magnitud (unidades subjetivas del trastorno). En contraste, Levey y cols.

(1991)
realizaron una descripción topográfica más completa de un paciente con problemas
de In1ciación y mantenimiento del sueño; su análisis topográfico hacía hincapié en
las características temporales (frecuencia y duración de los despertares nocturnos
nivel de cambio de estado de vigilia a sueño, tiempo entre respuestas —el tiempo que
transcurría entre los despertares—,) y variabilidad (variación en los estados latentes
de iniciación del sueño) de las conductas motoras (por ejemplo, actividad física),
afectivo-biológica (por ejemplo, angustia personal) y cognitivo-verbales (por ejem-
plo, cogniciones incontrolables previas al sueño).
1V2. Topografía de los factores determinantes

Como se observó anteriormente, un presupuesto fundamental de los sistemas de
teorías conductuales es que las conductas problemáticas están controladas por múl-
tiples factores del entorno. Estos factores ambientales pueden organizarse en torno a
las mismas dimensiones topográficas que las conductas.
En términos de contenido, los factores determinantes pueden dividirse a grandes
rasgos en dimensiones situacionales e intraindividuales (Willems, 1977; Hollands-
worth, 1986). La dimensión situacional puede subdividirse en “escenarios de con-
ducta”, que han sido descritos por los psicólogos ambientalistas como unidades bá-
sicas ambientales (por ejemplo, el aula, la cafetería, el teatro, el despacho de un
terapeuta...) donde aparecen típicamente «patrones estables de conducta» (Barker,
1968; Schoggen, 1989). A su vez, los escenarios de conducta pueden subdividirse en
factores ambientales físicos inanimados (por ejemplo, estructura del aula, tempera-
tura, humedad...) y factores físicos animados, que pueden ser humanos o no huma-
nos. Por ejemplo, un aula de una escuela es un entorno que tiene un patrón de con-
ducta estable (por ejemplo, normalmente se espera que el estudiante se quede
sentado y hable sólo cuando se lo pida el profesor) y contiene factores físicos inani-
mados (por ejemplo, las sillas se disponen para favorecer al máximo la interacción
entre profesor y estudiante), además de factores físicos animados (por ejemplo,
otros estudiantes). Estos factores situacionales externos actúan para facilitar ciertas
conductas mientras que inhiben otras.
Los factores determinantes intraindividuales pueden caracterizarse como *situa-
ciones internas” que pueden controlar algún aspecto de la topografía conductual. Al
igual que las conductas, el contenido de los factores determinantes intraindividuales
puede subdividirse en respuestas cognitivo-verbales, afectivo-psicológicas y motri-
ces (Delprato y McGlynn, 1988). Por ejemplo, las estimaciones cognitivas de una
causa de estrés situacional pueden ejercer un impacto significativo en una “respuesta
al estrés” como el evitar la conducta o la magnitud de la reactividad psicológica. Más
importante, los factores determinantes intraindividuales pueden explicar la varia-
ción de la topografía de la conducta independientemente de la que explican los facto-
res situacionales externos (Hocking y cols., 1992).
La magnitud y las dimensiones temporales de los factores determinantes tam-
la
bién han de organizarse. Por ejemplo, la intensidad y duración de laexposición a
s pueden evaluars e con fiabilida d y se ha
atención de los adultos y/o tareas exigente
demostrado que tienen un impacto significativo en la frecuencia y magnitud de la

conducta autolesiva en algunos pacientes (Durand y Crimmins, 1988; Durand y
Carr, 1991; Taylor y Carr, 19924). Del mismo modo, la magnitud, frecuencia y dura-
ción de la exposición a colas de hospital en pacientes de quimioterapia con náuseas y
vómitos anticipatorios ha demostrado ejercer un impacto significativo en la grave-
dad de los síntomas (Burish y cols., 1987; Carey y Burish, 1988).
Finalmente, los factores determinantes pueden definirse según el gradode varia-
bilidad y nivel de reducción. Por ejemplo, un análisis funcional que identifique los
factores determinantes asociados a los ataques de pánico puede hacer énfasis en la
variabilidad de la presencia de acontecimientos situacionales que evoquen la con-
ducta (por ejemplo, encuentros inesperados con un estímulo temido) más que las
medidas absolutas de frecuencia o magnitud. Además, estos sucesos evocativos si-
tuacionales pueden organizarse a nivel molar (por ejemplo, conducir por autopista)
o molecular (por ejemplo, percepción de la activación del sistema nervioso simpáti-
co como un incremento de la tasa cardiaca).
En resumen, la topografía de las conductas y los factores determinantes pueden
organizarse en torno a una serie de dimensiones que incluyen contenido, magnitud,
frecuencia, duración, intervalo de respuesta o de estímulo, nivel de cambio, variabili-
dad y nivel de reducción. Una descripción topográfica produce información precisa
sobre la forma y contenido de las conductas y los factores determinantes. A su vez,
se hace posible la medida cuantitativa de estas variables.
V. REDUCCIÓN DE LA COMPLEJIDAD DE LA EVALUACIÓN:

PAPEL DE LAS PRESUPOSICIONES EN EL CAMPO CAUSAL
Tras realizar una descripción topográfica de las conductas y los factores determinan-
tes, el analista de conducta ha de tratar de identificar la presencia y grado de relacio-
nes funcionales causales. Como se observa en la figura 21.1, existen al menos 126
modos en los que los factores determinantes y las conductas interactúan. Es alta-
mente improbable que el analista de conducta pueda evaluar sistemáticamente todas
las interacciones posibles e incorporarlas a un análisis funcional. De este modo, las
decisiones apriorísticas deben tomarse considerando cuáles de las interacciones po-
tenciales tienden a ser más importantes, controlables y causales. Estas decisiones ini-
ciales son análogas al concepto de «presuposiciones del campo causal» descritas por
Einhorn (1988).
Las presuposiciones causales empleadas por los analistas de conducta para redu-
cir la complejidad de los datos de la evaluación han sido poco investigadas y, por tan-
to, poco comprendidas (Hayes y Follette, 1992; Krasner, 1992). No obstante, hay al
menos dos fuentes de influencia en estos procesos de decisión. En primer lugar, el
entrenamiento del analista y su experiencia clínica, esto es, la historia del refuerzo en
ambientes clínicos, ejercerán influencia en los tipos de variables que se incorporan
en el análisis funcional (Hayes y Follette, 1992). Por ejemplo, un analista de conduc-
ta con entrenamiento y experiencia en evaluación psicopatológica puede presuponer
que los síntomas de ansiedad de un paciente están causados con una mayor probabi-
501
FIGURA 21.1. Modelo de interacciones potenciales entre las distintas dimens
iones topográfi-
cas de las variables determinantes y conductas
[99]
[UY]
5 Motora
= .
=||5
E _Afectiva/
E [pa Fisiológica
=
y Ez
Z A
Nivel de reducción
Y Cognitiva/ Variabilidad
En Verbal
Nivel de cambio
ge ea
F
Sl Ade Intervalo entre
2 É A ODAna respuestas / estímulos
Es os
> Física
dolo ió
Duración
O humana .
E Ml $ Frecuencia
ES Física/
2 =)
E ¡
Inanimada a
Magnitud
5 Cognitiva/ Afectiva Motora

Verbal Fisiológica
CONTENIDO TOPOGRÁFICO DE LA CONDUCTA
lidad por patrones de respiración no adaptados o exceso de activación del sistema

nervioso simpático. Su descripción topográfica y análisis funcional acentuarían en-
tonces los factores determinantes intraindividuales (por ejemplo, la frecuencia y re-
gularidad de patrones de respiración) y conductas intraorgánicas (por ejemplo, la
tasa cardíaca de reposo). Por otra parte, un analista de conducta con entrenamiento y
experiencia en terapia conductual de pareja puede presuponer que los trastornos en
los patrones de comunicación y los consiguientes incrementos en el estrés diario son
las variables causales más relevantes en los síntomas de ansiedad. Su descripción to-
pográfica y análisis funcional puede entonces hacer énfasis en los factores determi-
nantes de la situación externa (por ejemplo, la frecuencia de las discusiones) y con-
ductas individuales (por ejemplo, la expresión de síntomas de ansiedad).
Un segundo factor que puede influir en las presuposiciones en el campo causal
entre los analistas de conducta es la literatura existente (Haynes, Spain y Olivera, en
prensa). Por ejemplo, una creciente literatura sobre el análisis funcional de lacon-
ducta autolesiva ha proporcionado pruebas de que cuatro grandes clases de variables
determinantes ejercen a menudo influencia causal en esta conducta. Estas clases de
variables determinantes incluyen atención social, escape de situaciones averstvas, re-
troalimentación sensorial o estimulación y refuerzo tangible (Taylor y Carr, 1992a,
1992b). Además, los investigadores en esta área han publicado protocolos de evalua-
ción de laboratorio e inventarios de autoinformes de análisis funcional (Carr y Du-
rand, 1985; Durand y Crimmins, 1988). De este modo, un analista de conducta que
se prepare para realizar la evaluación de un paciente con conducta autolesiva podría
502 William H. O*Brien y Stephen N. Haynes
emplear la literatura publicada para guiar parcialmente sus decisiones sobre qué va-
riables deben organizarse e incorporarse en un análisis funcional. ura.
Mientras que las presuposiciones en el campo causal son necesarias para simplifi-
car una tarea de evaluación extraordinariamente compleja, los analistas de conducta
deben evitar desarrollar un conjunto demasiado estrecho o inflexible de presupues-
tos porque las búsquedas inadecuadas de relaciones causales o los análisis funciona-
les incorrectos son más probables en estas condiciones. Se recomienda entonces una
serie de precauciones. Primero, es importante que los analistas de conducta evalúen
de forma rutinaria sus conductas de evaluación (por ejemplo, revisar cintas de audio
y vídeo) y guarden los datos sobre la exactitud y utilidad para el tratamiento de sus
predicciones y decisiones clínicas (Arkes, 1981; Garb, 1989); segundo, los analistas
de conducta deben discutir con frecuencia los casos con los colegas y supervisores
para obtener puntos de vista alternativos; tercero, se recomienda la lectura de la lite-
ratura sobre el tema; y, finalmente, los analistas de conducta deben actualizar regu-
larmente su conocimiento de la literatura sobre la investigación clínica y realizar in-
vestigaciones, asistir a convenciones, congresos y talleres.
VI. IDENTIFICACIÓN Y EVALUACIÓN DE LAS RELACIONES FUNCIONALES

CAUSALES
Una vez realizada la descripción topográfica y simplificado el campo causal, el ana-

lista de conducta debe intentar discernir las relaciones causales de entre la combina-
ción de interacciones funcionales entre factores determinantes y conductas. Como
se observó anteriormente, la covariación fiable entre un suceso determinante y algún
aspecto topográfico de una conducta es condición sin la cual no se da una relación
funcional causal. Sin embargo, la covariación por sí misma no implica causalidad.
Para diferenciar las relaciones funcionales causales de las no causales, los analistas de
conducta deben en primer lugar demostrar el orden cronológico (que los cambios de
la variable causal hipotética preceden a los efectos en la conducta dependiente), en
segundo lugar, dar una explicación lógica de la relación y, en tercer lugar, demostrar
la exclusión de explicaciones alternativas plausibles de la relación observada (Bla-
lock, 1964, 1969; Cook y Campbell, 1979; Saris y Stronkhorst, 1984; Einhorn, 1988;
Haynes, 1992).
Se pueden emplear varios métodos de evaluación conductual para obtener datos
de las relaciones funcionales causales. Tras obtener información básica de las relacio-
nes causales, el analista de conducta tiene dos opciones de evaluación de los datos, el
Juicio intuitivo y la prueba estadística. Cada recogida de datos y método de evalua-
ción tiene ventajas e inconvenientes en relación con la inferencia causal y adecuación
a entornos clínicos.
503
VI1. Métodos empleados para la obtención de datos

de las relaciones funcionales
VL11. Estrategia de variables distintivas
El uso de variables distintivas es quizá el método más común de los analistas de con-
ducta para identificar relaciones funcionales causales. Una variable distintiva es una
medida convenientemente obtenida que se asocia fiablemente con la fuerza de una
relación funcional causal.
Las variables distintivas comprobadas empíricamente pueden derivarse de in-
ventarios de autoinforme diseñados específicamente para identificar relaciones
funcionales, entrevistas estructuradas, evaluaciones psicofisiológicas y ejercicios
de representación de papeles. La Motivational assessment scale for self-injurions
behavior [Escala de evaluación motivacional para conductas autolesivas] de Du-
rand y Crimmins (1988) y la School refusal assessment scale [Escala de evaluación
de rechazo escolar] de Kearney y Silverman (1990) constituyen dos ejemplos de
cuestionarios analíticos funcionales que predicen relaciones causales en ambientes
naturales. Igualmente, Lauterbach (1990) ha desarrollado un método de entrevis-
ta estructurado que puede ayudar a la identificación de relaciones causales entre
sucesos anteriores y conductas. Un ejemplo de variable distintiva psicofisiológica
comprobada empíricamente es la respuesta del paciente al reto de la inhalación
de CO; en este caso, se ha demostrado fiablemente que los pacientes con tras-
torno de pánico, en relación con controles sin ningún tipo de trastorno, son sig-
nificativamente más propensos a experimentar síntomas de pánico agudos cuan-
do se les induce a inhalar repetidamente aire con concentraciones elevadas de
CO, (Clark, Salkovskis y Chalkey, 1985; Barlow, 1988). Así, las respuestas del
paciente a esta sencilla prueba pueden emplearse como marcador de si las com-
plejas relaciones bioconductuales que caracterizan el trastorno de pánico son
operativas para un paciente concreto. Finalmente, Kern (1991) ha desarrollado
un procedimiento normalizado idiográfico de representación de papeles en el
que las relaciones entre ambiente y conducta de interacciones sociales recientes
son simuladas y evaluadas sistemáticamente con el propósito de identificar rela-
ciones funcionales causales.
Aunque la estrategia de variables distintivas puede proporcionar información
importante sobre la presencia de relaciones funcionales causales, hasta ahora sólo se
han identificado en la literatura conductual unas pocas variables comprobadas empí-
ricamente (Haynes y cols., en prensa). Como resultado, los analistas han tendido a
confiar en variables distintivas no comprobadas (por ejemplo, un paciente con un
diagnóstico de trastorno de estrés postraumático puede informar de que la frecuen-
cia de recuerdos está causada por un aumento de estrés en el trabajo), en la aplicación
de los inventarios tradicionales y en la observación durante las sesiones de interac-
ción conductual en situaciones (por ejemplo, un paciente con fobia social muestra
un aumento de activación comprensiva y evita temas cuando se le pide quedescriba
situaciones temidas) para identificar relaciones funcionales causales (Craighead y
cols., 1981; Kohlenberg y Tsai, 1987).
La principal ventaja de la estrategia de variables distintivas es la sencillez de su

aplicación. Un analista de conducta puede identificar muchas relaciones causales po-
tenciales con una pequeña inversión de tiempo y esfuerzo. Por ejemplo, el número
de marcadores de relaciones causales potenciales que se pueden identificar en una
sola entrevista conductual puede ser elevado. El problema más significativo al em-
plear variables distintivas para inferir la presencia de relaciones funcionales causales
está relacionado con la capacidad de generalización. En concreto, se desconoce el
grado en que variables distintivas no comprobadas como los informes de pacientes,
respuestas a inventarios de autoinforme, evaluaciones de laboratorio e interacciones
de conducta en situaciones durante sesiones se correlacionan con las relaciones cau-
sales de la «vida real» (Nelson, 1988). Para aquellas situaciones en que existen varta-
bles distintivas empíricas, la magnitud de la correlación entre variable y relación cau-
sal “real” puede variar sustancialmente para cada paciente (Haynes y cols., en
prensa). De este modo, cuando se emplean variables distintivas, deben obtenerse da-
tos de evaluación idiográfica adicional que permitan la comprobación empírica de la
relación funcional causal hipotética.
vI.1.2. Aplicación combinada de distintos procedimientos de evaluación

La aplicación combinada de distintos procedimientos de evaluación es un segundo
método para la obtención de información sobre las potenciales relaciones funciona-
les causales. Por ejemplo, un analista de conducta puede observar que un cliente no-
tifica en un inventario de autoinforme, que varios sucesos vitales negativos (por
ejemplo, pérdida del trabajo) han ocurrido en el año anterior, en impresos de auto-
rregistro informa sobre niveles diarios elevados de discusiones de pareja y, por últi-
mo, describe síntomas de depresión durante la entrevista. Con estos datos, puede ser
plausible formular la hipótesis de que la depresión del paciente es resultado de inte-
racciones de pareja aversivas, que a su vez fueron causadas por un aumento del estrés
vital.
Al igual que la estrategia de variables distintivas, la aplicación combinada de dife-
rentes procedimientos de evaluación permite al analista identificar muchas relacio-
nes funcionales causales potenciales con una inversión mínima de recursos clínicos.
Las inferencias causales derivadas de este método han de ser muy tentativas, ya que
no puede establecerse qué es anterior. Volviendo al ejemplo citado, puede ser igual-
mente plausible invertir la secuencia causal y formular la hipótesis de que la conduc-
ta depresiva ocasionó un incremento de los sucesos negativos, que a su vez provoca-
ron un aumento de la discordia en la pareja.
VL1.3. Observación conductual y AS de interacciones

conductuales en situaciones naturales
Un tercer procedimiento común para obtener información básica de las relaciones
causales es la observación sistemática de interacciones no preparadas. Generalmente
se instruye a los pacientes para que autorregistren algún aspecto de la topografía de
505
la conducta observada (por ejemplo, frecuencia o magnitud) junto con uno o más
factores del entorno que se crea que ejercen una influencia causal en la conducta
(Bornstein, Hamilton y Bornstein, 1986). Alternativamente, la observación directa
de la interacción puede ser realizada por observadores entrenados u observadores
que participen en situaciones naturales (por ejemplo, la casa del paciente, su lugar de
trabajo...) y/o situaciones análogas (por ejemplo, el despacho del terapeuta, el labo-
ratorio...) (Foster y Cone, 1986; Foster y cols., 1988; Hartman y Wood, 1990).
Los métodos de autorregistro y observación directa pueden proporcionar datos
que permitan sólidas inferencia causales (Saris y Stronkhorst, 1984; Gottman y Roy,
1990). Sin embargo, estas técnicas tienen dos limitaciones prácticas; primero, los pa-
cientes u observadores han de entrenarse bien para que registren las conductas y fac-
tores determinantes con precisión y fiabilidad; y, segundo, a medida que aumenta el
número y/o complejidad de las variables observadas, la exactitud y fiabilidad suele
disminuir (Paul, 19864, 1986b; Foster, Bell Dolan y Burge, 1988; Hartmann y
Wood, 1990). En conjunto, estas limitaciones sugieren que los métodos de observa-
ción sistemática son más apropiados para situaciones en las que la conducta y varia-
bles determinantes son pocas y fácilmente cuantificables.
VL1.4. Control experimental

El cuarto método empleado para identificar las relaciones funcionales causales es el
control experimental. Los controles experimentales llevan consigo la modificación
sistemática de los factores ambientales y la observación de los cambios consiguientes
en la topografía de la conducta. Estos controles pueden realizarse en entornos natu-
rales, entornos análogos (Durand y Crimmins, 1988; Cowdery, Iwata y Pace, 1990),
entornos de laboratorios de psicofisiología (Vrana, Constantine y Westman, 1992) y
durante las sesiones de evaluación/terapia (Kohlenberg y Tsai, 1987).
Se ha desarrollado una serie de diseños experimentales N = 1 que permite al
analista inferir la causalidad de modo plausible (Barlow, Hayes y Nelson, 1984;
Barlow y Hersen, 1984; Kazdin, 1992). Aunque la mayoría fue diseñada para eva-
luar los efectos causales de una intervención, también pueden usarse para identifi-
car relaciones funcionales causales durante la evaluación previa al tratamiento. Por
ejemplo, un diseño A-B-A-B (donde A = sin tratamiento o condición de línea base,
B = tratamiento) puede emplearse para obtener información sobre los efectos cau-
sales de un procedimiento de solución de las contingencias en la conducta de recha-
zo escolar. No obstante, este mismo diseño (A = en casa con permiso para ver la te-
levisión, B = en casa sin permiso para ver la televisión) podría emplearse para
evaluar el grado en que el refuerzo tangible (por ejemplo, ver la televisión en días
que se falta a clase) se relaciona causalmente con el rechazo al colegio (Kearney y
Silverman, 1990).
Los datos obtenidos de controles experimentales bien diseñados permiten sóli-
das inferencias causales. Más aún, los controles realizados en el laboratorio y entor-
nos análogos pueden realizarse con un coste mínimo para paciente y terapeuta. No
obstante, una limitación importante del control experimental es su reducida aplica-
ción. Con esta estrategia sólo se pueden evaluar unas pocas interacciones.
506 William H. O"Brien y Stephen N. Haynes
En resumen, las variables distintivas, la aplicación combinada de distintos pro-

cedimientos de evaluación conductual, la observación conductual y controles ex-
perimentales pueden emplearse para recoger datos de las relaciones funcionales
causales. No obstante, tal como señala Haynes (1992), la solidez de la inferencia
causal asociada a cada método varía inversamente a la viabilidad clínica. Los con-
troles experimentales y observación conductual de interacciones en situaciones na-
turales pueden proporcionar datos que permitan inferencias firmes. Sin embargo,
cada método requiere una considerable inversión de tiempo y esfuerzo o sólo se
evalúan unas pocas conductas y factores determinante s. Por el contrario, las varia-
bles distintivas y la aplicación combinada de procedimientos apoyan sólo inferen-
cias causales débiles, si bien son poco costosos e informan de una amplia gama de
variables.
Por tanto, parece lógico emplear distintos métodos en las distintas fases del pro-
ceso de evaluación. En las primeras fases de la evaluación previa al tratamiento, el
analista puede necesitar apoyarse más en variables distintivas y aplicaciones combi-
nadas de procedimientos para identificar un gran número de relaciones causales po-
tenciales con un mínimo costo; después, tras reunir información adicional sobre las
interacciones, el analista deberá seleccionar un subgrupo de relaciones causales y so-
meter cada una a un examen más detallado empleando estrategias de observación y
control sistemático.
v12. Evaluación de la magnitud de las relaciones funcionales causales

Tras identificar un subgrupo de relaciones funcionales causales hipotéticas, el analis-
ta ha de estimar la importancia o magnitud de cada relación. Para esta tarea hay una
serie de métodos, cuyos dos enfoques más comunes se revisan en las secciones si-
guientes.
VI2.1. Evaluación intuitiva
En un esfuerzo por determinar las actividades clínicas de los terapeutas, Guevre-

mont y Spiegler (1990) realizaron una encuesta a 988 miembros de la Association for
Advancement of Behavior Therapy (AABT); junto con preguntas relacionadas con el
enfoque del tratamiento y sus problemas más frecuentes, se pidió a los encuestados
que informaran de los métodos más utilizados para recoger datos. Los seis más co-
munes fueron: entrevistas conductuales (90,18%), inventarios de autoinforme
(63,36%), autorregistro (55,87%), escalas de estimación de conducta (52,83%),
cuestionarios de conducta (49,70%) e inventarios de personalidad (47,76%). Cuatro
de estos métodos (entrevista, escalas de estimación, cuestionarios e inventarios de
personalidad) no proporcionan datos que permitan la evaluación estadística de las
relaciones funcionales entre sucesos determinantes hipotéticos y conductas. Más
aún, se puede añadir que muy pocos analistas de conducta evalúan normalmente los
datos de autorregistro por métodos estadísticos. Por tanto, se puede concluir que la
mayoría de los analistas de conducta en situaciones clínicas se basa en métodos intui-
507
CUADRO 21.1. Datos hipotéticos de autorregistro evaluando la relación entre nivel de activi-
dad física y presión sanguínea.
Día de observación Nivel de actividad (M/P) Presión sanguínea (H/N)
Lunes 1
Martes 2 > s
Miércoles 3 M N
Jueves 4 E H
Viernes :S) M H
Sábado 6 E H
Domingo 7 M H
Lunes 8 M N
Martes 9 M N
Miércoles 10 M H
Jueves 11 P H
Viernes 12 R N
Sábado 13 M H
Domingo 14 M N
Lunes 15 M H
Martes 16 P N
Miércoles 17 M H
Jueves 18 M N
Viernes 19 P H
Sábado 20 M H
Domingo 21 M H
Lunes ES M N
Martes 23 Pp H
Miércoles 24 M H
Jueves 25 a H
Viernes 26 M H
Sábado 27 Ea H
Domingo 28 M H
Lunes 29 M de
Martes 30 M 4
Miércoles 31 e E
Jueves 32 M E
Viernes 33 M y
Sábado 34 y hi
Domingo 35 M +
Lunes
SAA
36 A
M: mucho nivel de actividad; P: poco nivel de actividad; H: hipertenso, N: normotenso.
tivos de evaluación de los datos para establecer análisis funcionales «informales» o

«hipotéticos, pero sin comprobar» (Nelson, 1988; Singh y cols., 1991).
Un enfoque de evaluación intuitivo tiene algunas ventajas; primero, requiere
sólo una pequeña inversión de tiempo y esfuerzo por parte del analista; segundo,
puede resultar muy útil para generar hipótesis; y, tercero, los procesos de juicio hu-
mano pueden ser buenos para discernir patrones de relaciones complejas cuando se
proporcionan reglas de toma de decisiones (Meehl, 1986; Nezu y Nezu, 1989). Sin
embargo, una importante limitación del juicio clínico está relacionada con la estima-
ción errónea de la covariación (Arkes, 1981; Kleinmuntz, 1990; Matyas y Green-
wood, 1990). Consideremos los datos de autorregistro hipotéticos del cuadro 21.1;
en este ejemplo, el paciente registra sólo dos niveles de actividad física diaria (M = mu-
cha actividad, P =poca actividad) y presión sanguínea (H = nivel hipertenso, N = ni-
vel normotenso). Estime intuitivamente la magnitud de la relación entre actividad fí-
sica y presión sanguínea (emplee una escala de O = sin relación a 10 = correlación
perfecta). ¿Hasta qué grado está seguro de su estimación (emplee una escala de
0 = sin seguridad, a 10 = seguridad absoluta)?
Elaborando una tabla de 2 x 2 de contingencia de los datos del registro (véase
cuadro 21.2), se puede determinar fácilmente que la probabilidad (P) de obtener un
nivel de presión sanguínea hipertenso en un día de mucha actividad [P (H:M)] es
0,67. Igualmente, la probabilidad de obtener un nivel de presión sanguínea hiperten-
so en un día de poca actividad [P (H:E)] es 0,67; entonces, la relación entre actividad
física y nivel de presión sanguínea es cero: no se relacionan estadísticamente.
CUADRO 21.2. Tabla de contingencia de dos direcciones entre nivel de actividad física y pre-
sión sanguínea
Nivel de presión sanguínea
H N
M 16 8
Actividad (16) (8)
P 8 4
Nota: Los números entre paréntesis son las frecuencias esperadas de las casillas dada la inexistencia de
relación entre estrés e hipertensión.
M: mucha; P: poca; H: hipertenso; N: normotenso.
Probabilidades condicionales: probabilidad de presión sanguínea alta con mucha actividad
[P (H:M)] = 16/24=0,67; probabilidad de presión sanguínea alta con poca actividad [P (H:P)] = 8/12 =0,67;
probabilidad de presión sanguínea normal con mucha actividad [P (N:M)] = 8/24 = 0,33; probabilidad
de presión sanguínea normal con poca actividad [P (N:P)] =4/12=0,33
Análisis de Chi-cuadrado:
Chi-cuadrado: 0,00; D.F.: 1; Significación: 1,00.
Como ha señalado Arkes (1981), al realizar un análisis intuitivo de datos simila-

res a los del cuadro 21.1 muchos analistas sobrestiman la magnitud de las relaciones
funcionales o infieren una “correlación ilusoria” (Chapman y Chapman, 1969). Una
causa de este fenómeno es que la información de confirmación o los aciertos, esto es,
509
casos en los que la variable causal y el efecto hipotético ocurren o [P (H:M)] son so-
brevalorados en una toma de decisiones intuitiva relativa a descartar información
como los falsos positivos [P (N:M)] o fallos [P (H:E)].
Se ha identificado otra serie de prejuicios o limitaciones del juicio humano
(Chapman y Chapman, 1969; Einhorn, 1988; Elstein, 1988; Kanfer y Schefft, 1988;
Kleinmuntz, 1990; West, Finney y Ollendick, 1992). No obstante, un resultado es-
pecialmente problemático es que la confianza de un analista en sus juicios de cova-
ración aumenta con la experiencia, mientras que la exactitud permanece casi igual
(Arkes, 1981; Garb, 1989).
En conclusión, los enfoques intuitivos de evaluación de datos pueden ser ade-
cuados y útiles para formular hipótesis. Sin embargo, surgen problemas cuando los
analistas tratan de estimar intuitivamente la magnitud de la covariación entre las va-
riables determinantes hipotéticas y las conductas. Este problema se agrava cuando al
considerar el hecho de que en una evaluación conductual normal se encuentran con-
ductas múltiples, causas múltiples e interacciones múltiples. Por ello, es recomenda-
ble la realización de pruebas estadísticas siempre que sea posible para evaluar la soli-
dez de las relaciones funcionales causales hipotéticas.
vI2.2. Evaluación estadística de las relaciones funcionales
Análisis de probabilidad condicional
Los análisis de probabilidad condicional presuponen que las relaciones funcionales

pueden ser descritas matemáticamente como probabilidades condicionales elevadas
(James y cols., 1982; Schlundt, 1985). Una probabilidad condicional elevada indica
simplemente que la posibilidad de observar un cambio topográfico en una conducta,
dado que ocurra un suceso determinante hipotético (su probabilidad condicional), es
mayor que la probabilidad de observar un cambio topográfico en una conducta sin
considerar la presencia del suceso determinante (su tasa básica o probabilidad no
condicional). Para ilustrarlo, tomemos A = un incremento clínicamente significativo
(por ejemplo, mayor que 89 mmHg de presión sanguínea diastólica) de la presión
sanguínea en reposo (la conducta en cuestión), B = asistencia diaria a una clase de
gimnasia (suceso causal hipotético) y P = probabilidad. Una relación funcional que
se inferiría tentativamente es que la probabilidad de comprobar una reducción de
presión sanguínea significativa posterior a los ejercicios de gimnasia (P [A/B]) es ma-
yor que la tasa de probabilidad básica de comprobar una reducción significativa de
presión sanguínea (P [A]).
Los análisis de probabilidad condicional pueden emplearse para evaluar las rela-
ciones de conducta y variable determinante previa, conducta y variable determinan-
te consecutiva, y antecedente-conducta-consecuencia empleando fórmulas estadísti-
cas simples (Schlundt, 1985). Por ejemplo, considérense los datos hipotéticos de
evaluación del cuadro 21.3; estos datos podrían obtenerse de autorregistros, obser-
vación análoga, observación en sesiones o control experimental. Para conseguir esto,
el analista no necesita más que evaluar la presencia o ausencia de variables antece-
dentes, centrales y consecuentes en cada punto de observación.
CUADRO 21.3. Datos de autorregistros hipotéticos

A ————
Variable antecedente presente Variable antecedente ausente
Ar rs EA UA AAA
Consecuencia Consecuencia
Presente Ausente Presente Ausente
Presente 8 2 1 5
(5) (5) (5) (5)
Conducta
Ausente 2 8 5 5
(5) 5555 55
(5) ———————— (5) A _
(5)
___———————
e
Nota: Los números entre paréntesis son los valores esperados de la casilla dado que no hay relación en-
tre la conducta y la consecuencia.
Análisis de probabilidad condicional:

a. Cuando está presente la variable antecedente:
Probabilidad de presencia de la conducta cuando la consecuencia está presente = 8/10
Probabilidad de no presencia de la conducta cuando la consecuencia está presente =2/10
Probabilidad de presencia de la conducta cuando la consecuencia no está presente = 2/10
Probabilidad de no presencia de la conducta cuando la consecuencia no está presente = 8/10
Coeficiente de Chi-cuadrado = 0,60; prueba exacta de significación de Fisher = 0,01
b. Cuando no está presente la variable antecedente:

Probabilidad de presencia de la conducta cuando la consecuencia está presente = 5/10
Probabilidad de no presencia de la conducta cuando la consecuencia está presente = 5/10
Probabilidad de presencia de la conducta cuando la consecuencia no está presente = 5/10
Probabilidad de no presencia de la conducta cuando la consecuencia no está presente = 5/10
Coeficiente de Chi-cuadrado = 0,00; prueba exacta de significación de Fisher = 1,00
Un análisis de probabilidad condicional permitió una evaluación estadística de la

capacidad de asociación entre conducta y variables determinantes consecuentes bajo
distintas condiciones antecedentes. Los resultados de este análisis sugerían que
cuando la variable antecedente estaba presente había una fuerte asociación entre
conducta y factor determinante consecuente. No obstante, cuando la variable deter-
minante antecedente estaba ausente no había una relación significativa. Se pueden
realizar más análisis para evaluar los principales efectos de las variables antecedentes
o consecuentes en la conducta además de los efectos de la dependencia seriada
(Schlundt y Donahoe, 1983; Tavare y Altham, 1983; Schlundt, 1985).
Los análisis de probabilidad condicional tienen importantes ventajas y limitacio-
nes. En primer lugar, sólo un reducido número de puntos de datos pueden producir
estimaciones de asociaciones fiables (Schlundt, 1985); en segundo lugar, los concep-
tos estadísticos subyacentes en el método se entienden con facilidad; tercero, se pue-
den utilizar muchos paquetes estadísticos para los análisis de probabilidad condicio-
nal, o en caso contrario los cálculos se hacen fácilmente a mano. Un inconveniente es
que estos análisis evalúan las interacciones de un número reducido de variables; ade-
más, debido a que es una técnica no paramétrica, sólo puede aplicarse cuando las va-
511
ag determinantes y las conductas se evalúan usando escalas nominales u ordi-

nales.
Análisis de series temporales
Los análisis de series temporales requieren tomar medidas repetidas en el tiempo de

dimensiones topográficas y conductas concretas de las variables determinantes hi-
potéticas. La magnitud de las relaciones funcionales causales puede estimarse calcu-
lando una medida de asociación entre variables determinantes y conductas tras eli-
minar la variación debida a la correlación (Hartman y cols., 1980; Barlow y Hersen,
1984; Wei, 1990).
Cuando los datos de análisis se cuantifican por medio de escalas nominales u or-
dinales (por ejemplo, conversa/no conversa, durante tarea/sin tarea), se puede em-
plear el análisis secuencial de intervalos y el modelo de Markov para evaluar la mag-
nitud de las relaciones funcionales (Gottman y Roy, 1990). Sin embargo, con datos
escalares o de intervalo se pueden aplicar otros métodos de series temporales como
los análisis espectrales (Cook y Campbell, 1979; McCleary y Hay, 1980; Wei, 1990).
Los métodos de series temporales proporcionan información excelente sobre la
fuerza y fiabilidad de las relaciones funcionales. También se emplean para examinar
los efectos de las variables determinantes de conductas en distintos intervalos de
tiempo. Sin embargo, su aplicación se limita a situaciones en las que se puede obte-
ner al menos una medida de 50 puntos en la topografía de variables determinantes y
conductas (Gottman y Roy, 1990; Matyas y Greenwood, 1991), cuando se necesita
un conocimiento de las interacciones entre unas pocas variables, y cuando el analista
de conducta tiene suficiente familiaridad con los procedimientos estadísticos y tiem-
po para codificar y analizar los datos. La primera limitación se puede suprimir cuan-
do el analista diseña un sistema de observación o autorregistro que evalúe los datos
en proporción al tiempo disponible para el registro anterior al tratamiento. Por
ejemplo, si el analista estima que tiene dos semanas para el autorregistro previo al
tratamiento (n = 14 días) y que se necesitarán 50 puntos de medida para realizar un
análisis adecuado de series temporales, las variables determinantes y conductas ha-
brán de registrarse al menos cuatro veces al día (50/14). Igualmente, si la conducta de
un paciente se observa en un entorno análogo (por ejemplo, sesión de ejercicios de
representación de papeles) durante 15 minutos, la variable determinante hipotética
(por ejemplo, autoafirmaciones negativas) y conducta (por ejemplo, aversión visual)
han de muestrearse cada 15 segundos para obtener 60 puntos de datos. El impacto de
la segunda limitación se atenuará si el analista selecciona un pequeño subgrupo de
variables antes de decidir los procedimientos de recogida de datos. Las soluciones
potenciales a la última limitación dependen de la disponibilidad de recursos. Los
analistas de conducta en universidades y grandes centros de asistencia podrán dispo-
ner de ayudantes entrenados que recojan y codifiquen los datos. Además, los recur-
sos para un entrenamiento formal en métodos de series temporales son mayores en
las universidades. A pesar de estos recursos, los métodos de series temporales pue-
den ser impracticables por el tiempo y esfuerzo que requieren,
En definitiva, a modo de resumen, podríamos señalar que las formulaciones con-
ductuales de los trastornos de conducta se hacen cada vez más complejas. Como con-
secuencia, los analistas han de ser capaces de identificar y evaluar muchas relaciones
funcionales entre factores determinantes y conductas. Parte de la habilidad para reali-
zar esta tarea se basa en un buen conocimiento de las distintas dimensiones de la topo-
grafía que pueden ser cuantificadas, de las formas múltiples en que las variables deter-
minantes y conductas interactúan en un trastorno de conducta, y de los presupuestos
y estrategias de decisión propias empleadas para determinar los campos causales.
Además del conocimiento, para identificar empíricamente las relaciones funcio-
nales causales han de emplearse métodos de evaluación específicos como la estrate-
gia de variables distintivas, aplicación combinada de distintos procedimientos de
evaluación conductual, observación y autorregistro de interacciones en entornos na-
turales, y controles experimentales. Cada método tiene ventajas y limitaciones rela-
cionadas con la solidez de las inferencias causales derivadas de los datos y del grado
de aplicación clínica. En general, los métodos que permiten inferencias causales más
sólidas (observación y autorregistro de interacciones y control experimental) son
costosos y limitados en su aplicación. Por el contrario, los métodos menos costosos
y de mayor aplicación (estrategias de variables distintivas y aplicación combinada de
distintos procedimientos de evaluación) tienden a permitir sólo inferencias causales
débiles. De este modo, al principio del proceso de evaluación previo al tratamiento,
el uso de estos últimos puede ser más apropiado. Más tarde, tras concretar el espec-
tro de relaciones funcionales causales hipotéticas, se recomiendan las estrategias de
evaluación que permiten relaciones causales más seguras. Una vez que se han obte-
nido los datos básicos de evaluación de las relaciones funcionales causales hipotéti-
cas, se pueden emplear procedimientos intuitivos y estadísticos para evaluar la mag-
nitud de la asociación. Los enfoques intuitivos son más apropiados para la
formulación de hipótesis, si bien la intuición humana es a menudo inexacta como
método para estimar la magnitud de la covariación entre variables. Por el contrario,
los enfoques estadísticos pueden proporcionar información sin prejuicios sobre la
seguridad de la relación funcional. Los análisis de probabilidad condicional pueden
ser particularmente útiles ya que sólo requieren una pequeña cantidad de datos, y se
entienden y se aplican fácilmente.
VI. MODELO CAUSAL ANALÍTICO FUNCIONAL: UN MÉTODO PARA INTEGRAR

Y SINTETIZAR DATOS DE EVALUACIÓN
Derivado de una combinación de métodos de evaluación, el análisis funcional con-

tiene información sobre las relaciones entre factores determinantes múltiples y con-
ductas para cada paciente. Como se observó antes, estas relaciones pueden variar se-
gún el grado de causalidad inferida (unas se juzgan causales y otras correlacionadas),
la solidez de la asociación (algunas explican más variación que otras), la direccionali-
dad (unidireccionalidad o bidireccionalidad), y la forma (lineal o no lineal). Además,
algunas de las relaciones serán directas, mientras que otras estarán mediadas por la
presencia de otras variables causales.
Para ayudar a la interpretación y comunicación de información de evaluación
compleja hemos recomendado que los analistas construyan modelos causales analí-
Análisis funcional de la conducta 513
ticos funcionales (Haynes, 1988, 1992; Haynes y O'Brien, 1990). Los modelos cau-
sales analíticos funcionales son diagramas de vectores que representan las relaciones
causales, controlables e importantes entre los distintos grupos de factores determi-
nantes y conductas para un paciente (Haynes, 1988; Haynes y O'Brien, 1990). La fi-
gura 21.2 es un ejemplo de modelo causal de un paciente que buscaba tratamiento
conductual para síntomas hemiparéticos (parálisis parcial de un brazo) acentuados
por el estrés.
FIGURA 21.2. Modelo causal analítico funcional de un paciente que presenta síntomas hemi-
paréticos en un brazo. Dimensiones topográficas de las variables determinan-
tes y conductas
Daños en
el sistema
nervioso
seal Activación
p del SNS
Tensión /
disfunción
creciente
del brazo
"Situaciones estresantes"
Autorregistro
reducido de
Encuentros sociales conducta y
y tareas difíciles pensamientos
Autocríticas
negativas
Relación causal
unidireccional
—» Relación causal
bidireccional
Relación de
correlación
Relación débil
Relación fuerte
Las relaciones funcionales causales hipotéticas contenidas en este modelo fueron

identificadas empleando varios métodos de evaluación. Por medio de entrevistas
conductuales se obtuvo primeramente información (variables distintivas) de una
amplia gama de variables determinantes potenciales y conductas. Además, la obser-
vación de interacciones que tuvieron lugar durante las entrevistas dio lugar a varias
hipótesis sobre el efecto de los factores de estrés en el funcionamiento del brazo. En
particular, se observó que cuando el cliente discutía temas “estresantes” (por ejem-
plo, encuentros sociales embarazosos) su cara se sonrojaba, su conversación se hacía
tangencial, su mano se cerraba y su brazo se cerraba sobre su pecho. El paciente tam-
bién decía que cuando se “estresaba” tendía a “perder el hilo” de sus pensamientos y
a “olvidar” el control de su mano y brazo afectados.
Tras completar la entrevista, se dieron instrucciones al paciente para que autorre-
gistrara la tensión/disfunción del brazo, los niveles de estrés y los sentimientos agra-
dables en una escala de O a 10 cuatro veces al día. Asimismo, el paciente registraba su-
cesos de la situación externa e interna que ocurrían antes, durante y después de un
aumento significativo de la tensión/disfunción del brazo. “Tras dos semanas se eva-
luaron los datos del autorregistro con análisis de probabilidad condicional (véase
cuadro 21.4). Los resultados de este análisis indicaban que la tensión/disfunción del
brazo estaba asociada significativamente con los niveles de estrés registrados. El pa-
ciente también recogía en el impreso de autorregistro que las tareas difíciles, interac-
ciones sociales y autocríticas (por ejemplo, anticipar el rechazo social o fracaso en ta-
reas importantes) se asociaban a los mayores niveles de estrés y tensión/disfunción
del brazo.
CUADRO 21.4. Tabla de contingencia en dos direcciones entre nivel de estrés y síntomas he-
miparéticos
Tensión/disfunción del brazo
mucha poca
elevado 23 3 26
(18) (8)
Nivel de estrés
reducido 6 6 12
(8) (4)
26 12
Nota: Los números entre paréntesis son las frecuencias esperadas de las casillas dado que no hay relación
entre estrés e hipertensión.
Probabilidad condicional: Probabilidad de mayor disfunción dado estrés elevado = 23/26 = 0,88; proba-
bilidad de mayor disfunción dado estrés reducido = 6/12 =0,50; probabilidad de menor disfunción dado
estrés elevado = 3/26 = 0,12; probabilidad de menor disfunción dado estrés reducido = 6/12 = 0,50.
Análisis de Chi cuadrado:

Chi cuadrado: 4,76; D.F.: 1; Significación: 0,03.
> Posteriormente se diseñó un control experimental para comprobar las siguientes

1pótesis:
a. Las situaciones causantes de estrés (tareas difíciles, interacciones sociales...)

y autocríticas provocarán un incremento en la actividad del sistema nervioso
simpático (SNS).
b. El incremento en la actividad del SNS se asociará con un incremento en los

niveles de tensión muscular (EMG) del brazo afectado.
Las medidas de la actividad del SNS (tasa cardíaca, conductancia de la piel y am-
plitud del pulso del volumen sanguíneo) y niveles de tensión muscular se obtuvieron
en un laboratorio de psicofisiología bajo las siguientes condiciones: línea base en re-
poso, globo hinchable (factor de estrés físico), globo que estallaba (sobresalto), sus-
tracción seriada (tarea difícil) e imágenes controladas de interacciones sociales gene-
radoras de ansiedad. Un examen visual de los datos psicofisiológicos indicaba que
los niveles de tensión muscular del brazo afectado eran significativamente mayores y
más variables durante las condiciones de estrés e imágenes negativas. Un análisis de
probabilidad condicional de estos datos confirmó la presencia de una relación esta-
dísticamente significativa entre la presentación de factores de estrés en laboratorio y
el aumento de la activación de las medidas fisiológicas.
Se diseñó un tratamiento para el paciente basado en el modelo causal analítico
funcional. Utilizando el principio de «variación compartida» (Haynes, 1986), se se-
leccionó para modificación el subgrupo de relaciones funcionales que se consideraba
responsable de la mayor variación en la conducta. En este caso, las relaciones funcio-
nales entre niveles de tensión muscular, actividad del sistema nervioso simpático,
conciencia de la tensión/posición del brazo y autocríticas negativas fueron el objeto
del cambio. La intervención consistió en biorretroalimentación de tensión muscular
(para facilitar la conciencia de la tensión del brazo), entrenamiento de relajación
(para mejorar el control de la activación del sistema nervioso simpático), y entrena-
miento en autoinstrucción (encaminado a reducir la frecuencia y “credibilidad” de
las autocríticas negativas).
vii. Ventajas de un modelo causal analítico funcional

Existen varias ventajas al emplear un modelo causal analítico funcional. En primer
lugar sistematiza los procesos clínicos de toma de decisiones y por tanto fuerza al
analista a prestar atención a la complejidad del caso, las propiedades funcionales de
las conductas y a considerar si se han recogido y/o analizado suficientes datos empí-
ricos para apoyar la presencia hipotética de una relación funcional entre conjuntos
de variables. Segundo, promueve una mayor integración de los datos de evaluación
con el diseño del tratamiento. Tercero, los modelos causales funcionales pueden faci-
litar la identificación de relaciones causales adicionales que pueden estar afectando a
las conductas. Cuarto, los modelos causales funcionales pueden proporcionar una
explicación conductual escueta de los muchos factores que dominan un conjunto de
conductas. El modelo hipotético puede revisarse con pacientes, guardarse en los ar-
chivos e informes médicos y pasarse a otros profesionales sin largas explicaciones.
VI. CONCLUSIONES
El análisis funcional hace énfasis en la identificación y cuantificación de importantes

relaciones funcionales causales controlables con el propósito de diseñar la interven-
ción. Las concepciones conductuales actuales sugieren que diversos factores juegan
un papel en el inicio, mantenimiento y/o fin de muchos trastornos de conducta. De
este modo, los analistas de conducta deben familiarizarse con la creciente literatura
sobre investigaciones y ser capaces de evaluar una amplia gama de interacciones en-
tre factores determinantes y conductas en pacientes que buscan tratamiento.
Existen varios métodos para obtener y evaluar los datos de las relaciones funcio-
nales. Cada uno tiene ventajas y limitaciones con respecto a la solidez de las inferen-
cias causales y aplicación clínica. Empleando procedimientos y estrategias de evalua-
ción múltiples, el analista puede diseñar una batería de evaluación lo suficientemente
amplia como para muestrear muchas relaciones causales potenciales y al mismo
tiempo específica para generar datos que permitan inferencias causales y pruebas es-
tadísticas.
El modelo causal analítico funcional se ofrece como método para organizar, inter-
pretar y comunicar la información contenida en un análisis funcional. También puede
sistematizar aspectos de los procesos clínicos de toma de decisiones y permite mayor
exactitud y fiabilidad de la estimación de las relaciones funcionales. Sin embargo,
quedan por contestar varias preguntas importantes sobre el análisis y el modelo cau-
sal funcional. Primero, ¿hasta qué punto conduce a intervenciones más eficaces el uso
de un análisis funcional previo al tratamiento?; segundo, ¿puede entrenarse a los ana-
listas para identificar y evaluar con fiabilidad las relaciones funcionales causales?; ter-
cero, ¿cómo son de generalizables los análisis y modelos funcionales en pacientes,
conductas y situaciones?; y, cuarto, ¿pueden diseñarse métodos estadísticos de un
solo sujeto con el propósito de comprobar los modelos causales analítico-funciona-
les? Ciertamente todas estas cuestiones requieren investigaciones sistemáticas.
Arkes, H. R. (1981). Impediments to accurate clinical judgement and possible ways to mini-
mize their impact. Journal of Consulting and Clinical Psychology, 49, 323-330.
Axelrod, S. (1987). Functional and structural analyses of behavior: Approaches leading to the
reduced use of punishement procedures? Research in Developmental Disabilities, 8, 165-
178.
Bandura, A. (1981). In search of pure unidirectional determinants. Behavior Therapy, 12, 30-
40.
ment of human behavior. Stanford. Stanford University Press.
Barlow, D. H. (1988). Anxtety and its disorders. Nueva York. Guilford.
Barlow, D. H., Hayes, S. C. y Nelson, R. O. (1984). The scientist practitioner: Research and
accountability in clinical and educational settings. Nueva York. Pergamon Press.
Barlow, D. H, y Hersen, M. (1984). Single case experimental designs: Strategies for studying
behavior change (2 ed.). Nueva York. Pergamon Press.
Barrios, B. (1988). On the changing nature of behavioral assessment. En A. S. Bellack y
m0 Hersen (dirs.), Behavioral assessment: A practical handbook. Nueva York. Pergamon
ress.
Beach, S., Sandeen, E. y O'Leary, K. D. (1990). Depression in marriage. Nueva York. Guil-
ford Press.
Bellack, A. S. y Hersen, M. (1988). Behavioral assessment: A practical handbook. Nueva
Blalock, H. M. (1964). Causal inferences in nonexperimental research. Chapel Hill. Univer-
sity of North Carolina Press.
Blalock, H. M. (1969). Theory construction: From verbal to mathematical formulations. En-
glewood Cliffs. Prentice-Hall.
Bornstein, P. H., Hamilton, S. B. y Bornstein, M. T. (1986). Self-monitoring procedures. En
A. R. Ciminero, C. S. Calhoun y H. E. Adams (dirs.), Handbook of behavioral assessment
(2.* ed). Nueva York. Wiley.
Bornstein, D. A., Borkovec, T. D. y Coles, M. G. H. (1986). Assessment of anxiety. En A. R. Cimi-
nero, C. S. Calhoun y H. E. Adams (dirs.), Handbook of behavioral assessment. Nueva
York. John Wiley and Sons.
Burish, T. G., Carey, M. P., Krozely, M. G. y Greco, F. A. (1987). Conditioned side effects
induced by cancer chemotherapy: Prevention through behavioral treatment. Journal of
Carey, M. P. y Burish, T. G. (1988). Etiology and treatment of the psychological side effects
associated with cancer chemotherapy. Psychological Bulletin, 104, 307-325.
Carr, E. G. y Durand, V. M. (1985). Reducing behavior problems through functional com-
munication training. Journal ofApplied Bolado Analysis, 18, 111-126.
Chapman, L. J. y Chapman, J. P. (1969). Illusory correlation as an obstacle to the use of valid
psychodiagnostic signs. Journal of Abnormal Psychology, 74, 271-280.
Ciminero, A. R., Calhoun, C. S. y Adams, H. E. (1986). Handbook of behavioral assessment.
Nueva York. John Wiley and Sons.
Clark, D. M., Salkovskis, P. M. y Chalkey, A. J. (1985). Respiratory control as a treatment for
panic attacks. Journal of Behavior Therapy and Experimental Psychiatry, 16, 23-30.
sessment. En A. S. Bellack y M. Hersen (dirs.), Behavioral assessment: A practical hand-
book. (3.? ed). Nueva York. Pergamon Press.
Cook, T. D. y Campbell, D. T. (1979). Quasi-experimentation: Design and analysis issues for
field settings. Chicago. Rand McNally.
Correa, E. 1. y Sutker, P. B. (1986). Assessment of alcohol and drug behaviors. En A. R. Ci-
minero, K. S. Calhoun y H. E. Adams (dirs.), Handbook of behavioral assessment
(2.* ed.). Nueva York. John Wiley and Sons.
Cowdery, G. E., Iwata, B. A. y Pace, G. M. (1990). Effects and side effects of DRO as a treat-
ment for self-injurious behavior. Journal ofApplied Behavior Analysis, 23, 497-506.
Craighead, W. E., Kazdin, A. E. y Mahoney, M. ]. (1981). Behavior modification: Principles,
issues, and applications (2.* ed.). Boston. Houghton Mifflin. de RAN
Delprato, D. J. y McGlynn, F. D. (1988). Interactions of response patterns and their implica-
tions for behavior therapy. Journal of Behavior Therapy and Experimental Psychiatry, 19,
199-205.
Delprato, D. J. y Midgley, B. D. (1992). Some fundamentals of B. F. Skinner's behaviorism.
American Psychologist, 47, 1507-1520. á.
Durand, V. M. y Carr, E. G. (1991). Functional communication training to reduce challen-
sing behavior: Maintenance and application in new settings. Journal ofApplied Behavior
Analysis, 24, 251-264. 1 mx LO
Durand, V. M. y Crimmins, D. (1988). pi the variables maintaining self-injurious
behavior. Journal ofAutism and Developmental Disorders, 18, 99-117.
Einhorn, H. J. (1988). Diagnosis and causality in clinical and statistical prediction. En D. C. Turk
y P. Salovey (dirs.), Reasoning, inference, and judgment in clinical psychology. Nueva York.
The Free Press. Pa :
Elstein, A. S. (1988). Cognitive processes in clinical inference and decision making. En
D. C. Turk y P. Salovey (dirs.), Reasoning, inference, and judgment in clinical psychology.
Nueva York. The Free Press. loc lod
Evans, IL. M. (1985). Building systems models as a strategy for target behavior selection in cli-
nical assessment. Behavioral Assessment, 7, 21-32. :
Eysenck, H. J. (1988). Psychotherapy to behavior therapy: A paradigm shift. En D. B. Fish-
man, F. Rotgers, C. M. Franks (dirs.), Paradigms in behavior therapy: Present and promi-
se. Nueva York. Springer.
Feurstein, M., Labbe, E. E. y Kuczmierczyk, A. R. (1986). Health psychology: A psychobiolo-
gical perspective. Nueva York. Plenum Press.
Foster, S. L., Bell-Dolan, D. J. y Burge, D. A. (1988). Behavioral observation. En A. S. Be-
llack y M. Hersen (dirs.), Behavioral assessment: A practical handbook (3.* ed). Elmstord.
Pergamon Press.
Foster, S. L. y Cone, J. D. (1986). Design and use of direct observation systems. En A. R. Ci-
minero, C. S. Calhoun y H. E. Adams (dirs.), Handbook of behavioral assessment.
(2. ed.). Nueva York. Wiley.
Fredrikson, M. y Matthews, K. A. (1990). Cardiovascular responses to behavioral stress and
hypertension: A meta-analytic review. Annals of Behavioral Medicine, 12, 30-39.
Garb, H. N. (1989). Clinical judgement, clinical training, and professional experience. Psy-
chological Bulletin, 105, 387-396.
Goodwin, F. K. y Jamison, K. R. (1990). Manic-depressive illness. Nueva York. Oxford Uni-
versity Press.
Gottman, J. M. y Roy, A. K. (1990). Sequential analysis: A guide for behavioral researchers.
Nueva York. Cambridge Press.
Guevremont, D. C. y Spiegler, M. D. (1990). What do behavior trerapists really do? A survey
of the clinical practice of AABT members. Comunicación presentada al 24th Annual Con-
vention of the Association for Advancement of Behavior Therapy. San Francisco, EE UU.
Gump, P. V. (1977). Ecological psychologists: Critics or contributors to behavior analysis.
En A. Rogers-Warren y S. F. Warren (dirs.), Ecological perspectives in behavior analysis.
Baltimore. University Park Press.
Hartmann, D., Gottman, J., Jones, R., Gardner, W., Kazdin, A. y Vaught, R. (1980). Inte-
rrupted time-series analysis and its application to behavioral data. Journal of Applied Be-
havior Analysis, 13, 543-559,
Hartmann, D. P. y Wood, D. D. (1990). Observational methods. En A. S. Bellack, M. Hersen
y A. E. Kazdin (dirs.), International handbook of behavior modification and therapy
(2.* ed.). Nueva York. Plenum Press.
Hawkins, R. P. (1986). Selection of target behaviors. En R. O. Nelson y S. C. Hayes (dirs.),
Conceptual foundations of behavioral assessment. Nueva York. Guilford Press.
Hayes, S. C. y Follette, W. C. (1992). Can functional analysis provide a substitute for syn-
dromal classification? Behavioral Assessment, 14, 345-365.
Hayes, S. C., Nelson, R. O. y Jarret, R. B. (1987). The treatment utility of assessment: A
functional approach to evaluate assessment quality. American Psychologist, 42, 963-974.
Haynes, S. N. (1986). The design of intervention programs. En R. O. Nelson y S. C. Hayes
(dirs.), Conceptual foundations of behavioral assessment. Nueva York. Guilford Press.
Inálisis funcional de la conducta 519
Haynes, S. N. (1988). Causal models and the assessment-treatment relationship in behavior

therapy. Journal of Psychopathology and Behavioral Assessment, 10, 171-183.
Haynes, S. N. (1992). Models of causality in psychopathology: Toward dynamic, synthetic,
and nonlinear models of behavior disorder. Nueva York. MacMillan.
Haynes, S. N. y Gannon, L. R. (1981). Psychosomatic disorders: A psychophysiological appro-
ach to etiology and treatment. Nueva York. Praeger.
Haynes,S.N. y O'Brien, W. H. (1988). The Gordian Knot of DSM-II1-R use: Integrating
Pas of behavior classification and complex causal models. Behavioral Assessment,

Psychology Reviero, 10, 649-668.
Haynes, S. N., Spain, E. H. y Olivera, J. (en prensa). Identifying causal relationships in clini-
cal assessment. Psychological Assessment.
Haynes, S. N. y Wai Alae, K. (1994). Psychometric foundations of behavioral assessment. En
R. Fernández-Ballesteros (dir.), Evaluación conductual hoy. Una alternativa para el cam-
bio en psicología clínica y de la salud. Madrid. Pirámide.
Hocking, J., O'Brien, W. H., Wise, P., Michael, S. yJohnson, H. (1992). Associations between
ruminative cognitions and cardiovascular recovery from stress. Comunicación presentada
al 26th Annual Convention of the Association for Advancement of Behavior Therapy.
Boston, EE UU.
Hollander, B. J. y Serganian, P. (1984). Aerobic fitness and psychophisiological reactivity.
Canadian Journal of Behavioural Science, 16, 257-261.
Hollandsworth, J. G. (1986). Physiology and behavior therapy: Conceptual guidelines for the
clinician. Nueva York. Plenum Press.
James, L. R., Mulaik, S. A. y Brett, J. M. (1982). Causal analysis: Assumptions, models, and
data. Beverly Hills. Sage.
Julius, S. y Weder, A. B. (1989). Brain and the regulation of blood pressure: A hemodynamic
perspective. Clinical and Experimental Theory and Practice, 11 (supl. 1), 1-19.
Kanfer, F. H. (1985). Target selection for clinical change programs. Behavioral Assessment, 7,
7-20.
Kanfer, F. H. y Phillips, J. (1970). Learning foundations of behavior therapy. Nueva York.
John Wiley and Sons.
Kanfer, F. H. y Schefft, B. K. (1988). Guiding the process of therapeutic change. Champaign.
Research Press.
Kaplan, N. M. (1986). Clinical hypertension (4.* ed.). Baltimore. Williams and Wilkins.
Kazdin, A. E. (1984). Behavior modification in applied settings (3. ed.). Homewood. Dorsey
Press.
Kazdin, A. E. (1992). Research design in clinical psychology. Nueva York. MacMillan.
Kearney, C. A. y Silverman, W. K. (1990). A preliminary analysis of a functional model of as-
sessment and treatment for school refusal behavior. Behavior Modification, 14, 340-366.
Kern, J. M. (1991). An evaluation of a novel role-playing methodology: The standardized
idiographic approach. Behavior Therapy, 22, 13-29. :
Kleinmuntz, B. (1990). Why we still use our heads instead of formulas: Toward an integrative
approach. Psychological Bulletin, 107, 296-310.
Kohlenberg, R. J. y Tsai, M. (1987). Functional analytic psychotherapy. En N. Jacobson
(dir.), Psychotherapists in clinical practice: Cognitive and behavioral perspectives. Nueva
York. Guilford Press. :
Krasner, L. (1992). The concepts of syndrome and functional analysis: Compatible or in-
compatible. Behavioral Assessment, 14, 307-321. lo (AE 4
Lauterbach, W. (1990). Situation-response (S-R) questions for identifying the function of
problem behaviour: The example of thumb sucking. British Journal of Clinical Psycho-
logy, 29, 51-57.
Levey, A. B., Aldaz, J. A., Watts, F. N. y Coyle, K. (1991). Articulatory suppression and the
treatment of insomnia. Behaviour Research and Therapy, 29, 85-89.
Maisto, S. A. (1985). Behavioral formulation of cases involving alcohol abuse. En IL. D. Turkat
(dir.), Behavioral case formulation. Nueva York. Plenum Press.
Mash, E. J. y Hunsley, J. (1990). Behavioral assessment: Á contemporary app roach. En A.S. Be-
llack y M. Hersén (dirs.), International handbook of behavior modification and therapy
(2 ed). Nueva York. Plenum Press. |
Matyas, T. A. y Greenwood, K. M. (1990). Visual analysis of single-case time series: Effects
of variability, serial dependence, and magnitude of intervention effect. Journal of Applied
Behavior Analysis, 23, 341-351. : Wat
Matyas, T. A. y Greenwood, K. M. (1991). Problems in the estimation of autocorrelation in
brief time series and some implications for behavioral data. Behavioral Assessment, 13,
137-157.
McCleary, R. y Hay, R. (1980). Applied time series analysis for the social sciences. Beverly
Hills. Sage.
Meehl, P. (1986). The causes and effects of my disturbing little book. Journal of Personality
Miller, D. J. (1991). Simple phobia as a symptom of posttraumatic stress disorder in a former
prisoner of war. Behavior Modification, 15, 250-260.
Morrison, R. L. (1990). Interpersonal dysfunction. En A. S. Bellack y M. Hersen (dirs.), In-
ternational handbook of behavior modification and therapy. Nueva York. Plenum Press.
Nelson, R. O. (1988). Relationships between assessment and treatment within a behavioral
perspective. Journal of Psychopathology and Behavioral Assessment, 10, 155-169.
Nelson, R. O. y Hayes, S. C. (1986). The nature of behavioral assessment. En R. O. Nelson y
S. C. Hayes (dirs.), Conceptual foundations of behavioral assessment. Nueva York. Guil-
ford Press.
Nezu, A. M. y Nezu, C. M. (1989). Clinical decision making in behavior therapy: A problem
solving perspective. Champaign. Research Press.
O”Brien, W. H. y Haynes, S. N. (1996). Behavioral assessment in the psychiatric setting. En
A.S. Bellack y M. Hersen (dirs.), Handbook of behavior therapy in the psychiatric setting.
Nueva York: Plenum Press.
Paul, G. L. (19864). Assessment in residential settings: Principles and methods to support cost-
effective quality operations. Champaign. Research Press.
Paul, G. L. (1986b). The time sample behavioral checklist: Observational assessment instru-
mentation for service and research. Champaign. Research Press.
Peterson, L., Homer, A. L. y Wonderlich, S. A. (1982). The integrity of independent varia-
bles in behavior analysis. Journal of Applied Behavior Analysis, 15, 477-492.
Pickering, G. T. y Gerin, W. (1990). Cardiovascular reactivity in the laboratory and the role
of behavioral factors in hypertension: A critical review. Annals of Behavioral Medicine,
123-163
Saris, W. E. y Stronkhorst, L. H. (1984). Causal modeling in nonexperimental research: An
introduction to the LISREL approach. Amsterdam. Sociometric Research Foundation.
Schlundt, D. G. (1985). An observational methodology for functional analysis. Bulletin for
the Society of Psychologists in Addictive Behaviors, 4, 234-249.
Schlundt, D. G. y Donahoe, C. P. (1983). Testing for independence between pairs of autoco-
rrelated binomial data sequences. Journal of Behavioral Assessment, 5, 309-316.
Schoggen, P. (1989). Behavior settings: A revision and extension of Roger G. Barker's ecologi-
cal psychology. Stanford. Stanford University Press.
Schwartz, G. E. (1986). Emotion and psychophysiological organization: Á systems approach.
En M. G. H. Coles, E. Donchin y S. W. Porges (dirs.), Psychophysiology: systems, processes,
and applications. Nueva York. Guilford Press.
Scott, $. P. (1978). Critical periods. Stroudsburg. Dowden, Hutchinson y Ross.
Singh, N. N., Deitz, D. D., Epstein, M. H. y Singh, J. (1991). Social behavior of students who
are seriously emotionally disturbed: A quantitative analysis of intervention studies. Beha-
vior Modification, 15, 74-94.
Smith, R. G., Iwata, B. G., Vollmer,T.R. y Pace, G. M. (1992). On the relationship between
a behavior and self-restraint. Journal of Applied Behavior Analysis, 25, 433-
0%
Strosahl, K. D. y Linehan, M. M. (1986). Basic issues in behavioral assessment. En A. Cimi-
nero, K. S. Calhoun y H. E. Adams (dirs.), Handbook of behavioral assessment (2.2 ed).
Nueva York. Wiley.
Tavare, S. y Altham, M. E. (1983). Serial dependence in observations leading to contingency
tables, corrections to chi-squared statistics. Biometrika, 70, 139-144.
Taylor, J. C. y Carr, E. G. (1992a). Severe problem behaviors related to social interaction 1:
Attention seeking and social avoidance. Behavior Modification, 16, 305-335.
Taylor, J. C. y Carr, E. G. (1992b). Severe problem behaviors related to social interaction 2: A
systems analysis. Behavior Modification, 16, 336-371.
Turkat, I. D. y Maisto, S. A. (1985). Application of the experimental method to the formula-
tion and modification of personality disorders. En D. H. Barlow (dir.), Clinical handbook
ofpsychological disorders. Nueva York. Guilford.
Voeltz, L. M. y Evans, L M. (1982). The assessment of behavioral interrelationships in child
behavior therapy. Behavioral assessment, 4, 131-165.
Vrana, S. R., Constantine, J. A. y Westman, J. S. (1992). Startle reflex modification as an aut-
come measure in the treatment of phobia: Two case studies. Behavioral Assessment, 14,
279-291.
Wei, W. S. (1990). Time series analysis: Univariate and multivariate methods. Redwood
City. Addison-Wesley.
Weist, M. D., Finney, J. W. y Ollendick, T. H. (1992). Cognitive bias in child behavior the-
rapy. The Behavior Therapist, 15, 249-253.
Willems, E. P. (1977). Steps toward an ecobehavioral technology. En A. Rogers-Warren y
S. F. Warren (dirs.), Ecological perspectives in behavior analysis. Baltimore. University
Park Press.

184,
Haynes, S. N. (1995). Causalidad multivariada en psicopatología: introducción a los modelos
causales. En V. E. Caballo, G. Buela-Casal y J. A. Carrobles (dirs.), Manual de psicopato-
logía y trastornos psiquiátricos (vol. 1). Madrid. Siglo XXI ne
É Psychology Reviez, 10, 649-668. 2 E «y
- Haynes, S. N. y Wao”Alae, K. (1994). Fundamentos psicométricos de la evaluación conduc-
tual. En R. Fernández-Ballesteros (dir.), Evaluación conductual hoy. Un enfoque para el
cambio en psicología clínica y de la salud. Madrid. Pirámide.
uanAN
E pr
| e
pr
$ 5 0% ponnes
1 de _
1 e
; Hez
SA vi >, | TUE EE 2%bi2 a
%
da »
E DUNA
ES DA VITA
E Y DA
r El >
y ) y nie e Mi e ? Ni a. )
A má
) A No q e
, . PA PE oriol e
'
,
n mn y 5 ¿ino HE DUO EZ Ne VE PAS
' va, he Í Y
a) e e; E! La ib)AUT
a d ME. , - , LA YA Y ¿ME po Roj
$ p
*
Ñ pla, o !
pon a
PARUTORA
¿HL MUST >
: de
]
.. q
3
; |
,
E Y
TERCERA PARTE
EVALUACIÓN DE LA INTELIGENCIA
ES
— AOVADIIITVILATAIG MOIDAUJAVS
3 Ñ ] Ñ E A O Ted Y
/ dt PS, e e :
day
22. EVALUACIÓN DE LA INTELIGENCIA GENERAL
LEANDRO S. ALMEIDA y GUALBERTO BUELA-CASAL
Il. INTRODUCCIÓN
A pesar de que, en la actualidad, términos como “inteligencia”, “aptitudes”, “capaci-

dad intelectual” o “cociente intelectual” son menos frecuentes en la literatura en psi-
cología e, inclusive, desaparecen de los nombres de los tests construidos para su eva-
luación, todavía está vigente su estudio. La evaluación de las aptitudes cognitivas
constituye uno de los dominios más significativos de la aplicación de la psicología en
nuestros días (Wigdor y Garner, 1982). Es cierto que hubo errores en la teoría y en la
práctica acerca del constructo genérico de “inteligencia”, siendo la mayoría de ellos
cometidos a la hora de su evaluación, cuando el test se tomaba como información se-
gura y exclusiva; sin embargo, no podemos negar una realidad psicológica o descui-
dar su estudio por el hecho de haber perdido en la actualidad la posición de privile-
gio que ocupaba treinta años atrás.
Si es cierto que parte de los errores cometidos y de las críticas formuladas eran
acerca de la falta de unanimidad de los autores sobre la definición de la inteligencia,
no es menos cierto que una postura académica y científica nos debe obligar a la bús-
ueda de un mejor conocimiento y una mejor explicación de la realidad psicológica.
Además, se debe tener en cuenta que la psicología no es una ciencia y una práctica
aislada, sino que se integra en un contexto más amplio de las ciencias humanas, y la
apreciación crítica de sus hechos debe tener en cuenta siempre el contexto sociocul-
tural de cada época y la tipología de solicitudes formuladas por la sociedad. Si hoy
vivimos en la era de la informática y de la comunicación, y si ello provocó una verda-
dera revolución cognitiva en el estudio de la inteligencia, es necesario tener en cuenta
conceptos más actuales en la literatura, tales como “cognición”, procesos cogniti-
vos”, “metacognición” o “estrategias”.
Las diferentes opiniones con respecto a la definición de inteligencia permanecen
todavía en la actualidad (Almeida, 1988), suscitando algunas dificultades. En este ca-
pítulo nos centraremos fundamentalmente en el concepto más general de la inteli-
gencia como capacidad cognitiva o inteligencia general. En otros capítulos de este
manual el lector encontrará referencias a la evaluación de las aptitudes intelectuales,
del desarrollo intelectual y del rendimiento. Tradicionalmente, los tests de inteligen-
cia relacionados con aptitudes y capacidades se diferenciaron de los tests de rendi-
miento más asociados a los conocimientos y el aprendizaje. A pesar de que tal distin-
ción se ha atenuado en la actualidad, como tendremos ocasión de indicar, optamos
por considerar en este capítulo todavía la inteligencia general como potencial cogni-
tivo del sujeto, aun cuando no estemos de acuerdo con la perspectiva tradicional de
Universidad de Minho (Portugal) y Universidad de Granada.

diferenciar los dos conceptos a través de la concepción de la inteligencia como capa-

cidad innata o de difícil entrenamiento o modificación.
Alo largo del capítulo procuraremos establecer siempre un enlace entre las posi-
ciones teóricas y la tipología de instrumentos construidos para la evaluación de di-
cha “inteligencia general”. Ya queda lejos la inteligencia definida como aquello que
miden los tests. Tomando una perspectiva histórica del concepto y su medida, abor-
daremos en primer lugar la definición de evaluación de la inteligencia, pasando a
continuación a la clasificación general de los tests de inteligencia, describiendo los
tests colectivos e individuales más nombrados en la literatura y, lógicamente, más
utilizados en la práctica. El último punto de este capítulo retoma y sintetiza algunas
de las consideraciones metodológicas, científicas y prácticas del concepto y medida
de la inteligencia.
IL. DEFINICIÓN Y EVALUACIÓN DE LA INTELIGENCIA
Las primeras concepciones de inteligencia, incluso a finales del siglo pasado, hacían
referencia a la capacidad asociada a la discriminación sensorial, al control motor, al
uso de los sentidos, al tiempo de reacción y a la coordinación sensoriomotriz. La ca-
pacidad intelectual del sujeto refleja la destreza y el grado de complejidad asociativa
que el sujeto conseguía desempeñar en esas funciones básicas (Almeida, 1988). Auto-
res formados en la Escuela de Psicología Experimental alemana, apoyándose en esta
concepción de la inteligencia, elaboraron pruebas sensoriales y motoras; es el caso de
Cattell en Estados Unidos y de Galton en Inglaterra; sin duda, son conocidos algu-
nos de los instrumentos usados para la medida de la discriminación de tamaños, pe-
sos y colores.
11. La inteligencia como entidad compuesta

Una concepción diferente de la inteligencia y una propuesta alternativa para su eva-
luación surge en Francia con Binet. En su opinión los fenómenos de la mente no se
pueden reducir simplemente a una mera asociación de funciones sensoriales y moto-
ras básicas. Estas poseen una entidad propia y son susceptibles de estudio y de medi-
da en condiciones experimentales, sin olvidar en tal planteamiento al propio sujeto.
En respuesta a una solicitud concreta por parte del Ministerio de Educación francés,
que tenía que ver con la creación de un instrumento de identificación de niños con
deficiencias cognitivas “condenados” al fracaso escolar, Binet y su más directo cola-
borador elaboran la Escala de inteligencia de Binet-Simon (Binet y Simon, 1905).
Esta escala refleja una concepción de la inteligencia como una entidad unitaria y glo-
bal, susceptible de evaluación directa a través del análisis (inferencia) de las respues-
tas del sujeto a situaciones estandarizadas. Estas respuestas no se sitúan ya al nivel de
movimientos y reacciones simples, como en los autores anteriores, sino que consi-
deran que el discurso y el pensamiento del sujeto resuelven problemas concretos. Bi-
net (1910), al concebir la inteligencia como una capacidad mental global, la define
Evaluación de la inteligencia general 527
como un conjunto de funciones cognitivas (comprensión, razonamiento, evalua-

ción, 1maginación...); por otro lado, su concepción como capacidad cognitiva de re-
solución de tareas que acompaña el crecimiento y la educación del niño implica el
uso de conceptos como “edad mental”, “retraso mental” o “educación cognitiva”,
así como una organización de las cuestiones en la escuela de acuerdo con períodos de
edad (cuestiones en las que un 75% de los niños de una determinada edad responde
correctamente). Así, para cada nivel de edad se propone un conjunto de cuestiones
para evaluar lo que será el desarrollo mental esperado de un niño de esa edad. La es-
cala permite atribuir una edad mental (EM) al individuo, correspondiendo a la edad
en la que consiguió resolver todas las cuestiones propuestas (edad de base, EB) acre-
centada por las bonificaciones consecuentes de los aciertos en cuestiones aisladas de
los niveles de edad posteriores. La comparación entre la edad mental y la edad cro-
nológica (EC) del sujeto permite apreciar su desempeño en términos de normalidad
o de desviación en un sentido superior o inferior.
La escala de Binet, tanto en las revisiones hechas por el autor como en las realiza-
das en Estados Unidos y Francia, se sigue utilizando en la investigación y en la inter-
vención psicológica. Sus fundamentos teóricos son subyacentes a las escalas de
Wechsler (W7SC, WAIS y WPPS7), tanto en la naturaleza unitaria y compuesta de la in-
teligencia, como en el índice descriptivo del desempeño o de la capacidad del sujeto.
La relación entre la edad mental y la edad cronológica permitió calcular el primer
tipo de cociente de inteligencia (Stern, 1912) (CI=EM/EC x 100). Los problemas con-
secuentes de falta de linealidad en la relación entre edad mental y edad cronológica
(especialmente por las dificultades de operacionalizarlas) y el hecho de graduar y
medir lo que podría ser la edad mental a partir del final de la adolescencia, justificó la
adopción de una desviación en el coeficiente de inteligencia tomando los parámetros
de distribución de los resultados en una muestra poblacional. Este procedimiento es
utilizado en las escalas de Wechsler, denominándose CI de desvío.
En resumen, con Binet y más tarde con Wechsler, la inteligencia se considera
como una capacidad global del individuo para actuar intencionalmente, pensar ra-
cionalmente y actuar eficazmente con su medio (Wechsler, 1944). Incluso, en el caso
de Wechsler, tal capacidad incluye aptitudes de índole práctico o manipulativo
(pruebas de manipulación) y aptitudes de índole verbal o abstracto (pruebas verba-
les), siendo posible calcular un CI verbal, un CI de manipulación y un CI global. Más
adelante hablaremos de esta división y de las pruebas que la operacionalizan.
12. La inteligencia como entidad simple (factor g)

Las teorías factoriales de la inteligencia dominaron la investigación y la práctica en
los tests hasta la década de los años sesenta (Almeida, 1988). Aprovechándose del
impacto de los tests Alpha y Beta en la selección de los reclutas en la primera guerra
mundial, y el uso masivo de la evaluación en las empresas, servicios y escuelas, sur-
gieron múltiples tests colectivos de inteligencia; basándose en los resultados obteni-
dos en grandes muestras se avanzó en un análisis factorial en los intentos de identihi -
car las unidades simples (factores) de la mente humana. El debate se situó en la
singularidad frente a la pluralidad de las aptitudes (factores) necesarios para la expli-
cación de las diferencias individuales en los múltiples tests. Spearman (1927) defien-
de una perspectiva unitaria de la inteligencia. En su opinión, la inteligencia humana
se debería definir a través de un factor simple subyacente a todo tipo de actividad in-
telectual, responsable de la mayor parte de la varianza encontrada en los tests (fac-
tor g). Acumulativamente, en cada tarea existiría un pequeño factor específico
(factor 5), aunque no sería generalizable a otras tareas (de ahí, que a veces se defina la
teoría de Spearman como la teoría de los dos factores).
Spearman no definió de una forma clara el factor g; éste tendría componentes or-
ganísmicos (energía nerviosa, cortical) y psicológicos. En este último caso el factor
general de inteligencia se describe operacionalmente a través de tres leyes de produc-
ción de conocimiento: adquisición de la experiencia, establecimiento de relaciones y
aplicación de las relaciones inferidas a nuevas situaciones. Por tanto, los tests pro-
puestos para su evaluación deberían tener en cuenta estas tres leyes; de ahí que se aso-
cie el factor g a la información recogida a través de tests de razonamiento con cuestio-
nes analógicas. Progresivamente, tales tests fueron teniendo en cuenta las siguientes
consideraciones: el carácter abstracto de las cuestiones (evitar recurrir al conocimien-
to, el aprendizaje escolar, la cultura y la experiencia del individuo), el formato analó-
gico de las cuestiones (razonamiento inductivo y deductivo) y la novedad de las tareas
(imposibilidad de entrenamiento o de memorización de una evaluación a otra).
El concepto de factor g permanece todavía actualmente en psicología. Tanto las
teorías jerárquicas de la inteligencia (como veremos a continuación) como los traba-
jos experimentales en psicología cognitiva, encuadrados o no en la teoría del proce-
samiento de la información, atribuyen una gran importancia al factor g en la defini-
ción y en la evaluación de la inteligencia. Varios autores recuperaron este concepto
de Spearman en las últimas décadas (Snow, 1980; Sternberg, 1981, Undheim, 1981).
113. La controversia en torno al número de factores

En una posición contraria a Spearman, Thurstone (1938) defiende una inteligencia
humana formada por aptitudes independientes (factores ortogonales) que explica-
rían la varianza en el desempeño de ciertos grupos de tareas. Este autor propone sie-
te factores de grupo para explicar el desempeño intelectual: comprensión verbal,
fluidez verbal, aptitud numérica, velocidad perceptiva, aptitud espacial, memoria y
razonamiento. Según esta concepción de la inteligencia, Thurstone construye una
batería de aptitudes múltiples, el Primary mental abilities (PMA) [Aptitudes mentales
primarias].
En la misma línea de Thurstone, Guilford (1959) defiende una división de la
mente en un número mayor de factores. Según su modelo estructural de inteligencia,
elaborado teóricamente, defiende 120 aptitudes distintas a través de la combinación
de cinco operaciones mentales, cuatro contenidos de las tareas y seis productos posi-
bles de trabajo mental; más recientemente, Guilford (1982) propone 150 aptitudes
diferentes.
Vernon (1965) y Cattell (1971) defienden una posición conciliadora de las dife-
rencias entre factor general y factores de grupo. En el primer caso tenemos un mo-
delo jerárquico en la explicación de la inteligencia humana, donde después de un fac-
Evaluación de la inteligencia general
529
tor general surgen dos factores de gran grupo (factor verbal-educativo y factor per-
ceptivo-mecánico). Descendiendo en la jerarquía de importancia y de generalización
de los factores aislados, siguen factores de pequeño grupo (¿segundo orden?) (próxi-
mos a los factores de Thurstone) y los factores específicos inherentes a cada tarca
(próximos a la noción de factores específicos de Spearman). Cattell (1971) sugiere
que la inteligencia se subdivide en inteligencia fluida (Gf) e inteligencia cristalizada
(Gc). La primera está relacionada con la capacidad mental más básica y asociada al
razonamiento, y la segunda con el aprendizaje y los conocimientos adquiridos por
los sujetos (por ejemplo, tests de vocabulario o de información). Siguiendo la línea
de Vernon (1965), Cattell (1971) defiende la importancia decisiva del factor general
en la descripción de la inteligencia tal como fue definido por Spearman, para quien es
importante asociar los factores de grupo más ligados a los contenidos o a las opera-
ciones cognitivas de los conjuntos más o menos amplios de tareas.
Como conclusión podemos afirmar que los tests de inteligencia general existen-
tes están asociados a diferentes concepciones teóricas y necesidades prácticas de este
constructo psicológico. Así, la primera concepción unitaria y global de la inteligen-
cia como un conjunto de diversas funciones está representada en los tests de Binet,
en sus revisiones y en las escalas de Wechsler. La definición de inteligencia en térmi-
nos de factor g aparece reflejada en las Matrices progresivas de Raven, en el Test de
los dominós de Pichot y en los tests de Cattell. Las teorías multifactoriales de la inte-
ligencia (Thurstone y Guilford) dieron origen a baterías de aptitudes múltiples, las
cuales serán objeto de otro capítulo en este manual. Finalmente, la teoría de la inteli-
gencia fluida e inteligencia cristalizada propuesta por Cattell está presente en el test
K-ABC (Kaufman y Kaufman, 1983); el modelo jerárquico propuesto por Vernon se
encuentra en la cuarta edición de la escala Stanford-Binet (Thorndike, Hagen y Sat-
tler, 1986), donde además de un factor general se apuntan dos factores principales en
función de que las tareas tengan que ver más con conocimientos educativo-verbales
o con las capacidades perceptivo-analíticas de los sujetos.
Si términos como “inteligencia”, “aptitud” y “coeficiente intelectual (C1)” han
sido retirados de los tests, incluso en aquellos a los que estaban tradicionalmente
asociados, y si expresiones como “aptitud escolar” o “aptitud cognitiva” están ocu-
pando su lugar (Reschly, 1990), podemos afirmar que continuamos usando los tests
anteriores y que este cambio refleja una preocupación o intento de una nueva inter-
pretación de los resultados en tales tests. Posiblemente, después de algunos años de
uso, estas nuevas “interpretaciones” puedan llevar a nuevas formas de definir y, so-
bre todo, de evaluar la inteligencia. En nuestra opinión, la evaluación de la inteligen-
cia está separada temporalmente de los avances de la investigación, asumiendo las
formas que en cada momento se presentan como más fiables y relevantes para res-
ponder a las necesidades sociales de la práctica psicológica (diagnóstico de ladefi-
ciencia, selección de personal, orientación escolar y profesional...). Los cambios se
produjeron esencialmente en los nombres de los productos y en las ideas sugeridas
para la interpretación de las puntuaciones. Varios ejemplos ilustran esta concepción.
El w7SC-R, manteniendo el término “inteligencia”, denomina al CI school functio-
ning level (SEL) (nivel de funcionamiento escolar); el Lorge-Thorndike intelligence
test cambió su nombre a Cognitive ability test, y el Ot1s-Lennon mental ability test
pasó a llamarse Otis-Lennon school ability test. En este último caso, el autor preten-
de delimitar al contexto escolar la interpretación de las puntuaciones y de las infe-

rencias que se puedan hacer (Lennon, 1980). Por último, la cuarta revisión de Stan-
ford-Binet (1986) sustituye el tradicional CI por Standard age scores (SAS).
Terminamos afirmando que esta “reorientación” en la interpretación de los re-
sultados en los tests, con influencias cada vez mayores en la utilización de los mis-
mos, no ha postergado a los tests de inteligencia general, pues éstos se siguen utili-
zando a gran escala (Murphy y Davidshofer, 1988). Así, en The ninth mental
measurements yearbook del año 1985 se describen y analizan 77 tests de inteligencia,
de los que 61 evalúan inteligencia general.
II. CLASIFICACIÓN DE LOS TESTS DE INTELIGENCIA
Según el concepto de inteligencia que hemos presentado podemos adivinar diferentes

tipos de tests de inteligencia. Así, unos proponen evaluar una inteligencia compuesta
a partir de varias funciones cognitivas (por ejemplo, las escalas de Binet y de Wechs-
ler) y otros evaluar una inteligencia genérica más asociada a la capacidad de aprender
y establecer relaciones entre cuestiones que no impliquen conocimientos culturales o
experiencias escolares (por ejemplo, las pruebas de Raven y las de Cattell). El tipo de
cuestiones o pruebas reflejan la concepción de la inteligencia de sus autores.
Evidentemente, la elección de uno u otro tipo de cuestiones no refleja únicamen-
te la concepción de inteligencia, sino la mejor forma de evaluarla y las circunstancias
en las que tal evaluación se puede realizar (tiempo, materiales o número de sujetos).
En los tests de vocabulario (conocimiento del significado de las palabras) o en los
tests de información (conocimiento o cultura general) se reconoce fácilmente que la
evaluación que se hace de la inteligencia está determinada por las experiencias educa-
tivas y la base cultural de los sujetos. Está claro que la adquisición y el conocimiento
del vocabulario y de la cultura no es apenas aprendizaje, entrenamiento o retención.
Niveles más elevados de desempeño en estas situaciones requieren discriminación,
generalización y derivación de conceptos, aspectos más próximos de la capacidad in-
telectual de los sujetos. Asimismo, la inteligencia ha sido evaluada especialmente a
través de tareas de razonamiento (analógico, silogístico, completar series...) en diver-
sos contenidos (verbal, numérico, abstracto y espacial) en donde lo importante son
los procesos cognitivos asociados a la relación de información y a la aplicación de le-
yes, principios y relaciones inferidas. En otras palabras, podemos afirmar que fun-
ciones cognitivas más complejas parecen predominar en estos tests en comparación
con funciones simples de reconocimiento o memoria.
Otra clasificación de los tests de inteligencia se puede hacer en función del obje-
tuvo de evaluación: inteligencia verbal, inteligencia práctica o inteligencia abstracta,
variando el tipo de cuestiones en cada uno de los tests (por ejemplo, palabras o fra-
ses, objetos a manipular o elementos gráfico-perceptivos, respectivamente) según
esta división. Jensen (1981) clasifica los tests de inteligencia general, de acuerdo al
contenido de las tareas, en tests verbales (requieren el uso del lenguaje; por ejemplo,
vocabulario y analogías verbales), tests no verbales (no necesitan implícitamente del
uso del lenguaje; por ejemplo, los tests de lápiz y papel de matrices, analogías de fi-
guras o secuencias) y los tests de manipulación (requieren el diseño, la construcción

de algo o la manipulación de materiales como cubos y la ordenación de imágenes O
puzzles). Las escalas de Wechsler aseguran tanto el cálculo de un CI global como de
un Cl verbal y un CI manipulativo, según la naturaleza más verbal o más manipulati-
va del contenido de sus subtests.
Por norma, los tests de inteligencia general evalúan más la potencia o capacidad
que la velocidad de desempeño. La existencia o no de un tiempo límite para la reali-
zación de los tests está ligada al hecho de estar ante un test de aplicación colectiva o
individual, respectivamente. En los tests de aplicación individual (por ejemplo, las
escalas de Binet y las de Wechsler) la prueba no tiene límite de tiempo, aun cuando el
factor tiempo se tenga en cuenta en la ponderación realizada de la puntuación del su-
jeto, o aparece definido en alguna prueba particular (por ejemplo, hay un tiempo lí-
mite en la prueba de “códigos” en las escalas de Wechsler). En los tests de aplicación
colectiva existe por norma un tiempo límite para la realización; este aspecto contri-
buye a una mejor sensibilidad (diferenciación) de los desempeños individuales y a
una mayor uniformidad (objetividad) de las condiciones de evaluación. Incluso aquí
es importante afirmar que el tiempo no es un factor determinante de las diferencias
encontradas en los desempeños individuales.
En cuanto al formato de las cuestiones en los tests de inteligencia, se puede decir
que son generalmente de elección múltiple. Sobre todo a partir de los tests colectivos
usados en la primera guerra mundial y con la generalización de la evaluación de la in-
teligencia en el campo de la industria y de la enseñanza la mayoría de los tests de in-
teligencia —o la casi totalidad de los tests colectivos— presenta alternativas de res-
puesta para la elección del sujeto. En los tests individuales el sujeto puede organizar
sus respuestas, siendo las mismas redactadas o puntuadas de inmediato en términos
de grado de adecuación y de rigor para la situación o problema presentado.
A continuación, en la descripción de los tests de aplicación colectiva e individual,
habrá ocasión de analizar e ilustrar algunas de las características de los tests más fre-
cuentemente usados en la práctica y citados en la literatura. En cada uno de ellos nos
centraremos en los fundamentos teóricos, en sus revisiones sucesivas, en los aspectos
de su aplicación, y en su fiabilidad y validez de los resultados.
IV. TESTS COLECTIVOS DE INTELIGENCIA
Los tests colectivos de inteligencia tienen una larga tradición en los países occidenta-
les; en algunos de ellos estos tests sirvieron a propósitos militares (reclutamiento); en
otros, su uso se centró en el ámbito escolar (clasificación, orientación escolar y pro-
fesional), y en otros se utilizaron para la selección de personal.
1v.1. Revisión histórica de los tests colectivos de inteligencia

Uno de los puntos de referencia del surgimiento de los tests colectivos fue la entra-
da de Estados Unidos en la primera guerra mundial (1914-1918). La American
Psychological Association (APA) a través de su presidente (Robert Yerkes) planteó

la necesidad de selección de reclutas para diferentes adiestramientos. Así, surgen el
Army alfa intelligence tests para reclutar a sujetos alfabetizados y el Army beta in-
telligence tests para los analfabetos. Estos tests fueron aplicados en esas fechas a
más de un millón de hombres (Vane y Motta, 1990), lo que demuestra su populari-
dad. Este hecho hace que los tests colectivos pasen al ámbito escolar como un me-
dio más objetivo que las clasificaciones de los profesores para identificar a los
alumnos con más o menos talento. La evaluación de la inteligencia de los alumnos
se convierte así en una rutina anual de las escuelas. Su utilidad estaba asociada so-
bre todo a la selección de candidatos para los niveles escolares más exigentes (por
ejemplo, las universidades), a la admisión en escuelas profesionales y a la orienta-
ción para la vida activa.
A finales de los años cincuenta el lanzamiento del Sputnik por la Unión Soviética
incrementa el protagonismo de los tests en las escuelas. Más dinero público fue in-
vestido en la producción de tests y en su aplicación sistemática a la población estu-
diantil. De nuevo, se pretendía identificar a los alumnos más brillantes; se buscaba la
“excelencia”, surgiendo la controversia entre el público y los profesionales. Progre-
sivamente, a partir de 1970 esta controversia se torna objeto de preocupación legisla-
tiva y objeto de debates nacionales en varios países. En algunos Estados americanos
los tests de inteligencia son abolidos.
1v.2. Características de los tests colectivos de inteligencia

Entre las características generales de los tests colectivos de inteligencia podemos des-
tacar las siguientes. En primer lugar, son tests de lápiz y papel y, por norma, se reali-
zan en un tiempo previamente definido; no obstante, el límite de tiempo no es un
factor decisivo en el desempeño. Este tiempo límite tiene como objetivo conseguir
una mayor objetividad en la evaluación y una mejor sensibilidad de los resultados.
En segundo lugar, las cuestiones se organizan en un formato de “elección múlti-
ple”, teniendo que señalar el sujeto la alternativa correcta. Este formato asegura una
mayor objetividad en la evaluación. La elaboración de las alternativas implica la exis-
tencia de una “más correcta”, teniendo las restantes un efecto de “distracción” varia-
ble. El número de alternativas es variable, aunque se debe procurar que no sea infe-
rior a cuatro o cinco para reducir el margen de acierto al azar en la cuestión a un 25%
o 20%, respectivamente.
En tercer lugar, la estandarización de las condiciones de aplicación y de los resul-
tados en este tipo de tests disminuye el peso del efecto del aplicador, hecho que no
ocurre en los tests individuales. Al contrario que en los tests individuales, el sujeto
responde a las cuestiones y no a la persona que las administra (Murphy y Davidsho-
fer, 1988). El aplicador puede estar más distante, lo cual justifica la tendencia actual
de administración informatizada de estos mismos tests. Asimismo, por este hecho,
los tests colectivos se usan en las primeras selecciones y fijación de expectativas de
éxito en grandes grupos, utilizando los tests individuales en situaciones de diagnósti-
co y de selección cuando hay una mayor exigencia de individualización en las deci-
siones a tomar.
533
IV3. Ventajas y desventajas de los tests colectivos de inteligencia

En cuanto a las ventajas de los tests colectivos de inteligencia, podemos hablar de su
eficacia y de su estandarización. La eficacia se refiere a que su uso se traduce general-
mente en una economía de recursos y de costos en comparación con otros métodos
para el mismo nivel de información. Por lo que respecta a la estandarización, pode-
mos afirmar que, respetando las instrucciones que aparecen en los manuales, estos
tests constituyen un conjunto de estímulos idénticos para diferentes sujetos, aplica-
dos con unas instrucciones y un intervalo temporal iguales para todos, con una co-
rrección y una interpretación idéntica, asumiendo que las diferencias en los resulta-
dos revelan las diferencias individuales en las características evaluadas.
En cuanto a las desventajas, podemos señalar que estos tests no contemplan la
forma en que los sujetos responden a otros aspectos que podrían ayudar a la inter-
pretación de los resultados, por ejemplo, las razones que llevan a un sujeto a escoger
una determinada alternativa considerada como incorrecta por el autor del test. Por
otro lado, la existencia de alternativas de respuesta, aun cuando favorecen la estanda-
rización, puede provocar la aparición de procesos cognitivos de respuesta (razona-
miento, comparación, justificación) o respuestas ocasionales no siempre debida-
mente ponderadas en el resultado final. Por ejemplo, se critica este aspecto diciendo
que los tests cuyo formato es de elección múltiple acaban por favorecer el aprendiza-
je y por penalizar a los pensadores más imaginativos y creativos. A pesar de estas
desventajas, la información disponible nos permite afirmar que estos tests evalúan de
hecho, en cierta medida, la inteligencia (Jensen, 1980; Jackson, 1984).
1v4. Descripción de algunos tests colectivos de inteligencia

La presentación que hacemos a continuación de algunos tests colectivos de inteli-
gencia general pretende únicamente ilustrar algunas de las pruebas construidas con
diferentes objetivos. Los lectores interesados en listas más exhaustivas pueden con-
sultar los manuales clásicos sobre tests (por ejemplo, los de Cronbach o Anastas1) y
especialmente las publicaciones sucesivas de The mental measurements yearbooks.
Haremos referencia a tests aplicados a niños con fines esencialmente escolares, tests
de selección para la universidad, tests para la selección profesional y, por último, pre-
sentaremos algunos tests elaborados teniendo en cuenta la polémica en torno a la in-
terferencia del factor cultural en el desempeño.
1v.4.1. Tests de diagnóstico y clasificación de alumnos

«Otis-Lennon mental ability test (OLMAT)» (Otis y Lennon, 1969)
Se trata de un test cuyo origen se puede situar en el Army alpha examination. En sus
revisiones sucesivas se construyeron escalas aplicables desde preescolar hasta laedad
adulta. El test constituye una medida del factor g. En preescolar, la evaluación se
hace a través de cuestiones que implican la comprensión de instrucciones, razona-

miento cuantitativo y comprensión verbal. Para las edades más avanzadas se intro-
ducen series o analogías verbales y no verbales. Las puntuaciones en el test están
normalizadas en términos de CI de desvío (media de 100 y desviación típica de 16).
Los parámetros psicométricos son bastante satisfactorios. Por un lado, su estandari-
zación se realizó en grandes muestras debidamente estratificadas; por otro, los coefi-
cientes de fiabilidad de los resultados se sitúan entre 0,84 y 0,90; los coeficientes de
correlación con las escalas de Wechsler están entre 0,73 y 0,78. Las críticas a los tests
de coeficiente intelectual da lugar al Otis-Lennon school ability test (OLSAT) (Otis y
Lennon, 1977). Sus cuestiones también hacen referencia a funciones cognitivas de
comprensión y de razonamiento, con materias verbales y no verbales. La puntua-
ción obtenida es resultado de la traducción de la capacidad de aprendizaje y del de-
sempeño escolar (índice de aptitud escolar). La estandarización de esta última ver-
sión se hizo con 130000 alumnos, situándose los coeficientes de fiabilidad entre 0,84
y 0,95, y los coeficientes de validez externa con criterios escolares entre 0,40 y 0,60
(valores usuales en este tipo de tests y criterios externos).
«Multidimensional aptitude batery (MBA)» (Jackson, 1984)
Se trata de una coversión del W/SC-R para aplicación colectiva, con cuestiones de
elección múltiple. La versión incluye tanto tests verbales (información, compren-
sión, aritmética, semejanza y vocabulario), como manipulativos (código, comple-
mento de imágenes, arreglo de imágenes, composición de imágenes y visualización
espacial). En cuanto a los parámetros psicométricos los valores son parecidos al
WISC-R (Vernon, 1985), encontrándose un coeficiente de correlación de 0,91 entre
las dos escalas (Jackson, 1984).
«Lorge-Thorndike intelligence tests» (Lorge y Thorndike, 1964)
Es un test dirigido a población escolar desde la enseñanza básica hasta la secundaria;

según sus autores evalúa la inteligencia abstracta (concepto que en su opinión se
aproxima al factor g). Incluye un componente verbal con cinco subtests (vocabula-
rio, clasificación verbal, completar frases, razonamiento aritmético y analogías ver-
bales) y tres subtests no verbales (clasificación de figuras, analogías figurativas y rela-
ciones numéricas). Los coeficientes de correlación con las escalas de Wechsler y con
el Stanford-Binet están entre 0,54 y 0,77. Revisiones recientes de este test dieron lu-
gar a la aparición y a un mayor uso del Cognitive abilities tests (CAT), que se agrupa
por escalas cubriendo tres niveles de escolaridad (de preescolar hasta los doce años).
Las dos primeras escalas, que cubren hasta el tercer año de escolaridad, incluyen
tests de vocabulario (identificación de objetos y animales), relación de conceptos (fi-
gura con objetos en un determinado lugar del espacio), clasificación y series (figuras
que completan o no pertenecen a un conjunto) y conceptos cuantitativos (identifica-
ción de figuras en función del número de objetos). La tercera escala, del tercer al
duodécimo año de escolaridad, incluye diez subtests, siendo algunos verbales (voca-
bulario, completar frases, clasificación verbal y analogías verbales), cuantitativos (re-
laciones cuantitativas, series de números y construcción de ecuaciones) y no verbales
535
(analogías figurativas, clasificación de figuras y síntesis de figuras). Los subtests, de

acuerdo a una jerarquización previa delas cuestiones en función de la dificultad, per-
miten que los sujetos respondan según su edad, evitando preguntas demasiado fáci-
les o demasiado difíciles. La puntuación del sujeto se da en términos de una edad pa-
trón, lo que en realidad no se aparta mucho del tradicional CI. Por otro lado, las
grandes similitudes entre los subtests de los Cognitive abilities tests y las escalas de
Binet y de Wechsler, así como tener una media de 100 y una desviación típica de 16
ratifican la superposición de información. Los coeficientes de fiabilidad, a través de
formas alternativas, se sitúan entre 0,85 y 0,90, encontrándose correlaciones elevadas
(entre 0,60 y 0,80) con las puntuaciones en el Raven y en el W7SC (Cronbach, 1972).
«Short form test of academic aptitude (SFTAA)»
Se trata de una versión de 1977 del California test of mental maturity (CTMM) (1963).
Su objetivo es evaluar las aptitudes cognitivas de los alumnos en período de enseñan-
za básica y secundaria (téngase en cuenta que el CTMM incluía también la edad prees-
colar). El test incluye cuestiones de vocabulario, analogías, secuencias y memoria,
posibilitando el cálculo de un CI verbal y de un CI no verbal; según Cronbach (1975),
los valores obtenidos en este test parecen más elevados que en otras escalas de CI por
problemas de normalización. Más recientemente, el SFTAA fue objeto de revisión,
dando lugar al Test of cognitive skills.
1V.4.2. Tests de admisión en la universidad

«College entrance examination Board's scholastic aptitude tests (SAT)»
Es un test ampliamente conocido por su uso masivo en la selección de candidatos en

las universidades estadounidenses (en la mayoría de los casos se requiere una nota
mínima en estas pruebas). La evaluación toma más en consideración los aspectosde
razonamiento y de comprensión que los conocimientos. El test incluye 150 cuestio-
nes de lápiz y papel con cinco alternativas de respuesta, cubriendo una sección ver-
bal o SA7-V (comprensión lectora, antónimos, analogías verbales y completar frases)
y una sección de matemáticas O SA7-M (razonamiento numérico y razonamiento
cuantitativo). La estandarización sitúa la media en 500 y ladesviación típica en 100
puntos. La correlación con las calificaciones en la universidad oscila, siendo objeto
de controversia; Stanley y Porter (1967) la sitúan en torno a 0,60. Por su parte, Jen-
sen (1981) encuentra una correlación de 0,50 cuando toma de forma separada las
puntuaciones en SAT-V y en SAT-M, y de 0,60 para su conjunto.
«Graduate record examination (GRE)»
Constituye una prueba similar al $47, y es destinada a la admisión o selección de

alumnos por la Universidad y escuelas de graduación. Además de tests para una eva-
luación de procesos cognitivos (como el $47) incluye una evaluación de los conoci-
mientos avanzados en diferentes disciplinas. En cuanto a la parte que más nos intere-
sa, la evaluación de aptitudes cognitivas, el GRE incluye tres secciones: una sección
verbal (analogías, completar frases y comprensión lectora), una sección cuantitativa
(problemas simples de álgebra y geometría, comparaciones cuantitativas e iterpre-
tación de datos) y una sección de razonamiento analítico (silogismos, anagramas ló-
gicos y abstracción de reglas para grupos de datos relacionados). La consistencia 1n-
terna de los resultados (con una media de 500 y una desviación típica de 100 puntos)
se sitúa en torno a 0,90, y los coeficientes de correlación con las clasificaciones esco-
lares son similares a los del $A7.
1v.43. Tests de selección profesional

«Wonderlic personnel test» (Wonderlic, 1945)
Se trata de un test de inteligencia usado en selección de personal; el término “inteli-

gencia” se eliminó del nombre del test para disminuir la ansiedad en su realización.
Su duración es de doce minutos, permitiendo por ello una selección. Sus 50 cuestio-
nes de elección múltiple cubren aspectos como el razonamiento y el pensamiento a
través de palabras, números y símbolos. La normalización de la prueba tienen en
cuenta el sexo, la edad, la escolaridad y el grupo étnico. Sus coeficientes de fiabilidad
y validez son satisfactorios.
«Armed forces qualification test»
Se usa en la selección y clasificación de reclutas. Está formado por 100 cuestiones de

elección múltiple. Sus coeficientes de correlación con otras medidas de desempeño
en entrenamientos está en torno a 0,50.
1V.4.4. Tests referidos a la controversia en torno a factores culturales
«Culture fair intelligence tests» (Cattell, 1973)
Se trata de tests de lápiz y papel que supuestamente evalúan la inteligencia sin la in-
terferencia de factores culturales por medio de figuras abstractas. Las cuestiones, in-
cluyendo series progresivas, clasificación, matrices y descubrimiento de propiedades
comunes, están agrupadas en tres escalas por orden de dificultad. La escala 1 (incluye
ocho subtests) va dirigida a niños de 4 a 8 años, aunque también se usa con sujetos de
más edad pero con retraso cognitivo; la escala 2 se aplica en el período de 8 a 13 años;
y la escala 3 a alumnos de enseñanza secundaria, enseñanza superior y adultos. Más
allá del nombre y del objetivo perseguido con su construcción (se piensa que aunque
estas escalas disminuyen la interferencia de factores culturales, no los elimina), los
coeficientes de correlación con las calificaciones escolares no son muy elevados (en-
tre 0,20 y 0,50). Aunque el manual permite la conversión del resultado en Cl, no es
una prueba muy utilizada, y no parece tener ventajas con respecto a la evaluación to-
mando partes no verbales de otros tests disponibles (Cronbach, 1972).
537
«Matrices progresivas de Raven» (Raven, 1941, 1981 ; Raven, Court y Raven, 1985)
Es un test muy conocido y usado, al menos en la investigación. En Inglaterra fue

el principal instrumento de selección de reclutas en la segunda guerra mundial,
Las cuestiones son figuras geométricas (analogías perceptivas en forma de matriz);
en esta matriz falta una parte para la que existen entre seis y ocho alternativas de
elección. La primera versión del test data de 1938, existiendo en la actualidad tres
versiones diferentes: Coloured progressive matrices destinada a niños entre 4 y 10
años, formada por 36 cuestiones coloreadas; la versión estandarizada constituida
por 60 cuestiones repartidas en cinco series de doce, organizadas (cuestiones en
serie) según un grado creciente de dificultad; y Advance progressive matrices for-
mada por 36 cuestiones y destinada a sujetos adultos más desarrollados intelec-
tualmente. Dada la creencia generalizada de que se trata de un test con una in-
fluencia cultural reducida y de que constituye una buena medida del factor g, este
test ha gozado de una gran aceptación. Los coeficientes de fiabilidad (test-retest)
son elevados (entre 0,80 y 0,90), situándose los coeficientes de correlación con las
puntuaciones en las escalas de Binet y de Wechsler entre 0,54 y 0,86. Constituye
una buena medida de la capacidad genérica de razonamiento, desaconsejándose su
uso para el pronóstico del aprendizaje y del desempeño del sujeto en tareas especí-
ficas.
«BITCH culture specific test» (Williams, 1972)
Es un test que, en opinión de su propio autor, se destina a la evaluación intelectual de

niños de raza negra, implicando, por tanto, una evaluación cognitiva que tiene en
cuenta las experiencias culturales de los sujetos. La prueba contiene una parte verbal
que refleja las experiencias de los individuos afroamericanos. Este test no correlacio-
na con otras medidas de inteligencia (Matarazzo y Wiens, 1977).
V. TESTS INDIVIDUALES DE INTELIGENCIA
Los tests individuales de inteligencia todavía son bastante usados en la actualidad; la

razón puede ser que los tests colectivos sufren de cierta “crisis” provocada por las
reacciones suscitadas por las evaluaciones masivas de poblaciones escolares, o que
los tests colectivos no profundizan en la evaluación cognitiva requerida para ciertas
decisiones en la clasificación o selección (Reschly, 1990).
En los tests individuales, más allá de la estandarización de los estímulos y de las
condiciones en las que se pasan, lo cual constituye también una preocupación en los
tests colectivos de inteligencia, es fundamental considerar la relación interpersonal
que se establece entre el evaluador (por norma un psicólogo) y el sujeto (niño o adul-
to). Esta relación, además de intervenir en ella diferentes variables del evaluador y
del sujeto (sexo, edad, clase social, atracción física...), es percibida de distintas formas
por los diferentes sujetos, lo cual interfiere en el desempeño. De hecho, trabajos clá-
sicos confirman diferencias en el rendimiento en función de las percepciones indivi-

duales, de la dificultad y del sentido de la evaluación (Roazzi, Spinillo y Almeida,
1991). |
Como se ha afirmado anteriormente, en la evaluación individual el sujeto perci-
be que debe responder más al propio psicólogo que a las cuestiones o al test. Ello
complica aún más la situación. Por todas estas razones, es decisiva la relación esta-
blecida en la evaluación de la inteligencia a través de los tests individuales, mostran-
do especial atención a los primeros momentos de la evaluación. Es importante imsis-
tir aquí que estos tests deben ser aplicados exclusivamente por psicólogos con una
formación general y específica en las técnicas usadas.
va. Características de los tests individuales de inteligencia

Algunas de estas características surgen de la propia situación de aplicación indivi-
dual. En primer lugar, estos tests incluyen pruebas con manipulación de materias,
así como complementar una alternativa a cuestiones verbales o figurativas. En otras
palabras, a través de estas pruebas se puede conseguir más fácilmente una evalua-
ción de aspectos motores y prácticos de la inteligencia. En segundo lugar, en la
gran mayoría de estos tests los sujetos responden a cuestiones más adecuadas a su
nivel de capacidad, evitando preguntas demasiado fáciles o demasiado difíciles. A
lo largo de la aplicación de las pruebas, el psicólogo, partiendo de las respuestas co-
rrectas O erradas anteriores, va determinando a qué cuestiones posteriores tendrá
que responder el sujeto. Está claro que un error en la calificación o un despiste por
parte del evaluador puede privar injustamente al sujeto de cuestiones más difíciles.
Finalmente, los tests individuales ofrecen la posibilidad de evaluar aspectos cogni-
tivos y no estrictamente cognitivos complementarios a los resultados finales. El he-
cho de que la evaluación ocurra en una situación individual, casi en una situación
de entrevista “clínica” o “experimental -clínica”, permite apreciar aspectos como la
reacción del sujeto a la situación de evaluación (cooperación, ansiedad, bloqueos,
persistencia...), el impacto de variables personales y situacionales en el propio ren-
dimiento (fatiga, motivación, autoconfianza...), e información referente a las res-
puestas correctas y a los errores cometidos en relación a los procesos cognitivos
empleados.
Por regla general, los tests individuales permiten una evaluación más acentuada
de la inteligencia, interrelacionando informaciones de índole cuantitativa (puntos,
notas, normas...) y cualitativa (comportamientos, reacciones, relación, personali-
dad...). Este hecho ha originado una relativa mayor aceptación de los valores obte-
nidos con estas pruebas en comparación a los tests colectivos, especialmente en si-
tuaciones de identificación de dificultades cognitivas (retraso mental, deficiencia
cognitiva, dificultades de aprendizaje, superdotados...) y de clasificación. Los tests
individuales de inteligencia son frecuentemente usados en situaciones de orienta-
ción escolar y profesional y, sobre todo, en situaciones de psicología clínica, cuan-
do se requiere conocer el funcionamiento cognitivo del individuo adulto, la com-
paración entre inteligencia verbal y no verbal, y los efectos cognitivos consecuentes
a perturbaciones o lesiones neurológicas.
539
v2. Descripción de algunos tests individuales de inteligencia

En esta descripción tenemos en cuenta tres grandes grupos de tests de inteligencia
general; en orden cronológico estarían las escalas de Binet, las escalas de Wechsler y
otras escalas para niños.
v.2.1. Escalas de Binet
El trabajo pionero de Binet a comienzos de siglo todavía es considerado como váli-

do, aunque se han hecho diversas revisiones de las escalas iniciales; téngase en cuenta
que en 1911 ya existían dos versiones mejoradas de la Escala de inteligencia de Binet-
Simon. Las mejoras incluyeron una reformulación y un agrupamiento de las cues-
tiones por niveles de edad —en la versión de 1905 la escala estaba formada por 30
problemas de diferente grado de dificultad; en la versión de 1908 las cuestiones se or-
ganizaban por grupos de edad desde los 3 a los 13 años (cinco o seis cuestiones para
cada uno de los años); en la versión de 1911 se mejora la presentación, pasando a te-
ner un número idéntico de cinco cuestiones para los diferentes niveles de edad, des-
de los 6 años hasta la edad adulta. Como característica general, y de acuerdo con lo
afirmado con anterioridad, los problemas cubren un abanico de diferentes procesos
cognitivos: comprensión, coordinación sensoriomotora, comparación, memoria y
razonamiento. A continuación haremos referencia a las revisiones realizadas en Es-
tados Unidos (Stantord-Binet) y en Francia (NEM1). Una descripción exhaustiva de
esta escala y sus revisiones en Estados Unidos se encuentra en Sattler (1982).
«Escala de inteligencia de Stanford-Binet»
Es una versión americana de la Escala de Binet-Simon que tuvo una evolución pro-
pia a lo largo de las diferentes revisiones y actualizaciones. En la actualidad esta es-
cala se usa incluso fuera de Estados Unidos, y lo que la liga a Binet es especialmen-
te el modelo (test compuesto de inteligencia). La primera versión de la Escala
Stanford-Binet aparece en 1916 a través de los trabajos de Terman y colaboradores
(Terman, 1916). En relación a la escala de 1911, los cambios fueron tan grandes que
se podría asumir estar ante un nuevo test (Anastasi, 1988). Una primera revisión la
realizaron en 1937 Terman y Merrill, pasando a disponer de dos formas paralelas
(forma L y forma M) baremadas en una muestra de 3 184 sujetos entre año y medio
y 18 años. En 1960 se realiza una nueva revisión que consiste en una selección de
las mejores cuestiones de las dos formas paralelas anteriores, haciendo una forma
única (Terman y Merrill, 1960). En su revisión más reciente, O sea la cuarta,
(Thorndike, Hagen y Sattler, 1986; Delaney y Hopkins, 1987) se intenta integrar la
escala en un modelo jerárquico de la inteligencia, donde junto a un factor general
de inteligencia (el más importante) se puede hablar de tres factores primarios, tales
como la aptitud cristalizada (razonamiento verbal y razonamiento cuantitativo), la
aptitud fluida o analítica y la memoria a corto plazo. Así, los quince subtests que
componen la escala aparecen agrupados en cuatro áreas cognitivas: aptitud verbal
(vocabulario, comprensión, absurdos y relaciones verbales), aptitud cuantitativa

(cálculo, series de números y construcción de ecuaciones), razonamiento abstracto
o figurativo (análisis de patrones, copia de figuras, matrices, y doblaje y corte) y
memoria a corto plazo (cuentas, frases, dígitos y objetos). Cuando se aplica a las
edades más inferiores y a las más superiores, únicamente se usan algunos de estos
subtests (generalmente entre 8 y 13).
La estandarización de la cuarta versión de la escala incluyó las respuestas de
5 000 sujetos con una edad entre 2 y 23 años, estratificados según la región, el tipo de
comunidad, la raza, la clase social y el sexo. En esta última versión, el resultado en
términos de CI (edad mental dividido entre edad cronológica) se sustituyó por una
puntuación patrón de edad (Standard age score, SAS). Entre los 2 y los 5 años, las ta-
blas ofrecen puntuaciones estandarizadas de cuatro en cuatro meses, de seis en seis
entre los 6 y los 10 años, de año en año entre los 11 y los 17 años, y habiendo una
única tabla de conversión de las puntuaciones brutas entre los 18 y los 23 años. Así,
en cada grupo de edad las calificaciones brutas se convierten en puntuaciones típicas
(media de 50 y desviación típica de 8 puntos); éstas permiten el cálculo del SAS global
y de un SAS para cada una de las cuatro áreas cognitivas antes mencionadas (media de
100 y desviación típica de 16 puntos). La interpretación de esta calificación tiene en
cuenta el rendimiento de los sujetos de una edad determinada cubierta por la escala
(la estandarización está hecha con sujetos de 2 a 23 años), sin separarse en la práctica
del significado del CI.
La escala de Stanford-Binet tuvo a lo largo de la historia de la psicología amplias
referencias, tanto en la práctica como en la investigación psicológica. Sus sucesivas
versiones no alteraron significativamente su tipología (Murphy y Davidshofer,
1988). La definición de inteligencia como un compuesto de comprensión, juicio y
razonamiento, así como el hecho de tratarse de una evaluación referida a la edad,
partiendo de la resolución de los problemas cotidianos de cada edad, siguen siendo
aspectos fundamentales de las sucesivas revisiones (aunque en las últimas, la organi-
zación de las cuestiones ya no se hizo en términos de grupos de edad, sino en sub-
tests en función de la proximidad de las operaciones mentales y de los contenidos
implicados). Esta continuidad ha sido importante para alguna investigación longitu-
dinal en el campo de la inteligencia, permitiendo valores próximos de fiabilidad y va-
lidez a lo largo del tiempo y de las versiones.
En términos de fiabilidad, ya en la versión de 1937, los coeficientes test-retest
con las formas paralelas M y L era superior a 0,90 en los diferentes grupos de edad.
Por su parte, el SAS global presenta un coeficiente de consistencia interna en torno a
0,95 en las diferentes edades (Thorndike y cols., 1986), situándose en los subtests in-
dividuales entre 0,80 y 0,97 (excepto en el pequeño test de memoria de objetos, don-
de los valores oscilaron entre 0,66 y 0,78). La información relativa a la validez de la
escala es también satisfactoria, e incluso ha sido una de las escalas usadas para la vali-
dación de otros tests individuales y colectivos de inteligencia. Su valor predictivo del
rendimiento escolar (grados, calificaciones dadas por los profesores, calificaciones
en tests de rendimiento...) es bastante significativo: coeficientes entre 0,40 y 0,75
Jensen, 1980). Tomando la cuarta versión, algunos estudios permiten afirmar que el
cálculo de un SAS conjunto del área cognitiva verbal y cuantitativa permite un mejor
poder predictivo del rendimiento académico (Anastasi, 1988)
541
Los análisis factoriales de los resultados en los subtests permiten defender la

existencia de un importante factor común al rendimiento en todos ellos. Así, en tér-
minos de validez de constructo podemos afirmar que la escala constituye una buena
medida del factor g. Tomando los datos referentes a la cuarta versión se encuentran
además del factor general, otros tres factores. Dos de ellos surgen asociados al carác-
ter verbal y al carácter cuantitativo de algunos subtests; un tercer factor aparece liga-
do a los subtests que evalúan la capacidad memorística. El hecho de no aparecer un
subfactor relacionado con los subtests perceptivo-espaciales se puede explicar por la
menor ligazón de este tipo de contenidos al aprendizaje escolar, surgiendo de ahí una
mayor especificidad o, en otras palabras, la ausencia de componentes comunes al
rendimiento (Anastasi, 1988).
El uso que se hace de la escala es importante, especialmente en niños. A pesar de
que en la última versión aparece con normas para sujetos de 2 a 24 años, se recomien-
da su aplicación principalmente en la infancia y en la adolescencia. Su uso con adul-
tos se limita casi exclusivamente a sujetos con retraso moderado o profundo de la in-
teligencia. La Escala de Wechsler para adultos es más recomendable en estas edades,
excepto cuando se prevé que algunos subtests del WA/S pueden ser calificados con
cero (Lindemann y Matarazzo, 1990).
«Nueva escala métrica de inteligencia (NEM1)» (Zazzo, Gilly y Verba-Rad, 1966)
Se trata de una revisión francesa de la originaria Escala de inteligencia Binet-Simon

(1911). Varios estudios dirigidos por Zazzo desde 1949 culminaron en 1974 con la
publicación de esta escala. El objetivo de Zazzo era obtener para Francia una versión
del Binet-Simon directamente construida para la población francesa y que pudiese
ser alternativa a las revisiones traducidas de la Stanford-Binet. Se puede encontrar
una descripción de los procedimientos seguidos en la construcción y en la estandari-
zación de la NEMI para la población escolar francesa en Zazzo y cols. (1966), y para
la portuguesa en Bairrao (1980).
v.2.2. Escalas asociadas a Wechsler
Wechsler desarrolló un extenso trabajo en el campo de la evaluación de la inteli-

gencia, siendo autor de instrumentos alternativos a las escalas de Stantord-Binet
tanto en Estados Unidos como en el resto de los países. Su gran innovación fue
agrupar las cuestiones de acuerdo al tipo de tareasa realizar en vez de hacerlo por
grupos de edad, y la introducción de una evaluación por medio de una escala de
puntos (el sujeto recibe una puntuación específica por cada cuestión respondida de
forma correcta). Su concepción de la inteligencia no se separa mucho de la de Bi-
net. De hecho, tanto en términos de definición como en términos de medida,
Wechsler concibe la inteligencia como un conjunto de funciones cognitivas, Consi-
derando que cuanto más se procure perfeccionar los tests en términos de un factor
general, más perderán su capacidad de evaluación de la propia inteligencia. Esta no
es una función mental simple, sino una parte de un todo: la personalidad (Wechsler,
1950).
«Escala Wechsler de inteligencia para adultos»
La primera escala surgió de la necesidad de solucionar las dificultades para evaluar la

inteligencia en sujetos adultos por medio de la Stanford-Binet. Esta primera escala se
denominó Wechsler-Bellevue intelligence scale. En 1955 pasó a denominarse Wechs-
ler adult intelligence scale (WAI1S), la cual fue revisada en 1981 (WAIS-R). La WAIS-R
está formada por 11 subtests: seis verbales (información, memoria de números, vo-
cabulario, aritmética, comprensión y semejanzas) y cinco manipulativos (completar
imágenes, cubos, puzzles, historietas y claves), dando lugar a un CI verbal, un Cl ma-
nipulativo y un CI global. La aplicación del WA/S, como de las restantes escalas de
Wechsler, requiere el cumplimiento de las normas estipuladas en el manual (por
ejemplo, seguir el orden definido de aplicación de los diferentes subtests, puesto que
los verbales se intercalan con los manipulativos); asimismo, debe ser aplicado por
psicólogos con experiencia. Esto último es importante, tanto por tratarse de un test
de aplicación individual, como por el hecho de que el fin de la aplicación de un sub-
test se produce por un determinado número de fallos que se decide en el propio mo-
mento de la aplicación; además, se debe tener en cuenta la calidad de las respuestas
dadas. Para cada subtest, la aplicación se inicia con un grupo de cuestiones de deter-
minada dificultad, pasando a cuestiones previas si el sujeto falla alguno de ellos; en el
caso de que se produzcan respuestas correctas en ese grupo de cuestiones el sujeto
recibe la puntuación de las cuestiones anteriores.
La normalización de los resultados se hizo a partir de una muestra de 1 880 casos
repartidos en los dos sexos y en nueve niveles de edad entre los 16/17 años y los
70/74 años. En la muestra se tuvieron en cuenta además otras variables de estratifica-
ción como la región, el tipo de comunidad, la raza, el nivel ocupacional y el nivel
educativo; no se incluyeron ni personas cuya primera lengua no fuese el inglés y las
que no comprendían o no se expresaban adecuadamente en esa lengua, ni sujetos
con deficiencias O lesiones reconocidas. Las puntuaciones y el análisis de los resulta-
dos se pueden hacer subtest a subtest, tomando la parte verbal y la parte manipulati-
va de forma separada, o el conjunto de la escala. Para cada subtest, el manual indica la
conversión de la puntuación bruta en puntuación estándar (media de 10 y desviación
típica de 3 puntos), pudiendo interpretar las discrepancias en los resultados entre los
subtests en función de los aspectos cognitivos implicados en cada una de ellas. El
componente verbal, el componente manipulativo y el conjunto de la escala permiten
el cálculo de los CI mencionados (media de 100 y desviación típica de 15 puntos).
También se han hecho propuestas de evaluación tomando únicamente algunos de los
subtests, hecho que puede apoyarse en la alta correlación (cerca de 0,95) encontrada
entre el Cl obtenido de esta forma y el CI conseguido con el conjunto de los subtests
(Matarazzo, 1972).
Los índices de fiabilidad son elevados, apuntándose valores entre 0,96 y 0,98
para el resultado del C1 global, entre 0,95 y 0,97 para el Cl verbal, y entre 0,88 y 0,94
para el CI manipulativo (Anastasi, 1988). Evidentemente, los coeficientes son más
bajos cuando nos referimos a cada subtest en particular. Pero, incluso así, de los 99
coeficientes calculados (cruzando los 11 subtests en los diferentes grupos de edad)
únicamente cinco de ellos se situaron por debajo de 0,70, lo que demuestra la preci-
543
sión de la escala. Los niveles de validez externa de los resultados, aun no siendo tan
elevados como los de la Stanford-Binet, son satisfactorios; este hecho puede expli-
carse por la mayor correlación de estos resultados con el rendimiento escolar que
con el rendimiento profesional, y por la mayor correlación en niños que en adultos.
El análisis factorial de la WA/S-R pemite según Leckliter, Matarazzo y Silverstein
(1986) hablar de un importante factor g, al que sigue un factor verbal (sobre todo en
los subtests de vocabulario, información y comprensión), un factor de organización
perceptiva (cubos y puzzles) y un factor de memoria-atención (memoria, código y
aritmética); este último factor es menos importante y no siempre se encuentra
(Murphy y Davidshofer, 1988).
Escalas de Wechsler para niños
Wechsler desarrolló dos escalas para la evaluación intelectual de los niños: la Wechs-
ler intelligence scale for children (WISC) y la Wecbsler preschool and primary scale of
intelligence (WPPSI). La primera se aplica especialmente a niños de 6 a 16 años, y la
segunda de los 4 alos 6 años o 6 años y medio.
La WISC se construyó en 1949 y fue revisada en 1974 (WISC-R). La estructura de
la escala, sus fundamentos y procedimientos de utilización son prácticamente simi-
lares a los de la WA7S. Así, la escala está formada por 12 subtests, siendo seis de ellos
verbales (información, semejanzas, aritmética, vocabulario, comprensión y memo-
ria de números) y seis manipulativos (completar figuras, historietas, composición de
objetos, cubos, códigos y laberinto); el subtest de memoria, el de números y el de la-
berinto son opcionales. En la estandarización de 1974 se emplearon 2 200 sujetos,
100 por cada sexo y para cada nivel de edad entre los 6 años y medio y los 16 años y
medio. Además, en el muestreo se tuvo en cuenta la región, el tipo de comunidad y la
profesión del padre; los niños con retraso intelectual o con problemas emocionales
graves se descartaron. El cálculo del CI se realiza únicamente con cinco subtests ver-
bales y cinco subtests manipulativos. Como en la WA/S las puntuaciones brutas se
convierten en puntuaciones estándar (media de 10 y desviación típica de 3 puntos),
las cuales darán lugar al CI verbal, al CI manipulativo y al CI global (media de 100 y
desviación típica de 15 puntos). En el W/SC-R se puede calcular la edad de test del
niño que se aproxima a la edad mental de la Stanford-Binet.
Los coeficientes de fiabilidad de los resultados se sitúan generalmente por enci-
ma del 0,91 para las puntuaciones de Cl; si tomamos los subtests de forma individual
los coeficientes oscilan entre 0,68 y 0,88. En cuanto a la validez, las correlaciones con
la Stanford-Binet sobrepasan el 0,70, y con las calificaciones escolares varían entre
0,50 y 0,60. El análisis factorial de los resultados en los subtests parece confirmar
más allá de un importante factor general, una estructura próxima de división entre
un CI verbal y un CI manipulativo (Kaufman, 1975; Marques, 1975). Los subtests
que menos correlacionan con los CI calculados son la memoria de dígitos, el código
y el laberinto (Marques, 1969). En algunos estudios, más allá de esos dos factores
complementarios aparece otro factor más ligado a las pruebas que requieren una es-
pecial atención (Anastasi, 1988).
La WPPSI se desarrolló en 1968, y es muy similar al W/SC. Su parte verbal incluye
subtests de información, vocabulario, aritmética, semejanzas, comprensión y me-
moria de frases (sustituible); la parte manipulativa incluye los subtests de código

(casa de animales), completar imágenes, laberintos, copia de dibujos y cubos. Se ha
intentado elaborar algunas versiones reducidas. Así, Kaufman (1982), tomando úni-
camente dos subtests verbales (aritmética y comprensión) y dos subtests manipulati-
vos (cubos y completar imágenes) obtuvo una correlación con el CI obtenido con la
escala global entre 0,89 y 0,92 en diferentes niveles de edad. Las puntuaciones obte-
nidas con esta versión reducida presentaban unos coeficientes de fiabilidad entre
0,91 y 0,94. Este hecho es importante por la economía de tiempo que implica, lo cual
reduce la posibilidad de fatiga y desinterés por parte del niño al realizar la prueba.
La estandarización de la WPPS1 se realizó en 1200 niños, 100 por cada sexo y por
niveles de edad con intervalos de 6 meses entre los 4 y los 6 años y medio. La muestra
se estratificó por región, tipo de comunidad, raza y ocupación del padre. Los proce-
dimientos de anotación, estandarización de los resultados y las puntuaciones de CI
son idénticos a los del W75C. En cuanto a la fiabilidad, los valores obtenidos son algo
inferiores a los mostrados por el WAJS y el W/SC, lo que se puede atribuir a la menor
edad de las muestras. Así, en varios niveles de edad el coeficiente de fiabilidad se si-
tuó entre 0,92 y 0,94 para el CI global, entre 0,87 y 0,90 para el CI verbal y entre 0,84
y 0,91 para el CI manipulativo; para los subtests este valor se situó en torno a 0,80. En
cuanto a la validez externa se encuentra una gran discrepancia, provocada, tal vez,
por la dificultad para definir los propios criterios externos de la actividad intelectual
en estas edades. En cuanto a la validez de constructo, parece existir dificultad para
identificar los dos factores (verbal y manipulativo) complementarios al factor gene-
ral como sucedía en el W7SC y en el WA7S; esto se hace más evidente en los niveles de
edad más inferiores (Hollenbeck y Kaufman, 1973).
Otras escalas para niños
a. Gesell developmental schedules. A partir de varios estudios longitudinales en la

infancia, Gesell y sus colaboradores publicaron la primera versión de esta escala en
1940. En su versión más reciente (Gesell, Ilg y Ames, 1974), la escala integra cinco
grandes áreas comportamentales: comportamiento adaptativo, motricidad gruesa,
motricidad fina, lenguaje y comportamiento personal y social. La evaluación incluye
actividades diarias del niño (comportamiento del niño ante determinados objetos o
juegos), y los relatos de los padres u otras personas significativas en la crianza del
mismo. Tanto en términos de estímulos y de información tomada, como de los pro-
cedimientos de evaluación se puede considerar esta escala como la primera alternati-
va a los tests de inteligencia (basados en la aptitud y la capacidad), puesto que se
orienta hacia la evaluación del desarrollo cognitivo. Tales aspectos serán retomados
por otros autores de escalas para estas edades u otras superiores, basándose en la teo-
ría de Piaget. La aplicación de la escala de Gesell cubre desde las 4 semanas hasta los
5 años. Sus pruebas, tanto las cuestiones como los procedimientos, se presentan me-
nos estandarizadas que los tests tradicionales de inteligencia. No obstante, muestran
un buen índice de fiabilidad a través del acuerdo entre observadores (cerca de 0,95).
En cuanto al nivel de validez de los resultados, algunos estudios realzan su valor
práctico en el diagnóstico médico de algunas anormalidades orgánicas o neurológi-
cas (Knobloch y Pasamanick, 1974).
545
b. Bayley scales of infant development. Estas escalas se basan en el Berkeley

growth study y evalúan el desarrollo de los recién nacidos (de los 2 a los 30 meses).
Según Bayley (1969), esta evaluación se realiza por medio de tres escalas. La escala
mental proporciona un índice de desarrollo mental a través de la evaluación de las
capacidades perceptivas, memoria, lenguaje, resolución de problemas, comunica-
ción verbal y pensamiento abstracto; la escala motora da lugar a un índice de de-
sarrollo psicomotor a través de medidas de motricidad gruesa y alguna motricidad
fina; y el registro del comportamiento del niño, que evalúa el desarrollo emocional,
social y de personalidad. El uso de estas escalas requiere no sólo un conocimiento es-
pecífico, sino también una base teórica en psicología evolutiva. Existe un cierto
acuerdo en que se trata de la mejor escala, al menos la más sólidamente estudiada,
para la evaluación del desarrollo mental en edades muy precoces (Sattler, 1988), con
todos los riesgos que tal evaluación implica en estas edades. Hay un relativo consen-
so acerca de que la evaluación de la inteligencia en estas edades es una combinación
de aspectos cognitivos, motores y sociales (Anderson y Messick, 1974) y, de hecho,
tales aspectos son considerados en esta escala a través de tareas particularmente liga-
das a la capacidad atencional y de coordinación psicomotora.
c. McCarthy scales of children's abilities (MSCA). Las escalas están formadas a
partir de 18 subtests, cubriendo diferentes niveles de edad (desde 2 años y medio
hasta 8 años y medio) y 6 áreas de desarrollo cognitivo: realización verbal, realiza-
ción cuantitativa, realización perceptiva, realización cognitiva general, memoria y
realización motora. A pesar de que su autor evite el uso del término CI en la interpre-
tación de los puntajes obtenidos, el índice cognitivo general (ICG) que se calcula no
se diferencia de las funciones evaluadas por medio del WISC-R (Sattler, 1988); ade-
más, el ICG presenta una distribución idéntica al Cl: media de 100 y desviación típica
de 16 puntos. Según su autor, la principal diferencia con respecto al CI es que el ICG
se interpreta Únicamente como un índice del funcionamiento mental del niño en el
momento en que se realiza la prueba. Su estandarización incluyó 1032 niños, cerca
de 100 por cada grupo de edad (grupos con intervalos de 6 meses entre los 2 años y
medio, y los 5 años y medio, y con un intervalo de 1 año entre los 5 años y medio, y
los 8 años y medio). Además, se tuvieron en cuenta otras variables como el sexo, la
región, la raza y el nivel profesional del padre. Los coeficientes de fiabilidad, en tér-
minos de consistencia interna, se sitúan entre 0,79 y 0,93 en las diferentes escalas; es-
tos valores son bastante adecuados si tenemos en cuenta la corta edad de los sujetos.
Estos índices de correlación descienden en el cálculo de la fiabilidad a través de coe-
ficientes de estabilidad de las medidas (valores entre 0,69 y 0,89) en las seis escalas se-
paradas. En relación a la validez de los resultados, los coeficientes de correlación se
sitúan entre 0,45 y 0,91, con un valor de la mediana de 0,75 (Sattler, 1988). En térmi-
nos de análisis factorial, especialmente en las edades más bajas, se encuentra alguna
inestabilidad en los factores aislados, por ejemplo, en la relación de algunas pruebas a
determinados factores (Kaufman y Hollenbeck, 1973).
d. Escala de Kaufman (K-ABC). La Kaufman assessment battery for children
(K-ABC) (Kaufman y Kaufman, 1983) es una escala reciente que recoge algunos avan-
ces en el campo de la neuropsicología y de la psicología cognitiva; asimismo, trata de
reflejar necesidades específicas de la evaluación de niños deficientes, con dificultades
de aprendizaje escolar y de niños provenientes de minorías étnicas O culturales. Dir1-
gida a niños entre 2,5 y 12,5 años, la escala considera la división entre inteligencia
fluida (Gf) e inteligencia cristalizada (Gc) propuesta por Cattell (1971) en la organi-
zación de dos secciones: sección de procesamiento mental para la medida de Gf, y
sección de rendimiento para la medida de Gc o conocimiento adquirido.Laprimera
sección se organiza en tests para la evaluación del procesamiento secuencial de infor-
mación (resolución paso a paso) y simultáneo (varias unidades informativas deben
ser consideradas al mismo tiempo). Las escalas de rendimiento evalúan vocabulario,
comprensión lectora, conocimiento general y conocimiento aritmético. La aplica-
ción de la escala es flexible, adecuándose a las características culturales del niño. Por
ejemplo, las primeras cuestiones en cada subtest se deben explicar claramente para
que el niño entienda perfectamente la tarea a realizar. Los subtests permiten calcular
cinco puntuaciones globales (media de 100 y desviación típica de 15 puntos) con una
interpretación cognitiva específica. Así, se obtiene una puntuación de rendimiento o
nivel de inteligencia cristalizada y cuatro puntuaciones de inteligencia fluida: pun-
tuación no verbal para las pruebas en las que no se requiere ningún lenguaje por par-
te del evaluador o del niño, puntuación de procesamiento secuencial de la informa-
ción, puntuación de procesamiento simultáneo de la información y puntuación
compuesta de procesamiento mental (formada por las dos anteriores), y que se iden-
tifica con el nivel de inteligencia fluida del niño. En términos del fundamento teóri-
co, las cuestiones parecen meticulosamente elaboradas y seleccionadas tomando
como referencia el procesamiento cognitivo implicado. Según Anastasi (1988), se
trata de una escala innovadora y con aspectos técnicos de calidad. La consistencia in-
terna de los subtests está en 0,80 y en las puntuaciones globales en torno a 0,90. En
cuanto a la validez externa, sus resultados correlacionan con el W/SC-R en torno a
0,70, y el análisis factorial de los resultados de los subtests corroboran su división en
un procesamiento secuencial frente a un procesamiento simultáneo de información.
VI. CONSIDERACIONES SOBRE LA EVALUACIÓN DE LA INTELIGENCIA
El hecho de la selección y clasificación de reclutas alfabetizados y analfabetos para la

primera guerra mundial por medio de tests de inteligencia provocó un gran auge de
estos tests en la sociedad civil en los años veinte y treinta, especialmente en Estados
Unidos. Una gran industria volcada en la evaluación de la inteligencia surge como
apoyo para evaluar esta capacidad (Murphy y Davidshofer, 1988). Progresivamente,
por razones de índole sociocultural y científica, los tests vendrían a ser objeto de
controversia pública (Cronbach, 1975).
vI1. La controversia social en torno a los tests de inteligencia

En la segunda mitad de este siglo la contestación sociocultural a los tests de inteli-
gencia se fue acentuando. Básicamente, el hecho de que las minorías étnicas presen-
tasen puntuaciones inferiores en tales tests, no ocupando por ello el mismo porcen-
taje de buenos empleos o las mejores escuelas, condujo a un fuerte movimiento
547
crítico y contrario a los tests, provocando dudas en cuanto a su neutralidad social y

validez científica. Hablando en nombre de la Black Psychological Association, Jack-
son (1975) informa de la influencia social de los tests. A pesar de los estudios publi-
cados como respuesta a la controversia originada, es cierto que aún hoy la cuestión
no está totalmente clarificada. En términos de comunicación social, el interés de la
polémica estaba en torno a las diferentes oportunidades de empleo y promoción que
los sujetos provenientes de grupos sociales y étnicos diferentes tendrían al ser eva-
luados por medio de estos tests (Vane y Motta, 1990). Los grupos más desfavoreci-
dos socialmente presentaban peores resultados en los tests tradicionales de inteligen-
cia, siendo discriminados en la enseñanza y en el empleo.
Los tests culture-fair constituyeron un intento para disminuir el peso de los co-
nocimientos y de las capacidades culturales de los individuos en la evaluación de la
inteligencia. Los esfuerzos de Els (1951) no tuvieron gran impacto en la época, pues
predominaba todavía el uso de los tests. La propia relación evaluador-evaluado en
tales tests y su impacto diferencial en el rendimiento según el origen social y étnico
de los sujetos vino a dar más fuerza al movimiento antitests. Las críticas fueron cada
vez más incisivas y, en algunos momentos, los tests fueron asociados a prácticas ra-
cistas (Jackson, 1975; Jones y Wilderson, 1976) o a modos de deshumanizar y de
destruir niños y jóvenes negros (Williams, 1970). El propio Williams (1972) elaboró
un test que en su opinión era más adecuado a la evaluación intelectual de niños ne-
gros, puesto que no tiene en cuenta sus experiencias culturales. También intentó de-
mostrar que un test de inteligencia influenciado culturalmente favorecería un grupo
de niños en relación a otros. Su prueba, el Black intelligence test of cultural homoge-
neity (BITCH), constituye un test de vocabulario que no tiene en cuenta los conoci-
mientos culturales de los guetos negros. En esta prueba, los niños negros obtienen
mejores puntuaciones que los blancos (Matarazzo y Wiens, 1977). No obstante, el
hecho de que las cuestiones estén más centradas en contenidos específicos que en
procesos cognitivos del tratamiento de información y de resolución de problemas
pone en duda si realmente constituye una medida válida de la inteligencia (Mataraz-
zo y Wiens, 1977; Cronbach, 1978; Jensen, 1981).
v12. Las críticas a los tests de inteligencia

Las críticas a los tests de inteligencia inciden en tres aspectos: en los tests en sí mis-
mos, en la forma en que eran usados y en las conclusiones que se sacaban a parur de
sus puntuaciones. En relación al propio test, se puede hacer referencia a dos aspec-
tos. El primero tiene que ver con la dificultad de evaluar algo que todavía no está
erfectamente definido. En otras palabras, consideramos que los tests serán siempre
medidas posibles de inteligencia, pero nunca —al menos en estos momentos— las
medidas de la inteligencia. Falta una definición clara y precisa, unánimemente acep-
tada, capaz de orientar con mayor objetividad la construcción de los indicadores
para su medida. Se verifica, incluso, que los tests existentes evalúan determinados as-
pectos, y no otros, del desempeño cognitivo. Un segundo aspecto está relacionado
con el hecho de que los sujetos mejor preparados o entrenados en la realización de
los tests obtendrán mejores resultados. Más allá de cuestionar estas ganancias de cara
a las definiciones de inteligencia algunas veces avanzadas (por ejemplo, su estabili-

dad e independencia cara al aprendizaje o a conocimientos específicos), podemos
considerar que tales ganancias afectan por lo menos tanto a la objetividad como a la
validez de los resultados obtenidos. Además, las propias expectativas de los resulta-
dos por parte del sujeto o de los otros en relación a uno parecen afectar significativa-
mente al rendimiento intelectual evaluado en los tests (véase el trabajo de Rosenthal
y Jacobsen, 1968).
En segundo lugar, algunas de las dificultades surgen por la forma en que son usa-
dos los tests. Algunas veces se aplican sin estar adaptados y contrastados a ciertas po-
blaciones, sin respetar, por tanto, las especificidades lingúísticas y culturales de los
individuos (Reschly, 1981). De forma paralela, se cuestiona el sentido de la validez
predictiva asociada a la justificación del uso de los tests. En muchos trabajos y en la
práctica psicológica, la evaluación ocurre por norma cuando un problema o una de-
ficiencia está ya identificada. Tal uso, más que estudiar el poder de pronóstico de los
tests, justifica la explicación y certificación del bajo desempeño. Los estudios con
subgrupos de rendimiento claramente inferior pueden crear una realidad a través de
un círculo cerrado de información.
Finalmente, las condiciones de evaluación son tan diversas y decisivas para los
resultados que una evaluación mínimamente consciente requiere una individualiza-
ción de la información. Esta individualización es especialmente importante en la
evaluación a través de tests colectivos, puesto que el psicólogo puede obtener muy
poca información acerca de las justificaciones y procesos empleados por el sujeto en
sus respuestas. Con todo, también en los tests individuales se debe tener cierta pre-
caución en este aspecto, especialmente con niños. Por ejemplo, la no comprensión
de la situación de evaluación puede llevar a no responder a preguntas sobre cosas ob-
vias. El “pedido de exhibición” (request for display) puede no entenderse como sufi-
cientemente serio y claro por parte del niño, no respondiendo, por tanto. Sin con-
textos propios, algunas de las situaciones de evaluación del niño no tienen sentido,
siendo necesario garantizar que la objetividad de los estímulos (cuestiones) perma-
nece detrás del esfuerzo de adecuación de las situaciones por parte del psicólogo.
Una de las propuestas más conocidas para una evaluación exhaustiva e indivi-
dualizada de la inteligencia es el programa System of multicultural pluralistic assess-
ment (SOMPA) [Sistema de evaluación pluralístico multicultural] de Mercer y Lewis
(1978). El SOMPA está dirigido a niños entre 5 y 11 años e integra información rela-
cionada con la aplicación de la escala W/SC-R con la obtenida a través de entrevistas a
los padres, entrevista individual al niño, su historia médica, evaluación sensoriomo-
tora y perceptiva, y de la aplicación de un inventario de comportamientos adaptati-
vos para niños. La información referente a la base socioeconómica debe entrar en
una ecuación de regresión para transformar la puntuación del CI (WISC-R) en una
puntuación estándar denominada potencial de aprendizaje estimado (PAE). Según
Mercer (1973, 1978), la ventaja del SOMPA es permitir una interpretación de las pun-
tuaciones obtenidas (más que la predicción de un suceso esperado en el futuro el
provecho que el niño podrá hacer de las situaciones de aprendizaje de su contexto
sociocultural), y no asociar al “estigma de la deficiencia” las percepciones de inca-
pacidad dadas a las consecuencias sociales y psicológicas que surgen como conse-
cuencia.
En tercer lugar, se pueden hacer algunas consideraciones con respecto a las con-
clusiones obtenidas con estas pruebas. Los resultados de los tests discriminan los in-
dividuos en función de su origen social, dando lugar a un porcentaje más elevado de
sujetos de las minorías étnicas en aulas especiales y en los peores empleos. Según al-
gunos autores, los tests de inteligencia serían únicamente fieles y válidos para indi-
viduos escolarizados de raza blanca (Williams, 1974). La cuestión de la validez nos
parece más pertinente y, en el fondo, consiste en saber si el test evalúa el mismo pará-
metro en diferentes grupos. Los tests, cuyas cuestiones se aproximan o reflejan los
conocimientos y la experiencia escolar, no son socialmente neutros, pues tales aspec-
tos no se encuentran distribuidos de forma igualitaria. Las cuestiones verbales son
las afectadas con más facilidad. Jensen (1980) considera que los tests de lápiz y papel,
al requerir lectura, respuestas escritas, velocidad, contenido verbal y memoria de in-
formación aprendida, son más fácilmente influenciados por los aspectos culturales
que los tests manipulativos, figurativos, de respuestas orales, de contenidos no ver-
bales, potencia y resolución de problemas. Las implicaciones de estas consideracio-
nes pueden conducir a serios problemas. El valor incuestionable de los tests puede
perpetuar medidas socialmente discriminativas. Los profesores pueden intentar ex-
plicar el bajo rendimiento en la escuela de algunos grupos de escolares tomando
como referencia su bajo desempeño en los tests de CI (Mercer, 1973). Al mismo
tiempo, la concepción de que ciertos grupos son superiores y otros inferiores en los
tests de inteligencia puede sugerir una determinación genética en tales diferencias
(Jensen, 1969; Herstein, 1971). La verdad es que uno de los mitos que no puede ser
compartido por los psicólogos, aunque permanezca entre el público, los profesores
y otros profesionales, es que el CI está determinado por factores genéticos, siendo
por eso una buena medida de la inteligencia.
v13. La discrepancia entre la concepción y la evaluación de la inteligencia

Si tenemos en cuenta los aspectos apuntados por el movimiento crítico a los tests y
considera los aspectos que la investigación valora hoy en la definición de inteligencia
(experiencia, conocimiento, estrategias, resolución de problemas, componentes...),
nos queda la percepción de que en la actualidad sabemos más sobre la inteligencia de
lo que los tests tradicionales evaluaban. Algunas de las críticas almétodo de los tests
dejarían de ser importantes si se verificase una mayor permeabilidad entre la investi-
gación y la práctica psicológica. En nuesta opinión, la investigación va delante de la
práctica y, por diversas razones (inclusive por cuestiones de investimentos económi-
cos asociados a proyectos tan amplios como la construcción de una mueva batería de
pruebas), las modificaciones en la concepción de la inteligencia no pasaron a laprác-
tica de la evaluación. En los últimos años se produjo un movimiento de mejoría de
los tests y de las condiciones de evaluación. Los esfuerzos realizados en la reciente
revisión de la Stanford-Binet y en la construcción de laK-ABC reflejan la preocupa-
ción por parte de sus autores por integrar los conocimientos recientes en el campo
de la psicología cognitiva (teoría del procesamiento de información) con la psicome-
tría tradicional. Los tests tradicionales continúan usándose con normalidad, simple-
mente hay mayor flexibilidad en las interpretaciones de las puntuaciones. Estas mo-
dificaciones no son radicalmente diferentes a los posicionamientos anteriores. Por

su parte, los propios psicólogos que recurren a la evaluación de la inteligencia se
sienten seguros con estos tests, los cuales dominan y fueron parte integrante de su
formación en psicología.
v1.4. Cambios previsibles en la evaluación de la inteligencia

En el futuro se prevén cambios en la evaluación de la inteligencia, algunos de los cua-
les ya son realidad. En primer lugar, existe una mayor preocupación por el análisis
intraindividual del rendimiento en los tests como contraposición a las normas de
grupo (Perlman y Kaufman, 1990). Por ejemplo, es previsible la aparición de un ma-
yor número de pruebas referidas al criterio y, en el caso concreto de la inteligencia,
como complemento a los tests centrados en normas. En segundo lugar, existe ya una
reorientación del objetivo de la evaluación, produciéndose un menor énfasis en la
evaluación de la aptitud mental o intelectual en beneficio de una evaluación más cen-
trada en las capacidades asociadas al aprendizaje o desempeño (Horn, 1979; Resnick,
1979; Sattler, 1988). En tercer lugar, habrá que integrar en la evaluación de la inteli-
gencia un componente curricular y extraescolar (experiencia y conocimientos) del
individuo. Estos aspectos nos dan información sobre las formas habituales de adap-
tación y de resolución de problemas en la vida diaria del individuo (Perlman y Kauf-
man, 1990). En cuarto lugar, la evaluación de la inteligencia deberá incluir aspectos
más dinámicos del propio ejercicio y funcionamiento cognitivo. Por ejemplo, nos
referimos a los estilos cognitivos o a las estrategias de procesamiento de informa-
ción; en otras palabras, la evaluación de la inteligencia no deberá referirse tanto a
“qué inteligente es” sino a “cómo funciona cognitivamente”. El test X-ABC responde
ya a esta preocupación al incluir pruebas para la evaluación del procesamiento se-
cuencial y simultáneo de información. Por último, el futuro de la evaluación de la in-
teligencia pasará por los desarrollos en el campo de la cognición, de los ordenadores,
de la inteligencia artificial y de la teoría del procesamiento de información en sentido
amplio (Lindemann y Matarazzo, 1990). Los avances registrados en el campo de la
informática y de la tecnología en general están influyendo en las formas habituales
de la evaluación de la inteligencia. Si en un primer momento únicamente la correc-
ción se hacía de una forma mecánica y rápida a través de estos medios, en la actuali-
dad la propia aplicación, organización de cuestiones y la elaboración de informes-
síntesis se realizan a través del ordenador. Las ventajas potenciales de este
procedimiento son un conocimiento más refinado de las respuestas a cuestiones ais-
ladas (por ejemplo, latencia de respuesta), una aplicación más ajustada a las caracte-
rísticas y capacidades reales de los sujetos (eliminación de las cuestiones más fáciles y
más difíciles) a través de la elección de las cuestiones adecuadas en función de las res-
puestas a las cuestiones anteriores (Weiss y Davidson, 1981) y, en tercer lugar, un
menor tiempo, menor costo y una mayor objetividad en la evaluación; evidentemen-
te, estas ventajas no son absolutas, por lo que es importante verificar y controlar el
uso del ordenador. La familiaridad y la relación establecida con la máquina y el test
pueden influir en el rendimiento (Murphy y Davidshofer, 1988). Es importante que
las ganancias obtenidas de esta forma en términos de recursos humanos y materiales
551
implicados no se conviertan en pérdida de información de la evaluación (Perlman y

Kaufman, 1990). También ligada a la cognición, otra área de investigación de gran
impacto en la actualidad, y que se espera que tenga reflejo en el campo de la defini-
ción y evaluación de la inteligencia, está formada por los avances en la comprensión
de los factores neurológicos, bioquímicos y fisiológicos relacionados con la activi-
dad inteligente. Es posible que de ahí surjan, por ejemplo, medidas más directas de la
inteligencia tomando sus elementos operantes (Lindemann y Matarazzo, 1990).
VI. CONCLUSIONES
Alo largo de este capítulo, y más concretamente al presentar algunos de los tests in-
dividuales y colectivos más usados en la investigación y en la práctica clínica, se ha
hecho referencia a los valores obtenidos en estudios de fiabilidad y validez de sus re-
sultados. Podríamos decir que los tests de inteligencia, sin tener una cientificidad ab-
soluta del 100% en su información, muestran confianza y ayudan a tomar decisio-
nes. El margen de error en las estimaciones y en las decisiones es menor con su uso
que sin él. Evidentemente, este margen de error aumenta cuanto más se aproximen a
un individuo la evaluación y las decisiones (caso individual), siendo menor cuando
hacemos referencia a grupos.
viL1. Fiabilidad y validez de los resultados en los tests de inteligencia

Haciendo referencia a los tests más citados en la bibliografía o más usados en la prác-
tica para evaluar las características intelectuales de los individuos, podemos afirmar
que presentan resultados satisfactorios en términos de fiabilidad y validez. De un
modo general, los coeficientes de fiabilidad presentes en la estabilidad de los resulta-
dos y en la consistencia interna de las cuestiones están por encima de 0,75 y de 0,85,
respectivamente. Sin entrar en la polémica herencia-medio en la inteligencia, pode-
mos afirmar la relativa estabilidad de los resultados en los tests de inteligencia. Rees
y Palmer (1970) encontraron coeficientes entre 0,75 y 0,85 a los 6, 12 y 17 años (ade-
más, para el 58% de los sujetos de este estudio el cambio en la puntuación del CI se
situó dentro de 15 puntos). Valores similares fueron apuntados en otros estudios con
adolescentes y jóvenes adultos (Harnqyist, 1968; Matarazzo, 1972). Aunque en al-
gunos estudios transversales se ha verificado una disminución en el rendimiento a
medida que avanza la edad, el problema puede ser de carácter experimental (Schaie y
Strother, 1968; Nesselroade y Reese, 1973; Schaie y LaBouvie-Vief, 1974), puesto
que tales pérdidas no se encuentran en estudios longitudinales hasta una edad bas-
tante avanzada, aunque pueden surgir otros problemas metodológicos como la
mortalidad, la equivalencia del grupo a lo largo del tiempo y la equivalencia de dife-
rentes tests a lo largo de la edad (Flynn, 1984). A nivel de validez, podemos afirmar
que los coeficientes de validez empírica y los parámetros apreciativos de la validez
de concepto o de constructo también se adecuan a los objetivos de la evaluación psi-
cológica de cada test. Los tests de inteligencia son todavía hoy las medidas predicti-
vas del éxito del sujeto en la escuela, en el trabajo o en la vida social. No disponemos,
al menos hasta el momento, de sustitutos adecuados para los tests de inteligencia
cuando el objetivo de la evaluación psicológica es el conocimiento del nivel y capaci-
dad de funcionamiento mental o la predicción de su rendimiento posterior. Claro
está que, retomando algunas de las críticas realizadas a los tests, podemos estar utili-
zando información redundante. Es previsible que los tests correlacionen con el ren-
dimiento escolar, pues surgen en cierta medida de situaciones que implican aprendi-
zajes y actividades curriculares (Detterman, 1979). Esto no quita nada del valor
informativo del test y de los resultados obtenidos en términos de diagnóstico y pre-
visión, igual que aceptamos lo importante que sería que el test permitiese una infor-
mación prescriptiva, o sea, dar información relevante para orientar la educación, la
enseñanza y el aprendizaje (Perlman y Kaufman, 1990).
viL2. El papel de las críticas a los tests de inteligencia

Los comentarios realizados en torno a la fiabilidad y validez de los resultados en los
tests no eliminan la pertinencia de las críticas hechas al método de los tests, ni tam-
poco significan que la situación está bien tal como está. Varios problemas subsisten
en la práctica. La generalización de resultados de muestras a subgrupos o de éstos a
individuos singulares presenta dificultades, incluso desde el punto de vista deonto-
lógico. Por todo ello, es importante mejorar la calidad de los instrumentos, cuidar su
uso y precisar la interpretación de sus resultados. Consideramos que las críticas jue-
gan aquí un importante papel. Tanto los constructores como los aplicadores de los
tests deben tener en cuenta la presión social y científica de las imperfecciones de las
medidas, y de este modo hacer un esfuerzo, tanto para la actualización como para su
relativización y complementariedad, respectivamente. A pesar de las críticas, los
tests siguen siendo apreciados y utilizados. Aunque no son perfectos, ofrecen mayo-
res garantías y validez en las decisiones tomadas en comparación con otras formas
alternativas. Por ejemplo, cuando en algunos Estados americanos los tests de inteli-
gencia fueron sustituidos por tests más relacionados con el rendimiento del niño, un
mayor porcentaje de niños de las minorías étnicas fue dirigido a centros de educa-
ción especial (Vane y Motta, 1990). Información acumulada con respecto al CI y
otras medidas del desempeño cognitivo indica que aquellos sujetos que mejor reali-
zan estas pruebas son los que obtienen un mejor rendimiento en otros contextos de
la vida (Carroll y Horn, 1981). Simultáneamente a las críticas y a la defensa de los
tests, podemos situar el interés en el estudio de las diferencias individuales. Por nor-
ma, estos aspectos se relacionan al hablar de las ventajas y desventajas de su conside-
ración en psicología.
vit3. El uso inteligente de los tests de inteligencia

La cuestión de la falta de atención al individuo y su contexto en la evaluación es deci-
siva. La validez ecológica puede optimizarse si el psicólogo considera situaciones-
problema como fuente de información de la evaluación y complementa la situación
553
de laboratorio cuyo modelo sirvió a la construcción de los tests. Ha existido una

preocupación por convertir la situación de evaluación en algo más contextualizado.
Varios inventarios del comportamiento habitual del sujeto, las entrevistas a otras
personas significativas para el sujeto o situaciones-problema a resolver se han usado
como fuente complementaria a los tests. Hoy la evaluación de la inteligencia no se
puede reducir a la aplicación y corrección de un test. En la evaluación psicológica la
precisión del instrumento no concede la sutileza del conocimiento (Zazzo, Gilly y
Verba-Rad, 1978). El hecho de tomar de los tests únicamente los resultados, dada su
objetividad, no es suficiente, pues puede conducirnos a errores. De forma paralela,
se debe tener en cuenta la información relativa a los conocimientos, actitudes y apti-
tudes; es decir, se debe realizar una evaluación general de la competencia (Sundberg,
Snowden y Reynolds, 1978). Tal como consideran Zazzo y cols. (1978), todo proce-
so científico no es más que un instrumento que debe ser usado por una mano inteli-
gente. Esto ha recibido la denominación de uso inteligente de los tests de inteligencia
(Wesman, 1968; Kaufman, 1979).
- Terminamos concluyendo que los tests presentan limitaciones; no obstante, tales
deficiencias no los convierten en meras reliquias o elementos de un pasado histórico
de la psicología. Estos problemas no ponen en duda su uso, pero se deben tener en
cuenta tanto a la hora de la interpretación de los valores obtenidos, como en el mo-
mento de buscar información complementaria a través de otros medios. Si acepta-
mos el hecho de poder utilizar en el próximo milenio los tests que están hoy en cir-
culación, así como los que ya estaban hace cincuenta años (Horn, 1979), entonces
debemos mejorar nuestras competencias evaluadoras.
Almeida, L. S. (1988). Teorias da inteligencia. Oporto. Jornal de Psicologia.

Anastasi, A. (1988). Psychological testing. Nueva York. MacMillan.
Anderson, S. B. y Messick, S. (1974). Social competency in young children. Developmental
Psychology, 10, 282-293. 25 .
Bairrao, J. (1980). Nova escala métrica da inteligéncia. En R. Zazzo, M. Gilly y M. Verba-Rad
(dirs.), Nova escala métrica da inteligéncia (vol. 11). Lisboa. Livros Horizonte.
Bayley, N. (1969). Bayley Scales of Infant Development: Birth to two years. San Antonio.
Psychological Corporation. 4
Binet, A. (1910). Les idées modernes sur les enfants. París. E. Flammarion. '
Binet, A. y Simon, T. (1905). Méthodes nouvelles pour le dignostic du niveau intellectuel des
anormaux. Année Psychologique, 11, 191-244. L.
Carroll, J. B. y Horn, J. L. (1981). On the scientific basis of ability testing. American Psycho-
logist, 36, 1012-1020. cura
Cattell R. B. (1971). Abilities, their structure, growth, and action. Boston. Houghton Mifflin.
Cattell, R. B. (1973). Cattell culture fair intelligence tests. Champaign. Institute for Persona-
lity and Ability Testing. an
abi, lo. Js (1972) ilantel tos de la exploració n psicológic a. Madrid. Biblioteca Nueva,
Cronbach, L. J. (1975). Five decades of public controversy over mental testing. American
Cronbach, L. J. (1978). Review of the BITCH Test. Eighth mental measurements yearbook
(vol. 1). Highland Park. Gryphon. ' a
Delaney, E. y Hopkins, T. (1987). Stanford-Binet Intelligence Scale: Examiner's handbook;
An expanded guided for fourth edition users. Chicago. Riverside Pubs.
Detterman, D. K. (1979). A job half done: The road to intelligence testing in the year 2000.
EnR.]. Sternberg y D. K. Detterman (dirs.), Human intelligence. Norwood. Ablex.
Els, K. (1951). Intelligence and cultural differences. Chicago. University Chicago Press.
Flynn, J. R. (1984). The mean 1Q of americans: Massive gains 1932 to 1978. Psychological Bu-
lletin, 95, 29-51.
Gesell, A., Ilg, F.L. y Ames, L. B. (1974). Infant and child in the culture of today. Nueva
York. Harper and Row.
Guilford, J. P. (1959). Three faces of intellect. American Psychologist, 14, 469-479.
Guilford, J. P. (1982). Cognitive psychology”s ambiguities: Some suggested remedies. Psy-
chological Reviezw, 89, 48-59. dd
Harnqvist, K. (1968). Relative changes inintelligence from 13 to 18. Scandinavian Journal of
Herstein, R. (1971). 1Q. Atlantic-Monthly (septiembre), 43-64.
Hollenbeck, G. P. y Kaufman, A. S. (1973). Factor analysis of the Wechsler Preschool and
Primary Scale of Intelligence (WPPS1). Journal of Clinical Psychology, 29, 41-45.
Horn, J. L. (1979). Trends in the measurement of intelligence. En R. J. Sternberg y D. K. Det-
terman (dirs.), Human intelligence. Norwood. Ablex.
Jackson, D. A. (1984). Multidimensional Aptitude Battery (MAB): Manual. Port Huron. Re-
search Psychologists Press.
Jackson, G. (1975). On the report of the ad hoc committee on educational uses of tests with
disadvantaged students. American Psychologist, 30, 88-92.
Jensen, A. R. (1969). How much can we boost I1Q and scholastic achievement? Harvard Edu-
cational Review, 39, 1-123.
Jensen, A. R. (1980). Bras in mental tests. Nueva York. The Free Press.
Jensen, A. R. (1981). Straight talk about mental tests. Londres. Methuen.
Jones, R. y Wilderson, F. (1976). Mainstreaming and the minority child. An overwiew of is-
sues and a perspective. En R. Jones (dir.), Mainstraiming and the minority child. Reston.
Council for Exceptional Chidren.
Kaufman, A. S. (1975). Factor structure of the McCarthy Scales at five age levels between 2
1/2 and 81/2. Educational and Psychological Measurement, 35, 641-656.
Kaufman, A. S. (1979). Intelligent testing with the WISC-R. Nueva York. Wiley.
oia A. S. (1982). Psicometría razonada con el WISC-R. México D. F. El Manual Mo-
erno.
Kaufman, A. S. y Hollenbeck, G. P. (1973). Factor analysis of the standardization edition of
the McCarthy scales. Journal of Clinical Psychology, 29, 358-362.
Kaufman, A. y Kaufman, N. (1983). Kaufman Assessment Battery for Children (K-ABC). Cir-
cle Pines. American Guidance Service.
Knobloch, H. y Pasamanick, B. (dir.) (1974). Gesell and Amatruda's developmental diagno-
sis. Nueva York. Harper and Row.
Leckliter, IL. N., Matarazzo, J. O. y Silverstein, A. B. (1986). A literature review of factor
analytic studies of the WA7S-R. Journal of Clinical Psychology, 42, 332-342.
Lennon, R. (1980). The anatomy of a scholastic aptitude test. NCME Measurement in Edu-
cation, 11, 1-8.
Lindemanmn, J. E. y Matarazzo, J. D. (1990). Assessment of adult intelligence. En G. Golds-
Es y M. Hersen (dirs.), Handbook of psychological assessment. Nueva York. Pergamon
ress.
555
Lorge, 1.y Thorndike, R. L. (1964). Lorge-Thorndike Intelligence Test. Boston. Houghton

in.
Marques, J. H. F. (1969). Estudos sobre a escla de Wechsler para criancas (WISC): Sua
dapa-
tacao e afericao para Portugal. Lisboa. Universidade de Lisboa.
Marques, J. H. F. (1975). A diferenca entre o Q1 verbal e o QI de realizacao nas escalas de
Wechsler. Revista Portuguesa de Pedagogía, s/n, 159-172.
Matarazzo, J. D. (1972). Wechsler's measurement and appraisal of adult intelligence. Baltimo-
re. Williams and Wilkins.
Matarazzo, J. D. y Wiens, A. N. (1977). Black Intelligence Test of cultural homogeneity and
Wechsler Adult Intelligence Scale scores of black and white police applicants. Journal of
Applied Psychology, 62, 57-63.
Mercer, J. R. (1973). Labeling the mentally retarded. Berkeley. University California Press.
Mercer, J. R. (1978). Theoretical constructs of adaptative behavior: Movement from a medi-
cal to a social-ecological perspective. En W. A. Coulter y H. W. Morrow (dirs.), Adapta-
tive behavior: Concepts and measurements. Orlando. Grune and Stratton.
Mercer, J. R. y Lewis, J. F. (1978). System of Multicultural Pluralistic Assessment (SOMPA).
San Antonio. Psychological Corporation.
Murphy, K. R. y Davidshofer, C. O. (1988). Psychological testing: Principles and applications.
Englewood Cliffs. Prentice-Hall International.
Nesselroade, J. R. y Reese, H. W. (dirs.) (1973). Life-span developmental psychology: Metho-
dological issues. Orlando. Academic Press.
Otis, A. S. y Lennon, R. T. (1969). Otis-Lennon Mental Ability Test. Nueva York. Harcourt,
Brace and World.
Otis, A. S. y Lennon, R. T. (1977). Otis-Lennon School Ability Test. Nueva York. Harcourt
Brace Jovanovich. odos
Perlman, M. D. y Kaufman, A.S. (1990). Assessment of child intelligence. En G. Goldstein y
M. Hersen (dirs.), Handbook ofpsychological assessment. Nueva York. Pergamon Press.
Raven, J. C. (1941). Standardization of progressive matrices. British Journal of Medical Psy-
chology, 19, 137-150.
Raven, iSC. (1981). Manual for Raven's Progressive Matrices and Mill Hill Vocabulary Sca-
les. Londres. H. K. Lewis. |
Raven, J. C., Court, J. H. y Raven, J. (1985). Manual for Raven's Progressive Matrices and
Vocabulary Scales; Standard progressive matrices. Londres. H. K. Lewis.
Rees, A. H. y Palmer, F. H. (1970). Factors related to change in mental test performance. De-
velopmental Psychology Monograpbs, 3. aer
Reschly, D. J. (1981). Evaluation of the effects of SOMPA measures on classification of stu-
dents as midly retarded. American Journal on Mental Deficiency, 86, 16-20.
Reschly, D. J. (1990). Aptitude tests in educational classification and A sE
G. Goldstein y M. Hersen (dirs.), Handbook of psychological assessment. Nueva York,
ergamon Press.
cda L. B. (1979). The future of IQ testing in education. En R. J. Sternberg y D. K. Detter-
man (dirs.), Human intelligence. Norwood. Ablex. 3 ) ml La
Roazzi, A., Spinillo, A. G. y Almeida, L. S. (1991). Definigao e avaliagao da E a j-
mites e perspectivas. En ES Almeida (dir.), Cognigao e aprendizagem escolar. Oporto.
iacao dos Psicólogos Portugueses. [.
a y Jacobsen, L 41068) Prgmálion in the classroom. Nueva York. Holt, Rine-
inston.
a pu AiEN Age effects on Wechsler Adult Intelligence Scale-Revised Tests. Journal
of Consulting Clinical Psychology, 50, 785-786.
Sattler, J. M. (1988). Assessment of children. San Diego. Jerome M. Sattler. E
Schaie, K. W. y LaBouvie-Vief, G. (1974). Generatio nal versus ontogenic compo
change in cognitive behavior: A fourtheen year cross-sequential study. Developmental

Psychology, 10, 305-320. y o.
Schaie, K. W. y Strother, C. R. (1968). A cross-sequential study of age changes in cognitive
behavior. Psychological Bulletin, 70, 671-680.
Snow, R. E. (1980). Aptitudes processes. En R. E. Snow, P. A. Federico y W. E. Montagne
(dirs.), Aptitudes, learning, and instruction (vol. 1). Hillsdale. Erlbaum.
Spearman, C. (1927). The abilities of man. Nueva York. MacMillan. :
Stanley, J. C. y Porter, A. C. (1967). Correlation of Scholastic Aptitude Test scores with co-
llege grades for negroes versus whites. Journal of Educational Measurement, 4, 199-218.
Stern, W. L. (1912). The psychological methods of testing intelligence. Education Psychology
Monographs 13. Baltimore. Warwick and York. ,
Sternberg, R. J. (1981). Intelligence and nonentrenchment. Journal of Educational Psycho-
logy, 73, 1-16.
Sund st N. D., Snowden, L. R. y Reynolds, W. M. (1978). Toward assessment of personal
competence and incompetence in life situations. Annual Review of Psychology, 29, 179-
20.
Terman, L. M. (1916). The measurement of intelligence. Boston. Houghton Mifflin.
Terman, L. M. y Merrill, M. A. (1960). Stanford-Binet Intelligence Scale: Manual for the
third revision, Form L-M. Boston. Houghton Mifflin.
Thorndike, R. L., Hagen, E. P. y Sattler, J. M. (1986). Stanford-Binet Intelligence Scale:
Fourth Edition. Chicago. Riverside Pubs.
Thurstone, L. L. (1938). Primary Mental Abilites. Chicago. University Chicago Press.
Undheim, J. O. (1981). On Intelligence IV: Toward a restoration of general intelligence.
Scandinavian Journal of Psychology, 22, 251-256.
Vane, J. R. y Motta, R. W. (1990). Group intelligence tests. En G. Goldstein y M. Hersen
Vernon, P. E. (1965). The structure of human abilities. Londres. Methuen.
Vernon, P. A. (1985). Multidimensional Aptitude Battery. En D. J. Keyser y R. C. Sweetland
(dirs.), Test critiques. Kansas City. Test Corporation of America.
Wechsler, D. (1939, 1944). The measurement of adult intelligence scale. Baltimore. Williams
and Wilkins.
Wechsler, D. (1950). Cognitive, conative, and non-intellective intelligence. American Psycho-
logist, 15, 78-83.
Weiss, D. J. y Davidson, M. L. (1981). Test theory and methods. Annual Review of Psycho-
logy, 32, 629-658.
Wesman, A. G. (1968). Intelligent testing. American Psychologist, 36, 112-113.
Wigdor, A. K. y Garner, W. R. (1982). Ability testing: Uses, consequences, and controversies.
Washington, DC. National Academy Press.
Williams, R. L. (1970). Danger: Testing and deshumanizing the black child. Clinical Child
Psychology Newsletter, 9, 5-6.
Williams, R. L. (1972). The BITCH Test. St. Louis (Mo). Black Studies Program, Washington
University.
Williams, R. L. (1974). The problem of match and mismatch in testing black children. En
L,MAS (dir.), The testing of black students: A symposium. Englewood Cliffs. Prentice-
all.
Wonderlic, E. F. (1945). Personnel test. Nueva York: The Psychological Corporation.
LAZO, Ba Gilly, M. y Verba-Rad, M. (1966). Nouvelle Échelle Meétrique de Intelligence.
París. Librairie Armand Colin.
Zazzo, R., Gilly, M. y Verba-Rad, M. (1978). Nova Escala Métrica da Inteligencia (vol. 1).
Lisboa: Bivros Horizonte.
Aiken, L. R. (1987). Assessment of intellectual functioning. Boston. Allyn and Bacon.

Carroll, ]. (1986). La medición de la inteligencia. En R. J. Sternberg (dir.), Inteligencia huma-
na (vol. 1). Barcelona. Paidós.
Kaplan, R. M. y Saccuzzo, D. P. (1993). Psychological testing. Principles, aplications, and is-
Murphy, K. R. y Davidshofer, C. O. (1991). Psychological testing. Principles and aplications
Ortiz, P. (1992). Evaluación intelectual en la clínica: las escalas de Wechsler, la evaluación del
pensamiento conceptual y perspectivas actuales. En A. Ávila (dir.), Evaluación en psicolo-
gía clínica Í: proceso, método y estrategias psicométricas. Salamanca. Amarú.
23. EVALUACIÓN DE LAS APTITUDES
CAROL ROBINSON-ZAÑARTU Y DANIELJ.RESCHLY
I. INTRODUCCIÓN
La evaluación de las aptitudes y su adiestramiento ha tenido durante mucho tiempo

un papel importante en el diagnóstico clínico de niños y adolescentes con problemas
e aprendizaje y conducta. En este capítulo se revisan los principales métodos de
evaluación de las aptitudes, haciendo énfasis en el modo en que esta información se
usa durante los procesos de diagnóstico, orientación educativa y adiestramiento. Por
lo tanto, no se incluye información sobre la evaluación de aptitudes en adultos o su
uso en la orientación vocacional o profesional. Un tema crítico en nuestro análisis es
la validez del tratamiento, o sea, si el tratamiento es efectivo o más efectivo cuando se
basa en un determinado concepto de aptitud y sus respectivos procedimientos de
evaluación. Este criterio requiere la consideración de modelos, conceptos, procedi-
mientos de evaluación, métodos de tratamiento y resultados estimados. Estos últi-
mos son especialmente importantes en nuestro análisis. Los resultados estimados o
criterios de validez deben ser una parte integral de la evaluación de los diferentes
modelos de aptitud. Algunos modelos tradicionales, aunque intelectualmente atrac-
tivos y lógicamente persuasivos, tienen un criterio limitado de validez de tratamien-
to. Sus usos en situaciones clínicas prácticas se deben considerar discutibles si no se
pueden demostrar beneficios para los niños y adolescentes. A continuación se des-
criben y examinan algunos de estos modelos, para dedicar la mayor atención al
aprendizaje mediado, un modelo con enorme potencial que ha sido examinado por
expertos de varios países occidentales.
ll. CONCEPTO DE APTITUD, INTELIGENCIA Y RENDIMIENTO
Las aptitudes, la inteligencia y el rendimiento no se diferencian fácilmente. Desde un

punto de vista tradicional, las pruebas de rendimiento reflejan los resultados de un
aprendizaje previo, mientras que las pruebas de aptitudes e inteligencia se conside-
ran un reflejo del potencial de éxito del individuo. Dentro de este enfoque tradicio-
nal, las aptitudes y la inteligencia se ven como características innatas y duraderas del
individuo, no fácilmente modificables por la experiencia o un adiestramiento espe-
cial. En algunos casos, los resultados de las pruebas de aptitudes e inteligencia se
San Diego State University (EE UU) e Iowa State University (EE UU). )
Agradecemos a la doctora Vera Gutiérrez-Clellan y a Elizabeth Freedman las innumerables horas
dedicadas a la traducción de este trabajo.
560 Carol Robinson-Zañartu y Daniel J. Reschly
consideran como indicadores de la capacidad innata del individuo. Estas interpreta-

ciones tradicionales de las pruebas de aptitudes, inteligencia y rendimiento han sido
rechazadas por los textos más importantes publicados en la última década (Brown,
1983; Cronbach, 1984; Anastasi, 1988). Actualmente, se consideran, por un lado,
pruebas de destrezas ya desarrolladas, o sea que reflejan los resultados de la expe-
riencia, y, por el otro, pruebas de exigencia, donde se asume que el individuo ha de
esforzarse al máximo para responder de la mejor manera.
Las diferencias más importantes entre las pruebas de aptitudes, inteligencia y
rendimiento se relacionan con el modo de uso y con las experiencias anteriores del
individuo (Brown, 1983; Anastasi, 1988). Con las pruebas de rendimiento se asume
que se evalúa aprendizaje ocurrido en una situación de enseñanza previa. En cambio,
las pruebas de aptitudes tienen referencia al futuro, o sea, se infiere el desenvol-
vimiento del individuo en situaciones futuras de aprendizaje o adiestramiento.
Las pruebas de inteligencia se consideran a medio camino entre las de rendimiento y
las de aptitudes en lo que respecta a las experiencias anteriores y al uso de pruebas.
Tienen una referencia presente dado que reflejan los resultados de experiencias gene-
rales y amplias de aprendizaje. Cuando las pruebas de inteligencia se usan en diag-
nóstico, se establece un marco de referencia para predecir el desarrollo futuro del in-
dividuo.
Como concepto teórico, la aptitud se usa a menudo de una manera general, espe-
cialmente en la teoría e investigación sobre las interacciones entre la aptitud y el tra-
tamiento (Cronbach y Snow, 1977; Snow, 1980, 1992). Aquí, la aptitud es virtual-
mente cualquier característica psicológica de la persona que pronostica diferencias
entre individuos en subsiguientes situaciones de aprendizaje o adiestramiento. En
esta amplia definición se incluyen las capacidades cognitivas y procesos, así como las
características emocionales y de personalidad (Snow, 1992). Aunque en este capítulo
se usará esta noción de aptitud, la mayoría del contenido se ocupará más del análisis
de las capacidades cognitivas y procesos que de las características emocionales o de
personalidad.
IL. CARACTERÍSTICAS COMUNES DE LOS MODELOS DE APTITUD

Y SU EVALUACIÓN
Los diversos modelos de aptitud que se utilizan con niños y adolescentes tienen una
serie de características comunes. Quizás el factor común más básico es el de mejorar
las conclusiones que se derivan del diagnóstico y que determinan la orientación edu-
cativa y terapéutica de niños y adolescentes con diferentes problemas de aprendi-
zaje.
11.1. Algunas consideraciones acerca de los procesos cognitivos

Los diferentes modelos de aptitud tienen como objetivo común evaluar procesos
cognitivos que no están directamente representados en las pruebas de inteligencia
Evaluación de las aptitudes 561
y rendimiento convencionales. Numerosos observadores han encontrado limita-

ciones en el tipo de proceso representado o en la oportunidad de observar distin-
tos procesos cognitivos en pruebas tradicionales (Naglieri, 1989; Woodcock y
Mather, 1989). Las ampliamente usadas pruebas de funcionamiento intelectual, ta-
les como las escalas de Wechsler (Wechsler, 1974, 1991), reflejan una limitada serie
de procesos cognitivos. Más aun, los ítems de las escalas Wechsler incluyen una
gran variedad de tareas complejas que requieren el uso simultáneo de dos o más
procesos cognitivos, dificultando la observación de los distintos procesos por sepa-
rado. Algunas pruebas desarrolladas recientemente, como la Batería de evaluación
Kaufman para niños (K-ABC) (Kaufman y Kaufman, 1983), provee una gama de pro-
cesos cognitivos más amplia y mejores oportunidades para observar procesos
específicos. Pero la prueba K-ABC e instrumentos similares permanecen primaria-
mente como medidas de inteligencia general con limitada información sobre los
procesos cognitivos, los cuales son derivados de un solo modelo de aptitudes. El sis-
tema DAS-Naglieri está programado para su estandarización y publicación en los
próximos años, pero también refleja un solo modelo cognitivo y una limitada gama
de procesos.
m2. Variación en los niveles de respuesta en el individuo contra

diferencias de nivel de respuesta entre individuos
Los modelos y las pruebas de aptitudes tienden a concentrarse más en los niveles de
respuesta del individuo mismo que en las diferencias de nivel de respuesta entre dis-
tintos individuos. Las diferencias de nivel de respuesta en un mismo individuo se re-
lacionan con variaciones en el patrón de procesos cognitivos. Por ejemplo, la media
de un individuo en varias pruebas a menudo se usa como punto de comparación
para evaluar las habilidades y deficiencias de sus procesos cognitivos. Si existen nive-
les de respuesta que varían sustancialmente de la media del individuo, los datos se
pueden aplicar al desarrollo de programas de adiestramiento cognitivo o de métodos
pedagógicos apropiados. El método interpretativo que compara los niveles de res-
puesta entre distintos individuos normalmente se usa con pruebas convencionales
de inteligencia y rendimiento. Aquí, el punto de referencia para interpretar los nive-
les de respuesta de un individuo es la discrepancia entre el nivel de respuesta indiv1-
dual y la media de la muestra de población (baremo), basada en un gran número de
individuos de la misma edad. Estas técnicas comparativas de interpretación son út1-
les para determinar el nivel de respuesta de un individuo comparado con otros,
mientras que las que analizan los diferentes patrones de respuesta en un mismo indi-
viduo sirven para indicar discrepancias en los patrones de respuesta en el individuo
mismo.
m3. Mejorías en el rendimiento escolar
La evaluación de aptitudes y los modelos de adiestramiento tienen como objetivo

mejorar el rendimiento escolar. De hecho, la evaluación de aptitudes y el adiestra-
miento usualmente se inician cuando el estudiante está teniendo problemas en la ad-

quisición de la lectura, escritura o matemáticas. Aunque los diferentes modelos utili-
zan procedimientos de evaluación y tratamiento diferentes (véase el apartado si-
guiente), la meta general es mejorar el rendimiento escolar.
11.4. Mejorías en el funcionamiento cognitivo general

Los modelos de aptitud tienen el objetivo común de mejorar el funcionamiento cog-
nitivo general, aunque existen ideas muy diferentes sobre la mejor manera de lograr
una mejoría en el funcionamiento general (véase el apartado siguiente). Los trata-
mientos basados en la evaluación de aptitudes mejoran el funcionamiento cognitivo
ya sea por medio de cambios directos en los procesos de pensamiento o por medio
de las contribuciones al funcionamiento cognitivo que ocurren cuando hay mejorías
en el aprendizaje escolar. La rápida y cambiante tecnología que ha llevado al naci-
miento de la “era de la información” en el mundo entero, ha dado lugar a procesos
complejos de pensamiento y requiere altos grados de escolaridad, metas imperativas
para niños y jóvenes en sociedades modernas. Con la evaluación y tratamiento de las
aptitudes se intenta cubrir estas necesidades por medio de procedimientos directos o
indirectos para mejorar el funcionamiento cognitivo general.
IV. DIFERENCIAS ENTRE LOS MODELOS DE APTITUD
Los modelos de aptitud varían significativamente de acuerdo con los procedimien-

tos de evaluación, técnicas de tratamiento y resultados deseados. Estas variaciones
incluyen elementos fundamentales tales como los supuestos acerca de la estabilidad
o la modificabilidad, el producto contra proceso de actividad cognitiva, la transfe-
rencia de resultados, los procedimientos de evaluación dinámica contra estandariza-
dos y la implementación.
Iv. Estabilidad contra cambio en las aptitudes

La diferencia más relevante alude a si las aptitudes son características relativamente
estables del individuo o si se pueden cambiar por medio del tratamiento. En el pri-
mer enfoque, las aptitudes se consideran características importantes del individuo
en las que basar recomendaciones relativamente perdurables de orientación progra-
mática o de metodología educativa. Dado que se cree que los procesos cognitivos o
neurológicos subyacentes a las aptitudes no cambian, la meta es mejorar el desem-
peño cognitivo y escolar por medio de un plan de estudios o metodología que se
adecue a las características de aptitud permanentes del individuo y que desarrolle
procesos intactos o metas realistas. Si las aptitudes se ven como inmutables, los trata-
mientos para cambiarlas (corregir las deficiencias) tienen poco valor (Reynolds,
Evaluación de las aptitudes
563
1981, 1986, 1992). En contraposición están quienes argumentan que las aptitudes se
pueden cambiar por medio del tratamiento; usan los resultados iniciales de la evalua-
ción como punto de partida para el diseño de experiencias que modificarán la mane-
ra básica de pensar del individuo. Aquí, la meta es nada menos que la modificación
del pensamiento y, de ahí, el desarrollo de aptitudes no observadas previamente.
Desde este punto de vista, la expansión del repertorio cognitivo es visto como posi-
ble y como esencial. Es difícil pensar en una diferencia entre los modelos más básica
que la idea de que los modelos son cambiables. Esta cuestión tan fundamental con-
duce a otras diferencias.
Iv2. Orientación hacia el producto contra el proceso

La unidad primaria de observacion varía de acuerdo con los modelos de aptitud. Los
modelos con orientación hacia el producto analizan si el individuo puede o no de-
sempeñar correctamente ciertas tareas que se consideran el reflejo de aptitudes sub-
yacentes. Por ejemplo, ¿puede el individuo resolver correctamente problemas que
exigen primariamente procesos visuales espaciales o supuestas funciones de la corte-
za cerebral derecha? Por el contrario, los modelos de aptitudes que están más orien-
tados al proceso intentan examinar procesos cognitivos o habilidades de pensamien-
to de base que el individuo usa para llegar a la respuesta correcta o equivocada en las
tareas. En la orientación al proceso, la respuesta por sí misma es a menudo menos
importante que las habilidades de pensamiento que llevan a la respuesta. La distin-
ción entre proceso y producto se relaciona con el supuesto de estabilidad-modifica-
bilidad y con cuestiones sobre la transferencia del adiestramiento, la clase de evalua-
ción y los resultados deseados.
1v3. Planteamiento de la transferencia

La cuestión de la transferencia plantea el problema de cómo se usa la información
sobre la aptitud y sus efectos. Para los modelos en que se asume la estabilidad de ap-
titudes con un foco sobre productos de actividad cognitiva, la cuestión de transte-
rencia alude a si las habilidades de aptitud se traducen en un aprendizaje escolar más
exitoso cuando se adecua la metodología de instrucción, o cuando se diseña un plan
de estudios de acuerdo con los niveles y patrones de aptitud. Se asume que las aptitu-
des que se evalúan son la base de la instrucción o controlan la respuesta a diferentes
planes de estudios. Si estas aptitudes no se transfieren desde la evaluación a tareas de
aprendizaje escolar, tanto la evaluación de aptitudes como las recomendaciones de
instrucción y planes de estudio carecen de validez de tratamiento.
La cuestión de la transferencia es diferente para los modelos que asumen que las
aptitudes son modificables. En estos modelos, los procesos cognitivos que se obser-
van en los intentos del individuo para resolver problemas específicos a la tarea se
convierten en metas de tratamiento de modificaciones cognitivas. La transferencia
proximal se demuestra subsecuente al tratamiento sl el individuo puede desempeñar
con más éxito nuevos ejemplos de las mismas o de otras tareas altamente similares.
Tal cambio positivo sugiere que los procesos cognitivos se han modificado al menos
para esa clase de tareas. Sin embargo, la modificación cognitiva es limitada a menos
que la transferencia distante pueda también demostrarse. La transferencia distante
hace referencia a la cuestión de si las modificaciones cognitivas del individuo lo lle-
van a un mejor desempeño en la resolución de problemas diferentes y con tareas O
propiedades de estímulo distintas. Por último, la mayoría de los modelos de modi-
ficabilidad cognitiva busca una mejor actuación en la generalización de soluciones
a problemas y en el aprendizaje, incluyendo la adquisición de destrezas escolares.
Por razones obvias, es bastante más fácil producir transferencia proximal que dis-
tante.
1v4. Evaluación estandarizada contra evaluación dinámica
Las reglas que se han establecido para una evaluación válida y confiable difieren sus-
tancialmente de acuerdo a los modelos de aptitud. En los modelos de modificabili-
dad, el examinador entabla una interacción compleja con el alumno donde el propó-
sito es establecer cómo el individuo piensa y qué estrategias usa para resolver los
problemas. Para lograr este propósito, se requiere necesariamente de un formato
que sea, en el mejor de los casos, parcialmente estructurado. La evaluación es “diná-
mica” en el sentido de que lo que el examinador hace está determinado por la clase
de procesos de pensamiento usados por el estudiante, interactuando con el estudian-
te para explorar las razones de las soluciones dadas, correctas o incorrectas, y modi-
ficando los procedimientos de administración para que los procesos cognitivos sub-
yacentes puedan ser observados completamente. Aunque los terapeutas en los
modelos de modificabilidad pueden usar una gama limitada de tareas en la solución
de problemas, la presentación de tareas y la interacción con el estudiante casi siem-
pre varía de acuerdo al caso.
Por lo general, los modelos que creen en la estabilidad de las aptitudes, usan pro-
cedimientos estandarizados convencionales con el propósito de lograr la mayor uni-
formidad en la presentación de tareas, evaluación de respuestas, resumen de puntua-
ciones e interpretación de éstas. La relación entre terapeuta y estudiante también se
asume que es estandarizada y similar a la relación en la evaluación de la inteligencia o
rendimiento.
Iv.5. Aplicabilidad para la toma de decisiones

La mayoría de los modelos de aptitud se usan primordialmente en casos donde el
niño o adolescente no adquiere las destrezas escolares al nivel esperado. La evalua-
ción de aptitudes genera decisiones acerca del estudiante pero la clase de decisión va-
ría significativamente según el modelo. La aplicación de los modelos que defienden
la estabilidad de las aptitudes por lo general lleva a decisiones sobre la clase de ins-
trucción que debería usarse, sobre todo en el área de lectura. Los terapeutas conjun-
tamente con los maestros intentan adecuar la metodología de instrucción a las habi-
lidades de aptitud, basándose en la creencia de que la mejor adaptación llevará a un
565
aprendizaje más eficiente. En otras circunstancias, las habilidades y deficiencias en

las aptitudes se pueden usar como parte de las decisiones del diagnóstico diferencial
y orientación (por ejemplo, para diagnosticar un bajo rendimiento derivado de un
problema de aprendizaje o dislexia) y después, basándose en este diagnóstico, para
colocar al estudiante en algún programa de reeducación o educación especial. :
Los modelos basados en la modificabilidad tienen menor posibilidad de ser usa-
dos en decisiones de diagnóstico u orientación, o en la prescripción de planes de en-
señanza específicos. Las decisiones en este caso tienden a incluir prescripciones de
adiestramiento en los procesos de pensamiento y estrategias para resolver problemas
y su aplicación en los métodos de enseñanza. Sin embargo, la evaluación continúa
como una parte integral del adiestramiento cognitivo. La enseñanza de nuevos pro-
cesos de pensamiento o estrategias ocurre simultáneamente a la evaluación misma de
la habilidad para resolver problemas, de manera que el proceso de enseñanza y eva-
luación es algo continuo e inseparable.
V. MODELOS DE EVALUACIÓN DE LAS APTITUDES
En este apartado se revisan tres modelos de evaluación de las aptitudes y de inter-

vención. Cada uno de los modelos se describe en función de las características co-
munes y las diferencias tratadas en la sección previa, y de acuerdo al criterio de vali-
dez de tratamiento.
v.1. Modelos psicolingúísticos y perceptivomotores

Las evaluaciones y tratamientos psicolingúísticos y perceptivomotores son los más
antiguos, mejor investigados y más controvertidos de los modelos de aptitudes usa-
dos actualmente con niños y adolescentes. Los dos modelos hacen suposiciones si-
milares acerca de los procesos cognitivos, los tratamientos y los resultados que se es-
peran en el rendimiento escolar. Debido a estas similitudes, ambos se presentarán en
esta sección.
El modelo psicolingúístico principal (Kirk, McCarthy y Kirk, 1968) se basa en
una teoría de comunicación (Osgood, 1957) y tiene tres componentes principales:
canales de comunicación (auditivo-vocal y visomotor), procesos de comunicación
(recepción, asociación y expresión) y niveles de organización (representacional y
automático-secuencial). Kirk y sus colegas desarrollaron el /llino:s test psycholin-
guistic aptitudes (ITPA) [Prueba Illinois de habilidades psicolingísticas] para evaluar
estos componentes de los procesos del lenguaje y se publicaron varios volúmenes
para guiar los tratamientos (Kirk y Kirk, 1971; Minskoff, Wiseman y Minskoff,
1972; Bush y Giles, 1977). Las subpruebas del I7PA y los procedimientos de terapia
asociados intentaban cubrir los siguientes procesos cognitivos: recepción auditiva,
recepción visual, asociación auditiva, asociación visual, expresión verbal, expresión
se-
manual, cierre gramatical, cierre visual, memoria secuencial auditiva, memoria
cuencial visual, cierre auditivo y combinación de sonidos. La fundamentación teóri-
ca era que el funcionamiento adecuado de estos procesos es un requisito para la ad-

quisición de la lectura, escritura y, aunque en menor grado, de las matemáticas.
El modelo de evaluación y terapia perceptivomotora se concentra en procesos
como la discriminación y percepción visual y auditiva, la coordinación e integración
visomotoras, la integración visual auditiva y las destrezas motoras. Algunos de los
modelos han establecido una relación directa entre el funcionamiento neurológico y
la conciencia perceptivomotora, derivando terapias como caminar sobre una barra
de equilibrio, estimulación vestibular a base de movimientos del cuerpo entero en el
espacio y amplios ejercicios motrices de alta precisión. Otras variantes del modelo
psicolingúístico ponen mayor énfasis en el uso de tareas con papel y lápiz para mejo-
rar las habilidades visomotoras o ejercicios auditivos para mejorar la discriminación
y reconocimiento de sonidos. Todas las variantes del modelo psicolingúístico presu-
ponen una relación entre estas destrezas y el rendimiento escolar.
Los modelos psicolingiísticos y perceptivomotores se usan para identificar dife-
rencias en el individuo entre procesos que se cree subyacen al funcionamiento cog-
nitivo y rendimiento escolar. Estos modelos se utilizan generalmente con niños pe-
queños (de 2 a 10 años) con retraso en su desarrollo cognitivo y dificultades en la
adquisición de las destrezas elementales, especialmente de la lectura. La terapia nor-
malmente se basa en una cuidadosa evaluación estandarizada de las habilidades y de-
ficiencias perceptivomotoras o psicolingúísticas, y en la enseñanza específica de acti-
vidades para superar las deficiencias.
Evidentemente, los modelos psicolingúísticos y perceptivomotores asumen que
los procesos cognitivos básicos pueden ser identificados con certeza y mejorarse por
medio de una instrucción sistemática. La transferencia hacia un mejor rendimiento
escolar se basa en una lógica que contiene los siguientes supuestos: los procesos psi-
colingúísticos y perceptivomotores subyacen y son un prerrequisito para el éxito en
el aprendizaje escolar, las deficiencias sin tratar pueden permanecer como una barre-
ra para el aprendizaje, y la mejoría en los procesos psicolingúísticos y perceptivomo-
tores puede conducir a un rendimiento escolar más exitoso. Muchos programas
educativos para niños pequeños con dificultades de aprendizaje mantienen estas hi-
pótesis y hacen hincapié en el adiestramiento psicolingúístico.
Además de los programas de reeducación para niños pequeños, los modelos psi-
colingúísticos y perceptivomotores tienen gran influencia en el diagnóstico de inca-
pacidades de aprendizaje. El concepto de incapacidad de aprendizaje que se ha usa-
do más ampliamente se define como un trastorno en alguno de los procesos
psicológicos básicos relacionados con la comprensión o uso del lenguaje, hablado o
escrito (Reschly y Gresham, 1989; Mercer, King-Sears y Mercer, 1990). Estos mode-
los continúan teniendo gran influencia sobre lo que se cree son las causas de los pro-
blemas de aprendizaje. Los modelos psicolingúísticos y perceptivomotores han do-
minado el pensamiento y la reeducación de las incapacidades de aprendizaje hasta
principios de la década de los ochenta. Las reseñas de los estudios de investigación
sobre la evaluación de los procesos psicolingúísticos y los resultados de las reeduca-
ciones respectivas comenzaron a aparecer a mediados de 1970 y condujeron a una
disminución en el uso de estos modelos. La Prueba Illinois de habilidades psicolin-
guísticas y otras pruebas perceptivomotoras han sido fuertemente criticadas por sus
criterios psicométricos, en especial por la baja confiabilidad de las subpruebas que se
Evaluación de las aptitudes y 567
usaban para diagnosticar deficiencias y prescribir reeducaciones (Salvia e Y sseldyke,

1988). Si laconfiabilidad de las subpruebas es baja, los niveles de habilidad y defi-
ciencia del individuo son obligadamente incorrectos y la terapia termina basándose
en información errónea. Aún más devastadoras, aunque polémicas, han sido las
diferentes reseñas sobre los resultados de las reeducaciones de los procesos psicolim-
gúísticos y perceptivomotores. Hammill y Larsen (1974, 1978) y Newcomer, Larsen
y Hammill (1975) concluyeron que las reeducaciones de los procesos psicolingúísti-
cos dan bajos resultados en el desarrollo de estos procesos y tienen una eficacia in-
cierta en el rendimiento escolar. Estas conclusiones han sido discutidas por Minskoff
(1975) y posteriormente por Lund, Foster y McCall-Pérez (1978) en una serie de ar-
dientes debates con Hammill y sus colegas. En exámenes posteriores de estos estu-
dios, usando la técnica de metaanálisis, las conclusiones llegaron a ser más positivas
en lo que atañe a algunos de estos procesos (expresión verbal, expresión manual, cie-
rre visual y asociación auditiva) (Kavale, 1981, 1990), pero todavía no se ha podido
confirmar que la mejoría de los procesos psicolingúísticos conduzca a un mayor
rendimiento escolar.
Los indicios sobre la validez de los tratamientos perceptivomotores son aún más
negativos. El metaanálisis de Kavale y Mattson (1983) con más de 180 estudios llegó
a la decepcionante conclusión de que las reeducaciones perceptivomotoras no tienen
efecto sobre los procesos perceptivomotores y no benefician el rendimiento escolar.
La evaluación y entrenamiento perceptivomotores parecen ser una pérdida de tiem-
po valioso para maestros y estudiantes (Kavale, 1990).
Aparentemente, los modelos psicolingúísticos y perceptivomotores son intuiti-
vamente muy atractivos. La mayoría de los procesos cognitivos identificados en es-
tos modelos tiene una relación lógica con el rendimiento escolar y el funcionamiento
cognitivo general. Se pueden adelantar varias posibles razones para el fracaso de las
reeducaciones de los procesos psicolingúísticos y perceptivomotores. En primer lu-
gar, puede ser que la teoría simplemente esté desacertada, o sea, que los procesos psi-
colingúísticos y perceptivomotores no sean esenciales para un funcionamiento cog-
nitivo general y el rendimiento escolar. En este caso, no sería la primera vez que una
idea intuitivamente atractiva es incorrecta. También es posible que los procesos psi-
colingilísticos y perceptivomotores esenciales no se estén evaluando correctamente
con las pruebas actuales. Algunos autores han notado deficiencias psicométricas en
las pruebas. Por otro lado, también las reeducaciones pueden no ser lo suficiente-
mente potentes como para lograr mejorías en los procesos psicolingúísticos y per-
ceptivomotores y en el rendimiento escolar. Cualquiera que sea la explicación co-
rrecta, continuar usando estos modelos en evaluaciones y terapias clínicas o
educativas es discutible.
v2. Modelos de interacción entre las aptitudes y el tratamiento

En la actualidad, hay tres modelos importantes de interacción entre las aptitudes y el
tratamiento que usan muchos psicólogos clínicos y escolares. Los tres modelos indi-
can relaciones entre los procesos cognitivos y los métodos que se usan para desarro-
llar las destrezas cognitivas y escolares. La técnica de desarrollo de las modalidades
generalmente se ocupa de tres clases de procesos o canales de información: auditivo,

visual o cinestésico. Los niños con dificultades en el aprendizaje son evaluados para
determinar sus niveles en estas áreas y para prescribir el método de enseñanza basa-
do en las habilidades del niño. Estos mismos procedimientos se siguen en el modelo
de estilos cognitivos y el modelo neuropsicológico. En este último modelo también
se incluyen inferencias acerca del funcionamiento cerebral de base. Por lo que res-
pecta a los métodos de enseñanza, las prescripciones son muy similares en los tres
modelos (Reschly y Gresham, 1989).
Los modelos de interacción entre aptitudes y tratamiento ven las aptitudes como
relativamente inmutables, hasta el punto de alertar en contra de “enseñar tejido
muerto” (Hartlage y Reynolds, 1981). El hecho de enfocar la rehabilitacion de áreas
deficientes, como en el caso de los modelos psicolingúísticos y perceptivomotores,
es visto como algo ineficaz y probablemente infructuoso. Las aptitudes se evalúan
normalmente por medio de pruebas estandarizadas tradicionales de funcionamiento
cognitivo, tales como las pruebas de funcionamiento intelectual general, administra-
das individualmente. Hay dos pruebas bien estandarizadas de inteligencia general
que se han desarrollado con el objetivo principal de diagnosticar los estilos cognit1-
vos (Kaufman y Kaufman, 1983; Das y Naglieri, en prensa). Estos modelos de inte-
racción se usan primordialmente para la planificación de la enseñanza, creyendo que
las habilidades se generalizarán al desarrollo del estudiante en el medio escolar. Los
conceptos neuropsicológicos también aparecen en las definiciones de incapacidad de
aprendizaje de 1980. Frases como «[...] posiblemente debido a una deficiencia del
sistema nervioso central» y «[...] se supone tiene un origen neurológico» han apare-
cido recientemente en dos definiciones distintas formuladas por grupos en favor de
los individuos con incapacidad de aprendizaje (Reschly y Gresham, 1989).
La técnica de desarrollo de las modalidades, la determinación del estilo cognitivo
y las evaluaciones y terapias neuropsicológicas dependen enormemente de la pre-
sencia de interacciones entre las aptitudes y el tratamiento. El concepto de interac-
ción suscita gran interés. Reynolds (1992) describió este proceso diciendo que «la
enseñanza se basa en los procesos del niño más desarrollados, evitando los pobre-
mente desarrollados o deficitarios» (p. 10). De acuerdo con una encuesta hecha por
Arter y Jenkins (1977), el 99% de los maestros cree que existen diferencias en cómo
los niños elaboran la información y que la instrucción sería más efectiva si los mate-
riales y métodos educativos se usasen de acuerdo a la modalidad o a las habilidades
neuropsicológicas del niño.
El caso de las interacciones entre aptitudes y tratamiento fue analizado por
Cronbach (1957) en un artículo ampliamente citado y muy influyente publicado en
American Psychologist. Crombach sostuvo que las aptitudes pueden ser evaluadas
con precisión y que «en caso de cualquier problema, existe un grupo apropiado de
tratamientos y la orientación más adecuada de personas a tratamientos» (p. 680). El
proceso de orientación significa la elección de tratamientos que desarrollen las habi-
lidades de aptitud del individuo por medio de la estimulación diferencial o métodos
de reeducación.
Aunque la lista potencial de aptitudes que pueden ser utilizadas en el adiestra-
miento es casi ilimitada, las diferentes metodologías reeducativas son mucho más li-
mitadas. El procedimiento típico incluye aptitudes tales como los procesos auditivo,
visual y cinestésico, los estilos de conocimiento simultáneo y sucesivo (Das, Kirby y

Jarman, 1979) o secuencial y simultáneo (Kaufman, Goldsmith y Kaufman, 1984), y
las teorías neuropsicológicas del funcionamiento de los hemisferios derecho e iz-
quierdo. Las diferentes metodologías educativas prescritas para niños con estas ha-
bilidades son bastante similares (Reschly y Gresham, 1989). Los métodos fonéticos
para la enseñanza de la lectura y la estimulación auditiva normalmente se recomien-
dan para niños que supuestamente tienen habilidad en la decodificación auditiva, es-
tilos de conocimiento secuencial o sucesivo o dominancia hemisférica izquierda. De
la misma manera, los métodos de enseñanza de la lectura global con claves visuales se
recomiendan para niños con habilidad en la decodificación visual, con estilo simul-
táneo de conocimiento o dominancia del hemisferio derecho.
Para que estos modelos tengan validez de tratamiento debe existir una interac-
ción entre la supuesta habilidad de aptitud y la metodología de enseñanza. Por ejem-
plo, niños con habilidades del hemisferio derecho deben poder leer mejor cuando
los materiales y métodos se seleccionan y presentan de acuerdo a sus habilidades y
leerán peor si los métodos de enseñanza no están de acuerdo con sus habilidades
(véase cuadro 23.1).
CUADRO 23.1. Interacción entre aptitud y tratamiento
APTITUD
Hemisferio izquierdo á Hemisferio derecho

Auditivo-vocal SS Visual-motor
M Sucesivo y Simultáneo
[E *
ya
O.
T
F *” Adecua el método Él No adecua el método
AOS a las destrezas ú a las destrezas
cues ;
é * Presupone Presupone
D t * un beneficio e un efecto
E e máximo á mínimo
eo ;
Emiient De hecho-Sin efectos ; De hecho-Sin efectos
N *k
S Z Adecua el método
FE G* Noadecua el método
Ñ Patas taestezas 3 a las destrezas
A dd »
Ab Presupone Presupone
eZ añ un efecto á un beneficio
A (0 mínimo ' máximo
+ De hecho-Sin efectos A De hecho-Sin efectos
,
máximos.
Supuesto: adecuar el tratamiento (enseñanza) a la aptitud produce beneficios
o destrezas y deficiencias
Base empírica: es débil con respecto a los procesos de base
neuropsicológicas.
Desafortunadamente, las investigaciones hasta la fecha no confirman la existen-

cia de interacciones significativas entre la aptitud y el tratamiento. Algunos de los
problemas con este tipo de investigaciones fueron resumidos por Cronbach (1975);
este autor expresó sus dudas acerca del uso clínico o educativo de la técnica de de-
sarrollo de las modalidades. Basándose en 18 largos años de investigaciones infruc-
tuosas, Cronbach concluyó que «una vez que prestamos atención a las interaccio-
nes, entramos en un pasillo de espejos que se extiende al infinito» (p. 119). Los
mayores problemas con las investigaciones de la interacción aptitud y tratamiento
han sido la falta de interacciones o la presencia de interacciones muy leves, o sea, que
las técnicas de desarrollo de las modalidades tienen a lo sumo efectos pequeños y sin
consecuencia, los resultados de distintos estudios han sido enormemente inconsis-
tentes y se han encontrado interacciones de orden más alto, o sea, interacciones
complejas de tres o cuatro factores que serían imposible de aplicar en la práctica a
problemas clínicos o educacionales.
Las investigaciones actuales sobre las técnicas de desarrollo de modalidades y de
evaluación y terapia neuropsicológica se encuadran en el patrón descrito por Cron-
bach (1975). La adecuación de las metodologías educativas a supuestas destrezas no
ha llegado a demostrar mejorías diferenciales en el rendimiento escolar, aunque las
habilidades de aptitud se conceptualicen como preferencias de modalidad (Kavale y
Forness, 1987, 1990; Kavale, 1990), estilos de conocimiento (Ayres y Cooley, 1986;
Ayres, Cooley y Severson, 1988) o funciones neuropsicológicas (Teeter, 1987, 1989;
Reschly y Gresham, 1989). A pesar de los indicios negativos, psicólogos y educado-
res continúan usando ampliamente las técnicas de evaluación y rehabilitación basa-
das en la adecuación a las modalidades, los estilos de conocimiento y el funciona-
miento neuropsicológico.
El pasillo de espejos que Cronbach describía en 1975 continúa obstaculizando el
desarrollo coherente de lo que fue una buena idea original, o sea seleccionar e imple-
mentar métodos de enseñanza que se basen en la capacidad de conocimiento del in-
dividuo. Las mismas razones de los indicios negativos en lo que respecta a la validez
de tratamiento en los modelos psicolingúísticos y perceptivomotores son pertinen-
tes a los modelos de la interacción aptitud-tratamiento. El problema o problemas
pueden residir en la teoría básica, las pruebas de aptitud o el tipo de rehabilitaciones
actualmente disponibles. Reschly y Gresham (1989) han notado deficiencias en to-
das las áreas propuestas como explicación del fracaso de estos modelos; a menudo,
éstos se basan en teorías bastante primitivas del funcionamiento neurológico o de la
decodificación de información. La determinación de la capacidad normalmente
comporta un análisis intensivo de los perfiles de las puntuaciones en diferentes sub-
pruebas o puntuaciones de diferentes baterías estandarizadas. Las diferencias de per-
1] que fundamentan la determinación de la habilidad o deficiencia normalmente tie-
nen baja confiabilidad. Quizás lo más importante es que las rehabilitaciones son
limitadas y no muy potentes. Cualquiera que sea la explicación correcta, o si cual-
quiera de las deficiencias se pueden corregir, el uso actual de alguno de los modelos
de interacción aptitud-tratamiento en el diagnóstico y tratamiento de problemas de
aprendizaje es muy discutible.
571
VI. EVALUACIÓN DINÁMICA/MODELOS DE CAMBIO
La evaluación dinámica y los modelos de rehabilitación del aprendizaje mediado

afirman que la capacidad de aprendizaje, o aptitudes, son modificables en vez de es-
tables. Dentro de este marco, lo que anteriormente se concebía como genéticamente
determinado ahora se considera abierto al cambio a través de la rehabilitación. Por
medio de mediaciones específicas se cree que las modificaciones reales de las estruc-
turas cognitivas, y la motivación como factor, pueden influir en la manera en que el
individuo es capaz de enfrentarse a situaciones nuevas, o sea, la adquisición de cono-
cimiento. La función de la evaluación en este modelo es identificar aquellos paráme-
tros cognitivos y motivacionales del individuo y la medida del cambio cuando se
provee rehabilitación del aprendizaje mediado. En contraposición, con formas tra-
dicionales de evaluación (que normalmente redundan en clasificaciones, rótulos y
conjeturas) basadas en el supuesto de diferencias estables en el individuo, la evalua-
ción dinámica identifica los métodos de rehabilitación que más favorecen el funcio-
namiento del individuo a través del medio escolar, el hogar y la comunidad.
La idea de evaluar la capacidad de aprendizaje mientras se observa el proceso de
aprendizaje mismo surgió alrededor de la primera mitad de este siglo (Dearborn,
1921; De Weerdt, 1927; Penrose, 1934). El concepto de que la observación delos re-
sultados de la estimulación del aprendizaje podría producir información importan-
te para el desarrollo de las aptitudes tiene sus primeras raíces en los trabajos de Vi-
gotski y Rey (1934). La teoría histórico-cultural del desarrollo mental humano de
Vigotski (1962), la epistemología genética de Piaget (1952), las investigaciones neu-
ropsicológicas del cerebro y la conducta de Luria (19664, 1966b), el modelo psico-
social y neuropsicológico de autorregulación de Schwartz (1977, 1983) y la teoría
del aprendizaje mediado y de la modificabilidad cognitiva estructural de Feuerstein
(Feuerstein, 1970; Feuerstein y cols., 1985; Feuerstein y cols., 1987; Jensen y Feuers-
tein, 1987) han sido parte también de esta evolución (Jensen, Robinson-Zanartu y
Jensen, 1992).
vL1. Gama de modelos dinámicos
Existen varios modelos de “evaluación dinámica”, cada uno de los cuales se ocupa de
la evaluación de las diferencias en el individuo, diferenciándose desde la medida en
que se prueban los límites (Carlson y Wiedl, 1976, 1978) hasta la teoría de modifica-
bilidad estructural cognitiva de Feuerstein (Feuerstein, 1970; Feuerstern y cols.,
1987). Tanto las suposiciones teóricas como el tratamiento de la evaluación, eltipo
de examen, los objetivos de cambio, el número y tipos de parámetros identificados
para terapia y los supuestos acerca de los resultados de la transferencia varían enor-
memente de acuerdo con los distintos modelos y pueden conceptualizarse como un
continuo (véase el cuadro 23.2). sE
Budoff (1967) y Budoff y Friedman (1964) crearon una evaluación del potencial
de aprendizaje que incluye la instrucción o entrenamiento entre los ensayos de la
prueba. Campione y Brown (1987), fuertemente influenciados por Vigotski, formu-
CUADRO 23.2. El continuo de supuestos y parámetros dinámica

de los modelos de evaluación E
AA A A A A
Fundamento teórico adaptado Fundamento teórico exhaustivo
Mediación de una sola habilidad Mediación de funciones cognitivas

múltiples, personalidad y factores de
motivación
Administración estandarizada Administración no estandarizada; se guía

por el objeto de modificar la estructura
cognitiva
Supuesto de transferencia distante Mediación para el logro de la

transferencia distante
Mediación psicométrica Mediación del proceso de cambio
Búsqueda de cambios relacionados a la Búsqueda de cambios estructurales

tarea
Presupone límites máximos No se presuponen límites máximos
Carlson y Wiedl Campione y Brown Budoff Feuerstein Jensen
laron una evaluación dinámica en la que se identifica la “zona de desarrollo prox1-

mal” a través de una serie de análisis de las “guías” para resolver problemas, destina-
das a ser progresivamente más específicas y concretas, y de las que se deriva una esti-
mación de la ayuda mínima necesitada. Estos autores comentaron que, aunque otros
procedimientos más clínicos pueden dar una información más fecunda, es preferible
utilizar un procedimiento que brinde información cuantitativa sólida. La modifica-
bilidad estructural cognitiva de Feuerstein (1970) y Feuerstein y cols. (1985) prefigu-
ra un modelo mucho más clínico. Usando una serie de materiales no escolares, des-
contextualizados o fuera de contexto, destinados a la capacidad cognitiva en varias
modalidades, el examinador utiliza conductas específicas de interacción (mediación)
y cerca de treinta funciones cognitivas específicas para suscitar e intentar reformar
los hábitos cognitivos. Las funciones identificadas como básicas para el aumento del
funcionamiento cognitivo del individuo y las específicas mediaciones que fueron
efectivas en el proceso de modificación se convierten en metas de rehabilitación, con
el supuesto de que estas nuevas destrezas se podrán transferir a nuevas tareas. El tra-
bajo de Feuerstein ha penetrado en las comunidades educativas de Norteamérica y
Sudamérica (por ejemplo, Venezuela, Chile), África (Sudáfrica) y Europa con el
adiestramiento y uso de la evaluación del potencial de aprendizaje y su programa de
rehabilitación de desarrollo instrumental, y se han usado no solamente con grupos
de bajo rendimiento para los que fueron destinados originariamente, sino también
con grupos bilingúes y de superdotados. El trabajo de Feuerstein ha sido quizás el
más controvertido de los modelos de cambio debido a su divergencia radical con los
conceptos tradicionales de la estabilidad de las diferencias en el individuo, los su-
puestos de límite del potencial individual y la confianza en las pruebas psicométri-
cas. En la década pasada, un número creciente de científicos ha investigado o comen-
573
tado acerca del potencial, los retos, y las posibles complicaciones y dificultades de
estos métodos (Lidz, 1987; Jensen y cols., 1988; Reschly y Wilson, 1990; Haywood
y Tzuriel, 1992). f ; Ao
Las primeras investigaciones de los modelos de evaluación dinámica (también
llamados pruebas del potencial de aprendizaje, capacidad para aprender tareas mue-
vas o capacidad para aprovechar la enseñanza) se abocaron a la posibilidad de identi-
ficar estudiantes malcategorizados, es decir, estudiantes categorizados como de bajo
nivel en las pruebas estandarizadas tradicionales de inteligencia debido a factores so-
cioeconómicos y culturales (Budoff y Friedman, 1964; Budoff, 1967). A pesar de
que el objeto preponderante de las evaluaciones dinámicas es la diferencia en el indi-
viduo, también estos métodos se han usado —de modo limitado— para comparar
diferencias entre individuos. En estudios hechos en Israel (Feuerstein y cols., 1980)
se usó el método de Feuerstein con un grupo de potencial medio, pero supuesta-
mente debajo de la media de acuerdo a los resultados de pruebas de inteligencia es-
tandarizada; este grupo se combinó con otro grupo de “coeficiente intelectual me-
dio” (de acuerdo a las pruebas estandarizadas) y de potencial similar con el
propósito de brindarles adiestramiento. Después de un año de enseñanza, los dos
grupos mejoraron y no se observaron diferencias con las pruebas estandarizadas de
inteligencia.
v12. Objetivos para el aumento del funcionamiento cognitivo

Las rehabilitaciones destinadas a acompañar las evaluaciones dinámicas dan por su-
puesto la modificación del tipo de funcionamiento cognitivo o proceso de aprendi-
zaje del individuo a través del tiempo. Las rehabilitaciones del aprendizaje mediado
normalmente se alejan del uso de tareas del contexto escolar, tales como la lectura o
aritmética, con el propósito de estimular las destrezas cognitivas subyacentes sin la
interferencia de factores de motivación. En su lugar, la rehabilitación se fía de herra-
mientas fuera de contexto o “descontextualizadas”, tareas de resolución de proble-
mas intencionalmente libres del contexto escolar, con el objeto de exigir destrezas
cognitivas progresivamente complejas o integradas. En el capítulo de Prieto de este
mismo manual se discuten con detalle tales tareas de resolución de problemas. El uso
de herramientas “recontextualizadas”, tareas de resolución de problemas basados en
el contexto escolar, que exigen un uso eficaz de las destrezas cognitivas (por ejemplo,
en contraposición con la memoria mecánica, la discriminación o el cierre perceptivo)
se han usado por lo menos en un modelo de aprendizaje mediado (la teoría del
aumento de la modificabilidad de Jensen). Uno de los mayores supuestos en la me-
diación o adiestramiento de las destrezas cognitivas es que éstas se transfieren a sl-
tuaciones nuevas, aumentando la facilidad y flexibilidad para abordar nuevos datos
y solución de problemas. Por lo tanto, las estrategias cognitivas entrenadas se vuel-
ven a evaluar en contextos similares pero nuevos (transferencia proximal). En la ac-
tualidad, es en este campo en donde se encuentran indicios favorables de apoyo al
concepto de aprendizaje mediado.
Las investigaciones generalmente demuestran transferencia proximal a las prue-
bas estandarizadas de “inteligencia” y a menudo utilizan pruebas cognitivas no ver-
bales. Por ejemplo, Carlson y Wiedl (1976, 1978, 1979, 1980) descubrieron que los
niños alemanes de edad escolar, usando verbalizaciones y estrategias de retroalimen-
tacion o feedback, obtuvieron beneficio de la terapia según una prueba de inteligen-
cia no verbal. En Estados Unidos se demostró que las diferencias de nivel entre los
diversos grupos étnicos se anulan estadísticamente usando estos procedimientos
(Dillon y Carlson, 1978). Budoff y Friedman (1964) y Budoff (1967) agregaron con-
diciones de entrenamiento a los resultados de la primera evaluación del potencial de
aprendizaje de los sujetos con el objeto de evaluar el efecto de éstas sobre las diferen-
cias significativas socioeconómicas; descubrieron que después de recibir entrena-
miento, el funcionamiento de los niños de “bajo coeficiente intelectual” se equipara-
ba al otro grupo. De la misma manera, Thickpenny y Howie (1990) evaluaron el
efecto de la enseñanza de destrezas de pensamiento con adolescentes sordos y halla-
ron incrementos significativos en dos subpruebas de la escala de Weschler, así como
en el Matching familiar figures test (MFFT) [Prueba de apareamiento de figuras faml-
liares]. Campione y Brown (1987), en un resumen de tres grupos de estudios, halla-
ron que la transferencia proximal era sustancial para los estudiantes de “bajo nivel”,
pero que las pruebas tradicionales son capaces de diferenciar con más precisión
“srupos de distinto nivel” en lo que respecta a la transferencia distante. En uno de
los análisis más rigurosos sobre este tema, Jensen y Singer (1987) evaluaron el efecto
del programa de Feuerstein, durante sus tres años de duración, con 234 adolescentes
en el grupo experimental y 164 en el grupo de control, todos de bajo nivel, y encon-
traron indicios claros de la adquisición de nuevas funciones cognitivas y transferen-
cia proximal. Además, Jensen (1990) halló que el análisis factorial de estas funciones
se distribuía entre cuatro categorías. Las tres primeras, que llamó entrada, transfor-
mación y comunicación, tenían una relación estrecha con los agrupamientos clínicos
de entrada, elaboración y salida de Feuerstein, contribuyendo así a la validez de la
teoría; la cuarta categoría, llamada control cognitivo, se asociaba con el papel de la
impulsividad y control sobre el “tempo” del acto mental. Sin embargo, no se halló
transferencia distante a una mejora escolar significativa (Jensen y Singer, 1987). Poco
después, Jensen (1990, 1992) postuló que las reseñas de investigación nos llevan a la
conclusión de que los programas de desarrollo instrumental cognitivo por sí mismos
no han sido efectivos en lograr resultados escolares.
vi3. Objetivos para el aumento del rendimiento escolar

Aunque los investigadores que trabajan dentro del marco de la evaluación dinámica
y aprendizaje mediado han hallado cambios significativos en los niveles manifiestos
de funcionamiento cognitivo en niños de edad escolar y adultos, los indicios indican
que la transferencia distante del aumento en el logro de resolución de problemas al
rendimiento escolar es mínima, especialmente cuando no es intencionada. Jensen
(1992) definió este problema como un intento por “desglosar” el conocimiento, o en
realidad infundir nuevos procesos cognitivos en las áreas de contenido o conoci-
miento. Á principios de la década de los años ochenta, otros investigadores que ha-
bían trabajado con modelos dinámicos de modificabilidad cognitiva (Harth, 1982;
Perkins, 1987; Haywood y cols., 1988; Greenberg, 1990; Salema y Valente, 1990)
575
propusieron que se desarrollasen modelos de entrenamiento que de hecho infundan

y trabajen directamente en la transferencia al currículo escolar.
Quizás el reto más grande al movimiento de desarrollo cognitivo va a ser demos-
trar que las destrezas de pensamiento pueden usarse efectivamente para diversos tipos
de conocimiento. Es en esta área, que la teoría del aumento de la modificabilidad de
Jensen propone que las estrategias cognitivas recién adquiridas deben ser mediadas
directamente de acuerdo al contenido, “entretejiendo” así el contenido y las estructu-
ras de conocimiento más desarrolladas para constituir lo que él llama estructuras de
conocimiento. Según el grado en que se usen estrategias cognitivas altamente eficaces
y flexibles para la resolución de problemas dentro de un área de contenido, se deter-
minará el efecto de la transferencia distante de las destrezas cognitivas entrenadas o
mediadas. El concepto de contenido e infusion del proceso tiene un apoyo creciente
entre educadores interesados en planes de estudio efectivos.
vI4. El tratamiento paralelo del contenido y el proceso para

la transferencia distante al rendimiento escolar
En Estados Unidos ha habido mucha preocupación acerca de los bajos niveles de
rendimiento en niños de edad escolar y de grupos étnicos, lingúísticos y culturales
diferentes a la “cultura” de la escuela (y del maestro). En una reseña sobre los com-
ponentes claves del ambiente educativo más apropiado para esta población, Moll
(1991) dedujo que la contextualización social (y cultural), la mediación de la maestra,
las suposiciones acerca de la capacidad del estudiante y su competencia, y el trata-
miento paralelo del proceso y el contenido o destrezas metacognitivas son la clave
ara un desarrollo escolar exitoso. El tratamiento paralelo del proceso y contenido
se halla de forma creciente en los textos sobre métodos efectivos de enseñanza para
niños de diversos ambientes (Brown, Collins y Duguid, 1989; Collins, Brown y
Newman, 1989; Allington, 1991; Deloria, 1991; Emerson, 1991). En una reseña re-
ciente sobre investigaciones del aprendizaje mediado, Greenberg (1992, p. 24) con-
cluye que «el uso del enfoque de mediación en las variables del proceso cognitivo y
el contenido del material de las asignaturas parece ser útil y quizás primordial para la
mejora del funcionamiento cognitivo y escolar».
La incorporación de la enseñanza de destrezas de pensamiento en el currículo
está creciendo en popularidad como concepto educativo y tiene potencial para con-
tribuir a resolver la cuestión de la transferencia proximal hacia la distante. La inclu-
sión de destrezas de pensamiento en el contenido refleja el tipo de rehabilitación que
los preconizadores del aprendizaje mediado recomendarían. Su éxito es importante
por dos razones; en primer lugar, se establecería una pauta para la aceptación de esti-
los de enseñanza imbuidos de contenido y proceso y, en segundo lugar, se provee-
rían datos importantes acerca de adquisiciones de conocimiento efectivas. Mientras
estas cuestiones suscitan el interés de los investigadores del aprendizaje mediado,
hasta la fecha no se han abordado con el propósito de elevar los niveles funcionales
manifiestos de los estudiantes de manera simultánea con la inclusión del contenido.
Sin embargo, se trata de una evolución en el campo educativo que debe ser vista con
un gran potencial de convergencia con el movimiento de desarrollo cognitivo.
Por ejemplo, Salema y Valente (1990) examinaron elefecto de la enseñanza siste-

mática de las destrezas de pensamiento y el metaconocimiento en el desarrollo de la
composición en portugués en niños de bajo rendimiento, y hallaron una diferencia
significativa con el grupo de control en el aprendizaje de la composición escrita; sin
embargo, no hallaron transferencia distante significativa hacia Otras asignaturas.
Kreigler y Kaplan (1990) usaron una versión abreviada del Desarrollo Instrumental
de Feuerstein para tratar de demostrar una conexión con el desarrollo en la lectura,
en la suposición de que la falta de atención, la hiperactividad y la impulsividad son
factores que interferían con la lectura y que podían ser mediados. Crearon corres-
pondencias cognitivas con una tarea de lectura específica y hallaron diferencias sig-
nificativas en el grupo experimental y de control en la estimación del maestro en el
área de atención, la precisión en la lectura y en los resultados de la Prueba de Labe-
rintos de Porteus.
El creciente banco de datos indica que el desarrollo simultáneo de las destrezas
cognitivas junto con el aumento de las bases del material de asignaturas o del conoci-
miento puede dar resultados importantes no sólo en la “aptitud” sino en su práctica.
En Europa, la European Association for Research on Learning and Instruction
(EARLI) provee un foro y promueve estudios empíricos y teóricos sobre el aprendi-
zaje, el desarrollo y la educación. Algunos de los trabajos actuales son el análisis de la
autorregulación en la enseñanza del pensamiento de Simons en Holanda, el trabajo
sobre la resolución de problemas en las ciencias de Caillot y Dumas-Carre, las inves-
tigaciones de Mandl sobre el procesamiento de textos (Mandl y Schnotz, 1987) y el
estudio del pensamiento inductivo y la transferencia de Klauer (1989) en Alemania.
vL5. La evaluación dinámica y la mediación de estructuras cognitivas

y del conocimiento
El aprendizaje mediado y la evaluación dinámica descritas en la teoría del aumento de
la modificabilidad y el modelo de cambio propuesto por Jensen (1992), Jensen y cols.
(1992) son útiles para explorar la integración de destrezas de pensamiento recontex-
tualizadas dentro de las áreas escolares, dado que proveen una descripción de la rela-
ción y de la justificación de la conexión entre el contenido y el proceso en el aprendi-
zaje, un proceso en el que la evaluación está conectada con la rehabilitación, y la
incorporación de la cultura del niño como contexto (Robinson-Zañartu y Cook-
Morales, 1992). Más aún, la teoría del aumento de la modificabilidad postula que el
desglosamiento de las estructuras de conocimiento es un proceso altamente específi-
co; por lo tanto, no se puede asumir transferencia automática, sino que ésta debe faci-
litarse. Las estructuras de conocimiento propuestas en esta teoría se forman a través
de un proceso de desglosamiento. La base de conocimiento concreto de cualquier
área de contenido se entrelaza con las estructuras cognitivas (que abarcan las funcio-
nes y los asociadores), los factores de motivación, y las características de personalidad
para formar un conjunto de procesos que permiten la recogida eficaz de información,
su transformación y su comunicación dentro de esa área de contenido. Las funciones
cognitivas, tales como las conductas de comparación, planeamiento y las estrategias
para deducir inferencias, se considera que convierten información de una manera
analítica, produciendo un resultado basado en lo recibido o input determinado. En

teoría, los asociadores, tales como la experiencia de desequilibrio, la interiorización, la
formación de representaciones mentales y el pensamiento hipotético imaginativo
convierten información a través de un proceso de asociación, el cual puede producir
una variedad de resultados potenciales. Juntos, las funciones y los asociadores, for-
man las estructuras cognitivas, otorgando capacidad intelectual al funcionamiento
humano. Los factores de motivación, tales como la necesidad de dominio, el deseo
por la novedad y la presencia de aspiraciones llevan al individuo a entablar actos men-
tales y a fundarlos con apoyo y energía. En la teoría del aumento de la modificabili-
dad, las características de personalidad tales como la autoestima, la tolerancia a la frus-
tración y el optimismo se ven como determinantes de los aspectos del estilo y las
maneras relacionados con el desarrollo cognitivo y de estructuras de conocimiento
(Jensen, 1992). Se ha observado que las variables en este modelo son sensibles al cam-
bio y, por lo tanto, capaces de contribuir a la mejora del funcionamiento. Aproxima-
damente la mitad han sido investigadas cuidadosamente por Feuerstein y sus colegas
(Feuerstein y cols., 1985; Jensen y Feuerstein, 1987).
vLó6. Modelos de estabilidad contra modelos de cambio
Las suposiciones básicas subyacentes y las características de las evaluaciones dinámi-

cas en contraposición con las evaluaciones estáticas se encuadran en los paradigmas
de estabilidad frente a los de cambio. El cuadro 23.3 presenta un compendio de esas
diferencias.
CUADRO 23.3. Contraste de paradigmas

MODELOS ESTABLES MODELOS DE CAMBIO
Sistema cerrado Sistema abierto
Características humanas estables Características humanas modificables
Presupone que la inteligencia es Presupone que la inteligencia depende

principalmente hereditaria de la interacción entre la persona y el
medio ambiente
Relativamente resistente a influencias La estimulación de estructuras cognitivas

educativas y culturales puede producir un mejor funcionamiento
Presupone límites máximos No se presuponen límites máximos
Exigencia medioambiental reducida Exigencia destinada a suscitar estructuras

cognitivas y de conocimiento en evolución
Énfasis en la evaluación, categorización, Énfasis en la interacción dinámica del

corroboración contexto y el conocimiento; la reeduca-
pronóstico,
ción es inherente a la evaluación
Modelo pasivo de recepción Modelo activo de modificación

Los modelos de estabilidad (por ejemplo, la medida del cociente intelectual) dan
por supuesto que las diferencias individuales en el organismo humano son estables,
pueden ser evaluadas, dan una indicación válida del funcionamiento actual y un pro-
nóstico de futuros niveles o aptitudes de desarrollo. De esta manera, presuponiendo
que el funcionamiento humano tiene un límite y una naturaleza invariables, se po-
nen límites a las expectativas dirigidas al individuo que se evalúa, produciendo hábi-
tos como el de dar rótulos, la categorización y la orientación diferencial en aulas de
clases, en las que a menudo se modifica el medio ambiente para acomodar esas ex-
pectativas (por ejemplo, la simplificación del currículo). Los modelos estables están
caracterizados por presentar una orientación hacia los productos (por ejemplo, los
pronosticadores numéricos) y una aceptación pasiva de los niveles bajos de funcio-
namiento. Su influencia ha sido particularmente fuerte en el área de la psicometría,
donde la búsqueda de diferencias individuales estables ha producido métodos de
identificación y categorización de individuos basados en la ejecución de pruebas ba-
remadas y estandarizadas (Jensen, 1992). La eficacia de este paradigma está ahora en
discusión en los campos de la psicología donde los indicios empíricos apuntan al
contexto como variable crítica para entender el funcionamiento humano (Bowlby,
1960; Harlow y Harlow, 1966; Kaufman y Rosenblum, 1967; Sackett, 1967).
Los modelos de cambio aplicados a la modificabilidad y aprendizaje humanos
operan basados en el supuesto de que el contexto es una variable crítica que debe ser
aplicada a la evaluación del funcionamiento humano. Aunque estos modelos varían
en su atención hacia factores como la edad, etiología y severidad del trastorno, tie-
nen en común la idea de que el organismo humano es un sistema abierto y, por lo
tanto, que la evaluación debe abordar la posibilidad de su enriquecimiento (Jensen,
1992). Proponen que la naturaleza humana es cultural y que el aprendizaje implica la
elaboración de símbolos contextualmente significantes (por ejemplo, culturalmen-
te). Más aún, estos modelos proponen que el aprendizaje es un proceso dinámico y
abierto en el que la modificación activa puede dedicarse al aumento del funciona-
miento (Jensen, 1992; Robinson-Zañartu y Cook-Morales, 1992).
vL7. La atención dinámica al proceso frente a la atención estática

al producto
La evaluación dinámica representa un rumbo diferente del modelo estático de
orientación al producto, en el que el único proceso es la presentación de preguntas
o situaciones y la grabación de las respuestas por el examinador, que se mantiene in-
tencionadamente separado del proceso. En la evaluación dinámica, el foco de atención
está en el proceso de aprendizaje del individuo, que se evalúa mientras está apren-
diendo. El examinador no sólo observa sino que interviene en el proceso de evalua-
ción basado en esas observaciones, tratando de modificar los modos cognitivos o de
aprendizaje para después observar los resultados de la reeducación. Las metas de la
reeducación se derivan de un repertorio de funciones cognitivas y factores de moti-
vación.
La evaluación dinámica presentada en los modelos de Jensen y Feuerstein sostie-
ne que el aprendizaje comienza con la persona principal al cuidado del niño y dentro
579
del contexto de su cultura e idioma. Esta persona es el primer mediador del aprendi-
zaje; presenta al niño los elementos con finalidad del medio ambiente, entabla
una
relacion recíproca con él, ayuda a encuadrar y formar conductas asociadas con el
aprendizaje, y otorga significado y motivación a las interacciones y al aprendizaje
que se desarrolla. Estas acciones constan de características esenciales de mediación.
Estas características de mediación, en las que el examinador engendra la intención y
reciprocidad, los sentimientos de capacidad, la regulación de la conducta o ritmo
cognitivo, el valor transcendental de la experiencia inmediata y la idea de lo que sig-
nifica el cambio a medida que ocurre son lo que caracteriza el tipo de interacción en-
tre el examinador y el examinado en la evaluación dinámica.
vLs. Problemas de evaluación
Los problemas de evaluación, validez y confiabilidad de los modelos de cambio

son tema de preocupación para los teóricos que operan dentro y fuera de este pa-
radigma. Aunque los resultados en ciertas dimensiones del desarrollo e incluso del
desglosamiento pueden compararse con los resultados de métodos alternativos
usando una variedad de criterios (por ejemplo, evaluaciones basadas en el currícu-
lo, evaluación de la cartera...), el nivel de individualización necesario en cada eva-
luación dinámica impide el uso de medidas tradicionales de validez y confiabilidad.
El cambio de supuestos básicos va a requerir un movimiento del enfoque psicomé-
trico hacia concepciones matemáticas destinadas a evaluar el cambio en lugar de la
estabilidad. El foco no es comparar los productos de un individuo con otros, sino
evaluar procesos de cambio en el individuo. De esta manera, se necesita conocer es-
tos cambios, qué se supone que cambia, cómo se produce el cambio y cuándo se cree
que ocurre.
Jensen (1992) ha propuesto una regla matemática de eficacia de ejecución que
utiliza tecnología de ordenadores con pantallas táctiles. Esta tecnología es capaz de
grabar las respuestas del aprendiz instantáneamente y de forma continuada, dando
una medida del nivel y el cambio en la eficacia del sujeto. La curva de aprendizaje re-
presenta el valor de cambio en la eficacia y provee datos de los que se pueden derivar
la confiabilidad y validez de esos cambios funcionales. Jensen sugiere que aunque se
ueden calcular resultados estadísticos individuales y de grupo, el significado princi-
al de la evaluación reside en el uso clínico del proceso de mediación donde se inten-
ta el desarrollo de nuevos modos de funcionamiento.
vi9. Transferencia de resultados

Hasta aquí, la transferencia de los efectos de la evaluación dinámica y de la reeduca-
ción del aprendizaje mediado se ha analizado en relación a los indicios acerca de la
transferencia al aumento cognitivo y escolar. Una gran cantidad de estudios de in-
vestigación dan apoyo al supuesto de que este modelo produce un aumento en el
funcionamiento cognitivo y en la habilidad para resolver problemas. En la actuali-
es del
dad, las metas en educación se están reexaminando de acuerdo a las necesidad
estudiante en el siglo XX1. En Estados Unidos, los mandatos para reformar la educa-
ción ahora recalcan que las metas educativas deben ir más allá del rendimiento esco-
lar. La atención se dirige hacia el desarrollo de las destrezas de pensamiento (Car-
negie Council on Adolescent Development, National Educational Goals Report) y
al logro de resultados que capaciten al aprendiz para aprovechar la enseñanza (Yssel-
dyke y Thurlow, 1992).
Las investigaciones con estos modelos hasta la fecha no han corroborado elsu-
puesto de transferencia al aumento de rendimiento escolar, aunque las nuevas orien-
taciones deberían dejarlo abierto para revisión. Dado el interés de Jensen en las
dimensiones múltiples del aumento de la aptitud, su trabajo teórico en el desglosa-
miento del conocimiento parece ser especialmente merecedor de un examen científi-
CO riguroso.
vtio. Las aplicaciones en la toma de decisiones

Hay tres tipos de aplicaciones en la toma de decisiones que se derivan de este mode-
lo: la identificación de estudiantes mal categorizados, las metodologías de enseñanza
preventivas y las reeducaciones estratégicas del niño. En la primera aplicación, se
identifican aquellos estudiantes mal categorizados de bajo nivel, según las pruebas
tradicionales de inteligencia; estos estudiantes supuestamente de “bajo nivel” en las
pruebas de inteligencia actúan en las evaluaciones dinámicas como los estudiantes
que reciben educación regular. Los indicios de las pocas investigaciones realizadas
indican que cuando se compara la actuación de los estudiantes que reciben educa-
ción regular con los de educación especial en la evaluación dinámica, y cuando los
estudiantes en educación especial (que funcionan tan bien como los que reciben edu-
cacion regular) se integran a la clase regular, estos estudiantes de “bajo nivel” tienen
éxito. Estos investigadores postulan que las diferencias de nivel en la capacidad del
estudiante para aprovechar la enseñanza están relacionadas con variables socioeco-
nómicas y culturales. El proceso de identificar estudiantes mal categorizados implica
una cantidad considerable de evaluaciones individuales y comparaciones. Dado que
existen pocos datos estandarizados sobre la evaluación dinámica en los que derivar
estas comparaciones, el uso difundido de este proceso tiene en potencia un grado de
subjetividad que lo hace discutible. Sin embargo, una variante del método puede te-
ner valor para derivar hipótesis sobre categorizaciones inadecuadas.
Los modelos dinámicos varían significativamente en los marcos teóricos acerca
de la naturaleza del aprendizaje, sus componentes e interrelaciones. Los modelos de
Feuerstein y Jensen proveen “mapas cognitivos” destinados a dirigir la enseñanza.
Las dos últimas aplicaciones para la toma de decisiones se apoyan en la articulación
de estas funciones cognitivas y de los factores de motivación que se cree que aumen-
tan el aprendizaje. La segunda aplicación infunde el aprendizaje mediado en los mé-
todos de enseñanza de la educación regular; aquí, se identifican las funciones cogni-
tivas implícitas en el contenido del currículo y las funciones se median dentro del
contenido como parte de la lección. La tercera aplicación, la reeducación mediada,
especifica las metas individuales de desarrollo determinadas por la evaluación diná-
mica. Estos objetivos van a ser funciones o factores necesarios para preparar al niño
para el entendimiento y uso de funciones escolares. Por ejemplo, si el maestro pro-

yecta trabajar la función cognitiva de categorización conjuntamente con el aprendi-
zaje de conjuntos en matemáticas, se necesitará preparar al niño en la función de
conducta de comparación como requisito previo. Durante la evaluación dinámica se
puede examinar una gran variedad de otras funciones, tales como la inhibición de
respuestas impulsivas, la conservación de constancias, la precisión y la exactitud en
la recogida de datos o la conciencia del problema, y se pueden establecer metas y se-
cuencias apropiadas para el niño.
viti. La validez de tratamiento
La validez de tratamiento en los modelos de evaluación dinámica y de reeducación

del aprendizaje mediado está íntimamente relacionada con los problemas de transfe-
rencia proximal y distante analizados anteriormente. La mayoría de los modelos de
evaluación dinámica afirma que sus fines son el aumento del funcionamiento cogni-
tivo o de las destrezas para la resolución de problemas. Este criterio se ha demostra-
do en tareas de transferencia proximal tales como en las evaluaciones de inteligencia
no verbal y en los informes del maestro cuando el estudiante usa nuevos enfoques
para la resolución de problemas. Además, hay indicios de que la inclusión intencio-
nada de las destrezas de aprendizaje o de pensamiento en el contenido de las asigna-
turas da resultados positivos en la precisión lectora, la escritura y las estimaciones
sobre la atención del maestro. Sin embargo, la transferencia distante del aumento
cognitivo al aumento del rendimiento escolar todavía no se ha demostrado adecua-
damente. Los investigadores en este campo están actualmente abocados a nuevos ca-
minos en los que aplicar el aumento de las destrezas cognitivas directamente al cu-
rrículo. Estos nuevos rumbos pueden dar indicios de que los modelos son más útiles
para el aumento del rendimiento escolar.
VI. CONCLUSIONES
Reflexionando acerca de las corrientes de la última década, hemos examinado las ap-
titudes desde una perspectiva que incluye cualquier medida destinada a pronosticar
diferencias individuales en futuros aprendizajes. Específicamente, nos hemos con-
centrado en tres modelos de evaluación de las aptitudes cognitivas dirigidos a mejo-
rar el diagnóstico, la orientación y/o el tratamiento de niños y adolescentes con pro-
blemas de aprendizaje: los modelos psicolingúísticos y perceptivomotores, los
modelos de interacción entre la aptitud y el tratamiento y los modelos de cambio de
la evaluación dinámica y la reeducación del aprendizaje mediado. Todos estos mo-
delos tienen en común la idea de que existe un repertorio de procesos cognitivos de
base en el proceso de aprendizaje, que el examen de las diferencias en elindividuo
mismo en lugar de las diferencias entre individuos debe reflejar datos importantes
acerca del plan de adiestramiento o de enseñanza, y que el aumento del funciona-
miento cognitivo y del rendimiento escolar deben ser las metas finales de la rehabili-
tación basada en estas evaluaciones.
Las diferencias significativas entre los modelos conducen a diferentes conclu-
siones acerca de sus utilidades. Los modelos de interacción entre las aptitudes y el
tratamiento presuponen que las aptitudes son características estables del individuo,
relativamente resistentes al tratamiento. Los modelos psicolingúísticos y percepti-
vomotores presuponen que las funciones deficientes pueden identificarse y cam-
biarse con tratamientos. Los modelos de estabilidad se basan en productos o res-
puestas como la unidad principal de observación y en procedimientos tradicionales
de evaluación estandarizada; mientras, los modelos de evaluación dinámica presu-
ponen que las funciones cognitivas no son sólo modificables, sino que están in-
terrelacionadas de manera que su desarrollo puede conducir al aumento de la es-
tructura cognitiva global. Conforme con los modelos de cambio, la unidad de
observación son los procesos de pensamiento que se usan para producir una va-
riedad de respuestas en lugar de los productos, en los procedimientos en la evalua-
ción dinámica son dinámicos e interactivos, guiados por los procesos de pensa-
miento del estudiante.
Cada modelo se diferencia en el supuesto de la transferencia de los resultados.
En los modelos de interacción, aptitud y tratamiento se presupone que el tratamien-
to o la enseñanza deben desarrollar las destrezas o habilidades estables, produciendo
así el aumento del funcionamiento. Los modelos psicolingúísticos y perceptivomo-
tores presuponen que las funciones deficientes pueden entrenarse, llevando así a un
aumento del funcionamiento. La toma de decisiones de acuerdo a estos modelos de
estabilidad se relaciona normalmente con el tipo de enseñanza que debe usarse o con
la categorización del estudiante para una futura orientación diferencial basada en la
existencia de ciertas deficiencias cognitivas o de elaboración. Los modelos dinámi-
cos de cambio presuponen que la transferencia puede lograrse a través de los proce-
sos reeducativos que se identifican durante la evaluación y que son parte de la mis-
ma. La toma de decisiones se relaciona con los métodos de enseñanza encaminados
al aumento del funcionamiento global. Las reeducaciones son conductas interactivas
(mediaciones) efectuadas por los maestros, padres o especialistas que se aplican a las
funciones cognitivas en el contexto del currículo.
En la actualidad, los tres modelos se quedan cortos en cuanto se aplica el están-
dar de validez de tratamiento que se basa en la mejora de los resultados escolares.
Aunque las causas de los indicios negativos pueden deberse a debilidades en la teoría
básica, en la evaluación de las aptitudes o en las reeducaciones que se disponen, las
investigaciones con el modelo de interacción aptitud-tratamiento indican en el me-
jor de los casos interacciones bastante débiles. Con respecto al modelo perceptivo-
motor, las reeducaciones parecen tener efectos limitados sobre los procesos percep-
tivomotores. Las reeducaciones del modelo psicolingúístico parecen tener algún
efecto mínimo sobre los procesos psicolingúísticos, pero no resultados certeros en el
rendimiento escolar. Las reeducaciones de los modelos de evaluación dinámica pare-
cen tener un efecto claro sobre el aumento cognitivo, pero no hay indicios claros de
transferencia al desarrollo escolar. Los adelantos recientes en las teorías e investiga-
ciones en este campo son promisorios y deben continuarse. Los experimentos que
intencionadamente equiparan las destrezas de aprendizaje y el contenido de la ense-
583
ñanza están comenzando a producir indicios de transferencia. Con una atención cre-
ciente en el campo educativo hacia el papel que Juegan las destrezas de pensamiento
los métodos de evaluación y reeducación que provean indicios del desarrollo mental
y del desenvolvimiento escolar llegarán a ser notables.
Allington, R. L. (1991). Effective literacy instruction for at-risk children. En M. S. Knapp y

P. M. Shields (dirs.), Better schooling for children ofpoverty: Alternatives to conventional
wisdom. Berkeley. McCutchan.
Anastasi, A. (1988). Psychological testing (6.* ed.). Nueva York. MacMillan.
Arter, J. A. y Jenkins, J. R. (1977). Examining the benefits and prevalence of modality consi-
derations in special education. Journal of Special Education, 11, 281-298.
Ayres,R. R. y Cooley, E. J. (1986). Sequential versus simultaneous processing on the K-ABC:
a in predicting learning success. Journal of Psychoeducational Assessment, 4, 211-
Ayres, R. R., Cooley, E. J. y Severson, H. H. (1988). Educational translation of the Kaufman

po Battery for Children: A construct validity study. School Psychology Review,
Babad, E. y Budoff, M. (1974). Sensitivity and validity of learning potential measurement in

three levels of ability. Journal of Educational Psychology, 66, 439-447.
Bowlby, J. A. (1960). Separation anxiety. International Journal of Psychoanalysis, 41, 89-113.
Brown, F. G. (1983). Principles of educational and psychological testing (3.2 ed.). Nueva York.
Holt, Rinehart and Winston.
Brown, J. S., Collins, A. y Duguid, P. (1989). Sitnated cognition and the culture of learning.
Educational Researcher, 18, 32-42.
Budoff, M. (1967). Learning potential among institutionalized young adult retardates. Ame-
rican Journal of Mental Deficiency, 72, 404-411.
Budoff, M. y Friedman, M. (1964). “Learning potential” as an assessment approach to the
adolescent mentally retard. Journal of Consulting Psychology, 28, 434-439.
Bush, W. J. y Giles, M. T. (1977). Azds to psycholinguistac teaching (2.* ed.). Columbus. Char-
les E. Merrill.
Campione, J. C. y Brown, A. L. (1987). Linking dynamic assessment with school achieve-
ment. En C. S. Lidz (dir.), Dynamic assessment: An interactional approach to evalnating
learning potential. Nueva York. Guilford Press. . ¡a
Carlson, J. y Wiedl, K. H. (1976). Applications of “testing-the-limits”: Towards a differential
testing approach employing the Ravens Coloured Matrices. Trier Psychologische Berich-
te,.3, 1-80,
Carlson,J. yWiedl, K. H. (1978). Use of testing the limits procedures in the assessment of in-
tellectual capacities in children with learning difficulties. American Journal of Mental De-
ficiency, 2, 559-564. a ' N , en
Carlson, j. yWiedl, K. H. (1979). Towards a differential testing approach: Testing-the-limits
employing the Ravens Matrices. Intelligence, 3, 323-344, DAI,
Carlson, J. y Wiedl, K. H. (1980). Applicatio ns of a dynamic testing approach in intelligence
assessment: Empirical results and theoretical formulations. Zeitschrift fur Differentielle
und Diagnotiche Psychologie, 1, 303-318.
Carnegie Council on Adolescent Development. Task Force on Education of Young Adoles-

cent (1980). Turning points: Preparing American youth for the 215t century: The report of
the Task Force on Education of Young Adolescents. Washington, D.C. Carnegie Council
on Adolescent Development. 24 Y)
Collins, A., Brown, J. S. y Newman, T. E. (1989). Cognitive apprenticeship: Teaching the
craft of reading, writing and mathematics. En L. B. Resnick (dir.), Knowing, learning and
instruction: Essays in honor of Robert Glaser. Hillsdale. Erlbaum. $6
Corman, L. y Budoff, M. (1973). A comparison of group and individual training procedures
on the Ravens Learning Potential Measure in the black and white special class students.
RIE Print 57. Cambridge. Research Institute for Educational Problems. :
Cronbach, L. J. (1957). The two disciplines of scientific psychology. American Psychologist,
12, 671-684.
Cronbach, L. J. (1975). Beyond the two disciplines of scientific psychology. American Psy-
chologist, 30, 116-127.
Cronbach, L. J. (1984). Essentials ofpsychological testing (4.* ed.). Nueva York. Harper and
Row.
Cronbach, L. J. y Snow, R. E. (1977). Aptitudes and instructional methods. Nueva York. Wi-
ley.
DT P., Kirby, J. R. y Jarman, R. F. (1979). Simultaneons and successful cognitive processes.
Das, J. P., Naglieri, J. A. (en prensa). Das-Naglieri: Cognitive Assessment System. Chicago.
Riverside Publishing Co.
Dearborn, W. F. (1921). Intelligence and its measurement. Journal of Educational Psycho-
logy, 12, 210-212.
Deloria, V. (1991). Indian education in America. Boulder. American Indian Science and En-
gineering Society.
De Weerdt, E. H. (1927). A study of the improbability of fifth grade children in certain men-
tal functions. Journal of Educational Psychology, 18, 547-557.
Dillon, R. y Carlson, J. (1978). The use of activation variables in the assessment of cognitive
abilities of three ethnic groups: A testing-the-limits approach. Educational and Psycholo-
gical Measurement, 38, 437-443.
Emerson, L. W. (1991). MLE and American Indian education. En R. Feuerstein, P. S. Klein y
A. J. Tannenbaum (dirs.), Mediated Learning Experience (MLE): Theoretical, psychosocial
and learning implications. Londres. Freund.
Feuerstein, R. (1970). A dynamic approach to causation, prevention and alleviation of retar-
ded performance. En H. C. Haywood (dir.), Social-cultural aspects of mental retardation.
Nueva York. Appleton-Century-Crofts.
Feuerstein, R., Haywood, H. C., Rand, Y., Hoffman, M. B. y Jensen, M. R. (1985). The lear-
ning potential assessment device: Manual. Jerusalén. Hadassah WIZO Canada Research
Institute.
Feuerstein, R., Jensen, M. R., Hoffman, M. B. y Tand, Y. (1985). Instrumental enrichment.
An intervention program for structural cognitive modificability: Theory and practice. En
J. W. Sega, S. F. Chilpman y R. Glaser (dirs.), Thinking and learning skills. Related ins-
truction to research (vol. 1). Hillsdale. Erlbaum.
Feuerstein, R., Rand, Y., Hoffman, M. y Miller, R. (1980). Instrumental enrichment. Glen-
view. Scott Foresman and Company.
Feuerstein, R., Rand, Y., Jensen, M. R., Kaniel, S. y Tzuriel, D. (1987). Prerequisites for as-
sessment of learning potential: The LPAD mode. En C. S. Lidz (dir.), Dynamic assessment,
an interactional approach to evaluating learning potential. Nueva York. Guilford Press.
Greenberg, K. H. (1990). Mediated learning in the classroom. International Journal of Cog-
nitive Education and Mediated Learning, 1, 33-44.
Greenberg, K. H. (1992). Research and mediated learning: Implications for program imple-
mentation. Comunicación presentada a la Conference on Mediated Learning in Health

E and ripo p Forging a New Alliance. St. Petersburg, EE UU.
ammill, D, 3
Children, y oe
Larsen, S. (1974)
(1974). The
E effectiveness of psycholinguis
inguistic traini
tic training. Exceptional
Hammill, D. y Larsen, S. (1978). The effectiveness of psycholinguistic training: A reaffirma-
tion of position. Exceptional Children, 44, 402-414.
Harlow, H. F. y Harlow, M. K. (1966). Learning to love. American Scientist, 54, 244-272.
Harth, R. (1982). The Feuerstein perspective on the modification of cognitive performance.
Focus on Exceptional Children, 15, 11-22.
Hartlage, L. C. y Reynolds, C. R. (1981). Neuropsychological assessment and the individua-
lization of instruction. En G. W. Hynd y J. E. Obrzut (dirs.), Neuropsychological assess-
ment and the school age child: Issues and procedures. Nueva York. Grune and Stratton.
Haywood, H. C. y Tzuriel, D. (1992). Interactive assessment. Nueva York. Springer Verlag.
Haywood, H. C., Towery-Woolsey,J.,Arbitman-Smith, R. y Aldrudge, A. (1988). Cogniti-
ve education with deaf adolescents: Effects of Instrumental Enrichment. Topics in Lan-
guage Disorders, 8, 23-40.
Jensen, M. R. (1990). Change models and some evidence for phases and their plasticity in
cognitive structures. International Journal of Cognitive Educative and Mediated Lear-
ning, 1, 5-16.
Jensen, M. R. (1992). Principles of change models in school psychology and education. Ad-
vances in Cognition and Educational Practice, 1, 47-72.
Jensen, M. R. y Feuerstein, R. (1987). The learning potential assessment device: From philo-
sophy to practice. En C. S. Lidz (dir.), Dynamic assessment: An interactional approach to
evaluating learning potential. Nueva York. Guilford Press.
Jensen, M. R., Rand, Y., Kaniel, S. y Tzuriel, D. (1988). Cultural difference and cultural de-
privation: A theoretical framework for differential intervention. En R. M. Gupta y
P. Coxhead (dirs.), Cultural diversity and learning efficiency. Londres. MacMillan.
Jensen, M. R., Robinson-Zanartu, C. y Jensen, M. L. (1992). Dynamic assessment and media-
ted learning. Assessment and intervention for developing cognitive and knowledge struc-
tures: An alternative in the era of reform. Sacramento. California Department ot Educa-
tion.
Jensen, M. R. y Singer,J.L. (1987). Structural cognitive modificability in low functioning ado-
lescents: An evaluation of Instrumental Enrichment. Hartford. State of Connecticut De-
partment of Education.
Kaufman, A. S., Goldsmith, B. Z. y Kaufman, N. L. (1984). k-SOS: Kaufman Sequential or Si-
multaneous. Circle Pines. American Guidance Service.
Kaufman, A. y Kaufman, N. (1983). Kaufman Assessment Battery for Children (K-ABC). Cir-
cle Pines. American Guidance Service.
Kaufman, IL C. y Rosenblum, L. A. (1967). The reaction to separation in infant monkeys:
Anaclitic depression and conversation-withdrawal. Psychosomatic Medicine, 29, 648-675.
Kavale, K. A. (1981). Functions of the Illinois Test of Psycholinguistic Abilities (ITPA): Are
they trainable? Exceptional Children, 47, 496-510.
Kavale, K. (1990). The effectiveness of special education. En T. B. Gutkin y C. R Reynolds
(dirs.), The handbook of school psychology (2. ed.). Nueva York. Wiley.
Kavale, K. A. y Forness, S. R. (1987). Substance over style: Assessing the efficacy of modality
testing and teaching. Exceptional Children, 54, 228-239. t
Kavale, K. A. y Forness, S. R. (1990). Substance over style: A rejoinder to Dunn's animadver-
sions. Exceptional Children, 56, 357-361. a
Kavale, K. A. y Mattson, P. D. (1983). “One jumped off the balance beam”: Meta-analysis of
perceptual=motor training. Journal of Learning Disabalities, 16, 165-173.
Kirk, S. A. y Kirk, W. (1971). Psycholinguistic learning disabilities: Diagnosis and remedia-
tion. Champaign. University of Illinois Press.
Kirk, S. A., McCarthy, J. y Kirk, W. (1968). /llinois Test of Psycholingwistic Abilities. Cham-
paign (Il). University of Illinois Press. :
Klauer, K. J. (1989). Teaching for analogical transfer as a means of improving problem-
solving, thinking and learning. Instructional Science, 179-192. AZ, : :
Kreigler, S. M. y Kaplan, M. E. (1990). Improving inattention and reading in inattentive chil-
dren through MLE: A pilot study. International Journal of Cognitive Education and Me-
diated Learning, 1, 185-192.
Lidz, C.S. (1987). Dynamic assessment: An interactional approach to evaluation learning po-
tential. Nueva York. Guilford Press.
Lipman, M., Sharp, A. M. y Oscayen, F. S. (1990). Philosophy in the classroom. Filadelfia.
Temple University Press.
Lund, K., Foster, G. y McCall-Pérez, F. (1978). The effectiveness of psycholinguistic trai-
ning: A reevaluation. Exceptional Children, 44, 310-321.
Luria, A. R. (19664). Higher cortical functions in man. Nueva York. Basic Books.
Luria, A. R. (1966b). Human brain and psychological processes. Nueva York. Harper and
Row.
Mandl, H. y Schnotz, W. (1987). New directions in text comprehension. En E. De Corte
(dir.), Learning and Instruction (vol. 1). Oxford Leuvens. Pergamon/Leuven University.
Mercer, C. D., King-Sears, P. y Mercer, A. R. (1990). Learning disabilities definitions and cri-
teria used by state education departments. Learning Disability Quarterly, 13, 141-152.
Minskoff, E. (1975). Research on psycholinguistic training: Critique and guidelines. Excep-
tional Children, 42, 136-144.
Minskoff, E. H., Wiseman, D. E. y Minskoff,J.G. (1972). The MWM Program for Developing
Language Abilities. Ridgeway. Educational Performance Associates.
Moll, L. C. (1991). Social and instructional issues in literacy instruction for “disadvantaged”
students. En M. S. Knapp y P. M. Shields (dirs.), Better schooling for children ofpoverty:
alternatives to conventional wisdom. Berkeley. McCutchan.
Naglieri, J. A. (1989). A cognitive processing theory for the measurement of intelligence.
Educational Psychologist, 24, 185-206.
Newcomer, R., Larsen, S. y Hammill, D. (1975). A response to Minskoff. Exceptional Chil-
dren, 42, 144-148.
Nisbet,J. y Shucksmith,J.(1986). Learning strategies. Londres. Routledge.
Osgood, C. E. (1957). Motivational dynamics of language behavior. En M. R. Jones (dir.),
Nebraska Symposium on Motivation. Lincoln. University of Nebraska Press.
Penrose, L. S. (1934). Mental defect. Nueva York. Farrar and Rinehart.
Perkins, D. N. (1987). Thinking frames: An integrative perspective on teaching cognitive
skills. En J. B. Baron y R. J. Sternberg (dirs.), Teaching thinking skills: Theory and practi-
ce. Nueva York. Freedman and Co.
Haga (1952). The origins of intelligence in children. Nueva York. International Universi-
ties Press.
Reschly, D. J. y Gresham, F. M. (1989). Current neuropsychological diagnosis of learning
problems: Á leap of faith. En C. R. Reynolds y E. Fletcher-Janzen (dirs.), Handbook of
Clinical Neuropsychology. Nueva York. Plenum Press.
Reschly, D. J. y Wilson, M. S. (1990). Cognitive processing versus traditional intelligence:
Diagnosuc utility, intervention implications, and treatment validity. School Psychology
Review, 19, 443-458.
Rey, A. (1934). D'un procédé pour évaluer Péducabilité (quelques applications en psycho-
pathologie). Archives de Psychologie, 24, 297-337. )
Reynolds, C. R. (1981). Neuropsychological assessment and the habilitation learning: Consi-
derations in the search for aptitude x treatment interaction. School Psycholo gy Reviero, 10,
343-349.
587
Reynolds, C. R. (1986). Transactional models of intellectual development, Yes. Deficit

mo-
dels of process remediation, No. School Psychology Review, 15, 256-260.
Reynolds, C. R. (1992). Two key concepts in the diagnosis of learning disabilities and the ha-
bilitation of learning. Learning Disability Quarterly, 15, 2-12.
Robinson-Zañartu, C. y Cook-Morales, V. J. (1992). American Indian issues in school psy-
chology. Working paper. San Diego. San Diego State University.
Sackett, G. P. (1967). Some persistent effects of different rearing conditions on preadult social
behavior of monkeys. Journal of Comparative Physiological Psychology, 64, 363-365.
Salema, M. H. y Valente, M. O. (1990). Learning to think: Metacognition in written compo-
sition. International Journal of Cognitive Education and Medicated Learning, 1, 161-170.
a E cds y 1988). Assessment in special and remedial education (42 ed.). Boston.
oughton-Mifflin Company.
Schwartz, G. (1977). Psychosomatic disorders and biofeedback: A psychobiological model
of disregulation. En J. A. Maser y M. E. P. Seligman (dirs.), Psychopathology: Experimen-
tal Models. San Francisco. W. H. Freeman.
Schwartz, G. (1983). Disregulation theory and disease: Applications to the repression/cere-
FÉ Oya disorder hypothesis. International Review of Applied
sychology, 32, 95-118.
ed P. ¡oa Learning to learn. En P. Span (dir.), Onderwijsleerprocessen. Lisse. Swets
and Zeitlinger.
Snow, R. E. (1980). Aptitude and achievement. En W. B. Schrader (dir.), Measuring achieve-
ment: Progress over a decade. New directions for testing and measurement. San Francisco.
Jossey-Bass.
Snow, R. E. (1992). Aptitude theory: Yesterday, today, and tomorrow. Educational Psycho-
logist, 27, 5-32.
Teeter, P. A. (1987). Review of neuropsychological assessment and intervention with chil-
dren and adolescents. School Psychology Review, 16, 582-583.
Teeter, P. A. (1989). Neuropsychological approaches to the remediation of educational defi-
cits. En C. R. Reynolds y E. Fletcher-Janzen (dirs.), Handbook of Clinical Child Neuro-
psychology. Nueva York. Plenum Press.
The National Education Goals Report (1991). Buzlding a nation of learners. Washington,
D.C. National Education Goals Panel.
Thickpenny, J. P. y Howie, D. R. (1990). Teaching thinking skills to deaf adolescents: The
implementation and education of instrumental enrichment. International Journal of Cog-
nitive Education and Medicated Learning, 1, 193-209.
Vigotski, L. S. (1962). Thought and language. Cambridge. MIT Press.
Wechsler, D. (1974). Manual for the Wechsler Intelligence Scale for Children-Revised. San
Antonio. Psychological Corporation. pr
Wechsler, D. (1991). Wechsler Intelligence Scale for Children-Thir d Edition: Manual. San
Antonio. Psychological Corporation. la 3
Woodcock, R. W. y Mather, N. (1989). W]-R tests of cognitive ability-standard and sup-
plemental batteries: Examiner's Manual. En R. W. Woodcock y M. B. Johnson (dirs.),
Woodcock-Johnson Psychoeducational Battery-Revised. Allen. DLM Teaching Resources.
Ysseldyke, J. E. y Thurlow, M. L. (1992). Educational outcomes: Do we consider all stu-
dents? Communique, 20, 20-21.
R. Reynolds
Kavale, K. (1990). The effectiveness of special education. En T. B. Gutkin y C.
(dirs.), The handboo k of school psycholog y (2% ed.). Nueva York. Wiley.
Lidz, C. S. (1987). Dynamic assessment: An interactional approach to evaluation learning po-

Reschly, D. J. y Gresham F. M. (1989). Current neuropsychological diagnosis of learning
problems: A leap of faith. En C. R. Reynolds y E. Fletcher-Janzen (dirs.), Handbook of
clinical neuropsychology. Nueva York. Plenum Press.
Reschly, D. J. (1990). Aptitudes tests in educational classification and placement. En
G. Goldstein y M. Hersen (dirs.), Handbook ofpsychological assessment (2.* ed.). Nueva
Snow, R. E. (1992). Aptitude theory: Yesterday, today, and tomorrow. Educational Psycho-
logist, 27, 5-32.
24. EVALUACIÓN DE LAS HABILIDADES DE LA INTELIGENC
IA:
TEORÍA TRIÁRQUICA DE LA INTELIGENCIA
|
ROBERT STERNBERG y MARÍA DOLORES PRIETO
Il. INTRODUCCIÓN
En este capítulo se hace una revisión de la teoría triárquica de la inteligencia y de su

modelo de evaluación; ambos, teoría y evaluación, han supuesto una nueva alternati-
va para evaluar los mecanismos internos de la inteligencia individual y su interacción
con el contexto del sujeto. El Sternberg triarchic abilities test (STAT) se ha diseñado
para evaluar los procesos y funciones de las tres subteorías que componen la teoría
triárquica (componencial, experiencial y contextual). El contexto y la experiencia del
individuo con aquél es esencial por el hecho de que ningún test está libre de influen-
cia cultural.
Este modelo de evaluación pretende ser una alternativa a los modelos psicomé-
tricos existentes en psicología, por cuanto que está orientado a evaluar las operacio-
nes de la inteligencia en su contexto y la mediación que éste tiene para el desarrollo
intelectual, mientras que la mayoría de los instrumentos de medida tradicionales
evalúa sólo los mecanismos subyacentes a la inteligencia. Las preguntas del test se
han organizado dentro del sistema de evaluación de manera que evalúen las distintas
facetas de la inteligencia, desde los mecanismos metacomponenciales hasta las fun-
ciones de la inteligencia práctica, y la forma en la que se emplean dichos mecanismos
para interactuar con el medio. Se trata de un test de respuestas de elección múltiple
que se puede administrar en grupo. El procedimiento de puntuación es un tanto so-
fisticado, obteniendo puntuaciones separadas para evaluar tres dimensiones de la in-
teligencia (analítica, creativa y práctica) en tres modalidades de lenguaje (verbal,
cuantitativa y figurativa). La inteligencia analítica se evalúa con tareas en las que se
han incluido problemas que recogen los componentes o habilidades intelectuales-
académicas; la creativa, mediante problemas cuya solución exige pensar de forma
novedosa, ponderando más el proceso y la recomposición que el sujeto hace de todo
el contexto que la respuesta novedosa en sí; por último, las funciones de la inteligen-
cia práctica y contextual se evalúan con problemas cuya solución exige emplear pro-
cesos de razonamiento lógico.
El test se administra en grupo y cubre nueve niveles, desde los cuatro años hasta
la edad adulta. Se puede utilizar para evaluar la inteligencia en general y para detectar
los déficit intelectuales, en particular; además, también se está utilizando para detec-
tar y entrenar sujetos con habilidades superiores. :
El estudio de los antecedentes históricos de la evaluación, objeto del apartado n
de este capítulo, nos ayudará a comprender las diferencias y semejanzas de la teoría
University of Yale (EE UU) y Universidad de Murcia.

590 Robert Sternberg y María Dolores Prieto
triárquica de la inteligencia con respecto a algunos modelos de evaluación como el

psicométrico, la psicología del desarrollo y el procesamiento de la información, En
el apartado III se hace un planteamiento teórico de la inteligencia triárquica, explici-
tando los mecanismos, procesos y funciones de las subteorías individual, contextual
y práctica de la inteligencia. A continuación se han incluido algunas de las activida-
des que evalúan los componentes de la inteligencia, analizando los procesos que se
utilizan para la solución; también se hacen algunas comparaciones entre este tipo de
evaluación de los componentes y el tradicional. En el punto V del capítulo recoge-
mos los ítems para evaluar la inteligencia contextual. Los problemas se han organi-
zado en dos apartados: uno, referido a la medida de los procesos de insight; elotro, a
los de automatización. En el punto VI se incluyen algunos de los ítems diseñados
para evaluar las funciones y estrategias propias de la inteligencia práctica. En el pun-
to VII señalamos algunas limitaciones que tienen los métodos actuales de evaluación,
apuntando algunas innovaciones que se deberían introducir en el diseño de modelos
futuros de evaluación de la inteligencia. El capítulo finaliza con algunas reflexiones
sobre las ventajas que la teoría triárquica y el test tienen para el campo de la educa-
ción.
II. ANTECEDENTES HISTÓRICOS

11. La perspectiva psicométrica
Esta perspectiva se inicia con los primeros estudios de Binet y Simon (1905) y conti-
núa con Terman y Merril (1960) en Estados Unidos. Binet y sus colaboradores pre-
tendían evaluar la inteligencia analizando los aumentos de la capacidad del individuo
para resolver tareas relativamente complejas. La solución de éstas exigía habilidades
similares a las utilizadas en la experiencia diaria. Según Binet y Simon (1916), la inte-
ligencia implica tener juicio, sentido práctico, iniciativa y facultad para adaptarse a
las circunstancias de uno mismo. Estos autores piensan que la inteligencia supone
dirección, adaptación y capacidad para la crítica. La dirección consiste en saber qué
se ha de hacer y cómo lograrlo; esto significa en cierta manera que el sujeto defina el
problema y se vaya dando instrucciones (autorregulando) durante el tiempo que
dure la actividad. La adaptación se refiere a la selección y supervisión de la estrategia
tal y como tiene que ser usada. La capacidad de crítica se refiere a la habilidad para
evaluar si las decisiones que se toman para utilizar la información y resolver el pro-
blema son idóneas o no. Estos primeros procedimientos de evaluación nacen en un
contexto educativo, con el fin de diferenciar a los estudiantes con dificultades de los
considerados normales y de darles a aquéllos una educación especializada. Sin em-
bargo, no incluían problemas tal como ocurren en el contexto del individuo.
Desde la perspectiva psicométrica se han diseñado otros procedimientos para
evaluar la inteligencia. Uno es el conocido como el análisis factorial, método estadís-
tico cuyo objetivo es buscar fuentes comunes de variación entre los individuos e
identificar estas fuentes como atributos psicológicos unitarios o factores. Spearman
(1904), mediante la técnica del análisis factorial, pretendía identificar las capacidades
Evaluación de las habilidades de la inteligencia: teoría triárquica de la inteligencia
591
subyacentes en los tests de habilidades mentales, llegando a distinguir el factor go

inteligencia general, implícito en todos los tests de inteligencia, y los factores especí-
ficos (s), propios del rendimiento de cada individuo (éstos se evalúan con distintos
tests). Según Sperman, el factor general podría representar las diferencias individua-
les respecto a la capacidad mental. Existen tres procesos mentales que son comunes
para diferentes tests de razonamiento. Uno es el referido a la codificación perceptiva
de estímulos; otro es la deducción de relaciones referida a la inferencia de relaciones
entre estímulos, y el tercer proceso es la deducción de correlatos o aplicación de las
relaciones inferidas a un dominio o actividad nueva.
Los tests utilizados por la psicometría —problemas de matrices, completar se-
ries de números y palabras, clasificaciones y analogías— permiten obtener una pun-
tuación del cociente intelectual (CI). Los ítems incluyen actividades de tipo figurati-
vo cuya solución implica menos uso de conocimientos previos, por esta razón se
decía que eran pruebas libres de contenido cultural. Las pruebas verbales, por el
contrario, sí exigen un alto nivel de vocabulario y, por tanto, no se consideran bue-
nas medidas del factor g. Más tarde, Thurstone (1938) venía a decir que el factor
general no describe con rigurosidad la inteligencia. Ésta está compuesta por siete ha-
bilidades mentales primarias: comprensión verbal, fluidez verbal, numérica, visuali-
zación espacial, rapidez perceptiva, memoria y razonamiento. Según esta teoría
cualquier factor que exista ha de ser considerado de segundo orden según la correla-
ción que tenga con ellos. Basándose en la idea de las habilidades múltiples, Guilford
(1967) llegaba a obtener 120 factores distintos que ayudan a analizar la inteligencia,
éstos se han aumentado a 150 (cinco tipos de operaciones, cinco clases de contenidos
y seis clases de productos 5x5x6=150) (Guilford, 1982). La evaluación de los facto-
res se hace mediante instrumentos apropiados; por ejemplo, las relaciones figurati-
vas se evalúan con tests de analogías de figuras. Guilford y los psicometristas realiza-
ron una gran aportación al campo de la identificación y evaluación de los procesos
subyacentes en la inteligencia del sujeto, pero no se preocuparon del estudio de la in-
fluencia de un proceso sobre otro. Actualmente, la teoría jerárquica de Vernon es
una de las más aceptadas. El autor establecía una taxonomía entre las habilidades,
poniendo en el nivel más superior el factor g; después situó dos grandes grupos de
factores: capacidad verbal-educativa y capacidad mecánica-espacial; en un tercer ni-
vel estaría un grupo de factores de orden inferior y en la parte más baja de la relación
jerárquica los factores específicos.
De esta breve trayectoria podemos deducir que aunque el método psicométrico
estuvo estrechamente ligado a la escuela desde los tiempos de Binet, las implicacio-
nes educativas se centraron principalmente en el diagnóstico de las deficiencias y de
las diferencias individuales para dar un tratamiento educativo diferenciado. Los tests
utilizados procedentes de la psicometría apenas si informan de los procesos implíci-
tos en los aprendizajes escolares. Incluso muchos de los procesos considerados en
los tests no son precisamente los que se exigen para el aprendizaje escolar. La psico-
metría analiza la inteligencia mediante un método estructural, centrándose en las di-
ferencias y variaciones entre los individuos; emplea tests estandarizados para la eva-
luación de la inteligencia y se asume que la ejecución de una tarea depende de la
ha-
función de una serie de habilidades implícitas en dicha tarea, denominando a las
bilidades factores (Wagner y Sternberg , 1984).
12. La perspectiva psicogenética

Desde la psicología del desarrollo, Piaget (1936, 1947) considera la inteligencia de
forma muy distinta a como lo hacen los psicometristas. Piaget tuvo la oportunidad
de observar el trabajo de los niños en el laboratorio de Binet, preocupándose desde
sus inicios por el análisis de los errores que estos niños cometían cuando trataban de
resolver cualquier problema. Esto hizo que se mostrara más interesado por el estu-
dio del razonamiento del niño y de las diferencias que existen entre el razonamiento
de éste y del adulto. Su investigación la orienta a describir y analizar la evolución y
los cambios de las estructuras cognitivas en cada fase del desarrollo del niño. Piaget
distingue dos aspectos de la inteligencia interrelacionados: la función y la estructura.
Considera la función —adaptación— de la inteligencia como otra función biológica.
La adaptación incluye los procesos de asimilación y acomodación de las conductas a
la estructura cognitiva. Conforme el sujeto va progresando en su adaptación, por
procesos de interacción con el medio, la conducta se considerará más inteligente. En
opinión de este autor existirían cuatro factores que ayudan y explican el desarrollo:
la maduración, la experiencia, el equilibrio y la interacción con el mundo físico y
social.
Piaget utiliza un modelo de desarrollo del esquema —utilizado para la solución
de problemas— para explicar la organización del pensamiento, centrándose en lo
que es común a los sujetos de una misma edad, pero diferente a los de edades distin-
tas. Empleó el método clínico para evaluar la inteligencia, principalmente la observa-
ción, asumiendo que el rendimiento o la ejecución de una actividad se podría enten-
der en términos de las funciones lógicas implícitas en la solución de problemas. A
pesar de que el desarrollo puede variar entre los sujetos, Piaget pensó que los esta-
dios en sí mismos y su secuencia son universales. Esto significa que hay una única
ruta o camino para el desarrollo intelectual de todos los seres humanos. Las diferen-
cias individuales resultan de los diferentes índices de la progresión a lo largo del ca-
mino (Piaget, 1936).
A modo de conclusión podemos decir que la teoría del desarrollo mental ha con-
feccionado un modelo de evaluación orientado a evaluar más la competencia —lo
que el sujeto es capaz de hacer, a pesar de las restricciones externas e internas que in-
terfieren con la demostración de la total o completa competencia— que el rendi-
miento o competencia demostrada. La teoría subraya en mayor medida la madura-
ción que el aprendizaje, aunque Piaget no ignoró en ningún momento la
importancia que tiene la interacción contextual para el desarrollo de la inteligencia.
Los estadios de desarrollo cubren períodos de tiempo tan amplios que después de rea-
lizada la evaluación se hace poco operativa sobre todo cuando se quiere intervenir.
13. Procesamiento de la información

Las distintas concepciones de la inteligencia existentes dentro del paradigma del
procesamiento de la información se derivan de estudios que pretenden analizar la
forma en la que se procesa y representa la información en la mente humana. La inte-
593
ligencia es considerada como lahabilidad o conjunto de estrategias que el sujeto em-

plea para adquirir el conocimiento, organizarlo y representarlo en su esquema men-
tal. Los psicólogos del procesamiento de la información utilizan la metáfora del
computador y los procedimientos heurísticos para explicar los mecanismos del fun-
cionamiento de la mente humana. Mientras que para los psicometristas el factor es la
unidad fundamental que sirve para analizar y explicar la inteligencia, los psicólogos
del procesamiento de la información emplean el concepto de proceso como unidad
de análisis básica y elemental de la inteligencia (Newell y Simon, 1972). El rendi-
miento se puede entender en función de los procesos que componen las tareas. Se
asume desde esta perspectiva que toda la conducta procesada por la mente humana
es el resultado de la combinación de estos procesos elementales. Por esta razón,
cuando las tareas son complejas, se dividen en sus componentes más simples con el
fin de poder procesar la información de forma adecuada. La complejidad del análisis
varía según el tipo de conducta y el nivel en el que se quiera explicar ésta. Conse-
cuentemente, es preciso definir rigurosamente los procesos y tener una muestra am-
plia y representativa de todos los componentes, con el fin de componer y definir
todo el sistema macroscópico de actuación del procesamiento humano. Por esta ra-
zón se han diseñado procedimientos computacionales bastante complejos para com-
probar diferentes teorías sobre el procesamiento humano. Algunos investigadores
comparan las predicciones generadas mediante simulaciones computacionales con
las formas empleadas por los sujetos para procesar la información. Sin embargo,
otros prefieren comprobar sus teorías utilizando modelos cuantitativos con paráme-
tros que se han extraído directamente de los datos de los sujetos.
Dentro de los modelos más conocidos está el de “correlatos cognitivos”, elabo-
rado por Hunt, Frost y Lunnenborg (1973), cuyo objetivo es evaluar las diferencias
individuales en la inteligencia utilizando tareas empleadas en el laboratorio. Por
ejemplo, emplean tests de emparejamiento de letras para evaluar lo que ellos entien-
den como habilidad mental y, especialmente, la rapidez para utilizar el léxico. El ob-
jetivo es comprender las habilidades y predecir el rendimiento mediante tareas pro-
cedentes de la psicología cognitiva, aunque esto no siempre ha sido así. Por ejemplo,
una de las baterías más conocidas dentro de la perspectiva cognitiva es la diseñada
por Rose (1980); sin embargo, las correlaciones entre las tareas y las puntuaciones de
rendimiento académico son muy bajas. A pesar de que se siguen confeccionando
instrumentos en el campo de la psicología cognitiva, la mayor aportación que se ha
hecho hasta el momento actual ha sido metodológica, la explicación que se sigue
dando al funcionamiento de los mecanismos internos de la inteligencia es la misma
que daban los psicometristas. Los dos enfoques estudian los mismos fenómenos con
diferentes procedimientos. La psicometría se centra en el estudio de las diferencias
entre los sujetos y el procesamiento de la información en las diferenciasovariación
de los estímulos. Ambas olvidaron explicar la parte contextual y experiencial de la
inteligencia y sobre todo, lo que es más importante, las interrelaciones entre la indi-
vidual, contextual y práctica (Sternberg, 1985).
En este contexto, la teoría triárquica de la inteligencia estaría dentro de lapers-
pectiva del procesamiento de la información, en el sentido de que lainteligencia indi-
vidual, según el autor, está compuesta por tres tipos de procesos básicos o elementales
ón).
(metacomponentes, componentes de rendimiento y de conocimiento, y adquisici
Sternberg (1977) propone el “análisis componencial” como método para descompo-

ner las tareas complejas en sus procesos más elementales porque este procedimiento
ayuda a procesar la información de las tareas complejas. y
Los tres modelos —psicométrico, piagetiano y procesamient o de la informa-
ción— comentados anteriormente son complementar ios más que excluyentes, por
dos razones. En primer lugar, porque los factores psicométricos se derivan de la va-
riación entre los sujetos, mientras que los procesos de la información se derivan de
las diferencias entre los estímulos que se le presentan a los sujetos. Así pues, aspectos
de la ejecución de una tarea que varían poco de un individuo a otro podrían ser fun-
damentales para la ejecución o realización de las tareas, pero esto se olvida en la psi-
cometría. Contrariamente, hay aspectos para la ejecución de la tarea que varían poco
de una a otra, pero podrían ser fuentes interesantes de diferencias individuales, sien-
do precisamente estas diferencias las que se han obviado en el procesamiento de la
información y sobrevalorado en la psicometría. En segundo lugar, la perspectiva pia-
getiana propone un factor diferente de la perspectiva psicométrica y del procesa-
miento de la información, que es el desarrollo evolutivo de la competencia intelec-
tual. Piaget explica rigurosamente el desarrollo cognitivo mediante procesos
(equilibrio, asimilación y acomodación), haciendo además una descripción exhausti-
va de dicha competencia en los diferentes estadios del desarrollo.
La dificultad radica en la aplicación directa de los métodos de la evaluación gené-
tica a la escuela, puesto que no están demasiado acordes con las exigencias de ésta,
aunque actualmente se han diseñado instrumentos de evaluación (llamados modelos
neopiagetianos) que recogen situaciones instruccionales (Lawson, 1975; Siegel y
Brainerd, 1978). La teoría triárquica de la inteligencia se ha confeccionado para pa-
liar algunas de las deficiencias de los modelos comentados y diseñar un modelo de
evaluación más acorde con las exigencias del futuro. La inteligencia se entiende
como proceso de adaptación propositiva, modelado o configuración y selección del
medio más relevante y pertinente con las necesidades del individuo. El carácter de
proposición de la inteligencia implica evaluar las funciones tal como el individuo las
utiliza en la planificación que hace a corto, medio y largo plazo para configurar la
adaptación con su medio real. Este sentido macroscópico de considerar la planifica-
ción es una diferencia fundamental de la evaluación triárquica y la de tipo tradicio-
nal. Otra diferencia radica en el hecho de incluir tareas y problemas relevantes para
la vida del sujeto, puesto que tests relevantes para sujetos de una determinada cultura
pueden no serlo para otros de cultura diferente; por ejemplo, cuando examinamos
las tareas recogidas en los tests tradicionales se observa con frecuencia que éstas tie-
nen poco interés y no despiertan casi ninguna motivación en los alumnos. Esto es
debido a que las actividades se han diseñado en situación de laboratorio, muy aleja-
das del mundo escolar y contextual del estudiante. A pesar de que Binet y Piaget
consideraron la importancia que tenía para el desarrollo de la inteligencia la relación
de ésta con el medio, no la evaluaron tal como se presenta en el ambiente del niño.
En cualquier caso, no se puede decir que las teorías actuales de evaluación de la
inteligencia no sirvan para evaluar la inteligencia a nivel individual, puesto que la
mayoría contempla las habilidades y mecanismos relacionados con el medio interno
del sujeto, olvidando como ya hemos señalado las funciones que relacionan el mun-
do interno con el contexto del individuo. Sin embargo, la inteligencia, tal como indi-
595
ca Sternberg, no funciona en el vacío, sino en estrecha interacción con un mundo

cuya complejidad es creciente. Así pues, los problemas que se presentan varían des-
de los completamente nuevos, que exigen procesos de insight o respuestas novedo-
sas, hasta los más familiares, cuya solución precisa automatizar la información. Estos
tres aspectos de la inteligencia (individual, experiencial y contextual) son los aspec-
tos que pretende evaluar el SA7.
IM. FUNDAMENTACIÓN TEÓRICA DE LA INTELIGENCIA TRIÁRQUICA
La teoría triárquica de la inteligencia pretende explicar las relaciones entre la inteli-

gencia y el mundo interno del individuo o mecanismos mentales subyacentes en la
conducta considerada inteligente (este tipo de inteligencia responde a la pregunta de
cómo se genera el comportamiento —subteoría individual o componencial—,, las
relaciones entre la inteligencia y la experiencia o aplicación de los mecanismos men-
tales para solucionar problemas que van desde los muy novedosos hasta los muy fa-
militares, relacionando la inteligencia con el mundo interno y externo (responde a la
pregunta cuándo el comportamiento es inteligente —subteoría experiencial—), y las
relaciones entre la inteligencia y. el mundo externo del individuo o uso de esos meca-
nismos mentales para lograr la adaptación al medio, planteando cuestiones acerca de
qué comportamientos son inteligentes, para quién y dónde (subteoría contextual)
(Sternberg, 1985). Véase el cuadro 24.1.
CUADRO 24.1. La teoría triárquica de la inteligencia

Subteoría componencial Subteoría experiencial Subteoría contextual
— Metacomponentes — Insighto novedad — Adaptación

— Componentes de rendimiento — Automatización — Configuración
— Componentes de conocimiento- — Selección
adquisición
o 55 5 5 5
El Sternberg triarchic abilities test (STAT) se ha diseñado para evaluar las tres sub-
teorías. Las habilidades generales que se han incluido en algunos de los subtests son
parecidas a las que aparecen en los tests convencionales, pero laforma interactiva de
evaluarlas es diferente. Se tiene en cuenta la capacidad del individuo para aprender,
más que los conocimientos previos. Los procesos de la subteoría contextual se han
dividido en dos partes que evalúan desde los procesos para hacer frente a la solución
de problemas completamente nuevos (novedad o insight) hasta procesos de rapidez
para interiorizar la información (automatización) (Sternberg, 1985, 1991a).
1.1. Componentes de la inteligencia individual

En esta subcategoría se incluyen tres tipos de componentes instrumentales que ayu-
dan a adquirir y procesar la información: metacomponentes que sirven para apren-
der a hacer las cosas, componentes de rendimiento que ayudan a planificar qué cosas
hay que hacer y componentes de conocimiento-adquisición que nos dicen cómo ha-
cerlas. Los componentes especifican el conjunto de mecanismos mentales que fun-
damentan la conducta inteligente de un individuo.
1.1.1. Metacomponentes
Los metacomponentes son los procesos de orden superior o ejecutivos que se usan
para planificar, dirigir y evaluar la conducta, entre los que se incluye:
a. Reconocimiento de la existencia de un problema; consiste en examinar con

cuidado la naturaleza del problema y la necesidad de resolverlo.
b. Definición de la naturaleza del problema; ésta obliga al sujeto a reconsiderar
el problema, simplificar y redefinir los objetivos. La definición de un problema juega
un papel fundamental en la inteligencia; por ejemplo, los niños y algunos adultos tie-
nen a veces serias dificultades no para resolver el problema, sino para darse cuenta de
que ha de ser resuelto.
c. Selección de los pasos necesarios para resolver el problema; consiste en gra-
duar las etapas de la tarea según su dificultad, contemplando diferentes alternativas
antes de llegar a la solución correcta. La selección de una estrategia combinando los
componentes de orden inferior es un aspecto esencial de la inteligencia por cuanto
que nos permite entender la ejecución inteligente de una tarea al igual que la eficacia
para emplear la estrategia elegida (Sternberg y Weil, 1980).
d. Combinación de los pasos dentro de una estrategia eficaz; para la solución
de un problema no sólo es necesario seleccionar los componentes adecuados, sino
que además hay que combinarlos de una forma eficaz, considerando el problema en
su totalidad y disponiendo los pasos de una manera lógica.
e. Representación de la información; el individuo selecciona una forma para
representar el problema. Las representaciones pueden ser mediante diagramas, ta-
blas o cualquier diseño que implique una representación múltiple.
f. Localización de las fuentes necesarias para la solución del problema; es el
componente que se utiliza para localizar diferentes fuentes y recursos, que además
permite realizar la solución del problema.
g. Supervisión de la solución; dicho componente consiste en la habilidad del
individuo para dirigir y controlar la naturaleza del problema, para seleccionar los
procesos a utilizar y la forma de representar el problema. Como estrategias que el
sujeto utiliza podemos citar las siguientes: implicarse activamente en la solución del
problema, justificar el esfuerzo, controlar la impulsividad y considerar la retroali-
mentación interna y externa.
h. Evaluación de la solución; después de llegar a la solución del problema, toda-
vía se impone hacer una evaluación cualitativa y apropiada de los resultados obtenidos.
El carácter interactivo de los metacomponentes hace que no se puedan evaluar ni

entrenar por separado. Dicha interactividad se puede comprobar por la naturaleza
compleja de las tareas, que exigen el uso de varios metacomponentes a la vez.
597
111.2. Componentes de rendimiento

Los componentes de rendimiento son procesos de orden inferior que ejecutan las
instrucciones de acuerdo a la planificacion implícita en los metacomponentes. Mien-
tras que los metacomponentes informan qué hacer, los componentes lo hacen. Estos
componentes son los que mejor se han evaluado en los tests tradicionales; sin embar-
go, es casi imposible saber el número de componentes que forma parte de cada una
de las tareas. Esto es interesante porque unos son más importantes que otros (Stern-
berg, 1984). Los componentes de rendimiento se trabajan en problemas y situacio-
nes prácticas que exigen el uso de procesos de razonamiento inferencial; los princi-
pales son los siguientes:
a. Codificación de los estímulos; es el proceso a través del cual el individuo

percibe los términos de un problema y accede a la información almacenada en su
memoria. En dicho proceso el individuo tiene en cuenta la información relevante y
desecha la irrelevante.
b. Inferencia de las relaciones entre los estímulos; proceso mediante el cual el
individuo descubre las distintas relaciones entre los estímulos.
c. Relaciones entre relaciones o mapping; es el proceso que se utiliza para des-
cubrir relaciones de orden superior entre relaciones de orden inferior. Este proceso
es esencial para solucionar los problemas de analogías.
d. Aplicación; es el proceso mediante el cual el individuo soluciona el proble-
ma o analogía según la relación inferida anteriormente.
e. Comparación; consiste en establecer comparaciones entre alternativas posi-
bles y decidir cuál es la idónea para la solución del problema.
Justificación; proceso utilizado para decidir cuál es la mejor respuesta que
lleva a la solución del problema, aunque ésta no sea la ideal.
Este tipo de componentes incluye los que aparecen en el razonamiento induc-

tivo.
11.13. Componentes de conocimiento-adquisición
Son procesos no ejecutivos que se emplean para aprender cómo resolver un proble-
ma y están controlados por los metacomponentes. Se trata de procesos individuales
que se usan para adquirir información nueva, recordar la información adquirida pre-
viamente y transferir lo aprendido a otro contexto. Estos componentes son esencia-
les para el aprendizaje, el uso del lenguaje y para el funcionamiento intelectual. Los
componentes de adquisición-conocimiento proporcionan los mecanismos mediante
los cuales se desarrolla el conocimiento básico. El aumento del conocimiento básico
permite aprender procedimientos más sofisticados y complejos para adquirir infor-
mación y esto a su vez ayuda a utilizar con mayor facilidad los componentes de ad-
quisición-conocimiento. Estos componentes facilitan el aprendizaje del vocabula-
rio. El hecho de tener un vocabulario cada vez más amplio, hace que se aumente el
conocimiento base y, consecuentemente, la capacidad para relacionar la información

nueva con la ya existente. Esto significa que existe un proceso de retroalimentación
entre el uso de los componentes y el conocimiento; es decir, los componentes llevan
al aumento del conocimiento base, por tanto, siempre que el individuo posea un ma-
yor nivel de conocimientos puede a su vez utilizar los componentes con mayor efi-
cacia. Los componentes de conocimiento-adquisición son los siguientes:
a. Codificación selectiva; implica el cambio de los datos irrelevantes de un tex-

to por los relevantes. Cuando la información nueva se presenta en un contexto natu-
ral, la que es relevante para alcanzar una meta determinada se mezcla con frecuencia
con la irrelevante. La tarea del sujeto es cambiar simplemente la información irrele-
vante por la relevante y fundamental para lograr la meta (Schank, 1980).
b. Combinación selectiva; implica combinar selectivamente la información co-
dificada a fin de integrarla de manera plausible en un todo. Cambiar simplemente la
información irrelevante por la relevante no es suficiente para generar nuevas estruc-
turas de conocimiento. Por tanto, uno debe saber cómo combinar la información
para organizarla adecuadamente en el esquema de pensamiento (Mayer y Greeno,
1972).
c. Comparación selectiva; supone la relación de la información nueva con la
adquirida anteriormente para dar significado a la información nueva.
El énfasis que se concede a los componentes de adquisición varía con respecto a

los enfoques de la psicología cognitiva, la cual acentúa sólo la importancia del cono-
cimiento ya adquirido y de la estructura de éste (Keil, 1984). Ambos enfoques —el
triárquico y el cognitivo— parecen ser complementarios en el sentido de que si uno
está interesado por saber las diferencias de ejecución entre expertos y novatos —en-
foque cognitivo— es obvio que tengamos también que considerar la cantidad y es-
tructura del conocimiento base —enfoque triárquico— de estos sujetos. Cuando
además nos interesa saber las diferencias en la forma en la que se adquiere ese cono-
cimiento básico, todavía con más razón tendremos que utilizar los componentes de
adquisición para averiguarlo.
n1L2. Procesos de la inteligencia experiencial

Esta subteoría mantiene que hay dos elementos del desarrollo del individuo que son
especialmente relevantes para evaluar y entrenar la inteligencia; éstos son la capaci-
dad para enfrentarse a situaciones novedosas y la capacidad para automatizar la in-
formación. La automatización nos permite interiorizar aprendizajes complejos con
componentes motores y cognitivos.
112.1. El 2nsight en la solución de tareas novedosas

Los procesos de autorregulación cognitiva se emplean cuando se quiere entender y
actuar de forma rápida y eficaz para resolver tareas y situaciones relativamente nue-
599
vas (Sternberg, 19864). El insight consiste en saber utilizar tres procesos psicológicos
mutuamente relacionados: codificación selectiva, combinación selectiva y compara-
ción selectiva (Davidson y Sternberg, 1986). La codificación selectiva implica enfo-
car el problema hacia lo relevante, ignorando los datos irrelevantes para la solución.
La combinación selectiva consiste en saber coordinar todas las unidades de informa-
ción disponibles para resolver el problema o la situación novedosa. La comparación
selectiva supone saber relacionar la información nueva con la ya disponible en el co-
nocimiento; el resultado de dicha comparación nos lleva a la solución creativa del
problema.
1.22. Procesamiento y automatización de la información

La automatización se refiere al cambio de lo consciente a lo subconsciente; así, por
ejemplo, cuando aprendemos a conducir, leer o un idioma nuevo, normalmente
transformamos la información controlada en automática. Las habilidades que per-
miten enfrentarse y resolver problemas novedosos y las que ayudan a automatizar lo
aprendido están estrechamente relacionadas. Esto significa que la capacidad supe-
rior para enfrentarse a lo nuevo permite llegar de forma rápida y efectiva a la auto-
matización. Y, al mismo tiempo, la capacidad superior de la automatización libera
más mecanismos mentales para tratar con la novedad. Por tanto, en la medida en que
un individuo automatice diferentes aspectos en una tarea o problema, podrá prestar
mayor atención a los aspectos más novedosos de la tarea. Estas dos facetas de la inte-
ligencia operan interactivamente con los otros aspectos de la teoría triárquica de la
inteligencia.
m3. La inteligencia práctica

La subteoría contextual intenta explicar la utilidad de los componentes de la intel:-
gencia en situaciones de la vida diara. Existen tres tipos de funciones (adaptación, se-
lección y configuración) o mecanismos mediante los cuales el sujeto se relaciona con
su entorno. Veamos cada una de ellas.
a. Adaptación: consiste en las modificaciones que experimenta el individuo en

orden a conseguir una mejor adaptación a su medio.
b. Selección: proceso consistente en buscar alternativas para lograr el camino
más adecuado para la adaptación. Cuando la adaptación no funciona, el individuo
considera otros componentes que le permitan adaptarse, aunque a veces la selección
no ofrece la alternativa ideal. , ara ]
c. Configuración ar del medio: implica
! modificac
: : ambiente
ión del o PREpara lograr , una
mejor adaptación del individuo consigo mismo. La configura ción o “modelado” re-
presenta una alternativa especialmente viable para la adaptaci ón cuando es imposible
abandonar el medio en el que se vive.
IV. EVALUACIÓN DE LOS COMPONENTES DE LA INTELIGENCIA
En este apartado hemos incluido los ítems recogidos en el $747, el cual pretende eva-
luar los mecanismos de la inteligencia individual del sujeto.
1v.1. Componentes de la modalidad verbal

Las preguntas que se incluyen evalúan las habilidades de comprensión verbal tradi-
cionalmente evaluadas por los tests de vocabulario (sinónimos y antónimos). La di-
ferencia de los problemas recogidos en el STATy los considerados en los tests verba-
les tradicionales radica en el hecho de que éstos evalúan el producto y no el proceso.
En cambio, desde la teoría triárquica se pretende evaluar dichas habilidades verbales
en el contexto en el que aparecen, puesto que sólo a través de éste se puede conocer
la capacidad para procesar la información (Sternberg, 1991b). Esto quiere decir que
el test evalúa la capacidad para aprender y no los conocimientos previos. Para la eva-
luación de éstos, el psicólogo de la educación dispone de otros instrumentos de me-
dida que se pueden utilizar conjuntamente. Las preguntas, tal como mostramos en el
siguiente ejemplo, son palabras sin sentido, cuyo significado se ha de contextualizar
en función del lugar que ocupan en el texto. Para ello, el sujeto ha de utilizar los
componentes de conocimiento-adquisición (codificación selectiva, combinación se-
lectiva y comparación selectiva), comentados anteriormente (Sternberg, 1991a).
Ejemplo de un ítem para evaluar el componente de modalidad verbal en niños de
10-12 años:
La depresión de 1929 no ocurrió repentinamente con el hundimiento de la bolsa y del

mercado, porque el “lazz” que precedió pareció despreocupado y despilfarrador. Los
años veinte vieron cómo los trabajadores se quedaron sin casas y comenzaron a emi-
grar de un sitio para otro y cómo los pequeños empresarios se vieron en bancarrota.
Lazz posiblemente significa:
a) economía b) años c) historia d) estilo de vida
1v2. Componentes de la modalidad cuantitativa

Las habilidades para tratar los números se han evaluado a través de tests de series de
razonamiento inductivo con modalidad de lenguaje numérica.
Ejemplo de un ítem para evaluar el componente de modalidad numérica en ni-
ños de 10-12 años.
Observa la siguiente serie y señala cuál es el número que sigue:

1, 3,6, 0, 16,
a. 18 hb: 1124 CHÓ2 d. 48

601
1V3. Componentes de la modalidad figurativa

Evalúan las habilidades de clasificación y de razonamiento analógico. La evalua-
ción de los alumnos de preescolar (4-6 años) se hace mediante la clasificación de
dibujos y la de los alumnos/as mayores con analogías figurativas parecidas a las de
Raven.
V. EVALUACIÓN DE LA INTELIGENCIA EXPERIENCIAL
Los problemas de este apartado evalúan la capacidad de pensar y solucionar proble-

mas de forma novedosa a través de tres modalidades de lenguaje. Las preguntas re-
cogen situaciones y problemas para detectar los procesos de insight (capacidad para
pensar divergentemente) y los de automatización.
v.1. Evaluación de los procesos de insight

v1.1. Novedad-modalidad verbal
Estos ítems evalúan la capacidad para resolver tareas novedosas de contenido
verbal.
Ejemplo de un ítem para evaluar la novedad verbal en niños/as de 8-9 años.
Si un perro pusiera huevos, ¿cuál de las alternativas siguientes podría ser la más
cierta?
Los perros podrían volar

Los cachorros podrían tener plumas
Los huevos podrían tener cola
Los cachorros podrían incubar
ES
Los pollos podrían ladrar.
v.12. Novedad-modalidad cuantitativa
Los ítems de este apartado evalúan la capacidad para hacer frente a situaciones nove-
dosas en una modalidad numérica. Los problemas que se usan son matrices con nú-
meros y símbolos. >. w
Ejemplo de un ítem para evaluar la novedad-modalidad cuantitativa en niños/as
de 6-7 años.
Los números de la tabla guardan una cierta relación. Abajo se te da algún tipo de in-
formación que te ayudará a completar la casilla que aparece con interrogante.
v.1.3. Novedad-modalidad figurativa

Las cuestiones de este apartado recogen problemas consistentes en completar series
figurativas de una forma nueva, de acuerdo a una regla que se ha de inducir previa-
mente. Las relaciones de mapping son esenciales para solucionar este tipo de series.
v2. Evaluación de los procesos de automatización

Los ítems recogidos para evaluar los procesos de la automatización de la informa-
ción contemplan la rapidez del sujeto para finalizar la tarea.
v2.1. Automatización-modalidad verbal

El sujeto ha de establecer dos categorías (vocales y consonantes) y decidir a cuál de
éstas pertenece una serie de palabras.
Ejemplo de un ítem para la automatización modalidad verbal para niños/as de
preescolar.
Marca la letra modelo tan pronto como puedas:

L.
AMIGAS
K "URI.
HSCIKSZ
v.22. Automatización-modalidad cuantitativa
Los ítems de este subtest exigen al examinando realizar juicios rápidos sobre la per-
tenencia o no de una serie de números a dos categorías (par e impar).
Evaluación de las habilidades de la inteligencia: teoría triárquica de la inteligenc
ia 603
Vv.23. Automatización-modalidad figurativa
Los problemas del test requieren que el examinando compare pares de figuras y diga
si el número de lados es igual o diferente.
VI. EVALUACIÓN DE LA INTELIGENCIA PRÁCTICA
La inteligencia práctica se refiere a las funciones y estrategias que el sujeto utiliza

para adaptarse, modelar y seleccionar el ambiente más adecuado para sus intereses.
Son funciones de las cuales se pueden servir los componentes cuando éstos operan
en el medio.
vL1. Inteligencia práctica-modalidad verbal

Estos ítems evalúan la inteligencia práctica mediante tareas verbales que recogen
problemas cotidianos cuya solución precisa el análisis detallado de los diferentes
datos.
Ejemplo de ítem para evaluar funciones de inteligencia práctica verbal en ni-
ños/as de 8-9 años.
A continuación aparece cierta información sobre una situación que se puede dar en tu
vida. Léela cuidadosamente y elige la solución que podría ser la verdadera.
El Sr. Sánchez se une a la protesta de que su estación de servicio no sea malvendida.
1. Laestación de servicio del Sr. García cobra más que la del Sr. Sánchez.
2. Ningún garaje cobra menos que el del Sr. Sánchez.
3. El garaje del Sr. Sánchez es el más ocupado de la ciudad.
vI2. Inteligencia práctica-modalidad numérica
La solución de los problemas de este apartado requiere razonar de forma cuantitati-

va ante problemas cotidianos. A
Ejemplo de ítem para evaluar funciones de inteligencia práctica numérica en n1-
ños/as de 10-12 años.
Le has prometido a una amiga hacerle unas galletas para su cumpleaños. La receta
dice que para dos docenas de galletas necesitas los siguientes ingredientes:
1 pastilla de mantequilla, 1 taza de azúcar, 1 huevo, 1 taza de harina y 1 taza de
nueces.
Tú tienes los siguientes ingredientes: 4 pastillas de mantequilla, 5 tazas de azúcar,

1 docena de huevos, 7 tazas de harina, 1 leg de chocolate y 3 tazas de nueces.
Si decides hacer galletas con nueces. ¿Cuántas puedes hacer usando la receta?
a. 3 docenas b. 4docenas c. 6docenas d. 8docenas
v13. Inteligencia práctica-figurativa

En este apartado se han incluido ítems que requieren habilidades de planificación
efectiva. La información se le presenta al sujeto en mapas o diagramas que represen-
tan la localización de diferentes partes de la ciudad. Los ítems incluidos en este apar-
tado recogen problemas y situaciones de la vida cotidiana a los cuales se ha de dar
una solución empleando procesos de razonamiento inferencial.
VII. EL FUTURO DE LA EVALUACIÓN DE LA INTELIGENCIA
Aun cuando el STAT ha supuesto un nuevo modelo de evaluación de la inteligencia,

al igual que el de Gardner (1983) y algunos otros (Feuerstein, 1978), se deben seguir
diseñando alternativas de evaluación que respondan a las exigencias culturales y
educativas de los individuos. A continuación vamos a señalar algunos principios que
se deberían contemplar en los nuevos métodos de evaluación.
Primero, las teorías y las tecnologías han de salir de los laboratorios e introducir-
se en el mundo real, tal como se presenta en la escuela y en la vida del sujeto. Esto no
significa que las teorías actuales de la inteligencia no sirvan, sino más bien que sólo
recogen y relacionan los mecanismos del mundo interno del individuo (de la inteli-
gencia individual). El error ha sido no considerar la relación de los mecanismos indi-
viduales con el mundo externo del individuo en el que éste funciona (Sternberg,
19864, 1986b, 1989). Segundo, los procedimientos de evaluación han de fundamen-
tarse en teorías sólidas de la inteligencia, principio que se descuidó en los primeros
modelos. La mayoría de los instrumentos se ha preocupado por mostrar largas listas
de datos sobre índices de validez y fiabilidad del instrumento, sin preocuparse de la
fundamentación teórica. Los tests de los primeros tiempos se orientaron más a resal-
tar las diferencias individuales que a validar la teoría sobre la que fundamentar los
problemas que recogían. Tercero, hay que ampliar el campo de la evaluación de la in-
teligencia. Ésta es la línea en la que está trabajando Gardner (1983), quien ha incluido
en su instrumento de medida siete tipos de inteligencia (musical, lógico-matemática,
lingúística, espacial, cinestésica, interindividual e intraindividual). Cuarto, se ha de
enfatizar la evaluación de los procesos que subyacen en la inteligencia, en la misma
línea que lo hizo Guilford. Sin embargo, en vez de ocuparnos en identificar tantos
procesos, hemos de cuidar la influencia e interacción que se produce entre los dife-
rentes componentes de adquisición-conocimiento que el sujeto posee, porque esto
nos da una información sustanciosa para entender cómo varían las estructuras del
pensamiento. Quinto, no debemos descuidar la cara práctica de la inteligencia, como
Evaluación de las habilidades de la inteligencia: teoría triárquica de la inteligenc
ia 605
ya apuntó Charlesworth (1979), porque en el mundo académico hay estudiantes con

una capacidad extraordinaria para aprender y resolver tareas en un contexto conven-
cional, como es el de la instrucción, pero tienen dificultad cuando intentan aplicar
esas capacidades para lasolución de problemas de su vida cotidiana. Y, al revés, nos
encontramos con estudiantes muy buenos para moverse en el mundo real, pero que
fracasan cuando tienen que resolver tests académicos. Por esta razón no debemos
descuidar tests que sean válidos para ambos tipos de individuos. Sexto, se debe in-
cluir la evaluación de los procesos de insight, puesto que el individuo tiene que resol-
ver los problemas nuevos que se encuentra con mucha frecuencia en contextos mue-
vos. El insight no debe ser entendido como creatividad, sino más bien como esa
capacidad que el sujeto necesita para pensar en sistemas no convencionales. Los
ítems de estos tests han de evaluar directamente lo que tradicionalmente sólo se ha
evaluado indirectamente con los tests conocidos como de creatividad. Séptimo, los
métodos de evaluación han de contemplar programas de entrenamiento para resti-
tuir los fallos detectados y mejorar los procesos que no funcionen adecuadamente.
El modelo que más ha cuidado la evaluación y entrenamiento de forma simultánea
ha sido el de Feuerstein (1878, 1980). Feuerstein ha diseñado el Programa de Enri-
quecimiento Instrumental para desarrollar las funciones cognitivas o prerrequisitos
de la inteligencia; además del programa existe el test Learning potential assessment
device (LPAD) [Evaluación dinámica del potencial de aprendizaje] para evaluar el po-
tencial de aprendizaje o capacidad del estudiante para beneficiarse del aprendizaje
formal e informal.
La teoría triárquica tiene también su programa de entrenamiento conocido
como el Programa de la Inteligencia Aplicada. El objetivo es favorecer el desarrollo
de los componentes y funciones de la teoría triárquica de la inteligencia (Sternberg,
1986b). Para los niños se ha confeccionado otro programa, la inteligencia práctica
aplicada a la escuela, orientado a enseñar a los alumnos a aplicar los componentes de
la inteligencia en la escuela. En este modelo se ha contemplado el estilo de pensa-
miento del estudiante, lo cual permite adaptar la enseñanza a las peculiaridades del
alumno (Sternberg y cols., 1991b; Beltrán, Pérez y Prieto, 1992).
Para finalizar quisiéramos hacer una serie de puntualizaciones. La teoría triár-

quica de la inteligencia especifica los procesos mentales que utiliza el individuo para
actuar y resolver problemas, identifica los factores contextuales que afectan a la apli-
cación de dichos procesos para la solución de problemas inmediatos y la transferen-
cia de habilidades a nuevos problemas. La subteoría componencial recoge los proce-
sos cognitivos básicos que se utilizan para adquirir y aplicar el conocimiento a la
solución de todo tipo de problemas. La subteoría experiencial especifica la relación
entre la inteligencia, tal como se manifiesta en una situación O tarea, y la cantidad de
experiencia con la situación. Esta subteoría viene a decir que una tarea evalúa la inte-
ligencia en la medida que exija una o ambas aptitudes: la capacidad para hacer frente
a nuevos tipos de tareas y exigencias contextuales y la capacidad para automatizar la
información. La inteligencia se pone a prueba cuando el individuo trata de hacer
frente a un problema nuevo, lo cual exige procesos de autorreflexión, O cuando está
automatizando una habilidad aprendida. La subteoría contextual —aplicación de los
mecanismos intelectuales al medio para adaptarse a éste— significa que la inteligen-
cia depende del individuo y del marco sociocultural en el que viva; es decir, un com-
portamiento inteligente para unos puede no serlo para otros. De acuerdo con esta
subteoría el individuo puede elegir entre las siguientes alternativas: adaptarse o cam-
biar para enfrentarse mejor a las exigencias del ambiente, configurar o cambiar el
ambiente para adaptarlo mejor a las necesidades de uno y optar por un ambiente que
responda mejor a las necesidades. La elección inteligente dependerá de las aptitudes,
necesidades y relación con la situación de cada persona. Además, la subteoría prácti-
ca propone que el contexto afecta a la cognición en el sentido que apuntaba Vigotski.
Esto significa que, aunque los mismos procesos componenciales se apliquen a dis-
tintos tipos de contenidos con resultados diferentes, el rendimiento en un campo de-
terminado depende de la experiencia, motivación e interacción del individuo con ese
campo.
Hay un test de papel y lápiz que pretende evaluar cuatro áreas (componentes O
habilidades generales, procesos para enfrentarse a situaciones y problemas novedo-
sos, procesos de automatización de la información e inteligencia práctica) del proce-
samiento de la información en las tres formas diferentes en las que el individuo re-
presenta dicha información (verbal, cuantitativa y figurativa). Las habilidades
generales o componentes son similares a las recogidas en los tests convencionales de
inteligencia y evalúa la relación de la inteligencia con el mundo interno del sujeto.
Las tareas recogidas en el área referente al procesamiento de la información de ma-
nera novedosa evalúan la relación de la inteligencia del individuo con experiencias
nuevas (2nsight). Los problemas del área o dominio de la automatización evalúan la
relación de la inteligencia con situaciones muy familiares. Y las situaciones y proble-
mas recogidos en el área de la inteligencia práctica evalúan la relación de la inteligen-
cia con el mundo externo del individuo (inteligencia experiencial). La contextual se
evalúa en dos secciones separadas porque el individuo emplea procesos distintos
cuando se encuentra con situaciones completamente nuevas a cuando se encuentra
con situaciones totalmente familiares (Sternberg, 19914). El STAT puede ser una gran
aportación para evaluar más ampliamente la inteligencia y pensamos que ayudará a
predecir y diagnosticar las funciones de la inteligencia de los estudiantes dentro de su
ambiente escolar.
Beltrán, J., Pérez, L. y Prieto, M. D. (1992). La inteligencia práctica aplicada a la escuela (ver-
sión experimental). Murcia. ICE Universidad de Murcia.
Binet, A. y Simon, T. (1905). Methodes nouvelles pour le diagnostic du niveau intellectuel des
anormaux. L”Année Psychologie, 11, 191-244.
Binet, A. y Simon, T. (1916). The development of intelligence in children. Baltimore, M. D.
Williams y Wilkins.
Charlesworth, W. R. (1979). Ethology: Understanding the other half of intelligence. En
Evaluación de las habilidades de la inteligencia: teoría triárquica de la inteligencia 607
M. Cranich, K. Koppa, W. Lepenies y D. Ploog (dirs.), Human ethology: Claims and li-
mits of a new discipline. Cambridge. Cambridge University Press.
Davidson, J. E. y Sternberg, R. (1986). The role of insight in intellectual giftedness. Gifted
Child Quarterly, 28, 58-64. ]
Feuerstein, R. (1978). The Learning Potential Assessment Device (LPAD). Ulinois. Scott, Fo-
resman and Co.
Feuerstein, R. (1980). Instrumental Enrichment Program. Vlinois. Scott, Foresman and Co.
ee H. (1983). Frames of mind: The theory of multiple intelligences. Nueva York. Basic
ooks.
Guilford, J. P. (1967). The nature of human intelligence. Nueva York. MacGraw-Hill [La
naturaleza de la inteligencia humana, Barcelona, Paidós, 1986].
Guilford,J.P. (1982). Cognitive psychology”s ambiguities: Some suggested remedies. Pycho-
logical Revier, 89, 48-59.
Hunt, E. B., Frost, N. y Lunnenborg, C. E. (1973). Individual differences in cognition. En
G. Bower (dir.), The psychology of learning and motivation (vol. VII). Nueva York. Aca-
demic Press.
Keil, F. C. (1984). Transition mechanisms in cognitive development and the structure of
AS En R. Sternberg (dir.), Mechanisms of cognitive development. San Francisco.
reeman.
Lawson, A. (1975). Developing formal thought through biology teaching. American Biology
Teacher, 37, 411-429.
Mayer, R. y Greeno, J. G. (1972). Structural differences between learning outcomes produ-
ced by different instructional methods. Journal of Educational Psychology, 63, 165-173.
McDermott, P. (1985). Multidimensional assessment of children. Cleveland. The Psychologi-
cal Corporation.
Newell, A. y Simon, A. $. (1972). Human problem solving. Englewood Cliffs. Prentice Hall.
Piaget, J. (1936). La naissance de l'intelligence chez P'enfant. Neuchátel. Delachaux y Niestlé
[El nacimiento de la inteligencia en el niño, Barcelona, Crítica, 1990].
Piaget, J. (1947). La psychologie de l'intelligence. París. Librairie Armand Collin [La psicolo-
gía de la inteligencia, Barcelona, Crítica, 1989].
Rose, A. M. (1980). Information processing abilities. En R. E. Snow, P. A. Federico y W. E.
Montague (dirs.), Aptitude, learning and instruction (vol. 1). Hillsdale. Lawrence Erl-
baum Associates.
Schank, R. (1980). How much intelligence is there in artificial intelligence. [ntelligence, 4,
1-14.
Siegel, L. S. y Brainerd, C. J. (1978). Alternatives to Piaget: Critical essays on the theory. Nue-
va York. Academic Press [Alternativas a Piaget: ensayos críticos sobre la teoría, Madrid,
Pirámide, 1982].
Spearman, C. (1904). General intelligence, objectively determined and measured. American
Journal of Psychology, 15, 201-293.
Spearman, C. (1927). The abilites of man. Nueva York. MacMillan. :
Sternberg, R. (1977). Intelligence, information processing, and analogical reasoning: The com-
ponential analysis of human abilities. Hiillsdale. Lawrence Erlbaum Associates.
Sternberg, R. (1984). What cognitive psychology can (and cannot) do for test development.
En B.S. Blake y J. Mitchell (dirs.), Social and technical issues in testing: implications for test
construction and usage. Hillsdale. Lawrence Erlbaum Associates.
Sternberg, R. (1985). Beyond IQ: A triarchic theory of human intelligence. Nueva York.
Cambridge University Press. sa
Sternberg, R. (19864). The future of intelligence testing and training. £ ducational Measure-
ment: Issues and Practice, 5, 19-22.
Sternberg, R. (19865). Intelligence applied. Nueva York. Harcourt brace Jovanovich, Pu-
blishers.
Sternberg, R. (1989). The tyranny of testing. Learning, 89, 60-63. Sem

Sternberg, R. (19914). Theory-based testing of intellectual abilities: rationale for the triarchic
abilities test. En H. A. Rowe (dir.), Intelligence: Reconceptnalization and measurement.
Hillsdale. Lawrence Erlbaum Associates. ASA
Sternberg, R. (19916). Practical intelligence for school. New Haven. Yale University.
Sternberg, R. y Weil, E. M. (1980). An aptitude-strategy interaction in linear syllogistic rea-
soning. Journal of Educational Psychology, 72, 226-234.
Terman, L. M. y Merril, M. A. (1960). Stanford-Binet intelligence scale. Boston. Houghton-
Mifflin.
Thurstone, L. L. (1938). Primary mental abilities. Chicago. University of Chicago Press
[P.M.A. Aptitudes mentales primarias, Madrid, TEA, 1987].
Vernon, P. E. (1971). The structure of human abilities. Londres. Methuen.
Wagner, R. K. y Sternberg, R. (1984). Alternative conceptions of intelligence and their impli-
cations for education. Review of Educational Research, 54, 179-223.
Prieto, M. D. y Sternberg, R. (1990). Dos caras de una misma moneda: la inteligencia. Boletín
de Psicología, 28, 29-58.
Prieto, M. D. y Sternberg, R. (1991). La teoría triárquica de la inteligencia: un modelo que
ayuda a entender la naturaleza del retraso mental. Revista Interuniversitaria de Forma-
ción del Profesorado, 11,77-93.
Sternberg, R. (1985). Beyond IQ: A Triarchic Theory of Human Intelligence. Nueva York.
Cambridge University Press (traducción al castellano DDB, 1990).
Sternberg, R. y Salter, W. (1982). Concepciones de la inteligencia y su medición. En R. Stern-
berg (dir.), La naturaleza de la inteligencia y su medición. Madrid. Paidós
25. EVALUACIÓN DEL POTENCIAL DE APRENDIZAJE
MARÍA DOLORES PRIETO
Il. INTRODUCCIÓN
La evaluación del potencial de aprendizaje es un modelo orientado a evaluar la mo-

dificabilidad y capacidad del alumno para aprender. La finalidad del examinador es
implicar al alumno activamente en el proceso de aprendizaje que se sucede durante la
evaluación. El examinador es el mediador activo que dirige y modifica la interacción
con el examinando mediante situaciones de tests. El evaluador desempeña un papel
activo en la organización de la información. El resultado de este proceso de evalua-
ción es la modificabilidad o cambio del funcionamiento cognitivo del sujeto. Ésta se
produce dentro del modelo test-entrenamiento-test.
Los antecedentes de la evaluación del potencial de los sujetos con dificultades de
aprendizaje se sitúan en la década de los años veinte cuando algunos psicólogos ya
buscaban formas alternativas de evaluar la inteligencia de los alumnos que presenta-
ban problemas de aprendizaje. Sin embargo, en las medidas diseñadas permanecía el
concepto de inteligencia como algo estático e inmodificable. Las teorías de Vigotski
vienen a cuestionar los tests de evaluación de la inteligencia, sobre todo por no con-
siderar la capacidad oculta del sujeto para beneficiarse de las experiencias de apren-
dizaje cuando éstas son mediadas por el adulto o por un compañero aventajado.
Plantea el poder de la interacción y del aprendizaje en la misma situación de examen.
Este nuevo enfoque ha llevado a diferentes autores al diseño de modelos orientados
a evaluar dicho potencial. Uno de los procedimientos más conocidos es el desarro-
llado por Feuerstein y sus colaboradores.
En primer lugar, se hace una breve revisión histórica de la evaluación del potencial
y de algunos de los modelos utilizados actualmente en el campo de la psicología. En
segundo lugar, se aborda el estudio del modelo de Feuerstein y de las innovaciones
que el mismo ha supuesto en el campo de la evaluación psicológica; el autor funda-
menta su modelo de evaluación (Learning Potential Assessment Device —LPAD—
[Evaluación dinámica del potencial de aprendizaje) en la teoría de la Modificabilidad
Estructural Cognitiva (TMEC). En tercer lugar, se especifican los objetivos de la LPAD;
objetivos orientados a evaluar las deficiencias de los componentes de la inteligencia, a
enseñar contenidos, habilidades y estrategias para acceder al aprendizaje. En cuarto
lugar, analizamos los parámetros de la interacción psicológica que hace posible la mo-
dificabilidad del potencial de aprendizaje; Feuerstein basa la interacción en la Expe-
riencia de Aprendizaje Mediado (EAM). Al evaluador como experto le corresponde la
organización de todas las experiencias de aprendizaje para hallar potencial oculto y en
función de éste diseñar la instrucción. En quinto lugar, se hace una revisión de los ins-
610 María Dolores Prieto
trumentos del modelo, clasificándolos según el nivel de dificultad de los procesos que
pretenden evaluar y la complejidad que encierran. La selección de los instrumentos
más adecuados para un sujeto determinado supone una gran especialización en el
modelo de evaluación, para elegir sólo aquellos que mejor respondan a las caracterís-
ticas propias del sujeto.
Il. HISTORIA DE LA EVALUACIÓN DEL POTENCIAL DE APRENDIZAJE
En la historia de la evaluación dinámica se pueden distinguir tres grandes períodos:

1920-1940, 1950-1960 y 1970-1980.
111. Antecedentes de la evaluación dinámica (1920-1940)

En 1920 algunos psicólogos manifestaron su disconformidad con los métodos que
se utilizaban para evaluar el nivel de inteligencia de los sujetos deficientes. Así, por
ejemplo, Bucckingham (1921), Dearborn (1921) y Penrose (1934) creen que eltest
ideal para estudiar la deficiencia mental ha de evaluar la capacidad de estos sujetos
para aprender y no el mero producto. Hacia 1927, De Weerdt sugirió utilizar dife-
rentes instrumentos —no sólo el test de inteligencia— para investigar cómo aumen-
tar la capacidad de los escolares para lograr una mejora en sus rendimientos. En sus
estudios demostró la eficacia de otras medidas para la predicción y clasificación de
los sujetos deficientes. Esta autora cree que la puntuación cuantitativa no es suficien-
te; de hecho, en la práctica se necesita un test dinámico como medida de la capacidad,
a fin de mejorarla con un entrenamiento específico.
12. Diseños experimentales (1950-1960)

Durante la década de los años cincuenta se realizaron algunos estudios tratando de
estimar los efectos de la enseñanza en la evaluación. La mayoría de estos estudios
tuvo lugar en Gran Bretaña (James, 1953; Yates, 1953; Dempster, 1954; Vernon, 1954;
Wiseman, 1954). Estos investigadores no estaban interesados en encontrar alternati-
vas para la mejora de la inteligencia, o su evaluación, sino más bien en entrenar a los
alumnos para pasar los exámenes del British Eleven Plus. Sin embargo, hacia 1960 se
realizan algunos intentos aislados orientados a diseñar medidas de aprendizaje que
evaluaran la educabilidad. Éstos se concretaron en los tests, administrados en sesio-
nes de test-enseñanza-retest.
Schuman (1960) diseñó un procedimiento para niños de 5 a 11 años con retraso
severo, creyendo que la educabilidad de los sujetos se podía inferir a partir de las res-
puestas que éstos daban a situaciones distintas de aprendizaje, las cuales exigían un
conjunto de habilidades. Se evaluó a un grupo de sujetos con el modelo test-entrena-
miento-test y después de una serie de sesiones se determinaron los materiales apro-
piados e idóneos para tal evaluación. La batería final de Schuman incluyó cinco tests
Evaluación delpotencial de aprendizaje
611
no verbales. El resultado de la batería fue hallar el coeficiente intelectual (CI) de los

sujetos para diferenciar los deficientes de los normales. La estabilidad del CI era ma-
yor que la de otros tests.
A lo largo de los años sesenta se hicieron varias experiencias de este género, pero
en todas subyacía el concepto tradicional de inteligencia. Así pues, en la mayoría de
los estudios se llegaba a la conclusión de que la capacidad para aprender era distinta
de la inteligencia. Zigler y Butterfield (1968) estudiaron los efectos que algunos pro-
gramas habían tenido en el aumento de la inteligencia de los sujetos. Estos autores
creyeron que el Cl era el resultado de tres factores: procesos cognitivos, logros extra-
escolares y motivación. En sus investigaciones consideraron la motivación como in-
grediente esencial para optimizar los resultados del aprendizaje. Sus resultados, con
grupos experimental y control en preescolar, demostraron la incidencia de los facto-
res motivacionales en el aumento del Cl.
Quizás el problema de estos años fue la imprecisión con la que se abordó el tema.
Además, había una excesiva preocupación por diseñar modelos de evaluación sin
una teoría que los fundamentara. Consecuentemente, esto no tenía demasiada apli-
cación en la escuela.
113. Diseño de teorías, instrumentos y modelos de evaluación dinámica

(1970-1980)
En los años setenta, Feuerstein, Budoff, Campione y Brown dan a conocer sus tra-
bajos sobre evaluación dinámica y se empieza a conocer el concepto de “zona de
desarrollo próximo” de Vigotski (1978), incluido en el modelo de evaluación de
Feuerstein y en el de Campione y Brown. Este tipo de metodología de evaluación se
empezó a divulgar en Estados Unidos con la promulgación de la legislación sobre la
integración de los sujetos con necesidades educativas especiales. Estos cambios le-
gislativos se materializaron en instrumentos orientados a considerar la evaluación y
el entrenamiento de la misma de una forma más dinámica, entendiendo que la inteli-
gencia es una entidad modificable; esto hace que a partir de estos años se produjeran
cambios en la concepción de la medida de la inteligencia. Los cambios dieron lugar a
una cierta polémica sobre la posibilidad o no del entrenamiento de los procesos sub-
yacentes en la inteligencia. Esta polémica ha llevado a una producción abundante de
publicaciones y programas orientados al entrenamiento de la misma. La abundancia
de programas no significa que el problema está resuelto, ya que muchos de éstos ca-
recen de una base teórica sólida e incluso tienen problemas de validez a la hora de
implementarlos en el aula.
Uno de los primeros innovadores en la evaluación y entrenamiento de lainte-
ligencia ha sido Reuven Feuerstein, cuyo modelo está enfocado al enriquecimiento
de los procesos de la inteligencia. Este autor plantea la necesidad de diseñar un
método de evaluación dinámica que refleje el nivel de funcionamiento cognitivo
de los sujetos con necesidades educativas especiales. Para él los tests psicométricos
se han preocupado excesivamente por la cuantificación del producto, descuidando
el proceso que el sujjeto sigue en la solución de los problemas;
) esto presenta difi-
cultades a la hora de diferenciar la capacidad de funcionami ento de los sujetos del
nivel manifiesto de dicho funcionamiento (Feuerstein, 1970, 1978; Feuerstein y

Rand, 1977).
El modelo de Budoff sobre el potencial de aprendizaje (PA) se basa en la entrena-
bilidad de la inteligencia o capacidad para beneficiarse de la experiencia. El método
está orientado a examinar la capacidad general de razonamiento del individuo. Para
este autor es importante minimizar durante el proceso de la evaluación las desventa-
jas de los sujetos que no han tenido oportunidades educativas. El paradigma del PA
pretende ofrecer a los sujetos un entrenamiento en una serie de experiencias relacio-
nadas directamente con los procesos de razonamiento. Este entrenamiento permite
al sujeto aprender y aplicar un amplio abanico de habilidades necesarias para lasolu-
ción de problemas. El modelo de Budoff viene a sustituir al modelo tradicional
orientado al producto. En su procedimiento se incluyen los tres momentos de la
evaluación dinámica: test-entrenamiento-test.
En el potencial de aprendizaje se han incluido cuatro instrumentos de medida:
Diseño de cubos de Khos (Khos, 1923; Budoff, 1967, 1969; Budoff y Friedman, 1964),
Matrices progresivas de Raven (Raven, 1956, 1958; Corman y Budoff, 1973), Test de
series del potencial de aprendizaje (Corman y Budoff, 1973) y el Test de asociación
de palabras y dibujos (Gimon, Budoff y Corman, 1974), que fue una modificación
del Test de inteligencia semántica de Rulon y Schweiner (1953). El trabajo con el po-
tencial de aprendizaje se inició con el fin de ofrecer un modelo de evaluación, más
adecuado y asequible que el Cl, para discriminar a los sujetos con necesidades educa-
tivas especiales de los normales. Budoff demostró con sus resultados que estos ins-
trumentos eran idóneos para evaluar la inteligencia, entendiendo ésta como la capa-
cidad para aprender y beneficiarse de la experiencia.
El método diseñado por Campione y Brown está enfocado a identificar y descri-
bir las conductas (puntos fuertes y débiles) de los estudiantes que presentan proble-
mas en su aprendizaje, a fin de ofrecerles un programa de entrenamiento que palie en
cierta medida dichos problemas. Estos autores creen que los métodos de evaluación
han de orientarse a estimar los procesos psicológicos básicos necesarios para la ad-
quisición de la información incluidos en los tests tradicionales de inteligencia (Cam-
pione y Brown, 1987). Muchos niños no disponen en su bagaje cognitivo de estos
procesos exigidos en su escolaridad; sin embargo, con el entrenamiento adecuado
los pueden adquirir.
Para Brown y Campione las técnicas de entrenamiento pueden ser diversas,
siempre que haya un control exhaustivo del rendimiento. Así por ejemplo, el entre-
namiento de los sujetos puede consistir en modificar el formato del test (Carlson y
Wield, 1978, 1979), ofrecer una instrucción directa en la forma de resolver proble-
mas (Budoff, 1974), o intentar evaluar directamente un conjunto de procesos cogni-
tivos definidos previamente como objetivo de la evaluación (Feuerstein, 1978). El
objetivo final de la evaluación es ofrecer un programa que potencie al máximo el po-
tencial oculto de los sujetos. El modelo de Brown y Campione está fundamentado
en la teoría de Vigotski sobre la mediación del aprendizaje a través de las interaccio-
nes sociales. Los niños experimentan las actividades cognitivas en situaciones socia-
les y las interiorizan gradualmente. En estas interacciones el niño y el adulto trabajan
de forma conjunta, éste sirve de mediador y modelo. En la medida en que el niño
adquiere un cierto nivel de capacidad, el adulto ejerce menos de mediador. Esto hace
Evaluación del potencial de aprendizaje 613
que se aumente la independencia del sujeto. El papel del adulto es el de mediador,

crítico y experto que guía al niño hacia el logro de los objetivos diseñados en la eva-
luación. En la interacción se desencadenan procesos de autorregulación y retroali-
mentación (Prieto, Rodríguez y Bermejo, 1991). Los objetivos del método de
Brown y Campione se pueden resumir en los siguientes puntos:
a. Identificar los estudiantes que presentan problemas o dificultades;

b. Analizar su trayectoria académica en términos de habilidades presentes y
ausentes en el funcionamiento cognitivo;
Aplicar métodos adecuados de evaluación de la competencia del sujeto;
a”. Implementar programas idóneos para superar las deficiencias y desarrollar
el potencial cognitivo;
e. Lograr la transferencia de habilidades, procesos y estrategias al currículo.
TIL. CONSIDERACIONES GENERALES DE LA EVALUACIÓN DINÁMICA

DEL POTENCIAL DE APRENDIZAJE (EDPA)
La evaluación dinámica del potencial de Feuerstein es un conjunto de instrumentos

de evaluación y entrenamiento de la inteligencia. Fuerstein orienta su modelo a la
evaluación del potencial de los sujetos que presentan problemas de aprendizaje. El
modelo de evaluación de Feuerstein es dinámico en el sentido de que el examinador
interactúa directamente con el sujeto, intentando hallar su potencial de aprendizaje o
capacidad oculta para aprender (Feuerstein, 1978). Él cree que la mayor parte del
aprendizaje que ocurre en la infancia es mediado por los padres y/o la persona en-
cargada de la educación del niño. Por tanto, el mediador es la persona que ayuda al
niño a compensar de algún modo las deficiencias del ambiente y las propias del suje-
to. La evaluación de dicho potencial se hace teniendo en consideración una serie de
componentes cognitivos, factores emotivo-motivacionales, operaciones mentales y
componentes metacognitivos (Feuerstein, 1980). El autor fundamenta su modelo de
evaluación en su Teoría de la Modificabilidad Estructural Cognitiva (IMEC) y en la
Experiencia del Aprendizaje Mediado (EAM). Opina que en un ambiente rico en
oportunidades educativas y culturales, el sujeto tiene mayores posibilidades de desa-
rrollar su potencial. Por el contrario, cuando el aprendizaje mediado no ocurre de
forma normal, al niño se le priva de una serie de oportunidades que le impiden desa-
rrollar todo su potencial. Esto hace que no se beneficie de la cultura y se vea dismi-
nuido su potencial de aprendizaje (Feuerstern, 1978).
Los orígenes de la fundamentación teórica de este modelo hay que buscarlos en
Vigotski (1978), quien habla de un desarrollo real de la persona —capacidad para lo-
grar un aprendizaje por sí mismo— y de un desarrollo potencial —capacidad para
alcanzar un aprendizaje con la ayuda de los demás. Así, el modelo de Feuerstein
consiste en favorecer el potencial mediante la interacción entre estímulos (E), media-
dor (M), organismo (O) y respuesta (R). El mediador es la persona adulta encargada
de la educación del niño. A él le corresponde evaluar la capacidad oculta de aprendi-
zaje proporcionando, organizando y presentando experiencias de aprendizaje al su-
jeto. Éste recibe dos tipos de estimulaciones; por una parte, todos los estímulos (E)
que le vienen desde el exterior y, por otra, las experiencias de aprendizaje estructura-
das y organizadas que le proporciona el evaluador (M). Como resultado de esta esti-
mulación tenemos la conducta o respuestas (R). Cuando éstas son inadecuadas, la
función del mediador (M) consiste en proporcionar el feedback necesario durante la
evaluación para que el sujeto considere sus errores o respuestas no adecuadas. En di-
cha evaluación el profesor —como facilitador de aprendizaje— ayudará al alumno a
desarrollar su potencial a través de la organización y secuenciación de las experien-
cias de aprendizaje o problemas y actividades de los tests.
Así pues, desde la perspectiva de la evaluación dinámica, el sujeto es considerado
como un ser activo con capacidad para registrar, seleccionar, procesar y comunicar
los estímulos de su medio interno y externo; el individuo es un sistema abierto y sus-
ceptible a las influencias que pueden producir cambios estructurales en su funciona-
miento cognitivo (Jensen y Feuerstein, 1987). Por tanto, el verdadero sentido de la
EDPA es evaluar la susceptibilidad del cambio de la estructura cognitiva. El resultado
de la evaluación dinámica no es un repertorio de respuestas a la manera de los tests
de inteligencia clásicos, sino más bien trata de identificar las causas por las cuales el
sujeto no puede acceder a los procesos superiores de la inteligencia; simultáneamen-
te, se evalúa el tipo, cantidad y cualidad de la intervención necesarios para lograr la
modificabilidad de la estructura cognitiva del sujeto.
IV. OBJETIVOS DE LA EVALUACIÓN DINÁMICA
La evaluación dinámica del potencial de aprendizaje tiene como finalidad evaluar y

controlar los procesos utilizados por los sujetos en la solución de problemas y ta-
reas. El objetivo es centrarse en los componentes de la inteligencia, los procesos me-
tacognitivos —control de la impulsividad y planificación de la conducta— e incluso
aspectos motivacionales. Los objetivos específicos los podemos resumir en los si-
guientes puntos:
a. Desarrollo y mejora de las funciones cognitivas deficientes. La función cogni-

tiva es, a juicio de Feuerstein, el componente básico de la inteligencia del individuo;
es el prerrequsito necesario para pensar y actuar inteligentemente. Cuando estas
funciones no aparecen en el bagaje cognitivo del sujeto porque presenta un retraso
mental debido a déficit genéticos y/o ambientales, la evaluación se orienta a enseñar-
las y a evaluar el potencial oculto para adquirirlas. Cuando las funciones aparecen,
pero deficitarias, el examen hay que enfocarlo a la mejora o restitución de los déficit.
Y cuando los sujetos presentando los componentes cognitivos en su repertorio no
los usan adecuadamente porque existe una falta de necesidad e incluso cierta apatía,
el examen se orienta a crear y favorecer el sistema de necesidades del sujeto. Feuers-
tein ha utilizado la analogía del computador para secuenciar las funciones en las tres
fases en las que se produce el procesamiento de la información (entrada, elaboración
y salida). A modo de ejemplo hemos recogido en el cuadro 25.1 las funciones cogni-
tivas correspondientes al test de organización de puntos.
Evaluación del potencial de aprendizaje
615
CUADRO 25.1. Funciones cognitivas del test de organización de

puntos
xXAo_nxAX?£?»vó9%46%4%4% 4641
I. Recoger toda la información necesaria para la solución de los problemas
del test
(FASE DE INPUT)
— Usar un plan para no olvidar algo importante: hacerlo explícito incluso repitiendo
los pasos en voz alta (exploración sitemática).
— Describir las figuras y sus relaciones en el espacio (referentes espaciales).
— Describir las figuras por sus características relevantes (instrumentos verbales

precisos).
II. Usar la información que hemos recogido en la fase anterior (FASE DE ELABORACIÓN)
— Usar sólo la información que es pertinente para la solución de los problemas (in-
formación relevante).
— Usar siempre la lógica para justificar cualquier respuesta (razonamiento lógico).
— Pensar en alguna otra solución diferente a la dada y tratar de imaginar qué ocurri-
ría si se eligiera una u otra (pensamiento hipotético).
— Diseñar un plan que incluya todos los pasos necesarios para lograr los objetivos
(conducta de planificación).
IL... Expresar la solución del problema (FASE DE SALIDA)
— Pensar bien la respuesta antes de comunicarla inmediatamente; pensar incluso

en posibles errores que se puedan cometer (vencer el ensayo-error y evitar las
respuestas al azar).
— Usar las mejores palabras para expresar adecuadamente los elementos de las fi-
guras pedidas en el test (lenguaje exacto y preciso).
— Cambiar de estrategia interiorizándola, haciendo consciente su uso para evitar la

estrechez mental (flexibilidad de pensamiento).
b. Favorecer la generalización y trascendencia de los prerrequisitos conductua-

les. Este objetivo consiste en desarrollar la generalización de principios y reglas usa-
das en la evaluación. La trascendencia se dirige a potenciar el uso de estrategias y
procesos en situaciones diferentes del examen, por lo queelevaluador diseña tareas
paralelas o situaciones de la vida real para evaluar la capacidad de usarlas en contex-
tos diferentes.
c. Regulación y control de la impulsividad. La finalidad es fomentar el uso de
estrategias de planificación haciendo que el sujeto secuencie gradualmente el proble-
ma en fases, de forma que éstas no sean demasiado amplias ni demasiado cortas. El
primer paso hay que hacerlo tan fácil como sea posible para que el sujeto logre los
objetivos mínimos y se dé cuenta de su competencia cognitiva; esto es útil especial-
mente con los sujetos deficientes. En un segundo momento, el sujeto ha de conside-

rar las diferentes alternativas antes de elegir una cualquiera.
d. Potenciar el desarrollo de las operaciones mentales. Este objetivo se orienta
al aprendizaje de una serie de reglas que ayuden al sujeto a procesar la información
—relacionando la información nueva con la que ya posee— y organizándola en su
estructura mental. Así por ejemplo, con el Raven se enseñan operaciones mentales
de clasificación, multiplicación lógica, seriación, reversibilidad y transformación.
e. Enseñar contenidos necesarios para la inteligencia práctica y académica. La
enseñanza de contenidos se refiere a conceptos espaciales y temporales que estos su-
jetos necesitan para organizar su experiencia; además, se favorece el aumento del vo-
cabulario y la precisión de su uso.
f.. Mediar los procesos de retroalimentación o potenciar los aspectos motivacio-
nales. Estos procesos son esenciales para desarrollar la autorreflexión o insight que a
su vez favorece los componentes metacognitivos. Cuando el sujeto falla en alguna
respuesta, el mediador proporciona una serie de estrategias para orientar su atención
hacia una respuesta más satisfactoria; para ello se han diseñado unos protocolos a
modo de entrevistas clínicas. El feedback también se usa después de una respuesta
correcta para hacer explícita la competencia del sujeto; del mismo modo le ayuda a
autocorregir y controlar la impulsividad durante la situación de examen.
V. PROCESOS DE INTERACCIÓN EN EL POTENCIAL DE APRENDIZAJE
La Experiencia del Aprendizaje Mediado (EAM) es el principal vehículo del que dis-
pone el evaluador para conseguir la interacción del individuo con el aprendizaje. En
esta interacción el mediador juega un papel fundamental, consistente en ofrecer al
sujeto un conjunto de estímulos y experiencias que le permiten evaluar y enriquecer
su funcionamiento cognitivo durante la prueba. En la evaluación dinámica del po-
tencial de aprendizaje esta interacción viene determinada por una serie de paráme-
tros orientados a estimar el potencial oculto del sujeto para beneficiarse del aprendi-
zaje proporcionado en la situación misma de la evaluación. Los parámetros se
pueden resumir en los siguientes puntos.
a. Intencionalidad-Reciprocidad; consiste en diseñar situaciones de aprendiza-

je para implicar al sujeto en el mismo y desarrollar una situación interactiva entre el
mediador y el sujeto.
b. Trascendencia; supone aplicar y transferir los mecanismos y procesos desen-
cadenados en la evaluación al mundo del sujeto. La trascendencia implica la generali-
zación y la transferencia.
c. Significado; las situaciones de aprendizaje y las tareas de evaluación han de
ser relevantes e interesantes para el sujeto. El mediador ha de despertar la atención
del sujeto provocando pequeñas discusiones sobre la importancia y la finalidad de la
tarea.
d. Regulación de la conducta; el mediador intenta regular la atención del sujeto
hacia el problema, elaborando estímulos de forma apropiada y controlando la im-
pulsividad. La regulación exige del sujeto obtener la información de los conocimien-

tos previamente adquiridos (fase de input o entrada de la información), la utilización
de los mismos dándoles una cierta coherencia o forma (fase de elaboración) y el ra-
zonamiento lógico de la respuesta (fase de output o salida de la información).
_ €. Competencia; en la EDPA el mediador crea las condiciones para que el indi-
viduo logre los objetivos de la evaluación. Así por ejemplo, el mediador transforma
los estímulos según la capacidad del individuo. El sentimiento de competencia está
estrechamente relacionado con la motivación.
f. Participación activa; consiste en lograr un clima adecuado en donde el exami-
nador ofrece al examinando la oportunidad para discutir las respuestas. Examinador
y examinando pueden pensar juntos cómo resolver la tarea. En dicha participación
el sujeto es considerado como individuo activo en la tarea.
g. Individualizacion y diferenciación psicológica; consiste en aplicar diferentes
modalidades de aprendizaje en función de diferencias individuales de los estilos cog-
nitivos y de aprendizaje de los sujetos.
h. Conducta de logro; implica la definición previa de metas y objetivos a con-
seguir en la evaluación. La función del examinador es modelar la situación de exa-
men y desarrollar en el sujeto la perseverancia para lograr los objetivos.
1. Mediación del cambio: consiste en diseñar situaciones novedosas y comple-
jas con el fin de despertar la curiosidad del sujeto. En este parámetro se trata de desa-
rrollar en el niño las respuestas divergentes en la solución de un problema.
j. Mediación del conocimiento de la modificabilidad y cambio; el mediador co-
munica al examinando los logros de éste en la situación de examen. Feuerstein consi-
dera importante hacer partícipe al sujeto de su potencial para aprender, lo cual con-
tribuye a aumentar la autopercepción del individuo.
La evaluación del potencial de aprendizaje se desarrolla a través de sesiones de

test-entrenamiento-test. Feuerstein concede un papel importante al mediador como
facilitador de habilidades y procesos en la fase de entrenamiento. En ésta el media-
dor ha de reunir las características que permiten sacar el máximo provecho del alum-
no. Así por ejemplo, el mediador ha tener la intención de evaluar los cambios cogni-
tivos que se producen en el sujeto motivados por su intervención, despertando en el
alumno la reciprocidad necesaria para beneficiarse del entrenamiento. También ha
de diseñar experiencias significativas de aprendizaje y favorecer la trascendencia de
los aprendizajes, lo que significa que el mediador ha de crear situaciones de aprendi-
zaje paralelas para controlar la transferencia producida durante la intervención
(Prieto y Arná1z, 1991). A modo de ejemplo, en los cuadros 25.2 y 25.3 analizamos
los parámetros del aprendizaje mediado en una situación de examen.
VL TESTS DE EVALUACIÓN DINÁMICA DEL POTENCIAL DE APRENDIZAJE
Los materiales para la evaluación dinámica del potencial de aprendizaje se han cons-
truido de tal forma que ofrecen al sujeto una serie de instrumentos en diferentes mo-
dalidades de lenguaje; además, permiten al examinador acceder a la estructura cogn1-
CUADRO 25.2. Protocolos de la mediación de procesos cognitivos en el test de organización de

puntos
O o _-_ -Q ———
PROCESOS ALUMNO INTERPRETACIÓN
AAA MERPRED
AAA A A METACOGNITIVOS
An A AA A — A
¿Qué ves aquí? Se le pide que haga uso Un cuadrado y algún El mediador debe orien-
de los conocimientos punto tar al sujeto a una res-
previos puesta precisa y com-
pleta
A A A A
¿Qué crees que podrías Pedir definición del pro- Trazar un cuadrado
hacer con estos pun- blema
tos?
———
5 e A——Á
¿Cómo justificarías que Se trabaja el uso del ra- Cuatro puntos forman un Sólo usa un criterio o
es un cuadrado? zonamiento analítico cuadrado fuente de información
e
(El mediador dibuja un Se usa la comparación- El análisis de las dos fi- El uso adecuado de la di-
rectángulo) ¿Cuál es la diferencia entre longitud guras y de los errores ferencia en longitud y la
diferencia entre un cua- de lados y la igualdad hace que el alumno con- igualdad de los ángulos
drado y un rectángulo? entre los ángulos entre trole sus respuestas ¡im- indica que el sujeto ha
ambas figuras pulsivas dado una definición co-
rrecta del problema
(El mediador controla si ha Pedir el razonamiento Tiene cuatro lados de

habido aprendizaje.) Defi- analítico, la comparación igual longitud y paralelos
ne las propiedades del y la definición precisa del y cuatro ángulos rectos
cuadrado problema
(El mediador trabaja el Fomentar el uso de la Es un triángulo porque Respuesta impulsiva.

triángulo.) ¿Cuántos la- comparación y de habili- se sustenta sobre su vér- Esta hace que no se
dos tiene? ¿Cómo son dades de relación tice haya interiorizado la
los ángulos? ¿Es un cua- constancia de la forma
drado o un triángulo? del cuadrado
¿Por qué crees que es un Ayudar al sujeto a analizar El triángulo es una figura La respuesta idónea es
triángulo? el origen de su error. Se de tres lados y tres ángu- aquella en la que se indi-
fomentan los procesos de los can las características
insight exactas de los lados y
ángulos del triángulo.
Además, dos triángulos
forman un cuadrado
¡ A 0 _A<A<<<< <<>—>—>—m%2%464+
¿Cómo se llama cada Fomentar el transfer con- Son cuadrados porque...

una de las figuras? siderando ejemplos di-
versos de cuadrados y Son triángulos porque...
triángulos
—_——___—————————___————————>>ák>kx«x<—__
___==+414+4+
Fíjate bien cómo apare- Explicar las reglas de la El alumno puede realizar El mediador orienta la
cen las dos figuras. tarea. Se exigen proce- la tarea con excesiva ra- atención hacia la super-
sos de flexibilidad para pidez, cometiendo erro- posición de figuras.
cambiar la estrategia y res al no planificar su Hace que el niño use los
controlar los errores por conducta metacomponentes ense-
la superposición de las ñados previamente
figuras
¡€xK_x— _—_—_—QCo— o + ++ ++ e O QO0gQQ
En el modelo tienes... Observar al niño para an-

El examinador interviene
ticipar las deficiencias
para fomentar el uso de
que pueden surgir
la metacognición y de la
autorregulación de los
KáK—_—_—_
—_____—_—_——_—_—_——————————_
_— _—_—_—__________
errores A
Ahora ya has aprendi-

(O
áOo_
<«<<«<<=>—+114141414141
>>
CUADRO 25.3, Características de la mediación: test

de organización de puntos
—_———_—__ —_—_ »>--__—_——
— Tener la intención de evaluar el funcionamiento cognitivo para entrenar en los proce-
sos que aparecen deficitarios. Por ejemplo, aprenderemos a organizar puntos y reglas
útiles para la planificación de actividades.
— Despertar el sentimiento de competencia del examinando haciendo que éste desarro-

lle una conducta de búsqueda sistemática de todos los elementos del problema.
— Regular la conducta favoreciendo los procesos metacognitivos para controlar y rectifi-

car los errores. Así por ejemplo, se le dice al examinando: «antes de empezar el pro-
blema piensa qué debes conocer y qué supones que has de hacer». Los pasos de la
estrategia de planificación se pueden resumir en los siguientes puntos: definir los ob-
jetivos del problema, qué figura quiero trazar, qué elementos tengo, planificar la estra-
tegia más eficaz, decidir el punto de partida, definir las reglas del problema —un pun-
to no se puede usar más de una vez, las figuras se pueden superponer, las figuras
resultantes deben ser idénticas a las del modelo, el tamaño y la forma son constantes,
no se puede inclinar, es mejor tratar de representar la figura mentalmente— y compro-
bar siempre la solución para ver si hemos logrado la meta.
— Considerar las diferencias individuales del examinando. La evaluación se planifica de

acuerdo con las peculiaridades de cada sujeto. Cuando se establezca el plan de tra-
bajo hay que pensar que no todos los sujetos van a cubrir las etapas a un mismo ritmo.
El objetivo es evaluar las diferencias intraindividuales a lo largo de la evaluación. El
mediador ha de diseñar las metas considerando los déficit de los sujetos. Siempre hay
unos objetivos mínimos que se deben alcanzar para lograr la competencia y evitar la
frustración.
— Mediar el significado de la tarea: las relaciones implícitas en los puntos —formar cua-
drados y/o triángulos de acuerdo al modelo establecido— también las empleamos
para organizar cosas según el objetivo que queramos lograr. Quizás la forma más im-
portante de aprender a aprender es considerar los errores y ver la forma de corregir-
los. Errores parecidos a los de puntos los podemos cometer en otras situaciones.
— Las tareas de la evaluación han de trascender a la situación misma del examen. Por
ejemplo, organizamos la ropa, el tiempo, las actividades escolares, etc. porque quere-
mos imponer un orden para ser más eficaces.
tiva y controlar el tipo de intervención, así como los aspectos intelectuales y los
emotivo-motivacionales. En la construcción de los materiales de la EDPA se han con-
siderado tres dimensiones de la inteligencia: el grado de complejidad y novedad de la
tarea, el lenguaje o modalidad de presentación y las operaciones mentales. Feuers-
tein ha introducido la novedad —definida por el grado de familiaridad o no que se
tenga con el problema— como ingrediente esencial para favorecer la solución de
problemas en situaciones nuevas y fomentar la transferencia. El lenguaje de la tarea
consiste en presentar los problemas en las diferentes modalidades en las que se puede
procesar la información (numérica, verbal, gráfica, pictórica, simbólica, figurativa O
espacial). Las operaciones mentales se definen como un conjunto de estrategias en
función de las cuales el sujeto organiza, transforma y controla la información proce-
dente de las fuentes externas e internas (Feuerstein, 1986). La selección de los distin-
tos tests de la batería se ha hecho considerando los siguientes criterios: cada uno re-
quiere unas funciones cognitivas específicas; todos ellos exigen tareas y materiales
empleados anteriormente en clínica; la solución de los problemas implica utilizar
procesos de orden inferior y superior de pensamiento y las tareas se han organizado
de tal forma que permiten detectar microcambios en la misma situación de examen
(Prieto, 1988).
Los tests del modelo se han clasificado en tres grupos según el tipo de procesos
que evalúan y la dificultad de los mismos (véase cuadro 25.4).
CUADRO 25.4. Instrumentos de evaluación del potencial de aprendizaje

— Tests perceptivo-motores Organización de puntos
Figura compleja
— Tests de procesos superiores Matrices progresivas de Raven

Organizador
Progresiones numéricas
Diseño de patrones
— Tests de procesos de aprendizaje Bandejas

Aprendizaje de posición
Memoria asociativa
Memoria de palabras
VI1. /nstrumentos perceptivomotores
En este grupo se incluye el Test de organización de puntos y el Test de la figura com-

pleja (Rey, 1934, 1950, 1958). En estos tests se han estudiado los procesos cognitivos
y los factores motivacionales para explicar de algún modo la influencia de éstos en el
procesamiento de la información (Feuerstein, 1978). Los objetivos de estos tests son
evaluar la capacidad de análisis y de organización mental de los sujetos, los procesos
utilizados por éstos en la estructuración y organización de un campo complejo y la
capacidad de precisión y la calidad de las respuestas (Feuerstein y cols., 1985) (véase
el cuadro 25.5).
VI2. Instrumentos de evaluación de los procesos superiores

de la inteligencia
En este grupo se han incluido los siguientes tests: Diseño de patrones (Arthur,
1947), Progresiones numéricas, Organizador (Feuerstein y cols., 1985) y Matrices
progresivas de Raven (Raven, 1947). El objetivo de los mismos es evaluar las
operaciones mentales de nivel superior de la inteligencia, enseñar reglas y princi-
pios que exigen un cierto grado de pensamiento abstracto y evaluar la capacidad
del sujeto para generalizar dichas reglas en la misma situación de examen-ense-
ñanza-examen. Véanse los cuadros 25.6 y 25.7. A continución se presentan dos
ejemplos.
621
Ejemplo de Test de progresiones numéricas
Hallar la progresión entre los siguientes números:
A A a
ME EEES
Ejemplo de Test organizador
Instrucciones: Coloca cada uno de los 6 colores en el lugar apropiado, teniendo en

cuenta los principios siguientes:
A. Elazul, verde y amarillo están colocados en la casilla 1,365.
B. En la casilla 2 y 4 están el naranja y el blanco.
C. Elrojo y el verde están en la 1 y 6.
D. En las del centro están el naranja y el amarillo.
CUADRO 25.5. Tests perceptivomotores (LPAD de Feuerstein)
ORGANIZACIÓN DE PUNTOS FIGURA COMPLEJA
OBJETIVOS OBJETIVOS
— Evaluar la capacidad del sujeto para — Evaluar la capacidad del sujeto para
organizar figuras en un campo percep- estructurar y organizar los elementos
tivo desorganizado. de una figura, considerando sus ele-
mentos y detalles internos y externos.
— Evaluar la capacidad para utilizar habi-
lidades de planificación. — Evaluar la memoria a corto y largo
plazo.
— Evaluar la capacidad para usar estrate-
gias metacognitivas. — Evaluar procesos de discriminación.
— Evaluar el nivel para adquirir y controlar

conceptos y operaciones.

ORGANIZACIÓN DE PUNTOS FIGURA COMPLEJA
A. EOz-qgqgzg AA A A mE
CONTENIDO CONTENIDO
VETA + E A. LS. A AA A A
El test consta de una página con unos mo- Dibujo con la figura compleja y sus
delos que el alumno/a ha de reproducir, con- 18 características.
siderando una serie de reglas y estrategias.
A A O A |
MATERIALES MATERIALES
— Test, hoja de entrenamiento y postest. — Test figura compleja.

— Hoja de entrenamiento.
o 5 A — — —_Á —_ _—— __ _———
HABILIDADES HABILIDADES
— Definición precisa de la tarea. — Percepción precisa.
— Conservación y constancia de las ca-— — Conducta sumativa.

racterísticas del modelo. .
— Relaciones espaciales.
— Planificación de la conducta. ]
— Relaciones temporales.
— Pensamiento hipotético. O :
— Análisis-síntesis.
vI3. El Raven: evaluación de los procesos de razonamiento

El test de Matrices progresivas-Escala general de Raven consta de cinco series (A, B,
C, D y E) compuestas por doce ítems o problemas a resolver. La resolución exige
descubrir en cada problema una serie de reglas, mediante la composición y descom-
posición de las distintas figuras. El método es de elección múltiple, la solución hay
que encontrarla entre otros seis dibujos, la cual implica procesos de pensamiento in-
ductivo y el uso de los componentes de rendimiento.
La escala Especial de Colores (PM 47) modificada sobre la primitiva PM 38 per-
mite evaluar las funciones perceptivas, el razonamiento deductivo-inductivo y el uso
de la transferencia en niveles de madurez inferiores a los 12 años (5 a 11 años). Es
muy útil para la evaluación de los sujetos que presentan déficit cognitivos y proble-
mas de lenguaje (Bougés, 1979). En esta escala se han reducido las matrices y se ha
introducido el color, quedando compuesta por tres series: A, AB y B, con 12 ítems
cada una. Su autor considera que se trata de un test muy sensible al factor espacial
dado que los problemas implican nociones de simetría y transporte visual.
VI4. Instrumentosde evaluación de la memoria y de los procesos

de aprendizaje
En este grupo se han considerado los siguientes tests: Aprendizaje de posición (Rey,
1958), Memoria asociativa (Feuerstein y cols., 1985), Bandejas o Plateaux (Rey, 1950)
62 Us
CUADRO 25.6. Tests de procesos superiores (LPAD, Feuerstein)
DISEÑO DE PATRONES PROGRESIONES

NUMÉRICAS ORGANIZADOR
o O 2 ASARTIVA 0 FAA
OBJETIVOS OBJETIVOS OBJETIVOS
— Evaluar la capacidad — Evaluar la capacidad — Evaluar la capacidad
para solucionar proble- para extraer y generali- para procesar informa-
mas zar reglas ción
— Evaluarel poder del feed-
Evaluar la capacidad —
— Evaluar la capacidad
back para establecer relacio- para representar la infor-
nes entre relaciones o mación en jerarquías
mapping
A NATA MOADBIOA E EOO) VVS
CONTENIDO CONTENIDO CONTENIDO
— Veinte problemas cuya — Problemas con progre-— — Información desorgani-

solución exige gran fle- siones ascendentes y zada que exige estruc-
xibilidad de pensa- descendentes turación utilizando in-
miento formación almacenada
en la memoria a largo
plazo
MATERIALES MATERIALES MATERIALES
— Hoja con veinte diseños — Pretest con 15 proble- — Pretest con 10 tareas
en color mas :
— Hoja de entrenamiento
— Hoja de aprendizaje — Test con 45 problemas con cuatro tareas
— Test paralelo — Dos hojas de entrena- — Postest

de 20 tareas
miento
HABILIDADES HABILIDADES HABILIDADES
— Inducción — Generalización de re-_ — Codificación

alas y principios Vota
— Evaluación — Decodificación
— Transformación LitedA
— Verificación — Clasificación
— Proyección de relacio- h
— Hipótesis nes — Representación
y Memoria de palabras (Feuerstein y cols., 1985). Los tests de este grupo permiten
establecer una curva de aprendizaje en donde se observan el ritmo y la eficacia del
sujeto para enfrentarse a una serie de situaciones, en donde se contemplan procesos
similares a los aprendizajes escolares. En la práctica, el examinador selecciona los
tests idóneos para el sujeto, estableciendo la línea base sobre la que se fundamenta la
intervención. Los perfiles se diseñan en función de cuatro dimensiones: áreas de
cambio, magnitud del cambio, naturaleza cualitativa de los cambios y naturaleza de
la intervención (Prieto, 1987).
CUADRO 25.7. Test de matrices progresivas de Raven (LAPD, Feuerstein)

nn ——=—==—————=
TEST DE MATRICES PROGRESIVAS DE RAVEN

A AAA A A A A A
1. Objetivos
— Evaluar el potencial de aprendizaje

— Evaluar la capacidad para beneficiarse del aprendizaje mediado Y
— Evaluar la capacidad para aprender y aplicar principios y reglas en la solución de
problemas
2. Contenido: problemas de analogías figurativas geométricas
3. Funciones cognitivas
Considerar toda la información necesaria
— Percepción precisa y definición del problema

— Planificación-exploración sistemática de la tarea
— Describir las relaciones espacio-temporales
— Organizar la información usando dos o más fuentes de información a la vez
Usar la información recogida (elaboración)
— Utilizar sólo la información necesaria para la solución del problema, desechando

lo irrelevante
— Inferir las relaciones entre las figuras
— Pensar en diferentes posibilidades para resolver un problema, intentar probar los
resultados (pensamiento hipotético)
— Comparar las semejanzas y diferencias entre las figuras. Clasificarlas
Respuesta y solución del problema
— Transporte visual
— Proyección de relaciones entre las figuras
— Controlar la impulsividad
— Evitar el ensayo-error
— Utilizar un lenguaje preciso para dar la respuesta correcta
Materiales
— Test Matrices progresivas para niños/as y adultos/as

— Variaciones nivel | y II para niños y adultos respectivamente (matrices de entrena-
miento)
El mayor inconveniente de la evaluación dinámica es que se trata de una evalua-

ción de tipo individual, aunque actualmente se están realizando estudios sobre la
viabilidad de utilizarla en pequeños grupos. En cualquier caso, existen otros tests e
incluso escalas (véase el cuadro 25.8) que se pueden emplear.
En síntesis, podemos decir que el modelo de evaluación dinámica de Feuerstein
ha supuesto algunas innovaciones respecto a la evaluación de tipo psicométrico; in-
novaciones en cuanto a la estructura y disposición de los instrumentos de medida y a
la secuenciación, que se hace mediante el proceso de test-entrenamiento-test. Las di-
CUADRO 25.8. Tests de procesos de aprendizaje (LPAD, Feuerstein)
BANDEJAS MEMORIA DE MEMORIA MEMORIA DE

POSICIÓN
AO O TG Eh Y MONALIL IAASOCIATIVA
A ADD CLASIFICACIÓN
ROHS SHE UN LID
OBJETIVOS OBJETIVOS OBJETIVOS OBJETIVOS
— Evaluar la capa- — Evaluar el ritmo — Evaluar la me- — Evaluar la Capa-

cidad para ima- de aprendizaje moria y capaci- cidad para or-
ginar y proyec- dad de memo- ganizar y codifi-
tar relaciones ria a corto y Car palabras
en el espacio largo plazo
K——_—_—_
——___———_____——__—___——____________—___————_———_————_—oan_
_—_ _—_ _—_____—___— _ o. QQ.
CONTENIDO CONTENIDO CONTENIDO CONTENIDO
— Tareas cuya so- — Problemas que — Objetos familia- — Clasificar pala-

lución precisa exigen la pro- res y reconoci- bras según su
de relaciones to- yección de rela- miento de la sus- significado y ex-
pológicas ciones espacio- titución funcional traer el paráme-
temporales de los mismos tro de clasifica-
ción
MATERIALES MATERIALES MATERIALES MATERIALES
— Cuatro bande- — Cuadros con re- Test con 20 di- Test con 20 con-
jas superpues- jillas en donde bujos de obje- ceptos
tas. Una lleva se han de situar tos
un botón fijo puntos al ritmo Hoja entrena-
que marca el Test entrenamiento 20 con-
evaluador miento con otros ceptos
20 objetos
Postest paralelo
HABILIDADES HABILIDADES HABILIDADES HABILIDADES
Percepción Planificación Definición de ob- Codificación

jetos
Flexibilidad Transporte vi- Comparación
sual Usar diferentes
Inferir fuentes de infor- Clasificación
Relaciones es- mación
Precisión reco- pacio-tempora-
gida informales Codificación
ción
ferencias entre la situación pretest y postest sirven para hallar la zona de distancia o
potencial de aprendizaje. También se ha producido otro cambio consistente en con-
siderar el proceso versus producto utilizado por el sujeto para llegar a la solución del
problema. Esto significa que la evaluación del potencial se centra más en el procedi-
miento (cómo) que el sujeto utiliza para acceder al aprendizaje, que en la cantidad de
conocimientos que adquiere. El modelo de evaluación dinámica se fundamenta en
una teoría de la inteligencia que permite evaluar los puntos débiles y fuertes de los
sujetos con problemas de aprendizaje.
Los objetivos esenciales de la evaluación dinámica del potencial de aprendizaje

se orientan principalmente a la evaluación de los componentes del pensamiento
(funciones cognitivas), al control de los procesos de cambio que se producen me-
diante la intervención adecuada en la evaluación y a la prescripción de un modelo de
intervención para mejorar los procesos deficientes. La intervención se realiza me-
diante el programa conocido como enriquecimiento instrumental. Los contenidos
del programa se pueden establecer en función de las deficiencias que se detectan en la
evaluación. La evaluación dinámica del potencial de aprendizaje se ha construido
para sujetos con necesidades educativas especiales y con problemas de aprendizaje;
su aplicación exige una gran preparación teórica y práctica en la teoría de la modifi-
cabilidad estructural cognitiva, puesto que las técnicas y entrevistas clínicas que se
incluyen son bastante sofisticadas.
Arthur, G. (1947). Manual of directions for the Stencil Design Test I. Nueva York. Psycholo-
gical Corporation.
Bougés, S. (1979). Tests para el psicodiagnóstico infantil. Madrid. Cincel.
Bucckingham, B. R. (1921). Intelligence and its measurement: A symposium. Journal of Edu-
cational Psichology, 12, 271-275.
Budoff, M. (1967). Learning potential among institutionalized young adults retardates. Ame-
rican Journal of Mental Deficiency, 72, 404-411.
Budoff, M. (1969). Learning potential: A supplementary procedure for assessing the ability
to reason. Seminars in Psychiatry, 1, 278-290.
Budoff, M. (1974). Learning potential and educability among the educable mentaly retarded.
Cambridge. Research Institute for Educational Problems, Cambridge Mental Health As-
sociation.
Budoff, M. y Friedman, M. (1964). Learning potenttial as an assessment approach to the ado-
lescent mentally retarded. Journal of Consulting Psychology, 28, 434-439.
ment. En C. S. Lidz (dir.), Dynamic assessment. An interactional approach to evaluating
learning potential. Nueva York. Guilford Press.
Carlson,J.5. y Wield, K. H. (1978). Use of testing-the-limits procedures in the assessment of
intellectual capabilities im children with learning difficulties. American Journal of Mental
Deficiency, 82, 559-564.
Carlson, J. S. y Wield, K. H. (1979). Toward a differential testing approach: Testing-the-li-
mits employing the Raven Matrices. Intelligence, 3, 323-344.
Corman, L. y Budoff, M. (1973). A comparison of group and individual training procedures
on dERaven Learning Potential measure. Cambridge. Research Institute of Educational
Problems.
Dearbon, W. F. (1921). Intelligence and its measurement. Journal of Educational Psychology,
12, 210-212.
Dempster, J. J. B. (1954). Symposium on the effects of coaching and practice intelligence tests
(ID. British Journal of Educational Psychology, 24, 547-557.
DeWeerdt, E. H. (1927). A study of the improbability of fifth grade school children in cer-
tain mental functions. Journal of Educational Psychology, 18, 547-557.
Feuerstein, R. (1968). Learning Potential Assessment Device. En B. W. Richards (dir.), Pro-
ceedings of the First Congress of the International Association for the Scientific Study of
Mental Deficiency. Surrey, Inglaterra. Michael Jackson Publishing Co. Ltd.
Feuerstemn, R. (1970). A dynamic approach to the causation, prevention and alleviation of re-
tarded performance. En H. C. Haywood (dir.), Sociocultural aspects of mental retarda-
tion. Nueva York. Appleton-Century-Crofts.
Feuerstei, R. (1978). The dinamic assessment of retarded performers: The learning potential
assessment device. Baltimore. University Park Press.
Feuerstein, R. (1980). Instrumental enrichment: A intervention program for cognitive modi-
frability. Baltimore. University Park Press.
Feuerstein, R. (1986). Mediated learning experience. Jerusalén. WIZO-Canadá Research Insti-
tute.
Feuerstein, R., Haywood, H. C., Rand, Y., Hoffman, M. B. y Jensen, M.R. (1985). Learning
Potential Assessment Device: Manual. Jerusalén. Hadassah-WIZO-Canada Research Insti-
tute.
Feuerstein, R. y Rand, Y. (1977). Redevelopment of cognitive functions of retarded adoles-
cents: Instrumental Enrichment. Jerusalén. WIZO-Canadá Research Institute.
Gimon, A., Budoff, M. y Corman, L. (1974). Learning potential measurement with spanish-
a youth as an alternative to 1Q tests: A first report. Interamericam Tettmalof Psy-
chology, 8, 233-246.
James, W. S. (1953). Symposium on the effects of coaching and practice in intelligence tests.
British Journal of Educational Psychology, 23, 155-163.
Jensen, M. R. y Feuerstein, R. (1987). The Learning Potential Assessment Device: From philo-
sophy to aractice. En C. Lidz (dir.), Dynamic assessment: An interactional approach to
evaluating learning potential. Nueva York. Guilford Press.
Khos, (1923). Intelligence measurement. Nueva York. MacMillan.
Penrose, L. S. (1934). Mental defect. Nueva York. Farrar and Rinehart.
Prieto, M. D. (1987). El potential de aprendizaje: un modelo y un sistema aplicado de evalua-
ción. Murcia. Instituto de Ciencias de la Educación (ICE), Universidad de Murcia.
Prieto M. D. (1988). Manual de la evaluación dinámica del potencial de aprendizaje (EDPA).
Murcia. Instituto de Ciencias de la Educación (ICE), Universidad de Murcia.
Prieto, M. D., Rodríguez, A. y Bermejo, M. R. (1991). Diseño e investigación de un programa
de habilidades, procesos y estrategias de aprendizaje en una muestra de sujetos con necesi-
dades educativas especiales. Anuario Español e Iberoamericano de Investigación en Edu-
cación Especial, 131-162.
Prieto, M. D. y Arnaiz, P. (1991). La evaluación dinámica de la inteligencia: un modelo para
evaluar los procesos metacognitivos. Ponencia presentada en el Simposium Internacional
sobre Evaluación Diagnóstica y Entrenamiento Cognitivo del Niño Deficiente Mental.
Zaragoza. '
Raven, ]. C. (1947, 1956, 1958). Tests de matrices progresivas. Escala especial. Buenos Aires.
Paidós.
Rey, A. (1934). D'un procédé par evaluer Peducabilité: quelques applications en psychopa-
thologie. Archives de Psychologie, 24, 297-337. de
Rey, A. (1950). Six épreuves au service de la psychologie clinique. Bruselas. Etablissements
Bettendorf.
Rey, A. (1958). L'examen clinique en psychologie. París. PUF. E Dire
Rulon, P. y Schweiner, R. (1953). Validation of a non-verbal test of military trainability. De-
partamento de la Armada.
Schuman, H. (1960). Evaluating the educability of the severely mentally retarded child. Ps)-
chological Monographs, 74 (número monográfico).
Vernon, P. E. (1954). Symposium on the effects of coaching and practice in intelligence tests (V).
Vigotski, L. S. (1978). Mind in society: The development of higher psychological processes.
Cambridge. Harvard University Press. [El desarrollo de los procesos psicológicos superio-
res, Barcelona, Crítica, 1995.] FUE A
Yates, A. (1953). Symposium on the effects of coaching and practice in intelligence tests (1).
Wiseman, S. (1954). Symposium on the effects of coaching and practice in intelligence tests (IV).
Zigler, E. y Butterfield, E. C. (1968). Motivational aspects of changes in IQ test performance
of culturally deprived nursery school children. Child Development, 39, 1-14.
Calero, M. D. (dir.) (1995). Modificación de la inteligencia. Sistemas de evaluación e interven-

ción. Madrid. Pirámide.
Feuerstein, R. (1978). The dinamic assessment of retarded performes. Glenview. Scott, Fores-
man and Co.
Lidz, C. (1987). Dynamic assessment: An interactional approach to evaluating learning po-
Prieto, M. D. (1987). El potential de aprendizaje: un modelo y un sistema aplicado de evalua-
ción. Murcia. Instituto de Ciencias de la Educación (ICE), Universidad de Murcia.
Prieto M. D. (1988). Manual de la evaluación dinámica del potencial de aprendizaje (EDPA).
Murcia. Instituto de Ciencias de la Educación (ICE), Universidad de Murcia.
Prieto, M. D., Rodríguez, A. y Bermejo, M.R. (1991). Diseño e investigación de un programa
de habilidades, procesos y estrategias de aprendizaje en una muestra de sujetos con necesi-
dades educativas especiales. Anuario Español e Iberoamericano de Investigación en Edu-
cación Especial, 131-162.
Prieto, M. D. y Arnáiz, P. (1992). La evaluación dinámica de la inteligencia: un modelo para
evaluar los procesos metacognitivos. Anuario Español e Iberoamericano de Investigación
en Educación Especial, 368-397.
CUARTA PARTE
EVALUACIÓN DEL APRENDIZAJE Y DEL DESARROLLO

' Ñ
A o
A .
ci AL.
nc joa
IVA 110 VOI
b Y 0 ' P € jr 16m r=odele y

4
. a ») hs
o . ed Le
0 0%
y - mis > LAA de «HA
í AT "RA A MS ,
5 . A e A >
ñ ] > -. mi qe me>
.q
A Micra
A Ñ
en 1ra paMuda Ñ de sucios dos YTE PA RA
nl sa? » 0 e ps qe7 dp Nod a
aj O » Le RIO
bas" E
0
“ 3 E
ey SN
«
EUA SA
26. EVALUACIÓN DE LA MEMORIA Y LA ATENCIÓN
J. GARCÍA-MARTÍNEZ, J. M. RODRÍGUEZ-GONZÁLEZ y ALFONSO BLANCO-

PICABIA
L. LA MEMORIA Y SU EVALUACIÓN
11. Historia de la evaluación de la memoria
Las primeras pruebas de memoria (Wells y Martin, 1923; Babcock y Levy, 1940) se
caracterizaron por una excesiva carga de medidas de inteligencia. Ello llevó a Ey-
senck y Haldstead (1945) a proponer una serie de criterios de elaboración de pruebas
de memoria que se mantienen hoy en día: evaluar adquisición y retención, no ser
molestas para el sujeto y no correlacionar excesivamente con la inteligencia. Después
de las recomendaciones de estos autores se desarrollaron multitud de escalas de tipo
psicométrico que evalúan la capacidad de memoria a partir de la acumulación de da-
tos sobre su funcionamiento sin defender hipótesis previas (Weschler, 1945; Benton,
1945, 1974). De hecho, la proliferación de teorías experimentales sobre el funciona-
miento de la memoria (Atkinson y Shiffrin, 1968; Craik y Lockhart, 1972; Baddeley
y Hitch, 1974) apenas afectó al área de la evaluación. A partir de los años setenta se
produce un movimiento que trata de centrar la evaluación de la memoria en datos
ecológicamente relevantes (Neisser, 1978) y que da lugar a la aparición de multitud
de cuestionarios de memoria y metamemoria, pero que aleja, sobre todo en el caso
de estos últimos, la evaluación de la memoria del ámbito de la ejecución. Última-
mente han aparecido pruebas que combinan el ámbito de la ejecución con la relevan-
cia ecológica (Wilson, Cockburn y Baddeley, 1985).
12. Concepto de memoria

La memoria es un proceso cognitivo de carácter superior que se ocupa del almacena-
miento y recuperación de la información. Está relacionada con los procesos de
aprendizaje (en tanto que una información aprendida puede ser posteriormente re-
cordada) y con la atención (dado que ésta es una condición previa para la puesta en
marcha de todo proceso de obtención de información). Tradicionalmente se ha reali-
zado una serie de divisiones en el concepto de memoria referidas al tipo de informa-
ción y durabilidad de la misma que afectan a cada una de aquéllas:
a. La primera es la memoria sensorial; un almacén de gran capacidad, pero que

mantiene la información apenas unos milisegundos y que analiza la información en
términos de la modalidad estimular con la que ésta se presenta.
Universidad de Sevilla.
632 J. García-Martínez, J. M. Rodríguez-González y Alfonso Blanco-Picabia
b. El segundo componente es la memoria primaria O memoria a corto plazo,

que es un almacén de capacidad limitada, de tipo transitorio (Atkinson y Shiffrin,
1968), que mantiene la información sólo durante segundos, pero que es el lugar don-
de ésta es procesada. De hecho, posteriormente, esta división de la memoriasecon-
cibió como memoria activa o memoria en funcionamiento dando énfasis a dicha ca-
pacidad de procesamiento (Baddeley y Hitch, 1974).
c. El siguiente almacén es el de memoria a largo plazo o memoria secundaria,
que posee una capacidad infinita y una duración ilimitada. En él permanecen las in-
formaciones adquiridas hasta que son de nuevo evocadas por la memoria en funcio-
namiento. Experimentalmente las medidas de durabilidad sobre este almacén se li-
mitan a comprobar la perseveración de un dato en la memoria al cabo de unos pocos
minutos.
d. Por último, se habla de memoria remota que, aunque teóricamente no es di-
ferenciable de la memoria secundaria, sí lo es en la práctica, evaluándose mediante
técnicas que solicitan recuerdo de informaciones que llevan mucho tiempo (años) al-
macenadas.
Otra división interesante de la memoria es la referida a memoria episódica o re-

cuerdo de conocimientos de tipo personal, memoria semántica o recuerdo de cono-
cimientos generales independientes del contexto personal y memoria procesual o re-
cuerdo del procedimiento de realizar una tarea (Tulving, 1985). Todas ellas serían
manifestaciones de la memoria a largo plazo.
13. Procedimiento clínico en evaluación de la memoria
En cuanto a la comprobación clínica de las divisiones de la memoria que acabamos

de ver, hemos de señalar que no parece que la evaluación del almacén sensorial sea
pertinente desde el punto de vista clínico, pues no se observan grandes diferencias
entre diversos grupos de individuos. El almacén a corto plazo, conceptualizado
como memoria primaria, se suele evaluar mediante pruebas de amplitud de dígitos o
letras. La memoria primaria no presenta diferencias entre sujetos normales y sujetos
con déficit mnésico o ancianos, excepto si se aplican pruebas de superamplitud que
ofrecen más información de la que el sujeto es capaz de mantener en procesamiento
de manera simultánea (Squire, 1982; Lezak, 1983). La memoria secundaria (almacén
a largo plazo) se evalúa a través de técnicas de recuerdo libre, de párrafos o de repro-
ducciones visuales inmediatas o diferidas. Es en este almacén donde aparece la ma-
yor parte de las diferencias entre sujetos normales y sujetos con déficit, fundamen-
talmente si se aplican pruebas de recuerdo diferido (Squire, 1982). Las diferencias en
memoria remota suelen discriminar entre individuos normales y con patologías
(Cohen y Squire, 1981), pero no entre grupos de edad (Fozard, 1980).
En cuanto a la clasificación de la memoria propuesta por Tulving (1985), se sabe,
desde un punto de vista clínico, que la memoria episódica es la que se halla más daña-
da en todos los déficit de memoria, mientras que la memoria procesual se mantiene
prácticamente intacta y no discrimina entre grupos normales y patológicos (Cohen,
1984; Mitchell, 1989).
Evaluación de la memoria y la atención 633
Otra distinción interesante es la referida a los tipos de procesos que se realizan a

la hora de realizar tareas de memoria, en concreto, la diferenciación entre “recuer-
do” o recreación de un dato recuperándolo de los almacenes de memoria y “recono-
cimiento” o recuperación de ese dato facilitada por la nueva presencia del mismo;
normalmente, éste se evalúa pidiendo al sujeto que identifique el estímulo ya conoci-
do entre una colección de estímulos similares. El reconocimiento supone un menor
esfuerzo cognitivo y discrimina menos entre sujetos normales y con patologías, y
entre diferentes grupos de edad.
Cuando evaluamos la memoria nuestro objetivo debe ser encontrar respuesta a
las preocupaciones prácticas del paciente y del terapeuta, esto es, encontrar cuál es el
déficit del sujeto y la gravedad de éste, así como la posible intervención. De esta ma-
nera, la utilidad debe ser el criterio fundamental que rija la evaluación. Para elegir la
técnica diagnóstica hemos de atender a cuatro factores que influyen en la capacidad
de memoria y que interactúan entre sí (Smith, 1980):
a. Las características individuales del sujeto (salud, educación, trabajo, estado

afectivo, edad, capacidades cognitivas y autoevaluación de la memoria).
b. El tipo de tarea empleada al evaluar la memoria (reconocimiento, recuerdo y
complejidad).
c. El tipo de material empleado (naturaleza sensorial, familiaridad y relevancia
ecológica).
d. Eltipo de procesamiento cognitivo que se efectúa ante la tarea (codificación,
recuperación, organización...).
Además, la prueba elegida debe cumplir una serie de características concretas

(Ericksonn, Poon y Walsh-Sweeney, 1980):
a. Validez ecológica del procedimiento y del material de medida.

b. La presencia de medidas de recuerdo diferido para evaluar el recuerdo a lo
largo del tiempo.
c. Que el instrumento cuente con baremos adecuados a la población represen-
tativa del sujeto. Na
. Queel mencionado instrumento sea breve y fácil de administrar.
e. Queel test disponga de formas alternativas que permitan administrarlo a su-
jetos con déficits en alguna modalidad de respuesta.
Que el test sea útil, es decir, sugiera evaluaciones adicionales y tratamientos.
Que la prueba tenga unas condiciones psicométricas aceptables de fiabilidad
y validez. MA
05
> Que disponga de formas paralelas que eviten el efecto de la práctica ante la
repetición sucesiva. 30Y A
1. Quepreferiblemente aporte informació n tanto cuantitativa Como cualitativa
sobre el estado del evaluado.
El análisis de la memoria debe comenzarse intentado establecer un diagnóstico

diferencial de otros trastornos que puedan ser confundidos con éste, como es el caso
de los depresivos y de otros déficit cognitivos no mnésicos, por lo que debe evaluar-
634 ]. García-Martínez, J. M. Rodríguez-González y Alfonso Blanco-Picabia
se también el estado afectivo y cognitivo general del sujeto (Thompson, 1980). Una
vez definido el problema como puramente mnésico o, al menos, que este tipo de
deterioro también está presente, se ha de elegir una serie de instrumentos según la si-
guiente sistematización:
a. Una batería de memoria para explorar el nivel de ejecución general del su-
jeto.
b. Una serie de pruebas de tipo específico que pormenoricen la ejecución para
ese tipo de material, ya que ciertos déficit de memoria suelen alterar únicamente el
recuerdo de cierto tipo de información, fundamentalmente cuando el problema se
relaciona con lesiones cerebrales unilaterales (Milner, 1958; Speedie y Heilman,
1982). Las pruebas de tipo verbal son sensibles a problemas situados en el hemisferio
izquierdo y las no verbales a las lesiones del hemisferio derecho.
c. Una exploración de la memoria primaria; por ejemplo, mediante pruebas de
amplitud. Este tipo de tareas es preferible administrarlas si se sospechan problemas
en la atención, depresión o demencia (Stenberg y Jarvik, 1976; Ericksonn y Howie-
son, 1986).
d. Quela aplicación de las pruebas incluya, al menos, una prueba de recuerdo
diferido del material aprendido y comparar esta ejecución con la habida para el re-
cuerdo inmediato, ya que este tipo de recuerdo es más sensible a los efectos del dete-
rioro en la memoria secundaria (Milner, 1958).
e. Administrar tests de memoria remota tanto semántica como episódica ya
que esto puede ayudar a establecer un diagnóstico pormenorizado, al menos para al-
gunos síndromes que cursan con problemas de amnesia (Schacter y cols., 1982), ade-
más de dar datos cualitativos sobre los recuerdos intactos o dañados en el sujeto y su
extensión temporal.
f. Administrar alguna escala de evaluación de la metamemoria para conocer as-
pectos subjetivos del daño y la opinión del paciente al respecto, además de centrar el
tipo de quejas que importan a éste.
14. Procedimientos de evaluación de la memoria
Existen múltiples maneras de clasificar las pruebas de memoria. La más tradicional

es dividirlas en baterías o pruebas que evalúan múltiples aspectos de la memoria y
pruebas que evalúan un solo aspecto de la memoria, las cuales a su vez se dividen en
pruebas de memoria verbal y pruebas de memoria no verbal. Entre las baterías cabe
mencionar la Weschler memory scale (WMS) [Escala de memoria de Weschler]
(Weschler, 1945), la New York University memory test (NYU) [Escala de memoria de
la Universidad de Nueva York] (Randt, Brown y Osborne, 1980), el Rivermead be-
havioural memory test (RBMT) [Test conductual de memoria de Rivermead] (Wil-
son, Cockburn y Baddeley, 1985), la Memory test battery [Batería de test de memo-
ria] (Cronholm, Cronholm y Molander, 1957), la Learning test battery [Batería de
test de aprendizaje] (Meyer y Falconer, 1960), la Williams memory scale [Escala de
Williams para la evaluación de la memoria] (Williams, 1958) y el Guild memory test
[Test de memoria de Guild] (Gilbert, Leeve y Catalano, 1968).
Evaluación de la memoria y la atención
635
Entre las pruebas de memoria verbal destacan la Point-digit span [Amplitud

punto-dígito] (Smith, 1975), el Auditory-verbal learning test [Test de aprendizaje
audio-verbal] (Taylor, 1959), New word learning and memory test modified [Test de
aprendizaje de nuevas palabras modificado] (Walton y Black, 1957), el Sentence re-
petition test [Test de repetición de frases] (Benton y Hamsher, 1976), el Silly senten-
ces [Test de frases absurdas] (Botwinick y Storandt, 1974). De las pruebas de memo-
ria no verbal podemos apuntar el Recurring figures test [Test de figuras recurrentes]
(Kimura, 1963), el Visual retention test [Test de retención visual] (Warrington y Ja-
mes, 19674), el Complex figure test [Test de la figura compleja] (Osterreith, 1944), el
Memory test for designs [Test de memoria de diseños] (Graham y Kendall, 1946,
1960) y el Benton visual retention test [Test de retención visual de Benton] (Benton,
1945, 1974).
A pesar de esta clasificación que acabamos de exponer, quizás la manera más
funcional de ordenar las diferentes pruebas de evaluación de la memoria sea en fun-
ción de su utilidad para evaluar los distintos almacenes (memoria primaria, secunda-
ria O remota).
14.1. Técnicas que evalúan la memoria primaria

Algunas pruebas que emplean estímulos verbales para evaluar este proceso de me-
moria son las que utilizan letras o dígitos como estímulo. Las tareas de dígitos suelen
presentar listas progresivamente más largas que el sujeto evaluado ha de reproducir
en el orden de presentación y en el inverso. Las tareas de este tipo que más discrimi-
nan entre diversos grupos de pacientes o de edad son las pruebas de superamplitud
(Milner, 1971; Lezak, 1979) que presentan al sujeto más estímulos de los que puede
recordar. Pruebas de este tipo se suelen incluir en baterías de memoria, tales como
NYU, RBMT y WMS. Una tarea de características ecológicas estrechamente relaciona-
da con éstas es la de recuerdo de números de teléfono (Crook y cols., 1980). Las síla-
bas son otro estímulo verbal que evalúa memoria primaria y es capaz de discriminar
entre normales y amnésicos y diferencias debidas a la edad (Newcombe, 1969;
Ericksonn y Howieson, 1986). Entre las pruebas estandarizadas, la batería de
Weschler y el test de Benton son pruebas muy eficaces para evaluar este tipo de me-
moria.
142. Evaluación de la memoria secundaria
La característica común a todas las pruebas que evalúan este tipo de memoria es que
se hace de modo diferido. Los tipos de técnicas que suelen utilizarse para la medida
de la memoria secundaria son las de recuerdo libre de palabras, recuerdo de frases y
de párrafos, entre las que se emplean estímulos verbales, y técnicas de recuerdo de
rutas y lugares, entre las no verbales. En el recuerdo de listas de palabras se puede
proporcionar la categoría semántica a la que pertenecen éstas para facilitar la recupe-
ración. Una tarea ecológica asimilable a éstas es el recuerdo de listas de la compra
que discrimina problemas de memoria (McCarthy y cols., 1981).
636 ]. García-Martínez, J. M. Rodrígnez-González y Alfonso Blanco-Picabia
Todas las tareas de memoria asociativa, tanto verbal como no verbal, son aconse-
jables también para evaluar la memoria secundaria. Entre ellas nos encontramos con
pruebas de pares asociados (que se suelen incluir también en todas las baterías), re-
cuerdo de nombres y apellidos que discrimina grupos con patologías y de edad
(Clark y cols., 1982), recuerdo de caras y recuerdo de la asociación cara-nombre. Las
tareas de frases o párrafos evalúan también este tipo de memoria, aunque algunos
autores opinan que los instrumentos construidos con párrafos evalúan también me-
moria episódica. El gran problema de las pruebas de párrafos es su puntuación, ya
que las reproducciones no suelen ser literales. Los errores más comunes que se co-
meten son sustituciones, omisiones y alteraciones del contenido. Rapaport, Gill y
Schaffer (1968) recomiendan puntuar como correcto todo recuerdo que no altere el
significado de la historia. Las aplicaciones en diferido discriminan muy bien entre
normales y amnésicos (Milner, 1958; Stenberg y Jarvik, 1976). Entre las pruebas es-
tandarizadas la NYU y el RBMT son adecuadas para evaluar este tipo de memoria.
14.3. Evaluación de la memoria remota
La memoria remota se suele evaluar a través de cuestionarios de memoria que explo-

ran aspectos que realmente han sucedido en la vida de uno. La validez de estas prue-
bas suele ser alta y discriminan bien a enfermos (Schacter y cols., 1982), pero no el
efecto de la edad. Los autores no suelen informar de la fiabilidad de estas pruebas
(Herrmann, 1984). Abarcan diferentes aspectos de la vida cotidiana como el recuer-
do de caras famosas (Cohen y Squire, 1981), de hechos históricos (Warrington y
Sanders, 1971) o programas de televisión (Squire y Fox, 1980). Se han diseñado cues-
tionarios de memoria que evalúan tanto aspectos de memoria semántica como de
memoria episódica, siendo los primeros más fácilmente puntuables ya que se dispo-
ne de baremos objetivos para contrastar la precisión de las respuestas.
Otra prueba que evalúa también memoria remota es el recuerdo de categorías
donde se pide al sujeto generar palabras pertenecientes a categorías de alta o baja fre-
cuencia.
14.4. Cuestionarios de metamemoria
Al margen de las diversas pruebas de ejecución que evalúan los diversos almacenes
de la memoria y del valor de los trabajos sobre memoria cotidiana, se han desarrolla-
do multitud de cuestionarios de metamemoria. No son pruebas de ejecución, sino
pruebas de metamemoria que evalúan el conocimiento que una persona tiene acerca
del funcionamiento de sus propios procesos de memoria (Flavell, 1977). Todas estas
pruebas exploran diversos aspectos de la memoria que van desde la autopercepción
de la bondad de la ejecución de tareas de memoria a rasgos de personalidad asocia-
dos a la memoria pasando por el uso de mnemónicos (Herrmann, 1984; Gilewski y
Zelinski, 1986). Se diferencian también en los tipos de escala de medida que utilizan.
La fiabilidad (estabilidad temporal) es adecuada, oscilando alrededor de 0,80 (Herr-
mann, 1984), pero su validez es muy baja. Sólo excepcionalmente se encuentran gra-
637
dos aceptables de covariación con pruebas de ejecución utilizando los cuestionarios

contestados por los propios evaluados (Zelinski, Gilewski y Thompson, 1980; Sán-
chez-Cánovas y García Martínez, 1991). La validez aumenta si el cuestionario es
contestado por un familiar del evaluado (Broadbent y cols., 1982, Sunderland, Ha-
rris y Gleave, 1984). La capacidad de estos instrumentos para discriminar entre gru-
pos de pacientes es muy débil, pero son útiles para comprobar el tipo y cuantía de las
quejas de los evaluados.
Algunos de los cuestionarios de metamemoria más interesantes son el /nvuentory
of memory experiencies [Inventario de experiencias de memoria] (Herrmann y Neis-
ser, 1978), el Metamemory questionnaire [Cuestionario de metamemoria] (Zelinski,
Gilewski y Thompson, 1980), el Metamemory in adulthood [Cuestionario de meta-
memoria en adultos] (Dixon y Hultsch, 1983) y el Memory failures questionnaire
[Cuestionario de fallos de memoria en la vida cotidiana] (Sunderland, Harris y Glea-
ve, 1984). Véase cuadro 26.1.
14.5. Descripción de algunas pruebas de memoria

Weschler memory scale (WMS) [Escala de memoria de Weschler] (Weschler, 1945)
Es la batería de memoria más utilizada y la que ha merecido mayor interés por parte
de los investigadores. Incluye siete subescalas: información general, orientación in-
mediata (ambas tratan de evaluar el estado de confusión del examinado), control
mental (incluye ítems de rastreo y reproducción de tareas automáticas), memoria ló-
gica (recuerdo inmediato de párrafos), amplitud de dígitos (en el orden de presenta-
ción y en el inverso), reproducción visual de estímulos visuales y aprendizaje verbal
de pares asociados. Cada escala es puntuada en función del número de aciertos si-
guiendo criterios rigurosos y la suma de las puntuaciones de cada subescala da la
puntuación total que luego es traducida a un cociente de memoria en función de la
edad.
La estandarización inicial de la prueba se realizó con 200 sujetos adultos (no an-
cianos) y normales. Más tarde se han realizado baremaciones para poblaciones de
otras edades (Hulicka, 1966; Meer y Baker, 1965; Ivinskis, Allen y Shaw, 1971). No
existen baremaciones para muestras de España, aunque las subescalas de memoria
lógica, amplitud de dígitos y pares asociados fueron adaptadas por Cordero (1978)
para la realización del Test de memoria auditiva inmediata. De igual manera, existe
una adaptación de los subtests de pares asociados y memoria lógica (Montorio,
1990). Dada la inexistencia de baremos generales para la población española se sue-
len utilizar los de la edición francesa (Centro de Psicología Aplicada de París).
Existe una forma paralela del test (Stone y Weschler, 1946) con una correlación
con la primera de 0,80 (Stinnet y Digtacomo, 1970), aunque no ha sido baremada,
Hay datos ambiguos acerca de la estabilidad temporal de la prueba, encontrándose
alta en unos estudios (Caldwell y Watson, 1954; Caldwell, 1954) e ínfima en Otros
(Struckett, 1953). La consistencia interna sólo alcanza niveles medios lo que indica
que está compuesta por varios factores (Hall y Toal, 1957; Ivinskis y cols., 1971). Los
análisis factoriales suelen ser muy estables, encontrando normalmente dos o tres di-
638 J. García-Martínez, J. M. Rodrígnez-González y Alfonso Blanco-Picabia
CUADRO 26.1. Cuestionarios de metamemoria
— Memory change questionnaire (Cuestionario de cambios de memoria) de Cronholm

y Ottonson (1961)
— Memory questionnaire (Cuestionario de memoria) de Ash (1977)
— Inventory of memory experiencies (Inventario de experiencias de memoria) de Herr-
mann y Neisser (1978)
— Memory questionnaire (Cuestionario de memoria) de Perlmutter (1978)
— Short inventory of memory experiencies (Breve inventario de experiencias de memo-
ria) de Herrmann (1979)
— Subjective memory questionnaire (Cuestionario de memoria subjetiva) de Bennett-
Levy y Powell (1980)
— Head injury postal questionnaire (Cuestionario postal de daño cerebral) de Harris y
Sunderland (1980)
— Metamemory questionnaire (Cuestionario de metamemoria) de Zelinski y cols. (1980)
— Wadsworth memory questionnaire (Cuestionario de memoria de Wadsworth) de
Goldberg y cols. (1981)
— Metamemory questionnaire (Cuestionario de metamemoria) de Niederehe y cols.
(1981)
— Error processeness questionnarie (Cuestionario de propensión al error) de Reason
(1981)
— Slips of action inventory (Inventario de fallos de la acción) de Reason (1981)
— Memory complaints questionnaire (Cuestionario de quejas de memoria) de Zarit,
Cole y Guider (1981)
— Cognitive failures questionnaire (Cuestionario de fallos cognitivos) de Broadbent y
cols. (1982)
— Self-assessment of memory questionnaire (Autoevaluación de la memoria) de Hulic-
ka (1966)
— Memory self-report (Cuestionario de autoevaluación de la memoria) de Riege (1982)
— Metamemory in adulthood (Metamemoria en adultos) de Dixon y Hultsch (1983)
— Memory functioning questionnaire (Cuestionario de funcionamiento de la memoria)
de Gilewski y cols. (1983)
— Self-assessment of laboratory tasks (Autoevaluación de tareas de laboratorio) de
Herrmann y cols. (1983)
— Task/error questionnaire (Cuestionario de fallos en tareas) de Reason (1981)
— Everyday memory questionnaire (Cuestionario de memoria cotidiana) de Sunderland
y cols. (1983)
— Memory failures in everyday memory (Cuestionario de fallos de memoria en la vida
cotidiana) de Sunderland y cols. (1984)
— Autointorme de memoria de Fernández-Ballesteros y cols. (1986)
mensiones (Davis y Swenson, 1970; Dujovne y Levy, 1971; Kear-Colwell, 1973). En

cuanto a la validez, parece ser una buena prueba para detectar daño cerebral (Wal-
ton, 1958; Howard, 1954), aunque parece que sólo algunos subtests son discrimi-
nantes (Wang, Kaplan y Rogers, 1959). Cunningham (1986) señala la poca validez de
contenido de la escala, aunque tiene una alta correlación con la inteligencia (Fields,
1971; Sánchez-Cánovas y García Martínez, 1991).
Los cuestiones problemáticas que pueden detectarse en esta escala son la defi-
ciente conceptualización de la memoria —ya que se centra especialmente en evaluar
aprendizaje (Hulicka, 1966; Ericksonn y Scott, 1977)—, su no aplicabilidad a deter-
minadas poblaciones con deterioro y su validación inadecuada para ancianos
(Ericksson y Scott, 1977); además, penaliza a las personas con dificultades verbales al
639
estar sobrecargada de pruebas de este tipo, su fiabilidad test-retest no se ha compro-

bado, su baremación no está suficientemente extendida y tiene excesiva relación con
pruebas de inteligencia. Sin embargo, la WMS es una buena medida de memoria a
corto plazo, tiene una estructura factorial estable y evalúa bien el déficit de memoria
en pacientes amnésicos (Victor, Talland y Adams, 1959; Zaidel y Sperry, 1974). Es
muy eficaz para detectar déficit de memoria en pacientes con lesiones bilaterales y
del hemisferio izquierdo.
La insatisfacción existente con la batería de Wechsler llevó a Russell (1975) a
efectuar una revisión de la misma, desarrollando pruebas de recuerdo diferido de las
subescalas de párrafos y dibujos. Esta revisión parece tener una adecuada fiabilidad
y discrimina entre sujetos normales y pacientes con daño orgánico.
New York University memory test (NYU) [Escala de memoria de la Universidad

de Nueva York] (Randt, Brown y Osborne, 1980)
Esta escala ha sido construida específicamente para pacientes con daño moderado o
severo en funciones de almacenamiento o recuperación de la información. Contiene
siete subtests: información general, que pide al sujeto evaluado que responda a una
serie de ítems de orientación; recuerdo de palabras; recuerdo de dígitos en el orden
de presentación y en el inverso; recuerdo de pares asociados verbales; recuerdo de
párrafos; reconocimiento de dibujos de objetos comunes, y aprendizaje incidental
de los nombres de los subtests. Las pruebas de recuerdo de párrafos, palabras, pares
asociados y reconocimiento de dibujos tienen tres ensayos, uno inmediato y dos di-
feridos, el segundo de éstos al cabo de 24 horas. La aplicación de toda la prueba re-
quiere un tiempo de aplicación breve (sobre 20 minutos). El orden de presentación
permite diferenciar la recuperación del almacenamiento separando tareas de recuer-
do inmediato y diferido utilizando distractores. Posee cinco formas paralelas. Ex-
cepto el test de información general, la prueba es sensible al efecto de la edad y del
daño de memoria en los grupos patológicos. Permite obtener medidas de aprendiza-
je y recuerdo en múltiples tareas, permite la evaluación del recuerdo diferido (me-
moria a largo plazo) y considera el efecto del aprendizaje incidental, por lo que, se-
gún Ericksonn y Howieson (1986), es una buena alternativa a la WMSs. Al estar
excesivamente cargado de pruebas verbales penaliza a los sujetos con déficit limgúís-
tico y puede ser insensible al déficit de la memoria no verbal (Lezak, 1983). Todavía
no se han realizado estudios sobre su validez y fiabilidad.
Rivermead behavioural memory test (RBMT) [Test conductual de memoria

de Rivermead] (Wilson, Cockburn y Baddeley, 1985)
Esta prueba se diferencia de las típicas baterías y tests de laboratorio en que está
constituida por análogos de situaciones de olvido de la vida diaria con alta validez
ecológica por lo que el test se incluye dentro del enfoque de la memoria cotidiana. Es
un test con una gran orientación práctica y construido para contribuir a la compren-
sión y rehabilitación del déficit de memoria. Se inscribe dentro de laslíneas marcadas
por Ericksonn, Poon y Walsh-Sweeney (1980) para la construcción de un test obje-
tivo de evaluación del déficit amnésico. Ningún otro test cumple estas características
y se trata de un intento por salvar las distancias entre las pruebas de laboratorio y los
tests con validez ecológica. Tiene un amplio apoyo teórico de datos experimentales
y neurológicos. Las once tareas que componen la batería cubren las siguientes áreas:
recuerdo de un nombre y un apellido, recuerdo de la localización de un objeto, re-
cuerdo de un compromiso, reconocimiento de dibujos, recuerdo inmediato y diferi-
do de un párrafo, recuerdo de un recorrido inmediato diferido, recuerdo de la reali-
zación de un recado, reconocimiento de caras, aprendizaje de una tarea nueva,
introducir fecha y hora en un reloj digital y preguntas de orientación.
El test resulta discriminativo para pacientes amnésicos (Wilson, 1987) y ancianos
(Cockburn y Smith, 1988; Sánchez-Cánovas y García Martínez, 1991). Tiene una
alta correlación con otras pruebas de memoria como la WMS y los subtests de párra-
fos del NYU y las pruebas de elección forzosa de caras y palabras de Warrington
(1984), así como con listados de problemas de memoria realizados por los terapeutas
e informados por los sujetos (Wilson, 1987; Sánchez-Cánovas y García Martínez,
1991). Posee una alta fiabilidad interjueces (1,00) y test-retest (0,96) con un lapso de
una semana (Wilson, 1987). Su consistencia interna es mediocre (alfa = 0,59) lo que
parece indicar que las tareas que lo componen son diferentes entre sí (Sánchez-
Cánovas y García Martínez, 1991). El test dispone de cuatro formas paralelas que
correlacionan significativamente entre ellas (Wilson, 1987).
Benton visual retention test [Test de retención visual de Benton]

(Benton, 1945, 1974)
Es la prueba de memoria no verbal más conocida, existiendo una edición con barema-
ciones para la población española. La prueba posee tres formas paralelas (C, D, E),
aunque parece que la forma D presenta mayor dificultad para los sujetos (Benton,
1974). Todas las formas consisten en diez láminas que representan uno o tres dibujos
geométricos más o menos complejos. El test puede administrarse de cuatro formas
diferentes que implican memoria inmediata (dos de ellas), recuerdo diferido y copia.
A través de este procedimiento se evalúa memoria visual inmediata, aunque las lámi-
nas que disponen de tres diseños son una medida primaria de la amplitud de memo-
ria. El test pone también de manifiesto ciertos problemas de desorganización visoes-
pacial evidenciados en los diversos tipos de errores que pueden cometerse. Se puntúa
atendiendo a la cantidad de aciertos y a la cantidad de errores y tipo de éstos (omisio-
nes, distorsiones, perseveraciones, rotaciones y desplazamientos), tanto en el sector
izquierdo como en el derecho. La interpretación de las puntuaciones tiene en cuenta
la inteligencia y la edad del sujeto.
La fiabilidad del test —con procedimientos test-retest— es muy alta (0,77 a los
12 meses según Lezak, 1983). La fiabilidad por el procedimiento de las dos mitades
es de 0,76. La fiabilidad entre las distintas formas del test oscila entre 0,81 y 0,90. La
tasa de acuerdo entre distintos jueces llega a 0,90-0,94 (Egeland, Rice y Penny, 1967).
El problema de esta prueba parece ser que no está totalmente libre de efectos
verbales ya que muchas láminas pueden ser recodificadas verbalmente (Snow, 1979;
Zubrick y Smith, 1979). Discrimina entre pacientes orgánicos y psiquiátricos (Ben-
ton, 1974; Heaton, Baade y Jonhson, 1978), aunque no todos los estudios apuntan
en esta dirección (Burgess y cols., 1970). También es sensible al deterioro debido a la
641
edad. Algunos estudios sugieren que evalúa más percepción visoespacial o funciones
visomotoras que memoria visual inmediata (Silverstein, 1962; Chansky, 1967).
Inventory of memory experiencies [Inventario de experiencias de memoria]
Este inventario publicado por Herrmann y Neisser (1978) constituye uno de los
cuestionarios de metamemoria que más desarrollo ha experimentado. Los autores
suponen que la memoria es un proceso pluridimensional y que cada una de esas di-
mensiones ha de ser evaluada de modo independiente; por ello, el test se divide en
dos partes: una que pregunta acerca de experiencias de olvido y otra que se ocupa de
experiencias de recuerdo. La parte relativa a olvidos está compuesta por ítems agru-
pados en ocho dimensiones concretas confirmadas factorialmente (Herrmann y
Neisser, 1978). La subsección de recuerdos se compone de tres partes. La fiabilidad
es mayor para la parte de olvidos que para la de recuerdos. El test no correlaciona
con pruebas de ejecución. Existe una versión abreviada.
Memory failures in everyday life (MFE) [Cuestionario de fallos de memoria

en la vida cotidiana después de un daño cerebral severo]
Este cuestionario de metamemoria publicado por Sunderland, Harris y Gleave

(1984) es el resultado de una investigación con pacientes con daño cerebral; de todos
los cuestionarios de metamemoria es el único desarrollado intencionadamente para
poblaciones con déficit amnésico claro. El test consta de 28 ítems. Los análisis facto-
riales mostraron un único componente principal en muestras británicas (Sunder-
land, Harris y Gleave, 1984). Su consistencia interna es adecuada (Sánchez-Cánovas
y García Martínez, 1991) y el test correlaciona con pruebas de ejecución como el
RBMT y la WMS (Sánchez-Cánovas y García Martínez, 1991). Si los tests son contes-
tados por familiares de pacientes amnésicos sí logran predecir la ejecución de éstos
(Sunderland, Harris y Gleave, 1984). Existe una adaptación española, no publicada,
elaborada por Sánchez-Cánovas (1987).
IL. LA ATENCIÓN Y SU EVALUACIÓN
1L1. Introducción
Resulta curioso comprobar cómo, aun cuando la gran mayoría de los procesos y
funciones cognitivas ha merecido un gran interés por parte de los profesionales de la
evaluación, la atención ha sido relegada en muchas ocasiones a un segundo plano. El
motivo que a menudo se ha alegado para justificar esta acción ha sido afirmar que la
atención se constituía en un requisito imprescindible previo y mantenido durante la
realización de una tarea, circunstancia por la que cualquier prueba que precisase una
ejecución en un tiempo determinado facilitará información sobre la atención (Ro-
dríguez-González y Mesa, 1987, 1990). En la investigación básica y experimental es
posible hallar un interés creciente por el estudio de la atención, cuyo inicio puede si-
tuarse en el siglo XIX y que se mantiene constante en diversas corrientes psicológicas

(introspeccionismo, estructuralismo o funcionalismo) con algunas lagunas como la
que podríamos localizar entre los años veinte y cuarenta (Egeth y Bevan, 1979).
A partir de la década de los años cuarenta y como resultado de la conjunción de fac-
tores diversos (visión crítica de las escuelas imperantes, aparición de la psicología
cognitiva y del procesamiento de la información, auge de microteorías... ), la aten-
ción ha acabado convirtiéndose en un fenómeno que ha merecido un análisis más
detenido en los ámbitos teóricos, experimentales y, ocasionalmente, de la evalua-
ción. Concretamente no será hasta que en 1958 Broadbent conciba la atención como
un elemento básico en el procesamiento de la información y la incluya dentro de su
teoría del filtro y que los estudios acerca de ella adquieran una cierta estabilidad. Por
otro lado, es preciso tener en cuenta que, al igual que con otros términos psicológi-
cos, ha tenido lugar una popularización del concepto que supuso un uso indiscrimi-
nado y una gran confusión (Ruiz-Vargas, 1986). Finalmente, es preciso ser conscien-
tes de que, dentro del mismo ámbito de estudio de la atención, existen diversas
fuentes de estudio (vigilancia, atención selectiva, atención sostenida, etc.), lo cual im-
plica una gran divergencia en los datos que, en un momento dado, pueden hacer que
se pierda la visión de conjunto tan precisa en estos casos. Dicho de otra manera, exis-
te una gran diversidad metodológica, lo cual ha llevado a un progreso irregular de es-
tos estudios (Ruiz-Vargas y Botella, 1981, 1982). Es incluso interesante verificar
cómo, a pesar del paso de los años, continúan preocupando las mismas cuestiones
incluso desde un mismo modelo psicológico. Ruiz-Vargas y Botella (1982) plantean
que los estudios acerca de la atención se podrían agrupar en tres grandes bloques:
a. ¿El procesador humano dispone de una reserva limitada o de varias?

b. ¿Los recursos atencionales son limitados o ilimitados?
c. ¿Dónde, quién o cómo se hace la selección de la información que debe pasar
a la conciencia?
Años más tarde, Kidd y Greenwald (1988) indican que estas cuestiones conti-
núan preocupando y que aún no existe una respuesta definitiva. Ante este panorama
resulta casi comprensible y lógico que las aportaciones que desde el ámbito de la
evaluación psicológica se han realizado sean breves, raras y escasas. Entiéndase aquí
que hacemos referencia a pruebas o tests estandarizados, baremados y con unas ga-
rantías psicométricas mínimas, ya que en la investigación han sido y son muy fre-
cuentes lo que podríamos llamar “tareas experimentales”, éstas carecen de los requi-
sitos más básicos y necesarios para ser incluidas bajo la denominación de tests.
12. Concepto de atención

Dejando de lado planteamientos clásicos como el de Ribot, según el cual la atención
es un estado psíquico que se caracteriza por el predominio en la conciencia de una
representación única, las aportaciones efectuadas durante gran parte del siglo XX se
caracterizan por dos puntos comunes: la atención es un proceso cognitivo y dicho
proceso resulta ser selectivo. No obstante, estos postulados se van modificando por
diversas causas; se produce una clarificación a raíz de datos procedentes de diversas

subdisciplinas de la psicología, diversos paradigmas, modelos, submodelos y Siste-
mas van incidiendo tanto sobre cuestiones particulares como más generales, enri-
queciendo así el espectro teórico y experimental. Tomando en consideración a Ruiz-
Vargas y Botella (1987), quienes parten de una orientación cognitiva, se destaca el
hecho de que más que un proceso la atención resulta ser un intermediario entre to-
dos los procesos cognitivos. Así, resulta comprensible concebir este término como
un elemento previo y necesario a la puesta en marcha de cualquier proceso, lo cual
no evita que para que el mencionado proceso tenga un funcionamiento lo más co-
rrecto posible sea necesario que la atención se mantenga.
Posiblemente una de las definiciones más elementales, y a la vez más representa-
tiva de la orientación cognitiva, sea la planteada por Lindsay y Norman (1983). Es-
tos autores presentan una conceptualización de la atención a partir de sus aspectos
positivos y negativos. Con respecto a los primeros, la misión de ésta es la de facilitar
el seguimiento de estímulos concretos entre otros irrelevantes (material distractivo);
con respecto a las cuestiones negativas, la atención impide seguir a todos los estímu-
los que se presentan. No hay duda de que en este caso se enfatiza la tarea selectiva
que, aunque importante, no resulta ser la única.
A final de la década de los años ochenta e inicio de los noventa se va poniendo en
evidencia que el interés se desplaza de forma progresiva desde el intento de explica-
ción y/o definición hacia el estudio e investigación de fenómenos particulares, como
podrían ser los distintos componentes y subcomponentes de las modalidades de
atención. En cuanto a los enfoques teóricos, y considerando tan sólo las aportacio-
nes efectuadas desde el procesamiento de la información, cabe la posibilidad de aislar
tres modelos que a su vez englobarían a otras tantas posturas teóricas. Ruiz-Vargas y
Botella (1987) distinguen entre:
a. Modelos de capacidad; la atención se entiende como un conjunto de reglas

en virtud de las cuales se distribuyen y organizan los limitados recursos cognitivos
de los que dispone el hombre (Kahneman, 1973).
b. Modelos estructurales; en esta concepción viene a entenderse que la aten-
ción se encarga de organizar la información sensorial con el fin de que algunos ele-
mentos sean integrados antes que otros. Dado que el psiquismo es concebido aquí
como poseedor de una estructura serial (y por ello únicamente capaz de procesar un
estímulo cada vez), el fenómeno estudiado alcanza un papel esencial (Deutsch y
Deutsch, 1963; Broadbent, 1971).
c. Modelos mixtos; suponen un intento de integración entre los dos anteriores,
dado que se acepta el sistema de funcionamiento de los modelos estructurales y, a la
vez, se asume que la capacidad de procesamiento debe incrementarse o disminuirse
(Johnston y Heinz, 1978).
13. Modalidades de atención

r los siguien-
Sin entrar en la cuestión de la modalidad sensorial, es factible distingui
tes tipos de atención:
-
a. Atención selectiva, entendida como la habilidad de una persona para focali-

zar o centrarse en estímulos importantes y neutralizar los irrelevantes.
b. Atención sostenida; en este caso son diversas las corrientes que encuentran
distintas explicaciones acerca de los mecanismos implicados en esta modalidad de
atención. De esta forma hay quienes la relacionan con el esfuerzo invertido, con la
organización y autodirección y con el mantenimiento de la misma a lo largo de un
tiempo prolongado.
c. Atención cambiante, reconocida como una función cuyo foco varía de ma-
nera continua, siendo posible predecir los mencionados cambios en algunas ocasio-
nes pero no en aquellos otros casos en los que el estímulo se encuentra formado por
una estructura compleja.
En esta clasificación se han planteado los términos de uso más frecuente y co-
mún, lo cual no evita que el lector se encuentre con otras posibilidades, como sería el
caso de Lezak (1983), quien desde la psiconeurología distingue (con fines de evalua-
ción y refiriéndose a las actividades atencionales) entre atención, concentración O vi-
gilancia y rastreo conceptual. Como antecedente histórico también es posible recu-
rrir a autores como Piorkowski, quien, desde la psicología diferencial, establece
cinco tipos de atención con miras a la selección profesional: atención constante, dis-
tributiva, en ritmo oscilante, concentrada para períodos breves y fluctuante para in-
tervalos breves.
Evidentemente, teniendo en cuenta las distintas modalidades sensoriales señala-
das, es posible hacer otras clasificaciones en función del tipo de sentido concreto de
que se trate. Piénsese que la atención no sólo puede ir vinculada con la percepción
visual, sino también con la auditiva, la olfativa, la táctil, etc. Teniendo en cuenta la
percepción visual se pueden distinguir distintas modalidades desde lo más amplio a
lo más específico. Pashler (1991) introduce el concepto de atención visual selectiva,
reconociendo la existencia de un tipo análogo para las restantes modalidades senso-
riales. Si continuamos restringiendo el campo de estudio nos hallamos con que
cabe la posibilidad de que la atención se divida o no; en caso de que ocurra tal divi-
sión han aparecido diversas explicaciones acerca del recorrido de la información en
esas condiciones, siendo posible distinguir entre modelos de contenido indepen-
diente y modelos de coactivación, a los cuales sería preciso sumar el modelo inte-
ractivo propuesto por Mordkoff y Yantis (1991). Por otro lado, se encuentre divi-
dida o no, es preciso explicar la atención, pues desde los años setenta han aparecido
distintos intentos explicativos que pueden agruparse en tres modelos: los de movi-
mientos análogos (Shulman, Remington y McLean, 1979; Tsal, 1983), los de inva-
rianza temporal (Rizzolatti y cols., 1987) y los de distribución (Hughes y Zimba,
1985, 1987). Incluso sería posible complicar aún más la cuestión recurriendo a con-
ceptos mucho más restringidos o específicos; éste es el caso del denominado siste-
ma anterior de la atención propuesto por Posner y cols. (1989) y que se encontraría
fuertemente relacionado con las funciones lingúísticas y con los cambios controla.
dos de la atención visual.
Como se puede comprobar, estamos ante un campo de estudio muy prolífico
pero que, a causa de la cantidad ingente de información, es frecuente que se pierda la
noción global.
645
114. Evaluación de la atención
Entre las principales características de las pruebas de evaluación se podrían desta-

car las siguientes. Son pocos los tests que de manera exclusiva evalúan la atención,
efectuando la mayoría de ellos una evaluación de la faceta perceptivo-visual y te-
niendo el sujeto como misión la de focalizar su atención en una determinada direc-
ción con el fin de discriminar diferencias. Por otra parte, hallamos que la gran ma-
yoría de los tests de aptitudes se ocupa, de manera directa o indirecta, de este
fenómeno; pero en estas circunstancias dicho fenómeno adquiere un carácter más
secundario. En tercer lugar, no existe la menor duda de que son las tareas experi-
mentales o de laboratorio las que más a menudo se emplean, ya sea en la investiga-
ción básica o en la clínica. Finalmente, es de sobra conocido que existe una amplia
variedad de pruebas psicométricas (especialmente de evaluación de la inteligencia)
en las que desde un punto de vista clínico se afirma que la atención subyace a mu-
chas de las actividades.
Por todo ello, hemos optado por abordar el estudio de los sistemas de evaluación
de las capacidades atencionales partiendo de la clasificación que se deduce de lo ex-
puesto anteriormente; esto es, pruebas de atención, pruebas de aptitudes, tareas de
atención y pruebas de medida indirecta.
114.1. Pruebas de atención
Test de Toulouse-Piéron (TP)
Sin lugar a dudas, se trata del instrumento más tradicional en la evaluación de la

atención. Pone de manifiesto una dimensión denominada velocidad perceptiva,
que consiste en encontrar una figura preestablecida entre un conjunto de mate-
rial distractivo. La prueba fue descrita en 1904 por Toulouse y Piéron, siendo
adaptada a diversos países; la versión española de Mariano Yela data de 1978.
Con algunas variaciones en cuanto a la aplicación, se hace factible obtener datos
sobre:
a. Constancia de la atención, siguiendo el procedimiento establecido por los

autores.
b. Amplitud, haciendo que la tarea consista en identificar varios modelos en lu-
gar de uno solo. ' l
c. Capacidad de adaptación, variando el estímulo cada cierto tiempo.
d. Intensidad; a la vez que trabaja se le pide al evaluado que vaya recitando, por
ejemplo, el abecedario.
En cuanto a su empleo en investigación cabe reseñar el reciente trabajo de Suá-

rez-Noguerol (1990) en el que se informa de una adecuada covariación entre acti-
vación y ejecución, de manera que en niveles altos de activación los individuos no
suelen verse afectados por la presencia de materiales irrelevantes o distractores.
Percepción de diferencias. Caras
Esta prueba, creada por Thurstone (1944) y adaptada por Yela (1979) a la población
española, sigue un patrón de ejecución similar al 77, variando únicamente los estí-
mulos. Los datos psicométricos españoles se centran en el análisis de su fiabilidad y
validez. En el primer caso, mediante la técnica de test-retest (con un intervalo de un
año), el coeficiente de estabilidad alcanzó 0,60, mientras que con la división en dos
mitades se lograron unos valores que oscilaban entre 0,94 y 0,97. En cuanto a la vali-
dez de criterio, ésta fue bastante reducida (0,38).
Test de formas idénticas (Fl)
Este test de 1944 es el resultado de los estudios iniciados por Thurstone, presentan-
do una dinámica de funcionamiento similar a los casos anteriores. Presenta unas al-
tas correlaciones con instrumentos que evalúan visualización estática, rapidez per-
ceptiva, orientación y velocidad. Existe baremación española (TEA, 1979), y se
encuentra especialmente recomendado para la orientación escolar y profesional y la
selección de personal. Resulta interesante comprobar cómo en los análisis factoriales
en niños mayores y adultos se independiza esta prueba de aquellas otras que ponen
de manifiesto el factor g.
Test de ejecución continua
El Test de ejecución continua es la prueba más utilizada y la más versátil. Con la pre-
tensión de evaluar la atención mantenida y con la finalidad inicial de servir en el diag-
nóstico diferencial de lesión cerebral, Rosvold y cols. (1956) elaboran una tarea que
con el paso del tiempo y diversos estudios psicométricos ha adquirido una gran rele-
vancia en este ámbito. La versatilidad de este instrumento hace que sea posible apli-
carlo con y sin distractores y en versiones tanto auditivas como visuales. Asimismo,
ha sufrido distintas modificaciones; no obstante, tal y como informan Halperin,
Wolf y Pascualvaca (1988), la forma más utilizada es la original y la más difícil, la ver-
sión de Erlenmeyer-Kimling y Cornblatt (1978). La tarea a realizar por los sujetos
examinados consiste en presenciar la aparición de 680 estímulos (de los que 84 son
considerados diana) mediante la pantalla de un ordenador. Cada uno de ellos perma-
nece 0,53 segundos, con un intervalo interestímulos de un segundo. A pesar de que
este sistema de aplicación es más complicado y requiere un mayor procesamiento a
nivel cognitivo, tiene a su favor el hecho de que los resultados finales son más discri-
minativos. Suelen tenerse en cuenta dos cuestiones fundamentales: errores de omi-
sión y errores de comisión. En este caso, mientras autores como Halperin y cols.
(1988) opinan que se ponen de manifiesto tanto la impulsividad como la inatención,
Sykes, Douglas y Weiss (1971) y Sostek, Buchsbaum y Rapoport (1980) se inclinan
exclusivamente por la impulsividad.
647
Cuadrados de letras (CL)
Es el resultado del aprovechamiento de datos y experiencias de diversos trabajos de

Thurstone por parte de TEA (1975). Se trata de una tarea en la que es necesario modi-
ficar constantemente el foco atencional, dado que existen 90 cuadrados en cada uno
de los cuales hay 16 letras (distribuidas en cuatro filas y cuatro columnas). El sujeto
evaluado tiene que analizar particularmente cada construcción con el fin de detectar
posibles repeticiones. La fiabilidad obtenida mediante test-retest es de 0,81 en adul-
tos. Asimismo, y dada la naturaleza de la tarea a realizar, no es extraña la presencia de
una correlación de 0,68 con el Test de percepción de diferencias (caras).
Vocales
Esta prueba elaborada por Seisdedos data de 1976, planteándose como objetivo eva-
luar el grado de atención y resistencia a la fatiga en una tarea monótona con material
desconocido y distractivo (Seisdedos, 1976). El material de trabajo lo constituye el
alfabeto ibérico primitivo, proporcionando siempre y a la vista las claves correspon-
dientes con el fin de evitar cualquier sesgo motivado por el posible mal estado de la
memoria.
Consonantes
Seisdedos (1980) elabora este instrumento con el objetivo de evaluar aspectos tanto
perceptivos como atencionales. No obstante, el autor ha intentado vincular el test a
tareas académicas o escolares, motivo por el que para su realización se requiere una
formación básica.
Palabras-1 (TO-1)
Este instrumento elaborado por Rosel (1990) intenta evaluar la capacidad de obser-
vación, considerada ésta como una dirección intencional de la atención voluntaria
aplicada a un objeto externo, con la finalidad de percibirlo o aprehenderlo en su to-
talidad y darnos cuenta de alguno de sus aspectos o cualidades. La prueba la compo-
nen 60 elementos formados por cuatro palabras que es necesario contrastar con un
modelo. Uno de los principales problemas de la prueba, reconocido por el autor, ra-
dica en que es fácil que pueda aparecer el factor cansancio, lo que supone un impor-
tante sesgo de los resultados.
Test de atención (K-T)
Se trata de un test elaborado por Halter y publicado recientemente por el Centro

Francés de Psicología Aplicada. Mantiene una gran similitucon d los restantes ins-
trumentos de tachado y de comparació n, presentand o la ventaja de que su aplicación
y corrección son más rápidas. Facilita informació n acerca de la atención concentrada
mediante la medida de la velocidad y la precisión en acciones de comparación y ta-
chado de dos listados. El K-T aún no se encuentra adaptado a la población española y

está pendiente de ser perfeccionado a nivel psicométrico en Francia.
11.42. Pruebas de aptitudes

Dado que estos instrumentos pretenden evaluar el rendimiento del individuo en ac-
tividades que precisan una velocidad y un tiempo de reacción breve, no debe resultar
extraño que bien de una u otra manera el concepto atención acabe apareciendo. De
esta manera es posible pensar que pruebas tradicionales del tipo del Test de aptitudes
mentales primarias (PMA), Test de aptitudes diferenciales (DAT), etc., aparte de infor-
marnos sobre el estado actual del factor razonamiento, numérico, mecánico, etc., fa-
cilitan implícitamente datos sobre ese fenómeno que media entre las diversas funcio-
nes y procesos que controlan a los citados factores.
Con el fin de no extendernos en exceso en esta cuestión, vamos a ocuparnos tan
sólo de cuatro instrumentos recientes.
Aptitudes básicas para la informática (ABI)
De las seis partes que constituyen esta prueba elaborada por Cruz (1986), y aun
cuando todas ellas miden aspectos relacionados con la evaluación, la autora ha ais-
lado dos apartados que se ocupan de detección de errores y codificación. Los estu-
dios de fiabilidad (test-retest) señalan unos valores de 0,94 y 0,97 respectivamente
para cada uno de los subtests. Asimismo, la covariación con la puntuación total al-
canza 0,76 en ambos casos.
Batería de tareas administrativas (BTA)
Este instrumento está formado por ocho pruebas de las que comprobación y codifi-
cación se relacionan directamente con atención y atención concentrada.
Test de aprendizaje visoespacial (VSLT)
Tiene como antecedentes el Test de aprendizaje verbal de California (Delis y cols.,

1987) y el Test de aprendizaje auditivo-verbal (Ivnik y cols., 1990). Sus autores Ma-
lec, Ivnik y Hinkeldey (1991) efectúan un análisis factorial de la prueba que pone de
manifiesto la existencia de tres factores: memoria visoespacial, inteligencia gene-
ral/atención y memoria verbal. Asimismo, sus autores consideran que a medida que
do la edad se va incrementando la relación entre la atención y el factor g de inte-
igencia.
1143. Tareas de atención
Generalmente, estas pruebas se han utilizado en estudios experimentales y de labo-

ratorio cuya generalización de resultados suele ser escasa. Por otro lado, es caracte-
rística la ausencia de datos normativos, baremación, fiabilidad, validez, etc., motivo
por el que se ha optado por denominarlas tareas. Aunque los estudios se iniciaron
recurriendo a tareas auditivas, el desarrollo posterior supuso la inclusión de las vi-
suales, las cuales han tendido a convertirse en tests. En cuanto a las tareas auditivas,
generalmente se han centrado en la escucha dicótica (por ejemplo, Ruiz y Bermúdez
[1992] con pacientes depresivos) o la tarea de Strub y Black [1985]) y escucha selecti-
va en modalidad dicótica. Por lo que respecta a las tareas visuales, éstas suelen glrar
alrededor de las siguientes acciones: identificación rápida, discriminación, aptitudes
espaciales y trazado. De esta forma encontramos la Operación de curva de trazado
de Jolicoeur, Ullman y Mackay (1986), empleada últimamente por McCormick y
Jolicoeur (1992) como estímulo para captar la atención visual, y la Tarea de elección
con tiempo de reacción. Cabe también la posibilidad de emplear las denominadas
Pruebas de control mental, consistentes en pedir al sujeto que cuente, por ejemplo,
desde 100 hacia atrás en series de 7, repetir el abecedario en sentido inverso, etc. Ac-
tualmente es posible hallar la agrupación de diversas tareas que analizan otras tantas
modalidades sensoriales; éste es el caso de las investigaciones de Ellis (1991) y Fein-
berg y Mcllvried (1991). Ellis (1991) utiliza completamiento de sentencias, audición
selectiva, tiempo de reacción motor utilizando la mano no dominante (para facilitar
la focalización de la atención), cálculo numérico y recuerdo de palabras a corto pla-
zo. Por su parte, Feinberg y Mcllvried (1991) conforman lo que denominan una Ba-
tería de tareas atencionales con tarea de resta en series de tres y en sentido inverso
(Lezak, 1983), repetición de sentencias, tachado de letras y la prueba de atención
SOA de la Batería de diagnóstico cognitivo de Kay (1982).
114.4. Pruebas de medida indirecta
Aquí se pueden incluir todas aquellas pruebas existentes, especialmente dedicadas a

la evaluación de la inteligencia, y cuyo análisis clínico aporta datos acerca de la aten-
ción en cualquiera de sus modalidades. Por tanto, no es extraño encontrar que en el
caso de la Escala de inteligencia de Wechsler para adultos (WAIS), Zimmermann y
Woo-Sam (1976) afirmen que los subtests de aritmética, dígitos, clave de números y
figuras incompletas nos facilitan datos acerca de la capacidad de atención, lo cual po-
dría extenderse a la versión para niños (W/SC) —Kaufman (1979) ha establecido un
Índice de libertad para la distracción, sobre cuya utilidad informan Longman, Inglis
y Lawson (1991)— y preescolar (WPPS1). La prueba Beta a partir de los tests de clave
de símbolos o reconocimiento de errores continúa incidiendo sobre la misma cues-
tión. Algo similar sucedería con los tests de factor g de Cattell, el mismo Terman-
Merrill e incluso las pruebas de ritmo de Seashore y de percepción de palabras sin
sentido de la batería de Halstead-Rettan.
Finalmente, de la misma forma que en el caso de la memoria, se han desarrollado
cuestionarios que, en lugar de inducir a realizar una tarea, interrogan al sujeto eva-
luado acerca de sus estilos interpersonales y atencionales. Dentro de ellos posible-
mente sea el de Nideffer (1973) uno de los que mejores resultados facilita (Heilbrun
y Worobow, 1991).
Albert, N. S., Butters, N. y Levin, J. (1979). Temporal gradients in the retrograde amnesia of
patients with alcoholic Korsakoff's disease. Archives ofNeurology, 36, 211-216.
Ash, R. C. (1977). Memory: Clinical assessment and behavior measures. Á short study of the
Weschler memory scale. Tesis doctoral inédita. Universidad de Londres. |
Atkinson, R. C. y Shiffrin, R. M. (1968). Human memory: A proposed system and its control
processes. En K. W. Spence y J. T. Spence (dirs.), The psychology of learning and motiva-
tion: Advances in research and theory (vol. 11). Nueva York. Academic Press.
Babcock, H. y Levy, L. (1940). Test and manual of directions: The revised examination of the
measurement of efficiency of mental functioning. Chicago. Stoelting.
Baddeley, A. D. (1979). The limitations of human memory: Implications for the design of re-
trospectives surveys. En L. Moss y H. Goldstein (dirs.), The recall methods in social scien-
ces. Londres. Educational Institute, Universidad de Londres.
Baddeley, A. D. y Hitch, G. (1974). Working memory. En G. H. Bower (dir.), Recent ad-
vances in learning and motivation (vol. VI11).
Bahrick, H. P. (1979). Maintenance of knowledge: Questions about memory we forget to
ask. Journal of Experimental Psychology: General, 108, 296-308.
Babrick, H. P. y Karis, D. (1982). Long-term colegial memory. En C. R. Puff (dir.), Hand-
book of research methods in intelligence, memory and cognition. Nueva York. Academic
Press.
Bennett-Levy, J. y Powell, G. E. (1980). The subjective memory questionnaire: Án investiga-
tion into the self-reporting of real-life memory skills. British Journal of Social and Clinical
Psychology 19, 177-188.
Benton, A. L. (1945). A visual retention test for clinical use. Archives of Neurology and Psy-
chiatry, 54, 212-216.
Benton, A. L. (1974). The revised visual retention test. Nueva York. Psychological Corpora-
tion.
Benton, A. L. (1981). Test de retención visual. Madrid. TEA.
Benton, A. L. y Hamsher, K. S. (1976). Multilingual aphasia examination. Manual. lowa
City. University of Iowa.
Botwinick, J. y Storandt, M. (1974). Memory related functions and age. Springfield. Charles
Thomas.
Botwinick, J. y Storandt, M. (1980). Recall and recognition of old information in relation to
age and sex. Journal of Gerontology, 35, 70-76.
Broadbent, D. E. (1958). Perception and communication. Londres. Pergamon Press.
Broadbent, D. E. (1971). Attention and stress. Londres. Academic Press.
Broadbent, D. E., Cooper, P. E., Fitzgerald, P. y Parkes, K. R. (1982). The cognitive failures
questionnaire and ¡ts correlates. British Journal of Clinical Psychology 21, 1-16.
Brooks, D. N. y Baddeley, A. D. (1976). Whar can amnesics learn? Neuropsychologia, 14,
111-122,
Burgess, M., Kudanz, A., Ziegler, D. y Greenberg, H. (1970). Prediction of brain damage in
the clinica populations. Perceptual and Motor Skills, 30, 523-534.
Caldwell, B. M. (1954). An evaluation of psychological efects of sex hormona administration
in aged women. Journal of Gerontology, 8, 168-174.
Caldwell, B. M. y Watson, R. L. (1954). An evaluation of sex hormona replacement in aged
women. Journal of Genetic Psychology, 85, 181-200.
Chansky, N. (1967). Validity of the Benton visual retention test. Perceptual and Motor Skills,
24, 1126.
Clark, E., Ferris, S. H., Crook, T. y McCarthy, M. (1982). Paired-associate span and learning
in aging and dementia. Documento inédito.
651
Cockburn, J. y Smith, P. T. (1988). Effects of age and intelligence on everyday memory tasks.
En M. M. Grunenberg, P. E. Morris y R. N. Sykes (dirs.), Practical aspects of memory:
Current research and issues. Nueva Jersey. Wiley.
Cohen, N. J. (1984). Preserved learning capacity in amnesia: Evidence for multiple memory
systems. En L. R. Squire y N. Butters (dirs.), Nexropsychology of memory. Nueva York.
Guilford Press.
Cohen, N. J. y Squire, L. R. (1981). Retrograde amnesia and remote memory impairment.
Neuropsychologia, 19, 337-356.
Cordero, A. (1978). Test de memoria auditiva inmediata. Madrid. TEA.
Craick, E. L M. y Lockhart, R. S. (1972). Levels of processing: A framework for memory re-
search. Journal of Verbal Learning and Verbal Behavior, 11, 671-684.
Cronholm, O. y Molander, L. (1957). Memory disturbances after electroconvulsive therapy.
Acta Psychiatrica Scandinava, 32, 280-306.
Cronholm, O. y Ottoson, J. O. (1963). Reliability and validity of a memory test battery. Acta
Psychiatrica Scandinava, 39, 218-234.
Crook, T., Ferris, S. H. y McCarthy, M. (1979). The mispaled object task: A brief test for me-
mory dusfunction in aged. Journal of the American Geriatrics Society, 27, 284-287.
Crook, T., Ferris, S. H., McCarthy, M. y Rae, D. (1980). The utility of digit recall tasks for as-
sessing memory in the aged. Journal of Consulting and Clinical Psychology, 48, 228-233.
Cruz, M. V. (1986). ABI. Aptitudes básicas para la informática. Madrid. TEA.
Cunningham, W. R. (1986). Psychometric prespectives: Validity and reliability. En L. W.
Poon (dir.), Handbook for clinical memory asessment of older adults. Washington, DC.
American Psychological Association.
Davis, L. J. y Swenson, W. M. (1970). Factor analysis of WMS. Journal of Consulting and Cli-
nical Psychology, 35, 430.
Delis, D. C., Kramer, J. H., Kaplan, E. y Ober, B. A. (1987). The California verbal learning
test. Research Edition. Nueva York. Psychological Corporation.
Deutsch, J. A. y Deutsch, D. (1963). Attention: Some theoretical considerations. Psychologi-
cal Review, 70, 80-90.
Dixon, R. A. y Hultsch, D. F. (1983). Structure and development of metamemory in adult-
hood. Journal of Gerontology, 38, 682-688.
Dujovne, B. E. y Levy, B. 1. (1971). The psychometric estructure of the Weschler memory
scale. Journal of Clinical Psychology, 27, 351-354. |
Egeland, B., Rice, J. y Penny, J. (1967). Inter-scores reliability on the Bender gestalt test and
the revised visual retention test. Journal of Mental Defiency, 72, 96-99.
Egeth, H. y Bevan, W. (1979). La atención. En B. B. Wolman (dir.), Mannal depsicología ge-
neral. Bases orgánicas de la conducta y percepción (vol. 11).Barcelona. Martínez Roca.
Ellis, H. C. (1991). Focused attention and depressive deficits in memory. Journal of Experi-
mental Psychology: General, 120, 310-312. : :
Ericksonn, R. C. y Howieson, D. (1986). The clinicians perspective: Measurmg change and
treatment effectiveness. En L. W. Poon (dir.), Handbook for clinical memory asessment of
older adults. Washington, DC. American Psychological Association.
Ericksonn, R. C., Poon, L. W. y Walsh-Sweeney, L. (1980). Clinical memory testing of the
elderly. En L. W. Poon, J. L. Fozard, L. S. Cermack, D. Arenberg y L. W. Thompson
(dirs.), New directions in memory and aging. Hillsdale. Erlbaum. — a
Ericksonn, R. C. y Scott, M. 1. (1977). Clinical memory testing: Ás review. Psychological Bu-
lletin, 84, 1130-1149. : : bread
of children
Erlenmeyer-Kimling, L. y Cornblatt, B. (1978). Attentional measures in a study
ee
at high risk for schizophrena. Journal of Psychiatric Research, 14, 93-98.
y Haldstead, H. (1945). The memory function. American Journal of Psi-
Eysenck, H. ].
chiatry, 102, 174-180.
Feinberg, J. R. y Mcllvried, E. J. (1991). WA/S-R intrasubtest scatter in a chronic schizophre-

nic population: Is it atrentional problem? Journal of Clinical Psychology, 47, 327-335.
Fernández-Ballesteros, R. (1976, 1977). Adaptación experimental de la Escala de memoria de
Weschler. Madrid. Universidad Autónoma de Madrid.
Fernández-Ballesteros, R., Díaz, P., Souto, E., Hernández, J. M., Izal, M. y Gallego, A.
(1986). Tratamientos conductuales sobre memoria en ancianos. Comunicación presentada
al V Congreso Organizado por la Asociación Venezolana para el Avance de las Ciencias
del Comportamiento. Caracas, Venezuela. a
Fields, F. (1971). Relative effects of brain damage on the Weschler memory and intelligence
questionnaire. Diseases of the Nervous System, 32, 673-675.
Flavell, J. H. (1977). Cognitive development. Englewood Cilffs. Prentice Hall.
Fozard, J. L. (1980). The time of remembering. En L. W. Poon, J. L. Fozard, L. S. Cermack,
D. Arenberg y L. W. Thompson (dirs.), New directions in memory and aging: Procee-
dings of the G. A. Talland Memorial Conference. Hillsdale. Erlbaum.
Gilbert, J. G. y Leeve, R. F. (1971). Patterns of declining memory. Journal of Gerontolog)y,
26,70=75.
Gilbert, J. G., Leeve, R. F. y Catalano, F. L. (1968). A preliminay report on a new memory
scale. Perceptual and Motor Skills, 27, 277-278.
Gilewski, M. J. y Zelinski, E. M. (1986). Questionnaire asessment of memory complaints. En
L. Y. Poon (dir.), Handbook for clinical memory assessment of elderly adults. Washing-
ton D.C. American Psychological Association.
Gilewski, M. J., Zelinski, E. M., Schaie, K. W. y Thompson, L. W. (1983). Abbreviating the
metamemory questionnatre: Factor structure and norms for adults. Comunicación presen-
tada en el Annual Meeting of American Psychological Association. Araheim, EE UU.
Goldberg, Z., Syndulko, K., Lemon, J., Montan, B., Ulmer, R. y Tourtellotte, W. W. (1981).
Everyday memory problems in older adults. Comunicación presentada en Annual Mee-
ting of American Psychological Association. Los Ángeles, EE UU.
Graham, F. K. y Kendall, B. J. (1946). Performance of brain damaged cases on memory for
designs test. Journal ofAbnormal and Social Psychology, 41, 303-314.
Graham, F. K. y Kendall, B. J. (1960). Memory for designs test: Revised general manual. Per-
ceptual and Motor Skills, 11, 147-188.
Hall, J. C. y Toal, R. (1957). Reliability (internal consistency) of the Weschler memory scale
and correlations with the Weschler-Believe intelligence scale. Journal of Consulting Psy-
chology, 21, 131-135.
Halperin, J. M., Wolf, L. M. y Pascualvaca, D. M. (1988). Differential assessment of attention
and impulsivity in children. Journal of American Academic Child and Adolescence Psy-
chiatry, 27, 326-329.
Harris, J. E. y Sunderland, A. (1980). Head injury postal questionnaire. Comunicación pre-
sentada en el Trauma International Meeting. Northampton.
Heaton. R. K., Baade, C. E. y Johnson, K. L. (1978). Neuropsychological test results asocia-
ted with psychiatric disorders in adults. Psychological Bulletin, 85, 141-162.
Heilbrun, A. B. y Worobow, A. L. (1991). Attention and disordered eating behavior: 1. Di-
sattention to satiety cues as a risk factor in the development of bulimia. Journal of Clinical
Herrmann, D. J. (1979). The validity of memory questionnaires as telated to a theory of me-
mory introspection. Comunicación presentada en el British Psychological Meeting. Lon-
dres, Gran Bretaña.
Herrmann, D. J. (1984). Questionnaires about memory. En J. E. Harris y P. E. Morris (dirs.),
Everyday memory: Actions and absent-midedness. Londres. Academic Press.
Herrmann, D. J., Grubs, L., Sigmundi, R. y Gruenich, R. (1983). Awareness of memory apti-
tude as a function of memory experience. Nueva York. British Psychological Society.
Herrmann, D. J. y Neisser, U. (1978). An inventory of everyday memory experiencies. En
653
e dypla b E. Morris y R. peSykes (dirs.), Practical aspects of memory. Lon-
Howard, A. R, (1954). Further validation of The WMS with selected groups of institucionali-
zed patients. Journal of Consulting Psychology, 10, 164-167.
He o Mel Gs; Minds $ey Comen, A. (1978). The hyperactive child at adolescence:
E A emotional and social functioning. Journal of Abnormal Child Psychology, 6,
Hughes, H. C. y Zimba, L. D. (1985). Spatial maps of directed visual attention. Jonrnal of Ex-
perimental Psychology: Human Perception and Performance, 11, 409-430.
Hughes, H. C. y Zimba, L. D. (1987). Natural boundaries for the spatial spread of directed
visual attention. Nenropsychología, 25, 5-18.
o Ba M. (1966). Age differences in WMS scores. Journal of Genetic Psychology, 109,
Ivinskis, A., Allen, S. y Shaw, E. (1971). An extension of WMS norms to lower age groups.
Journal of Clinical Psychology, 27, 354-357.
Ivnik, R. J., Malec, J. F., Tangolos, E. G., Petersen, R. C., Kukmen, E. y Kurland, L.T. (1990).
The auditory verbal learning test (AVLT). Psychological Assessment, 2, 304-312.
Johnston, N. A. y Heinz, S. P. (1978). Flexibility and capacity demands of attention. Journal
of Experimental Psychology: General, 102, 420-437.
Jolicoeur, Ullman, S. y Mackay, M. (1986). Curve tracing: A posible basic operation in the
perception of spatial relations. Memory and Cognition, 14, 129-140.
Kahneman, D. (1973). Attention and effort. Nueva Jersey. Prentice Hall.
Kaufman, A. S. (1979). Intelligent testing with the WISC-R. Somerset. Wiley.
Kay, S. (1982). Manual for the cognitive diagnostic battery. Odessa. Psychological Assess-
ment Resources.
Kear-Colwell, J. J. (1973). The structure of WMS and its relationship to brain damage. British
Journal of Social and Clinical Psychology, 12, 384-392.
Keenan,J.M., MacWhinney, B. y Mayhew, D. (1977). Pragmatics in memory: A study of na-
tural conversation. Journal of Verbal Learning and Verbal Behavior, 16, 549-560.
Kidd, G. R. y Greenwald, A. G. (1988). Attention, rehearsal, and memory for serial order.
American Journal of Psychology, 101, 259-279.
Kimura, D. (1963). Right temporal lobe damage. Archives of Neurology, 8, 264-271.
Lezak, M. D. (1979). Recovery of memory and learning functions following traumatic brain
injury. Cortex, 15, 63-70.
Lindsay, P. H. y Norman, D. A. (1983). Introducción a la psicología cognitiva (2* ed.). Ma-
drid. Tecnos.
Longman, R.S., Inglis,J.y Lawson, J. S. (1991). WISC-R patterns of cognitive abilities in beha-
vior disorded and learning disabled children. Psychological Assessment, 3, 239-246.
Malec, J. F., Ivnik, R. y Hinkeldey, N. S. (1991). Visual spatial learning test. Psychological As-
sessment, 3, 82-88.
McCarthy, M., Ferris, S. H., Clarck, E. y Crook, T. (1981). Acquisition and retention of cate-
gorized material in normal aging and senile dementia. Experimental Aging and Research, 7,
127-135.
McCormick, P. A. y Jolicoeur, P. (1992). Capturing visual attention and the curve tracing
operation. Journal of Experimental Psychology: Human Perception and Performance, 18,
72-89.
ng of geria-
Meer, B. y Baker,J.A. (1965). Reliability of measurement of intellectual functioni
tric patients. Journal of Gerontology, 20, 410-414... ;
M. (1960). Defects of learning ability with massive lesions of the tem-
Meyer, V. y Falconer,
poral lobe. Journal of Mental Sciences, 106, 472-477.
Milner, B. (1958). Psychological defects produced by temporal lobe excision. Research Ner-
vous and Mental Disorders, 36, 244-257. ,
Milner, B. (1971). Interhemispheric differences in the localization of psychological proceses
in man. British Medical Bulletin, 27, 272-277.
Mitchell, D. B. (1989). How many memory systems? Evidence from aging. Journal of Expe-
rimental Psychology: Learning, Memory and Cognition, 15, 31-49.
Montorio, C. (1990). Evaluación psicológica en la vejez: instrumentación desde un enfoque
multidimensional. Tesis doctoral inédita. Universidad Autónoma de Madrid.
Mordkoff, J. T. y Yantis, S. (1991). An interactive race model of divided attention. Journal of
Experimental Psychology: Human Perception and Performance, 17, 520-538.
Morris, P. E., Grunenberg, M. M., Sykes, R. y Merrick, A. (1981). Football knowledge and
the acquisition of new recall. British Journal of Psychology, 72, 479-484.
Neisser, U. (1978). Memory: What are the important questions. En M. M. Grumenberg,
P. E. Morris y R. N. Sykes (dirs.), Practical aspects of memory. Londres. Academic Press.
Newcombe, F. (1969). Missile wounds of the brain. Londres. Oxford University Press.
Nideffer, R. (1973). Preliminary manual for the test of attentional and interpersonal styles.
Rochester. University of Rochester.
Niederehe, G., Nielsen-Collins, K. E., Volpendesta, D. y Woods, A. M. (1981). Metame-
mory processes in perception: Depression and age effects. Comunicación presentada en la
reunión de la Gerontological Society of America. Toronto, Canadá.
Osterreith, P. A. (1944). Le test du copie d'une figure complexe. Archives de Psychologie, 30,
206-256.
Pashler, H. (1991). Shifting visual attention and selecting motor responses: Distinct attentio-
nal mechanisms. Journal of Experimental Psychology: Human Perception and Perfor-
mance, 17, 1023-1040.
Perlmutter, M. (1978). What is memory aging the aging of? Developmental Psychology, 88,
3-32.
Peterson, M. R. y Peterson, M. J. (1959). Short-term retention of individual items. Journal of
Experimental Psychology, 58, 193-198.
Posner, M., Sandson, J.. Dhawan, M. y Shulman, G. (1989). Is word recognition authomatic?
A cognitive anathomical approach. Journal of Experimental Psychology: Human Percep-
tion and Performance, 5, 522-526.
Randt, C. T., Brown, E. R. y Osborne, D. P. (1980). A memory test for longitudinal measu-
rement of mild to moderate defficits. Clinical Neuropsychology, 2, 184-194.
Rapaport D., Gill, M. M. y Schafer, R. (1945). Diagnostic pychological testing. Nueva York.
International Universities Press.
Reason, J. T. (1981). Lapses of attention. En R. Parasuraman, R. Daves y J. Bentty (dirs.), Va-
rietes of attention. Londres. Academic Press.
Riege, W. H. (1982). Self-reports and test of memory aging. Clinical Gerontologist, 1, 23-26.
Rizzolatti, G., Riggio, L., Dascola, I. y Umilta, C. (1987). Reorienting attention across the
horizontal and vertical meridians: Evidence in favor a premotor theory of attention. Neu-
ropsychologta, 25, 31-40.
Rodríguez-González, J. M. y Mesa, P. ]. (1987). Planteamientos clínicos en la valoración de
las actividades intelectuales, los procesos cognitivos y sus alteraciones. En A. Blanco
(dir.), Apuntes de diagnóstico clínico. Valencia. Promolibro.
Rodríguez-González,J.M. y Mesa, P. J. (1990). Planteamientos clínicos en la valoración de la
inteligencia, los procesos cognitivos y sus alteraciones. En A. Blanco (dir.), Apuntes de
diagnóstico clínico (2* ed.). Valencia. Promolibro.
Rosel, E. (1990). Palabras 1 (Test de observación). Manual. Madrid. TEA.
Rosvold, H. E., Mirsky, A. F., Saranson, I., Bransome, E. D. y Beck, L. H. (1956). A. conti-
nous performance test of brain damage. Journal of Consulting Psychology, 20, 343-350.
655
Ruiz, A. y Bermúdez, ]. (1992). Estado de ánimo deprimido, atención dividida y procesa-

miento de la información. Revista de Psicología General y Aplicada, 45, 43-48.
paisas J. . PSA Litto del00 cognitivo esquizofrénico. En R. Fernández-
Gredo, eros,
a ybaJ. a
A. Carrobles (dirs.),) ción
Evaluació conductual. k Metodología» y aplicacione
ICACi s
Ruiz-Vargas, J. M. y Botella, J. (1981). Limitaciones de procesamiento y selectividad atencio-
nal. Estudios de Psicología, 7, 30-41.
Ruiz-Vargas, J. M. y Botella, J. (1982). Atención y capacidad de procesamiento de la informa-
ción. En 1. Delclaux y J. Seoane (dirs.), Psicología cognitiva y procesamiento de la informa-
ción. Madrid. Pirámide.
Ruiz-Vargas, J. M. y Botella, J. (1987). Atención. En J. M. Ruiz-Vargas (dir.), Esquizofrenia:
un enfoque cognitivo. Madrid. Alianza.
Russell, E. W. (1975). A multiple scoring method for the asseessment of complex memory
functions. Journal of Consulting and Clinical Psychology, 43, 800-809.
Sánchez-Cánovas, J. (1987). Adaptación de los cuestionarios Cognitive Failures Question-
naire y Memory Failures in Everyday. Valencia. Universidad de Valencia.
Sánchez-Cánovas, J. y García Martínez, J. (1991). Evaluación cognitiva de los trastornos de
memoria. Comunicación presentada en el Simposium Internacional sobre Aspectos Ac-
tuales del estudio de la Memoria Normal y Patológica. Murcia.
Schacter, D., Wang, P. L., Tulving, E. y Freedman, P. C. (1982). Functional retrograde amne-
sia: A cuantitative case study. Neuropsychología, 20, 523-532.
Schulman, G. L., Remington, R. y Mc Lean, J. P. (1979). Moving attention through visual
space. Journal of Experimental Psychology: Human Perception and Performance, 5, 522-
526.
Seisdedos, N. (1976). Vocales. Manual. Madrid, TEA.
Seisdedos, N. (1980). Consonantes. Manual. Madrid. TEA.
Shapiro, M. B. y Nelson, E. H. (1955). An investigation of the nature of cognitive impairment
in cooperative psychiatric patients. British Journal of Medical Psychology, 28, 239-256.
Silverstein, A. B. (1962). Perceptual motor and memory function in the visual retention test.
American Journal of Mental Deficiency, 67, 613-617.
Smith, A. D. (1975). Partial learning and recognition memory in the aged. International Jour-
nal ofAging and Human Developement, 6, 359-365.
Smith, A. D. (1980). Age differences in encoding, storage and retrieval. En L. W. Poon, J. L.
Fozard, S. L. Cermack, D. Arenberg y L. W. Thompson (dirs.), New directions in me-
mory and aging: Procedings of G A Talland memorial conference. Hillsdale. Erlbaum.
Snow, W. G. (1979). The Rey-Osterrieth complex figure test as a measure of visual recall. Co-
municación e la 7th Annual Conference of International Neuropsychologi-
cal Society. Nueva York, EE UU.
Sostek, A. ana: M. y Rapoport, S. (1980). Effects of amphetamine on vigilance per-
formance in normal and hyperactive children. Journal of Abnormal Child Psychiatry, 8,
491-500.
Speedie, L. J. y Heilman, K. M. (1982). Amnesic disturbance following infarction of the left
dorsomedial nucleus of the thalamus. Nexropsychología, 20, 597-604.
Squire, L. R. (1982). The neuropsychology ot human memory. Annual Review of Neuro-
sciences, 5, 241-273. A ñ
Squire, L. R. y Fox, M. M. (1980). Assessment of remote memory —validation of the televi-
sion test by repeated testing during a 7 year period. Behavior Research Methods and Ins-
trumentation, 12, 583-585. |
Stenberg, D. E. y Jarvik, M. E. (1976). Memory functions in depression. Archives of General
Psichiatry, 33, 219-224. Boo en LA 2
J. L. y Digiacomo, J. N. (1970). Daily administer ed uniliateral ECT. Biological Psi-
Stinnett,
chiatry, 3, 303-306.
Stone, C. P. y Weschler, D. (1946). Weschler memory scale manual. Nueva York. Psycholo-
gical Corporation.
Strub, R. L. y Black, F. W. (1985). Mental status examination in neurology (2* ed.). Filadelfia.
F. A. Davis. :
Struckett, P. B. (1953). Effect of prefrontal lobotomy on intellectual functioning 1 cronic
schizophrenia. Archives of Neurology and Psichiatry, 69, 293-304. ;
Suárez-Noguerol, M. I. (1990). Activación automática y errores cometidos en tareas atencio-
nales. Revista de Psicología General y Aplicada, 43, 463-467.
Sunderland, A., Harris, J. E. y Gleave, S. (1984). Memory failures in everyday memory follo-
wing severe head injury. Journal of Clinical Neuropsychology, 6, 127-142.
Sykes, D. H., Douglas, V. L y Weiss, G. (1971). Attention and hyperactive children and the
effects of methylphenidate. Journal of Child Psychology and Psychiatry, 2, 129-139.
Taylor, E. M. (1959). The appraisal of children with cerebral deficits. Cambridge. Harvard
University Press.
TEA (1975). C.L. Cuadrados de letras. Manual. Madrid. TEA.
TEA (1979). Formas idénticas. Madrid. TEA.
TEA (sin fecha). BTA. Batería de tareas administrativas. Manual. Madrid. TEA.
Thompson, L. W. (1980). Testing and mnemonic strategies. En L. W. Poon, J. L. Fozard,
S. L. Cermack, D. Arenberg y L. W. Thompson (dirs.), New directions in memory and
aging: Procedings of G A Talland memorial conference. Hillsdale. Erlbaum.
Thurstone, L. L. (1944). A factorial study of perception. Psychometrics Monograp»s, 4.
Tsal, Y. (1983). Movements of attention across the visual field. Journal of Experimental Psy-
chology: Human Perception and Performance, 9, 523-530.
Tulving, E. (1985). How many memory systems are there? American Behavior and Brain
Sciences, 7, 223-238.
Vega, M. (1984). Introducción a la psicología cognitiva. Madrid. Alianza.
Victor, M., Talland, G. A. y Adams, R. D. (1959). Psychological studies of Korsakoff's psy-
chosis. I. General intellectual function. Journal of Nervons and Mental Disesases, 128,
528-537.
Walton, D. (1958). The diagnostic and predictive accuracy of WMS in psychiatrics patients
over 65. Journal of Mental Sciences, 104, 1111-1118.
Walton, D. y Black, D. A. (1957). The validity of psychological test of brain damage. British
Journal ofMedical Psychology, 30, 270-279.
Wang, P., Kaplan, J. y Rogers, E. (1959). Memory functioning in hemiplegics: A neuropsy-
chological analysis of WMS. Archives of Physical Medicine and Rehabilitation, 32, 213-
220.
Warrington, E. K. (1984). The recognition memory test. National Foundation for Educational
Research. Windsor. Inglaterra.
Warrington, E. K. y James, M. (19674). Disorders of visual perception in patients with locali-
zed cerebral lesions. Neuropsychología, 5, 253-366.
Warrington, E. K. y James, M. (19675). An experimental investigation of facial recognition in
patients with unilateral cerebral lesions. Cortex, 3, 317-326.
Warrington, E. K. y Sanders, H. 1. (1971). The fate of old memories. Quarterly Journal of Ex-
perimental Psychology, 23, 432-442.
Wells, F. L. y Martin, A. (1923). A method of memory examination suitable for psychotic ca-
ses. American Journal of Psychiatry, 3, 243-258.
hi3 D. (1945). A standarized memory scale for clinical use. Joxrnal of Psychology, 19,
Williams, M. (1958). The measurement of memory in clinical practice. British Journal of So-
cial and Clinical Psychology, 7, 19-34.
Wilson, B. A. (1987). Rehabilitation ofmemory. Londres. Guilford Press.
Wilson, B. A., Cockburn, J. y Baddeley, A. D. (1985). The Rivermead behavioural memory

test. Londres. Thames Valley Test Company.
Yela, M. (1979). Caras. Percepción de diferencias. Manual (3* ed.). Madrid. TEA.
e Es Sperry, E. W. (1974). Memory impairment after commissurotimy in man. Brain, 97,
Zarit, J. H., Cole, K. D. y Guider, R. C. (1981). Memory training strategies and subjetive
compliments of age in the aged. The Gerontologist, 21, 158-164.
Zelinsk1, E. M., Gilewski, M. J. y Thompson, L. Y. (1980). Do laboratoy test relate to self as-
sessment of memory ability in the young and old? En L. W. Poon, J. L. Fozard, L. S. Cer-
mack, D. Arenberg y L. W. Thompson (dirs.), New directions in memory and aging.
Hillsdale. Erlbaum.
Zimmermann, Í. L. y Woo-Sam,J.M. (1976). WA/s. Interpretación clínica de la escala de inte-
ligencia de Wechsler para adultos. Madrid. TEA.
Zubrick, J. y Smith, A. (1979). Minnesota test for differential diagnosis in aphasia (revision).
En F. 1. Darley (dir.), Evaluation of appraisal techniques in speech and language patho-
logy. Minnesota. Addison-Werley Readings.
Baddeley, A. D. (1984). Su memoria. Madrid. Debate.

Cooper, L. A. y Regan, D. T. (1987). Atención, percepción e inteligencia. En R. J. Sternberg
(dir.), Inteligencia humana. 11. Cognición, personalidad e inteligencia. Barcelona. Paidós.
Harris,J.E. y Morris, P. E. (dirs.) (1984). Everyday memory: Actions and absent-mindedness.
Londres. Academic Press.
Poon, L. Y. (dir.) (1986). Handbook for clinical memory asessment of older adults. Washing-
ton, D. C. American Psychological Asssociation.
Poon, L. W., Fozard, J. L., Cermack, L. S., Arenberg, D. y Thompson, L. W. (dirs.) (1980).
New directions in memory and aging. Hillsdale. Lawrence Erlbaum.
Ruiz-Vargas, J. M. y Botella, J. (1987). Atención. En J. M. Ruiz-Vargas (dir.), Esquizofrenia.
Un enfoque cognitivo. Madrid. Alianza.
Vega, M. (1984). Introducción a la psicología cognitiva. Madrid. Alianza.
Wilson, B. A. (1987). Rehabilitation of memory. Londres. Guilford Press.
nn
A
TER steel ara doo
Ai upoña, |. we.(19801 Fe
ret Í
"EN Ascnb
Ea PARE aj
ns y í ” él
Y ESPA ON
- 1 pa
+ A A y
le - A a
>, £ ¿ y as |y
ts Za e »
FS] CAME LA
Po q ., Pdf”
e Ti AA
SS
Er
AN
¿lr
INS
Eel ho Tit We aa,
sd ÑLe 5177 J 1.1| bnrspal Mi
7 pp opseN h
la ciAa un
y.
G
27. EVALUACIÓN DEL DESARROLLO SENSORIOMOTOR
CARMEN MAGANTO
L INTRODUCCIÓN
El indudable interés que este tema despierta deriva de la importancia que la evalua-
ción psicológica de los bebés ha adquirido para el diagnóstico precoz de los retrasos,
con las consiguientes intervenciones preventivas y/o terapéuticas. Esto ha sido posi-
ble merced a los progresivos desarrollos de la psicología evolutiva, la psicopatología,
la pediatría, las investigaciones en etología y metodología del desarrollo, entre otras
ciencias, que han dotado de rigor a la evaluación del desarrollo sensoriomotor en la
primera etapa de la vida humana. Dos aspectos han sido determinantes en la consoli-
dación de la citada evaluación:
a. La toma de conciencia por parte de una serie de autores como Piaget, Wa-
llon, Spitz, Gesell, Bowlby, etc. de que el valor de estos años va a ser de una impor-
tancia capital para el desarrollo de la persona; así, estos autores elaboran diferentes
teorías explicativas del desarrollo infantil.
b. El surgimiento de inventarios de conducta, de los cuales se van a derivar las
escalas evolutivas más actuales. Surgen, como veremos seguidamente, registros com-
portamentales y escalas de desarrollo que propiciarán la evaluación del desarrollo
infantil.
La preocupación por las diferencias individuales, tanto en el comportamiento

como en el modo de reacción de los sujetos, viene desde antiguo. Recordemos que
Gesell hacía ya estas observaciones a los pocos días del nacimiento de un bebé. Se-
gún Korner (1972), Brazelton (1973), Thomas y Chess (1977) y Fullard (1984), las
diferentes respuestas de los bebés ante los mismos estímulos provienen de dos fuen-
tes de variación: las competencias del recién nacido y las variaciones ambientales, en
mutua interacción constante. La idea básica que subyace a la primera fuente de va-
riación es que el niño no es una tabula rasa, sino alguien competente desde el naci-
miento. En torno a este concepto se ha desarrollado todo un ámbito de evaluación
con técnicas específicas de diagnóstico, denominadas escalas de desarrollo. Estas es-
calas posibilitan evaluar estas competencias y la interacción con elmedio, especial-
mente con la madre como figura significativa y fuente de estimulación en el entorno
del bebé. Los instrumentos diagnósticos han tomado en consideración este aspecto
del desarrollo, que se observa desde las primeras edades y que se prolonga, con im-
portantes cambios en cuanto a concepto y tests elaborados para tal fin, hasta la edad
adulta.
Universidad del País Vasco.

660 Carmen Maganto
En 1916 se crea una escala integrada por un conjunto de pruebas, cuyos auto-
res son Izard y Simon, con un rango de aplicación desde los 3 a los 24 meses, en
la que se fijan diferentes etapas evolutivas determinadas por el desarrollo percep-
tivo. En función de los tests realizados se indicaba el desarrollo intelectual que
tenía el niño. El estudio minucioso y detallado sobre el desarrollo de niños nor-
males se debe a Gesell. La Escala de desarrollo por él creada con algunas varia-
ciones ha llegado hasta nuestros días. Utilizando tanto una metodología longitu-
dinal como transversal, sistematiza las etapas evolutivas desde el nacimiento hasta
la adolescencia. A través de los registros de observación comportamental com-
pendia cuatro tipos de conductas: motora, adaptativa, verbal y personal-social.
Para algunos autores le corresponde el mérito de haber refrendado la psicología
evolutiva. Su influencia en el campo del diagnóstico es de máxima relevancia. Las
derivaciones de la influencia de este autor llevaron a Brunet-Lezine a publicar la
Escala de desarrollo de la primera infancia. Otra escala construida en 1933 por
Bayley ha dado lugar posteriormente a las Bayley scales of infant development
[Escalas de desarrollo infantil] de amplia utilización en el ámbito clínico y en la
investigación, especialmente en comparaciones de muestras transculturales.
Piaget en su libro El nacimiento de la inteligencia en el niño pequeño plantea un
método clínico-experimental de exploración. Las pruebas desarrolladas en la teoría
plagetiana tienen como finalidad conocer en qué estadio de la inteligencia se encuen-
tra el niño: sensoriomotor, operatorio, etc. Las pruebas más representativas basadas
en la teoría del investigador suizo son las de Casati y Lezine (1968) publicadas en
Erancia y las de Uzgiris y Hunt (1975) desarrolladas en Estados Unidos.
La importancia concedida a los factores biológicos y al desarrollo neurológico
llevan a Brazelton a explicar el comportamiento infantil desde el análisis de los
mismos, partiendo de la comprobación experimental de las competencias del re-
cién nacido. La evaluación se basa en el estudio de las respuestas cualitativas del
niño en un proceso de interacción y adaptación, realizada a través de la Neonatal
behavioral assessment scale [Escala para la evaluación del comportamiento neona-
tal]. En otra línea de investigación, Butterbaugh (1988) se interesa por los aspectos
psicométricos y clínicos de los tests de desarrollo neurológico infantil, abogando
por continuar trabajando con los mismos hasta dotarlos de las garantías necesa-
rias. Es un ámbito de la evaluación infantil realizado en colaboración con los equi-
pos asistenciales de salud y que debe ir tomando primacía en el diagnóstico del
desarrollo.
La evaluación sensoriomotora debe contemplar el desarrollo personal global
en la consideración del sujeto como totalidad y debe situarlo dentro de un contex-
to y en un proceso continuo de aprendizaje en el que el niño es a la vez receptor y
actor del mismo, sujeto activo y pasivo, en una continua interacción con el am-
biente donde se desenvuelve. Asimismo, debe estudiar el sujeto infantil que evolu-
ciona, madura y se desarrolla, así como las condiciones para lograrlo. Abordar el
concepto de desarrollo, las características del mismo, la significación de patrón de
desarrollo y su incidencia en la evaluación sensoriomotora, es requisito previo
para situar adecuadamente la comprensión de las escalas de evaluación en el pri-
mer período de la vida.
Evaluación del desarrollo sensoriomotor
661
IL. CONCEPTO DE DESARROLLO Y SU IMPORTANCIA EN LA EVALUA

CIÓN
DEL DESARROLLO SENSORIOMOTOR DE LA PRIMERA INFANCI
A
La idea matriz de la evaluación del desarrollo parte del presupuesto de que el creci-
miento de cada Persona corresponde a categorías esenciales únicas, pero la vida de
los diversos individuos sigue un patrón general de desarrollo. «La psicología del de-
sarrollo es el estudio científico de los cambios conductuales, cognoscitivos y de la
personalidad que ocurren durante los ciclos de vida de los organismos» (Sarafino y
Armstrong, 1988, p. 14). Esta definición contiene tres ideas básicas en las que se debe
sustentar la evaluación del desarrollo sensoriomotor: la idea de cambio, las diferen-
tes áreas en las que éste se opera y el aspecto longitudinal de dicho cambio. Los psi-
cólogos del desarrollo coinciden en afirmar la necesidad fundamental de un cuadro
preciso del patrón de desarrollo para poder comprender a los niños. Reconocen
también que el conocimiento de lo que provoca variaciones en el desarrollo es esen-
cial para entender a cada niño individualmente. Los patrones del desarrollo se rigen
por leyes con características de continuidad, direccionalidad, irreversibilidad, dife-
renciación e integración.
El desarrollo es un proceso continuo, pero esto no significa que deba ser consi-
derado como una sucesión simple y rígida de etapas. Significa que la secuencia en las
adquisiciones es la misma para todos los niños, pero el grado de desarrollo varía con
cada uno de ellos. Sin embargo, puesto que el desarrollo es continuo, lo que sucede
en una etapa influye en la siguiente. Por otro lado, el desarrollo se refiere a cambios
cualitativos y cuantitativos. Se puede definir como una serie progresiva de cambios
ordenados y coherentes. Progresivo significa que los cambios son direccionales y
que avanzan, en lugar de retroceder. Que sea direccional sugiere que sigue un curso
coherente hacia la madurez. Aquí radica la posibilidad de predecir el desarrollo y la
evaluación. Por ejemplo, todos los bebés siguen la misma secuencia direccional de
vocalización hasta lograr las primeras palabras, se ponen de pie antes de caminar y
trazan círculos antes que cuadrados. Normalmente, en ningún caso se invierte ese
orden. El ritmo de desarrollo es diferente según las áreas y según los individuos,
pero en todas las edades es irreversible. Tanto en las respuestas mentales como en las
motoras, la actividad general precede siempre a la específica.
Las diferencias individuales en el ritmo de maduración evolutiva, así como las di-
ferencias en las diversas áreas en un mismo individuo, explican los desajustes evolu-
tivos. Los psicólogos del desarrollo han comprobado repetidamente que existen va-
riaciones en la conducta de los niños en diferentes edades, pero que no se deben
pasar por alto las variaciones notables que se dan en sujetos de la misma edad. La
evaluación de las diferencias individuales encuentra aquí su justificación. El patrón
de diferenciación hace relación a la progresiva complejidad en la adquisición evoluti-
va de la individuación y especialización, a nivel biopsicofisiológico. La diferencia-
ción cobra sentido gracias a otro patrón de integración que regula eldesarrollo; éste
organiza los componentes diferenciados en adquisiciones madurativas que precisan
estructuras más complejas. La idea de totalidad expresada por Sroufe y Rutter (1984)
va en la misma línea. Cada conducta está determinada y entendida como una totali-
dad globalizadora y significativa de adquisiciones más simples. En concordancia con
662 Carmen Maganto
este principio de progresivas organizaciones más complejas de la conducta, está la

concepción teórica de Staats (1979), que propone la noción de repertorios básicos de
conducta, entendidos «no como una mera categoría descriptiva de las conductas de
un individuo, sino que éstos adquieren una función dinámica y causal en la medida
en que, en torno a ellos, se organiza el aprendizaje y la experiencia del sujeto, en una
situación determinada» (Vizcarro, 1983, p. 331). El concepto de continuidad y cam-
bio en el desarrollo proviene de estas reorganizaciones progresivas en las que, por
paradójico que parezca, el cambio es manifiesto, pero la continuidad también se da.
Indudablemente, las interacciones con el ambiente mediatizan estas reorganiza-
ciones.
Cada período del desarrollo supone conseguir una serie de logros evolutivos.
Aquí justifican las teorías evolutivo-genéticas su clasificación en etapas o períodos.
A su vez, esto implica que determinadas conductas son adaptativas o esperables (en
relación a la “norma”) a una determinada edad, pero no lo son en otro momento an-
terior o posterior. Estos logros evolutivos y movilidad funcional derivan y compro-
meten la adaptación del sujeto a su ambiente. El desarrollo está programado genética
e individualmente, pero interactúa con múltiples variables ambientales que actuali-
zan el potencial genético, produciéndose la maduración y aprendizaje, elementos in-
teractivos a su vez del desarrollo humano. El proceso de desarrollo constituye un
vínculo crucial entre los determinantes genéticos y las variables ambientales. La con-
ducta no es una respuesta al estímulo ambiental, sino que el niño percibe selectiva-
mente y organiza su experiencia en función de todo el bagaje de acontecimientos y
adaptaciones progresivas realizadas anteriormente. Por ello, el desarrollo se com-
prende como una perspectiva en espiral, en que lo viejo queda reorganizado en lo
nuevo.
Describir el desarrollo supone recabar datos del máximo número posible de su-
jetos y organizarlos de acuerdo a características comunes. Los datos así organizados
se llaman “normativos” porque indican la “frecuencia” con que los niños adquieren
o superan determinados logros, conductas o funciones. A partir de estas normas es
posible explicar y predecir el desarrollo y la conducta. Véase el anexo 1. Las ideas
provenientes del psicoanálisis, de la etología y antropología, en concreto de Bowlby
y Spitz, sobre la importancia de las experiencias tempranas, han promovido en la
psicología en general, y en el psicodiagnóstico infantil en particular, la necesidad de
conocer e identificar, lo más precozmente posible, los factores de riesgo, de vulnera-
bilidad en determinados sujetos, a través del diagnóstico precoz y de cara a la pre-
vención primaria. De aquí la identificación de pautas de crianza y otras variables del
contexto familiar y ambiental, consideradas estresoras y generadoras de patología o
retrasos adquisitivos más o menos graves, realizando a partir de ellas un pronóstico a
corto, medio o largo plazo. De aquí la importancia de la evaluación del desarrollo.
Como conclusión, saber cuál es el patrón de desarrollo tiene un valor tanto cien-
tífico como práctico, especialmente para la evaluación psicológica infantil; ello res-
ponde a varias razones. En primer lugar, el conocimiento del patrón de desarrollo
humano permite conocer qué es lo común y usual en los niños, aproximadamente a
qué edades esperar distintos patrones de conducta y cuándo se reemplazarán nor-
malmente esos patrones por otros más maduros. En segundo lugar, saber qué espe-
rar permite establecer lineamientos en forma de escalas de edad mental y de desarro-
663
llo social o emocional. Puesto que el patrón de desarrollo para todos los niños nor-
males es aproximadamente el mismo, es posible evaluar a cada sujeto en función de
las normas para su grupo de edad. En tercer lugar, conocer que un bebé está capaci-
tado, por ejemplo, para aprender a caminar, sugiere que debemos facilitarle oportu-
nidades para practicarlo. La falta de oportunidad y estímulo puede retrasar el de-
sarrollo normal.
Aun cuando el patrón de desarrollo es similar para todos los niños, todos si-
guen un patrón predecible a su propio modo y su ritmo. Algunos niños se desarro-
llan de una manera suave, gradual, etapa por etapa, mientras que otros lo hacen de
forma brusca. Algunos tienen oscilaciones ligeras, y otros amplias. Por tanto, no
todos los niños llegan en todas las áreas al mismo punto de desarrollo a la misma
edad. Precisamente una de las dificultades en la evaluación del desarrollo sensorio-
motor de un niño radica aquí en delimitar la diferencia entre normalidad y patolo-
gía. Los logros motrices, lingúísticos, las conductas de adaptación personal y so-
cial, la adquisición de procesos y estrategias cognitivas implican áreas globales y
específicas de evaluación, a fin de identificar, con prudencia y con rigor, el nivel de
desarrollo de un niño, y decidir en qué y cuándo es necesario intervenir, bien para
prevenir o para remediar.
III. CONSIDERACIONES Y CARACTERÍSTICAS DE LA EVALUACIÓN
En la evaluación psicológica de la primera infancia se han de considerar los siguien-

tes aspectos:
a. La evaluación se realiza en función de la duda o sospecha, por parte de los

padres o allegados, de retrasos en algún área del desarrollo (caminar, hablar...), de los
exámenes periódicos que el pediatra realiza, del control médico (riesgo) por razón
de tratamientos administrados durante el período prenatal, perinatal o neonatal.
b. La evaluación debe basarse, dependiendo del motivo de consulta, en histo-
rias clínicas, exploración física, observación directa, exploraciones específicas y
cuestionarios a padres, cuidadores o figuras sustitutas.
c. La evaluación del desarrollo sensoriomotor precisa consecuentemente de un
trabajo interdisciplinar. se
d. La investigación del bebé debe realizarse a través de la observación y elestu-
dio de la situación actual (investigación sincrónica) y, simultáneamente, a través de la
historia que de él realizan (investigación diacrónica) los propios profesionales.
e. Elexamen físico no debe descartarse en ningún caso y en ocasiones se prec1-
san exámenes neuromotores. El sufrimiento y malestar del bebé se expresan fre-
cuentemente mediante trastornos somáticos y, por lo general, éstos alteran lasadqui-
siciones madurativas. Conviene que los psicólogos se familiaricen con los mismos a
fin de comprender la realidad corporal del bebé. s
f. El sujeto de evaluación es en realidad una parte de la díada madre-hi jo, pero
desatend iendo o
conviene estar atento para no privilegiar la información de la madre
pasando por alto otros datos.
664 Carmen Maganto
Para efectuar un eficaz examen se debe poseer ante todo un buen conoci-
miento del desarrollo del niño, de las técnicas a emplear en la evaluación, pero sobre
todo una probada experiencia en el trato con bebés. pen:
h. La exploración debe realizarse con el máximo rigor y con la flexibilidad que
se precise para obtener la cooperación de la madre y/o sustitutos, así como del lac-
tante, a fin de obtener los resultados esperados. ' '
¿. La experiencia profesional con niños en edades tempranas aconseja sugerir
los siguientes aspectos:
— Cuanto más pequeño es el niño, mayor es la participación del examinador en

la dirección y conducción de la evaluación. La función del profesional debe priorizar
despertar el interés del niño a fin de obtener su colaboración.
— Cuanto menor es la edad del sujeto, mayor influencia ejercen las variables si-
tuacionales, ambientales, locales, variables de personas extrañas y los estímulos deri-
vados del propio test. La mayor influencia de los factores situacionales y ambienta-
les determina los resultados de la exploración psicológica. El examinador, el tipo de
instrumento, la situación de examen, el lugar donde se evalúa, etc. condicionan en
gran medida los resultados. Por ello, siempre que sea posible, se han de obtener da-
tos en diferentes momentos y de diferentes contextos.
A menor edad, menor capacidad de control y de resistencia a factores negati-
vos “puntuales” en el momento de la evaluación (distracción, timidez, enfado, can-
sancio...).
— A menor edad, mayor número de variables entran a formar parte de la explo-
ración psicológica, independientemente de los instrumentos.
J. La importancia de la exploración de las áreas de desarrollo anteriormente ci-

tadas se debe a que:
— La conducta motora manifiesta la capacidad de integración neuromotriz (lle-

varse la mano a la boca u otras conductas más complejas). El modo de hacerlo puede
revelar las alteraciones consecuentes.
— Los exámenes neurológicos de las funciones principalmente visual y auditiva
permiten conocer éstas con detalle. Sin embargo, desconocemos «el triple proceso
sensación-percepción-cognición que existe probablemente ya desde la etapa inicial
de la vida, porque las posibilidades de exploración suelen ser insuficientes» (Domé-
nech, 1982, p. 37). La exploración requiere en estos casos métodos indirectos a través
de las respuestas conductuales. Tenemos acceso a la actividad sensorial y perceptual,
pero no al proceso y resultado cognitivo.
— La conducta social o lingúística se interrelacionan mutuamente, pero pueden
ser independientes. Ambas forman el entramado de redes sociales y de contactos in-
terpersonales. Las habilidades iniciales en ambos aspectos favorecen o limitan el de-
sarrollo global. Erróneamente una aparición tardía del lenguaje suele interpretarse
incuestionablemente como retraso global. No obstante, ambos aspectos poseen in-
terés primordial cara a descartar deficiencia mental, autismo, déficit sensoriales, en-
tre otros. Las alteraciones de la percepción y cognición pueden obstaculizar seria-
mente la capacidad del niño para satisfacer las demandas sociales y educacionales.
665
k. En casos de duda, porque el sujeto presenta características poco usuales, es

aconsejable repetir el examen después de un lapso razonable de tiempo, contrastarlo
con otros exámenes que también evalúen el nivel o índice de desarrollo. Se cometen
muchos errores en el diagnóstico del desarrollo cuando no se tienen en cuenta todas
las variables que afectan al mismo.
IV. CLASIFICACIÓN DE LAS ESCALAS DE DESARROLLO
Las escalas para la evaluación del desarrollo sensoriomotor pueden agruparse funda-
mentalmente atendiendo a dos criterios. Por un lado, el criterio estadístico de fre-
cuencia de una conducta a una determinada edad, estableciendo como normativo y
esperable lo más usual y común, es decir, la adquisición, autonomía y dominio por
parte de los sujetos de conductas acaecidas a determinada edad; estas escalas obedecen
al modelo psicométrico de evaluación, entre las que destacan las Escalas de desarrollo
de Gesell, la Escala para evaluar el desarrollo psicomotor de la primera infancia y las
Escalas Bayley de desarrollo infantil. También dentro de esta categoría de clasificación
hay que referir las escalas de selección, entre las que está la Escala de desarrollo de
Denver y la Escala observacional del desarrollo. Por otro lado, otras escalas siguen
criterios más cualitativos y responden al modelo genetista-cognitivo planteando la
evaluación en términos de procesos. En estas escalas cobra importancia la evaluación
cognitiva al observar la utilización de estrategias en la resolución de los problemas
que se plantean a través de los reactivos del test. Entre éstas merecen destacarse la Es-
cala para la evaluación de las etapas de la inteligencia sensoriomotriz y la Escala ordi-
nal del desarrollo psicológico infantil. Se ofrece seguidamente una síntesis de la des-
cripción, finalidad de evaluación y valoración crítica de cada una de las pruebas.
va. Escalas psicométricas de evaluación del desarrollo infantil

Iv.1.1. «Escala de desarrollo de Gesell»
Esta escala fue elaborada en 1921 por Gesell y Amatruda, siendo revisada posterior-
mente en 1940 y 1979. Se aplica a niños con una edad comprendida entre 4 semanas y
5 años, obteniendo una edad de desarrollo en cuatro áreas diferentes, cocientes de
desarrollo parciales (CD) y un cociente de desarrollo global (CDT). Su aplicación in-
cluye una entrevista preliminar, tests, observación y el Inventario Selectivo de De-
sarrollo (18D). En cuanto a su estandarización no existen normas métricas y está ba-
sada en criterios evolutivos de frecuencia, de donde se obtienen las “edades clave”.
Existe una interrelación entre edad y conducta. El objetivo de esta escala es la evalua-
ción del grado de desarrollo en cuatro áreas para predicción y/o control del
avance/retraso del desarrollo del niño. Estas áreas son:
a. Conducta motora gruesa (reacciones posturales, locomoción y coordina-

ción corporal) y conducta motora fina (aproximación, presión y manipula-
ción de un objeto).
666 Carmen Maganto
b. Conducta adaptativa (se analiza el ajuste perceptivo, la actividad de orienta-

ción y las reacciones, habilidades y estrategias ante experiencias nuevas).
Para Gesell, la conducta adaptativa es precursora de la inteligencia al utilizar
la experiencia para la solución de nuevos problemas.
c. Lenguaje: abarca toda las formas de comunicación visible y audible (gestos,
movimientos posturales, vocalizaciones, palabras y frases).
d. Conducta personal-social: comportamiento interrelacional en un contexto
y cultura determinados (autonomía de funciones de alimentación, higiene,
juego...).
El examen directo realizado al niño se debe completar siempre con el Inventario

selectivo del desarrollo realizado a los padres. Esta escala ha dado lugar a otros tests
utilizando las mismas áreas de observación y pruebas. Permite un registro evolutivo
sistematizado, rápido y útil, así como la evaluación de las tendencias de crecimiento.
Se ha comprobado la consistencia de resultados, tras dos años, en un estudio longi-
tudinal de más de 90 sujetos. Sin embargo, el número de elementos varía en cada
edad clave, lo que le resta validez. La edad clave es un concepto algo estático; repre-
senta etapas básicas de maduración a las cuales es posible referir la conducta obser-
vada para su estimación y supone una guía para observar modos de conducta e inter-
pretar su significación evolutiva en función de pautas normales. En algunos ítems
evolutivos sólo se cuenta con la respuesta de los padres. Al estar tipificada con mues-
tras estadounidenses es poco discriminativa a partir de tres años, debido a influen-
cias educativas propias del país.
1v.1.2. «Escala de Brunet-Lezine. Escala para evaluar el desarrollo

psicomotor de la primera infancia»
Esta escala fue construida por Brunet y Lezine en 1951 y revisada en 1965; poste-
riormente, en 1978 sufre una renovación importante. Es aplicable a niños con un
rango de edad entre 1 mes y 6 años, obteniendo una edad de desarrollo en cuatro
áreas y un cociente de desarrollo global. Su estandarización se hizo con 1 500 niños
no seleccionados y muy diversificados, y su finalidad es evaluar el nivel de desarrollo
postural (tono muscular y motricidad), coordinación oculomotriz (adaptación y
comportamiento con los objetos), lenguaje (poniendo en juego la audición y la ver-
balización) y socialización (la relación con los adultos y de los niños entre sí). Permi-
te un perfil de desarrollo de forma rápida y un cociente global de desarrollo en caso
de homogeneidad. Reduce la influencia del examinador. La presentación de las prue-
bas responde con adecuación a la dificultad progresiva sobre la que se sustenta. Está
muy bien sistematizada, contando con una serie de registros que simplifican el tra-
bajo. La lectura del registro y el perfil facilitan la evaluación. La programación en la
aplicación de la escala es muy adecuada. Parte de los tests de Gesell y Amatruda y de
los trabajos de Buhler, pero manteniendo para cada edad el número de ítems. Se ha
aplicado en España, no encontrando diferencias importantes en la tipificación. Los
autores continúan realizado nuevos estudios con esta escala y concluyen que se de-
ben confrontar varias ejecuciones antes de concluir que hay un avance o retraso sig-
667
nificativo, debido a la imprevisibilidad en la evolución de las conductas. Se han en-

contrado diferencias asociadas al sexo en motricidad fina y lenguaje, donde los niños
son más lentos, sin ser vinculante a edades posteriores. No es muy válida para niños
mayores de dos años. No obstante, resulta adecuada para evaluación, seguimiento y
elaboración de los programas reeducativos y de estimulación precoz.
1V.13. «Bayley scales of infant development (BSID) [Escalas Bayley

de desarrollo infantil)»
Esta prueba es aplicable a niños con edades comprendidas entre 2 meses y 2 años
medio, permitiendo obtener un Índice de Desarrollo Mental (IDM) y un Índice de
Desarrollo Psicomotor (IDP). Su estandarización se realizó en 1200 lactantes, de 2 a
30 meses, de 14 grupos de edades. Su objetivo es la evaluación del patrón de desarro-
llo mental temprano. La escala mental evalúa la sensopercepción y discriminación, la
constancia del objeto y memoria, el aprendizaje, las vocalizaciones, la generalización
y la clasificación. La escala motora evalúa control corporal, habilidad manipulativa,
no estando relacionada con funciones intelectuales. La escala de comportamiento
evalúa las orientaciones sociales del niño hacia su entorno expresadas en actitudes,
intereses, emociones, energía, actividad y tendencias de aproximación/evitación de
los estímulos. El valor principal de esta prueba está en establecer el nivel de desarro-
llo madurativo actual y el alcance de las desviaciones en relación a la edad mental y
psicomotriz. En función de ello, permite establecer programas de tipo preventivo
primario, secundario y terciario, es decir, preventivos y correctivos. Proporciona da-
tos para identificar el retraso mental y psicomotor y da pistas para que los clínicos
establezcan hipótesis etiológicas. Esta escala tiene en cuenta las puntuaciones razo-
nablemente fiables, los procedimientos de medida significativa y diferente en fun-
ción de la edad, en razón de las reales diferencias en este período evolutivo. En cada
nivel de edad o estadio de desarrollo debe evaluarse un amplio repertorio de con-
ductas que puedan ser comparables evolutivamente; asimismo, posibilita evaluar e
identificar sujetos excepcionales y poder establecer comparaciones con la población
“normal”. Según Sattler (1988), las normas son excelentes y la validez y fiabilidad sa-
tisfactorias. Los resultados de las tres escalas permiten diseñar programas de inter-
vención más específicos al contar con mayor información. Son complementarias y
las tres proporcionan datos para la evaluación clínica. En España no se han realizado
estudios. Las aplicaciones experimentales parecen indicar que pueden utilizarse los
baremos estadounidenses con ciertas salvedades. Es conveniente estar bastante fami-
liarizado con los procedimientos y el material, precisa práctica y experiencia puesto
que no existe un orden riguroso de presentación de los ítems, sino que se anotan a
medida que aparecen, pero deben seguirse fielmente las instrucciones.
1.1.4. «Denver development screening test (DDST) [Escala de selección

de Denver]»
Esta prueba ha sido elaborada por Frankenburg y colaboradores en 1967 y poste-
riormente revisada en 1971 y 1975. Es aplicable desde el nacimiento hasta los 6 años
668 - Carmen Maganto
y 4 meses. Permite obtener una puntuación en criterios de discriminación entre su-

jetos normales, dudosos o con retraso. El criterio es evolutivo en razón de la fre-
cuencia estadística. Su estandarización se realizó con 1036 niños estadounidenses.
Presenta una buena correlación con el cociente intelectual obtenido con el Stanford-
Binet y con la Escala Bayley. Se utiliza como instrumento de selección, identificando
retrasos en cuatro áreas del desarrollo: motricidad gruesa, en relación a control,
equilibrio y coordinación corporal; motricidad fina (habilidades manuales para re-
coger objetos, dibujar...); lenguaje (capacidad para escuchar, comprender y usar el
lenguaje), y conducta personal -social (habilidad para relacionarse, jugar y el auto-
cuidado). Es útil para selección inicial en edades de tres meses a cuatro años. Resulta
económica, rápida y fácil de administrar. La calificación es sencilla y breve, bien por
observación del examinador o por entrevista con los padres. La revisión de las esca-
las viene haciéndose periódicamente (Frankenburg y cols., 1981). Es, sin ninguna
duda, la prueba de selección más ampliamente utilizada y extensamente investigada,
incluyendo repetidos y originales estudios transculturales (Meisels, 1989). Las esca-
las comprenden siete instrumentos de selección de gran interés en la evaluación psi-
cológica infantil y en el diagnóstico pediátrico principalmente; éstos son: la Escala de
desarrollo de Denver anteriormente expuesta, cinco instrumentos utilizables por
distintos profesionales (audiometría, articulación, vista, ambiente del hogar y salud
en la comunidad; y finalmente, un breve cuestionario de desarrollo (el Denver pres-
creening developmental questionnaire), utilizado como preselección ante la sospe-
cha de problemas en el desarrollo. La aplicación de este breve cuestionario (10 pre-
guntas) a una selección inicial de sujetos ha proporcionado resultados satisfactorios
en la práctica pediátrica y en la investigación. Las críticas han venido principalmente
de las propiedades psicométricas de la prueba: selección muestral, al estar represen-
tados más sujetos blancos que lo que el censo sugiere (Satler, 1988); los puntos referi-
dos por los padres suelen ser especialmente inestables; insuficientes elementos de
lenguaje y ausencia de datos en relación a la consistencia interna de la prueba (Mei-
sels, 1989). Además, a pesar de la insistencia en que no es una prueba de inteligencia,
para validarla se utilizan pruebas de inteligencia. En concreto, los estudios sobre va-
lidez predictiva aportan resultados desiguales sobre la eficacia de la misma en la se-
lección de sujetos expuestos a riesgo. Las críticas derivan de su baja sensibilidad, es
decir, de la elevada proporción de falsos negativos (Cadman, Chambers y Walters,
1984; Kochaneck, 1984; Sturner, Green y Funk, 1985; Diamond, 1987; Meisels y
Margolls, 1988; Meisels, 1989). Se precisa, en consecuencia, más información sobre
validez y capacidad predictiva.
Iv.1.5. «Escala observacional del desarrollo»
Esta escala ha sido elaborada por Secadas en 1988 y es aplicable a sujetos de O a 6

años, permitiendo obtener un perfil modal y un perfil de rasgos. Su estandarización
ha tenido lugar con 1197 sujetos de O a 4 años de la población española. El autor in-
dica que la validez diagnóstica es adecuada y el grado de precisión es satisfactorio.
El perfil distingue una edad de otra por los tipos de conducta. Su finalidad es dotar
de un instrumento que permita conocer el nivel de desarrollo de un niño en el mo-
669
mento de la evaluación y descubrir secuencias y procesos temporales del desarrollo

en las principales áreas, así como servir de procedimiento de intervención educati-
va para la recuperación de sujetos con retraso. Evalúa un amplio repertorio de con-
ductas clasificadas por áreas, rasgos o modalidades, así como el momento de apari-
ción de dichas conductas. Las áreas que explora son: reacción afectiva, reacción
motriz, desarrollo somático, despertar sensorial, exploración sensoriomotriz, con-
tacto y comunicación. Se diferencia de los tests y escalas por presentar las unidades
de medida en intervalos de tiempo, ya que no considera el desarrollo sensoriomo-
tor mensurable en términos de edad. El desarrollo implica subordinación de con-
ductas precedentes a otras posteriores, integración en un sistema que las reorganiza
en otro nivel superior. Para Secadas esto es posible merced a la función supresora
realizada a través del juego. La supresión es un proceso que consiste en desatender
el proceso inicial que utilizamos para aprender algo, lo que implica automatizarlo,
asimilarlo e integrarlo escuetamente en el sistema, dando como resultado una nue-
va habilidad. Permite una visión rápida a través del perfil de áreas adelantadas o re-
trasadas. Posibilita establecer estrategias de intervención conductual y evaluarlas
posteriormente. Sin embargo, adolece de todas las limitaciones que ofrecen las es-
calas y cuestionarios sustentados en los padres como informantes, agrupa edades
demasiado amplias a partir de un año y no existen investigaciones contrastables
con otras muestras.
1v.2. Escalas de funcionamiento cognitivo

1v.2.1. Etapas de la inteligencia sensoriomotriz de Casati-Lezine
Este instrumento elaborado por Casati y Lezine (1968) es aplicable a niños con un
rango de edad entre 6 meses y 2 años y permite obtener una edad global en fun-
ción de la ejecución mejor en cualquiera de las medidas obtenidas. Su estandariza-
ción se realizó con 305 sujetos de la población normal entre 6 meses y 2 años. No
existen baremos, pero los estadísticos han permitido elaborar tablas de correspon-
dencia entre elemento, estadio y edad media. Su objetivo es la evaluación global
del nivel de desarrollo sensoriomotor. Analiza los mecanismos intelectuales en
formación y explora la búsqueda del objeto desaparecido, la utilización de inter-
mediarios, la exploración y la combinación de objetos. Es una escala basada en la
teoría de Piaget que permite observar la capacidad de resolver problemas, intervi-
niendo la percepción, las actitudes y los movimientos. La adaptación exige relacio-
nar objetos y actos mediante la distinción de medios y fines. Es posible identificar
retrasos eventuales de mecanismos que posteriormente sonel sustrato para la ela-
boración de los procesos intelectuales. Las diferencias individuales son más evi-
dentes en los dos últimos estadios, debido a que los factores de coordinación mo-
triz son más complejos, y a las diferencias individuales en lamanera en que el niño
se aprovecha de sus adquisiciones, y del interés y motivación que le suscite la si-
tuación. Los dos primeros estadios no presentan situación experimental. En gene-
12 y
ral, el éxito en el estadio IV se consigue entre 9 y 12 meses, el estadio V entre
17 meses, y el éxito en el estadio VI entre los 16 y 22 meses. Es sencilla de admi-
670 Carmen Maganto
nistrar, el manual es preciso y claro. Suele ser recibida de buen grado por elniño.
Exige conocimiento de la teoría de Piaget. La utilidad de la escala en el ámbito
educativo ha tenido especial relevancia en Francia. En el ámbito clínico (Calvo y
cols., 1981), las escalas derivadas de la teoría piagetiana han estado al servicio del
establecimiento de diagnósticos diferenciales del desarrollo y de precisar retrasos
significativos en el mismo. No obstante, su utilidad, según Dunst (1982), deviene
principalmente de los aspectos cualitativos que propician la observación del sujeto
ante los reactivos del estímulo. Es una limitación que al finalizar el período senso-
riomotor no exista una prueba de seguimiento que permita evaluar los estadios
posteriores de desarrollo.
1v22. «Infant psychological development scale (IPDS) [Escala ordinal

del desarrollo psicológico infantil)»
Esta escala de Uzgiris y Hunt (1975) es aplicable a niños de edades comprendidas
entre las 2 semanas y los 2 años. Evalúa el desarrollo en ocho subescalas diferentes,
presentando situaciones graduadas ordinalmente para su evaluación. No se preten-
de obtener una edad mental. Su fiabilidad es satisfactoria, pero para la validez se
precisan más datos. Su objetivo es la evaluación de los procesos intelectuales implí-
citos y asociados con los estadios de desarrollo: permanencia del objeto, uso de los
objetos como medio para un fin, aprendizaje y anticipación, desarrollo de esque-
mas, desarrollo de la causalidad operacional, construcción de relaciones de objetos
en el espacio, imitación vocal e imitación de gestos. Es una de las escalas más utili-
zadas e innovadoras metodológicamente. Da cuenta de las diferencias individuales
en el desarrollo y es buena predictora de habilidades cognitivas. El criterio ordinal
asume que las competencias conductuales están basadas en una organización jerár-
quica y relativamente independiente en líneas diferentes. El desarrollo debe consi-
derarse intrínsecamente ordenado. El orden viene dado por factores como herencia
biológica, secuencia lógica en el sistema de funcionamiento, organización jerárqui-
ca del esquema motor, persistencia y desarrollo de la motivación intrínseca. Ha
sido muy utilizada en la exploración de diferentes patologías como sordera o autis-
mo, debido a que permite apreciar los mecanismos intelectuales propiamente di-
chos y determinar la capacidad de aprendizaje y generalización de lo aprendido.
Los materiales y procedimientos no están estandarizados y pueden ser modifica-
dos a fin de acomodar el examen a las circunstancias particulares. La evaluación en
relación a cada una de las tareas es desigual. En concreto, para Gratch y Schatz
(1987), la subescala permanencia de objeto es la única que se relaciona de forma
significativa con la ejecución del Binet en cada nivel de edad estudiado. También
mostró esta subescala el patrón más constante de relaciones durante los cinco nive-
les de edad, de lo que se concluye que el desarrollo de la permanencia del objeto
Juega un papel importante en el desarrollo cognoscitivo. La revisión bibliográfica
demuestra el interés que despierta esta escala en la investigación sobre desarrollo
cognitivo a través de estudios longitudinales. Se ha observado que la capacidad pre-
dictiva es mayor que la de los tests psicométricos (Braibanti, Mamone y Bertini,
1989).
671
V. GARANTÍAS PREDICTIVAS DE LA EVALUACIÓN DEL DESARROLLO
Las escalas que se han expuesto posibilitan una evaluación comparativa de las habili-
dades y del grado de desarrollo global y específico que muestran los niños. Se utili-
zan con la finalidad de identificar tempranamente deficiencias en el desarrollo e in-
tervenir desde una perspectiva preventiva más que de tratamiento. La capacidad
predictiva de las escalas de tipo psicométrico se basa en el supuesto de que sólo es
posible una predicción razonable sobre el progreso futuro del niño conociendo los
valores promedio del desarrollo, identificando los factores que pueden afectar al
curso del mismo y realizando exámenes y registros sistemáticos. Por ello, parece jus-
tificado afirmar que, cuanto más lejos se encuentre un niño del promedio normal en
cualquier aspecto, es menos probable que sea normal. Las pruebas de desarrollo per-
miten predecir, en términos generales, el nivel de funcionamiento medio de un niño,
pero no con la precisión que desearíamos. Las escalas de tipo psicométrico tienen un
valor predictivo razonable, pero limitado en cuanto a la futura capacidad intelectual
del sujeto, puesto que, por una parte, infravaloran la amplitud de las transformacio-
nes de las habilidades cognitivas durante estadios subsecuentes del desarrollo; por
otra, es también limitado en cuanto que ignoran el gran papel que «juega la persona-
lidad en el progreso posterior del niño, y este aspecto es el responsable de que mu-
chos de los esfuerzos que hacemos para predecir el futuro progreso del desarrollo
del niño nos resulten fallidos» (Illingworth, 1985, p. 225). No obstante, prosigue
este autor, si se hicieran observaciones detalladas del curso del desarrollo en pobla-
ciones infantiles amplias, registrando edades de adquisición de habilidades y efec-
tuando seguimientos sistemáticos, sería posible establecer criterios predictivos en
función de las correlaciones halladas, así como identificar factores de riesgo en las
desviaciones del patrón de desarrollo. En la actualidad, la capacidad predictiva nega-
tiva es mayor, es decir, es mejor predictora de los déficit de funcionamiento que de
los posibles logros intelectuales del sujeto. No hay que olvidar que las discrepancias
en las investigaciones sobre la capacidad predictiva derivan, en parte, del objetivo y
contenidos de la evaluación, es decir, las diferencias entre lo que se evalúa en los exá-
menes de desarrollo y en las pruebas de inteligencia. En los primeros, se evalúa prin-
cipalmente el desarrollo sensoperceptual, sensoriomotor y la conducta de adapta-
ción social del bebé, mientras que en las segundas se hace hincapié en los aspectos
verbales.
La capacidad predictiva de las pruebas de selección ha sido ampliamente cuestio-
nada. Se han diseñado pocos instrumentos de selección y sólo algunos de ellos —sobre
todo, la Escala Denver— han sido sometidos a una rigurosa estandarización y re-
visiones periódicas (Dworkin, 1989; Meisels, 1989). Los resultados concordantes
obtenidos de repetidas investigaciones sobre sensibilidad y especificidad de la Escala
Denver permiten concluir que deja sin identificar niños expuestos al riesgo en rela-
ción a su desarrollo, dando un elevado número de falsos negativos. La sensibilidad
de la prueba es por tanto baja y poco adecuada su capacidad predictiva negativa. La
especificidad es más alta, lo que significa que identifica pocos sujetos como falsos
positivos, siendo, por consiguiente, más satisfactoria su capacidad predictiva posi-
tiva. No obstante, la eficacia o validez predictiva de una escala de selección de de-
672 Carmen Maganto
sarrollo debe considerar conjuntamente ambos aspectos, especificidad y sensibilidad,

exigiendo en ambos valores no inferiores al 80% (Meisels, 1989). Las conclusiones
sobre validez predictiva no se adecuan a estos valores deseados (Cadman, Chambers
y Walter, 1984; Kochaneck, 1984; Meisels, 1989). Frankenburg y Dodds publican
una amplia y profunda revisión de la escala que culmina con The Denver 11. Poste-
riormente, se publica un resumen de las ventajas de la nueva escala revisada (Fran-
kenburg y cols., 1992): incremento en un 86% de los ítems de la evaluación de len-
guaje, decremento en un 20% de los ítems referidos por los padres, eliminación de
los elementos difíciles de administrar o interpretar en la anterior escala, incorpora-
ción de un cuestionario/entrevista para anotar observaciones conductuales y los va-
lores de fiabilidad intertest o test-retest son más altos. Todo ello hace concluir a los
autores que The Denver 1] tiene mayor utilidad predictiva como escala de selección
de sujetos con problemas de desarrollo.
En cuanto a la capacidad predictiva de las escalas derivadas de la teoría de Piaget,
éstas proporcionan una evaluación de las aptitudes del niño en un estadio del de-
sarrollo, intentando paliar algunas limitaciones de las escalas anteriores, basándose en
criterios ordinales, referidos al concepto de estadio como modelo de medida. Aquí
se fundamenta la capacidad predictiva de las escalas, seleccionando los ítems en fun-
ción del proceso y estadio cognitivo del desarrollo, exponiendo para ello al niño a
una situación experimental. El procesamiento activo del niño, las estrategias de
adaptación al estímulo y los recursos que pone en funcionamiento proporcionan in-
formación relevante sobre la capacidad del lactante para atender selectivamente la
información y procesarla. Estos indicadores parecen ofrecer mayor capacidad pre-
dictiva en relación al futuro desarrollo intelectual del niño. El procesamiento de la
información en bebés ofrece las bases para un nuevo análisis de la inteligencia y un
nuevo análisis de estas escalas.
Sin embargo, en los últimos años, la importancia que ha adquirido la interven-
ción precoz, tanto preventiva como terapéutica, no se ha visto refrendada por el in-
cremento de instrumentos diagnósticos que den respuesta satisfactoria a las necesi-
dades existentes. Actualmente se está trabajando en la elaboración de nuevos
instrumentos de evaluación que se basan en estudios sobre la atención y el procesa-
miento de la información. Existen evidencias que refuerzan la consideración de las
medidas de atención, habituación y recuperación como buenos indicadores del de-
sarrollo mental (Braibanti, Mamone y Bertini, 1989). Si pudiéramos identificar tras-
tornos perceptuales y cognitivos muy precoces, conocer las diferencias en el proce-
samiento de la información y el modo en que se establecen las redes de interacción
con el ambiente se incrementaría la capacidad predictiva de la evaluación del de-
sarrollo, y sería factible proponer intervenciones preventivas precoces.
La influencia de factores ambientales de diversa índole variabilizan y restan ca-
pacidad predictiva a cualquier diagnóstico del desarrollo. Estudios longitudinales
han demostrado que se pueden producir cambios (aumento o disminución) del de-
sarrollo cognitivo en función de las ulteriores experiencias del niño. Los cambios en
el desarrollo cognitivo van por lo general asociados al medio cultural y al clima emo-
cional del hogar (Achenbach, 1981). Por consiguiente, las condiciones que determi-
nan un cambio de grado o dirección son múltiples y complejas. Está demostrado
que las experiencias tempranas y el desarrollo en estas edades constituyen los prerre-
673
quisitos intelectuales para un aprendizaje y desarrollo posteriores. Sin embargo, no

parece posible, por ahora, establecer relaciones de causalidad lineal entre retrasos,
problemas, síntomas y factores etiológicos. No obstante, sí parece posible establecer
asociaciones entre problemas y factores de incidencia orgánica, clima familiar y esta-
tus familiar. Éstas son las razones por las que no podemos predecir con exactitud el
desarrollo intelectual, ni el cociente intelectual que alcanzará un niño. Decir lo con-
trario es demostrar la ignorancia sobre las pruebas de desarrollo y dotarlas de una
potencialidad de la que no disponen. Tampoco se puede asegurar su retraso en tér-
minos precisos.
Como consecuencia de ello, la predicción, así como la prevención y reversibili-
dad, está sujeta a incertidumbre. Los cambios cuantitativos y cualitativos son múlti-
ples y complejos, pero el que sean más o menos esperables en edad, intensidad y cua-
lidad depende no sólo de las propias características del niño, sino del abanico de
múltiples influencias ambientales que operan constantemente en él durante su de-
sarrollo. En la medida en que los factores ambientales permanezcan constantes, la
predicción tendrá visos de mayor probabilidad, no de certeza absoluta. Para
Thompson y cols. (1986), el estudio de las influencias ambientales en la primera in-
fancia arroja luz sobre el efecto desigual de las influencias positivas y negativas en la
primera infancia y su repercusión en el desarrollo posterior. Se puede predecir con
mayor seguridad la incidencia de los efectos negativos en el desarrollo posterior de
un niño cuando la índole de dichas variables es de carácter negativo, pero no es posi-
ble predecir, como contrapartida, con igual grado de probabilidad que los sujetos
con influencias ambientales y experiencias tempranas positivas tendrán un desarro-
llo adecuado. Las investigaciones sugieren que, cuanto más joven es el organismo,
más vulnerable resulta a los impactos ambientales adversos. La vulnerabilidad al es-
trés y/o a diversas formas de privación nos alertan sobre los posibles efectos en el in-
fante y su carácter irreversible. Como contrapartida, cobran especial importancia las
formas tempranas de evaluación, intervención, estimulación precoz y/o los progra-
mas de prevención.
Esperar de los resultados de una prueba de desarrollo una medida del futuro in-
telectual del niño es desconocer la utilidad y el alcance de las mismas. Actualmente,
en Europa occidental, especialmente en Gran Bretaña, se acompañan estas activida-
des de evaluación infantil a través de las escalas con otras actividades denominadas
supervisión del desarrollo. Para Dworkin (1989), esta supervisión consiste en una
actividad profesional relacionada con el control del desarrollo en la que se incluye la
obtención de una historia clínica, observaciones precisas y relevantes del desarrollo,
la búsqueda y provocación del interés de los padres, considerando el desarrollo en el
contexto del bienestar global del niño, más que considerarlo como elementos del
conjunto de los elementos aislados obtenidos durante una sesión de pruebas, aunque
por supuesto no excluyen éstas. «La realización de observaciones longitudinales in-
formativas sobre el desarrollo y el comportamiento de los niños y la potenciación de
las impresiones e inquietudes de los padres requieren una considerable experiencia y
conocimientos» (Dworkin, 1989, p. 187). La validez predictiva de cualquier prueba
de desarrollo alcanzaría más exactitud si se la integrara en los resultados obtenidos
de esta supervisión. No olvidemos que es el profesional el que decide a partir de los
resultados, las pruebas son un instrumento del profesional.
674 Carmen Maganto
Un aspecto importante en la evaluación infantil es la comunicación de los resul-

tados a los padres. Ésta ha de ser utilizada para comprender al niño, pero no como
una etiqueta para clasificarlo en una categoría fija. La comprensión por parte de és-
tos es esencial para cualquier cambio que requiera esfuerzo por parte de los mismos.
Su grado de participación en la evaluación e intervención y la calidad misma, los
convierte en mediadores terapéuticos de indudable riqueza preventiva.
Para concluir, y a modo de síntesis, alentar a que la evaluación en estas edades ad-
quiera mayor relevancia de la que actualmente posee, ya que, aunque con limitacio-
nes, se viene comprobando a través de la experiencia clínica y de la investigación:
a. Que la importancia de los registros longitudinales y sistemáticos de la con-
ducta en niños de temprana edad hace posible confirmar o no explicaciones
teóricas evolutivas respecto al desarrollo infantil, lograr una identificación
temprana de factores de riesgo y elaborar programas de prevención para
contextos específicos (familiar, guarderías, atención primaria u otras institu-
ciones).
b. Que la evaluación psicológica de los bebés posibilita el diagnóstico precoz
de los retrasos, intervenir preventivamente y realizar un tratamiento tera-
péutico temprano.
c. Que el diagnóstico/intervención al ser indirecto, es decir, asesorando a los
agentes significativos que rodean al niño, propicia un aprendizaje del de-
sarrollo del mismo y convierte a los padres en colaboradores terapéuticos.
Entre las alternativas de intervención preventiva o terapéutica que se han deriva-
do de la evaluación del desarrollo temprano y que parecen ofrecer resultados más
satisfactorios de cara a la predicción y prevención están las consultas diagnóstico-
terapéuticas, las sesiones grupales de varias parejas de díadas (mamá-bebé) para el
aprendizaje asistencial del bebé con dificultades de desarrollo, los programas de in-
tervenciones domiciliarias para el entrenamiento en competencia materna y el recur-
so alas familias sustitutas en ambientes multicarenciados.
Achenbach, T. M. (1981). Investigación de la psicología del desarrollo: conceptos, estrategias y

métodos. México. El Manual Moderno.
Alonso Tapia, J. (1987). Evaluación del desarrollo intelectual y social. En R. Fernández-
Ballesteros (dir.), Psicodiagnóstico (vol. 3) (4* ed.). Madrid. UNED.
Barrena Moncada, G. (1987). Psicopediatría. Problemas psicológicos del niño en la práctica
diaria. Barcelona. Salvat.
Bayley, N. (1977). Escalas Bayley de Desarrollo Infantil. Madrid. TEA.
Braibanti, P., Mamone, P. y Bertini, M. (1989). Assessment of cognitive development in early
infancy: Theoretical and methodological issues. Evaluación Psicológica/ Psychological As-
sessment, 5, 219-240.
675
Brunet, O. y Lezine, 1.(1983). Batería de Tests para medir el Desarrollo Psicomotor y la Escala
de Visión de la 1* Infancia. Madrid. MEPSA.
Butterbaugh, G. J.(1988). Selected psychometric and clinical review of neurodevelopmental
infant tests. Clinical-Nenropsychologist, 4, 350-364.
Cadman, D., Chambers, L. W. y Walter, S. D. (1984). The usefulness of the Denver Develop-
mental Tscreening Test to predict Kindergarten problems in a general community popu-
lation. American Journal Public Health, 74, 1093-1097.
Calvo, M., Figueras, J., Picorel, M. F. y Wanger, D. (1981). Valoración de un test abreviado
para determinar el desarrollo psicomotor e intelectual del niño. Archivos de Pediatría, 53,
33-63,
Casati, I. y Lezine, 1. (1968). Les etapes de lintelligence sensori-motrice. París. Les Éditions
du Centre de Psychologie Appliquée.
Diamond, K. E. (1987). Predicting school problems form preschool developmental scree-
ning: A four-year folow-up of the Revised Denver Developmental Screening Test and the
role of parent report. Journal Developmental Early Child, 11, 242-253.
Doll, E. A. (1965). Vineland social maturity scale (3* ed.). Minnesota. American Guidance.
Doménech, E. (1982). Signos de alarma en el examen psicológico del neonato. Anales Espa-
ñoles de Pediatría, 17, 131-145.
Dworkin, P. H. (1989). Screening del desarrallo ¿esperando lo imposible? Pediatrics, 27, 186-
188.
Dunst, C. J. (1982). The clinical utility of Piagetian-based scales of infant development. In-
fant Mental Health Journal, 3, 259-275. E e
Flehmig, 1. (1988). Desarrollo normal del lactante y sus desviaciones. Buenos Aires. Médica
Panamericana. a
Frankenburg, W. K., Camp, B. W. y Van Natta, P. A. (1971). Validity of the DDST. Primary
Care, 11,535-547.
Frankenburg, W. K., Fandal, A. W., Sciarillo, W. y Burgess, D. (1981). The newly abbrevia-
ted and revised Denver Developmental Screening Test. Journal of Pediatrics, 99, 995-999.
Frankenburg, W. K., Dodds, J., Fandal, A. W., Kazuk, EN Cohrs, M. (1975). Denver Deve-
lopment Screening Test-Revised. Colorado. University of Colorado Medical Center.
Frankenburg, W. K. y Dodds, J. (1990). Denver 11 Screening Manual. Denver. Denver Deve-
lopmental Materials, Inc.
ems W. K., Dodds, J., Archer, P., Shapiro H. y Bresnick, B. (1992). The Denver Il:
A Major Revision and Restandarization of the Denver Developmental Screning Test. Pe-
diatrics, 89, 91-97. 5
Gesell, A. y Amatruda, C. (1981). Diagnóstico del desarrollo normal y anormal en el niño.
Evaluación y manejo del desarrollo nenropsicológico normal y anormal del niño pequeño y
preescolar. Buenos Aires. Paidós. A
Gratch, G. y Schatz, J. A. (1987). Cognitive development: The relevance of Piaget's a
books. En J. D. Osofsky (dir.), Hanbook of infant development (2* ed.). Nueva York.
Wiley.
llingworth, R. S. (1985). El niño normal. México. El Manual Moderno.
+ E ls Le O Preschool screening programs for children with a de A da
gitudinal analysis. cien a a la Annual Convention of the Council for
¡ ildren. Washington, Pda 3
RECON ¿Las pruebas a screening de desarrollo pueden identificar a los niños ex-
puestos a riesgo con respecto a su desarrollo? Pedtatrics, 27, iiO O
Meisels, S. J. y Margolls, L. H. (1988). ls EPSDT effective with developmen tal disa
dren? Pediatrics, 81, 262-271. a : pe
: cimiento de la inteligencia en el niño. Madrid. Aguilar. 5
ee ca J. W. (1988). Desarroll o del niño y del adolescent e. México. Tri-
dd
llas.
676 Carmen Maganto
Sattler, J. M. (1988). Evaluación de la inteligencia infantil y habilidades específicas. México. El

Manual Moderno.
Secadas, F. (1988). Escala observacional del desarrollo. Madrid. TEA.
Sroufe, L. A. y Rutter, M. (1984). The domain of developmental psychopatology. Child De-
velopment, 55, 17-29.
Staats, A. W. (1979). Behavioral interaction and interactional psychology theories of perso-
nality: Similarities, differences and need for unification. British Journal of Psychology, 71,
205-220.
Sturner, R. A., Green, J. A. y Funk, S. G. (1985). Preschool Denver Developmental Screening
Test as a predictor of later school problems. Journal Pediatric, 107, 615-621.
Thompson, A., Lea., Fulker, D. W., DeFries, J. C. y Plomin, R. (1986). Multivariate genetic
analysis of “environmental” influences on infant cognitive development. British Journal
of Developmental Psychology, 4, 347-353.
Uzgiris, O. C. y Hunt, ]. M. V. (1975). Assessment in infancy. Ordinal scales ofpsychological
development. Urbana. University of Illinois Press.
Vizcarro, C. (1983). Evaluación de repertorios clínicos de conducta. En R. Fernández-Balles-
teros (dir.), Psicodiagnóstico. Madrid. UNED.
Wachs, R. D. y Hubert, N. C. (1981). Changes in the structure of cognitive-intellectual per-
formance during the second year of life. Infant Behavior and Development, 4, 151-161.
Willis, A. y Ricciutti, H. (1990). Orientaciones para la escuela infantil de cero a dos años. Ma-
drid. Morata.
Hurlock, E. B. (1982). Desarrollo del niño (2* ed.). México. McGraw-Hill.

Illingworth, R. S. (1985). El niño normal. México. El Manual Moderno.
Lebovici, S., Diatkine, R. y Soulé, M. (1988). Tratado de psiquiatría del niño y del adolescente
tomo 11). Medios de diagnóstico. Madrid. Biblioteca Nueva.
Osofsky, J. D. (dir.) (1987). Handbook of infant development (2* ed.). Nueva York. Wiley.
Palacios, J. (1984). Procesamiento de información en bebés. En J. Palacios, Á. Marchesi y
M. Carretero (dirs.), Psicología evolutiva (vol. 11). Madrid. Alianza.
Rutter, M. (1985). Fundamentos científicos de psiquiatría del desarrollo. Barcelona. Salvat.
Sattler, J. M. (1988). Evaluación de la inteligencia infantil y habilidades específicas. México. El
Manual Moderno.
Secadas, F. y Musitu, G. (1982). Psicología evolutiva. Edad 1 año. Barcelona. CEAC.
Weaver, S. (1985). Testing children. Kansas City. Test Corporation of America.
ANEXO 1. SECUENCIAS DEL DESARROLLO
A. Secuencia del desarrollo motor
1 mes:
— Movimientos oculares de seguimiento

— Mantenimiento de la cabeza levantada boca abajo
— Flacidez de la cabeza al enderezarlo para sentarlo
— Chuparse el dedo
2 meses:
— Giro del tronco del costado hacia atrás

— Sostenido en posición sentada o vertical mantiene la cabeza erguida momentáneamente
3 meses:
— Respuesta a las sonrisas de otros

— Sostiene la barbilla y los hombros despegados de la cama de 45 a 90* sujetándose con los
antebrazos
4 meses:
— Coordinación de los ojos

— Adopta una posición sentada
— Sentado; mantenimiento de cabeza levantada
— Giros del tronco de atrás hacia el costado
— Alarga las manos y coge objetos
— Puede juntar las manos y jugar con ellas
5 meses:
— Coge objetos deliberadamente

— Adopta una posición sentada con apoyo
— Madura en el asimiento, facilidad y seguridad para coger los objetos
6 meses:
— Giros completos del tronco

— Adopta una posición sentada con apoyo
— Pedaleo variado; se agarra sus pies y los lleva a la boca
— Se arquea con fuerza
— Prensión palmar
678 Carmen Maganto
7 meses:
— Searrastra con el cuerpo boca abajo, impulsado por brazos y pies

— Se aproxima a los objetos con una mano; puede trasladarlos de una mano a otra; golpea
objetos contra una mesa; se lleva a la boca todos los objetos
8-9 meses:
— Adopta posición sentada sin apoyo

— Puede agarrar objetos entre su índice y su pulgar
— Gatea sobre manos y rodillas
— Se sostiene parado con apoyo
— Puede agarrar objetos pequeños
10-11 meses:
— Gatea sobre las manos y los pies

— Se sienta firmemente
— Adopta posición de pie sin apoyo
— Señala objetos con el dedo índice
— Suelta los objetos deliberadamente
12-14 meses:
— Camina sin apoyo

— Gatea escaleras arriba
— Da y toma objetos
— Puede hacer marcas con el lápiz
— Sujeción madura en pinza
15-17 meses:
— Lo explora todo
— Construye torres de dos dados con cierta precisión
— Tira los objetos
— Se quita los zapatos
18-21 meses:
— Corre de puntillas
— Sube escaleras con ayuda
— Empuja cosas con el pie
— Maneja la cuchara sin volcarla
— Garabatea de forma espontánea
— Se quita solo calcetines, guantes y baja cremallera
21-24 meses:
— Sube y baja escaleras poniendo ambos pies en cada peldaño

— Recoge objetos del suelo sin caerse
— Construye torres de cinco a siete dados, vuelve páginas de un libro, gira manillas y desen-
rosca tapaderas
679
B. Secuencia de desarrollo del lenguaje (habla)

0-1 mes:
— Llanto y gritos del recién nacido que significan hambre, dolor, incomodidad, etc.
— Alerta al sonido
— Progresivamente pequeños gritos guturales
2-5 meses:
— Balbuceo; se inicia con sonidos vocales, después sonidos guturales y progresivamente

toda clase de sonidos
— La expresión del balbuceo se observa en momentos de distendimiento, en respuesta a ma-
nifestaciones de afecto produciendo conversaciones que varían en tono e intensidad y por
el placer del ejercicio vibratorio y de hacer ruido
6-12 meses:
— Combina sílabas sin sentido

— Reproduce sílabas por imitación
— Se establece un verdadero intercambio madre-hijo en la comunicación
— Se articula la primera palabra con significado “papá o mamá”
— Atiende a su nombre
— Articula dos o más palabras con significado
12-18 meses:
— Inicialmente, utilización de la palabra-frase que inventada por el niño adquiere significa-

do en un contexto lingúístico dado; van ligadas a la vida emocional y frecuentemente
acompañadas de gestos
— Aumenta la utilización de palabras bien dichas y el número de éstas, 10-12 de promedio
— Comprende y responde instrucciones sencillas que requieren respuestas familiares
— Comienza la utilización del “no” en oposición consciente
19-24 meses:
— Imitación de frases o fragmentos: ecolalia

— Ordena por sí mismo dos o tres palabras en frases: inicialmente sustantivo-verbales y des-
pués sustantivo-adjetivales
— Empieza a usar pronombres yA
— Comprende órdenes sencillas e identifica signos de objetos familiares
C. Secuencia del desarrollo personal-social
0-2 meses:
— Inicialmente responde simplemente a estímulos de personas u objetos, más adelante ob-

serva la cara y después reconoce a los padres
— Vuelve la cabeza si escucha voces humanas y AOS:
— Sonríe en respuesta a sonidos agradables o sonrisas, iniciándose las sonrisas sociales
— Expresa placer por la presencia de otro mediante sonrisas, pataleos o agitación
680 Carmen Maganto
3 meses:
— Reconoce a la madre y a otros miembros de la familia, mostrando temor ante los descono-
cidos
— Llora cuando se le deja solo y deja de hacerlosise le habla o entretiene con un objeto
— Hace gestos de anticipación ante la alimentación
4 meses:
— Realiza ajustes de anticipación al hecho de cogerlo en brazos

— Muestra atención selectiva a los rostros
— Mira a la persona cuando se aleja
— Sonríe a quien le habla, muestra agrado por la atención personal y se ríe con los juegos
5-6 meses:
— Disfruta observando el medio que le rodea

— Discrimina las sonrisas y los regaños, las voces airadas y las amistosas
— Reconoce a las personas familiares con sonrisas y expresa temor ante los desconocidos
— Los avances sociales se hacen más agresivos: tiran del pelo, exploran la cara, cogen las len-
tes O la nariz, etc.
— Se producen los primeros indicadores reales de atención por otros bebés, les sonríen o
muestran interés por su llanto
7-9 meses:
— Comienza a explorar el medio

— Imita los gestos, los actos sencillos así como los sonidos del habla
— Se producen contactos con otros bebés, los mira e intenta tocarlos amistosamente
10-14 meses:
— Responde al juego social

— Deja de hacer cosas si se le dice “no”
— Acude cuando se le llama
— Muestra temor a los desconocidos, alejándose o llorando
— Continúa la imitación a los adultos
— Explora a otros bebés de su edad y a veces imita su conducta
— Se enfada si otro bebé le quita un juguete, llora y lucha
15-17 meses:
— Muestra un interés creciente por los adultos y desea estar con ellos e imitarlos
— Se interesa por otros bebés, sonríe imitándolos y comienzan los juegos
24 meses:
— Coopera con los adultos en actividades sencillas como bañarse o vestirse

— Los matertales de juego comienzan a utilizarse como medio de establecer relaciones so-
ciales
— Coopera con otros bebés para realizar juegos simples
681
D. Secuencia del desarrollo adaptativo.
1 mes:
— Observa a su madre cuando le habla y se queda quieto, también abre y cierra la boca y
mueve la cabeza
— Responde a estímulos como los sonidos del sonajero
2-3 meses:
— Sus ojos muestran fijación, convergencia y enfoque

— Sigue un juguete con la vista, primero desde que se aproxima, después de un lado a otro
— Sonríe cuando le hablan y grita de placer por lo que recibe
— Observa los movimientos de sus propias manos
4 meses:
— Sigue bien un objeto que se mueve lentamente

— Se excita cuando ve un juguete y mueve los brazos a la vista del mismo
— Muestra interés cuando ve el seno materno o el biberón
— Ríe con fuerza y vocaliza de placer cuando lo sientan
— Vuelve la cabeza cuando escucha algún sonido
5-6 meses:
— Sonríe con su imagen ante el espejo

— Tira los objetos y procura ver dónde los tiró, más adelante tratará de recogerlos
— Intenta hacer ruidos y burbujas con la lengua imitando a los adultos
— Casi todo lo que coge se lo lleva a la boca
— Puede aproximar sus labios a una taza y sus ojos están coordinados con sus manos
— Comienza a masticar y digiere alimentos sólidos
— Empieza a mostrar gusto o disgusto por los alimentos
7-9 meses
— Acaricia y aplaude su imagen en el espejo

— Reacciona cuando escucha su nombre
— Hace ruido para atraer la atención
— Puede imitar algunos movimientos
— Trata de alcanzar juguetes fuera de su alcance
— Golpea y agita el sonajero
— Se incrementa la concentración para agarrar un juguete y para Jugar
— Comienza a intentar comer solo, sosteniendo el biberón, la taza o la cuchara
10-11 meses:
— Estira la ropa u objetos de personas para llamar la atención

— Aplaude y dice adiós con la mano
— Acaricia una muñeca
— Se cubre la cara para jugar al escondite
— Tira objetos para que alguien se los coja
682 Carmen Maganto
— Mete y saca objetos de un recipiente

— Come solo y coge la taza o biberón para beber
— Mete la mano en la comida y juega con ella
12-17 meses:
— Le gustan los juegos de repetición

— Anticipa los movimientos cuando alguien se los recita
— Puede dar un beso y besar su imagen en el espejo
— Señala o nombra los que quiere coger
— Tira los objetos cuando juega o se enfada
— Comienza el negativismo
— Maneja mejor la cuchara y ya no derrama los alimentos
— Coopera en el vestirse
— Comienza a decir cuándo está mojado, iniciando así el primer signo del control de esfín-
teres
18-20 meses:
— Señala diferentes objetos correctamente cuando se le pide

— Tira un juguete de una cuerda
— Lleva o abraza un juguete determinado
— Distingue partes de la cara
— ÍImita movimientos domésticos
— Realiza Órdenes sencillas
— Garabatea de forma espontánea
21-24 meses:
— Agarra a personas para enseñarles objetos

— Conoce las cuatro partes del cuerpo
— Obedece órdenes sencillas
— Ímita trazos horizontales y verticales
— Se lava y seca las manos
— Se pone solo prendas individuales como zapatos, calcetines y pantalones
— Se inicia el control de esfínteres. Puede estar seco por la noche si orinó antes de acostarse
28. EVALUACIÓN DE LOS ESTILOS COGNITIVOS
MATEU SERVERA
IL. INTRODUCCIÓN
Los estilos cognitivos son uno de los temas más investigados en psicología puesto
que desde hace más de cuatro décadas no han dejado de aparecer publicaciones so-
bre ellos. Sin embargo, a pesar del tiempo transcurrido, todavía hoy en día se discute
con profusión sobre cómo clasificarlos, cómo definirlos e incluso cómo evaluarlos.
En cualquier caso, muchos autores estarían de acuerdo en que las repercusiones que
algunos de estos estilos cognitivos han demostrado tener sobre el rendimiento cog-
nitivo y el comportamiento social de las personas justifica sobradamente todos los
esfuerzos y las polémicas que han generado.
Tal y como se ha señalado reiteradamente (Carretero y Palacios, 1982; García
Ramos, 1989) los estilos cognitivos surgieron de la necesidad de establecer un puente
entre ciertas dimensiones cognitivas fundamentalmente relacionadas con el campo
de la percepción y algunos aspectos de la personalidad. A finales de los años cuarenta,
por la influencia de las teorías gestálticas de Kurt Lewin y Heinz Werner, surgió un
descontento con el atomismo sensorial de Wundt entonces en boga, así como por la
falta de atención que recibía el sujeto en las teorías de la percepción (Witkin y Goo-
denough, 1985). Casi al mismo tiempo que ocurría esto, algunos psicólogos de la
personalidad, especialmente los que formaban parte del movimiento psicoanalista,
empezaron a cuestionarse el papel que podría jugar la percepción en la configura-
ción de sus teorías.
El objetivo de los trabajos iniciales enmarcados en lo que se conoce como psico-
logía diferencial era la definición de rasgos estables y diferenciados en pruebas de
percepción que presentaran altas correlaciones con factores de personalidad. Esta lí-
nea de investigación de los estilos cognitivos dio lugar a lo que Huteau (1985) deno-
mina la «corriente extensiva» en la exploración de los estilos cognitivos; esta corrien-
te se caracteriza por desarrollar modelos explicativos globales del fenómeno de las
diferencias individuales intentando relacionar e integrar componentes cognitivos
con teorías de la personalidad muy ligadas a concepciones dinámicas. Los trabajos
de la Fundación Menninger, centrados en los controles cognitivos, y la teoría de la
diferenciación psicológica de Herman Witkin, basada en los trabajos sobre el estilo
dependencia-independencia de campo, son un buen ejemplo de esta corriente.
Sin embargo, con el paso del tiempo otros enfoques se acercaron al estudio de los
estilos cognitivos. Así, el interés que mostraron algunos psicólogos cognitivos y del
procesamiento de la información por el problema de las diferencias individuales alo
largo de la década de los años setenta fue decisivo para reorientar el término (Carre-

684 Mateu Servera
tero y Palacios, 1982). En esta corriente, a la que en términos de Huteau (1985) po-
demos llamar “intensiva”, el objetivo se ha centrado en estudiar los estilos cogniti-
vos básicamente desde la óptica del funcionamiento cognitivo, relacionándolos con
el tema del procesamiento de la información y las estrategias de resolución de pro-
blemas. Ello ha supuesto, por una parte, la incorporación de la metodología experi-
mental al estudio de los estilos cognitivos y, por otra, el abandono de las «cuestiones
motivacionales de raíz psicoanalítica» (Carretero y Palacios, 1982, p. 25) presente en
las primeras concepciones. Los trabajos de Kagan con el estilo cognitivo reflexivi-
dad-impulsividad y los trabajos de investigación en estrategias cognitivas de Bruner
y Pask son un buen ejemplo de esta línea que ha tenido sus principales implicaciones
en el campo de la educación. :
En cualquier caso, es evidente que la coexistencia de ambas corrientes e incluso
de otras surgidas dentro de la psicología social y de la psicología educativa ha influ1-
do a la hora de configurar un mapa confuso de los estilos cognitivos. Algunos esti-
los cognitivos han surgido exclusivamente a partir de constructos teóricos o de ex-
periencias puntuales y no disponen de pruebas de evaluación fiables que puedan
atestiguar sus supuestas áreas de influencia. Otros, en cambio, como la dependen-
cia-independencia de campo y la reflexividad-impulsividad, surgieron a partir de
planteamientos experimentales más rigurosos y se sustentan sobre pruebas de eva-
luación más sólidas, aunque no exentas de problemas. A lo largo del presente capí-
tulo vamos a abordar la problemática en general de la evaluación de los estilos cog-
nitivos, centrándonos fundamentalmente en las pruebas de evaluación de la
dependencia-independencia de campo y la reflexividad-impulsividad.
Il. CONCEPTO DE ESTILO COGNITIVO
Existe una gran diversidad de definiciones de los estilos cognitivos, dependiendo

fundamentalmente del alcance que se le confiere a esa función de reflejo de diferen-
cias individuales en la forma de actuar y de pensar de las personas y del marco de re-
ferencia en que nos situemos. Carretero y Palacios (1982) distinguen dos tipos de
definiciones que en cierto modo coinciden con las dos corrientes que hemos expues-
to. El primer tipo enfoca la concepción de los estilos cognitivos desde el prisma de la
jerarquización de las funciones cognitivas de la persona. En esta línea, Witkin (1969,
p. 687) expone que «los estilos cognitivos son manifestaciones en la esfera cognitiva
de dimensiones más amplias del funcionamiento personal evidentes también en
otras áreas de la actividad psicológica individual». El segundo tipo de definiciones
pone todo el énfasis en los aspectos puramente cognitivos; así, Kogan (1971, p. 306)
considera a los estilos cognitivos como «variaciones individuales en los modos de
percibir, recordar y pensar o como formas distintas de aprehender, almacenar, trans-
formar y emplear la información». Actualmente, parece ser que este segundo tipo de
definiciones tiene más interés para los investigadores y está generando un mayor nú-
mero de trabajos.
Desde otra óptica, Quiroga y Sánchez (1987) han distinguido tres grupos de
definiciones. En el primero están las definiciones que conciben a los estilos cogniti-
Evaluación de los estilos cognitivos
685
vos como unavariable mediadora (pero no integradora) que está involucrada en los
aspectos cualitativos de la cognición (Kagan, Moss y Siegel, 1963; Goldestein y
Blackman, 1978). En el segundo grupo se encuentran las que también se inclinan por
una concepción mediadora de los estilos cognitivos, aunque además consideran que
están implicados en todo el funcionamiento del individuo (Witkin, 1969; Kogan,
1976). Por último, en el tercer grupo están las definiciones que conceptualizan a los
estilos cognitivos como una variable integradora de aspectos cognitivos y no cogni-
tivos con una amplia influencia en todo el funcionamiento del individuo. Como
ejemplo de este grupo se encontraría la definición que han presentado las propias auto-
ras según la cual los estilos cognitivos son «un constructo hipotético superordinal,
desarrollado para describir y, en su caso, explicar las diferencias individuales obser-
vadas en alguno de los procesos que medían entre el estímulo y la respuesta, inte-
grando los aspectos cognitivos y no cognitivos de la persona» (Quiroga y Sánchez,
1987, p. 62).
En cualquier caso y pese a las evidentes divergencias en la forma de definirlos, en
nuestra opinión es posible destacar una serie de características de los estilos cogniti-
vos en las cuales coincidiría la mayoría de los autores. Tal vez la principal de estas ca-
racterísticas es que los estilos cognitivos intentan describir formas o modos del pen-
samiento en lugar de describir el producto del mismo; es decir, al contrario de lo que
ocurre con la evaluación de la inteligencia o las aptitudes en general, la evaluación de
los estilos cognitivos pretende definir estrategias de actuación de los individuos sin
que obligatoriamente ello deba implicar diferencias en su rendimiento. Otra caracte-
rística de los estilos cognitivos es que al ser evaluados acostumbran a definir un rasgo
bipolar relativamente consistente ante pruebas similares y estable a lo largo del de-
sarrollo de la persona. Este rasgo se establece a lo largo de un continuo sin que ello
implique juicios de valor ya que ambos polos son adaptativos en función de los con-
dicionantes del medio. Por otro lado, a pesar de que la mayoría de los estilos cognit1-
vos se centra en el área de la educación, es habitual que también mantengan relacio-
nes con aspectos de la conducta social de la persona (Witkin y Goodenough, 1977).
Por último, aunque no tiene por qué descartarse un sustrato biológico, los estilos
cognitivos hacen referencia a dimensiones principalmente aprendidas desde la pri-
mera infancia y susceptibles de modificación. Si bien, como señala Kogan (1971,
p. 346), esta propiedad puede variar según se trate de dimensiones que hagan más re-
ferencia a la “calidad de la capacidad” (como la dependencia-independencia de cam-
po) —en este caso su modificabilidad es más difícil— o según se refieran más a “pro-
¡edades estratégicas” (como la reflexividad-impulsividad) —en este caso serán más
fáciles de modificar.
III. CLASIFICACIÓN DE LOS ESTILOS COGNITIVOS
A la hora de determinar cuáles son las dimensiones que forman parte de los estilos
io-
cognitivos nos encontramos con serios problemas ya que las múltiples clasificac
n entre sí, sino que se han elaborad o a partirde
nes que existen no sólo no coincide
criterios diferentes. Podemos encontra r clasifica ciones basadas en criterios descrip-
686 Mateu Servera
tivos (Messick, 1970; Kogan, 1971), en criterios empíricos o de tipo metodológico

(Goldstein y Blackman, 1978) y en función del marco de referencia al que sustentan
(Flahaut, 1985). te ;
En general, entre todas estas clasificaciones existen discrepancias en el número
de estilos cognitivos que incluyen, en la importancia que se les atribuye e incluso en
la nomenclatura que se utiliza, pero también acostumbran a coincidir a la hora de
destacar a la dependencia-independencia de campo y a la reflexividad-impulsividad
como los dos estilos cognitivos más importantes. En los siguientes apartados nos ex-
tenderemos en las cuestiones que afectan a la evaluación de estos dos estilos cognit1-
vos debido a que han sido los que han recibido una mayor atención por parte de los
investigadores y los que presentan mayores implicaciones en el ámbito educativo,
social e incluso laboral.
En lo que respecta a los restantes estilos cognitivos, necesariamente hay que rea-
lizar una selección porque, por una parte, nos ocuparía mucho espacio abarcarlos
todos y, por otra parte, muchos de ellos actualmente sólo mantienen un valor histó-
rico. En el cuadro 28.1, a partir de la importancia que atribuimos a sus pruebas de
evaluación, aparecen algunos de los estilos cognitivos más destacados. Desde otro
punto de vista también podríamos incluir la complejidad-sencillez cognitiva, el ries-
go-cautela, convergentes-divergentes, etcétera.
En el primer grupo aparecen dos de los estilos cognitivos ligados al Centro de
Estudios Cognitivos de Harvard que desde el punto de vista de la evaluación difie-
ren de casi todos los demás por el hecho de centrarse en el análisis de estrategias de
aprendizaje a partir de la elaboración de tareas de laboratorio. El segundo grupo de
estilos, aquéllos ligados a los trabajos de la Fundación Menninger, se caracterizan
por haber surgido de las teorías dinámicas y por centrarse en el ámbito de la perso-
nalidad, aunque su evaluación se realice fundamentalmente con pruebas perceptivas.
Por último, los dos restantes tienen como uno de sus méritos principales haber ser-
vido de base para el desarrollo de otras dimensiones; en concreto, los estilos de con-
ceptualización permitieron el desarrollo de la reflexividad-impulsividad, y la ampli-
tud de categorización, y sus pruebas de evaluación, está muy ligada a cuestiones
actuales dentro de la psicología social.
IV. DEPENDENCIA-INDEPENDENCIA DE CAMPO (DIC)
Entre los investigadores interesados en el tema existe un amplio acuerdo en que la

dependencia-independencia de campo (DIC) es el estilo cognitivo más relevante y
con las mayores repercusiones tanto en el ámbito teórico como aplicado. La DIC
surgió de los trabajos de Witkin y colaboradores a finales de los años cuarenta so-
bre la percepción de la verticalidad (Witkin, 1954, 1962) a los que se unieron poste-
riormente los trabajos sobre la capacidad de reestructuración cognitiva. Estos dos
componentes de la dimensión, como se verá posteriormente, se encuentran perfec-
tamente reflejados en las distintas pruebas de evaluación que se utilizan, si bien
desde el punto de vista teórico han sido motivo de controversia (García Ramos,
1989).
687
CUADRO 28.1. Principales estilos cognitivos (exceptuando la dependencia-independencia de

campo y la reflexividad-impulsividad)
EN RELACIÓN CON EL CENTRO DE ESTUDIOS COGNITIVOS DE HARVARD
Estilo cognitivo Definición Evaluación

Enfoque-Explotación | Se refiere a las estrategias que adoptan los Tareas de laboratorio
sujetos a la hora de enfrentarse a determi- de Bruner, Goodnow y
nadas tareas de solución de problemas. En Austin (1952).
la estrategia de enfoque, el material se pro-
cesa de forma secuencial y lógica y en la de
exploración se trabaja simultáneamente con
varias hipótesis.
Serialistas-Holistas Se refiere a las estrategias que adoptan los Tareas de laboratorio y

sujetos fundamentalmente en condiciones dos tests paralelos: The
de aprendizaje libre. Los serialistas proce- spy ring history y
san la información de manera encadenada Smugglers test (Pask,
estableciendo relaciones simples, mientras 1976).
los holistas procesan la información como
un todo estableciendo fuertes relaciones de
orden.
EN RELACIÓN CON LOS TRABAJOS DE LA FUNDACIÓN MENNINGER
Escudriñamiento Se refiere a la capacidad atencional del su- La tarea del error

jeto a la hora de realizar estimaciones res- constante en los juicios
pecto a estímulos perceptivos ya sea en ilu- de estimación de tamaño
siones o en tareas de emparejamiento. (Gardner y cols., 1959).
Nivelamiento- El nivelamiento se refiere al hecho de ignorar Tests de

Agudización las diferencias entre unos estímulos vistos esquematización
anteriormente y otros estímulos presentes. (versión infantil de
La agudización se refiere a la capacidad de Santostefano, 1964).
seguir manteniendo diferencias entre estimu-
los separados por un intervalo de tiempo.
Control flexible-rígido Se refiere a las diferencias que se observan El test de interferencias

entre los sujetos en su susceptibilidad a ser color-palabras (versión
distraídos por estímulos irrelevantes en la infantil de Santostefano
realización de una tarea. y Paley, 1964).
Tolerancia a Se refiere al grado en que un sujeto es ca- Instrumentos que crean

experiencias irreales paz de aceptar y manifestar experiencias el movimiento aparente
que él sabe positivamente que son irreales. (Klein y Schlesinger,
1951) y el Rorschach.
OTROS ESTILOS COGNITIVOS RELEVANTES
Estilos de Se refiere a la forma en que los sujetos reali- | Test de estilos

conceptualización zan clasificaciones cuando se les proporcio- | conceptuales (Kagan,
(analítico, funcional y na un conjunto heterogéneo de objetos para | Moss y Sigel, 1963).
categorial) que sean agrupados según sus preferencias.
Amplitud de Se refiere a las distintas formas de evaluar — Cuestionario de

categorización el riesgo que realizan los sujetos ante tareas Pettigrew (1958).
de categorización. Unos prefieren aceptar — Tarea geométrica de
un error de inclusión (categoría amplia) y Wallach y Caron
otros uno de exclusión (categoría estrecha). (1959).
— Tarea verbal de
Fillembaum (1959).
688 Mateu Servera
La DIC se puede definir como «el grado en que la persona percibe una parte del
campo perceptivo como separado del contexto que lo rodea, en vez de hacerlo como
si estuviera incluido en él [...]; o por decirlo en palabras más corrientes, el grado en
que la persona percibe de forma analítica» (Witkin y cols., 1977, pp. 6-7). Así pues, la
DIC es un continuo con dos polos: la independencia de campo que hace referencia a
la elevada capacidad para reestructurar un campo perceptivo, es decir, la percepción
muestra una cualidad analítica, y la dependencia de campo que se refiere auna baja
capacidad de reestructuración del campo perceptivo, es decir, existen dificultades
para separar los elementos que configuran un contexto. En definitiva, siguiendo a
Witkin y cols. (1977) podemos resumir las características de la DIC señalando que se
trata de una dimensión con una gran estabilidad a lo largo del desarrollo, que influye
directamente en la forma en que las personas perciben y procesan la información del
medio, y que también tiene importantes repercusiones sobre gran parte de su activi-
dad espontánea.
Iv. Pruebas de evaluación de la dependencia-independencia de campo

En principio debemos distinguir entre dos tipos de pruebas. Cronológicamente las
primeras que aparecieron fueron las pruebas de percepción de la verticalidad que
son complicados artilugios de laboratorio, entre los que destacan el Body adjuste-
ment test (BAT) [Test de ajuste corporal], el Rod and frame test (RFT) [Test del marco
y la varilla] y el Rotating room test (RRT) [Test de la habitación rotatoria]. Posterior-
mente, aparecieron las pruebas de lápiz y papel centradas en el estudio de la capaci-
dad de reestructuración cognitiva del sujeto; en este caso se utilizó el Embedded fi-
gures test (EFT) [Test de figuras enmascaradas] con sus distintas versiones.
Iv.1.1. El Body adjustement test (BAT) [Test de ajuste corporal]

En esta prueba el sujeto se sienta en una silla móvil que a su vez está colocada dentro
de una pequeña habitación también móvil. El experimentador mueve a derecha o iz-
quierda la habitación y a continuación se le pide al sujeto que adopte una posición
vertical. Los sujetos que toman como punto de referencia su propio cuerpo —es de-
cir, permanecen sentados correctamente— son considerados independientes de
campo (IC), mientras que los sujetos que intentan hacer coincidir el ángulo de su silla
con el grado de inclinación de la habitación son considerados dependientes de cam-
po (DC).
1v.1.2. El Rod and frame test (RFT) [Test del marco y la varilla]
En esta prueba se coloca al sujeto en una habitación totalmente oscura en la cual ve

un marco cuadrado luminoso y dentro de él una varilla también luminosa. El experi-
mentador mueve a voluntad el marco, mientras la tarea del sujeto consiste en colocar
la varilla en posición vertical. Los resultados demostraron que algunas personas co-
689
locan la varilla vertical tomando como eje de referencia su propio cuerpo (IC), mien-
tras que Otras personas se rigen por pautas externas y ajustan la varilla al grado de in-
clinación del marco (DC).
Iv.13. El Rotating room test (RRT) [Test de la habitación rotatoria]
Esta prueba en contraste con las anteriores pretende modificar la fuerza gravitacio-
nal mientras el campo visual permanece estable en posición vertical. Para ello se sien-
ta al sujeto en una silla móvil que se encuentra dentro de una pequeña habitación la
cual es impulsada a lo largo de un carril circular, de este modo la fuerza que actúa so-
bre el sujeto es el resultado de los efectos de la fuerza centrífuga y de la fuerza de gra-
vedad. Al final se pide al sujeto que coloque su cuerpo en la posición en la que consi-
dere que está derecho. Curiosamente, en este caso se pudo verificar que los sujetos
que se regían por pautas internas tenían muchas más dificultades en adoptar una
postura correcta que los que se regían por pautas externas. Ello es lógico ya que las
referencias de los IC han sido alteradas por el efecto de la fuerza centrífuga mientras
la referencia de los DC (el campo visual) en este caso no ha sufrido ninguna altera-
ción.
Es importante remarcar acerca de estas tres pruebas de laboratorio que la DIC
demostró tener un alto grado de estabilidad ya que los sujetos independientes de
campo en el BAT también acostumbraban a ser clasificados como tales en las otras
dos pruebas y lo mismo sucedía con los dependientes de campo (Witkin y Goode-
nough, 1985).
1V.14. El Embedded figures test (EFT) [Test de figuras enmascaradas]

Esta prueba de lápiz y papel consta de diferentes versiones según la edad de los suje-
tos aunque la tarea a realizar siempre es la misma: encontrar una figura simple escon-
dida dentro de otra más compleja sin que en ningún momento ambas figuras se en-
cuentren a la vez a la vista del sujeto. El FT es la versión individual del test diseñada
para ser utilizada a partir de los 10 años de edad. Consta de dos series de figuras
complejas (formas A y B) de seis láminas cada una y de ocho láminas de figuras sim-
ples. El sujeto debe encontrar y trazar la figura simple correspondiente dentro de
cada figura compleja sin que en ningún momento coincidan ambas figuras. El expe-
rimentador registra en cada ítem el tiempo en segundos que el sujeto tarda en encon-
trar la solución (el tiempo límite es de 180 segundos). La puntuación definitiva se
obtiene sumando el tiempo total y dividiéndolo por los 12 ítems. Lógicamente,
cuanto menor sea el tiempo invertido mayor es la tendencia hacia la independencia
de campo.
El GEFT es la forma colectiva del EFT y consta de un cuadernillo que incluye
ítems de entrenamiento y dos secciones de evaluación con nueve ítems cada una. En
el cuadernillo aparecen de forma correlativa las figuras complejas y al final se en-
cuentran las ocho figuras simples. La tarea del sujeto consiste en 11 trazando con un
lápiz las figuras simples correspondientes dentro de cada figura compleja teniendo
690 Mateu Servera
en cuenta que sólo dispone de cinco minutos para cada una de las dos secciones. La
puntuación final es el número total de formas simples trazadas correctamente con
un máximo de 18 puntos. Una puntuación elevada siempre indica una tendencia ha-
cia la independencia de campo.
El Children embedded figures test (CEFT) es una versión infantil del test de apli-
cación individual que se puede utilizar entre los 6 y los 12 años. Consta de dos figu-
ras simples recortadas (un triángulo o tienda india y una casa) que corresponden a
las dos series de evaluación del test; la serie tienda está formada por 11 figuras sim-
ples y la serie casa por 14. El niño, tras superar las series de demostración y de entre-
namiento, debe encontrar la figura simple correspondiente en cada una de las figuras
complejas sin que exista límite de tiempo —aunque en algunas ocasiones se ha pro-
puesto el límite de dos minutos por ítem. La puntuación final del test es el número
de ítems correctamente resueltos y, lógicamente, una puntuación elevada indica una
tendencia hacia la independencia de campo.
El Preschool embedded figures test (PEFT) es una versión de Coates (1972) para
ser utilizada con niños entre 3 y 5 años. Consta de una serie de actividades y figuras
de entrenamiento y la evaluación se efectúa sobre 24 figuras complejas. La tarea del
niño consiste en encontrary señalar una figura simple (un triángulo recortado) so-
bre cada uno de los 24 ítems obteniendo un punto por cada respuesta correcta. De
nuevo una puntuación elevada es considerada como indicativa de un estilo cognitivo
independiente de campo.
Por último, hay que señalar que existen baremaciones estadounidenses para to-
das estas versiones e incluso el manual del EF7, del GEFT y del CEFT se halla traduci-
do por TEA (1981). En el caso del GEFT también disponemos de algunas baremacio-
nes con muestras españolas (Fernández-Ballesteros y Maciá, 1981; Roda, 1982;
Amador, Forns y Kirchner, 1988).
1v2. Principales implicaciones de la evaluación de la dependencia-

independencia de campo
La evaluación de la dependencia-independencia de campo (DIC) ha tenido impor-
tantes implicaciones tanto desde el punto de vista teórico como aplicado. Aquí fun-
damentalmente nos centraremos en los aspectos aplicados, pero no podemos olvidar
que la investigación sobre la DIC ha servido de base para la elaboración de diversas
teorías como la diferenciación psicológica de Witkin (Witkin, Goodenough y Olt-
man, 1979; Witkin y Goodenough, 1985), el modelo ecológico de Berry (1976) o la
teoría de los operadores constructivos de Pascual-Leone (1974).
Los estudios evolutivos han demostrado que, aunque no es descartable la in-
fluencia genética, el origen de la dimensión está en las pautas de crianza de los prime-
ros años (Witkin y cols., 1962). Por otra parte, se trata de una dimensión que presen-
ta una elevada estabilidad interindividual pero no intraindividual, es decir, aunque
con la edad todas las personas tiendan a hacerse más independientes de campo, cada
individuo mantiene sus diferencias respecto a sus compañeros en el grupo normati-
vo. La puntuación se estabiliza hacia los 17-18 años y en la senectud se experimenta
una vuelta a la dependencia de campo. Por otra parte, a pesar de que es un tema algo
691
polémico, es habitual que hasta los 10-11 años o bien no aparezcan diferencias por
sexos en la puntuación de la DIC o bien las niñas sean algo superiores (Kogan, 1976);
sin embargo, en la preadolescencia y en la edad adulta los varones acostumbran a ser
más independientes de campo que las mujeres (Witkin y Goodenough, 1985; García
Ramos, 1989).
Aunque actualmente la mayor influencia de la DIC se centre en el campo cogniti-
vo, desde siempre se ha destacado su influencia sobre otras áreas; por ejemplo, desde
elpunto de vista dinámico de la personalidad se ha encontrado que la DIC correla-
ciona con los mecanismos de defensa, de control y con el esquema corporal (Fernán-
dez-Ballesteros, 1980; Beltrán, 1985; García Ramos, 1989). Por otra parte, también
se han señalado importantes relaciones de la dimensión con el comportamiento so-
cial; así, se considera que las personas dependientes de campo tienden a buscar más
el contacto social y son percibidas por los demás como más amables y de fácil trato,
mientras los independientes de campo son considerados individualistas y más insen-
sibles a las influencias sociales (Witkin y Goodenough, 1977; Witkin y cols., 1979).
Desde otra óptica, como ya señalaron Witkin y cols. (1977), Kogan (1976), y Pa-
lacios y Carretero (1982), algunas de las implicaciones más importantes de la DIC se
dan en el ámbito educativo. Palacios y Carretero (1982) distinguen entre dos tipos
de estudios: los estudios de laboratorio centrados sobre aspectos básicos del apren-
dizaje y los estudios de desempeño escolar en ambientes naturales. Dentro del pri-
mer grupo de estudios, Goodenough (1976) encontró dos características básicas de
los DC: son mucho más susceptibles al refuerzo negativo aplicado en forma de crítica
verbal y realizan un mejor aprendizaje en condiciones de motivación extrínseca; por
su parte, los IC trabajan mejor en situaciones de motivación intrínseca.
Los experimentos sobre adquisición de conceptos y sobre memoria (Witkin y
cols., 1977) señalan diferencias importantes entre dependientes e independientes de
campo en el modo de actuación. Los primeros tienden a utilizar estrategias globales
y poco estructuradas, mientras los segundos se decantan por el uso de una articula-
ción estructurada y por el sistema de hipótesis-refutación. De todos modos, ello no
quiere decir que necesariamente un estilo sea superior al otro en tareas de resolución
de problemas, ya que parece evidente que el rendimiento depende en última instan-
cia del tipo de tarea que utilicemos.
En cuanto al rendimiento académico, resulta evidente que los IC siempre mues-
tran una clara superioridad en las asignaturas “científicas”, así como en capacidad y
comprensión lectora (véase la revisión de Palacios y Carretero, 1982). Por contra, en
algunos trabajos se ha pretendido demostrar que los DC son superiores en asignatu-
ras de contenido social (Ruble y Nakamura, 1972), aunque Witkin y cols. (1977)
aconsejan ser prudentes en este tema puesto que no todos los resultados son coinci-
dentes y además no está claro que la mayor inclinación social de los DC sea equipara-
ble al contenido de asignaturas como historia o geografía. En cualquier caso, lo que
sí parece comprobado es que los DC se inclinan más por carreras de “letras” y los IC
or carreras de “ciencias” y en los casos en que ello no es así existen bastantes más
probabilidades de fracaso (Witkin, 1976; Shade, 1983).
Por otra parte, también se han podido comprobar los interesantes efectos que
produce la relación entre el estilo cognitivo del alumno y del profesor. Profesores y
alumnos que comparten el mismo estilo cognitivo garantizan un aprendizaje más
692 Mateu Servera
eficaz y una percepción mutua más positiva, pero, cuando ello no es así, la tendencia
es que ambos realicen una evaluación más negativa del proceso de enseñanza-apren-
dizaje (Goodenough, 1976; Witkin y cols., 1977). cae
Un tema de gran importancia y que siempre ha estado envuelto en lapolémica es
la relación entre la DIC y la inteligencia. Vernon (1972) realizó un ambicioso trabajo
del cual se concluía que el cociente intelectual (CI) era capaz de explicar casi toda la
variabilidad atribuida a las puntuaciones de la DIC. En esta misma línea, Satterly
(1976) también encontró correlaciones muy elevadas entre la DIC y el CI. En res-
puesta a estos trabajos, Witkin y Goodenough (1977) explicaron dicha relación ba-
sándose en el hecho de que algunos tests de inteligencia y las pruebas de la DIC po-
drían compartir un mismo factor de capacidad; en concreto, se referían al factor
analítico, pero, por contra, otros factores de inteligencia (por ejemplo, el verbal y el
atencional) no guardaban ninguna relación con la DIC. Por otra parte, en otro traba-
jo de Satterly (1979) se ofrecen datos que apoyan la existencia de una cierta indepen-
dencia entre el CI y la DIC. La conclusión a este tema es que parece lógico que las per-
sonas independientes de campo obtengan mejores puntuaciones sobre algunos tests
de inteligencia que las dependientes, pero de ahí no se deduce que unas sean más in-
teligentes que las otras (Witkin, 1962).
Por último, hay que referirse a las implicaciones de la DIC dentro del mundo la-
boral. Las principales líneas de investigación establecidas se centran en la conduc-
ción de automóviles (en general, los DC parecen más propensos a sufrir accidentes),
la congruencia entre estilo cognitivo y trabajo que se realiza (en determinadas profe-
siones como, por ejemplo, en las de controlador aéreo, la influencia de este estilo pa-
rece decisiva), y las relaciones entre la DIC y el comportamiento del consumidor.
V. REFLEXIVIDAD-IMPULSIVIDAD (R-D
El concepto de reflexividad-impulsividad (R-I) surgió de los trabajos de Kagan y co-

laboradores a mediados de los años sesenta (Kagan y cols., 1964) utilizando el test de
estilos conceptuales. En esta prueba el sujeto debe agrupar una serie de dibujos de
personas, animales u objetos en función de algún criterio que después se haya cate-
gorizado. Contrariamente a lo que se había hipotetizado se encontró que los sujetos
más inteligentes y más inclinados hacia las actividades intelectuales fueron los que
tardaron más tiempo en realizar sus agrupaciones y además éstas fueron de tipo ana-
lítico (es decir, basadas en un elemento compartido por todas las figuras). Ello dio
pie al estudio de la variable latencia de respuesta y su relación con los índices de efi-
cacia en una serie de tareas de resolución de problemas tanto en adultos como en ni-
ños, si bien al final la mayoría de los trabajos se ha desarrollado en edades infantiles.
La R-I se define como un índice de la capacidad analítica del niño presente fun-
damentalmente ante pruebas que impliquen incertidumbre de respuesta (Kagan y
cols., 1964; Kagan, Lapidus y Moore, 1978). El niño reflexivo es aquel que se detiene
a evaluar la validez de sus hipótesis de solución y presenta largas latencias acompa-
ñadas de pocos errores, mientras el impulsivo es aquel que acostumbra a evaluar de
modo incorrecto o simplemente no evalúa una serie de hipótesis, lo que provoca que
693
presente muchos errores acompañados de latencias cortas. En definitiva, como seña-

lan Kogan (1971, 1976) y Palacios (1982), las principales implicaciones de este estilo
cognitivo están estrechamente relacionadas con los procesos de solución de proble-
mas —especialmente con la generación y evaluación de alternativas— y con el rendi-
miento académico. Como es de suponer, los niños impulsivos son los que acostum-
bran a presentar mayores problemas y un rendimiento más pobre sobre la mayoría
de las tareas cognitivas.
v.1. Pruebas de evaluación de la reflexividad-impulsividad

En un principio se utilizó una gran cantidad de pruebas con un contenido de incerti-
dumbre de respuesta para evaluar la R-I, no obstante, el Matching familiar figures
test (MFFT) [Test de emparejamiento de figuras familiares] de Kagan (1965) se perfiló
como la prueba más interesante. Sin embargo, no podemos dejar de mencionar otras
pruebas que, sin ser diseñadas expresamente para tal fin, también se han venido utili-
zando para evaluar el constructo “impulsividad”, que no en todos los casos coincide
con la R-I ya que también incluye hiperactividad e impulsividad en el sentido de ras-
go de personalidad. Entre estas pruebas se encuentra el Test de los laberintos de Por-
teus, las tareas de inhibición motora centradas en dibujar lo más lentamente posible
una línea y en caminar lo más lentamente posible sobre una línea, las Resistance to
temptation tasks (RTT) [Tareas de resistencia a la tentación] y algunos cuestionarios
de personalidad como el Eysenck personality inventory (EP1) [Inventario de perso-
nalidad de Eysenck] y la Escala de autocontrol de Kendall y Wilcox.
v.11. El Matching familiar figures test (MEFT) [Test de emparejamiento

de figuras familiares]
Se trata de una prueba perceptiva de aplicación individual que consta de 12 ítems con
idéntica estructura: el sujeto debe observar un modelo (una figura familiar) y otras
seis figuras alternativas muy parecidas de entre las cuales debe señalar la que es exac-
tamente igual al modelo, teniendo en cuenta que sólo existe una respuesta acertada y
que no tiene un límite de tiempo. En cada ítem el experimentador registra dos pun-
tuaciones: el tiempo en segundos que tarda el sujeto en dar la primera respuesta, sea
o no acertada, y el número de errores (máximo de cinco). Al final se obtienen dos
puntuaciones: errores (el número total de errores) y latencias (la latencia media de
respuesta, es decir, la suma total del tiempo dividido por 12). e,
Desde un principio la baremación del test se presentó problemáticayaque había
que combinar dos puntuaciones con un origen muy distinto: las latencias (factor de
estilo) y los errores (factor de capacidad), por ello, y dada la elevada correlación ne-
gativa que se supuso entre ambas puntuaciones, se optó por un sistema de clasifica-
ción más simple basado en la doble división por las medianas de errores y latencias.
Este sistema consiste en calcular las medianas de errores y latencias en cada muestra
donde se aplique el test con el fin de establecer cuatro cuadrantes (véase cua-
dro 28.2).
Mateu Servera
694
CUADRO 28.2. Sistema de clasificación basado en la doble división por las medianas de erro-
res y latencias
+
REFLEXIVOS LENTOS-
INEXACTOS
LATENCIAS
RÁPIDOS- IMPULSIVOS
EXACTOS
ERRORES
Se consideran impulsivos aquellos niños que presentan puntuaciones que están

por debajo de la mediana de latencias y por encima de la de errores, y reflexivos los
que están por encima de la mediana de latencias y por debajo de la de errores. Los
otros dos grupos resultantes, rápidos-exactos y lentos-inexactos, que acostumbran a
constituir un tercio de las muestras, se eliminan al considerar que no difieren en tér-
minos de estilo sino exclusivamente en términos de capacidad.
Existen diversas versiones del MFFT; el MFFT-F es la versión original que hemos
descrito para niños en edad escolar. El MFFT-S es —en teoría— su forma paralela,
aunque algunos autores consideran que no cumple correctamente tal cometido
(Egeland y Weinberg, 1976). Para trabajar con adultos, Yando y Kagan (1968) desa-
rrollaron una versión más complicada aunque también acusa problemas de fiabili-
dad y validez. Por último, Palacios (1982) cita un trabajo no publicado de Kagan
en donde se destacan las grandes dificultades para evaluar la dimensión R-I en prees-
colar al confundirse con el CI; aun así, se ha utilizado el MFFT-K (actualmente en
desuso) y en mayor medida el Kansas reflection-impulsivity scale for prescholers
(KRISP) de Wright (1971), del cual se dispone de bastantes datos incluyendo una ba-
remación basada en una muestra de 1400 niños entre tres y cinco años (Wright,
1978). Sin embargo, a pesar de todo, bastantes autores siguen opinando que se trata
de una prueba con importantes limitaciones psicométricas (Salkind y Schlecter,
1982; Gaddis y Martin, 1989).
En cualquier caso, la verdad es que durante los años setenta, las críticas a todas
las pruebas de evaluación de la R-I fueron constantes (Ault, 1973; Block, Block y
Harrington, 1974; Ault, Mitchell y Hartman, 1976). En primer lugar, respecto al
MFFT, se encontró que la correlación negativa entre errores y latencias que en un
695
principio debía ser muy elevada solamente estaba alrededor de 0,50 y, por otra
par-
te, sus índices de fiabilidad a pesar de su fluctuación y de que fueran algo más eleva-
dos en muestras de sexo femenino en general demostraron ser bastante bajos. Por
ejemplo, utilizando el método del test-retest, los índices estaban alrededor de 0,50
para los erroresysobre 0,54 para las latencias, mientras que los índices de consisten-
cia interna se situaron sobre 0,90 en el caso de las latencias, pero solamente sobre
0,64 en el caso de los errores (Servera, 1992).
Respecto al sistema de clasificación de cuadrantes descrito anteriormente, ha si-
do reiteradamente calificado como arbitrario y poco fiable (Ault y cols., 1976; Ege-
land y Weinberg, 1976). En principio, con este sistema se dicotomizan artificialmen-
te los errores y las latencias que son dos variables continuas y además se pierde cerca
de un tercio de las muestras. Por otra parte, al utilizar un estadístico como la media-
na, se magnifican las diferencias causales hasta el punto que, según Ault y cols. (1976,
p. 228), «la confusión entre, por una parte, reflexivos y lentos-inexactos y, por otra
parte, impulsivos y rápidos-exactos acontecerá en el 24% de los casos». Las solucio-
nes a los problemas del MFFTy al sistema de evaluación tradicional aparecerán a fina-
les de los años setenta con el test MFF-20 de Cairns y Cammock (1978) y el sistema de
clasificación de Salkind y Wright (1977).
El MFF-20 de Cairns y Cammock (1978) es una versión muy mejorada del ori-
ginal MFFT que mantiene una estructura idéntica y que se caracteriza tanto por el
hecho de tener 20 ítems en lugar de 12 como por el sustancial aumento que se ob-
serva en la correlación entre errores y latencias, y en sus índices de fiabilidad
cuando se trabaja con niños entre 6 y 12 años. Este aumento, aunque fluctúe en
función de la edad de la muestra con la que se trabaje (Cairns y Cammock, 1978;
Navarro, 1987; Quiroga y Forteza, 1988; Servera, 1992), sitúa la correlación erro-
res-latencias alrededor de -0,68 y la fiabilidad por consistencia interna de los erro-
res y las latencias respectivamente sobre 0,70 y 0,94. Por su parte, el sistema de
clasificación de Salkind y Wright (1977) (véase cuadro 28.3) se basa en una rota-
ción de los cuatro cuadrantes de la distribución original de forma que para cada
sujeto se definen dos puntuaciones o índices totalmente independientes: la pun-
tuación de impulsividad (PI) que se obtiene restando sus puntuaciones típicas de
errores y latencias y la puntuación de eficacia (PE) que se obtiene sumando estas
mismas puntuaciones.
La interpretación de las puntuaciones en lo que respecta a la R-1 se hace del si-
guiente modo: cuanto mayor es la PI positiva, mayor es la tendencia hacia la impulsi-
vidad, y, cuanto mayor es la PI negativa, mayor es la tendencia hacia la reflexividad.
Las puntuaciones alrededor del 0,00 indican un estilo flexible y poco definido. Entre
las ventajas de este sistema destaca el hecho de que, contrariamente a lo que había-
mos visto anteriormente, no es necesario prescindir de ningún sujeto de la muestra
puesto que todos tienen una puntuación de estiloyotra de eficacia que podemos uti-
lizar por separado en función de nuestros objetivos de evaluación. Por otra parte,
este nuevo sistema no supone ningún cambio drástico respecto al anterior puesto
que prácticamente todos los sujetos claramente impulsivos y reflexivos enel sistema
de cuadrantes continúan manteniendo este estatus en el sistema de Salkind y Wright
(1977). En España, los trabajos de Quiroga y Forteza (1988) y Servera (1992) apor-
tan datos en favor de la utilización de este sistema; sin embargo, todavía quedan pen-
696 Mateu Servera
"CUADRO 28.3. El sistema de clasificación de Salkind y Wright (1977)
PUNTUACIÓN DE IMPULSIVIDAD (P1)

PI positivas > IMPULSIVIDAD
PI = Z errores — Z latencias ————] (puntuación 0,00)
PI negativas + REFLEXIVIDAD
PUNTUACIÓN DE EFICACIA (Pe)

PE positivas > INEFICACIA
PE = Z errores + Z latencias ————— (puntuación 0,00)
PE negativas > EFICACIA
Z errores = Puntuación típica de errores y Z latencias = Puntuación típica de latencias.
dientes algunas cuestiones como es la controversia sobre la validez diferencial que

presentan las puntuaciones 1 y E.
v2. Principales implicaciones de la evaluación

de la reflexividad-impulsividad
Los estudios sobre la evolución y la incidencia de la R-1 revelan que con la edad
siempre se tiende hacia la reflexividad aunque, como ocurre en la DIC, la dimensión
también presenta una cierta consistencia interindividual. Sin embargo, al contrario
de lo que hemos visto en la DIC, la R-I carece de pruebas de evaluación fiables en
preescolar y por encima de los 14 años y, por otra parte, normalmente no aparecen
diferencias por sexos y si aparecen acostumbran a indicar una mayor reflexividad
por parte de las niñas. Estas diferencias entre ambas dimensiones, junto con algunos
estudios evolutivos, han provocado que diferentes autores consideren que los resul-
tados de la evaluación de la R-I estén en función primordialmente del nivel de madu-
ración del niño (véase la revisión de Ancillotti, 1985); sin embargo, los estudios ex-
perimentales sobre análisis de pautas visuales y sobre estrategias de procesamiento
han coincidido en señalar que, independientemente de la edad, impulsivos y reflexi-
vos difieren en el modo en que se enfrentan a las tareas de resolución de problemas
(Zelniker y Jeffrey, 1979; Smith y Kemler-Nelson, 1988).
697
Respecto alnivel de rendimiento sobre estas tareas, los niños reflexivos han mos-
trado su superioridad sobre sus compañeros impulsivos en tareas de tipo perceptivo
O perceptivo-motor (Messer, 1976), en tareas que implican el funcionamiento de la
memoria a corto y a largo plazo (Siegel, Kirasic y Kilburg, 1973), en tareas de razo-
namiento analógico (Cameron, 1984), en tareas de capacidad atencional (Quay y
Weld, 1980), en algunas tareas piagetianas (Brodzinsky, 1982) e incluso en tareas que
en principio deberían favorecer la aproximación holística de los impulsivos (Smith y
Kemler-Nelson, 1988). Evidentemente, la cuestión está en discernir si las diferencias
entre impulsivos y reflexivos pueden ser conceptualizadas en función de distintas es-
trategias de actuación o, por el contrario, se deben a que los dos grupos presentan
distintos valores en el Cl,
Las relaciones de la impulsividad con la inteligencia es un tema que se ha aborda-
do con profusión sin que todavía dispongamos de un marco explicativo definitivo
(Kogan, 1976; Messer, 1976; Palacios, 1982; Quiroga y Forteza, 1988). De todos mo-
dos, existe una serie de aspectos que están suficientemente contrastados y que deben
ser tenidos en cuenta a la hora de evaluar la R-I. En primer lugar, sabemos que en
edad preescolar la R-I y el CI mantienen elevadas correlaciones incluso por encima
de 0,60, de forma que, como señala Kogan (1976), la puntuación de errores del MEFT
puede entenderse como una forma alternativa de evaluación de la inteligencia, mien-
tras las latencias presentan correlaciones mucho más bajas. En edad escolar, las co-
rrelaciones descienden bastante, aunque siguen siendo significativas (especialmente
en el caso de las niñas), si bien de nuevo son atribuibles casi exclusivamente a la pun-
tuación de errores. Por último, dicha relación siempre estará en función del tipo de
test de inteligencia que utilicemos, si éste contiene un alto grado de incertidumbre de
respuesta (las Matrices progresivas de Raven, el PMA de Thurstone, el Otis-Lennon,
etc.) cabe esperar correlaciones mucho más elevadas que en caso contrario.
En nuestra opinión, como ya apuntó Kogan (1976), es evidente que la R-I (tal
vez en mayor grado que la DIC) está hasta cierto punto en función del CI; sin embar-
go, el hecho de que las correlaciones se centren fundamentalmente en la puntuación
de errores y no en la de latencias nos obliga a considerar tal influencia como limitada.
De hecho, al igual que ocurre con los niños con dificultades de aprendizaje, en mu-
chas ocasiones es posible observar cómo el CI de los niños impulsivos no predice
adecuadamente su nivel de rendimiento. Precisamente, es dentro del ámbito del ren-
dimiento académico y de los problemas de aprendizaje donde la evaluación de la R-I
adquiere su máxima relevancia. Kogan (1971) ya indicó que la R-l era el estilo cogni-
tivo con más implicaciones en el campo del aprendizaje y posteriormente toda una
serie de trabajos (Messer, 1976; Palacios y Carretero, 1982) lo han confirmado. En
general, los niños reflexivos acostumbran siempre a presentarun mejor rendimiento
académico que los niños impulsivos, especialmente en matemáticas y en lectura; ade-
más, los niños impulsivos padecen con más frecuencia dificultades de aprendizaje
(Palacios y Carretero, 1982). A partir delos trabajos de Bornas y cols. (1990) y Ser-
vera (1992), se puede concluir que las diferencias de rendimiento entre impulsivos y
reflexivos siempre son estadísticamente significativas y favorables a estos últimos
prácticamente a lo largo de todos los cursos de la enseñanza primaria, tanto si eva-
luamos el rendimiento a través de la evaluación del profesor como a través de prue-
bas objetivas.
698 Mateu Servera
La constatación de los problemas que afectaban a los niños impulsivos llevó a los
investigadores a la búsqueda de procedimientos de modificación del estilo tendentes
a instaurar una estrategia reflexiva. Entre los procedimientos que han obtenido algu-
nos éxitos, pero que han tenido problemas en el mantenimiento y la generalización
de los resultados, destacan aquéllos basados en el condicionamiento operante, en el
entrenamiento en discriminación visual y en la técnica del modelado y las autoins-
trucciones. Actualmente, como señalan Moore y Hughes (1988), se considera que
los procedimientos que ofrecen más garantías son los programas cognitivo-conduc-
tuales multicomponentes (que incluyen, entre otras técnicas, auto1mstruccionesyso-
lución de problemas) combinados con un entrenamiento en estrategias cognitivas y
metacognitivas (Meichenbaum, 1985).
Por último cabe destacar que los trabajos que intentan relacionar la R-I con ras-
gos de personalidad y con el comportamiento social han obtenido resultados con-
trovertidos (Milich y Kramer, 1984; Quiroga y Forteza, 1988); en cualquier caso, pa-
rece evidente que la influencia de la R-I en estos ámbitos es bastante limitada y en
todo caso inferior a la DIC.
VL GARANTÍAS CIENTÍFICAS DE LAS PRUEBAS DE EVALUACIÓN DE LOS ESTILOS

COGNITIVOS
El paso de la definición a la operativización de cualquier estilo cognitivo siempre ha

sido complicado, ya sea porque las pruebas de evaluación se solapan con otros cons-
tructos (normalmente el CI), porque se definen como estrategias y luego se evalúan a
través de tareas de rendimiento o simplemente porque se utilizan pruebas sin dispo-
ner de índices de fiabilidad y validez. De todos modos, como ya se ha comentado, las
pruebas de evaluación de la DIC y la R-I, aun sin estar totalmente libres de estos pro-
blemas, ofrecen muchas más garantías que las pruebas de los restantes estilos cogni-
tivos, cuya evaluación para fines que no sean exclusivamente científicos (decisiones
educativas, clínicas, etc.) debe realizarse con mucha precaución.
vi1. Garantías científicas en la evaluación de la DIC

Las pruebas de evaluación de la DIC desde el principio presentaron buenos índi-
ces psicométricos, tanto en fiabilidad como en validez, si bien en el caso de la va-
lidez de constructo, como se indicará más adelante, la cuestión es bastante más
complicada. Las pruebas de percepción de la verticalidad (BA47, RFT yRRT) han
presentado unos aceptables índices de fiabilidad tanto por el método test-retest
como por el de la división por las dos mitades, oscilando entre 0,69 y el 0,91
(Tyler, 1978). Por otra parte, estas pruebas han mantenido correlaciones entre sí
y entre otras similares que fluctúan entre 0,50 y 0,70, con excepción del RRT que
presenta índices más bajos. Sin duda, el uso de estos procedimientos ofrece bas-
tantes garantías, s1 bien la complejidad de los artilugios y su coste ha hecho pro-
blemática su difusión.
699
La aparición del Test de figuras enmascaradas (EFT) supuso una solución al pro-
blema en principio sin tener que renunciar a las garantías en la evaluación de la DIC,
ya que se observó que mantenía elevadas correlaciones con las pruebas de percep-
ción de la verticalidad en unos valores por encima de 0,65, aunque algo inferiores en
el caso de las mujeres (Tyler, 1978). Como ya se ha comentado anteriormente, TEA
(1981) ha traducido el manual del EFT que incluye este test, el CEFT y el GEFT. Los
índices de fiabilidad de estas pruebas, así como del PEFT de Coates (1972), acostum-
bran a ser superiores a 0,80 y van acompañados de una contrastada validez de criterio
y de contenido. Los resultados con muestras españolas universitarias de Fernández-
Ballesteros y Maciá (1981) y Amador y cols. (1988) y con alumnos de 7 de EGB de
Roda (1982) también avalan los buenos índices psicométricos del GEFT.
Por otra parte, el tema de la validez de constructo de la DIC siempre ha sido muy
controvertido, si bien en un principio se pensó que la DIC era un constructo unitario,
los trabajos de Linn y Kyllonen (1981) y de García Ramos (1989) aportan datos para
pensar lo contrario. Según García Ramos (1989), hay una serie de hechos que justifi-
ca que la DIC es una dimensión inespecífica compuesta por al menos dos subcons-
tructos: “percepción de la verticalidad” y “reestructuración cognitiva”. Entre estos
hechos destaca, en primer lugar, la constatación de que la capacidad de reestructura-
ción cognitiva no es independiente del contenido de las tareas; mientras el GEFT (de
contenido geométrico) es capaz de distinguir a sujetos IC y DC, otras pruebas de en-
mascaramiento de contenido verbal no detectan diferencias entre los mismos suje-
tos. En segundo lugar, a pesar de que las pruebas de verticalidad y el test EFT evalúan
dimensiones relacionadas, difícilmente pueden considerarse como equivalentes ya
que, como indica García Ramos (1989), sólo comparten en el mejor de los casos un
35% de la variancia. Por último, los estudios factoriales también han contribuido al
reconocimiento de los dos subconstructos dentro de la DIC.
En definitiva, el psicólogo interesado en evaluar la DIC para fines aplicados, ya
sea en el área educativa, clínica o laboral, debe saber que dispone de unos excelentes
instrumentos de evaluación de este estilo cognitivo. Tal vez la única recomendación
que se puede hacer es que, al aplicar a adultos el GEF7, es posible reducir a cuatro mi-
nutos el tiempo asignado a las dos series para lograr un aumento en la capacidad de
discriminación del test. Por otra parte, el psicólogo que trabaje en el campo de la in-
vestigación debe tener muy presente las cuestiones esbozadas respecto a la posibili-
dad de distinguir diferentes subconstructos en las pruebas de evaluación de la DIC.
v12. Garantías científicas en la evaluación de la R-I

En el caso de la R-I, las garantías de sus pruebas o, mejor dicho, de su prueba de eva-
luación, el MFF-20, son bastante menos consistentes. En primer lugar, debemos acla-
rar que, a pesar de que aún hoy en día el uso del MFF sigue siendo muy frecuente, lo
recomendable es la utilización del MFF-20 de Cairns y Cammock (1978), entre otras
razones porque, como ya se ha señalado anteriormente, sus índices de fiabilidad son
bastante más elevados. Por otra parte, si alguien desea trabajar con el MFF e interpre-
tar los resultados en función del intento de baremación efectuado por Salkind (1978)
utilizando 2 800 niños estadounidenses entre los 5 y los 12 años debe hacerlo con
700 Mateu Servera
precaución, ya que, por ejemplo, Ancillotti (1982), con una muestra de niños france-
ses, encontró bastante similitud en la puntuación de latencias pero diferencias signi-
ficativas en casi todos los niveles de edad en la puntuación de errores. En la revisión
de Messer (1976) ya se pudo constatar el gran margen de variabilidad que presentan
muestras de edades similares sin una causa evidente, aunque probablemente el ori-
gen de los sujetos (clase alta-baja, medio urbano-rural, etc.) es una variable a tener en
cuenta.
El test MEF-20 no dispone, al menos que conozcamos, de ninguna baremación
definitiva aunque en el trabajo de Cairns y Cammock (1978) aparecen datos de
muestras de 7, 9 y 11 años y en la revisión de Palacios (1982) se cita un trabajo no pu-
blicado de los mismos autores con una muestra de 600 niños norirlandeses. En Es-
paña, se pueden consultar datos de muestras entre 6 y 14 años en los trabajos de Na-
varro (1987), Quiroga y Forteza (1988) y Servera (1992). En general, se puede
afirmar que con niños entre 7 y 12 años los índices de fiabilidad de las latencias y los
errores son aceptables, en el primer caso están por encima de 0,90 y en el segundo
por encima de 0,70.
Otro problema más complejo es el del sistema de clasificación que se debe utili-
zar. De nuevo debemos decir que, aunque el sistema de cuadrantes ha sido el más
utilizado, en los últimos años parece que las ventajas que supone el sistema de Sal-
kind y Wright (1977) van a conseguir que se imponga definitivamente. Con este sis-
tema se superan gran parte de los problemas de arbitrariedad que existían y además
ofrece la posibilidad de trabajar con técnicas de análisis de regresión ya que se obtie-
ne una puntuación continua en impulsividad. Sin embargo, todavía quedan bastan-
tes dudas respecto a la validez de este sistema debido al papel distinto que se atribuye
a la PI y a la PE; en diversos estudios se ha podido comprobar que, contrariamente a
lo que en principio sería de esperar, la PI muestra correlaciones más elevadas con
pruebas de rendimiento y con tests de inteligencia que la PE, que, en teoría, es la pun-
tuación de capacidad (Miyakawa, 1981; Servera, 1992).
A estas cuestiones hay que añadir los problemas de validez de constructo de la
R-I. Milich y Kramer (1984) y Oas (1985) realizaron dos amplias revisiones de las
cuales se puede concluir que, por una parte, la evaluación de la R-I requiere necesa-
riamente el perfeccionamiento de los tests derivados del MFF y, por otra parte, hay
bastantes indicios de que la impulsividad cognitiva o R-I sea un constructo diferente
a lo que se conoce como impulsividad motora.
Desde un punto de vista correlacional, las medidas de impulsividad motora o so-
cial (registros de observación, cuestionarios de personalidad, cuestionarios para pa-
dres y maestros...) guardan relaciones muy bajas con las versiones del MEF. Por otra
parte, los estudios de carácter más experimental han podido constatar que mientras
cabe esperar que un niño hiperactivo también se muestre impulsivo sobre el MFF, la
probabilidad de que se dé el caso contrario es mucho más baja. Por lo tanto, hay que
tener muy presente que con la evaluación de la R-I lo que se pretende evaluar son es-
trategias de actuación ante tareas de solución de problemas o, si se prefiere, lo que se
pretende es detectar déficit en los procesos de solución de problemas, pero en caso
de que estemos interesados en analizar el comportamiento social del niño o en reali-
zar un diagnóstico clínico es necesario utilizar otros procedimientos complemen-
tarios.
701
En resumen, en nuestra opinión, la evaluación de la R-1 resulta de especial inte-

rés en elcampo educativo debido a las relaciones que mantiene con los trastornos de
aprendizaje y el rendimiento en general y actualmente, al menos con niños en edad
escolar, se puede efectuar con un mínimo de garantías científicas, si bien es recomen-
dable ejercer cierto control sobre el CI. Por otra parte, evaluar la R-L en preescolar o
en sujetos adultos tal vez supone asumir riesgos demasiado elevados, aunque dado el
interés que sigue manteniendo esta dimensión nada impide pensar que en un futuro
próximo no aparezcan pruebas mejoradas y sistemas de clasificación más fiables.
Amador, J., Forns, M. y Kirchner, T. (1988). Perfil del GEFT en la población universitaria ca-
talana. Evaluación Psicológica/Psychological Assessment, 4, 89-110.
Ancilloti, J. P. (1982). Dimension réflexive-1mpulsive de la personnalité et processes cognitifs
chez Penfant. Cahiers de Psychologie Cognitive, 2, 71-90.
Ancilloti, J. P. (1985). Dimension réflexive-impulsive de la personnalité et fonctionnement
cognitif. Cahiers de Psychologie Cognitive, 5, 667-686.
Ault, R. L. (1973). Problem-solving strategies of reflexive, impulsive, fast-accurate, and slow-
inaccurate children. Child Development, 44, 259-266.
Ault, R. L., Mitchell, C. y Hartman, D. (1976). Some methodological problem in reflection-
impulsivity research. Child Development, 47, 227-231.
Beltrán, J. (1985). Estilos cognitivos. En Psicología Educacional (vol. 1) (3* ed.). Madrid.
UNED.
Berry, J. W. (1976). Human ecology and cognitive style. Nueva York. Wiley.
Block,
J.,Block, J. H. y Harrington, D. M. (1974). Some Misgivings about the Matching Fa-
miliar Figures Test as a Measure of Reflection-Impulsivity. Developmental Psychology,
10,611-632.
Bornas, X., Servera, M., Serra, F. y Escudero, J. T. (1990). El tratamiento de la impulsividad
infantil: autoinstrucciones versus solución de problemas. Estudios de Psicología, 43-44,
61-71.
Brodzinsky, D. M. (1982). Relationship between cognitive styles and cognitive development:
A 2-year longitudinal study. Developmental Psychology, 18, 617-626.
Bruner, J. S., Goodnow, J. J. y Austin, G. A. (1952). A study of thinking. Nueva York. Wiley.
Cairns, F. D. y Cammock, J. (1978). Development of a more reliable version of the Matching
Familiar Figures Test. Developmental Psychology, 5, 555-560.
Cameron, R. (1984). Problem-solving inefficiency and conceptual tempo: A task analysis of
underlying factors. Child Development, 55, 2031-2041. re,
Carretero, M. (1982). El dessarrollo del estilo cognitivo dependencia-independencia de cam-
po. InfanciayAprendizaje, 18, 65-82. da 06 SS
Carretero, M. y Palacios, J. (1982). Los estilos cognitivos: introducción al problema de las di-
ferencias cognitivas individuales. Infancia y Aprendizaje, 17, 20-28.
Coates, S. (1972). Preschool Embedded Figures Test. Palo Alto. Consulting Psychologist
Press. erratas]
psy-
Egeland, B. y Weinberg, R. A. (1976). The Matching Familiar Figures Test: A look to its
chometric credibility. Child Development, 47, 483-491.
702 Mateu Servera
Fernández-Ballesteros, R. (1980). Del estilo cognitivo dependencia-independencia de campo

a una teoría de la diferenciación. Revista de Psicología General y Aplicada, 35, 467-490.
Fernández-Ballesteros, R. y Maciá, A. (1981). Estudio diferencial con el test de figuras en-
mascaradas. Anuario de Psicología, 24, 45-56.
Fillenbaum, S. (1959). Some stylistic aspect of categorizin behavior. Journal of Personality,
27, 187-195. :
Flahaut, D. (1985). Les styles perceptivo-cognitifs en la differentiation psychologique: Un
glossaire et un cadre conceptuel. Cahiers de Psichologie Cognitive, 5, 639-666.
Gaddis, L. R. y Martin, R. P. (1989). Relationship among measures of impulsivity for pres-
choolers. Journal of Psychoeducational Assessment, 7, 284-295.
García Ramos, J. M. (1989). Los estilos cognitivos y su medida: estudios sobre la dimensión de-
pendencia-independencia de campo. Madrid. CIDE. E
Gardner, R. W., Holman, P. S., Klein, G. S., Linton, H. B. y Spence, D. P. (1959). Cognitive
control: A study of individual consistencies in cognitive behavior. Psychological Issues, 1
(monográfico).
Goldstein, K. M. y Blackman, S. (1978). Cognitve style: Five approach and relevant research.
Nueva York. Wiley.
Goodenough, D. R. (1976). The role of individual differences in field dependence as a factor
in learning and memory. Psychological Bulletin, 83, 675-694.
Huteau, M. (1985). Quelques questions a propos des styles cognitifs. Cahiers de Psychologie
Cognitive, 5, 625-638.
Kagan, J. (1965). Matching Familiar Figures Test. Cambridge. Harvard University.
Kagan, J., Lapidus, D. y Moore, M. (1978). Infant antecedents of later cognitive functioning.
Child Development, 49, 1005-1023.
Kagan,J.,Moss, H. A. y Siegel, J. E. (1963). Psychological significance of styles of conceptua-
lization. Monograpbs of the Society for Research in Child Development, 27, 73-112.
Kagan, J., Rosman, B., Day, D., Albert, J. y Phillips, W. (1964). Information processing in the
child: Significance of analytic and reflective attitudes. Psychological Monographs, 78 (mú-
mero monográfico).
Klein, G. S. y Schlesinger, H. J. (1951). Perceptual attitudes toward instability: Prediction of
apparent movement experiences from Rorschach responses. Journal of Personality, 19,
289-302.
Kogan, N. (1971). Educational implications of cognitive styles. En G. S. Lesser (dir.), Psycho-
logy and educational practice. Glenview. Scott-Foresman.
Kogan, N. (1976). Cognitive styles in infancy and early childhood. Hillsdale. LEA.
Linn, M. C. y Kyllonen, P. (1981). The field dependence-independence construct: Some, one
or none. Journal of Educational Psychology, 37, 261-273.
Meichenbaum, D. (1985). Teaching thinking: A cognitive-behavioral perspective. En
S. F. Chipman, J. W. Segal y R. Glaser (dirs.), Thinking and learning skills (vol. 2): Re-
search and open question. Hillsdale. LEA.
Messer, S. B. (1976). Reflection-Impulsivity: A Review. Psychological Bulletin, 83, 1026-1052.
Messick, S. (1970). The criterion problem in the evaluation of instruction: Assessing possible
not just intended outcomes. En M. C. Wittrock y D. Wiley (dirs.), The evaluation of ins-
truction: Issues and problems. Nueva York. Holt, Rinehart and Winston.
Milich, R. y Kramer, S. (1984). Reflection on impulsivity. An empirical investigation of im-
pulsivity as a construct. Advances in Learning and Behavioral Disabilities, 3, 57-94.
Miyakawa, J. (1981). Some comments on Salkind and Wright's model for reflection-impulsi-
vity. Perceptual and Motor Skills, 52, 947-954.
Moore, L. A. y Hughes, J. N. (1988). Impulsive and hyperactive children. En N. J. Hughes
(dir.), Cognitive behavior therapy with children in schools. Nueva York, Pergamon Press.
Navarro, M. J. (1987). El estilo cognitivo impulsividad-reflexividad y otras variables del suje-
to. Tesis doctoral inédita. Universidad Complutense de Madrid.
703
Oas, P. (1985). The psychological assessment of impulsivity. A review. Journal of Psychoedu

-
cational Assessment, 3, 141-156.
Palacios,J. (1982). Reflexividad-impulsividad. Infancia y Aprendizaje, 17, 29-69.
Palacios, J. y Carretero, M. (1982). Implicaciones educativas de los estilos cognitivos. Infan-
cia y Aprendizaje, 18, 83-106.
Pascual-Leone (1974). A neo-piagetian process-structural model of Witkin's psychological
differentiation. En H. A. Witkin (dir.), Directions in research on field-dependence-inde-
pendence. Kingston, Ontario. International Association for Cross-Cultural Psychology.
ed E Ep y o theory: Applications in education and epistemology. Amster-
Pettigrew, T. E. (1958). The measurement and correlation of category width as a cognitive va-
riable. Journal of Personality, 26, 532-544.
Quay, L. y Weld, G. L. (1980). Visual and auditory selective attention and reflection-impul-
sivity in normal learning-disabled boys at two age levels. Journal of Abnormal Child Psy-
chology, 8, 117-125.
Quiroga, M. A. (1988). El estilo cognitivo dependencia-independencia de campo: un estudio
diferencial a través de los perfiles del Rorschach. Tesis doctoral inédita. Universidad Com-
plutense de Madrid.
Quiroga, M. A. y Forteza, J. A. (1988). La reflexividad-impulsividad. Estado de la cuestión y
análisis de las características psicométricas del test MFF-20. Investigaciones Psicológicas, 5,
97-125.
Quiroga, M. A. y Sánchez, M. P. (1987). Lecturas para las prácticas de psicología diferencial.
Madrid. Universidad Complutense de Madrid.
Roda, F. (1982). La dependencia-independencia de campo como variable diferencial en los
procesos de enseñanza. Studia Pedagogica (Salamanca), 10 (número monográfico).
Ruble, D. N. y Nakamura, C. Y. (1972). Task orientation vs. social orientation youngs chil-
dren and their attention to relevant social cues. Child Development, 43, 471-480.
Salkind, N. J. (1978). Development of norms the Matching Familiar Figures Test. JSAS Cata-
log of Selected Documents in Psychology, 8, 61.
Salkind, N. J. y Schlecter, T. (1982). Comparability of the Kansas reflection impulsivity scale
for preschoolers and the Matching Familiar Figures Test in kindergarten children. Child
Study Journal, 12, 1-5.
Salkind, N. J. yWright, J. C. (1977). The Development of Reflection-Impulsivity and Cogni-
tive Efficiency. (An Integrat ed. Model). Human Development, 20, 377-387.
Santostefano, S. G. (1964). A developmental study of the cognitive control “leveling-sharpe-
ning”. Merrill-Palmer Quarterly, 10, 343-360. A
Santostefano, S. G. y Paley, E. (1964). Development of cognitive controls in children. Child
Development, 68, 36-42. :
Satterly, D. J. (1976). Cognitive styles, spatial ability and school achievement. Journal of
Educational Psychology, 68, 36-42. Po al
Satterly, D. J. (1979). Covariation of cognitive styles, intelligence and achievement. British
Journal Educational Psychology, 49, 179-181. la meo y
Servera, M. (1992). La modificación de la reflexividad-impulsividad y el rendimiento acadé-
mico en la escuela a través de la instrucción en estrategias cognitivas. Tesis doctoral inédita.
Universidad de las Islas Baleares.
Shade, B. J. (1983). Cognitive strategies as determinants of school achievement. Psychology in
the Schools, 20, 488-493. 7 :
Siegel, A. W., Kirasic, K. C. y Kilburg, R. R. (1973). Recognition memory in reflective and
impulsive preschool children. Child Development, 44, 651-656. e
Smith, J. D. y Kemler-Nelson, D. G. (1988). Is the more impulsive children a more holistic
processor? A reconsideration. Child Development, 59, 719-727.
TEA (1981). Test de Figuras Enmascaradas: EFI, GEFTyCEFT. Madrid. TEA.
704 Maten Servera
Tyler, L. (1978). Psicología de las diferencias humanas (3? ed.). Madrid. Marova.
Vernon, P. E. (1972). The distinctiveness of field independence. Journal of Personality, 40,
366-391.
Wallach, A. y Caron, A. J. (1959). Attribute criteriality and sex-linked conservatism as deter-
mints of psychological similarity. Journal of Abnormal and Social Psychology, 59, 43-50.
Witkin, H. A. (1954). Personality through perception. Nueva York. Harper and Brothers.
Witkin, H. A. (1962). The problem of individuality in development. En S.Wapner y B. Ka-
plan (dirs.), Perspectives in psychological theory. Nueva York. International Universities
Press.
Witkin, H. A. (1969). Social influences in the development of cognitive style. En D. A. Gos-
lin (dir.), Handbook of socialization theory and research. Chicago. Rand McNally.
Witkin, H. A. (1976). Cognitive style in academic performance and in teacher-student rela-
tions. En S. Messick (dir.), Individualtiy in learning: Implications of cognitive styles and
creativity. San Francisco. Jossey-Bass.
Witkin, H. A., Dyk, R. B., Faterson, H. F., Goodenough, D. R. y Karp, S. A. (1962). Psycho-
logical differentiation. Nueva York. Wiley. '
Witkin, H. A. y Goodenough, D. R. (1977). Field dependence and interpersonal behavior.
Psychological Bulletin, 4, 661-689.
Witkin, H. A. y Goodenough, D. R. (1985). Los estilos cognitivos: naturaleza y orígenes. Ma-
drid. Pirámide.
Witkin, H. A., Goodenough, D. R. y Oltman, P. K. (1979). Psychology differentiation: Cu-
rrent status. Journal of Personality and Social Psychology, 37, 1127-1145.
Witkin, H. A., Moore, C. A., Goodenough, D. R. y Cox, P. W. (1977). Field-dependent and
field-independent cognitive styles and their educational implications. Review of Educa-
tional Psychology, 47, 1-64.
Wright, J. C. (1971). The Kansas Reflection-Impulsivity Scale for Preschoolers (KRISP). St.
Louis. CHMREL. Inc.
Wright, J. C. (1978). The KRISP: A normative evaluation. Lawrence. Center for Research in
Early Childhood Education (University of Kansas).
Yando, R. M. y Kagan, J. (1968). The effect of teacher tempo on the child. Child Develop-
ment, 39, 27-34.
Zelniker, T. y Jeffrey, W. E. (1979). Attention and cognitive styles in child. En G. A. Hale y
M. Lewis (dirs.), Attention and cognitive development. Nueva York. Plenum Press.
García Ramos, J. M. (1989). Los estilos cognitivos y su medida: estudios sobre la dimensión de-
pendencia-independencia de campo. Madrid. CIDE.
Kirchner, T. (1988). Lectura: estilos y estrategias. Barcelona. PPU.
Kogan, N. y Saarni, C. (1989). Cognitive styles in children: Some evolving trends. Early
Child Development and Care, 43, 101-128.
Miller, A. (1987). Cognitive style: An integrated model. Educational Psychology, 7, 251-268.
Quiroga, M. A. (1988). Los estilos cognitivos y los controles cognitivos: panorama actual. ln-
vestigaciones Psicológicas, 5 (número monográfico).
Shipman, S. y Shipman, V. (1985). Cognitives styles: Some conceptual methodological and
applied issues. Review of Research in Education, 12, 229-291.
Witkin, H. A. y Goodenough, D. R. (1985). Los estilos cognitivos: naturaleza y orígenes. Ma-
drid. Pirámide.
29. EVALUACIÓN DE LAS HABILIDADES DE AUTORREGULAC
IÓN
XAVIER BORNAS
I. INTRODUCCIÓN
A pesar de los intentos innovadores, de las propuestas teóricas y de los proyectos de

reforma, el sistema educativo actualmente se ocupa más de transmitir conocimientos
que de desarrollar la capacidad autorreguladora de quienes pasan por él. Éste es, en
opinión de Corno y Rohrkemper (1985), uno de los mayores fallos de dicho sistema.
Cierto es que el desarrollo de la autorregulación (o de algo en principio similar,
como la autonomía personal) forma parte de los objetivos de la inmensa mayoría de
las instituciones educativas, pero dichos objetivos, en muchos casos, no pasan del
plano de las intenciones. Están escritos en más o menos extensos documentos, pro-
yectos educativos, curriculares, etc. y su redacción ha dado muchos quebraderos de
cabeza, pero una vez han sido plasmados, los profesores vuelven a la realidad de cada
día e imparten sus asignaturas prescindiendo de ellos. Existe, por así decirlo, la con-
ciencia generalizada de que la autorregulación (AR) es importante, entre otras cosas
porque “suena” a autonomía personal, a autoaprendizaje y a otros conceptos actual-
mente en alza. Pero no existen, salvo excepciones, metodologías sistemáticas y es-
tructuradas para la promoción de su desarrollo. Una de estas excepciones lo consti-
tuye el proyecto del Instituto de la Unesco para la Educación recogido en la obra de
Skager (1984) sobre la organización de las escuelas con vistas a la promoción de la
autodirección en el aprendizaje. Pero, por lo general, las escuelas que más impor-
tancia conceden a aquellos conceptos suelen emplear las metodologías menos siste-
matizadas, a veces por la creencia (de larga tradición) de que la autorregulación, la
autonomía personal o la capacidad de aprender por uno mismo son fenómenos na-
turales, que están en el alumno y que lo único que hay que hacer con ellos es ver
cómo florecen. Con muy buena voluntad, y gracias a la intuición y la experiencia, al-
gunos profesores consiguen de este modo resultados encomiables; sin embargo, re-
sultan excepcionales en sentido literal: no son sino excepciones a la norma, esto es,
excepciones frente a la inmensa mayoría de los alumnos incapaces de aprender por sí
mismos, de programar sus actividades y, en general, de autorregular su comporta-
miento; alumnos que, a falta de control externo, son incapaces no ya de ponerse a
trabajar sino incluso de encontrar algo en que divertirse.
Lo que falla en la creencia mencionada y el primer problema con que nos encon-
tramos es la indefinición/confusión que ha rodeado y sigue rodeando al concepto
clave de autorregulación. Brevemente, podríamos suponer que s1 no está claro lo que
significa “autorregulación” difícilmente podrán idearse estrategias de evaluación y
educativas para conseguir el desarrollo de la misma. La idea intuitiva que de él se

706 Xavier Bornas
pueda tener y la importancia, también intuitiva, que se le pueda conceder, no son su-
ficientes para diseñar y poner en práctica procedimientos educativos concretos que
favorezcan la formación de alumnos capaces de aprender autónomamente, de resol-
ver problemas sociales por sí mismos, etcétera. pu d y e
Por tanto, en el siguiente apartado se ofrecerá un significado y dotará de conteni-
do al concepto clave de autorregulación para salir de la nebulosa en que parece mo-
verse el concepto y encontrar aspectos concretos y evaluables en la práctica educati-
va. Este significado lo extraeremos del ámbito de la psicología conductual que, a
_ nuestro modo de entender, es el que puede aportar un contenido más concreto y útil
para la práctica educativa. Una vez tengamos definido el concepto de AR, en eltercer
apartado se examinará el significado y la importancia que se da en la investigación
educativa a conceptos y términos similares, reseñando los aspectos comunes y tam-
bién las diferencias que hay entre éstos y el de autorregulación tal como aquí la en-
tendemos. Con todo esto podremos entrar ya en el tema de la evaluación de las habi-
lidades de autorregulación con algunas garantías de que no nos perderemos durante
el trayecto.
Il. CONCEPTO DE AUTORREGULACIÓN (AR)
En el ámbito de la psicología conductual, el interés por la autorregulación, aunque

no antiguo, sí es cada día mayor. El término en sí, en dicho ámbito, aparece inevita-
blemente ligado al de autocontrol, que pasó a primer plano gracias a los trabajos de
Kanfer en la segunda mitad de los años sesenta y a lo largo de los setenta (Kanfer,
1966, 1970, 1975a, 1975b, 1979). El modelo propuesto por dicho autor, compuesto
por la autoobservación, la autoevaluación y el autorreforzamiento, se ha mantenido
casi invariable hasta la actualidad (por ejemplo, algunas variaciones se refieren a la
inclusión de otros elementos, como los procesos de atribución causal en el modelo
para la depresión de Rehm, 1977, 1983, 1991). La importancia que el estudio del auto-
control ha tenido en la evolución de la psicología conductual y del conductismo la
pone de manifiesto el que sea visto como una de las grandes influencias en el trayecto
desde la modificación de conducta hasta la modificación de conducta cognitiva (Me-
yers y Craighead, 1984; Meyers, Cohen y Schleser, 1989) o desde el conductismo
hasta el conductismo cognitivo del que hablan Hall y Hughes (1989) y una de cuyas
premisas conceptuales afirma que los individuos son participantes activos en su pro-
pio aprendizaje.
El desarrollo de la investigación sobre autocontrol durante veinte años nos ha
permitido contar con un numeroso grupo de técnicas (para una excelente revisión,
véase Avia, 1984) eficaces para el tratamiento de diversos problemas clínicos (hábitos
nerviosos, problemas de sueño, obesidad, depresión...). No obstante, este desarrollo,
sin duda provechoso para la práctica de la terapia de conducta, ha tenido una contra-
partida negativa: de forma generalmente implícita se ha visto el autocontrol como
algo con funciones exclusivamente terapéuticas. Las técnicas, por un lado, se han
empleado principalmente para resolver problemas y sólo de forma minoritaria para
prevenirlos. Por otro lado, se ha supuesto que los procesos de autocontrol (por
Evaluación de las habilidades de autorregulación
707
ejemplo, la autoevaluación) se activan y se deben activar en situaciones de “anorma

-
lidad” (por ejemplo, como la que representa la pérdida de un reforzador importan-
te). El estudio de tales procesos en condiciones de “normalidad” ha recibido poca
atención, y lo mismo ha ocurrido con lo que podríamos considerar posibilidades
preventivas y educativas de los conocimientos sobre autocontrol (una excepción im-
portante aquí lo constituye el trabajo de Comas, 1982).
Sin embargo, estas posibilidades existen y, en nuestra opinión, merecen ser ex-
plotadas al máximo. Un punto de referencia inevitable para ello se encuentra en la
teoría cognitivo-social de Bandura (1977, 1986). En esta última y voluminosa obra,
este autor dedica todo un capítulo, que no dudamos en recomendar al lector, a los
mecanismos de autorregulación. Supera de este modo, por la vía de la teorización, la
perspectiva excesivamente terapéutica seguida en el campo del autocontrol. Esto no
excluye que en cierta medida comparta tanto la terminología como la conceptualiza-
ción de dicha perspectiva; a modo de ejemplo, el término autoobservación designa
prácticamente lo mismo en su teoría que en cualquier modelo de autocontrol. Pero
al mismo tiempo, Bandura se aparta de estos modelos en algo fundamental: lo que él
denomina “aspectos fenomenológicos”. De hecho, bien podría considerarse que su
teoría es en buena medida fenomenológica (además de cognitiva, como él mismo
quiere que se califique) y es este cariz fenomenológico lo que diferencia sustancial-
mente su visión de la autorregulación de la que se puede encontrar en modelos más
conductuales e incluso más cognitivos (en la acepción de la teoría del procesamiento
de la información).
Ahora bien, al margen de tales diferencias, en la discusión de las cuales no pode-
mos extendernos ahora, lo que aquí interesa destacar es que Bandura, como decía-
mos, considera la autorregulación como algo normal y no como algo que se pone en
marcha en situaciones extraordinarias (en cualquier sentido de la palabra). En efecto,
la autorregulación es una forma de ejercer control sobre la propia conducta, que es
controlada además por los resultados externos (regulación externa). Bajo este punto
de vista, la autorregulación no sólo es necesaria para dejar de hacer algo (dejar de fu-
mar, de beber, de morderse las uñas...) —tal como se la ve en la mayoría de los pro-
gramas de autocontrol— sino también para hacerlo (para escribir este capítulo, para
elegir una camisa, para encontrar trabajo...). La diferencia puede parecer trivial pero
es este carácter “normal” de la autorregulación lo que abre las puertas de su explota-
ción con fines preventivos y educativos.
Con todo esto se ha hecho una aproximación al concepto de autorregulación tal
como se suele entender en la psicología conductual (o cognitivo-conductual). Pode-
mos tratar de dar ahora una definición de dicho concepto. Desde nuestro punto de
vista, la autorregulación es un sistema cuyos elementos son habilidades y cuya finali-
dad es optimizar el proceso que conduce a la satisfacción de las demandas tanto in-
ternas como externas que nos llegan. Es ésta una definición muy general y desde lue-
go deberemos precisarla más. Pero creemos que sirve como punto de partida.
Hablar de sistema de autorregulación no es algo fortuito. El término sistema se
emplea aquí en un sentido literal, es decir, acorde con la teoría de sistemas de Berta-
lanffy y la filosofía de sistemas (Laszlo, 1972). Tal como expone Colom (1982) en su
revisión del concepto de sistema, la interrelación y la función teleológica son dos de
las características que la mayoría de los autores considera esenciales para que algo
708 Xavier Bornas
pueda ser visto como un sistema. En la definición anterior se recogen ambas caracte-
rísticas; por una parte, hablamos de las habilidades como elementos que conforman
el sistema y de cuya interacción depende, y, por otra parte, que la función teleológica
enunciada (la optimización) se cumpla. Referirnos a la autorregulación como siste-
ma y no como capacidad obedece a la connotación dinámica del primer término, que
contrasta con la más estática del segundo. Un sistema (abierto en este caso) se entien-
de más fácilmente como algo modificable de una capacidad y esto es importante en
el marco de la intervención conductual, sea preventiva o terapéutica. Pero, además
de este aspecto de significado, hablar del sistema de autorregulación permite, como
veremos más tarde con detenimiento, identificar y definir las características que la
evaluación de la AR debe tener. Por así decirlo, la conceptualización que hacemos de
la AR conduce directamente a las pautas generales de evaluación de la misma.
En cuanto a la función del sistema debemos hacer también algunos comentarios.
Si nos centramos en los contextos educativos, una demanda típica de tales contextos
puede ser que el alumno aprenda a leer. Satisfacer esta demanda puede lograrse de
muchas maneras, algunas muy lentas, costosas y poco eficaces, y otras más rápidas,
económicas y eficaces. Pues bien, el sistema de autorregulación funciona para en-
contrar éstas y evitar las primeras, optimizando el proceso (en sentido general) que
conduce a —en este ejemplo— aprender a leer (o a leer, en definitiva). Sin embargo,
por otra parte el sistema de autorregulación no debería entenderse únicamente como
un mecanismo que permite reaccionar de forma más eficaz a las demandas externas.
Del buen funcionamiento del sistema de AR depende también el grado de autonomía
personal del sujeto en cuanto a las demandas internas, es decir, de las que él mismo se
plantea (por ejemplo, ser menos tímido, aprender a cocinar, practicar un deporte...;
estas demandas pueden ser a veces internas y a veces externas). En pocas palabras,
del sistema de autorregulación dependen no sólo las reacciones sino también las ac-
ciones.
A modo de conclusión, veamos cuál es la estructura del sistema de AR tal como
aquí lo entendemos. En otros trabajos hemos presentado un modelo teórico, de ca-
rácter prescriptivo más que descriptivo, de dicho sistema (Bornas, 1991; Bornas, Ser-
vera y Soler, 1992). Aunque aquí ampliaremos algo dicho modelo, de momento nos
servirá para ilustrar lo dicho hasta ahora y para que el lector se haga una idea más
precisa de las habilidades de autorregulación a que nos referimos. En el cuadro 29.1
se puede ver dicho modelo.
El sistema se compone básicamente de dos grandes grupos de habilidades: las
que tradicionalmente conforman lo que llamamos autocontrol y que pueden verse
en la parte izquierda (desde la autodeterminación de objetivos y criterios hasta el auto-
rreforzamiento) y las que suelen conformar los modelos de solución de problemas,
que se encuentran en la parte derecha del cuadro 29.1 (desde la generación de al-
ternativas hasta la elaboración de la solución). Las flechas indican las relaciones entre
estas habilidades, es decir, el modo en que opera el sistema. Éste es activado por una
demanda, frente a la cual lo primero que el sistema hace es identificarla, reconocerla
o definirla. A continuación establece unos objetivos y unos criterios de autoevalua-
ción y planifica el mejor modo de satisfacer la demanda (esto es, de conseguir los
objetivos propuestos) mediante un proceso de resolución de problemas. Una vez
planificada la acción, se ejecuta bajo el control permanente ejercido por los procesos
Evaluación de las habilidades de autorregulación 709
CUADRO 29.1. El sistema de antorregulación (AR)
Demanda (interna o externa)

(problema)
Identificación de la demanda/problema
Autodeterminación de objetivos
y criterios
Planificación de la acción
Puesta en práctica
Generación de alternativas
Autoobservación
Previsión de consecuencias
Elección de la mejor alternativa
(E
90) Autorregistro
(9)
5a)(09)
.
Elaboración de la solución
E
9O>)
<
Autoevaluación
Atribución
Autorreforzamiento
710 Xavier Bornas
de autoobservación y autoevaluación. Una vez satisfecha la demanda se produce el

autorreforzamiento (que puede venir simplemente de ver alcanzados los objetivos
previstos).
Se deben realizar unas matizaciones para evitar confusiones al interpretar el cua-
dro 29.1. En primer lugar, se trata de un esquema y, por tanto, de una simplificación,
con el riesgo que esto implica. Así por ejemplo, muchas relaciones entre habilidades
no están representadas mediante flechas para evitar que la ingente cantidad de éstas
dificulte la comprensión del funcionamiento del sistema, en lugar de facilitarla. Se ha
indicado la dirección general que siguen aquellas relaciones, pero es obvio que, por
ejemplo, los procesos de autoevaluación pueden conducir y activar cualquiera de los
procesos anteriores de solución de problemas si se detecta un incumplimiento de los
objetivos que se están persiguiendo. En segundo lugar, no se ha recogido la automa-
tización que afortunadamente tiene lugar en el funcionamiento del sistema cuando
las demandas que le llegan son ya conocidas o requieren soluciones de gran sencillez.
Si cada mañana para ir a trabajar tuviéramos que activar el sistema en todos sus ele-
mentos, además de llegar mucho más tarde de lo razonable, estaríamos actuando de
forma completamente desadaptativa. Por tanto, se asume que el proceso de automa-
tización ocurre dependiendo sobre todo del tipo de demandas y del entorno en que
éstas se producen. Y, en tercer lugar, conviene aclarar que la forma en que trabaja el
sistema de autorregulación, así como las posibilidades de favorecer su desarrollo
desde un punto de vista educativo, se ha explicado recientemente en un trabajo mu-
cho más extenso (Bornas, 1992). Cuanto aquí hemos dicho no es, por tanto, más que
un muy breve resumen.
Las habilidades de AR a que se refiere el presente capítulo son, en principio, las
que refleja el modelo del cuadro 29.1. Antes de pasar a analizar los aspectos relativos
a la evaluación de las mismas, examinaremos la autorregulación tal como se entiende
en la investigación educativa actual.
HI. LA AUTORREGULACIÓN EN LA INVESTIGACIÓN EDUCATIVA
En términos generales, se puede afirmar que la formación de personas capaces de

autodirigir su aprendizaje y autorregular su comportamiento es uno de los objetivos
prioritarios de cualquier sistema educativo actual. Para entender que esto sea así bas-
ta con darse cuenta de que el rápido desarrollo científico y tecnológico de la sociedad
hace materialmente imposible transmitir la ingente cantidad de conocimientos que
se van generando. Más bien se requiere que la educación garantice el mayor desarro-
llo de las capacidades que permitirán seguir asimilando conocimientos durante y
después del paso por las instituciones educativas, es decir, las capacidades de auto-
aprendizaje. Á esto se refiere Skager (1984) cuando utiliza el marco de la lifelong
education para encuadrar los objetivos educativos relacionados con la autodirec-
ción. Claro está que no es éste, de tipo pragmático, el único motivo o la única funda-
mentación para colocar dicho objetivo en lugar tan destacado. Podríamos encontrar
también fundamentos filosóficos, sociológicos y psicológicos (por ejemplo, en las
teorías humanistas) que el mismo autor repasa brevemente (Skager, 1984).
711
En la psicología cognitivo-conductual se puede observar un grado de acuerdo

cada vez mayor con aquellos objetivos educativos. Si bien es cierto que en el pasado
este enfoque se despreocupó de estas cuestiones y acusó un exceso de pragmatismo,
en los últimos diez años ha existido un notable giro en esta posición. Benson y Pres-
bury (1989, p. 53) lo señalan explícitamente al decir que «el control, bajo voluntad
propia, del repertorio de estrategias para adquirir, acceder a, y utilizar información
es el fin de la educación» y que «los enfoques cognitivo-conductuales en educación
parecen seguir este énfasis actual en el metacontrol». No es difícil ver que esta forma
de metacontrol está muy cerca de lo que hemos denominado autorregulación en el
apartado anterior y de lo que Skager (1984) denomina autodirección. El interés por
la metacognición se puede apreciar igualmente en el trabajo de Kendall y Cummings
(1988), y el hecho de plantearse cuestiones relativas a la validez social y ecológica de
las intervenciones cognitivo-conductuales en contextos educativos (Elliott, 1988;
Martens y Witt, 1988) apunta en la misma dirección y subraya que los objetivos rela-
cionados con los procesos de autoaprendizaje, autodirección y autorregulación se
tienen cada vez más en cuenta desde dicha perspectiva (Powers y Franks, 1988).
Todo esto permite, en nuestra opinión, abrigar al menos una débil esperanza de me-
Jora en las relaciones entre la psicología cognitivo-conductual y las escuelas en el fu-
turo, aunque la historia y el panorama actual de tales relaciones sea más bien negro,
tal como lo describe Baer (1988) o más recientemente Keller (1992).
Además de figurar en un lugar importante entre los objetivos de la educación, la
autorregulación ha despertado el interés de los investigadores en diversas áreas con-
cretas de interés educativo. Un repaso de la literatura actual nos lleva enseguida hacia
temas de socialización, por una parte, y de aprendizaje y rendimiento escolar, por
otra. Y en este caso, veremos una estrecha relación con la investigación y la teoría so-
bre motivación intrínseca.
m1. Autorregulación y comportamiento social
Al desarrollo social del niño se le da cada vez más importancia en las escuelas. A pe-
sar de que el uso de programas específicos para el desarrollo de lashabilidades socia-
les es escaso, la práctica educativa tiene en cuenta y procura que éste se consiga. Des-
de enfoques cognitivo-conductuales se han aportado datos sobre la necesidad de
favorecer aquel desarrollo con vistas a prevenir futuros problemas de adaptación so-
cial (Michelson y cols., 1983; Kirschenbaum y Ordman, 1984), así como programas
específicos de intervención (Shure y Spivack, 1974; Spivack y Shure, 1974; Allen y
cols., 1976; Michelson y Mannarino, 1986) e instrumentos de evaluación y modelos
teóricos sobre el tema (Gresham, 1986, 1988). Sin embargo,loque ahora nos interesa
destacar es que en todo ello ocupa un lugar más o menos privilegiado la autorregula-
E clasificación de Gresham (1988) de los problemas de habilidades sociales

distingue entre déficit de adquisición y de ejecución, por una parte,yentre od
llos en que se da una respuesta que interfiere con el comportamiento social y
aquellos en que no se da, por otra. Combinando estos elementos tenemos cuatro
posibilidades:
712 Xavier Bornas
SS Déficit de habilidades sociales (éstas no están adquiridas, en general por falta

de ocasiones para ello). de
b. Déficit de ejecución o conducta social (se tiene adquirida la habilidad pero
alguna respuesta interfiere e impide su puesta en práctica).
c. Déficit de habilidades de autocontrol (la habilidad no está adquirida por la
presencia de alguna respuesta que lo impide, por ejemplo, la falta de control
sobre la ansiedad).
d. Déficit de ejecución de autocontrol (la habilidad se tiene pero algún fallo de
autocontrol impide su puesta en práctica, como por ejemplo en la impulsi-
vidad).
Este sistema de Gresham, algo confuso, tiene fines meramente clasificatorios y

no vamos a entrar en las críticas que se le pueden hacer. Para nuestros propósitos ac-
tuales sólo queremos aclarar que dicho autor basa la diferencia entre las categorías hb
y d en que haya o no una respuesta interfiriente explícita. Así, en b menciona la falta
de motivación como aquello que impide que la habilidad social se manifieste y no
considera esta falta de motivación como respuesta interfiriente; en cambio, en d,
donde también se posee la habilidad, sí existiría una respuesta explícita que impide la
ejecución. Por tanto, se trata de una clasificación algo arbitraria; pero, en cualquier
caso, y volviendo a la autorregulación, es fácil ver que, al menos en las categorías b, c
y d de problemas sociales, éstos se deben en alguna medida a déficit del sistema de
autorregulación (que como señalamos incluye un circuito de autocontrol con unos
procesos que, si bien Gresham no los menciona explícitamente, hemos de suponer
en la base de su apelación al autocontrol). Incluso en el caso a, cabe pensar que la ad-
quisición de habilidades sociales se puede realizar mediante programas de entrena-
miento que contienen el formato tradicional de resolución de problemas (D”Zurilla
y Goldfried, 1971), además de técnicas operantes y de modelado.
Por otra parte, las estrategias y programas basados en las autoinstrucciones
(Meichenbaum y Goodman, 1971; Meichenbaum, 1981; Bornas, 1987) para la inter-
vención sobre el desarrollo social del niño han tenido también un considerable im-
pacto en contextos educativos; el caso paradigmático lo constituye el programa
Think aloud (Camp y Bash, 1981; Bash y Camp, 1985). Cabe recordar que las auto-
instrucciones se basan en la teoría de Luria acerca de la función reguladora del habla
sobre el comportamiento y que, por tanto, son técnicas de autorregulación (en el
cuadro 29.1 se habrá observado que dicha función está recogida en el circuito de eje-
cución de la acción).
uz. Autorregulación y rendimiento escolar

Para entender las relaciones entre la autorregulación y el rendimiento escolar hay
que considerar casi necesariamente el tema de la motivación (Dweck, 1989; Clinken-
beard y Murphy, 1990). Concretamente, las referencias más explícitas a la autorregu-
lación las encontramos en la literatura sobre motivación intrínseca (Ames y Ames,
1985, 1991). Sin duda, una motivación elevada correlaciona con un buen rendimien-
to académico. El problema está en la naturaleza de esta motivación. Después de mu-
713
chos trabajos realizados especialmente en los años ochenta parece existir una eviden-
cia considerable acerca de la conveniencia de que aquélla sea intrínseca en lugar de
extrínseca. De forma muy simplificada podríamos indicar que es mejor fomentar el
deseo de aprender que la necesidad de hacerlo (por miedo a una calificación o por
ganar algún premio). Este es un tema complejo y polémico tanto a nivel científico
como de política educativa y no podemos adentrarnos en él ahora. Bastará conside-
rar laexistencia de una línea importante de investigación que aboga por la motiva-
ción intrínseca y que entronca, de acuerdo con Ryan, Connell y Deci (1985), con la
tradición educativa que pone el acento en el desarrollo del niño de dentro hacia fuera
y que supone una práctica educativa basada en ayudar, orientar y guiar dicho de-
sarrollo frente a la otra gran tradición, que enfatiza el control externo, mayores san-
ciones y disciplina y, en definitiva, marcar más al alumno. Según estos autores, esta
segunda gran tradición sintonizaría con los modelos de motivación extrínseca.
Como señalan Corno y Rohrkemper (1985), la motivación no puede entenderse
prescindiendo de los procesos cognitivos y metacognitivos (en sus propias palabras,
autorreguladores) y, más concretamente, afirman que la motivación intrínseca por
aprender dependerá del desarrollo de unas habilidades cognitivas particulares. Esta-
blecen así un nexo claro y bastante concreto entre motivación, aprendizaje y auto-
rregulación. En la medida en que un alumno posea estrategias de aprendizaje ade-
cuadas es más probable que esté motivado para aprender. Claro está que el mero
hecho de disponer de estas estrategias (que podemos entender como habilidades o
conjunto de habilidades encaminados a un fin determinado) no garantiza un nivel
óptimo de motivación, y así sería peligroso cognitivizar en exceso el tema; el valor de
los reforzadores externos es un factor igualmente importante en la determinación de
la motivación y no conviene olvidarlo. Pero parece claro que la falta de aquellas es-
trategias representa una merma considerable para la motivación y el aprendizaje en
sí. Alguien que no sepa sacar el máximo provecho de lo que lee, es decir, alguien sin
estrategias de comprensión lectora y/o de memorización, es poco probable que esté
motivado por leer (que desee leer). Entonces, lo que sugieren Corno y Rohrkemper
(1985) es la posibilidad de aumentar y mantener la motivación mediante la adquis1-
ción y el desarrollo de dichas estrategias y habilidades.
Estas habilidades guardan una estrecha relación con lo que hemos denominado
sistema de autorregulación. Por supuesto, existen unas estrategias y habilidades es-
pecíficas para determinadas actividades (microestrategias, de acuerdo con Nisbett y
Shucksmith, 1986) que no quedarían representadas en dicho sistema precisamente
por ser tan específicas; es el caso de las estrategias de memorización. Pero hay otras
estrategias más generales o macroestrategias que se pueden utilizar en una amplia va-
riedad de actividades y para la realización de aprendizajes en dominios muy diversos
que sí están cerca de aquel sistema. Buscar más de una solución ante un problema
podría ser un ejemplo de tales habilidades, también denominada “pensamiento di-
vergente” o “generación de alternativas” (en los programas de entrenamiento en so-
lución de problemas ya citados) y que, como vimos, queda recogida en el sistema de
AR justo al comienzo de la fase de planificación de la acción. Existen finalmente los
estilos de aprendizaje (siguiendo con la terminología de Nisbett y Shucksmith,
1986), de los que ahora nos interesa destacar uno: el autorregulado (Corno y Rohr-
kemper, 1985), que en cierta medida sería equiparable al estilo que Ryan, Connell y
714 Xavier Bornas
Deci (1985) denominan de “integración”, aunque estos autores hablan de estilos de

autorregulación más que de aprendizaje y sitúan en el nivel más alto (el estilo más
perfeccionado) la integración, precedida por la identificación, la regulación interiori-
zada y la extrínseca.
El aprendizaje autorregulado consta de cinco componentes agrupados en dos
grandes funciones: en la de adquisición están los componentes de atención y control,
mientras en la función de transformación están la selección, la conexión y la planifi-
cación (Corno y Rohrkemper, 1985). El paralelismo entre este esquema y el sistema
de autorregulación es bastante claro, incluso hay elementos comunes, aunque hay
que tener en cuenta que Corno y Rohrkemper (1985) se refieren al aprendizaje
mientras el sistema de AR es algo más amplio que suponemos en funcionamiento no
sólo en tareas de aprendizaje escolar sino también, como hemos señalado, en situa-
ciones sociales.
En definitiva, el aprendizaje autorregulado y la motivación intrínseca dependen,
en buena medida, de que se posean unas habilidades y estrategias cognitivas que for-
man parte del sistema de autorregulación (además de las microestrategias relativas a
actividades particulares). Si el rendimiento académico está en función, como parece,
de un estilo de aprendizaje autorregulado y de una elevada motivación intrínseca
por aprender, entonces resulta clara la conveniencia de investigar, conocer y fomen-
tar aquellas habilidades. Ahora bien, además de poseer las habilidades, éstas deben
ser Operativas, es decir, activarse cuando conviene. Esto, como advierten también
Corno y Rohrkemper (1985), depende de factores como el tipo de tarea académica, el
formato de instrucción (cooperativo, competitivo, tamaño del grupo...) y de los
agentes sociales (profesores y compañeros). Más adelante volveremos sobre estos as-
pectos.
Para terminar este apartado hay que indicar aún otra relación muy estrecha entre
la autorregulación y el rendimiento escolar, si bien situada en un plano distinto. En
la evaluación del rendimiento académico cada vez se tienen más en cuenta los proce-
sos cognitivos responsables del mismo. Frente a la evaluación tradicional, tanto de
aquel rendimiento como de la inteligencia del alumno, la evaluación directa (Shapi-
ro, 1989; Fuchs y Fuchs, 1990) y las teorías procesuales de la inteligencia prestan ma-
yor atención a las estrategias y estilos de aprendizaje, habilidades cognitivas y proce-
sos, en definitiva, que constituyen la inteligencia misma (Goetz, Hall y Fetsco, 1990;
Nitko y Lane, 1990). Es fácil apreciar el paralelismo que esta concepción de la eva-
luación en el ámbito del rendimiento escolar guarda con la evaluación de la AR que
estamos describiendo aquí (véase, para una revisión amplia, Goetz, Hall y Fetsco,
1989; Hall, Goetz y Fetsco, 1989).
5513. Autorregulación y metacognición

La metacognición ocupa un lugar muy destacado en la investigación educativa ac-
tual. Desde la introducción del término por Flavell a principios de los años setenta
ha aparecido una ingente cantidad de trabajos sobre el tema. Sin embargo, la confu-
sión en torno al concepto mismo de metacognición no se ha reducido y quizá esté
todavía aumentando. Del propio Flavell (1977, p. 19) son las siguientes palabras: «los
715
conceptos auténticamente interesantes que hay en este mundo tienen la desagrada-

ble costumbre de escapar a nuestros más decididos intentos por concretarlos [...]».
Así empieza Flavell a introducir el concepto de “conocimiento”, pero sin duda sus
palabras son igualmente aplicables al de “metacognición”, y en ellas puede verse algo
de premonitorio. En cuanto a sí se trata de un concepto auténticamente interesante,
a pesar de no poder afirmar con certeza que así sea, el volumen de trabajos que ha ge-
nerado y la cantidad de investigadores que ha movilizado parecen apoyar la hipóte-
sis de que, en efecto, lo es (al menos en el momento actual).
La confusión a que hemos aludido se deriva, en parte, de la falta de una defini-
ción inicial clara del concepto, que ha llevado al extremo de creer que «cualquier
cognición que uno pueda considerar relevante para el conocimiento o el pensamien-
to puede ser clasificada como metacognición» (Paris y Winograd, 1990, p. 19), pero
existen también problemas metodológicos y de evaluación importantes (Cavanaugh
y Borkowsk:1, 1980). Ahora bien, a pesar de no tener una definición adecuada, sí pue-
de verse con facilidad que la metacognición abarca dos aspectos bien diferenciados.
Brown (1978) define la metacognición como la conciencia de los alumnos de su pro-
pia actividad cognitiva y de los métodos que emplean para regular sus propios pro-
cesos cognitivos. Reeve y Brown (1985) señalan que el término metacognición suele
usarse para referirse a la capacidad de los individuos de comprender y manipular sus
propios procesos cognitivos. En ambos casos, podemos apreciar que se está aludien-
do, por una parte, a conocimiento (metaconocimiento, si se quiere), que es algo está-
tico, y por otra a “regulación”, “manipulación” (o control, en definitiva), que es algo
de tipo dinámico. Más en concreto, la metacognición en cuanto conocimiento se re-
fiere al que los individuos poseen en cuanto a sí mismos (personalidad), a las tareas y
a las estrategias y a las influencias recíprocas entre estos tres grupos de variables
(Short y Weissberg-Benchell, 1989).
Las referencias a la autorregulación en la literatura metacognitiva son abundan-
tes, y en cierto modo los procesos metacognitivos son considerados esencialmente
autorreguladores (por tanto, estamos en la segunda acepción, dinámica o procesual,
de la metacognición). El problema está en saber qué es lo que regulan. Si atendemos
a las declaraciones teóricas, como las citadas anteriormente, resulta aparentemente
claro que los procesos metacognitivos regulan los cognitivos. Pero si nos fijamos en
las actividades concretas a que se alude con la calificación de “metacognitivas” pare-
ce que, en realidad, lo que regulan es el comportamiento o la ejecución. Así por
ejemplo, entre dichas actividades suelen considerarse esenciales planificar, monitori-
zar, examinar, revisar, controlar o evaluar actividades o procesos que podrían ser
considerados cognitivos y reguladores (y, en cierto modo, optimizadores) del com-
portamiento. En nuestra opinión, que sean considerados metacognitivos no aclara
nada; más bien contribuye a crear confusión en un campo donde ésta ya sobra. Algo
parecido ocurre cuando se considera el entrenamiento en solución de problemas
como entrenamiento metacognitivo; «el entrenamiento metacognitivo, en la forma
de enseñar principios generales de solución de problemas, ha sido particularmente
exitoso en la facilitación de la ejecución intelectual de niños con problemas de apren-
son,
dizaje» (Reeve y Brown, 1985, p. 343). Los principios de solución de problemas
de hecho ha sido así du-
por definición, generales y su enseñanza puede ser vista, y
rante años, como una forma de entrenamiento cognitivo O cognitivo-conductual.
716 Xavier Bornas
No vemos la necesidad, el interés o la utilidad que pueda tener considerarlo ahora

metacognitivo. Pero la confusión puede aumentar todavía más. Por seguir con los
mismos autores, unas líneas antes afirman que «la incapacidad para controlar o ma-
nipular los propios procesos metacognitivos se cree que es responsable, en parte, de
la pobre ejecución en tareas académicas de solución de problemas». Si la incapacidad
para manipular y controlar los procesos metacognitivos es responsable de algunos
problemas académicos, cabe suponer que la capacidad para hacerlo los podría resol-
ver o al menos paliar; pero entonces, ya que se trata de procesos metacognitivos, de-
beríamos entrenar unos procesos superiores que los puedan controlar y manipular,
es decir, procesos meta-metacognitivos, que, a su vez, podrían ser regulados por
Otros procesos superiores.
¿Quiere todo esto decir que no tiene sentido hablar de procesos metacognitivos?
No nos atreveríamos a afirmarlo taxativamente, pero hemos creído importante ad-
vertir al lector de los riesgos que implica hacerlo. Por otra parte, quizá todo se re-
duzca, a la larga, a un problema terminológico o de preferencias léxicas; por ejemplo,
estrategias metacognitivas, macroestrategias y estrategias de solución de problemas
son expresiones utilizadas a menudo de forma intercambiable bajo la creencia o la
sospecha de que denotan lo mismo. Por tanto, los procesos que suelen denominarse
metacognitivos podemos considerarlos cognitivos o incluso cognitivo-conductuales
(basta pensar en la autoevaluación tal como se entiende en los modelos de autocon-
trol) y quedan integrados en el sistema de autorregulación que, como se recordará,
abarca tanto la heurística general de solución de problemas como los procesos de
control permanente de la acción.
Todo esto no debería entenderse como una crítica al concepto mismo de meta-
cognición. En primer lugar, nos estamos refiriendo exclusivamente a la acepción di-
námica o procesual de dicho término. En segundo lugar, sólo queremos subrayar
que denominar metacognitivos unos procesos que han sido investigados durante
mucho tiempo desde perspectivas conductuales y cognitivo-conductuales entraña
más inconvenientes que ventajas. En tercer lugar, reconocemos que la investigación
de la metacognición está en una fase inicial y que probablemente en el futuro vaya
aclarando muchos de los aspectos actualmente oscuros o ambiguos que incluye. En
cuarto lugar, en el ámbito estricto del aprendizaje académico —que es donde la in-
vestigación metacognitiva se está desarrollando más— la metacognición adopta
unos significados bastante precisos y se relaciona con las técnicas de estudio, el po-
tencial de aprendizaje y el rendimiento académico; en este ámbito restringido, los
comentarios hechos anteriormente deberían ser sustancialmente revisados ya que
existen instrumentos específicos de evaluación (por ejemplo el Learning and study
strategies inventory de Weinstein, Zimmerman y Palmer, 1988) que aquí no hemos
considerado (en Bornas y Servera [1992] puede encontrarse una breve revisión de las
relaciones entre rendimiento y metacognición). Y, finalmente, respecto a la acepción
referida al metaconocimiento, creemos que constituye un tema del mayor interés
tanto desde el punto de vista teórico como desde una perspectiva aplicada. En el
apartado 1V.3.3. volveremos sobre estos aspectos.
717
IV. EVALUACIÓN DE LA AUTORREGULACIÓN
Saber en qué consiste la autorregulación, qué habilidades consideramos de autorre-

gulación y destacar brevemente qué interés tiene el tema desde el punto de vista edu-
cativo han sido los objetivos de los apartados anteriores. Ahora podemos entrar ya
en el tema de la evaluación, viendo tanto las características que debería tener esta
evaluación como los instrumentos de que podemos disponer para realizarla. Como
se recordará, en el segundo apartado de este capítulo se definió la autorregulación
desde una perspectiva sistémica y se habló del sistema de autorregulación. Se señaló
entonces que esta misma concepción nos llevaría a determinar las características que
la evaluación debería tener. Lo veremos ahora con algún detenimiento.
IVA. Estructura y funcionamiento del sistema de autorregulación

Entender la autorregulación como un sistema implica que sus habilidades no son
elementos aislados sino partes que interactúan con alguna finalidad. Desde el punto
de vista de la evaluación, esto significa que, si bien es posible examinar cada habili-
dad por separado y, de hecho, deberá hacerse en múltiples ocasiones, esto no nos lle-
vará necesariamente a conocer por qué el sistema funciona mal o no funciona ni a
encontrar procedimientos para mejorarlo o perfeccionarlo. Supongamos que eva-
luamos la habilidad de generar soluciones alternativas en un alumno con problemas
de impulsividad. Supongamos que es capaz de generar perfectamente un número
elevado de alternativas y, por tanto, descartamos que el problema pueda venir de un
déficit en esta habilidad. Evaluamos a continuación la habilidad de prever las conse-
cuencias de una acción y obtenemos idénticos resultados, es decir, no hay ningún dé-
ficit en dicha habilidad. Así, podríamos seguir evaluando habilidades hasta agotar
todas las posibilidades; si no encontráramos déficit en ninguna de ellas es probable
que atribuyéramos el problema del alumno a algún factor no cognitivo, bien sea or-
gánico, bien conductual. Sin negar que tales atribuciones pudieran ser correctas, es
importante destacar que habríamos pasado por alto una posibilidad más, aun en el
dominio cognitivo y de la autorregulación: la de que, estando bien los elementos/ha-
bilidades del sistema, el funcionamiento no fuese correcto. En pocas palabras, que,
por ejemplo, aquel alumno que genera muchas soluciones alternativasnoenlaza este
proceso con el siguiente, es decir, con la evaluación de las consecuencias de cada so-
lución. En otros términos, el primer proceso no activa elsegundo y el alumno, sien-
do capaz de ejecutar ambos por separado, no sabe unirlos. De nada sirve entonces
que piense diez soluciones si al final siempre escoge la primera que le vino a la cabe-
za. Por tanto, interesa conocer si el alumno posee las habilidades de autorregulación
y en qué estado se encuentran (aspectos estructurales del sistema); pero también in-
teresan, y no son menos importantes, los aspectos funcionales del sistema, es decir,
saber cuál es el nivel de interacción entre dichas habilidades.
718 Xavier Bornas
12. La autorregulación, un sistema abierto
El sistema de autorregulación es un sistema abierto que recibe información (deman-

das) del entorno educativo y envía información (conducta) a dicho entorno; por tan-
to, la evaluación debería realizarse en el contexto en que suponemos que el sistema
es o debería ser operativo y dirigirse también hacia ese contexto. a
Desde un punto de vista evolutivo, el desarrollo del sistema de autorregulación
depende en gran medida del entorno educativo. Un entorno muy regulador o con-
trolador no favorecerá aquel desarrollo y el niño educado en entornos basados en el
control o la regulación externa verá dificultado o retrasado el perfeccionamiento del
sistema de autorregulación; «cuando uno es observado desde muy cerca o es dema-
siado marcado, la autonomía se convierte en una imposibilidad psicológica» (Ryan,
Connell y Deci, 1985, p. 21). Del mismo modo, la activación del sistema en un mo-
mento dado depende también del entorno. Siendo así, haber evaluado la estructura y
función del sistema de autorregulación del alumno en condiciones de test no es sufi-
ciente. Habría que evaluar también los aspectos ambientales (desde el comporta-
miento del profesor hasta la organización del aula, pasando por aspectos físicos y so-
ciales específicos) que tienen influencia tanto en la activación del sistema de AR de
dicho alumno como en su desarrollo y optimización funcional.
La autorregulación no se produce en el vacío. En apartados anteriores se ha visto
la importancia que se le concede en diversos dominios de la investigación y la prácti-
ca educativa. Si la evaluación ha de tener una función constructiva, ésta probable-
mente será la de proporcionar información no sólo acerca de los posibles fallos o dé-
ficit del sistema de AR de tal o cual alumno sino también, y de modo muy especial,
dar información que permita elevar el nivel del entorno educativo en la dirección de
favorecer el desarrollo y el perfeccionamiento de la autorregulación en todos los
alumnos inmersos en él. Y esto no puede observarse desde una perspectiva particu-
lar o individual. En pocas palabras, la evaluación de la AR también debería buscar
respuestas a la pregunta de si el ambiente educativo favorece o no que los alumnos
adquieran, mantengan y perfeccionen estilos de autorregulación tanto de sus apren-
dizajes escolares como de sus interacciones sociales. Centrarse exclusivamente en el
sistema de autorregulación del alumno puede acarrear dificultades. Supongamos,
por ejemplo, que detectamos un serio déficit en la habilidad de autoevaluación del
alumno X. Obviamente podemos intervenir y hacer que la desarrolle. Pero, si en el
entorno educativo habitual de X la evaluación es siempre externa y esto no lo cono-
cemos (porque no lo hemos evaluado) y, por tanto, no lo alteramos, X no tendrá
ninguna necesidad de autoevaluarse y esta habilidad permanecerá en desuso y sin re-
portar a X ninguna de las ventajas que de la misma podría sacar. En condiciones de
test, quizás X se autoevalúe perfectamente, pero eso no le servirá de nada si no lo
hace en su entorno habitual. En resumen, la evaluación de la autorregulación debería
dirigirse a la interacción del alumno con su entorno y buscar información relevante
tanto en el sistema del primero como en las características del segundo.
Sin perder de vista estas características generales que la evaluación de la autorre-
gulación debería poseer, resulta necesario pormenorizar algo más y ver, tanto para la
parte del alumno y su sistema de AR, como para la del ambiente educativo, hacia
749
dónde hay que enfocar la evaluación y de qué medios concretos podemo

s disponer
para realizarla.
1v3. Evaluación de habilidades de autorregulación del alumno

Enfunción de lo expuesto en los apartados II y III y, aunque sea con la única idea de
facilitar la exposición en éste, agruparemos las habilidades de autorregulación en tres
grupos: las de autocontrol, las de resolución de problemas y las metacognitivas.
Iv3.1. Evaluación de habilidades de autocontrol
Dentro de la perspectiva educativa y preventiva que hemos adoptado aquí, el auto-

control no se refiere únicamente, ni de forma prioritaria, a la “fuerza de voluntad” o al
autodominio en el sentido de no hacer o dejar de hacer algo que se quiere hacer. Más
bien se refiere a la capacidad de autodirigir el comportamiento y el aprendizaje bajo
muy diversas circunstancias. Y esta autodirección depende de unas habilidades espe-
cíficas que están en el sistema de autorregulación: la autoobservación, el autorregis-
tro (Mace y Kratochwill, 1988), la autodeterminación de objetivos y criterios, la auto-
evaluación y el autorreforzamiento. Existen pocos instrumentos para evaluar estas
habilidades y, en cierto modo, diríamos que afortunadamente es así. Cuando se bus-
can escalas de evaluación del autocontrol suelen referirse al primero de los dos signi-
ficados apuntados en el párrafo anterior. Así, por ejemplo, la Self control rating scale
(SCRS) de Kendall y Wilcox (1979), validada por Robin, Fischel y Brown (1984) con
sujetos de entre 4 y 18 años, evalúa el grado de autocontrol versus impulsividad
(Kendall y Hays, 1988), con lo que tiene una utilidad limitada. Algo parecido ocurre
con las escalas de autocontrol para adultos, como las de Heiby o Rhem (véase Her-
sen y Bellack, 1988). Además, muchos instrumentos evalúan más la frecuencia (por
ejemplo, del autorreforzamiento) que la habilidad en sí. Pero, en cualquier caso, la
falta de instrumentos estandarizados o comercializados no constituye un auténtico
problema en el campo de la autorregulación. Al contrario, puede facilitar que se rea-
lice una evaluación directa y teniendo muy en cuenta el ambiente.
En este contexto, no estará de más recordar que la evaluación tiene por objeto
proporcionar información acerca de un sistema abierto y más concretamente res-
ponder a preguntas como las siguientes: ¿favorece el ambiente educativo la adquisi-
ción, el mantenimiento y la optimización de las habilidades de autocontrol?, ¿tienen
un significado claro cada una de estas habilidades en dicho ambiente?, ¿el uso de es-
tas habilidades es reforzado en dicho ambiente?, ¿está vinculado a algunas activida-
des escolares específicas (por ejemplo, de matemáticas)?, ¿están integradas las habili-
dades en un esquema o circuito del sistema o, por el contrario, funcionan de forma
aislada?, etc. Sin duda, la mejor forma de responder a estas preguntas es la observa-
ción directa, aunque pueden resultar de gran valor los informes verbales de quienes
forman parte de tal ambiente (profesores y alumnos) (para una revisión de esta me-
todología de evaluación, véase Witt, Heffer y Pfeiffer, 1990). No es extraño, por
ejemplo, encontrar significados ambiguos de la autoevaluación, que a menudo se
720 Xavier Bornas
confunde con el autorreforzamiento, o ver que la autoobservación es, en realidad, un

autorregistro de frecuencias de conducta. Es muy frecuente también que los objeti-
vos y criterios, para la realización de cualquier actividad escolar, sean establecidos
externamente (por los profesores) dando escaso margen para el desarollo de la habi-
lidad de autodeterminarlos (aunque, sorprendentemente, luego se exija al alumno
que sepa “programar su estudio”, por ejemplo —algo que está muy relacionado con
aquella habilidad—). Incluso, se puede constatar con cierta frecuencia que los crite-
rios externos son ambiguos (cuando no escasos o nulos), ofreciendo así un pésimo
modelo para un supuesto autoaprendizaje de la habilidad en cuestión.
En cuanto a la integración de las habilidades, el tema de la evaluación es todavía
más complejo. No basta, como se señaló anteriormente, conocer si el alumno sabe
autoobservar, autoevaluar o autorreforzar su comportamiento. Es de primordial in-
terés conocer si estas habilidades funcionan de forma integrada y realizan la función
autorreguladora global. Si, por ejemplo, la autoevaluación no se realiza conforme a
unos objetivos y criterios claros y especificados antes de realizar determinada tarea,
la habilidad de autoevaluar queda desconectada del funcionamiento conjunto del
sistema de autorregulación. Del mismo modo, la autoobservación tiene pleno senti-
do si la autoevaluación depende de ella, no si cada una funciona por separado. Algo
parecido ocurre cuando el autorreforzamiento es independiente de la autoevalua-
ción. Cualquier niño es capaz de pegar un papelito de color en una cuadrícula en la
pared cuando va a un determinado rincón; pero, esto no nos dice casi nada respecto
al funcionamiento de su sistema de autorregulación si no vemos la función que cum-
ple esta forma, por otra parte tan habitual, de autorregistro en dicho sistema (por
ejemplo, si activa o no la autoevaluación posterior o si está vinculada o no a una
autodeterminación previa de objetivos y criterios). Si, como ocurre a menudo, la
evaluación y el reforzamiento posteriores son externos, la contribución de dicho
autorregistro al desarrollo del sistema de AR puede considerarse insignificante y me-
rece ser sometida a reflexión.
1v3.2. Evaluación de habilidades de solución de problemas
A diferencia de lo que ocurre en el caso anterior, sí existen instrumentos específicos

de evaluación de las habilidades de solución de problemas sociales (Roberts y Nel-
son, 1984), tal como las consideramos desde la perspectiva cognitivo-conductual.
Sin embargo, muchos de los comentarios hechos en el anterior apartado sirven tam-
bién para éste en el sentido de que la observación y los informes verbales son ele-
mentos de gran valor para realizar dicha evaluación. Así, una evaluación que no ten-
ga en cuenta el contexto educativo proporcionará una información de escaso valor
práctico.
Entre las habilidades de solución de problemas se aceptan generalmente las de
definición del problema, generación de alternativas de solución, previsión de conse-
cuencias de cada alternativa (toma de decisiones) y puesta en práctica y verificación.
Sin embargo, la primera de dichas habilidades, en el contexto del presente capítulo,
quedaría recogida entre las de autocontrol, ya que difícilmente podemos hablar de
autodeterminación de objetivos y criterios si previamente el problema (la tarea, la si-
721
tuación O laactividad) no están definidos adecuadamente. Esto no significa quitarle

importancia a aquella habilidad (en otro lugar hemos destacado esa importancia
[Bornas, 1992]). La última habilidad tampoco la consideraremos aquí ya que la pues-
ta en práctica y verificación no es, dentro del sistema de autorregulación, más que
otro circuito cognitivo-conductual que funciona con las habilidades de autocontrol
(véase el cuadro 29.1). Por tanto, quedan la generación de alternativas y la previsión
de consecuencias.
La evaluación tradicional de estas habilidades, es decir, la evaluación basada en
tests y realizada en condiciones de test, nos dará información acerca del número de
alternativas que un alumno es capaz de proponer para resolver un problema o de la
cualidad, originalidad, sofisticación de dichas alternativas; instrumentos para evaluar
estos aspectos son el Preschool interpersonal problem-solving (P1PS) de Shure y Spi-
vack (1974) o el Open middle inventory (OMI) y Open middle test (OMT) (Marchio-
ne, 1988). Este tipo de evaluación también nos informará de la capacidad del alumno
para prever las ventajas e inconvenientes de las alternativas, así como las dificultades
que conllevaría su puesta en práctica; mediante el juego del «¿Qué pasará luego?»
(Spivack y Shure, 1974) y el Means-end problem solving (MEPS) de Shure y Spivack
(1972) se puede evaluar dicha capacidad. Una revisión de los procedimientos de eva-
luación de la competencia social en niños la ofrece Hughes (1989).
Esta es una información interesante pero incompleta, como ya se adelantaba en
el apartado IV.1. Es necesaria una evaluación conductual que responda a preguntas
como: ¿se da tiempo al alumno para que genere alternativas o, por el contrario, se re-
fuerza el hallazgo rápido de una única solución ante un problema?, ¿el alumno toma
las decisiones a partir de la previsión de consecuencias o utiliza otros medios (por
ejemplo, imitar a alguien)?, ¿genera alternativas cuando se enfrenta a un problema y
no se siente presionado externamente para actuar?, ¿lo hace cuando sí hay presión
externa?, ¿se ofrecen buenos modelos de dichas habilidades en el ambiente educati-
vo del alumno?, ¿cuál es el grado de integración de aquellas habilidades en el sistema
de autorregulación del alumno?, ¿se favorece dicha integración en el contexto edu-
cativo?, etc. Por supuesto se trata de preguntas muy parecidas a las que hemos plan-
teado en relación al autocontrol. No debemos olvidar que estamos tratando la eva-
luación de la AR entendida como sistema y que tanto las habilidades de autocontrol
como las de solución de problemas forman parte del mismo sistema. Las respuestas a
estas preguntas, y a otras en la misma dirección, se obtendrán mediante la observa-
ción directa en el ambiente educativo real que se esté estudiando. La información así
obtenida será la que nos permitirá introducir cambios y mejoras para el buen de-
sarrollo de aquellas habilidades y del sistema de autorregulación de los alumnos.
1v33. Evaluación de habilidades metacognitivas
Ya se indicó anteriormente que la metacognición incluía dos aspectos: el conoci-

miento de los procesos y estrategias cognitivas y la capacidad para manipularlos
conscientemente. Este segundo aspecto ya se ha recogido en
las habilidades anterio-
y
as, ya que cuando se habla de habilida des
res de autocontrol y solución de problem
etc., en definiti-
metacognitivas se hace referencia a planificar, autoevaluar, controlar,
722 Xavier Bornas
va, a procesos que, en nuestra opinión, quedan suficientemente explicitados en la li-

teratura cognitivo-conductual sobre autorregulación y que no necesitan la etiqueta
de “metacognitivos”. Para otra opinión, centrada en el terreno estrictamente acadé-
mico del aprendizaje, véase Linn (1991). Sin embargo, el primer aspecto de la meta-
cognición sí merece una atención específica ahora. En particular y desde el punto de
vista educativo es importante evaluar el conocimiento metacognitivo acerca de las
estrategias de aprendizaje. Este conocimiento hace referencia a cómo emplear dichas
estrategias, a cuándo es conveniente o no hacerlo y a por qué es útil hacerlo en deter-
minadas circunstancias (Paris y Winograd, 1990). De ahí que a veces se hable de
conocimiento metaestratégico. El nivel que el alumno posea de este tipo de conoci-
miento probablemente influye en sus posibilidades y en su grado de autorregula-
ción. Nos estamos refiriendo más a las microestrategias, es decir, aquellas que son es-
pecíficas y sirven para un pequeño número de actividades, que a las macroestrategias
(como las de solución de problemas vistos anteriormente), ya que para éstas el meta-
conocimiento se elabora precisamente al prever las consecuencias de las alternativas
de solución y, en principio, excepto cuando se trata de actividades rutinarias, parece
útil emplearlas siempre. En cambio, las microestrategias tienen una aplicación más
rápida y no debieran requerir un proceso tan reflexivo de solución de problemas. El
metaconocimiento en este caso podría estar memorizado y determinar inmediata-
mente qué estrategia utilizar de entre las n disponibles. Raramente subrayamos el
periódico al leerlo pero es probable que sí subrayemos una fotocopia de un informe
técnico o un artículo científico. En ambos casos se supone que queremos compren-
der lo que leemos y probablemente lo conseguimos. El hecho de que la estrategia de
subrayar la usemos selectivamente puede depender del conocimiento que tenemos
acerca de la estrategia (cuándo conviene y cuándo no conviene emplearla); pero todo
parece indicar que es un conocimiento adquirido y memorizado que determina de
forma inmediata el uso de la estrategia para una actividad y el prescindir de ella para
otra actividad. No reflexionamos sobre la necesidad o la conveniencia de subrayar
cada vez que leemos algo (afortunadamente no necesitamos hacerlo).
Ahora bien, ¿cómo hemos aprendido aquel metaconocimiento y cómo hemos
llegado a este grado de automatización en el uso de estrategias? Probablemente, en la
mayoría de los casos, de manera informal, espontánea o por ensayo y error. La edu-
cación formal no suele proporcionar metaconocimiento, aunque sí proporcione a
veces estrategias. Y no parece haber ninguna razón para que esto sea así. El conoci-
miento metacognitivo se puede enseñar como cualquier otro y, desde el punto de
vista de la autorregulación, sería deseable que en la práctica educativa realmente se
diera.
En cuanto a la evaluación de la habilidad en el uso selectivo de microestrategias,
además de las directrices generales (evaluación conductual, directa, contextualizada,
que incluya el ambiente educativo) que hemos apuntado en apartados precedentes y
que son aplicables a este caso en particular, creemos, de acuerdo con Linn (1991),
que concretamente la evaluación dinámica (Campione y Brown, 1987), donde la
evaluación forma parte del proceso de enseñanza-aprendizaje y donde el evalua-
dor/profesor interactúa, pregunta, observa, dialoga con sus alumnos, es una forma
preferible a la más tradicional o estática basada en pruebas estandarizadas que difícil-
mente aportan información sobre la calidad del pensamiento. En definitiva, quizás
723
en el momento actual la mejor forma de evaluación de estos aspectos consista en pre-

guntar al alumno, después de hacer una tarea determinada, cómo la ha realizado o
pedirle que hable en voz alta mientras la está haciendo (Roberts y Nelson, 1984). A
partir de ahí podemos saber algo acerca de su conocimiento metaestratégico y de la
forma como accede a él y lo utiliza.
1V4. Evaluación de aspectos ambientales que inciden

en la autorregulación
En los apartados precedentes hemos insistido en la necesidad de realizar la evalua-
ción teniendo en cuenta que la autorregulación se da en un contexto educativo. Por
ello, se han mencionado algunos factores de dicho contexto que deberían ser evalua-
dos (por ejemplo, los recursos materiales empleados para la autoobservación o la
autoevaluación). Sin embargo, existen otros factores, más generales en cierto senti-
do, que tampoco deberían obviarse en la evaluación de la autorregulación ya que in-
ciden en ella aunque sea de forma indirecta. En el apartado 111.2 hemos hablado de
las relaciones entre la autorregulación y el rendimiento escolar, y hemos visto que la
motivación intrínseca podía considerarse una condición esencial para que se diera el
aprendizaje autorregulado. Pues bien, existen elementos en el contexto educativo
que socavan dicha motivación o no facilitan su desarrollo y, por ello, tampoco favo-
recen la autorregulación. Es a estos factores a los que ahora prestaremos alguna aten-
ción. El trabajo ya citado de Ryan, Connell y Deci (1985), por una parte, y el más re-
ciente de Ames y Ames (1991) nos servirán de guía para la presente exposición.
Ryan, Connell y Deci (1985) integran tres proposiciones en su teoría de la eva-
luación cognitiva. La primera afirma que cualquier acontecimiento que facilite la
percepción de un lugar de causalidad interno para una actividad tenderá a incremen-
tar la motivación intrínseca para esa actividad. Bornas (1988) hizo una revisión de las
relaciones entre atribuciones causales y rendimiento escolar que apoya en buena
medida dicha proposición. Por otra parte, son conocidas las elevadas correlaciones
positivas entre lugar de control interno y éxito académico (Findley y Cooper, 1983).
La proposición de Ryan y cols. (1985) sugiere que entre los factores contrarios a la
motivación intrínseca (e indirectamente al sistema de autorregulación) hay que con-
siderar aquellos que promueven o facilitan la percepción de un lugar de causalidad
externo (por ejemplo, comentarios del profesor atribuyendo el buen rendimiento de
un alumno en una actividad o materia a la buena suerte o a la facilidad de aquella ac-
tividad). Sin embargo, la evaluación de las atribuciones no es fácil (para el caso infan-
til, véase la revisión de Palmer y Rholes, 1989). La segunda proposición de Ryan y
cols. (1985) se refiere a la competencia; cualquier acontecimiento que enfatice laper-
cepción de competencia (dominio, destreza) tenderá a incrementar la motivación in-
trínseca. Por el contrario, los factores que favorecen la percepción de falta de compe-
tencia reducirán dicha motivación. Esta proposición está muy vinculada a la teoría
de Bandura (1977, 1986) sobre la eficacia personal. Entre estos factores se destacan
dos: el feedback, que no sólo debería referirse al éxito o fracaso en una actividad sino
que debería también proporcionar información acerca de lo que se requiere para me-
¡orar la ejecución o lo que se ha requerido para alcanzar ya un buen nivel; el otro fac-
724 Xavier Bornas
tor es el nivel de reto que supone una tarea determinada, y que de acuerdo con di-
chos autores no puede ser ni excesivamente alto ni demasiado bajo. En el primer
caso, el alumno puede experimentar sentimientos de incompetencia contradictorios
con la motivación intrínseca; en el segundo, a pesar del reforzamiento por la buena
ejecución, el nivel de motivación no crece porque no existe percepción de compe-
tencia al tratarse de una tarea que el alumno ya domina (Ryan y cols., 1985). La ter-
cera proposición es algo más compleja y se refiere al significado funcional de los
acontecimientos. Se trata de una propiedad fenomenológica y de mucho más difícil
evaluación. Ryan y cols. (1985) distinguen entre acontecimientos informativos, con-
troladores y amotivadores, siendo los primeros los que mejoran la motivación in-
trínseca al ser vistos como proporcionadores de feedback relevante en contextos de
elección o autonomía; los segundos son percibidos como presiones para actuar, pen-
sar o sentir de una forma determinada, y los terceros se experimentan como carentes
de relevancia.
Por su parte, Ames y Ames (1991) resumen de manera menos formal, pero qui-
zás más clara, los siguientes factores que contribuyen a crear o mantener un patrón
motivacional negativo (es decir, opuesto a la motivación intrínseca y a la autorregu-
lación): la competición y la comparación social en clase, la evaluación pública, el re-
forzamiento de la capacidad en lugar del esfuerzo, comunicar bajas expectativas,
permitir a los alumnos que no participen en los procesos de aprendizaje, reforzar el
rendimiento en lugar del aprendizaje, el énfasis excesivo en las notas y el éxito, la fal-
ta de reconocimiento y las malas condiciones físicas de aprendizaje (espacio, ruidos,
etc.). La lista de Ames y Ames (1991) no es incompatible con la presentación de
Ryan y cols. (1985). De hecho, muchos de los factores de esta lista pueden operar, en
teoría, por los mecanismos relativos a causalidad, competencia y significado funcio-
nal enunciados por estos autores. En cualquier caso, hemos querido simplemente
ilustrar con algo más específico las referencias a la necesidad de dirigir la evaluación
de la autorregulación también al ambiente educativo, referencias que hemos reitera-
do alo largo de todo el texto.
Allen, G. J., Chinsky, J. M., Larcen, S. W., Lochman,].E. y Selinger, H. V. (1976). Commu-
nity psychology and the schools. A behaviorally oriented multilevel preventive approach.
Hillsdale. Erlbaum.
Ames, C. y Ames, R. (dirs.) (1985). Research on motivation in education (vol. 2). The class-
room milien. Orlando. Academic Press.
Ames, R. y Ames, C. (1991). Motivation and effective teaching. En L. Idol y B. F. Jones
(dirs.), Educational values and cognitive instruction: Implications for reform. Hillsdale.
(PTAS
Avia, M. D. (1984). Técnicas cognitivas y de autocontrol. En J. Mayor y F. J. Labrador (dirs.),
Manual de modificación de conducta. Madrid. Alhambra
725
Baer, D. M. (1988). The future of behavior analysis in educational settings. En

J. C. Witt,
S. N. Elliott y F. M. Gresham (dirs.), Handbook of behavior therapy in education. Nueva
York. Plenum Press.
Bandura, A. (1977). Self-efficacy: Towards a unifying theory of behavioral change. Psycholo-
gical Revierw, 84, 191-215.
Bandura, A. (1986). Pensamiento y acción. Fundamentos sociales. Barcelona. Martínez Roca.
Bash, M. A. y Camp, B. W. (1985). Think aloud: Increasing social and cognitive skills: A pro-
blem-solving program for children (Grades 3-4). Champaign. Research Press.
Benson, A. J. y Presbury, J. H. (1989). The cognitive tradition in the schools. En J. N. Hug-
hes y R. J. Hall (dirs.), Cognitive behavioral psychology in the schools. A comprehensive
handbook. Nueva York. Guilford Press.
Bornas, X. (1987). Las autoinstrucciones. Descripción y aplicaciones en educación especial.
Revista Interuniversitaria de Educación Especial, 0, 39-54.
Bornas, X. (1988). Atribuciones causales y fracaso escolar: una revisión. Enseñanza, 6, 205-
221:
Bornas, X. (1991). Habilidades cognitivo-sociales y prevención de problemas en la escuela.
En G. Buela-Casal y V. E. Caballo (dirs.), Manual de psicología clínica aplicada. Madrid.
Siglo XXI.
Barsa X. (1992). El desenvolupament de autonomia personal. Vic, Barcelona. Eumo.
Bornas, X. y Servera, M. (1992). Cognitive training programs to reduce impulsivity-related
achievement problems: The need of in-classroom interventions. Learning and Instruc-
tion, 2, 89-100. S
Bornas, X., Servera, M. y Soler, T. (1992). Una propuesta global basada en laautorregulación
para la formación, en psicología, del profesorado. En Actas do 11 Seminário«A compo-
nente de psicologia na formaíao de professores e outros agentes educativos». Évora. Uni-
versidade de Evora.
Brown, A. (1978). Knowing when, where, and how to remember: A problem of metacogni-
tion. En R. Glaser (dir.), Advances in instructional psychology. Hillsdale. Erlbaum.
Camp, B. W. y Bash, M. A. S. (1981). Think aloud. Increasing social and cognitive skills: A
problem-solving program for children (Primary level). Champaign. Research Press. >
ment. En C. S. Lidz (dir.), Dynamic assessment: An interactional approach to evaluation
learning potential. Nueva York. Guilford Press.
Cavanaugh, J. C. y Borkowski, J. G. (1980). Searching for metamemory-memory connec-
tions: A development study. Developmental Psychology, 16, 441-453... Pa
Clinkenbeard, P. R. y Murphy, S. C. (1990). Measuring student motivation. Esa . a
nolds y R. W. Kamphaus (dirs.), Handbook ofpsychological and educational assessmen
of children. Personality, behavior and context. Nueva York. Guilford E . A.
Colom, A. J. (1982). Teoría y ri de la educación. Un enfoque a la luz de la teoría ge
. México. Trillas. :
ja D.(1982) Autocontrol i comportament: aplicació d'un model d a en un
medi escolar, Tesis de licenciatura inédita. Universidad Autónoma de nes .
Corno, L. y Rohrkemper, M. M. (1985). The intrinsic motivation to learn in c ei n
G es y R. Ames (dirs.), Research on motivation in education (vol. 2). The classroom
10 . Academic Press.
¿ner an Motivation. ceA. Lesgold y R. Glaser (dirs.), Foundations for a psycho-
on. Hillsdale. Erlbaum. IRE
a oe ra M. (1971). Problem-solving and behavior modification. /ournal of
chology, 78, 107-129. a,
o of behavioral treatments in educational o a > o
Ae o
S. N. Elliot y F. M. Gresham (dirs.), Handboo k of behavior therapy in education.
York. Plenum Press.
726 Xavier Bornas
Findley, M. J. y Cooper, H. M. (1983). Locus of control and achievement: A literature re-

view. Journal of Personality and Social Psychology, 44, 419-427.
Flavell, J. H. (1970). Developmental studies of mediated memory. En H. W. Reese y L. P. L1p-
sitt (dirs.), Advances in child development and behavior (vol. 5). Nueva York. Academic
Press.
Flavell, J. H. (1977). El desarrollo cognitivo. Madrid. Aprendizaje Visor.
Fuchs, L. S. y Fuchs, D. (1990). Curriculum based assessment. En C. R. Reynolds y R. W.
Kamphaus (dirs.), Handbook ofpsychological and educational assessment of children. In-
telligence and achievement. Nueva York. Guilford Press. sv
Goetz, E. T., Hall, R. J. y Fetsco, T. G. (1989). Information processing and cognitive assess-
ment l: Background and overview. En J. N. Hughes y R. J. Hall (dirs.), Cognitive beha-
vioral psychology in the schools. A comprehensive handbook. Nueva York. Guilford
Press.
Goetz, E. T., Hall, R. J. y Fetsco, T. G. (1990). Implications of cognitive psychology for as-
sessment of academic skill. En C. R. Reynolds y R. W. Kamphaus (dirs.), Handbook of
psychological and educational assessment of children. Intelligence and achievement. Nue-
va York. Guilford Press.
Gresham, F. M. (1986). Conceptual issues in the assessment of social competence in children.
En P.S. Strain, M. J. Guralnick y H. M. Walker (dirs.), Children's social behavior. Orlan-
do. Academic Press.
Gresham, F. M. (1988). Social skills: Conceptual and applied aspects of assessment, training,
and social validation. En J. C. Witt, S. N. Elliott y F. M. Gresham (dirs.), Handbook of
behavior therapy in education. Nueva York. Plenum Press.
Hall, R. J., Goetz, E. T. y Fetsco, T. G. (1989). Information processing and cognitive assess-
ment II: Assessment in the schools. En J. N. Hughes y R. J. Hall (dirs.), Cognitive beha-
vioral psychology in the schools. A comprehensive handbook. Nueva York. Guilford Press.
Hall, R. J. y Hughes, J. N. (1989). Cognitive-behavioral approaches in the schools: An over-
view. En J. N. Hughes y R. J. Hall (dirs.), Cognitive behavioral psychology in the schools.
A comprehensive handbook. Nueva York. Guilford Press.
Hersen, M. y Bellack, A. S. (dirs.) (1988). Dictionary of behavioral assessment techniques.
Oxford. Pergamon Press.
Hughes, J. N. (1989). A cognitive-behavioral model for assessing children's social competen-
ce. En J. N. Hughes y R. J. Hall (comps.), Cognitive behavioral psychology in the schools.
A comprehensive handbook. Nueva York. Guilford Press.
Kanter, F. H. (1966). Influence of age and incentive conditions in children's self-reward. Psy-
chological Reports, 19, 263-274.
Kanfer, F. H. (1970). Self-monitoring: Methodological limitations and clinical applications.
Journal of Consulting and Clinical Psychology, 35, 148-152.
Kanfer, F. H. (19754). Autocontrol en niños: investigación y teoría. En V. Pelechano (dir.),
Primer simposium sobre aprendizaje y modificación de conducta en ambientes educativos.
Madrid. INCIE (MEC).
Kanter, F. H. (1975b). La aplicación de las técnicas de autodirección en educación. En V. Pe-
lechano (dir.), Primer simposium sobre aprendizaje y modificación de conducta en am-
bientes educativos. Madrid. INCIE (MEC).
Kanfer, F. H. (1979). Autodirección: estrategias y técnicas. En A. P. Goldstein y F. H. Kanfer
(dirs.), Generalización y transfer en psicoterapia. Bilbao. DDB.
Keller, E. S. (1992). Friends and foes of educational reform. Ponencia presentada en el Primer
Congreso Internacional sobre el Conductismo y las Ciencias de la Conducta. Guadala-
jara, México.
Kendall, P. C. y Cummings, L. (1988). Thought and action in educational interventions:
Cognitive-behavioral approaches. En J. C. Witt, S. N. Elliott y F. M. Gresham (dirs.),
Handbook of behavior therapy in education. Nueva York. Plenum Press.
727
Kendall, P. C. y Hays, R. C. (1988). Self-control rating scale. En M. Hersen y A. S. Bellack

(dirs.), Dictionary of behavioral assessment techniques. Oxford. Pergamon Press.
Kendall, P. C. y Wilcox, L. E. (1979). Self-control in children: Development of a rating scale.
Kirschenbaum, D. S. y Ordman, A. M. (1984). Preventive interventions for children: Cogni-
tive behavioral perspectives. En A. W. Meyers y W. E. Craighead (dirs.), Cognitive beha-
vior therapy with children. Nueva York. Plenum Press.
Laszlo, E. (1972). Defensa de la filosofía de sistemas. Cuadernos Teorema, 42 (número mo-
nográfico).
Linn, R. L. (1991). Dimensions of thinking: Implications for testing. En L. Idol y B. F. Jones
IEA
Mace, F. C. y Kratochwill, T. R. (1988). Self- Monitoring. En J. C. Witt, S. N. Elliott y F. M.
Gresham (dirs.), Handbook of behavior therapy in education. Nueva York. Plenum
Press.
Marchione, K. (1988). Open Middle Inventory. En M. Hersen y A. S. Bellack (dirs.) (1988),
Dictionary of behavioral assessment techniques. Oxford. Pergamon Press. 1-3
Martens, B. K. y Witt, J. C. (1988). On the ecological validity of behavior modification. En
J. C. Witt, S. N. Elliott y F. M. Gresham (dirs.), Handbook of behavior therapy in educa-
t10n. Nueva York. Plenum Press.
McCormick, C. B., Miller, G. E. y Pressley, M. (dirs.) (1989). Cognitive strategy research:
From basic research to educational applications. Nueva York. Springer-Verlag.
Meichenbaum, D. H. (1981). Una perspectiva cognitivo-comportamental del proceso de so-
cialización. Análisis yModificación de Conducta, 7, 85-113.
Meichenbaum, D. H. y Goodman, J. (1971). Training impulsive children to talk to themsel-
ves: A measure of developing self control. Journal of Abnormal Psychology, 77, 115-126.
Meyers, A. W., Cohen, R. y Schleser, R. (1989). A cognitive-behavioral approach to education:
Adopting a broad-based perspective. J. N. Hughes y R. J. Hall (dirs.), Cognitive behavioral
psychology in the schools. A comprehensive handbook. Nueva York. Guiltord Press. :
Meyers, A. W. y Craighead, W. E. (1984). Cognitive behavior therapy with children: A his-
torical, conceptual, and organizational overview. En A. W. Meyers y W. E. Craighead
(dirs.), Cognitive behavior therapy with children. Nueva York. Plenum Press. pe
Michelson, L. y Mannarino, A. (1986). Social skills training with children: Research and clini-
cal applications. En P. S. Strain, M. J. Guralnick y H. M. Walker (dirs), Children's social
behavior. Orlando. Academic Press. E
Michelson, L., Sugai, D. P., Wood, R. P. y Kazdin, A. E. (1983). Las habilidades sociales en la
infancia. Evaluación y tratamiento. Barcelona. Martínez Roca.
Nisbett, J. y Shucksmith, J. (1986). Estrategias de aprendizaje. Madrid. Santillana. a
Nitko, A. J. y Lane, S. (1990). Standardized multilevel survey achievement o s
C.R. Reynolds y R. W. Kamphaus (dirs.), Handbook of psychological pd ucationa
assessment of children. Intelligence and achievement. Nueva York. Guiltord Press.
Palmer, D. J. y Rholes, W. S. (1989). Conceptual and methodological issues in the o
of children's attributions. En J. N. Hughes y R. J. Hall (dirs.), Cognitive behavioral ps)-
chology in the schools. A comprehensive handbook. Nueva York. Guilford a ,
Paris, S. G. y Winograd, P. (1990). How metacognitio n can promote academic learning an
instruction. En B. F. Jones y L. Idol (dirs.), Dimensions of thinking and cognitive instruc-
1 . Erlbaum.
ds a C. M. (1988). Behavior therapy and the educative > pl dE
Witt, S. N. y F. M. Gresham (dirs.), Handbook of behavior therapy in education. Nueva
aa O L. (1985). Metacognition reconsidered: Implications for interven-

tion research. Journal ofAbnormal Child Psychology, 13, 343-356.
728 Xavier Bornas
Rehm, L. P. (1977). A self-control model of depression. Behavior Therapy, 28, 787-804.

Rehm, L. P. (1983). Un modelo para el tratamiento de la depresión. Ponencia presentada en
las IN Jornadas de Modificación de Conducta Cognitiva. Madrid.
Rehm, L. P. (1991). Métodos de autocontrol. En V. E. Caballo (dir.), Manual de técnicas de
terapia y modificación de conducta. Madrid. Siglo XXI. A ri
Roberts, R. N. y Nelson, R. O. (1984). Assessment issues and strategies in cognitive behavior
therapy with children. En A. W. Meyers y W. E. Craighead (dirs.), Cognitive behavior
therapy with children. Nueva York. Plenum Press. ¿oécas
Robin, A. L., Fischel, J. E. y Brown, K. E. (1984). The measurement of self-control in chil-
dren: Validation of the Self-Control Rating Scale. Journal of Pediatric Psychology, 9, 165-
175.
Ryan, R. M., Connell, J. P. y Deci, E. L. (1985). A motivational analysis of self-determination
and self-regulation in education. En C. Ames y R. Ames (dirs.) (1985), Research on moti-
vation in education (vol. 2). The classroom milien. Orlando. Academic Press.
Shapiro, E. S. (1989). Academic skills problems: Direct assessment and intervention. Nueva
Short, E. J. y Weissberg-Benchell, J. A. (1989). The triple alliance for learning: Cognition,
metacognition and motivation. En C. B. McCormick, G. E. Miller y M. Pressley (dirs.),
Cognitive strategy research: From basic research to educational aplications. Nueva York.
Springer-Verlag.
Shure, M. B. y Spivack, G. (1972). Means-end thinking, adjustment, and social class among
elementary school-aged children. Journal of Consulting and Clinical Psychology, 38, 348-
ITA
Shure, M. B. y Spivack, G. (1974). Problem-solving techniques in childrearing. San Francisco.
Jossey-Bass.
Skager, R. (1984). Organizing schools to encourage self-direction in learners. Oxford. Perga-
mon Press and Unesco Institute for Education.
Spivack, G. y Shure, M. B. (1974). Social adjustment ofyoung children. San Francisco. Jossey-
Bass.
Spivack, G., Platt, J. J. y Shure, M. B. (1976). The problem-solving approach to adjustment.
San Francisco. Jossey-Bass.
Symons, S., Snyder, B., Cariglia-Bull, T. y Pressley, M. (1989). Why be optimistic about cog-
nitive strategy instruction? En C. B. McCormick, G. E. Miller y M. Pressley (dirs.), Cog-
nitive strategy research: From basic research to educational applications. Nueva York.
Springer-Verlag.
Weinstein, C. E., Zimmerman, S. A. y Palmer, D. R. (1988). Assessing learning strategies:
The design and development of the LASSI. En C. E. Weinstein, E. T. Goetz y P. A. Ale-
xander (dirs.), Learning and study strategies: Issues in assessment, instruction, and evalua-
t10n. San Diego. Academic Press.
Witt, J. C., Heffer, R. W. y Pfeiffer, J. (1990). Structured rating scales: A review of self-report
and informant rating processes, procedures, and issues. En C. R. Reynolds y R. W.
Kamphaus (dirs.), Handbook of psychological and educational assessment of children.
Personality, behavior, and context. Nueva York. Guilford Press.
Ames, R. y Ames, C. (1991). Motivation and effective teaching. En L. Idol y B. F. Jones

LEAN
Bornas, X. (1992). El desenvolupament de 'autonomia personal. Vic. Eumo.
Evaluación de las habilidades de autorregulación 729
Hughes, J. N. y Hall, R. J. (dirs.) (1989). Cognitive behavioral psychology in the schools. A

- comprehensive handbook. Nueva York. Guilford Press.
Kendall, P. C. y Cummings, L. (1988). Thought and action in educational interventions:
Cognitive-behavioral approaches. En J. C. Witt, S. N. Elliott y F. M. Gresham (dirs.),
Handbook of behavior therapy in education. Nueva York. Plenum Press.
McCormick, C. B., Miller, G. E. y Pressley, M. (dirs.) (1989). Cognitive strategy research:
From basic research to educational applications. Nueva York. Springer-Verlag.
30. EVALUACIÓN DEL LENGUAJE
VICTORIA DEL BARRIO
Il. INTRODUCCIÓN
La complejidad del lenguaje y sus múltiples variedades ha generado dificultades en

su definición a pesar de la familiaridad que su uso y conocimiento ofrecen a todos
los sujetos y especialmente a los expertos en el tema. Sin embargo, hay ciertos ele-
mentos que se encuentran en todo tipo de definiciones aplicadas al lenguaje. Estos
elementos son signos (artificiales), símbolos (naturales), códigos, sistema y comuni-
cación. No obstante, cada autor y cada escuela añaden precisiones que enfatizan su
peculiar punto de vista, subrayando unas veces su carácter de código, otras su siste-
ma convencional, sus contenidos o su estructura. Un considerable número de defi-
niciones puede encontrarse en autores especialistas en este tema (Mayor y Pinillos,
1991; Belinchon, Riviére e Igoa, 1992). Una definición muy genérica que podría en-
globar diferentes puntos de vista sería la siguiente: sistema de símbolos utilizado
para la comunicación; esta definición puede servir como punto de partida.
La evaluación del lenguaje y sus problemas ha sido desde los comienzos una ta-
rea interdisciplinar. La psicopatología, la lingúística, la psicología evolutiva y la psi-
cología comparada han confluido y contribuido, cada una desde una perspectiva di-
ferente, en el desarrollo y perfeccionamiento del proceso de evaluación del lenguaje.
En la evaluación del lenguaje se han visto también implicadas diversas concepciones
teóricas que han repercutido en la forma de abordar el problema. Mencionaremos
como ejemplo los distintos enfoques de la relación entre pensamiento y lenguaje (el
desarrollo del lenguaje dependiente del desarrollo cognitivo, según Piaget, o inde-
pendiente de él según Vigotski, o el desarrollo cognitivo dependiente del desarrollo
del lenguaje, como sostienen Solokov o Luria, o los que consideran a ambos como
consecuencia del desarrollo biológico, como defiende Lenneberg) que han generado
disensiones que no han hecho más que incentivar la necesidad de un conocimiento
científico del lenguaje y, por tanto, potenciar su evaluación. La famosa polémica teó-
rica sobre el origen innato (Chomsky) o aprendido (Skinner) de las estructuras lin-
gúísticas ha alentado la evaluación del proceso de la adquisición del lenguaje y coad-
yuvado al refinamiento de sus técnicas en estudios transculturales. También el
desarrollo de la psicolingúística, fuertemente ligado a la mencionada disputa, ha lle-
vado a atender a la evolución de la evaluación del lenguaje en sus distintas dimensio-
nes (fonológicas, gramaticales y semánticas) y a la sofisticación de las técnicas utili-
zadas para ello. P
En el campo de la psicopatología los problemas del lenguaje asociados al retraso
mental obligaron a incluir en todas las pruebas de inteligencia evaluaciones del len-
Universidad Nacional de Educación a Distancia (UNED).

732 Victoria del Barrio
guaje que han permitido analizar y reajustar muy precozmente algunos de sus pro-
blemas. Por otra parte, las lesiones cerebrales producidas en las dos últimas guerras
mundiales proporcionaron mútiples ocasiones para estudios empíricos sobre la rela-
ción entre las afasias en todas sus formas y su localización cerebral, lo que produjo
una ampliación de los conocimientos sobre las bases físicas del lenguaje y el desarro-
llo paralelo de las técnicas de evaluación neuropsicológica. Otras perturbaciones
asociadas a minusvalías físicas, como la hipoacusia, espastias o parálisis cerebrales
han representado un poderoso acicate en cuanto a la búsqueda de estrategias para la
evaluación de formas de comunicación alternativas al lenguaje fonético, tales como
el lenguaje gestual o pictográfico. Por su parte, la psicología comparada, debido
principalmente a su intento por mostrar las posibilidades de utilización del lenguaje
por parte de los animales, ha generado una nueva fuente de información y de preci-
siones en los registros de comunicación.
Cada una de estas ciencias utiliza generalmente un modelo peculiar como marco
teórico de su investigación. La psicología utiliza preferentemente modelos conduc-
tuales o cognitivos, donde la adquisición y el uso del lenguaje son sus problemas
fundamentales; la psicopatología recurre al modelo médico y la psicolingúística si-
gue el modelo estructural que se centra en el análisis de sus categorías fundamentales
(fonología, gramática, sintáctica, semántica y pragmática). Así, resulta que la evalua-
ción del lenguaje siempre se ha solapado con el estudio de la inteligencia, de los tras-
tornos orgánicos y el de los aspectos sociales relacionados con el aprendizaje de la
lengua. El retraso mental, las afasias, las hipoacusias, los entornos sociales, los siste-
mas educativos, la estructura de cada lengua son todos ellos factores que están ínti-
mamente relacionados con la cuestión de la evaluación del lenguaje. Por ello, la eva-
luación interdisciplinar y global del lenguaje es una meta para los especialistas en el
tema (Aimard y Abadie, 1992). Esta evaluación tiene que considerar un extenso
campo, con considerable cantidad de dificultades, problemas y escollos. Entre ellos
se pueden enumerar los siguientes: complejidad del lenguaje, heterogeneidad de sus
trastornos, falta de consenso en las teorías sobre el desarrollo del lenguaje, diversidad
de marcos teóricos en la elaboración de instrumentos de evaluación y peculiares difi-
cultades debidas al propio proceso de evaluación. A todo ello hay que añadir que
dado que la evaluación del lenguaje se realiza fundamentalmente en población infan-
til salvo en caso de lesiones traumáticas o mórbidas que se dan más habitualmente
en adultos— aún son mayores las dificultades en el proceso de evaluación, puesto
que se plantean los problemas típicos en toda evaluación infantil: lograr la colabora-
ción del sujeto evaluado, completar los déficit de información debidos a la inmadu-
rez recurriendo a distintas fuentes, la naturaleza cambiante de los elementos que han
de ser evaluados por evolución característica del sujeto, etcétera.
II. ELLENGUAJE Y SUS ASPECTOS EVALUABLES
El lenguaje, tal como ya se ha señalado, es el sistema de signos o símbolos que se usa

para la comunicación en una codificación determinada, con la representación de ob-
Jetos, personas, acontecimientos, pensamientos; esta representación supone proce-
Evaluación del lenguaje
733
sos materiales de naturaleza física y fisiológica (motora y acústica-perceptiva), cog-

nitiva, emocional y social. El desarrollo del sistema lingúñístico es imprescindible
para el desarrollo social e intelectual y viceversa. Por tanto, evaluar el desarrollo del
lenguaje es evaluar el desarrollo de un sistema de comunicación interactivo que sirve
para establecer contacto con el mundo circundante, establecer relaciones sociales
para aprender y poder pensar. Por ello, se pueden considerar en su evaluación distin-
tos campos de actuación que delimitan distintos elementos y áreas de actuación
(Wallach y Miller, 1988; Van Kleeck y Richardson, 1990). Son numerosos los aspec-
tos que pueden ser objeto de evaluación dentro de un sistema lingiístico y guardan
relación con los distintos elementos, funciones y estructuras que lo componen. Si
nos atenemos a un esquema que explicite las diferentes formas de comunicación y
sus componentes tendremos perfectamente delineados los distintos ámbitos genéri-
cos a donde se puede extender la evaluación del lenguaje. Tomando como referencia
las categorías de vehículo sensorial, código, así como las que se refieren a los elemen-
tos más estrictamente lingúísticos (forma, contenido y uso) (Bloom y Lahey, 1978),
se recoge todo aquello que puede ser objeto de evaluación dentro de cualquier siste-
ma de comunicación. Véase cuadro 30.1.
CUADRO 30.1. Diferentes elementos de la comunicación
Sujetos
Humanos Animales
Vehículo sensorial
Verbal Auditivo Visual Táctil Olfativo Gustativo
Canal de comunicación
Expresión Comprensión Proxemia
Habla Lenguaje Gestos
Lectura
Escritura
III IO AAN e ESE ES ECU POCA A AAA
Estructura linguística
Fonología
Forma Morfología
Sintaxis
Contenido Semántica
Uso
++(q
Pragmática =— KK
La comunicación humana participa con mayor o menor intensidad de todas las

formas de comunicación animal, mientras que los animales no tienen acceso a laco-
municación verbal y los niveles de abstracción que ésta permite (es un tema pa
do y discutible si el lenguaje que se le enseña a los chimpancés E no un nive
de abstracción). Es evidente que en el caso del lenguaje humano, los e ementos ver-
A to-
bales son los más representativos seguidos de los visuales, aunque estén
animales otros
dos los demás. Por el contrario, en el caso de los llamados lenguajes
elementos sensoriales son más relevantes y, generalmente, el factor visual se convier-

te en el vehículo central de la comunicación en las especies superiores, tal como ha
mostrado la psicología comparada. Aunque el lenguaje puede ser evaluado en todos
estos elementos, aquí nos vamos a centrar en la evaluación del lenguaje humano en
su doble dimensión verbal (expresiva y comprensiva) y en la visual (fundamental-
mente su forma gráfica que da lugar a la lectura y escritura).
ma. Distintas áreas de evaluación del lenguaje

En el lenguaje humano existen diversas áreas o dimensiones a tener en cuenta a la
hora de la evaluación del mismo. El área física se ocupa fundamentalmente de la eva-
luación neurológica, auditiva, visual y del examen de todos los procesos implicados
en la fonación (sistema respiratorio, cordinación motora de la fonación y articula-
ción). El área física es el campo tradicionalmente acotado por la medicina, siendo los
profesionales de esta disciplina los que se hacen cargo habitualmente de esta tarea;
no obstante, últimamente la evaluación psiconeurológica va ganando terreno. (Véa-
se en este mismo manual el capítulo de Peña-Casanova, Hernández yJarne.)
El área cognitiva se evalúa para determinar los siguientes aspectos:
a. Silos problemas de lenguaje se deben a un retraso general.

b. Si hay adecuación en habilidades parciales para la adquisición del lenguaje
(habilidades motoras).
c. Si el sujeto está preparado para desarrollar el control de símbolos (función
simbólica) y conceptos expresados en el lenguaje (conceptos y operaciones).
Cómo se usa el lenguaje para razonar y resolver problemas.
e. Cómo procesa el sujeto la información y aprende mejor, es decir, su estilo
cognitivo.
f. Cómo el problema del lenguaje, si lo hay, afecta al rendimiento escolar.
La evaluación de esta área se realiza mediante instrumentos adecuados de eva-

luación del desarrollo intelecual (véase en este mismo libro el capítulo de Prieto). La
conveniencia de evaluar el desarrollo intelectual previamente a la evaluación del de-
sarrollo del lenguaje ha sido un tema muy discutido por los expertos, pero actual-
mente parece una necesidad sólidamente asentada (Wallach y Miller, 1988).
El área social estudia, en relación con el lenguaje, procesos tales como apego,
agresión, impulsividad, desarrollo moral, temperamento y autoestima. Se pretende
así:
a. Establecer si el niño presenta un retraso en su evolución hacia la indepen-

dencia.
b. Determinar si ésta influye en el desarrollo del lenguaje.
c. Evaluar el entorno lingúístico.
d. Determinar la prioridad o no del problema de la comunicación.
e. Determinar, en el caso de que haya una intervención, las metas de la misma
en función del sistema de apoyo y las expectativas familiares.
735
f. Determinar quién se hace cargo de la intervención.

g. Decidir quién sería el foco de la intervención (padres, niño).
h. Decidir dónde se realizaría la intervención (hogar, institución, centro de re-
cuperación...).
La evaluación en este campo se realiza con instrumentos focalizados en el de-

sarrollo social (véase en este manual el capítulo de Kirchner). Para la evaluación del
entorno, que ha aparecido como especialmente relevante desde la perspectiva del
aprendizaje social, se usan instrumentos de evaluación de la interacción lingúística,
de la estructura familiar, prácticas de crianza, apoyo social, etc. que puedan perfilar el
sistema de necesidades, recursos y expectativas que conciernen al caso.
En el área lingúística se evalúa la forma, contenido y uso del lenguaje. La forma
analiza la sintaxis, la morfología, la fonología; el contenido se centra en su carácter
simbólico o semántico, y el uso evalúa la pragmática o funcionalidad del lenguaje del
sujeto. Esta es el área más compleja y en donde se centran los esfuerzos de la evalua-
ción. Se pretende específicamente:
a. Precisar la naturaleza del problema a evaluar.

b. Determinar la relación entre síntomas.
c. Identificación de los aspectos que contribuyen a los problemas de comuni-
cación.
d. Ayudar ala determinación de áreas de intervención.
Para la evaluación de estos elementos se utiliza una pluralidad de métodos que

más adelante se precisarán. La edad del niño es esencial en este tipo de evaluación,
puesto que varían los elementos a evaluar y la colaboración del sujeto; por ello, las
técnicas de evaluación son diferentes para los distintos niveles evolutivos. Como esta
área es de especial extensión en la producción de instrumentos de evaluación del len-
guaje y en ella se pone más énfasis, se expondrán más tarde, pormenorizadamente,
las técnicas específicas para cada uno de sus diferentes aspectos.
En el área de sistemas de lenguaje, la evaluación debe incluir aspectos segmenta-
les (sonidos) y suprasegmentales (entonación). La evaluación segmental comienza
antes de que el niño inicie la emisión de palabras. ñ E
Todas estas perspectivas reflejan, una vez más, la complejidad del lenguaje y las
distintas facetas e interacciones que pueden darse en un mismo fenómeno.
12. Elementos del lenguaje que se evalúan

Los elementos a evaluar varían en los distintos estadios evolutivos; por ello, vamos a
presentar qué se evalúa del lenguaje en la etapa prelingúística y en la lingúística pro-
piamente dicha, y esta última teniendo en cuenta sus aspectos de forma, contenido y
uso. Por otra parte, hay que subrayar que la evaluación se puede hacer utilizando el
canal receptivo (lenguaje comprensivo) y el canal emisor (lenguaje expresivo). En al-
gunos instrumentos sólo se evalúa uno de esos canales, pero, si se utilizan ambos, la
evaluación del lenguaje receptivo precede al expresivo y el gestual al verbal.
12.1. Lenguaje no verbal

En la evaluación no verbal del lenguaje genéricamente se tienen en cuenta muy dife-
rentes elementos (Aguirre y Beiras, 1976; Knap, 1978):
Cinestesia (movimientos corporales, gestos y expresión facial).

Tacto o conducta de contacto.
Proxémica (distancia, espacios). |
Paralingúística (entonación, tono, timbre, tensión, calidad de voz).
$HN Comunicación artefactual (vestido, pelo, maquillaje).
SS
Si los sujetos son niños y, por tanto, están en el período preverbal o carecen de
cualquier tipo de lenguaje se evalúan:
Los signos de actividad comunicativa (mirar objetos).

SA Discriminación auditiva (atender a fuentes sonoras, responder emocional-
mente a diferentes tonos de voz).
c. Contacto ocular.
d. Movimientos anticipatorios.
e. Señalar objetos.
f. Gestos comunicativos (llamada, rechazo, atención, contacto físico).
También es posible una evaluación de los requisitos previos a la instalación del

lenguaje, tales como procesos imitativos y desarrollo motor, puesto que son consi-
derados como esenciales en la adquisición de las primeras etapas del lenguaje.
112.2. Lenguaje verbal

Se evalúan todos los prerrequisitos para la aparición del lenguaje oral como llanto,
gritos y gorjeos, aunque no sean procesos verbales propiamente dichos. Los análisis
específicos de esta área de evaluación se centran en los aspectos estructurales y fun-
cionales del lenguaje derivados del campo lingúístico: forma, contenido y uso.
Forma
Dentro de la forma se consideran incluidos elementos fonológicos, morfológicos y

sintácticos. Entre los elementos fonológicos destacan los balbuceos (vocales, conso-
nantes y sus distintas posiciones), la prosodia, las ecolalias, la articulación y la veloci-
dad; de entre los elementos morfológicos destacan los términos (sustantivos, adjeti-
vos, preposiciones, verbos...) y los aspectos gramaticales (singular, plural, formas
verbales, negación...); y, de los elementos sintácticos, destacan la longitud media de
emisión, la estructuración de las oraciones y su complejidad y el índice de longitud y
complejidad. Los aspectos sintácticos y morfológicos están íntimamente unidos, por
tanto, su separación es una distinción artificial que en el lenguaje real no se produce.
737
Contenido
En relación con el contenido se evalúa el carácter estrictamente simbólico del léxico

(su semántica), lo que se puede hacer a distintos niveles: el significado léxico de las
palabras aisladas y el papel semántico o su funcionamiento en una frase determinada.
Uso
Se centra en la determinación de la competencia de un sujeto para la comunicación.

Los registros de uso se modifican según distintos contextos e interlocutores. Me-
diante este tipo de evaluación se pretende establecer si el sujeto es capaz de ajustar su
lenguaje en función de distintas situaciones y determinar si el lenguaje del sujeto es el
mismo en situación real que en situación de evaluación. Los elementos concretos a
evaluar son: intentos y frecuencia de la comunicación, la eficacia y adecuación de la
misma, las distintas funciones del lenguaje, la observación del conocimiento del tur-
no de la palabra, y la observación de la marcha y organización del discurso.
u3. Estrategias para la evaluación del lenguaje

Las estrategias arbitradas para la evaluación de los elementos que acabamos de expo-
ner varían en función del lenguaje al que están dirigidas (gestual, verbal o gráfico), a
la comprensión o a la producción lingúística y, por supuesto, las diferencias son más
acusadas cuando proceden de distintas metodologías, como veremos más adelante.
La exploración del lenguaje oral espontáneo se hace fundamentalmente en una con-
versación no formalizada o en situaciones de juego (la estrategia básica de esta eva-
luación se podría decir que es precisamente la ausencia de estrategia); el lenguaje ges-
tual utiliza fundamentalmente la observación y categorización de todas las
conductas motoras comunicativas. En ambos casos, es necesario el registro minucio-
so de las conductas. Cuando la evaluación del lenguaje oral se realiza mediante ins-
trumentos, cada uno hace hincapié en unas determinadas facetas del lenguaje que
configuran su técnica de evaluación. Sin embargo, existen unas estrategias básicas
que son repetidamente utilizadas por todos los técnicos y expertos en este campo,
sobre todo por los que elaboran pruebas formales y estandarizadas. Forns (1989)
hace una categorización pormenorizada de las mismas. No es posible hacer una ex-
posición exhaustiva de todas ellas, pero sí ejemplificar las más habituales.
a. Estrategia para evaluar la discriminación auditiva: movimiento de cabeza

—lenguaje gestual— (el evaluador produce un ruido fuera del campo visual del su-
lao)b. y boe deca
Estrategias para evaluar la articulación (forma): imitación —lenguaje expre-
sivo— (el evaluador dice una palabra y el niño la repite) y denominación (el evalua-
dor muestra una imagen y el sujeto dice su nombre).
c. Estrategias para evaluar la comprensión y significación (contenido): mos-
tración —lenguaje comprensivo— (el evaluador presenta dos o más objetos y
nombra uno de ellos para que el niño lo señale), categorización (el evaluador
proporciona distintos términos a incluir en categorías O distintas categorías para
las que buscar términos), denominación —lenguaje expresivo— (el evaluador
presenta dos o más objetos y señalando uno de ellos pregunta «¿esto qué es?»),
ejecución (el evaluador da una orden que el sujeto debe ejecutar), relación (el
evaluador presenta oral o visualmente un objeto y pide al niño que diga el
opuesto), completamiento (se da una frase incompleta que el sujeto debe termi-
nar) y sentido de refranes (se presentan al niño refranes a los que tiene que bus-
car el sentido).
d. Estrategia para evaluación de la sintaxis: elicitación —lenguaje expresivo—
(se presenta una lámina con una escena dinámica y se pregunta al niño «¿qué pasa
aquí?») y narración (se le demanda al niño que cuente un cuento). y
e. Estrategias para evaluación de la pragmática (uso): necesidad —lenguaje ex-
presivo— (se retira un objeto deseado para provocar su petición).
En resumen, se han presentado las distintas perspectivas desde las que se pue-
de contemplar el lenguaje, qué es lo que se evalúa y cómo se hace, cubriendo así
las recomendaciones que hacen los expertos que se enfrentan con este tema como
Kent (1974) y Miller (1981), si añadimos el porqué se evalúa a un sujeto, o sea, el
objetivo de la evaluación que condicionan a su vez el qué y el cómo de la misma
(Miller, 1976). Los objetivos fundamentales de la evaluación del lenguaje pueden
ser la determinación del desarrollo del lenguaje, los estudios epidemiológicos que
cuantifican la incidencia y prevalencia de los problemas y la evaluación y diagnós-
tico de problemas específicos. Para su consecución ha de seguirse un proceso
determinado.
IM. PROCESO DE EVALUACIÓN DEL LENGUAJE
La evaluación del lenguaje se ha interpretado como un proceso de toma de deci-

siones complejo (Gerard y Carson, 1990), donde las fases fundamentales como en
cualquier otro proceso de evaluación son la búsqueda de información, formula-
ción de hipótesis, verificación e interpretación de resultados (véase el capítulo de
Buela-Casal, Verdugo y Sierra en este mismo manual). Así, antes de entrar en las
técnicas específicas de evaluación del lenguaje conviene hacer un pequeño esque-
ma del proceso específico de su evaluación (véase cuadro 30.2) y cuyos elementos
son esencialmente válidos para cualquier marco teórico y diferentes técnicas utili-
zadas.
En el momento de la selección de técnicas de evaluación conviene partir de ins-
trumentos más amplios en el momento inicial para ir estrechando sucesivamente la
evaluación a instrumentos más específicos a medida que se va perfilando el tipo de
problema; este procedimiento se ha llamado la técnica del embudo (Cone, 1981).
Esta guía en el proceso de evaluación es común para todos los profesionales que tie-
nen que abordar esta tarea. Sin embargo, en el punto de selección de técnicas puede
aparecer un abanico de posibilidades diferentes.
739
CUADRO 30.2. Proceso de evaluación del lenguaje
Recogida de información
1. Lectura de datos colaterales
2. Revisión de cuestiones previas
3. Observación
4. Establecimiento del nivel de desarrollo general:
Niño Padres
Mecanismos del lenguaje 1. Historia evolutiva
Audición = 2. Rendimiento escolar
Comprensión 3. Revisiones previas
Producción 4. Recursos sociales
Desarrollo cognitivo
Atención y motivación
ES
ES Medio
Formulación de hipótesis
— Selección de métodos y procedimiento
2. Evaluación de la ejecución específica del lenguaje
Verificación
1. Análisis de los datos
2. Reformulación o mantenimiento de hipótesis
Resultados
Interpretación de los datos
Cuestiones adicionales derivadas
Predicción
Recomendaciones
EInforme
Intervención
Mantenimiento
Seguimiento
Información
¿Cuál es el problema?
¿Qué expectativas se tienen?
¿Hay diferencias entre test y vida real?
¿Qué factores ambientales pueden ayudar el cambio?
¿Cuáles son los patrones de comunicación del sujeto?
Metas
¿Qué es lo que el sujeto necesita aprender?
Mantenimiento
¿Qué ayuda hay en el entorno que pueda mantener los logros?
¿Cómo se puede estructurar esa ayuda?
¿Cuál es el sistema de revisión? de »
¿Es necesaria una ayuda exterior para el mantenimie nto”
Dado el problema, ¿es posible la intervención?
¿Cuándo hay que hacer una reevaluaARA ción?
tt ri E Bt EM
AA A
cc
IV. TÉCNICAS DE EVALUACIÓN DEL LENGUAJE
Las técnicas de evaluación han ido evolucionando paralelamente a las del estudio del
lenguaje. Siguán (1984) hace un recorrido histórico del tema mostrando esta evolu-
ción; Valle Arroyo (1991) sub: 21 « cómo el área de la comprensión del lenguaje ha sido
la que más atención ha acaparado a lo largo del tiempo y ello ha repercutido en la eva-
luación; por su parte, Forns (1989) recoge la información específica sobre la evolución
de los instrumentos de evaluación. La década de los años cincuenta marca cuatro gran-
des líneas de investigación. La primera busca el establecimiento de niveles evolutivos
normativos y basaba la evaluación en la posesión del lenguaje desde una perspectiva
semántica, frecuentemente asociada a la evaluación de la inteligencia; una segunda se
centra en los elementos lingiiísticos y usa la observación del lenguaje en ambientes na-
turales, con una especial atención a los aspectos gramaticales y sintácticos; la tercera se
centra especialmente en la evaluación fonológica, fonética y en las funciones del len-
guaje; la cuarta atiende a los aspectos patológicos. En los años sesenta se produce la
gran emergencia de las pruebas estandarizadas en donde se exploran plurales aspectos
del lenguaje, además de iniciarse una preocupación por la evaluación de los cambios
producidos por la intervención; es también típico de esta década la diversificación de
técnicas en función del marco teórico de partida. En los años setenta comienza el pro-
tagonismo del contexto y la influencia más marcada de la psicolingúística que aporta el
esquema de forma, contenido y uso a la evaluación. Los años ochenta se caracterizan
por el interés que cobran los aspectos interactivos de la comunicación.
Se podría resumir el panorama diciendo que la evaluación del lenguaje ha evolu-
cionado desde una primera época donde preocupaba el individuo desde un punto de
vista evolutivo, una segunda en la que el protagonismo lo adquiere el grupo y, por
último, se imponen los aspectos sociales del lenguaje. Ajustándose a estas necesida-
des, existen fundamentalmente cuatro vías clásicas para la evaluación del lenguaje:
escalas de desarrollo, observación directa de la conducta lingúística de un sujeto,
pruebas estandarizadas y pruebas no estandarizadas. Las escalas de desarrollo y la
observación del lenguaje se usan más frecuentemente en los primeros estadios (0-5
años), las pruebas estandarizadas son más frecuentes a partir de los 6 años y las prue-
bas no estandarizadas se usan en todos los niveles de edad. Ninguna de estas meto-
dologías es excluyente, es decir, un sujeto puede ser evaluado con todas ellas simultá-
neamente y los datos obtenidos serán complementarios si en cada proceso se han
cuidado las características científicas de la evaluación.
IVA. Escalas de desarrollo
Las escalas evolutivas pueden estar específicamente construidas para la evaluación

de la evolución verbal o pueden referirse, como es más frecuente, al desarrollo gene-
ral de los sujetos incluyendo el área verbal; unas y otras pueden usar métodos dife-
rentes en la selección de sus ítems: el idiográfico y el estadístico. La metodología
idiográfica consiste en la observación intensiva de uno o pocos niños. Los pioneros
en este campo (Darwin, 1877; Machado Alvarez, 1887; Preyer, 1889; Stern y Stern,
Evaluación del lenguaje 741
1907) observaron más o menos sistemáticamente a sus propios hijos y esbozaron

UNOS primeros procesos evolutivos, incluyendo el área del lenguaje. Se consideran
trabajos de gran interés, pero de poco rigor científico (Irwin, 1949). Otra cuestión
diferente son los trabajos que Binet y Piaget han elaborado sobre el desarrollo de sus
hijos con largos períodos de seguimiento y gran sistematicidad en la observación; es-
tos trabajos han dado lugar a la aparición de libros ya clásicos en la psicología. Otros
profesionales expertos en lenguaje, usando una metodología idiográfica han seguido
también el desarrollo lingúístico de sus propios hijos: Gregoire (1937), Leopold
(1939), Hernández Pina (1979), Secall (1982); otros (Brown y Bellugi, 1964; Mc-
Neill, 1966, 1970; Bloom, 1970; Slobin, 1971) aplicaron esta metodología a pequeños
grupos. Con ello se han obtenido datos para confeccionar escalas de desarrollo que
abarcan tanto la comunicación prelingúística como la verbal propiamente dicha.
Por otro lado, la metodología estadística actúa sobre muestras más grandes de
sujetos y utiliza mayoritariamente listados de conductas o pruebas que cumplimen-
tan los padres de los sujetos. Las escalas de maduración se han construido funda-
mentalmente con este segundo método; autores clásicos de tales escalas son Gesell,
Cattell, Wallon, Bayley, McCarthy. Otros autores han usado una metodología mix-
ta, aplicando escalas pero de manera muy minuciosa y repetidamente a un número
muy pequeño de sujetos (Búhler, 1930; Lewis, 1936; Irwin, 1949; McCarthy, 1959;
Brown, 1973; Miller, 1976). (Es especialmente famoso el caso de Carlota Búhler que
ha observado a 69 niños durante 24 horas a lo largo de un año.)
Las preguntas referidas al área del lenguaje son muy parecidas en todas las esca-
las. Como ejemplo exponemos en el cuadro 30.3 algunos elementos (ítems) de la es-
cala Developmental programing for infants and young children [Programa de de-
sarrollo para bebés y niños pequeños].
CUADRO 30.3. Desarrollo del lenguaje
Mueve las piernas, cabeza y ojos en respuesta a la voz y el ruido

Vocaliza cuando se le habla
Vuelve la cabeza en dirección de la fuente sonora
Vocaliza emociones, comienzan los distintos tonos de voz
Emite sonidos diferentes ante emociones diferentes
Imita sonidos
Emite repeticiones silábicas (Íma-ma)
Hace gestos diferentes en relación con canciones
MS Hace sonidos onomatopéyicos (guau-guau)
E
SN
10. Inhibe la acción ante el “no”
11. Emite jerga con prosodia
12. Imita aproximadamente palabras
13. Usa dos palabras funcionalmente
14. Utiliza gestos para la comunicación
15. Ante la orden verbal señala partes de su cuerpo
16. Ante la designación de un objeto lo denomina
La metodología idiográfica y la estadística han llegado a ser complementarias

como es patente en el caso de Binet; la primera da lugar a un amplio conocimiento de
los problemas de la evaluación y las estrategias de solución de los mismos, la segunda
permite unos datos más firmes en el establecimiento de etapas madurativas. Como

ejemplo de los datos obtenidos de ellas mostramos en el cuadro 30.4 un resumen de
la recopilación que McCarthy (1957) hace de las más precoces escalas de desarrollo
lingúístico desde 1925 a 1940.
Cuando el niño sobrepasa los 12 meses, el ritmo de posesión del lenguaje es muy
variado, por ello se han realizado estudios cuantitativos que permiten precisar el rit-
CUADRO 30.4. Escala de desarrollo del lenguaje
5 meses Incremento de las emisiones en situación

social
6 meses Articulación silábica repetida, expresión vocal de satisfacción,

impaciencia o protesta
7 meses Vocalizaciones prosódicas de “conversación”, vocalizaciones de

reconocimiento de adulto
8 meses Reconocimiento del significado de algunas palabras, interjecciones
9 meses Comprende, imita y hace gestos significativos, ampliación de

reconocimiento de palabras habituales
10 meses Comienzo de intelección de órdenes, enriquecimiento de la

articulación
11 meses Aparición de las primeras palabras: mamá, papá
12-13 meses Intelección de órdenes simples, frases de una sola palabra,

aparición de dos-tres palabras
14-18 meses Incremento rápido del número de palabras, denominación de

objetos reales y pictóricos, aparición del saludo social, comprensión
de elementos faciales
18-24 meses Ampliación de comprensión y expresión de objetos (media = 75),

ampliación de longitud de frase, uso de la negación, denominación
de acciones
25-36 meses Consolidación de estructuras sintácticas, incremento léxico

(media = 175), aparición de adjetivos, adverbios, preposiciones y
pronombres
743
mo medio de adquisición léxica; el número de palabras que un niño usa funcional-

mente es 2-3 palabras a los 12 meses, 10-20 a los 18 meses, 50 a 250 a los 24 meses,
400 a 500 a los 30 meses y de 800 a 900 a los 36 meses. A partir de los 36 meses un
niño normal incrementará su vocabulario, su precisión articulatoria y sus estructu-
ras sintactáticas se harán más complejas, pero las bases de su lenguaje comprensivo y
expresivo están ya perfectamente asentadas. Secadas (1992), con una metodología
paralela, ha confeccionado sus escalas evolutivas en niños españoles. Entre otras se
incluye una escala de desarrollo de lenguaje que tiene una secuencialización muy si-
milar a la expuesta. La mayor parte de las escalas evolutivas recoge los grandes ras-
gos del desarrollo del lenguaje y coinciden en su secuencialización; según las distin-
tas épocas se hace más hincapié en aspectos gestuales, fonéticos, gramaticales,
sintácticos o funcionales, pero el desarrollo en la adquisición del lenguaje es básica-
mente estable en todas ellas (Faw, 1981). Su uso permite la comparación de cualquier
sujeto evaluado con el grupo de su edad y resultan útiles en un primer estadio de la
evaluación. La escala más usada es quizás la de Ireton y Thwing (1974), de la que no
existe adaptación española. Las escalas de desarrollo del lenguaje normal han dado
lugar al establecimiento de una escala paralela generada por la American Association
of Mental Deficiency (AAMD) elaborada por Grossman (1973) que permite estable-
cer los niveles de desarrollo del lenguaje típicos en los distintos niveles de retraso
mental. Véase el cuadro 30.5.
CUADRO 30.5. Niveles de retraso del lenguaje
Edad cronológica Nivel de lenguaje
Tres años o más 1. Imita sonidos, risa y sonrisa Profundo

responde a gestos y signos
sin lenguaje funcional
Tres años o más 2. Usa dos palabras y vocaliza Severo
Tres años o más 4. Nombra objetos comunes, hace frases

de dos o tres palabras Leve
Existe una homogeneidad en las líneas básicas de desarrollo del lenguaje entre las
distintas lenguas en los primeros estadios. Otra cuestión diferente son los estadios
el
más detallados de desarrollo lingúístico que está ya mucho más condicionado por
que el niño aprende y las diferenci as se hacen más y más
tipo de modelo de lenguaje
avances
importantes a partir de los 18 meses. Muchos expertos han estudiado estos
en morfolog ía, fonología , sintaxis, semántica y pragmáti ca que
específicos y precisos
se producen entre los 18 y los 50 meses; estos trabajos se han abordado desde un
marco teórico distinto y con una metodología diferente: observación del lenguaje
espontáneo.
1v2. Observación directa
La observación directa del lenguaje infantil puede realizarse sin ninguna estructura-
ción y en ambientes naturales anotando o registrando todo lo que elniño dice, pero
este método es especialmente costoso desde todos los puntos de vista. Por ello, los
expertos en observación del lenguaje han propuesto una serie de estrategias que li-
mitan el tiempo de la evaluación sin que por ello se pierda la riqueza ni la espontanei-
dad de la evaluación, más aún la facilitan. En estas estrategias se plantean los proble-
mas de quién, cuándo, dónde y cómo hacer los registros de lenguaje para conseguir
la máxima calidad con el mínimo costo (Miller, 1976).
1V.2.1. Recogida de datos

Dada la compleja naturaleza del lenguaje, todos los expertos recomiendan trabajar con
registros mecánicos, ya sea con grabación de sonido o filmación de las sesiones de eva-
luación. Esto permite volver una y otra vez a los registros para precisar los datos. La
transcripción del material grabado está perfectamente regulada y existen normas pre-
cisas que homogenizan los datos y permiten su utilización por diferentes especialistas
o distintos miembros de un mismo equipo. Aunque existen varias normas de trans-
cripción de cintas, una de las más conocidas es la propuesta por Bloom y Lahey (1978);
en el cuadro 30.6 se recogen algunas de las normas de transcripción más importantes.
Miller (1981) recomienda que la transcripción del habla infantil se haga exacta-
mente como el niño la emite (la mayor precisión se logra con transcripción fonética),
con la palabra correcta escrita a continuación entre paréntesis, puesto que investiga-
dores diferentes de los que hacen el registro pueden tener problemas de reconoci-
miento en las palabras y sonidos mal articulados. Las grabaciones en vídeo se trans-
criben con las mismas normas, con la facilidad que añade el apoyo visual que
acompaña a las verbalizaciones.
1v.2.2. Formas de elicitación del lenguaje

Como la evaluación del lenguaje se realiza fundamentalmente en niños, muchos auto-
res recomiendan una serie de normas para lograr que éste hable durante los períodos
de evaluación, puesto que es frecuente que se encuentren inhibidos; entre estas nor-
mas destacamos las siguientes (Bloom y Lahey, 1978; Miller 1981):
a. Seguir las directrices que marca el niño: hablar de lo que el niño está hacien-
do, comentar el contenido de lo que dice, seguirle, oírle, focalizar la conversación so-
bre cosas familiares y cotidianas y usar un lenguaje del mismo nivel.
745
CUADRO 30.6. Resumen de las normas de transcripción de Bloom y Labey (1978)
e Todo lo que dice el niño, se le dice u oye se escribe en un papel dividido por
una línea vertical. Lo que dice el niño aparece en el lado derecho. lo que dicen
otros hablantes en el izquierdo. Las distintas personas se identifican por su
inicial (M = mamá, P = papá). La información referida al contexto se recoge en
el lado izquierdo entre paréntesis.
(M: le da un pastel a A)
M: mira lo que tengo/
A: coge el pastel —pastel/
a$ Una acción o acontecimiento que ocurre simultáneamente se registra en la

misma /ínea; si suceden sucesivamente en líneas separadas.
sacando el pastel —pastel/

—más/
Sn Las emisiones que se suceden unas a otras sin cambio de situación se ponen
en la misma /ínea.
tirando unos bloques —no bloques/ no más/ no/
4.2 El signo de terminación es (/). Su uso está determinado por la longitud de una
pausa antes de que aparezca la próxima emisión. Es un juicio difícil de hacer
en etapas tempranas.
5.2 Las pausas se indican mediante un punto (.). Las pausas largas por varios (...).
6.2 Las dicciones ininteligibles se indican por (----).
7.2 Los cortes abruptos se indican por ( ).
8.2 Las páginas se numeran en la parte superior derecha.
9.2 En el margen izquierdo se registra de 50 en 50 las vueltas de la cinta.
10.2 Se registra al comienzo de la grabación la fecha de la toma.
b. Renunciar al control de la interacción: no corregir al niño, no dirigirle, ex-

presar las propias opiniones o ideas sólo ocasionalmente, minimizar el uso de pre-
guntas, no usar preguntas de test, no intentar llenar los huecos o silencios de la con-
versación y no asumir el papel de maestro o terapeuta.
c. Estructurar de forma positiva la interacción: producir un primer período de
contacto sin pretender la elicitación, usar un juego en el período de calentamiento,
jugar con materiales en el suelo, hablar sobre lo que hace eladulto, hablar de los ju-
guetes, usar cuestiones abiertas y cerradas, demostrar funcionalmente qué conductas
se pretenden del niño y olvidar una interacción estructurada.
Como se puede apreciar, todas estas normas, a pesar de que introducen un cierto
orden y organización homogénea en los que las siguen, pretenden en todo momento
no ser directivas y conservar al máximo la espontaneidad del lenguaje infantil. Se
pretende que el evaluador logre el máximo lenguaje posible con el mínimo de inter-
vención. Existen también pruebas no estandarizadas que suponen un grado mayor
de estructuración en la elicitación del lenguaje; éstas se verán más adelante en el apar-
tado correspondiente.
1v2.3. Lugar de la observación

Las recomendaciones genéricas de la evaluación infantil sugieren eluso de entornos
plurales. Esto es mucho más importante aún en el área del lenguaje, puesto que éste
en el niño, sobre todo en las primeras etapas, es concreto y ligado a la realidad cir-
cundante. La casa, la escuela, el parque, el despacho y la clínica son los lugares posi-
bles, pero no deben ser excluyentes. Antes de los dos años no se aconsejan las graba-
ciones fuera del hogar, puesto que hasta esa edad todos los niños se inhiben en
ambientes extraños y su lenguaje es fundamentalmente doméstico. Aunque se reco-
mienda la observación en espacios exteriores y zonas de juego, en la práctica son evi-
tados (siempre que no sean imprescindibles) por las dificultades acústicas que aña-
den al registro mecánico estas situaciones. Son especialmente minuciosas las
recomendaciones que se han formulado para la evaluación de niños pequeños. Se su-
giere la observación en actividades diferentes: baño, comida, eliminación, arreglo,
juego, etc. Si la observación tiene que ser en un despacho, se recomienda generar dis-
tintas situaciones de juego que reproduzcan esas actividades reales; además, se cam-
bia el compañero de juegos (juego en solitario, con la madre, con el evaluador, con
compañeros...) con el fin de ampliar el abanico de posibilidades para elicitar todo
tipo de lenguaje en una etapa en que éste es más bien escaso.
1V.2.4. Los materiales
Los materiales pueden estar referidos a los equipos de grabación o a los que se usan
para la interacción con el niño.
Aparatos de grabación
Dada la variación en el mercado de estos instrumentos, las recomendaciones son

muy genéricas, puesto que pronto los nuevos productos mejoran los anteriores. Sin
embargo, es evidente que para obtener una buena grabación es imprescindible un
buen aparato y micrófonos multidireccionales; si los aparatos de grabación inhiben
O asustan al niño se le permite manipularlo en los primeros minutos de la sesión pre-
paratoria. Los niños suelen acostumbrarse rápidamente y colaboran sin dificultad en
las actividades nuevas que se les proponen y que forman parte de la evaluación. Si la
grabación se realiza con vídeo, se debe tener en cuenta todo lo anterior, y además
hay que añadir algunas recomendaciones. La filmación debe acompañarse de un re-
gistro de sonido complementario para asegurar su precisión. Como las cámaras im-
plican movimiento y su manejo puede distraer excesivamente al niño, se recomienda
hacer este tipo de registros a través de una ventana de visión unidireccional. Ello no
suele ser posible en los registros en ambientes naturales y domésticos; en tales casos,
se recomienda posibilitar y alargar, si fuese necesario, el período de habituación.
747
Materiales de trabajo
Suelen emplearse diferentes tipos de juguetes, que se seleccionan en función del de-
sarrollo cognitivo de cada sujeto, entre los objetos habituales e inhabituales para la
determinación de diferencias entre unos niños y otros. Brown (1973) indica una se-
rie de recomendaciones en función de los distintos estadios de desarrollo verbal:
a. Del estadio Tal estadio III: pelotas, muñecas, vasos, tazas, coches y camiones.
b. Estadio III: conversación sobre vacaciones, actividades escolares, abuelos,
niños y juguetes favoritos.
c. Estadio IV: contar historias acerca de una actividad pasada o futura.
Algunos autores prefieren las situaciones menos formales sin materiales concre-
tos, puesto que en su opinión facilitan más el lenguaje espontáneo y alargan la longi-
tud media de la frase.
Iv2.5. La duración
El tiempo de duración varía con la edad y también con las recomendaciones de dife-
rentes autores. El término medio de una sesión se estima entre 15 y 30 minutos. Sin
embargo, como han de tomarse registros en diferentes lugares, de distintas activida-
des a lo largo del día, se estima una duración media global de dos horas. Si la graba-
ción estuviese movida por el deseo de establecer la eficacia de un tratamiento, el tera-
peuta es el que debe estimar, según el ritmo del progreso, la periodicidad, duración y
el calendario de los registros.
Iv2.6. Resultados obtenidos
Los datos obtenidos con esta metodología son muy numerosos y de una gran pre-
cisión y utilidad. Expondremos los más conocidos ante la imposibilidad de pre-
sentarlos todos. Prather, Hedrick y Kern (1975) estudiaron la aparición de distintos
fonemas colocados al principio o al final de emisiones lingúísticas, otros como Stoel-
Gammon (1985) precisaron los porcentajes de esta aparición en los distintos niveles
de edad. Véase cuadro 30.7.
Brown (1973) en el estudio de tres niños proporcionó datos minuciosos sobre la
longitud media de la emisión (Mean utterance length, MLU) en los que basó sus cin-
co estadios evolutivos del lenguaje. Véase el cuadro 30.8. ,
También se ha estudiado el proceso de aprendizaje y el papel que juega la interac-
ción con la madre en el desarrollo de las habilidades lingúísticas (Villiers y Villiers,
1978), que precisa no sólo la implantación de sonidos elementales sino los procesos
de generalización de los primeros términos, las diferentes funciones de los mismos y
las reglas gramaticales específicas del primer año. Más recientemente, comienzan a
evaluarse los aspectos interactivos como la secuencialización en la conversación
CUADRO 30.7. Evolución de aparición de fonemas
CUADRO 30.8. Estadios de Brown en función de la MLU

o 5 5.
Estadios MLU
is
!! AO)
mI LS
IV 3,50
V 4,00
(Jose, 1988). En España, y con metodologías muy diversas, también se han realizado
estudios sobre el desarrollo del lenguaje. Uno de los primeros ha sido realizado por
Gili Gaya (1972) con “recuentos” de la frecuencia de uso de nombres, adjetivos, ver-
bos, adverbios, pronombres, preposiciones y conjunciones en edad preescolar y es-
colar. López Ornat (1975) estudió el uso de determinadas preposiciones en su acep-
ción temporal y espacial en niños de 3 a 6 años. "También existen muchos trabajos
realizados en población mexicana; entre ellos se encuentran los de Melgar de Gon-
zález (1976), cuya investigación proporciona un estudio muy completo sobre el do-
minio de los fonemas en español y los errores más frecuentes desde los 3 hasta los
6 años y medio. El grupo Rosa Sensat (1978) ha construido un vocabulario básico de
niños entre 8-9 años ordenado en función de 26 categorías diferentes. Cabrejo-Parra
(1978), en un estudio longitudinal de diez niños de 18 a 36 meses, localiza a la edad
de 19 meses la aparición de la contestación a la pregunta «¿dónde está ?» ante
la presencia visual del objeto que se nombra. Bosch (1984) ha estudiado el desarrollo
fonológico de niños españoles. Triandó (1982) ha realizado observaciones sobre los
intentos de comunicación gestual y verbal en niños de 11 a 30 meses, mostrando el
desarrollo fonológico y gramatical de los sujetos observados. Clemente (1982) ha es-
tudiado la MLU, el número y tipo de verbos de cada emisión y el tipo y número de
estructuras sintácticas en niños de 2 a 7 años; sus datos proporcionan un listado de
porcentajes medios en cada nivel de edad. Soler (1984) ha estudiado la instalación del
artículo en niños de 3 a 6 años y la evolución de su uso en sus distintas formas, géne-
ros y números. Pérez y Singer (1984) han realizado un estudio de adquisición de
morfemas en niños entre 3 y 6 años, con una secuencialización de los mismos en or-
749
den a su dificultad. Belinchón (1985) analiza la evolución de las funciones pragmát-

cas del lenguaje. Boada (1986) ha realizado un estudio evolutivo del dominio dela co-
dificación. Sebastián (1991) ha estudiado la utilización de las diferentes formas verba-
les en niños de 3,4,5 y 9 años. Existe una copiosísima literatura en todos los idiomas
que proporciona una gran cantidad de datos a propósito de la adquisición de los dis-
tintos fonemas, morfemas, longitud y función de frases, número y tipo de contactos
comunicativos que es imposible enumerar y de los que están llenos las revistas espe-
cializadas. Todo esto da una idea de la vitalidad y eficacia de esta metodología.
V. PRUEBAS ESTANDARIZADAS
Las pruebas estandarizadas se plantean metas diferentes y usan distintos criterios de

evaluación de los que hemos visto anteriormente. Las pruebas estandarizadas de
evaluación del lenguaje más conocidas y usadas son las globales, es decir, las que ex-
ploran los diferentes elementos que constituyen el sistema lingúístico (fonología,
morfología, sintaxis, semántica, pragmática); no obstante, existen también pruebas
específicas para cada una de esas partes. La mayoría de los tests importantes de len-
guaje aparece en los años sesenta (Forns, 1989), aunando la pretensión normativa y
evolutiva de los primeros tiempos con el rigor metodológico y la especificidad que
los psicolingúistas habían introducido en la evaluación del lenguaje espontáneo. Se
pueden encontrar repertorios extensos de tests de lenguaje en muchas publicaciones
(Olswang y Bain, 1988). Expondremos más detenidamente aquellas pruebas que
puedan encontrarse adaptadas a la población española, puesto que no es posible la
utilización de tests de lenguaje que no hayan sufrido la adaptación de un idioma a
otro. No nos referiremos aquí a las pruebas que se usan para la evaluación de alguno
de los procesos básicos implicados en el lenguaje hablado o escrito (como por ejem-
plo, el test de Estructuración temporal de Stamback, el Gestáltico-visomotor de Ben-
der o el Test de maduración perceptivo motriz de Frost1g).
va. Pruebas globales de evaluación del lenguaje

Como ya se ha señalado antes, las primeras pruebas de evaluación del lenguaje apa-
recieron como subpruebas en la evaluación de la inteligencia; en nuestro contexto
social, la prueba de Binet, la de Terman-Merrill y la de Wechsler son las más usadas y
difundidas. Su relevancia fue tan grande que los primeros tests específicamente crea-
dos para evaluar el lenguaje han sufrido una importante influencia de ellas.
v1.1. Illinois test of psycholinguistic ability (ITPA) [Prueba Mlino1s

de id psicolingúísticas] de Kirk, McCarthy y Kirk (1968)
Se trata de uno de los tests de lenguaje más conocido y usado. Su primer autor,
Kirk, ha sido uno de los responsables de la puesta en marcha del programa Heads-
tart en Estados Unidos, el cual supuso la inversión más ambiciosa y dilatada en

programas de prevención de problemas de aprendizaje en niños de clases sociales
deprimidas. La evaluación fue un elemento esencial del programa, y como el len-
guaje es fundamental en los rendimientos escolares, el ITPA comenzó a usarse mast-
vamente. Tiene formas experimentales anteriores, pero la definitiva apareció en
1968. La prueba fue adaptada por sus autores al castellano para hispanoparlantes
con las variaciones pertinentes a las diferencias lingúlísticas y culturales entre el in-
glés y el castellano. Los países que colaboraron en su confección han sido Chile,
Puerto Rico, México, Colombia y Perú (Von Isser y Kirk, 1980). Existe también
una adaptación especial para población española, en donde se corrigen los modis-
mos hispanoamericanos (Ballesteros y Cordero, 1984, 1989). El ITPA se basa en los
constructos teóricos de Osgood y en el modelo clínico de Wepman; el proceso audi-
tivo es considerado como pieza fundamental. La pretensión de la prueba es la eva-
luación de problemas del lenguaje para la intervención y evaluación de su eficacia.
De hecho, la obra Disfunción del aprendizaje psicolingiístico: diagnosis y trata-
miento (Kirk y Kirk, 1976) ejemplifica la pretensión última del instrumento. Existe
también la adaptación española de este programa (Lugo, 1980). La prueba pretende
un diagnóstico individual aislando las áreas de dificultad o competencia de cada su-
jeto y ello desde un modelo clínico orientado al tratamiento, pero en base a funcio-
nes exclusivamente psicológicas sin componentes orgánicos. El esquema de la
composición de los distintos subtests que componen el /7PA es muy simple y se
superpone a su modelo clínico.
El proceso receptivo se evalúa mediante estímulos auditivos y visuales, el expre-
sivo mediante respuestas verbales o motoras y el proceso de organización a través de
la integración de la estimulación con otros procesos cognitivos como memoria o
asociación. Además, existen dos niveles de exploración: el automático, que se ocupa
de las rutinas del habla, y el representativo, que se refiere a la dimensión conceptual,
simbólica y semántica del lenguaje. Por otra parte, existen dos canales posibles: el
auditivo-vocal y el visomotor.
La prueba consta de diez subpruebas: comprensión auditiva, asociación auditiva,
fluidez verbal, integración auditiva, memoria secuencial auditiva, comprensión vi-
sual, asociación visual, expresión motora, integración visual y memoria secuencial
visomotora. Se trata de un test de aplicación individual con material gráfico de apo-
yo. El protocolo de respuesta facilita la aplicación de la prueba y su corrección pos-
terior. La puntuación es el número de respuestas correctas.
Ejemplo de asociación auditiva (analogías):
— El papá es grande. El niño es

— Los pescados van por el agua. Los pájaros van por
Ejemplo de integración auditiva (completar palabras):
Después de una introducción de la misma actividad utilizando dibujos se le dice al

niño: «Voy a decirte parte de una palabra y quiero que tú me digas toda la palabra.
Ahora escucha y dime la palabra que estoy diciendo: Muñe _, Glesia, Manza _ ».
751
1d normalización de la adaptación hispanoamericana está hecha a partir de una

muestra de 436 niños de 3 a 9 años. Las puntuaciones típicas que se proporcionan
son estaninas y existen distribuciones diferentes para cada nivel de edad en cada uno
de los subtests. A partir de ellas puede obtenerse un perfil de habilidades.
En los estudios sobre las características picométricas del 17PA, la fiabilidad test-
retest alcanza un valor entre 0,21 y 0,87 según distintos tiempos de intervalo; la vali-
dez de constructo alcanza valores moderados y la validez predictiva es muy irregular
en función de datos provenientes de distintas investigaciones (Paraeskepoulus y
Kirk, 1969). En la adaptación española se han realizado algunos cambios: el conteni-
do de la subprueba expresión verbal, un test visomotor en lugar de memoria secuen-
cial, la metodología de evaluación de comprensión auditiva, y una amplia adaptación
de las subpruebas de integración gramatical y comprensión auditiva (Ballesteros,
1983, 1986). Este test ha sido considerado por muchos no como una prueba verbal
propiamente dicha, sino como una prueba de desarrollo cognitivo, puesto que en
muchos de sus ítems se requiere del sujeto una actividad de razonamiento o memo-
rización más que una competencia lingúística. Así, se han hecho múltiples críticas,
las más importantes se centran en denunciar que evalúa fundamentalmente procesos
cognitivos, habilidad para la lectura y metalenguaje (Van Kleeck y Richardson,
1990).
v.12. Reynell developmental language scales (RDLS) [Escalas para evaluar

el desarrollo del lenguaje de Reynell] (Reynell, 1977)
Esta prueba evalúa la habilidad para usar y comprender los símbolos verbales con el
objetivo de pensar y comunicarse. Es aplicable a niños de 18 meses a 4 años y medio.
Está compuesta por tres escalas: lenguaje expresivo, comprensión verbal A y com-
prensión verbal B. La escala de lenguaje expresivo evalúa a su vez estructura del len-
guaje, vocabulario y contenido. La escala A se aplica en todos los casos en los que los
niños puedan utilizar las manos y está compuesta de 67 ítems repartidos en diez sec-
ciones; cada una de ellas consta de un número diferente de ítems. La escala B está
pensada para niños con impedimentos motores y se compone de los siete primeros
ítems de la escala A y una remodelación y simplificación de los restantes. Para la
cumplimentación de los primeros ítems se puede recabar información de las madres
aunque los niños tengan que ejecutar acciones corroboradoras. El material de los re-
activos está compuesto por objetos tridimensionales, láminas y enunciados verbales.
La corrección de la prueba se hace adjudicando un punto a cada ítem bien contesta-
do o en algunos casos de 0-2 y en otros de 1-5; hay normas que puntualizan y deter-
minan los matices de la calificación. Las puntuaciones directas pueden transformarse
en centiles en cada nivel de edad. La fiabilidad de la prueba obtenida mediante con-
sistencia interna es de 0,82 en la versión inglesa. La adaptación española de la escala
(Alonso Tapia y González Alonso, 1988) ha conservado la estructura de la prueba
con los cambios mínimos que permiten la eficacia de la evaluación, centrándose fun-
damentalmente en la subescala de lenguaje expresivo. Algunos dibujos como el de
ventana tienen dificultades de reconocimiento en niños españoles. La fiabilidad de la
adaptación española hallada mediante el método de las dos mitades es de 0,98.
v.13. El Bankson' language screening test [Test de Bankson

para selección del lenguaje] (Bankson, 1977)
Como su nombre indica, el objetivo de esta prueba es discriminar con rapidez suje-
tos con problemas de desarrollo del lenguaje. Evalúa forma, contenido y uso del len-
guaje, además de discriminación auditiva y visual, tanto por el canal comprensivo
como expresivo. Es aplicable a niños con edades entre 4 y 8 años. Los subtests de la
prueba para la evaluación de la semántica son: partes del cuerpo, objetos comunes,
nombres de acciones, categorías, funciones, mostración, adjetivación y opuestos. La
evaluación de la forma se aborda mediante los subtests: formas pronominales, for-
mas verbales, uso de plurales y sintaxis; este último a su vez evalúa la concordancia
verbo-sujeto y capacidad de repetición y discriminación de oraciones con compleji-
dad estructural. En cuanto a la evaluación de la percepción visual, se hace mediante
emparejamiento incluyente o excluyente de dibujos, y la percepción auditiva me-
diante memoria auditiva y retención de conceptos básicos de una historieta y dis-
criminación de dibujos por su sonido básico. La fiabilidad test-retest con intervalo
de una semana es de 0,96; la validez concurrente con el subtest de vocabulario del
Boehm es de 0,82. Existe una forma española de la prueba (Forns y cols., 1987).
v.1.4. Prueba de lenguaje oral de Navarra (PLON) (Aguinaga y cols., 1988)

Esta prueba, construida en España, asume las estructuras que recomienda la psico-
lingúística, puesto que evalúa la forma, contenido y uso del lenguaje dentro del mar-
co teórico de Bloom y Lahey (1978). Pretende establecer los niveles de dominio del
lenguaje oral de los niños normales para la adecuación de los niveles pedagógicos de
cada grupo y la detección de problemas que puedan interferir más tarde en el apren-
dizaje escolar. Es aplicable a niños de 4 a 6 años. Para la evaluación de la forma se de-
limitan dos subpruebas: fonología y morfología-sintaxis. La tarea que se propone
para la evaluación fonológica es la de repetición de palabras y denominación de imá-
genes (siguiendo el instrumento de Bosch). Para la evaluación de la morfología y sin-
taxis se usa la imitación de estructuras sintácticas, el completamiento de enunciados
incompletos y la producción verbal ante imágenes. Para la evaluación del contenido
se explora el dominio de la semántica mediante tareas que implican la comprensión,
tales como identificación, realización de órdenes, categorización, búsqueda de
opuestos, explicitación de funciones, etc. Para la evaluación del uso se analizan las
funciones de lenguaje, aunque ésta es una parte que sus autores consideran inconclu-
sa y con necesidad de remodelación. La puntuación se obtiene mediante recuento de
las respuestas correctas; cada subtest tiene su propia escala. Las puntuaciones direc-
tas pueden transformarse en centiles en cada nivel de edad. La fiabilidad de la prueba
mediante el método de las dos mitades oscila entre 0,24 y 0,86 según subpruebas y
edades; los índices más bajos, como cabría esperar, corresponden a las subpruebas de
fonología en cuatro años.
753
v2. Pruebas específicas

Las pruebas que acabamos de describir exploran distintos aspectos y funciones del
lenguaje; las que vamos a presentar ahora, las específicas, atienden solamente a un
elemento lingúístico y focalizan en él la evaluación. Se usan en las etapas posteriores
del proceso de evaluación, cuando ya se ha localizado un problema en las etapas pre-
vias de evaluación global y se pretende ahora lograr una precisión sobre un aspecto
determinado, siguiendo lo que se ha venido llamando el «embudo diagnóstico»
(Cone, 1981) que organiza la exploración en un orden de extensión decreciente a
medida que las hipótesis generadas en las exploraciones más amplias previas van
configurando el tipo de problema y permitiendo una focalización de la evaluación.
Las pruebas en castellano pertenecientes a este apartado son escasas; por ello, inclui-
remos algunas de las más importantes en otros idiomas.
v2.1. Peabody picture vocabulary test-R [Test de vocabulario en imágenes

Peabody] de Dunn (1959, 1981)
Es una de las pruebas más conocidas y de uso más generalizado. Se centra específica
mente en la evaluación del lenguaje comprensivo mediante la recepción funcional de
las palabras presentadas verbalmente por el evaluador apoyadas por imágenes. Su
primera forma es del año 1959 y ha tenido una revisión importante en 1981. Los
objetivos que se plantea son la localización precoz de problemas de lenguaje, la eva-
luación del rendimiento escolar y, ya en el campo clínico, el diagnóstico y segui-
miento de la eficacia de las intervenciones. Es aplicable a sujetos normales y retrasa-
dos de dos años y medio a 18 años de edad, pero no se aconseja su uso en sujetos con
mala discriminación auditiva o visual. Su duración aproximada es de 15 minutos. Se
compone de 150 láminas con tres imágenes para elección múltiple y cinco láminas de
ejemplo. La tarea consiste en seleccionar y señalar la imagen correspondiente a un
único reactivo verbal que emite el evaluador ante una lámina que presenta varios ob-
jetos o acciones. La respuesta es gestual, lo que hace innecesario que el sujeto posea
lenguaje verbal o escrito para poder contestar a los reactivos. La dificultad de las
imágenes es gradual, por lo que la prueba puede iniciarse en distintos niveles de difi-
cultad. Para la estimación del nivel de comienzo existen unas tablas basadas en la
edad cronológica y en las respuestas correctas que determinan el intervalo crítico de
cada sujeto; este intervalo es la zona del test donde los reactivos resultan más discri-
minativos para cada individuo (el elemento inferior del intervalo se llama elemento
base y el superior elemento techo). La corrección de la prueba se hace dando como
positivos todos los elementos previos al elemento base y negativos todos los ítems
por encima del elemento techo, por tanto la puntuación directa se obtiene restando
el número de errores a la puntuación máxima de cada elemento techo. La hoja de
respuesta facilita la corrección. Las puntuaciones directas se pueden transformar en
puntuaciones deciles, centiles y estaninas; también se proporciona un baremo evolu-
tivo que permite obtener la edad equivalente de un sujeto en función de las puntua-
ciones obtenidas en la prueba.
La fiabilidad test-retest con un intervalo de dos semanas es de 0,77 y la validez

concurrente con un test de vocabulario e inteligencia es adecuada (Robertson y Eisen-
berg, 1981). Existe una adaptación española de Muñoz (1969) realizada sobre laver-
sión original de 1959, y otras sobre la revisión de 1981. Si algunas imágenes tienen
dificultades en la presentación española se recomienda su eliminación; los reactivos
suprimidos se consideran bien contestados y en ningún caso deben ser sustituidos.
En la versión española la fiabilidad por el método de las dos mitades alcanza un valor
de 0,92 y la validez concurrente con el Test de rendimiento de California es de 0,50
(Neira-Meléndez, 1979), mientras que con tests equivalentes como el Fullrange vo-
cabulary test y el Van Alstyne picture vocabulary test alcanza una correlación de
0,86; las correlaciones son más moderadas con los tests de inteligencia (0,62 con la
escala de Wechsler y 0,72 con la escala Stanford-Binet).
v2.2. Inventario de articulación (Melgar de González, 1976)

Es una prueba fonológica que consta de 35 láminas; cada una de ellas contiene 56 di-
bujos en blanco y negro, correspondientes a sustantivos de uso común en el lenguaje
infantil del habla en España e Hispanoamérica. En ellos se evalúan sonidos del idio-
ma castellano en posición inicial, media y final; contiene 17 sonidos consonantes,
12 de mezcla de consonantes y 6 diptongos. Es aplicable a niños con edades com-
prendidas entre 3 y 7 años. La evaluación se realiza contabilizando los aciertos y el
tipo de errores en una hoja de registro que facilita la obtención de la puntuación.
Proporciona una tabla de adquisición fonética a los distintos niveles de edad y los
porcentajes y tipos de errores evolutivos más frecuentes.
v23. Developmental assessment of Spanish grammar (DASG) [Evaluación

del desarrollo de la gramática española] de Toronto (1976)
Es una prueba creada para evaluar las estructuras sintácticas del idioma materno de
niños mexicanos y portorriqueños con el propósito de pronosticar el aprendizaje
del inglés. Esta prueba consta de estímulos verbales y visuales. Es aplicable a niños
de 3 a7 años. La evaluación se realiza analizando 50 frases en su estructura y elemen-
tos. Proporciona unas puntuaciones directas transformables en percentiles para cada
nivel de edad. Existe una traducción al castellano de esta prueba (Serra, 1976). Se ha
criticado el peso que las estructuras lingúísticas del inglés tienen en esta prueba.
V24. ar assessment, remediation and screening procedure (LARSP)

[Evaluación del lenguaje y procedimiento de selección
y tratamiento] de Crystal (1979)
Se trata de una prueba específica para el análisis de las estructuras sintácticas. Es aplica-
ble a niños con edades entre nueve meses y seis años. Su aplicación tiene un aprendizaje
costoso, pero existe un perfil informatizado que facilita la tarea. Permite la obtención de
755
esquemas sintácticos del sujeto que efectúa la prueba; también proporciona una
escala
evolutiva media que permite situar a un sujeto concreto en la escala de desarrollo que
le
corresponde. Existe una adaptación al español de esta prueba (Serra, 1979).
v25. The assessment of aphasia and related disorders [Test de vocabulario

de Boston] de Kaplan, Goodglass y Weintraub (1983)
El Test de vocabulario de Boston es una prueba habitual para la evaluación del len-
guaje expresivo y semántico de sujetos normales y afásicos. Es aplicable a partir de
los cinco años y medio. El material para la evaluación del lenguaje expresivo consta
de 60 estímulos visuales; cada lámina presenta un objeto en orden de dificultad cre-
ciente. La tarea que se le demanda al sujeto es la denominación de objetos. El punto
de comienzo de la prueba está determinado por la edad o por los fracasos. Se pueden
dar pistas semánticas y fonéticas cuando el sujeto fracasa en su respuesta. Se registra
la contestación, el tiempo de latencia, si la respuesta es errónea, el número de pistas
semánticas y fonéticas y, por último, el número de respuestas correctas tras la ayuda.
La hoja de registro facilita la obtención de la puntuación. El estudio de la adaptación
española de la prueba de García-Albea, Sánchez Bernardos y Del Viso Pabón (1986)
proporciona las puntuaciones medias, las desviaciones típicas y los rangos de acier-
tos obtenidos en los distintos niveles de edad desde los 5 años y medio a los 59 años.
v2.6. Prueba para la evaluación del desarrollo fonológico en niños

(Bosch, 1984)
El objetivo de la prueba es la selección de niños con retraso en el desarrollo fonoló-
gico. Es aplicable a niños de 3 a 7 años. El material incluye una lista de 32 términos
presentados como dibujos en 16 láminas; en ellos se incluyen prácticamente todas las
combinaciones fonéticas del castellano, se analizan también grupos consonánticos y
diptongos, lo que hace un total de 63 ítems. La tarea a realizar es doble: denomina-
ción de los objetos percibidos y repetición por imitación de las mismas palabras emi-
tidas por el evaluador. La evaluación de la prueba se hace mediante análisis y recuen-
to de sonidos correctamente emitidos, omisiones, sustituciones, distorsiones y
coarticulaciones. Se puede obtener un perfil fonológico que proporciona los por-
centajes normativos de dominio de los distintos sonidos y unos indicadores de pro-
blemas en cada nivel de edad. Esta prueba posee también una adaptación a la lengua
catalana (Bosch, 1987).
Hay otras muchas pruebas de las que no existe una adaptación a muestras espa-
ñolas; entre ellas, vamos a enumerar las más conocidas. El Sequenced inventory of
communication development revised (SICD) [Inventario secuencializado del de-
sarrollo de la comunicación] de Hedrick, Prather y Tobin (1984) es muy utilizado
para evaluar respuestas a objetos reales e imágenes del niño desde los 4 meses a los
4 años; recoge también información de los padres en los primeros rangos de edad y
permite obtener mediante puntuaciones estandarizadas la edad comunicativ a del
edad. 1-1
niño, existiendo muy pocas pruebas de lenguaje que evalúen este rango de
Test for auditory comprehension of language revised (TACL-R) [Test de comprensión

auditiva del lenguaje] de Carrow-Woolfolk (1970, 1985) se aplica a niños de 3 a 12
años; evalúa el lenguaje por muy diferentes métodos: imitación de frases, órdenes de
tareas y análisis del lenguaje espontáneo. La Bracken basic concept scale [Escala de
conceptos básicos de Bracken] (Bracken, 1984) evalúa contextualmente el léxico. El
Inventories ofyoung children [Inventario para niños pequeños] de Stoel y Gammon
(1985) es aplicable a sujetos de 15 a 24 meses para la evaluación del repertorio de so-
nidos que el niño emite en la posición inicial o final de la emisión. El Early words
[Primeras palabras] de Winitz e Irvin (1958) evalúa palabras y sílabas desde los 13 a
18 meses de edad. El Articulation test [Test de articulación] de Prather, Hedrick y
Kern (1975) evalúa la precisión de la articulación. Para la entonación o prosodia del
lenguaje hay pocas pruebas formales; un ejemplo de ellas es la de Crystal (1982).
Hay otros instrumentos específicos para la evaluación de la pragmática o uso del
lenguaje, como por ejemplo la Interpersonal language skills assessment [Evaluación
de la capacidad de lenguaje interpersonal] de Blagden y McConnell (1985) que anali-
za el lenguaje espontáneo entre los 8 y 14 años.
VI. PRUEBAS NO ESTANDARIZADAS
Se trata de pruebas de evaluación del lenguaje que pretenden una cierta estructura-
ción de los reactivos de elicitación del mismo, pero no están sujetas a una objetividad
estricta de presentación ni de evaluación. Se van a exponer aquí algunas de estas
pruebas, aunque no todas tienen adaptación española.
vL1. «Análisis en la interacción verbal profesor-alumno» (Sanjuán,

Fernández y Marteles, 1974)
Se trata de la categorización de la interacción profesor-alumno en 16 categorías del
código de Flanders. El análisis y recuento de las posibles formas de comunicación se
pueden hacer directamente o sobre grabaciones; la puntuación se obtiene a partir del
recuento de porcentajes en las distintas categorías.
vi2. «Bellugi interrogation test» /Test de interrogación de Bellug:]

(Bellugz, 1978)
Pretende la elicitación del lenguaje interrogativo para evaluar los tiempos del verbo
variando los objetos, nombres y situaciones para conseguir formas interrogativas,
negativas y reflexivas. La estrategia utilizada son preguntas que se sugieren al niño
para que a su vez las haga a una muñeca:
— «Pregúntale a la muñeca qué quiere hacer.»

— «¿Dónde está algo?»
757
— «¿Cuándo hará algo?»

— «¿Cómo conseguir algo?»
vI3. «Word order production: An elicitation task» /Orden de

producción de palabras: tareas de elicitación] de Capman (1981)
Es una prueba para la elicitación de verbos en niños con edades entre 20-32 meses. El
material consiste en un coche, un camión, un barco de vela, un niño y niña de jugue-
te articulados y un perro. El niño observa las acciones que realiza el experimentador
con los juguetes y contesta a las preguntas siguientes:
— «¿Qué está pasando?»
— «¿Qué pasa?»
— «¿Qué estoy haciendo?»
La evaluación se hace mediante recuento y análisis del lenguaje elicitado y es de

carácter individual, sin normalización.
vI4. <«Visually uedienguass cards (VCLC)» [Método visual

para estimulación del lenguaje] de Foster y cols. (1991)
Es una prueba concebida para la elicitación del lenguaje oral mediante dibujos; su
objetivo es el apoyo de ejercicios en la recuperación del lenguaje, pero puede ser usa-
da para la elicitación del lenguaje en situación de evaluación. El material visual se es-
tructura en cuatro series. La serie 1 explora conocimiento de sustantivos y su catego-
rización (personas, animales, objetos del entorno, medios de transporte, lugares
donde resguardarse, habitaciones y objetos domésticos, ropa, alimentos, juguetes,
partes del cuerpo y objetos sonoros) presentados mediante 295 reactivos visuales. La
serie 2 tiene 267 reactivos que investigan la estructuración sintáctica de dos elemen-
tos: sustantivos, verbos, adjetivos, pronombres, etc. La serie 3 evalúa mediante 188
reactivos las frases de tres elementos en los que se incluye una acción. La serie
4 consta de 253 dibujos para analizar las estructuras sintácticas de cuatro elementos.
La serie 5 consta de 148 dibujos que evalúan distintos aspectos gramaticales como el
uso de proposiciones, formas reflexiva, plural, negación, etc. Tiene una fase de apli-
cación para el lenguaje comprensivo en la que el niño señala los objetos nombrados
por el evaluador, y otra fase para el expresivo en la que el niño debe enunciar el nom-
bre de los objetos señalados. La adaptación española de De la Cruz y Cordero
(1991) ha eliminado algunas de las imágenes por encontrarlas poco habituales en
nuestro medio y las que presentan dificultad están señaladas por un asterisco. La co-
rección se realiza adjudicando la calificación de suficiente e insuficiente a cada una
de las respuestas emitidas por el sujeto haciendo constar lafecha en la que se obtu-
vieron, lo que proporciona un perfil individual evolutivo si se sobreponen sucesivas
aplicaciones.
vis. «The Stycar language test» /Test de lenguaje Stycar] de Sheridan

(1975, 1976)
Se incluye esta prueba en este apartado, porque no proporciona unos baremos que
permitan comparar el nivel de un niño con el de los demás, aunque su estructuración
hace que algunos autores prefieran incluirla dentro de las pruebas objetivas. Se ha
concebido para la evaluación del lenguaje de niños retrasados y se focaliza en los pri-
meros niveles de lenguaje tanto verbal como preverbal. Investiga el lenguaje receptivo-
comprensivo y expresivo mediante las siguientes actividades:
Identificación gestual o verbal de objetos y dibujos comunes.

Conocimiento verbal o gestual de la función de los objetos.
Repetición de palabras y frases.
Discriminación auditiva.
Categorización de objetos.
PE
5
OSA Realización de órdenes complejas.
El test consta de tres partes: test de objetos comunes, con objetos de uso cotidia-
no aplicable a niños de 11 a 20 meses; test de juguetes en miniatura, que permite ac-
ceder a objetos no domésticos como coches, aviones, etc., aplicable desde los 21 me-
ses a los 5 años y medio; y test del libro de los dibujos, que permite extender el
campo de los reactivos a situaciones complejas (escenas, secuencias, acciones, histo-
rias...) y es aplicable a niños de 3-6 años. La corrección de la prueba se hace recon-
tando los aciertos, con los que se elabora para cada sujeto un perfil de desarrollo del
lenguaje. Existe una traducción de esta prueba al español (MEPSA, 1984).
vLó. Otras metodologías no estandarizadas

Entre la evaluación no estandarizada podríamos considerar también el análisis fun-
cional aplicado a la conducta lingúística; éste pretende establecer los elementos am-
bientales antecedentes y consiguientes a la conducta comunicativa de un sujeto para
obtener datos que permitan la intervención. Los elementos que se revelan como an-
tecedentes de la aparición del lenguaje se utilizarán como elicitadores y los consi-
guientes como reforzadores. Howlin (1980) proporciona los elementos adecuados
para este tipo de análisis del lenguaje que son similares al análisis funcional de cual-
quier otra conducta (véase el capítulo de O'Brien y Haynes en este mismo manual).
También se aconseja, junto al análisis funcional, la utilización de otros métodos
complementarios de evaluación del lenguaje.
Como se ha ido describiendo, la evaluación del lenguaje en su forma verbal se ha
realizado a través de distintas vías. La preferencia de unas u otras técnicas suele estar
asociada a la formación del evaluador. Los partidarios de las pruebas estandarizadas
defienden la firmeza de los datos obtenidos en la aplicación de muestras extensas; los
partidarios del uso de pruebas estructuradas, pero no normativas, sostienen que la
obtención de datos es más rica puesto que los diferentes estímulos producen en el
759
niño una facilitación de la aparición del lenguaje y al mismo tiempo conserva el

ca-
rácter individual de la evaluación; por el contrario, los partidarios de la observación
sin ningún otro tipo de pruebas sostienen que la estructuración resta espontaneidad
a los datos. En este microcosmos se reproduce la vieja polémica entre el método
idiográfico y el nomotético.
VII. EVALUACIÓN DEL LENGUAJE ESCRITO
El lenguaje hablado precede al escrito, pero no lo implica; durante siglos la mayor

parte de la gente hablaba con fluidez y agudeza, pero no podía leer ni escribir. La de-
claración de la escolaridad obligatoria a comienzos de este siglo tuvo consecuencias
sociales importantísimas y varias de ellas afectaron a la psicología; entre las más im-
portantes se cuentan la evaluación de la inteligencia y la evaluación y estudio de las
dificultades del aprendizaje. En este último caso, jugaba un papel importantísimo el
dominio del lenguaje y del lenguaje escrito. Antes de esta época, los niños que reci-
bían una educación letrada suponían un sesgo social e intelectual de la población,
por ello los problemas de aprendizaje, y del control y uso del lenguaje en las activi-
dades escolares, era muy minoritario. Pero a partir de principios del presente siglo, el
panorama de las aulas cambió y los estudios sobre los problemas de dificultades de
aprendizaje, y más específicamente sobre problemas de aprendizaje de la lectura, co-
menzaron a proliferar y con ellos también las técnicas de su evaluación. Los proble-
mas de lectura comenzaron a estudiarse muy precozmente en el marco médico y
siempre asociados con alteraciones físicas que interferían con la actividad lectora; las
afasias y alexias fueron el punto de partida. Por ejemplo, el término dislexia era el
nombre que se daba a las perturbaciones del lenguaje escrito sobrevenidas a causa de
lesiones cerebrales. El término fue acuñado por Stuttgar a finales del siglo pasado. El
tema de la dislexia ha sido uno de los caballos de batalla en la investigación del len-
guaje escrito y de su evaluación desde un punto de vista psicológico. La corriente
que considera la dislexia como una perturbación con base orgánica no se ha abando-
nado del todo como muestran los trabajos de Luria (1966) y de otros expertos en el
tema. Sin embargo, muy precozmente se consideró que la dislexia sólo era tal si se
daba en niños intelectualmente normales, sin daños cerebrales ni neurológicos,
como sostiene Hishelwood a comienzos de siglo y otros muchos autores después de
él; Critchley (1970) añadió la condición de pertenecer a una clase sociocultural sin
déficit. Así, poco a poco, se recuperó el tema de las dificultades de lectura para la psi-
cología y se comenzó a estudiar en la población normal. La investigación se centró
en los signos precoces de dificultades (madurez prelectora) o en dominio de la habi-
lidad (madurez lectora). Obras como las de Lourenío Filho (1928), Schonell (1946),
Gray (1957) o Ajuriaguerra, Auzias y Denner (1964) y otros muchos marcaron unas
directrices muy fecundas de investigación. |
La habilidad lectora es probablemente una de las conductas más evaluada, tanto
en sí misma como en las habilidades básicas previas. Los signos de madurez prelec-
tora no siempre han resultado ser buenos predictores y por ello se tiende cada vez
más a una evaluación específica del lenguaje escrito. Los marcos teóricos de esta eva-
luación son variados, pero hay una tendencia a asumir puntos de vista integradores
que consideran la lectura y la escritura como un complejo sistema de elementos es-
tructurados en una función dinámica. Estos elementos serían los estímulos visuales,
la actividad cerebral asociada a la percepción e intelección de la significación de los
signos (codificación y decodificación) y la actividad motora; también se analizan ele-
mentos que se han relacionado etiológicamente con los problemas lectores tales
como la dominancia lateral, el control del equilibrio, el control binocular, el control
ocular motor, la discriminación perceptiva, las destrezas auditivas y visuales, las es-
trategias lectoras, los procesos cognitivos complejos como categorización, recupera-
ción de información, etc. Todos estos elementos colaboran en la conducta lectora,
que consiste fundamentalmente en lograr que unos estímulos visuales se conviertan
en un estímulo discriminativo de determinados sonidos que pertenecen a un código
lingúístico y, por tanto, permiten la significación y la comunicación. La evaluación
del lenguaje escrito asume la evaluación de todos estos elementos.
vii. Recomendaciones para la evaluación del lenguaje escrito

Existe una serie de principios que los expertos consideran necesarios para una buena
evaluación del lenguaje escrito (Stratton y Crouthers, 1990):
La evaluación ha de ser continua.

Debe usarse como guía para un programa educativo.
DADebe utilizar una metodología e instrumentación variada (tests estandariza-
dos, grabaciones, inventarios, información de diversos profesionales...).
d. Debe proporcionar un diagnóstico global.
e. Ha derealizarse en varios contextos.
Estas recomendaciones responden a la filosofía de que cualquier evaluación en

este campo debe ir dirigida a la intervención y que su eficacia está ligada a la calidad y
pluralidad de instrumentos y contextos.
vi2. Métodos de evaluación del lenguaje escrito

La evaluación del lenguaje escrito, de forma paralela a lo que ya hemos visto en el
lenguaje oral, puede hacerse fundamentalmente a través de tres metodologías bási-
cas: observación directa e individualizada, pruebas estandarizadas y pruebas estruc-
turadas. La primera se realiza mediante la observación de la lectura y escritura de un
niño a través de registros minuciosos sobre sus tipos de errores, pausas, omisiones,
velocidad, prosodia y comprensión de lo leído, orientados fundamentalmente a la
intervención individual. La observación individual en mayor o menor grado utiliza
los criterios de observación que también están contenidos en las pruebas estructura-
das y/o estandarizadas.
761
vIt2.1. Evaluación del lenguaje escrito mediante pruebas estandarizadas

Las pruebas estandarizadas permiten establecer con criterios objetivos la compara-
ción de un niño con otros pertenecientes a su nivel de edad. La mayor parte de ellas
pretende, desde muy diversos campos teóricos, evaluar los procesos básicos subya-
centes a la lectura que podrían englobarse en tres grandes categorías: discriminación
visual y aprendizaje de la correspondencia grafema-fonema (exactitud), velocidad de
asociación entre grafemas y fonemas (velocidad) y comprensión conceptual del con-
tenido textual (comprensión) (González Portal, 1984a). Este tipo de pruebas debe
reunir las características de objetividad y precisión que son requisito básico y carac-
terístico de este tipo de evaluación. En la elección de las técnicas específicas se deben
tener en cuenta los siguientes requisitos (Hayward, 1968):
a. Que el test evalúe las habilidades que sean útiles para proporcionar pistas
para una posible intervención.
b. Que la validez sea alta en aplicación individual (0,90).
c. Que la correlación entre subescalas sea suficientemente baja (0,65).
La producción de instrumentos en este campo es inabarcable. Gray en 1957 con-

tabilizaba 70 pruebas de lectura; hoy sería casi imposible su recuento. Expondremos
aquí sólo algunas de las más conocidas y nos centraremos en las que pueden encon-
trarse en lengua española, tanto adaptaciones de otros idiomas como la producción
propia que ha sido bastante copiosa comparada con otros campos desde los años
ochenta.
«Teste del ABC de Lourenío Filho» (Lourenío Filho, 1928)
Ha sido uno de los primeros tests de evaluación de lectura e influyó en la construc-

ción de los siguientes. Se elaboró en Brasil y se extendió por toda Hispanoamérica.
La proximidad lingúística facilitó su traducción al castellano. La versión argentina es
de 1937. No se centra en el análisis de la actividad lectora, sino en la evaluación de las
habilidades relacionadas con la madurez para la lectura: coordinación visomotora,
resistencia a la inversión en la copia de figuras, memorización visual, coordinación
auditivomotora, capacidad de pronunciación, resistencia a la ecolalia, memorización
auditiva, índice de fatigabilidad, índice de atención dirigida y vocabulario de com-
prensión general. Estas diez habilidades se evalúan mediante ocho actividades: co-
piar tres figuras, memorizar objetos presentados visualmente, reproducir figuras di-
bujadas en el aire, repetición de una narración, repetición de términos presentados
verbalmente, repetición de palabras de difícil pronunciación, recorte de líneas curvas
cuadradas y poner puntos en una cuadrícula. Estas actividades están hoy presentes
en todos los currículos pedagógicos. e 7
La prueba es de aplicación individual y está orientada a la intervenció n. La dura-
ción aproximada de la aplicación es de ocho minutos y se utiliza en niños con edades
entre 6 y 14 años. La calificación se realiza mediante una escala de tipo Likert entre 0-3
para cada una de las actividades y con normas específicas para su calificación . La pun-
tuación global se obtiene a partir de la suma de los puntos de cada prueba. Las pun-
tuaciones permiten la obtención de un perfil individual o un perfil colectivo útiles
para agrupar sujetos en función de sus distintas habilidades. La fiabilidad de la prueba
mediante test-retest es adecuada. La validez predictiva obtenida a través de su correla-
ción con calificaciones escolares es de 0,75. El análisis factorial del ABC ha proporcio-
nado tres factores: X (espacial), Y (velocidad) y Z (memoria). La validez concurrente
con el Reversal es sólo significativa (0,24) en velocidad lectora e irrelevante en todas
las demás subpruebas; con el Test de rendimiento lector, la correlación es más alta; sin
embargo, su validez predictiva presenta problemas (González Portal, 1984).
«Batería de madurez lectora de Inizan» (Inizan, 1976)
Es una prueba de carácter preventivo que parte del presupuesto de una habilidad es-
pecífica y evalúa por tanto lo que se considera prerrequisitos para la lectura; preten-
de determinar el momento adecuado para comenzar el aprendizaje de la lectura y
evitar desajustes que originan las dificultades. Consta de dos partes: batería predicti-
va, muy próxima a la de Lourenío Filho, y batería de lectura aplicable a niños que ya
han iniciado el aprendizaje. La primera explora organización del espacio, lenguaje y
organización temporal; la segunda, lectura de palabras familiares, dictado de pala-
bras familiares, lectura de palabras extrañas y comprensión de lectura silenciosa. Es
aplicable a niños de 5-7 años y su validez predictiva es de 0,83.
«Pruebas de lectura. Niveles 1 y 2» (De la Cruz, 1980, 1988)
Es una prueba que basa su construcción en la atención de los elementos lingúísticos,

espacio-visuales y simbólicos implicados en la lectura. El Nivel 1 consta de tres par-
tes: comprensión auditiva, comprensión visual y discriminación visual. En las dos
primeras las tareas consisten en identificación de un dibujo cuyo nombre pronuncia
el evaluador y en la localización de letras o palabras escritas que lee el evaluador. Para
la evaluación de la discriminación visual la tarea a realizar es la identificación de le-
tras o palabras escritas con distinto tipo de letra. En el Nivel 2 las partes y tareas son
las mismas, pero difieren los reactivos presentados que se hacen más complejos. El
Nivel 1 es aplicable de forma individual o colectiva a niños de 5-6 años y el Nivel 2
de 7-8 años. En el primer caso el tiempo de aplicación es de 30 minutos y en el segun-
do 60. La puntuación directa es el número de aciertos que se transforman en centiles
en cada uno de los niveles. Es posible obtener un perfil individual o colectivo a partir
de las puntuaciones centiles. La fiabilidad de la prueba obtenida por el método de las
dos mitades oscila entre 0,73 y 0,98 según los distintos niveles; las correlaciones más
altas se obtienen en los niveles más bajos. La validez concurrente oscila entre 0,29 y
0,70; la correlación más alta se ha obtenido con aptitudes cognitivas y psicomotrici-
dad, y las más bajas con memoria.
«Reversal test» [Test Reversal] de Edfeldt (1955, 1975)
Este test parte de la consideración de la percepción como elemento primero y básico

del proceso. Consiste en la evaluación de la percepción espacial en función de las di-
763
mensiones derecha-izquierda. El “efecto de espejo”, problema lector frecuente en

disléxicos, alentó las investigaciones en esta dirección. La prueba ha tenido varias
ediciones desde su primera aparición en Estocolmo en 1955. Nos vamos a referir
aquí a la adaptación española de Villegas (1975) con varias ediciones. El objetivo de
la prueba es diagnosticar la madurez lectora y, por tanto, el momento Oportuno para
comenzar el aprendizaje de la lectura. La tarea a realizar consiste en el tachado de las
figuras que no son idénticas en 84 pares, donde el 50% son idénticas y el otro 50%
no; las diferencias pueden darse entre figuras iguales (en espejo vertical u horizontal)
o entre distintas en las que han cambiado pequeños detalles. Hay seis figuras de
ejemplos para familiarización con la tarea. El tiempo de realización es de 15 minutos.
La puntuación directa de la prueba se obtiene restando el número de errores de 84
(puntuación máxima posible). Esta puntuación se convierte en centiles. La puntua-
ción media de la muestra española para niños de 6 años es de 70 con una desviación
típica de 8,50. La validez criterial obtenida con la correlación de las puntuaciones en
la prueba y calificación de profesores es de 0,54; la fiabilidad obtenida mediante test-
retest es de 0,84, y de 0,94 con el método de las dos mitades; en ambos casos, se trata
de características psicométricas de la muestra francesa.
«Test de análisis de lectura y escritura TALE» (Toro y Cervera, 1980)
Se ha elaborado para la determinación de los niveles de lectura y escritura de niños

normales de 6 a 9 años de edad con el propósito de usarlo en la enseñanza, en la in-
vestigación y en la clínica. La prueba consta de dos partes diferenciadas: lectura y
escritura. En la primera se evalúa la lectura de letras, lectura de sílabas, lectura de
palabras, lectura de texto (nivel-I A y B, nivel 11, nivel III y nivel IV) y lectura silen-
ciosa de texto o comprensión (niveles 1, IL, III y IV). En la segunda se evalúa el co-
piado (en diferentes tipos de letra), dictado y escritura espontánea. Cada parte de
las distintas pruebas tiene un tiempo de realización normativo. La corrección de la
lectura tiene un carácter cuantitativo mediante el recuento del número de aciertos o
errores, y cualitativo (omisiones, vacilaciones, repeticiones, rectificaciones, sustitu-
ciones, rotaciones e inversiones). En la corrección de la escritura se tienen en cuen-
ta también aspectos cuantitativos y cualitativos valorando la grafía, la ortografía, la
sintaxis y el contenido expresivo con normas específicas para cada una de ellas. La
puntuación obtenida por un niño en cada parte y nivel se compara con la media y
desviación típica de la muestra normativa. Mediante el análisis de los promedios se
ofrece además una visión evolutiva del proceso del aprendizaje de la lectura y la es-
critura.
«Ortografía. O-2» (Seisdedos, 1980)
Es una prueba de dominio de la ortografía aplicable a niños de 10 años en adelante

con una duración de 10 minutos. Tiene unos objetivos eminentemente pedagógicos.
La tarea propuesta consiste en reconocer los errores ortográficos de 50 frases. La ca-
lificación se obtiene a partir del número total de aciertos quese transforma en pun-
tuaciones centiles. La validez de criterio de la prueba obtenida por su correlación
con las evaluaciones de profesores en lenguaje es de 0,58.
«Evaluación de la lengua castellana. Ciclo medio» (Fernández Pozar, 1983, 1988)
Se trata de una prueba pedagógica cuyo objetivo es la evaluación del rendimiento, a

pesar de que su contenido es de dominio de la forma del lenguaje. Está elaborada
para niños entre 8 y 10 años, y su administración puede ser individual y colectiva;
consta de dos formas, A y B, lo que facilita el seguimiento de los sujetos. Tiene prue-
bas de lectura, ortografía, vocabulario, redacción y gramática; cada una de ellas se
compone de diferentes subpruebas. La calificación de la prueba se hace asignando
puntos a cada reactivo según distintas instrucciones. Las puntuaciones obtenidas en
cada subprueba se transforman en típicas y a partir de ellas se puede obtener un per-
fil con una escala de 1-5. La fiabilidad de la prueba obtenida por el método de las dos
mitades es de 0,92 a 0,81 en función de las subpruebas. La validez de criterio entre las
puntuaciones de la prueba y las calificaciones de profesores alcanzó valores de 0,89 a
0,92 según distintos niveles escolares.
«Exploración de las dificultades individuales de lectura (EDIL)»

de González Portal (1989)
Esta prueba pretende una evaluación analítico-cualitativa para el establecimien-

to de programas de recuperación individualizados, enmarcándose en la teoría de
Staats, que concibe la actividad lectora como un proceso complejo que es la culmi-
nación de una serie de conductas simples básicas. Tiene la ventaja de haber sido ela-
borada para población española. Consta de tres escalas: exactitud lectora, com-
prensión lectora y velocidad lectora. El EDIL-1 (versión revisada de 1989) está
dirigido al primer nivel de Educación General Básica. La duración de la prueba es
discrecional. La exactitud lectora se evalúa mediante la discriminación de letras, la
construcción de sílabas y la discriminación de sonidos. La comprensión lectora se
evalúa a través de la asociación de imagen-palabra, la comprensión de órdenes es-
critas, la comprensión de frases y comprensión de un texto. Por su parte, la veloci-
dad lectora se determina a través de la cantidad de lectura de un texto en una uni-
dad de tiempo determinada. La prueba se acompaña de un material de presentación
de los estímulos visuales y unas hojas de respuesta donde el niño realiza las tareas
que se le demandan. La evaluación cualitativa tiene en cuenta aspectos como con-
fusión de letras, omisiones, rotaciones, adiciones, invenciones, titubeos, etc. La
exactitud de la lectura se centra en las observaciones hechas por el evaluador en las
etapas anteriores sobre comprensión lectora. En velocidad se pondera la entona-
ción, ritmo y pausas. La evaluación cuantitativa en exactitud se obtiene mediante el
registro del número de aciertos, en comprensión lectora por las observaciones po-
sitivas del evaluador y en velocidad según sea la resultante de dividir el número de
palabras leídas por dos. Los índices parciales de cada prueba se obtienen dividien-
do la puntuación obtenida por la puntuación máxima.
La fiabilidad de la prueba mediante test-retest con intervalo de diez días oscila
entre 0,91 y 0,97 según las escalas. La validez obtenida mediante las correlaciones en-
tre las puntuaciones EDIL y calificaciones de profesores está entre 0,52 y 0,71 en fun-
ción de las escalas (González Portal, 1984).
765
Dos pruebas estandarizadas de comprensión lectora (CLT) de Suárez-Yáñez

y Meara (1985)
Unliza como estrategia de evaluación la habilidad de completamiento de frases con

fuga de palabras dentro de la tradición de habla inglesa y de la metodología de traba-
jo de Anderson. Se ha construido para población española y es aplicable a sujetos de
11 a 14 años. El tiempo de aplicación es aproximadamente de una hora. Consta de
dos formas: la prueba A está compuesta por cuatro tipos diferentes de texto con 47
términos fugados; la prueba B sólo tiene un texto y 46 fugas. La puntuación de la
prueba se obtiene al contabilizar el número de aciertos en el completamiento de hue-
cos. El nivel de aciertos oscila entre el 20 y el 50% de los elementos. Las puntuacio-
nes directas se transforman en típicas en una escala con una media de 50 y una des-
viación típica de 10. La fiabilidad de la prueba se ha hallado mediante la correlación
entre las formas A y B, alcanzando un valor de 0,74. La validez concurrente con la
Prueba de comprensión lectora de Lázaro es de 0,45 para la forma A y de 0,52 para la
forma B (Suárez-Yáñez y Meara, 1985).
«Batería diagnóstica de madurez lectora (BADIMALE)» de Molina (1988)
Esta prueba tiene un marco teórico que subraya los aspectos neurológicos implica-
dos en la lectura; se señalan unos factores neuropsicológicos básicos para la madurez
lectora: estructuración espacial, estructuración rítmica, lenguaje oral (comprensivo y
expresivo) y lateralización. Se ha hecho una selección de pruebas ya existentes para
cubrir la evaluación de esos factores: organización perceptiva de Hilda Santucci
(OP), reproducción auditivo-manual de estructuras rítmicas de Mira-Stambak
(RER), seriación óculo-manual de estructuras rítmicas de Mira-Stambak (RER), con-
creción-abstracción lexical tomado del vocabulario del W7PPSI de Wechsler (CAL),
memoria auditivo-vocal tomado de la repetición de frases del WIPPS7 de Wechsler
(CAL), reconocimiento de diferencias espaciales entre dibujos semejantes tomado de
Horts (RDE) y orientación derecha-izquierda tomado de Piaget-Head en la adapta-
ción de Galifret Grajon (ODI). Está elaborado para niños entre 5 y 6 años de edad; la
aplicación es individual y la duración de unos 30 minutos. Cada reactivo tiene unas
normas de corrección para su calificación; a su vez, cada subprueba tiene una pun-
tuación directa que se convierte luego en estándar. La puntuación global se obtiene a
partir de la suma de las puntuaciones estándar de las subpruebas. El punto de corte
para hacer un buen pronóstico en el aprendizaje de la lectura lo ha estimado el autor
en 72 puntos, y el punto de corte de un mal pronóstico se estima en 49puntos; las
puntuaciones intermedias suponen dificultades en la lectura. La fiabilidad de la
prueba por el método de las dos mitades es de 0,94; su validez concurrente con
la prueba de lectura de De la Cruz (1980) es de 0,69.
«Comprensión de órdenes escritas (COE)» (Cordero y cols., 1988)
Evalúa la comprensión de órdenes escritas en niveles superiores para adolescentes y

adultos. Consta de dos formas (1 y 2), y la aplicación dura unos 15 minutos. La pun-
tuación correcta viene dada por el número de aciertos. La estandarización está reali-
zada en puntuaciones centiles.
«Test de habilidades grafomotoras (THG)» de García Núñez y León García (19892)

Se trata de una prueba orientada a evaluar la maduración para la escritura. El marco
teórico de la prueba está dentro de las teorías de Luria que conciben el lenguaje
como un complejo proceso dinámico y audiomotor de base orgánica; por tanto, se
trata de aislar las distintas funciones cerebrales que intervienen de una manera deter-
minante en la actividad de la escritura. Estas funciones se analizan en cada una de las
subpruebas que componen el instrumento: direccionalidad, pulsión tónica, coordi-
nación visomotora y procesos de codificación y decodificación perceptivomotora.
La meta del instrumento es detectar precozmente los problemas de escritura para su
prevención. Es aplicable a niños de 5 años y medio a 8 años. Cada ítem se puntúa en
una escala de 0-1 ó 0-2 según las escalas; la puntuación directa se obtiene a partir de
la suma de aciertos y se puede transformar en puntuaciones centiles en cada nivel de
edad, tanto en cada subescala como en la puntuación global. La fiabilidad obtenida
por el método test-retest con intervalo de un mes es de 0,91; la validez concurrente
con la prueba de Desarrollo de la percepción visual de Frostig es de 0,88. La subprue-
ba de discriminación visomotora resulta ser la más discriminante.
«Batería de comprensión lectora SURCO» (Alonso- Tapia, Carriedo y Mateos, 1992)
Parte de un marco teórico que concibe la lectura como un proceso complejo en el

que intervienen las dificultades del texto, la información del sujeto y sus actividades
concretas durante la lectura. Evalúa la comprensión lectora mediante tres tipos de
pruebas: detección de fallos de comprensión, conocimiento de estrategias generales
reguladoras aplicables en situaciones específicas y prueba de comprensión basada en
estrategias específicas. La consistencia interna de la prueba oscila entre 0,63 y 0,75.
«Evaluación de la comprensión lectora. Batería IDEPA» (Alonso-Tapia, Carriedo

y González, 1992)
Dentro del mismo marco teórico que la anterior, esta prueba pretende evaluar la ca-
pacidad para abstraer la información relevante de un texto. Consta de dos partes di-
ferenciadas: identificación de ideas principales e identificación del resumen más ade-
cuado. La consistencia interna de la prueba es de 0,75 en identificación de ideas
principales y 0,65 para la totalidad de la prueba.
VI. CONCLUSIONES
Muchas de las pruebas de evaluación de la lectura presentadas tienen una evaluación

estimativa y cualitativa frente a la cuantitativa y objetiva de otras; las primeras no
proporcionan una estandarización y baremación sino una ponderación individual
767
de los sujetos. El conjunto de los instrumentos presentados permite hacernos una

idea del panorama de la evaluación del lenguaje oral y escrito, al tiempo que posibili-
ta Optar por las que presentan unas características científicas más adecuadas y las
que
se adecuen mejor a los objetivos de la evaluación concreta que se haya de realizar. En
conjunto, se puede apreciar que la disponibilidad de pruebas en lengua española es
extensa sobre todo en lo que se refiere al lenguaje escrito, si bien hay otros aspectos
en el que aún queda un largo camino por recorrer.
Aguirre, G. y Beiras, T. (1976). Datos para una investigación sobre comunicación no verbal.
Anuario de Psicología, 2, 37-60.
Aimard, P. y Abadie, C. (1992). Intervención precoz en los trastornos del lenguaje del niño.
Barcelona. Masson.
Ajuriaguerra,
J Ne 1 ]., Auzias, M. yyDenner, A. (1964). L'écriture de Penfant. Neuchátel. Delachaux
y Niestlé.
Alonso Tapia, J., Carriedo, N. y Mateos, N. (1992). Evaluación de la supervisión y compren-
sión: la batería SURCO. En A. Alonso-Tapia (dir.), Metacognición, comprensión lectora y
pensamiento crítico: desarrollo de estrategias y técnicas de evaluación. Madrid. Servicio de
Publicaciones del Ministerio de Educación y Ciencia.
Alonso Tapia, J., Carriedo, N. y González, A. (1992). Evaluación de la comprensión lectora:
la batería IDEPA. En A. Alonso-Tapia (dir.), Metacognición, comprensión lectora y pensa-
miento crítico: desarrollo de estrategias y técnicas de evaluación. Madrid. Servicio de Pu-
blicaciones del Ministerio de Educación y Ciencia.
Alonso Tapia, J. y González Alonso, A. (1988). Escalas de desarrollo lingúístico de Reynell.
Madrid. MEPSA.
Bankson, N. W. (1977). Bankson's Language Screening Test. Nueva York. Psychological
Corporation.
Belinchón, M. (1985). Adquisición y evaluación de las funciones pragmáticas del lenguaje: un
estudio evolutivo. Estudios de Psicología, 19-20, 35-49. ei
Belinchón, M., Riviére, A. e Igoa, J. M. (1992). Psicología del lenguaje. Investigación y teoría.
Madrid. Trotta.
Bellugi, U. (1978). How children say no. Cambridge. MIT Press.
Blagden, C. y McConnell, N. (1985). Interpersonal language skill assessment. Moline. Lin-
ulsystems.
osea (1970). Language development: Form and function in emerging grammars. Cam-
bridge. MIT Press. y
Eo y Lahey, M. (1978). Language development and language disorders. Nueva York.
Wiley. q
Boada, HL(1986). El desarrollo de la comunicación en el niño. Barcelona. Anthropos.
Bosch, L. (1984). Desarrollo fonológico infantil: una prueba para su evaluación. En M. Si-
guán (dir.), Estudios sobre psicología del lenguaje infantil. Madrid. Pirámide. :
Bosch, L. (1987). Avaluació del desenvolupament fonologic en nens catalano-parlants de 3 a 7
anys. Barcelona. PPU. ;
aid B. A. (1984). Bracken Basic Concept Scale. San Antonio. Psycholog ical Corporati on.
Brown, R. (1973). A first language. The early etage. Cambridge. Harvard University Press.
Brown, R. y Bellugi, U. (1964). Three process in the child”s acquisition of syntax. Harvard
Educational Review, 34, 133-151.
Buhler, C. (1930). The first year of live. Nueva York. Day. la.
Cabrejo-Parra, E. (1978). Álgunos aspectos comparativos de la adquisición del lenguaje. En
J. P. Bronckart, P. Malrieu, M. Siguán, H. Sinclair, T. Slama-Cazacu y A. Tabouret-Keller
(dirs.), La génesis del lenguaje. Su aprendizaje y desarrollo. Madrid. Pablo del Río. ;
Capman, R. (1981). Exploring children's communication intents. En J.Miller (dir.), Assessimg
language production in children: Experimental procedures. Baltimore. University Park
Press.
Carrow-Woolfolk, E. (1970). Test for Auditory Comprehension of Language. Austin. Lear-
ning Concepts. .
Clemente, A. M. (1982). Variaciones en el lenguaje espontáneo infantil. En M. Siguán (dir.),
Estudios sobre psicología del lenguaje infantil. Madrid. Pirámide.
Cone, J. D. (1981). Psychometric considerations. En M. Hersen y A. S. Bellack (dirs.), Beha-
vioral assessment (2.* ed.). Nueva York. Pergamon Press.
Cordero, C., González, M., Seisdedos, N., De la Cruz, M. V. (1988). COE. Comprensión de
órdenes escritas. Madrid. TEA.
Critchley, M. (1970). Developmental dislexia. Heiman. Medical Books.
Crystal, D. (1979). Working with LARPS. Londres. Edward Arnold.
Crystal, D. (1982). Profiling lingustic disability. Londres. Edward Arnold.
Darwin C. R. (1877). A biographical sketch of an infant. Mind, 2, 285-294.
De la Cruz, M. V. (1980, 1988). Pruebas de lectura (Niveles 1 y 2). Madrid. TEA.
De la Cruz, M. V. y Cordero, A. (1991). VCLC. Método visual para la estimulación del len-
guaje. Guía para la aplicación. Adaptación española. Madrid. TEA.
Dunn, L. M. (1959). Peabody Picture Vocabulary Test: Original edition. Circle Pines. Ameri-
can Guidance Service.
Dunn, L. M. (1981). Peabody Picture Vocabulary Test-Revised. Circle Pines. American Gui-
dance Service.
Edelfeldt, A. W. (1975). Manual del Reversal Test. Barcelona, Herder.
Faw, T. (1981). Psicología del niño. Bogotá. McGraw Hill.
Fernández Pozar, F. (1983, 1988). Batería pedagógica 3. Evaluación de la lengua castellana en
el ciclo medio BP-3. Madrid. TEA.
Forns, M. (1989). Consideraciones acerca de la evaluación del lenguaje. En C. Triadó y
M. Forns (dirs.), La evaluación del lenguaje. Barcelona. Anthropos.
Forns, M., Triadó, C., Berdie, A. y Mondelo, P. (1987). Evaluación del conocimiento semán-
tico mediante el Bankson's Language Screening Test. Revista de Logopedia, Foniatría y
Audiología, VII, 213-224.
García-Albea, J. E., Sánchez Bernardos, M. L. y Del Viso Pabón, S. (1986). Test de Boston
para el diagnóstico de la afasia. Adaptación española. En H. Goodglass y E. Kaplan (dirs.),
Evaluación de la afasia y trastornos relacionados. Madrid. Médica Panamericana.
García Núñez, J. A. y León García, O. (1989). Test de habilidades grafomotoras (THG). Ma-
drid. García Núñez.
Gerard, K. A. y Carson, E. R. (1990). The decision-making process in child language assess-
ment. British Journal of Disorders of Comunication, 25, 61-75.
Gili Gaya, S. (1972). Estudios de lenguaje infantil. Barcelona. Biblograf.
González Portal, M. D. (19844). Dificultades en el aprendizaje de la lectura. Madrid. Servicio
de Publicaciones del Ministerio de Educación y Ciencia.
González Portal, M. D. (1984b, 1989). EDIL-1. Exploración de las dificultades individuales de
lectura (Nivel 1). Madrid. TEA.
Gray, W. S. (1957). La enseñanza de la lectura y la escritura. París. Unesco.
Gregoire, A. (1937). L'apprentissage du langage. París. Éditions les Belles Lettres.
769
Spgnta H. J. (dir.) (1973). Manual on Terminology and Classification in Mental

Retar-
+ sii Cora AA A ,
ayward, P. + Evaluating diagnostic reading test. The Reading Teacher, 21, 353-371.
Hedrick, D. L., Prather, E. M. y Tobin, A. R. (dirs.) (1984). ea Inventory of Comuni-
cation Development. Seattle. University of Washington Press.
ná Pina, F. (1979). Etapas en la adquisición del lenguaje. Infancia y Aprendizaje, 8,
Howlin, P. (1980). Language training. En W. Yule y J. Carr (dirs.), Behavior modification for
the mentally handicapped. Londres. Croom Helm.
Inizan, A. (1976). Cuándo enseñar a leer. Madrid. Pablo del Río.
Ireton, H. y Thwing, E. (1974). Manual for the Minnesota Child Development Inventory.
Minneapolis. Behavior Science Systems.
Irwin, O. C. (1949). Infant speech. Scientific American, 18, 22-24.
Jose, P. E. (1988). Sequentality of speech acts in conversationnal structure. Journal of Psycho-
linguistic Research, 17, 65-88.
a E., Goodglass, H. y Weintraub, S. (1983). Boston Naming Test. Filadelfia. Lea and
ebiger.
Kent, L. R. (1974). Language adquisition program for the retarded or multiply impaired. Re-
search Press.
Kirk, S. A. y Kirk, W. (1976). Psycholinguistic learning disabilities: Diagnosis and remedia-
tion. Urbana. University of Illinois Press.
Kirk, S. A., McCarthy, J. J. y Kirk, W. (1968). Examiner's Manual: Illinois Test of Psycholin-
guistic Abilities-R. Urbana. University of Illinois Press.
Leopold, W. (1939). Speech development of a bilingual child (4 vols.). Evanston. Northwes-
tern University Press.
Lewis, M. M. (1936). Infant speech: A study of the beginnings of language. Nueva York.
Harcourt Brace.
López Ornat, S. (1975). Dinámica de la adquisición verbal. Revista de Psicología General y
Aplicada, 137, 1059-1068.
Lourenío Filho, M. B. (1928). Testes para clasificao de analfabetos. Sao Paulo. Sociedade de
Educacao.
Lourenío Filho, M. B. (1937). Test ABC. Madrid. Kapelusz.
Lugo, D. E. (1980). Adaptación española de ITPA Prueba de Illinois de habilidades psicolin-
gúísticas. Board of Trustees of the University of Illinois.
Luria, A. R. (1966). Higer cortical functions in man. Nueva York. Basic Books.
Machado Álvarez, A. (1887). Tintín. Boletín de la Institución Libre de Enseñanza, XI, 319-320.
Mayor,J.y Pinillos, J. L. (dirs.) (1991). Comunicación y lenguaje. Madrid. Alhambra Univer-
sidad.
McCarthy, D. (1957). Desarrollo del lenguaje en los niños. En L. Carmichael (dir.), Manual
de psicología infantil. Barcelona. Ateneo.
McCarthy, D. (1959). Research in language development: Retrospect and prospect. Mono-
graphs of Social Research in Child Development, 24, 3-24.
McNeill, D. (1966). The creation of language for children. En J. Lyons y R. ]. Wales (dirs.),
Psycholinguistics papers. Edimburgo. University Edinburgh Press. E
MeNeill, D. (1970). The adquisition of language: the study of developmental psycholinguis-
tics. Nueva York. Harper and Row. to,
Melgar de González, M. (1976). Cómo detectar a un niño con problemas del habla. México.
Trillas.
MEPSA (1984). Stycar Languaje de Sheridan. Madrid. MEPSA.
Miller]. E. (dir.) (1976). Procedures for assessing children's language: Á developmental process
approach. Waisman Center on Mental Retardation and Human Development, University
of Wisconsin, Madison.
Miller, ]. F. (1981). Assessing language production in children. Baltimore, Maryland. Univer-

sity Prak Press.
Molina, S. (1988). BADIMALE. Batería diagnóstica de madurez lectora. Madrid. CEPE.
Muñoz, M. D. C. (1969). El Peabody Picture Vocabulary Test adaptación y baremación en
España. Revista de Psicología General y Aplicada, 24, 677-688.
Neira-Meléndez, (1979). Una revisión de la versión castellana del Peabody Picture Vocabu-
lary Test. Revista Latinoamericana de Psicología, 1, 131-136.
Olswang, L. B. y Bain, B. A. (dirs.) (1988). Assessment of language in developmentally disa-
bled infants and prescholers. En T. D. Wachs y R. Sheehan (dirs.), Assessment young de-
velopmentally disabled children. Nueva York. Plenum Press. sé
Paraeskepoulus, J. N. y Kirk, S. A. (1969). The development and psychometric characteristics
of revised Illinois Test of Psycholinguistic Abilities. Urbana, University Illinois Press.
Pérez, M. y Singer, D. (1984). Adquisición de morfemas en español. Infancia y Aprendizaje,
27-28, 205-221.
Prather, E., Hedrick, D. y Kern, C. (1975). Articulation development in children aged two to
four years. Journal of Speech and Hearing Disorders, 40, 179-191.
Preyer, (1889). El alma del niño. Madrid. Jorro.
Reynell, R. (1977, 1985). Reynell Development Language Scales. RDLS. Wilsor. NFER, Nel-
son.
Robertson,J.R. y Eisenberg, J. L. (1981). Technical supplement to the Peabody Picture Voca-
bulary Test-Revised. Circle Pines. American Guidance Service.
Sanjuán, M., Fernández, E. y Marteles, P. (1974). Análisis en la interacción verbal profesor
alumno. Revista de Psicología General y Aplicada, 29, 555-562.
Schonell, EF. J. (1946). The psychology and teaching reading. Edimburgo. Oliver and Boyd.
Sebastián, E. (1991). El desarrollo del sistema de referencia temporal en español: un paseo por
la morfología verbal. Anales de Psicología, 2, 181-196.
Secadas, F. (1992). Procesos evolutivos y escala observacional del desarrollo. Madrid. TEA.
Secall M. V. (1982). Aproximación al primer lenguaje. En M. Siguán (dir.), Estudios sobre psi-
cología del lenguaje infantil. Madrid. Pirámide.
Seisdedos, N. (1980). Ortografía, O-2. Madrid. TEA.
Serra, M. (1976). Métodos e índices para el estudio psicológico y patológico del lenguaje.
Anuario de Psicología 15, 173-196.
Serra, M. (1979). Normas estadísticas de articulación para la población escolar de 3 a 7 años en
el área metropolitana de Barcelona. Comunicación presentada en el III Congreso Nacio-
nal de Psicología. Pamplona.
Sheridan, M. D. (1975). The Stycar Language Test. Developmental of Medical Child Psycho-
logy, 17, 130-203.
Sheridan, M. D. (1976). Picture Book for the Stycar Language Test. Southampton. NFER Pu-
blishing Company.
Siguán, M. (1984). Estudios sobre psicología del lenguaje. Madrid. Pirámide.
Slobin, D. 1. (1971). Developmental psycholinguistics. En W. O. Dingwall (dir.), A survey of
linguistic science. Maryland. College Prak.
Soler, M. R. (1984). Adquisición y utilización del artículo. En M. Siguán (dir.), Estudios sobre
psicología del lenguaje. Madrid. Pirámide.
Stoel-Gammon, C. (1985). Phonetic inventories 15-24 months: A longitudinal study. Journal
of Speech and Hearing Research, 28, 505-512.
Stratron, B. D. y Crouthers, M. (1990). Diagnostic assessment of reading. En C. R. Reynolds
y R. W. Kamphaus (dirs.), Handbook ofpsychological and educational assessment of chil-
dren. Nueva York. Guilford Press.
Suárez-Yáñez, A. y Meara, P. (1985). Dos pruebas de comprensión lectora (Procedimiento
“cloze”). Madrid. TEA.
Toro, J. y Cervera, M. (1980). TALE. Test de análisis de lectoescritura. Madrid. Visor.
Evaluación del lenguaje 77
Toronto, A. S. (1976). Developmental assessment of Spanish grammar. Journal of Speech and

Hearing Disorders, 2, 150-171.
Triandó, C. (1982). Algunos aspectos del lenguaje del niño en su función comunicativa. En
M. Siguán (dir.), Estudios sobre psicología del lenguaje infantil. Madrid. Pirámide.
Valle Arroyo, F. (1991). Psicolingiística. Madrid. Morata.
Van Kleeck, A. y Richardson, A. (1990). Assessment of speech and language development.
En J. H. Johnson y J. Goldman (dirs.), Developmental assessment in clinical child psycho-
logy. Nueva York. Pergamon Press.
Villegas, M. (1975). Manual del Reversal Test. Barcelona. Herder.
Villiers, P. A. y Villiers, J. G. (1978). Early language. Londres. Open Books.
Von Isser, A. y Kirk, W. D. (1980). Manual de instrucciones. Prueba de Illinois de Habilida-
des Psicolingúísticas. llinois. Broad of Trustees of the University of Illinois.
Wallach, G. y Miller, L. (1988). Language intervention and academic success. Boston. Little
Brown.
Winitz, H. e Irvin, O. (1958). Sylabic and phonetic structure of infants: Early words. Journal
of Speech and Hearing Disorders, 1, 250-256
Alonso Tapia, A., De la Cruz, A. y Carriedo, N. (1992). Evaluación del desarrollo del lengua-
je. En R. Fernández-Ballesteros (dir.), Introducción a la evaluación psicológica. Madrid.
Pirámide.
Carranza, J. A. y Brito, A. G. (dirs.) (1991). Adquisición y desarrollo del lenguaje [Número
especial]. Anales de Psicología, 2. 0 que :
Gerard, K. A. y Carson, R. E. (1990). The decision-making in child language assessment. Bri-
tish Journal of Disorders of Communication, 25, 61-75.
Mayor, M. A. y Rivas, R. M. (1996). Evaluación de los trastornos del lenguaje. En G. Buela-
Casal, V. E. Caballo y J. C. Sierra (dirs.), Manual de evaluación en psicología clíncia y de la
salud. Madrid. Siglo XXI. ,
Triandó, C. y Forns, M. (1989). La evaluación del lenguaje. Barcelona. Anthropos.
Valle Arroyo, F. (1991). Psicolinguística. Madrid. Morata.
he d-Joer
>
=$ A -
Pro der $ 3
0 MN 4
pla pcs
$ Ano
;h E
A OY:yISR,
POMTTOnA 200 E A Os
y o a.
; CA
+ Dis han
E :
3 e. .
31. EVALUACIÓN DEL DESARROLLO PSICOSOCIAL
TERESA KIRCHNER
IL. INTRODUCCIÓN
El ser humano vive y se desarrolla dentro de un contexto social; pasa la mayor parte
de su vida en contacto con los demás, cooperando con otras personas, aprendiendo,
trabajando y estudiando con otros, en suma, viviendo y sintiendo en común. Esta
convivencia exige y potencia el desarrollo progresivo de una serie de comportamien-
tos específicos y habilidades de interrelación personal que constituyen el proceso de
socialización. Se ha podido comprobar que los aspectos sociales de la conducta tie-
nen importantes repercusiones en amplias áreas de la actividad humana, desde la
cognitiva a la afectiva, redundando tanto en procesos de aprendizaje como en la pro-
pia integración personal. Asimismo, esta influencia se extiende a contextos muy va-
riados, especialmente al escolar, al familiar, al laboral y, en general, a todos aquellos
ámbitos donde se requiera interrelación personal. Por tanto, es lógico que los psicó-
logos se hayan interesado por evaluar esta importante dimensión social de la con-
ducta y se hayan diseñado numerosos instrumentos que hagan factible este análisis.
Efectuando una breve revisión histórica, se observa que el interés por evaluar
factores de tipo social es relativamente temprano, pudiéndose señalar la década de
los años treinta como punto de partida inicial, y aún antes incluso. En efecto, como
el lector recordará, la mayoría de las pruebas clásicas de inteligencia infantil —como
la Escala de Binet-Simon— incluía ítems destinados a calibrar la capacidad de adap-
tación social de un determinado sujeto. Generalmente, estos ítems se englobaban
bajo el epígrafe de “inteligencia social”, concebida como la modalidad relacional de
la capacidad intelectual. Otras escalas clásicas de desarrollo intelectual que incluyen
una dimensión de socialización entre sus reactivos son la de Brunet-Lezine y las de
Gesell. Las mismas escalas de Wechsler participan de esta tradición mediante la in-
clusión de los subtests de comprensión que exploran la capacidad del sujeto para
comprender y seguir pautas sociales establecidas.
Con todo, en este capítulo se hará referencia exclusiva a todas aquellas pruebas
concebidas explícitamente desde su construcción como escalas básicas de soctaliza-
ción. El objetivo común de todas ellas se ha centrado, y se centra, en explorar de-
ficiencias en alguna de las áreas básicas de socialización a fin depoder implantar pro-
gramas de intervención adecuados, o bien en calibrar las posibilidades educativas de
sujetos con retraso mental. También han permitido efectuar estudios evolutivos de
los diferentes estadios de desarrollo de patrones sociales.
Es de referencia obligada, al hablar de los orígenes de esta evaluación, la Escala
de madurez social de Vineland, publicada originalmente por Doll en 1935 y de la
Universidad de Barcelona.
774 Teresa Kirchner
que posteriormente se han efectuado numerosas revisiones. Doll intentó explorar

con este instrumento la “competencia social” definida básicamente en términos de
“independencia” y “responsabilidad” (posibilidad de asumir su propia responsabi-
lidad, capacidad de integrarse en un grupo social y capacidad de contribuir a la vida
social). Puede aplicarse a sujetos a partir de los 6 meses hasta la edad adulta y ex-
plora seis áreas básicas relacionadas con la madurez social: autosuficiencia (en los
hábitos de limpieza, comida y vestirse), autonomía en el desplazamiento, capacidad
de ocuparse de sí mismo, capacidad de comunicación con los otros (a través del ha-
bla, de la lectura-escritura, por teléfono), capacidad de actuar por sí mismo (senti-
do de la responsabilidad) y capacidad de mantener actividades sociales. Doll partió
de un criterio teórico evolutivo parecido al sustentado con respecto a la inteligen-
cia: a cada grupo de sujetos de la misma edad cronológica corresponde un determi-
nado nivel de desarrollo social. De aquí que, mediante su prueba, pudiera determl-
narse una “edad social” y un “cociente de desarrollo social” a partir de los cuales
dictaminar si un niño estaba llevando o no un correcto nivel de desarrollo global,
cuál era su grado de desarrollo y en cuál de las seis áreas comentadas presentaba
deficiencias.
Este interés en evaluar aspectos relativos a la capacidad de relación interperso-
nal se incrementará en la década de los años sesenta, época en la que se crean nu-
merosos instrumentos destinados a evaluar aspectos concretos de la sociabilidad.
En líneas generales, estos instrumentos partían del supuesto de que de una buena
integración social dependía buen número de conductas tanto cognitivas como afec-
tivas y relacionales. De hecho, como acentúan Hresko y Brown (1984), se empezó
a manifestar un fuerte interés en evaluar la competencia social y emocional de los
niños muy pequeños con problemas de aprendizaje, a fin de que pudieran benefi-
ciarse de los proyectos de investigación que se estaban efectuando con la finalidad
de entrenar a estos niños. Muchos de estos programas, desarrollados en los años
sesenta, tenían un fuerte componente afectivo. De aquí que empiece a hablarse de
factores socioemocionales, como una de las variantes del proceso de socialización
que afecta primordialmente al sistema afectivo. De hecho, de las siete metas que
perseguía el proyecto Head Start, cinco eran de tipo afectivo: desarrollar senti-
mientos de autovaloración, desarrollar un buen autoconcepto, potenciar la auto-
confianza, incrementar la autodisciplina, y favorecer actitudes positivas hacia la fa-
milia y la sociedad.
Un ejemplo de escala de socialización de la década de los años sesenta es la Escala
de desarrollo psicosocial (DPS) de Hurtig y Zazzó (1969), basada fundamentalmente
en la primitiva escala de Doll. Explora básicamente la adquisición de comportamien-
tos sociales de niños entre los 5 y los 12 años de edad, mediante 139 ítems divididos
en tres subapartados:
a. Adquisición de autonomía personal (en casa, en la escuela, en la responsabi-

lidad material de sí mismo).
b. Desarrollo del interés por la vida social (interés por los libros y la lectura,
por la vida social).
c. Desarrollo de las relaciones interindividuales (relaciones con los padres, con
los compañeros, adaptación a la vida social en general)
Evaluación del desarrollo psicosocial
775
En la década de los años setenta, y bajo la influencia de paradigmas conductuales,

se renueva el interés por la evaluación de esta dimensión comportamental, interés
que se mantiene vigente, e incluso se incrementa en la década de los años ochenta
hasta la actualidad. Una característica es su operativización de la socialización como
un compendio de habilidades sociales, así como el interés que se produce por desa-
rrollar dichas habilidades mediante las técnicas de intervención adecuadas. Como
expresan Zigler y Trickett (1978), las competencias sociales deberían ser el centro de
los programas de intervención, más que el desarrollo cognitivo o la evaluación de los
cocientes intelectuales. De hecho, para autores como Rubin (1982) se ha ido dando
un progresivo cambio de enfoque en los programas de intervención escolar desde la
evaluación estrictamente de factores cognitivos a la evaluación de factores socio-
emocionales. «Este giro hacia la evaluación del desarrollo social parece ser el resulta-
do de un significativo número de hallazgos de estudios recientes que exploran los
efectos de la interacción entre compañeros en el desarrollo de habilidades sociales»
(Rubin, 1982, p. 353). Un ejemplo lo tenemos en el estudio de Roff, Sells y Golden
(1972), quienes pusieron de relieve la correlación existente entre el rechazo de los
compañeros durante los primeros años de escolaridad y posteriores conductas anti-
sociales y delictivas en la adolescencia y primeros años de la vida adulta. Desde esta
perspectiva se concibe la socialización, no tanto como una estructura inmóvil vincu-
lada a rasgos más o menos innatos, sino como la consecuencia de unos determinados
aprendizajes y, por lo tanto, susceptible al cambio. Para una revisión amplia sobre el
tema consultar Michelson y cols. (1987), Martorell (1988) y Caballo (1993).
Il. CONCEPTO DE DESARROLLO PSICOSOCIAL
Un primer problema que tuvieron que solucionar los autores de instrumentos de

evaluación del desarrollo psicosocial fue delimitar el concepto y las diferentes áreas
comportamentales que definen o integran el constructo a explorar. Puede decirse
que la evolución de su concepción teórica y praxis de la evaluación ha ido paralela a
la de otros constructos, como puede ser el cognitivo; ha pasado de ser concebida
como un rasgo más o menos estable y amplio, es decir, con efecto cross-situacional, a
ser interpretada de forma más molecular (ciertas habilidades en ciertas situaciones),
como fruto del aprendizaje y, por tanto, con posibilidades de modificación.
La variante relacional de la conducta humana es, de hecho, un concepto de difícil
delimitación y que, además, recibe nominaciones distintas según los autores que la
han tratado. Así, nos encontramos con expresiones tales como madurez social, so-
cialización, habilidad social, sensibilidad social, madurez psicosocial, competencias
sociales, etc., para referirnos, con escasas variantes, prácticamente al mismo concep-
to básico, al menos a juzgar por el tipo de ítems que componen las pruebas y por las
áreas que intentan explorar. Esta diversificación nominal contribuye a oscurecer el
panorama y dificulta la emisión de una definición que las abarque. De hecho, esta di-
ficultad es inherente al propio constructo que se está analizando. Lo adecuado so-
cialmente, lo que se considera maduro a nivel psicosocial, varía extraordinariamente
de un contexto a otro, de un país a otro, incluso de una subcultura a Otra; y también,
776 Teresa Kirchner
por descontado, de una época a otra. Así, mientras para unas perspectivas la madu-
rez social sería la capacidad para adaptarse y aceptar las normativas de un grupo,
desde otros puntos de vista sería la capacidad del sujeto para ser asertivo y destacarse
en el grupo social, pudiendo desarrollar de pleno sus intereses, emociones y necest-
dades, sin interferir en las de los demás. Adams (1975) nos ofrece una serie de carac-
terísticas de los sujetos con una buena adaptación personal-social que abarcaría mu-
chos de los aspectos comentados:
a. Son individuos capaces de establecer relaciones armónicas con los demás y

en ambientes distintos (casa, escuela, trabajo, comunidad...), sin que ello les
produzca tensiones internas y comportamientos ineficaces.
b. Pueden dedicar sus energías a la consecución de metas aceptadas en su mar-
co cultural.
c. Muestran un control emocional y de la impulsividad propio de su edad, sin
perder por ello espontaneidad y creatividad; aceptan sin servilismos las su-
gerencias de los demás.
d. Aceptan las normas de su grupo y son aceptados por su grupo de referencia.
Basándonos en estos ejes comportamentales, podría definirse el desarrollo psi-

cosocial como el proceso por el cual el individuo adquiere e interioriza (hace suyos)
una serie de patrones comportamentales de interrelación y de valores propios del
contexto al que pertenece o con el que se identifica. Esta adquisición temprana le po-
sibilitará adaptarse al medio social, desarrollar su potencial como ser autónomo y
manifestar su modo de ser, respetando a la par las características de los otros. Se in-
terpreta que una persona tiene mayor madurez psicosocial cuanto más capaz es de
desarrollar su propia forma de ser, de expresar sus necesidades y pensamientos, res-
petando a los demás, interrelacionándose con ellos y evitando los conflictos y en-
frentamientos con los otros. Por su parte, el concepto de madurez socioemocional, a
veces empleado como sinónimo de sociabilidad, va referido concretamente a los as-
pectos afectivos de la relación interpersonal (autoestima, capacidad de empatía, afec-
tividad, control emotivo...).
Hemos definido el desarrollo psicosocial como un proceso; por tanto, como
cualquier otro proceso, debe seguir una serie de pautas o fases que se inician muy
tempranamente en la infancia y se prolongan hasta la fase adulta. De hecho, para al-
gunos autores el proceso de socialización nunca tiene fin. En este proceso, largo y
complejo, las personas obtienen un éxito muy desigual. Numerosos estudios, prove-
nientes del campo de la sociología y de la psicología social han advertido la estrecha
relación existente entre inmadurez social y diversas alteraciones conductuales y/o
cognitivas. De aquí la necesidad de evaluar la trayectoria que sigue este desarrollo en
determinados sujetos, a fin de efectuar las intervenciones pertinentes. De hecho,
como ya se ha comentado, muchos de los estudios pioneros en este campo iban diri-
gidos a calibrar las posibilidades de insertarse en su medio social de sujetos deficien-
tes o con conductas fuertemente alteradas.
La evaluación del desarrollo psicosocial tendrá por objetivo primordial explorar
el grado de madurez personal y afectiva que ha alcanzado un sujeto en sus conductas
de relación con un grupo social vinculado a un contexto específico. Evidentemente,
PTA
esta evaluación tiene su punto de máximo interés en la infancia, época en la que se

van gestando y consolidando los patrones de comportamiento relacional y dondees
prioritario detectar tempranamente alteraciones, tanto por defecto (timidez, retrai-
miento...) como por exceso (agresividad, manipulación, dominancia...). De aquí que
muchos de los instrumentos ideados sean de aplicación infantil y adolescente. Otra
característica de estas pruebas es su búsqueda de validez ecológica: la conducta de los
niños pequeños es muy versátil, variando significativamente de un contexto a otro.
Por tanto, es importante que los instrumentos permitan evaluar la conducta de un
determinado sujeto en distintos ámbitos, especialmente en aquellos que se erigen
como contextos de máxima influencia y significación: la familia y la escuela. Por ello,
es lógico que la mayoría de las pruebas vaya dirigida a estos contextos o ámbitos es-
pecíficos. También, a fin de incrementar esta validez ecológica a la que se aludía, se
intenta que un mismo sujeto sea evaluado por personas distintas pertenecientes a
ámbitos sociales diferentes; así, siguiendo la tradición sociométrica, muchos cuestio-
narios incluyen, junto con una autoevaluación, una heteroevaluación. Padres, com-
pañeros y profesores se constituyen en el grupo de agentes sociales cuyo juicio es in-
dagado preferentemente. Concretamente, según recogen Michelson y cols. (1987), el
juicio de los compañeros ha demostrado tener una buena capacidad predictiva de
futuras dificultades sociales y de salud mental, tanto a corto como a medio plazo.
Destacan también estos autores que el juicio de los padres discrimina de forma co-
rrecta entre niños enviados a centros de salud mental y niños no enviados. Final-
mente, las estimaciones de los profesores han gozado tradicionalmente de amplia
credibilidad en la identificación de los niños con dificultades de adaptación social.
Hemos comentado que, de hecho, el proceso de socialización, entendido como
la maximización del propio potencial en interrelación con los demás, no tiene fin. De
aquí que también existan abundantes técnicas de evaluación y entrenamiento de ha-
bilidades sociales que persiguen como objetivo común aumentar la autoasertividad,
facilitar el habla en público sin cohibiciones, saber defender los derechos propios,
etc. Muchas de estas técnicas están pensadas para población adulta. En esta exposi-
ción nos centraremos exclusivamente en aquellos instrumentos destinados a evaluar
el desarrollo psicosocial de la población infantil y adolescente.
II. TÉCNICAS DE EVALUACIÓN DEL DESARROLLO PSICOSOCIAL
Ya hemos adelantado que el interés por evaluar esta dimensión relacional de la acti-
vidad humana es relativamente reciente y que ha experimentado un incremento pro-
gresivo a lo largo de las dos últimas décadas. Esto ha dado lugar a una gran prolifera-
ción de técnicas e instrumentos, que si bien tienen en común el análisis de ejes
comportamentales que se suponen claves en la conducta de interrelación personal,
presentan entre ellas diferencias conceptuales y/o estructurales importantes. En este
apartado se presentará, en primer lugar, una clasificación de las principales técnicas
para evaluar el desarrollo psicosocial; en segundo lugar, se tratarán las dimensiones
que suelen explorar estos instrumentos, es decir, qué se evalúa; finalmente, en un ter-
cer apartado, se analizarán con cierto detalle, a modo de ejemplo, dos escalas que
778 Teresa Kirchner
pueden resultar interesantes al lector porque están adaptadas (o en vía de adaptarse)

a España.
m1. Clasificación
Al igual que sucede con otros instrumentos de evaluación, como por ejemplo los
tests de inteligencia, las clasificaciones admiten diversas variantes según el eje refe-
rencial que se escoja. Así, puede elegirse como variable aglutinadora el modelo teóri-
co subyacente, el tipo concreto de variables de socialización que se priman, o la es-
tructura formal de la técnica que se ha elegido, etc. Por ejemplo, McFall (1982), tras
una exhaustiva revisión del concepto, llega a identificar dos grandes modelos: el mo-
delo de rasgos y el modelo molecular. El primero concibe las habilidades sociales
como una predisposición subyacente de respuesta que se da transituacionalmente, es
decir, se da un mismo patrón de conducta social a lo largo de diversos ámbitos. Por el
contrario, el modelo molecular concibe la socialización como una serie de conductas
discretas específicas a la situación, no vinculadas a rasgos ni a estructuras de persona-
lidad subyacentes. El problema que presentan los instrumentos de evaluación desde
esta segunda perspectiva es la selección apropiada de unidades de conducta social y
la clasificación de las situaciones sociales. Por su parte, las técnicas vinculadas al pri-
mer modelo presentan como mayor limitación su poca validez ecológica. Otros auto-
res han efectuado una clasificación según el tipo de tecnología o estrategia utilizada
para analizar esta dimensión relacional de la conducta. Este es el caso de Michelson y
cols. (1987), para quienes la mayoría de las pruebas que evalúa a esta conducta y ha-
bilidades sociales puede incluirse en tres grandes bloques: técnicas de observación de
la conducta, heteroinformes y autoinformes.
111.1. Observación de la conducta
La observación de la conducta va referida a la observación directa del comporta-

miento social que manifiesta un determinado sujeto. A su vez, esta modalidad meto-
dológica puede subdividirse en observación en marcos naturales u observación en
situaciones artificiales.
La observación natural implica una evaluación directa de las interacciones socia-
les de un individuo en su ambiente natural, ya sea la escuela, la familia, el grupo so-
cial, etc. Es un buen método para identificar a aquellos niños con un comportamien-
to social inapropiado. Suele realizarse con uno o más observadores que registran
puntualmente diversos parámetros de la conducta del sujeto en diversos ambientes.
Como se comprenderá, no hay un modelo de escala prototipo. La especificidad si-
tuacional y las características concretas del comportamiento social que pretenden in-
vestigarse han fomentado la creación de numerosos códigos y formatos de observa-
ción de cariz idiosincrásico. A efectos orientativos podríamos citar la obra de
Alvarez y cols. (1990), en la que se incluyen escalas de observación muy completas y
adaptadas a nuestro contexto. Han sido ideadas para que padres y profesores regis-
tren puntualmente la conducta social de niños entre 3 y 6 años en contextos natura-
779
les (casayescuela). La observación incide en dos grandes bloques conductuales: el

de habilidades de interacción social y habilidades de autonomía. A su vez, las habili-
dadesde interacción social quedan desglosadas en cuatro subapartados: interacción
en el juego, expresión de emociones, autoafirmación y conversación; por su parte,
las habilidades de autonomía incluyen: aseo personal, habilidades de comida, habili-
dades del vestir, habilidades para tareas sencillas, ayudar a los demás o usar herra-
mientas y habilidades para desplazamientos. Las técnicas observacionales en marcos
naturales gozan de indudables ventajas, como permitir la obtención de medidas fia-
bles y válidas de la auténtica conducta de relación de un sujeto en un determinado
contexto. El contrapunto negativo es su posible coste, tanto monetario como tem-
poral, la interferencia que puede crear la presencia de observadores externos a un de-
terminado contexto y la dificultad de evaluar conductas sociales de poca frecuencia
de aparición. Cuando los observadores son padres o profesores, pueden crearse
errores de apreciación al entrar en juego factores subjetivo-afectivos.
La observación en circunstancias artificiales consiste en observar y registrar la
conducta del sujeto en situaciones simuladas o de representación de papeles. Por lo
general, se le presentan al sujeto, bien a través de una grabación en vídeo o en audio,
o bien mediante un narrador, situaciones ficticias, relacionadas con las conductas so-
ciales que pretenden calibrarse, a las que él deberá responder; esta respuesta se com-
para con la de un grupo de referencia. Esta técnica suele utilizarse cuando la conduc-
ta que pretende explorarse —por ejemplo, tolerancia a situaciones frustrantes— es
de baja ocurrencia en un determinado contexto y, por tanto, ha de forzarse su apari-
ción. Un ejemplo de este tipo de técnica lo tenemos en el Behavioral assertiveness
test for children (BAT-C) [Test de conducta asertiva para niños] de Bornstein, Bellack
y Hersen (1977), compuesto de escenas que simulan situaciones interpersonales típi-
cas de la edad infantil.
111.2. Heteroinformes
Puede afirmarse que constituyen el material de evaluación con mayor tradición his-
tórica en este campo. Un agente social conocedor del sujeto de evaluación emite una
valoración sobre determinados aspectos de su conducta social. Estas personas alle-
gadas suelen ser los padres, los maestros y los propios compañeros. Estos heteroin-
formes pueden adoptar diferentes modalidades; por ejemplo, cuestionarios, escalas
de estimación o sociogramas. Por supuesto, también es factible la información ver-
bal directa por parte de los agentes sociales. Las primeras escalas para evaluar la ma-
durez en el desarrollo psicosocial, como las ya comentadas de Vineland o la Escala
de desarrollo psicosocial de Hurtig y Zazzó, pertenecen a esta categoría de heteroin-
formes a través de escalas de estimación. A partir de la década de los años setenta se
aprecia una auténtica proliferación de cuestionarios y escalas destinados a ser cum-
plimentados por profesores, padres o compañeros. Cast todos ellos son de habla in-
glesa y adaptados al contexto norteamericano en su mayoría. Podría destacarse, por
[In-
su amplia utilización, la Walker problem behavior inventory checklist (WPBIC)
1970), que explora cinco di-
ventario de la conducta problema de Walker] (Walker,
mensiones del comportamiento social: comportamiento manifiesto, retrarmiento,
780 Teresa Kirchner
distracción, problemas de relación con los compañeros e inmadurez. Otro ejemplo

de heteroinforme lo constituye la Teacher's rating of children's assertive behavior
scale (TRCABS) [Escala de conducta asertiva del niño para maestros) (Wood, Michel-
son y Flynn, 1978) destinada a maestros y que recoge su opinión acerca del compor-
tamiento del niño ante otros niños o adultos en una serie de situaciones de interac-
ción social. Por su parte, la Social competence scale (SCS) [Escala de competencia
social] de Kohn (1977) que evalúa tanto las competencias adaptativas como las pro-
blemáticas relacionales de los sujetos. Son tan numerosos estos instrumentos, que
sería prolijo e inútil efectuar un listado de ellas. El lector interesado en ampliar sus
conocimientos sobre el tema puede obtener amplia información en las obras de Mi-
chelson y cols. (1987), Martorell (1988) o Caballo (1993).
Una variante importante de los heteroinformes la constituyen los sociogramas,
basados en procedimientos sociométricos de estimación de conductas. Generalmen-
te, estos instrumentos implican la evaluación por parte de los compañeros de clase
del prestigio, popularidad o madurez social de un determinado niño. Mediante ellos
puede obtenerse un perfil de los niños populares y estimados o, por el contrario, im-
populares y rechazados por la mayoría del grupo. Normalmente, incluyen pregun-
tas del tipo: «¿a qué niño de la clase escogerías para invitar a tu fiesta de cumple-
años?», «¿a cuál de tus compañeros elegirías para pasar unos días de vacaciones?»,
«nombra al compañero con el que no te gustaría ir a una fiesta». Vemos que los ítems
van referidos tanto a aspectos positivos (niños populares) como negativos (niños im-
populares). La puntuación de un niño determinado consiste en el número de elec-
ciones que ha recibido. Para niños muy pequeños puede resultar interesante admi-
nistrar una variación sociométrica elaborada por Marshall y McCandless (1957),
consistente en un póster en el que están pegadas las fotografías de los compañeros de
clase. Cada niño señala al compañero que elegiría para efectuar conjuntamente cada
una de las actividades y propuestas que le formula el examinador.
111.13. Autoinformes
Son escalas de autoevaluación, es decir, contestadas por el propio sujeto objeto de

evaluación. Mediante ellas puede obtenerse una estimación de la autopercepción de
las propias habilidades sociales. Si bien es una técnica sencilla, práctica y de fácil
cuantificación, está sometida a la distorsión y subjetividad inherente a toda autoeva-
luación. Con todo, puede resultar interesante efectuar contrastaciones entre las me-
didas obtenidas mediante el autoinforme y los heteroinformes, de aquí que suela in-
cluirse una escala de autoestimación dentro de las baterías de evaluación de factores
sociales.
12. Dimensiones de la socialización
Es evidente que la mayoría de estas escalas comentadas anteriormente pretende ex-

plorar algún tipo de comportamiento psicosocial. No obstante, cabría preguntarse
cuáles son en concreto estas dimensiones principales de lo que nombramos sociali-
781
zación. Algunos autores han intentado una clasificación de las diferentes dimensio-
nes que componen la mayoría de los instrumentos de evaluación de esta faceta com-
portamental. Es indispensable efectuar una referencia a la obra de Spivack y Swift
(1973) sobre las escalas de socialización elaboradas en los años sesenta; estos autores
encuentran cuatro dimensiones esenciales de exploración:
a. Conductas perturbadoras del rendimiento escolar (agresividad, Irresponsa-

bilidad, hiperactividad...)
b. Ausencia de contacto social (timidez, conducta retraída...).
c. Conductas adaptativas en el aula (cooperación, control emocional, capaci-
dad de entusiasmo...).
d. A cognitivo (razonamiento, comprensión, dependencia inte-
ectual...).
Por otro lado, Khon (1977) propuso una teoría bifactorial, según la cual en la
mayoría de los instrumentos de evaluación de factores psicosociales pueden identifi-
carse dos grandes dimensiones que explicarían buena parte del funcionamiento so-
cial en distintos contextos: retralmiento versus participación, y agresividad y con-
ducta antisocial versus cooperación. Por su parte, Matson, Rotatori y Helsel (1983)
factorializaron el Matson evaluation of social skills with youngster (MESSY), obte-
niendo los siguientes datos independientemente para cada una de las dos escalas que
componen la prueba (escala de autoevaluación y escala de heteroevaluación). En la
escala de autoevaluación encontraron cinco factores esenciales: habilidades sociales
apropiadas, asertividad inapropiada, impulsivo/recalcitrante, autoconfiado y envi-
dia/retirada. Por lo que respecta a la escala para el profesor, emergen dos factores
fundamentales: asertividad/1mpulsividad inapropiadas y habilidades sociales apro-
piadas.
Finalmente, nos gustaría hacer referencia a algunos trabajos efectuados en Espa-
ña, entre los que destacan, por pioneros, los de Pelechano (1975, 1976). Este autor
elaboró dos escalas (AHS-1 y ETC-1) para calibrar los procesos de socialización de los
sujetos con retraso mental. Con posterioridad, construyó dos escalas (ESE-1 y ES£-2)
para evaluar aspectos positivos y negativos respectivamente de la socialización (Pe-
lechano y Barreto, 1979; Pelechano y Báguena, 1980). La escala ESE-1 incluye cuatro
factores de potenciación de la socialización: colaboración, respeto y responsabili-
dad, popularidad y liderazgo y actitud diferencial positiva entre actividades escola-
res y extraescolares. Por su parte, la escala £SE-2 está conformada básicamente por
dos factores diferenciales: hiperactividad y/o agresividad, e inseguridad y retral-
miento. > l :
En resumen, puede observarse que con mayor o menor número de dimensiones,
la mayoría de los instrumentos ideados para evaluar el nivel de desarrollo psicosocial
ha identificado una serie de parámetros y conductas prototípicas, que repercuten fa-
vorable o desfavorablemente tanto en las interrelaciones personales como en el ajus-
te personal y escolar. Estos parámetros aparecen en distintos marcos transculturales.
782 Teresa Kirchner
ma. Escalas de evaluación del desarrollo psicosocial

Ya se ha referido la diversidad de instrumentos y técnicas desarrolladas para explorar
esta dimensión relacional del comportamiento humano. De entre todas las técnicas e
instrumentos existentes actualmente, vamos a describir aquellos que pueden resultar
más ilustrativos y útiles al lector, ya que están adaptados a población española; éste
es el caso de la Batería de socialización de Silva y Martorell (1983) y el Test de de-
sarrollo socioemocional temprano de Hresko y Brown (1984). La primera de estas
pruebas es un ejemplo de batería que pretende explorar amplias facetas de lasociali-
zación, mientras que la segunda hace énfasis especial en la dimensión afectiva de las
relaciones interpersonales. Ambas tienen en común que son aplicables a niños (y
también a adolescentes en el caso de la Batería de socialización), exploran el desarro-
llo social y socioemocional en distintos marcos ecológicos y las observaciones pro-
ceden de diferentes observadores.
113.1. La «Batería de socialización (BAS)»

Esta batería, que goza de amplia popularidad en España, ha sido elaborada por Silva
y Martorell (1987), a partir de las ya citadas escalas ESE-1 y ESE-2 de Pelechano y co-
laboradores. El concepto de socialización que explora la batería BAS es amplio, com-
prendiendo desde una serie de habilidades básicas hasta patrones conductuales más
amplios de relación interpersonal y grupal. Una de sus originalidades con respecto a
otras escalas es que contempla dos aspectos diferenciales de la socialización; por un
lado, se evalúan aquellas conductas que se consideran perturbadoras de la socializa-
ción (que son generalmente las más estudiadas y evaluadas por numerosas escalas) y,
por otro lado, se exploran los factores facilitadores o potenciadores de conductas
sociales, a menudo obviados. Para operativizar estos criterios se ha efectuado una
taxonomía de hábitos o patrones de comportamiento social, cuya covariación se
ha estipulado mediante factorialización. Por tanto, no se parte de criterios teórico-
racionales sino correlacionales, habiéndose recurrido al análisis factorial para la ex-
tracción de las dimensiones básicas (Martorell, 1988). La BAS está diseñada para ser
administrada a niños y adolescentes (sujetos entre los 6 alos 15 años). Consta de tres
pruebas diferentes: BAS-1, BAS-2 y BAS-3. Veamos con algún detenimiento las caracte-
rísticas fundamentales de cada una de ellas.
La BAS-1 es una escala que explora la percepción que tienen los profesores del su-
jeto objeto de evaluación. Consta de 118 ítems con cuatro alternativas de respuesta
(Nunca, Alguna vez, Frecuentemente, Siempre) que analizan dos aspectos diferen-
ciales de la socialización: una positiva o potenciadora y otra negativa, perturbadora o
inhibidora. El factor potenciador de la socialización es evaluado mediante cuatro
subescalas: Liderazgo (Li), Sensibilidad social (Ss), Jovialidad (Jv) y Respeto-auto-
control (Ra). Algunos ejemplos de las cuestiones que deben contestar los profesores
son: Deja a sus compañeros/as trabajar o entretenerse sin molestarles, Anima, alaba o
felicita a sus compañeros/as, Hace sugerencias a sus compañeros/as, etc. Por su parte,
los aspectos negativos o inhibidores de la socialización son estimados mediante tres
Evaluación del desarrollo psicosocial 783
subescalas: Agresividad-terquedad (At), Apatía-retraimiento (Ar) y Ansiedad-timi-

dez (An). Algunos ejemplos de los ítems que las conforman son: Rompe pronto cual-
quier cosa que caiga en sus manos, Es envidioso/a de los demás compañeros, Dice que
no vale la pena VIVIY y que quiere morirse, etc. Una octava escala, Criterial-socializa-
ción (Cs), permite efectuar una evaluación global de esta dimensión social.
La BAS-2 es una escala cumplimentada por los padres. Consta de 114 ítems con
cuatro alternativas de respuesta (Nunca, Alguna vez, Frecuentemente, Siempre) y, a
grandes rasgos, es una réplica de la BAS-1, pero adaptada al contexto familiar. Explora
también los dos aspectos dicotómicos de la socialización antes comentados (poten-
ciadores e inhibidores), y comprende las mismas subescalas que forman parte de la
BAS-1. Algunos ejemplos de los ítems que exploran los aspectos facilitadores de la so-
clalización son: Hace nuevas amistades con facilidad, Sabe escuchar a los demás,
Anima, alaba o felicita a otros niños/as, etc. Entre los ítems componentes del factor
de inhibición de la socialización tenemos: Es violento/a y golpea a sus compañeros,
Se ruboriza con facilidad, Es vergonzoso, Entra en casa sin saludar y mirando hacia
abajo. También esta escala para padres comprende una escala de evaluación global, si
bien, a diferencia de la BAS-1, aquí hace sólo referencia a los aspectos negativos de la
conducta.
La BAS-3 es una escala de autoevaluación, cuyo objetivo es indagar la percepción
que los propios sujetos tienen de su conducta social. Consta de 75 ítems con res-
puesta dicotómica (“SÍ”, “NO”). Diez de estos ítems son de control y exploran la sin-
ceridad con la que el sujeto ha respondido a las preguntas formuladas. Comprende
cinco subescalas referidas a dimensiones diferentes integradas en el concepto de so-
cialización: Consideración con los demás (Co), Autocontrol en las relaciones socia-
les (Ac), Retraimiento social (Re), Ansiedad social/timidez (At) y Liderazgo (Li). A
ellas debemos añadir una sexta escala de sinceridad, ya mencionada. Algunos ejem-
plos de los ítems que componen esta escala de autoevaluación son: Me gusta organ:-
zar nuevas actividades, Todas las personas me caen bien, Tomo la iniciativa a la hora
de emprender algo nuevo, etcétera.
Las puntuaciones directas de cada una de las ocho escalas de la BAS-1 y de la BAS-2,
así como de las seis que conforman la BA5-3, se obtienen mediante un juego de plan-
tillas diseñadas para tal fin. Estas puntuaciones brutas se transforman en percentiles,
teniendo en cuenta el sexo y el curso escolar de los sujetos. Finalmente, con estos
percentiles, puede elaborarse un perfil del nivel de adaptación social logrado por el
sujeto. : pes
Con las escalas BAS se han efectuado numerosos estudios psicométricos reter1-
dos a varios parámetros, especialmente a su fiabilidad y validez. Con respecto a la
fiabilidad destacaremos los estudios de consistencia interna que ofrecen coeficientes
que fluctúan entre 0,73 y 0,99. En conjunto, los valores de las tres escalas que con-
forman la batería son altos, especialmente los correspondientes a la BAS-1. En cuanto
a la fiabilidad test-retest, o estabilidad temporal, los coeficientes son algo más bajos,
oscilando entre 0,42 y 0,80. En cuanto a la validez, se han efectuado estudios de vali-
dez criterial tomando como criterio dos parámetros: la adaptación social y grupos de
criterio. Por lo que hace referencia al primer tipo de contraste, los estudios aportan
es-
coeficientes variables según la variante de la batería (BAS-1 O BAS-2) y las distintas
calas de que se compone. En conjunto, son más altos para la BAS-1 y la correlación
784 Teresa Kirchner
media es de 0,44. En cuanto a la validez mediante grupos de criterio, también es va-

riable según la escala concreta que se estima, pero en conjunto parece que discrimi-
nan satisfactoriamente, ya que el 76% de los valores £ son significativos. También se
han efectuado numerosos análisis diferenciales, según la zona de residencia, el tipo
de centro escolar, profesión del padre, sexo de los sujetos, etc., de los que el lector in-
teresado puede obtener abundante información en la citada obra de Martorell
(1988).
132. Test of early socioemotional development (TOESD) [Test de desarrollo

socioemocional temprano] '
El TOESD es una prueba diseñada por Hresko y Brown en 1984 con el objetivo pri-
mordial de obtener medidas ecológicas de la afectividad de niños entre los 3 y los 7
años y 11 meses de edad. Se propone evaluar la competencia socioemocional de los
niños en distintos contextos desde la perspectiva de diferentes personas. Según seña-
lan sus autores, el TOESD puede ser usado con varias finalidades:
a. Para ayudar a identificar a aquellos escolares con sospecha de perturbacio-

nes emocionales, con conductas alteradas o con dificultades de aprendizaje.
b. Para identificar aquellos escenarios o ambientes en los que la conducta del
niño es percibida de forma más desviada de la norma.
c. Para contrastar el grado de desviación percibido por los diferentes observa-
dores o por el propio niño.
d. Para ayudar a planificar programas de intervención conjuntos con padres,
educadores y niños.
e. Para identificar metas de cambio de conducta concernientes a los niños, a
sus padres y a sus maestros.
El TOESD es la versión infantil de Behavior rating profile (BRP), escala anterior

diseñada por Brown y Hammill (1978, 1983). La prueba consta de cuatro subescalas,
cada una de ellas destinada a ser completada por distintos tipos de informadores: pa-
dres, profesores, compañeros y el propio sujeto de evaluación. A partir de estos dis-
tintos evaluadores, el TOESD analiza la percepción de la conducta del niño en dife-
rentes escenarios donde prima la relación social: en casa, en la escuela y en las
relaciones interpersonales con los compañeros. La escala completada por los padres
da una medida ecológica del comportamiento del niño en casa; la escala completada
por el protesor ofrece una visión de su conducta en el marco escolar; el sociograma
rellenado por sus compañeros estima la calidad de sus relaciones interpersonales;
mientras, el cuestionario efectuado por el propio niño aporta información acerca de
los tres contextos (familiar, escolar e interpersonal). A partir de los resultados obte-
nidos de las diferentes escalas se comprueba si la percepción de la conducta de un de-
terminado niño puede considerarse estadísticamente normal o desviada de la norma.
' Esta prueba ha sido traducida y aplicada a población española por Forns y Amador de la Universi-
dad de Barcelona.
785
El examinador puede aplicar las cuatro subescalas o, según sus objetivos, únicamen-
te una o dos. Tres de estas escalas tienen estructura de encuesta o cuestionario: la es-
cala de evaluación del estudiante, la escala de evaluación del profesor y la escala de
evaluación de padres; la cuarta es una medida sociométrica. Analizaremos breve-
mente cada una de estas escalas y sus componentes esenciales.
La escala de evaluación del estudiante se compone de 30 ítems a los que el niño
deberá responder “sí” o “no”. Una característica diferencial con respecto a otros
cuestionarios similares es que el examinador lee al alumno cada uno de los ítems, lo
cual, según Hresko y Brown (1984), contribuye a aumentar la validez y fiabilidad de
la prueba, especialmente en el caso de niños muy pequeños o con dificultades mani-
fiestas para la lectoescritura. El objetivo de esta escala es calibrar la percepción que
tiene el niño de su propia conducta, cómo se relaciona con las figuras de autoridad y
con los demás compañeros. Algunos ejemplos del tipo de pregunta que se formula
son: ¿Te gusta jugar con otros niños?, ¿Tienes muchos amigos?, ¿El trabajo en la es-
cuela es demasiado duro?, ¿Te molesta que las personas mayores te digan lo que debes
hacer?, ¿Tienes muchos dolores de estómago o de cabeza?, etcétera.
La escala de evaluación del profesor consta de 36 frases que el profesor u otras
personas que conozcan a fondo la conducta escolar del sujeto evaluado deben com-
pletar. Se les ofrece cuatro alternativas de respuesta (“Mucho”, “Bastante” “Algo” o
“Nada”). Al igual que en el caso anterior, los ítems van referidos tanto a la conducta
personal del alumno, como a su relación con profesores y otras figuras de autoridad,
como también a las relaciones que establece con sus compañeros. Algunos ejemplos
de esta escala son: El alumno es perezoso, Intimida a otros niños, No se separa fácil-
mente de sus padres, etcétera.
La escala de evaluación para padres consta de 34 ítems que deben completar pa-
dres o, en su caso, tutores que conozcan a fondo al niño. Cada frase presenta cuatro
alternativas de respuesta (“Mucho”, “Bastante” “Algo” o “Nada”). También como
en casos anteriores, pretende evaluar el comportamiento personal del niño, su rela-
ción con las figuras de autoridad en casa y con otros niños en casa o con los vecinos.
Algunos ejemplos de los ítems que se incluyen son: Mi hijo no sigue las normas esta-
blecidas por nosotros, Llora excesivamente, Interrumpe el juego de otros niños, etcé-
tera. ,
El sociograma del TOESD, a diferencia de las tres anteriores escalas, constituye
una técnica de nominación por parte de los compañeros del niño evaluado. Su obje-
tivo es averiguar el puesto que ocupa el sujeto dentro de su grupodecompañeros. Se
compone de tres preguntas, de las cuales el examinador debe elegir una: 57 celebraras
una fiesta, ¿a quién invitarías?, ¿quién querrías que estuviera en ellas, ¿qué amigos te
gustaría tener en tu fiesta de cumpleaños? De todos los chicos de tu clase, ¿quiénes son
tus amigos? La pregunta elegida por el examinador será formulada a todos los niños
de la clase (se necesitan un mínimo de veinte participantes). Es importante que cada
uno delos niños participantes en el sociogramadéun mínimo de tres nombres como
respuesta a la pregunta inicial; en caso contrario, el examinador puede seguir inda-
gando hasta conseguirlo. 2
En relación a la puntuación e interpre tación del TOESD, a partir de las notas bru-
tas, fáciles de calcular sumando las respuest as consider adas críticas en el sentido que
marca la escala, se obtienen dos tipos de puntuaci ones normativas: puntuaciones es-
786 Teresa Kirchner
tándar con media de 10 y desviación típica de 3, y escalas de percentiles. Hallar las

puntuaciones brutas del sociograma entraña algo más de dificultad, efectuándose
por un sistema de ordenación de rangos ponderados. Con las puntuaciones típicas
de las cuatro escalas se elabora un perfil de madurez socioemocional que permite
efectuar contrastaciones entre diferentes marcos ecológicos (casa, escuela y relación
con compañeros) y entre las percepciones de diferentes evaluadores (padres, maes-
tros, compañeros y el propio sujeto). Según los autores, las posibles discrepancias
entre estos perfiles aportan al examinador una información valiosa y le sirven de guía
para formular hipótesis y emitir diagnósticos. Por ejemplo, permite observar si un
niño da altas o bajas puntuaciones asociadas a un determinado marco ecológico, si su
autopercepción es más desfavorable que la que emiten los demás observadores (en
este caso cabría hablar de dificultades en el autoconcepto más que de problemas de
conducta), permite contrastar diferentes percepciones del niño en un mismo marco
ecológico, etc. Un ejemplo lo encontraríamos en las discrepancias entre la escala
contestada por el padre y la madre. Esto podría indicar que el niño se comporta de
forma diferente con cada uno de sus padres, que cada uno de los padres tiene expec-
tativas distintas con respecto al comportamiento de su hijo, o que los dos padres tie-
nen percepciones similares acerca de la conducta de su hijo, pero uno de ellos res-
ponde de forma más cautelosa que el otro. Las combinaciones, como puede
figurarse el lector, son múltiples y dan una extraordinaria riqueza al diagnóstico de
posibles dificultades de tipo socioemocional, a la par que permiten efectuar o diseñar
intervenciones más precisas.
Siguiendo las directrices de Walker (1970) de que los instrumentos de evaluación
socioemocional de edad preescolar deben reunir los mismos criterios de fiabilidad y
validez que los tests cognitivos, Hresko y Brown han construido el TOESD con el
máximo rigor metodológico y ciñéndose a las directrices estipuladas por la Ameri-
can Psychological Association (1974) sobre los tests referidos a la norma. Con res-
pecto a la fiabilidad, el TOESD aporta medidas de consistencia interna y fiabilidad
test-retest. Los coeficientes relativos al criterio de consistencia interna varían según
las edades y la escala concreta administrada entre 0,70 y 0,96. Como señalan los pro-
pios autores, un 53% de los coeficientes supera el 0,90. En relación al criterio test-
retest, los coeficientes son, en conjunto, más altos, cubriendo un arco que va de 0,82
a 0,98. La mayoría de ellos supera el 0,90. Por tanto, cabe señalar que el TOESD goza
de una buena fiabilidad. En relación a la validez se han obtenido medidas de validez
de contenido, validez de criterio y validez de constructo que se adaptan a las exigen-
cias planteadas para este tipo de pruebas. La validez de contenido se obtuvo median-
te la descripción por parte de 143 padres y profesores de niños con alteraciones emo-
cionales e incapacidades para el aprendizaje. La validez de criterio se estimó de
forma concurrente mediante correlaciones con otras medidas de probada validez y
fiabilidad. Los datos indican que el 76% de las correlaciones superan el 0,35. Final-
mente, la validez del constructo se analizó comparando el resultado de la prueba en
grupos de estudiantes con problemas escolares y de conducta y grupos de sujetos
normales. Los resultados son altamente significativos.
787
IV. CONSIDERACIONES SOBRE LA EVALUACIÓN DEL DESARROLLO SOCIAL
Una reflexión final para concluir este capítulo nos lleva a observar que la evaluación
psicológica, desde una perspectiva diacrónica, ha ido centrándose progresivamente
desde la exploración de rasgos individuales y aparentemente fuera de su contexto
ambiental, a contemplar dimensiones relacionales o patrones de conducta dentro de
su contexto ecológico. De aquí que la evaluación de la socialización, en tanto que
conjunto amplio de conductas que posibilitan la autonomía personal y la interrela-
ción con los demás, haya ido tomando fuerza progresiva. De un buen desarrollo so-
cial y socioemocional van a depender aspectos tan importantes como el sentido de la
cooperación, el respeto mutuo, la sensibilidad interpersonal y, de hecho, como
apuntan numerosos autores, la calidad interrelacional va a incidir en posteriores
conductas de vulnerabilidad, inestabilidad y falta de dominancia, así como los pro-
pios procesos de aprendizaje.
De aquí la necesidad de efectuar un seguimiento del desarrollo de los patrones
sociales de conducta de un determinado sujeto, desde los tempranos estadios evolu-
tivos. Es por este motivo que muchas pruebas y tests elaborados para evaluar esta
variable comportamental van dirigidos a población infantil y están adaptados a sus
contextos de máxima significación (familiar y escolar), con énfasis especial en este
último donde, cabe señalar, se está dando un proceso curioso: la dificultad de apren-
dizaje, o el fracaso escolar, si se quiere, ha pasado de interpretarse desde una óptica
puramente del déficit cognitivo, a calibrarse como fruto de desadaptaciones psicoso-
ciales y socioemocionales. Incluso para algunos autores, esta tendencia actual ha im-
primido un giro al papel tradicional desempeñado por el psicólogo escolar, que pasa
de estar ceñido a la evaluación de deficiencias cognitivas, a abarcar un campo más
amplio de detección precoz, prevención y desarrollo de habilidades o conductas so-
ciales y afectivas a fin de lograr una mayor integración personal, escolar e interperso-
nal de los niños.
Adams, G. 5. (1975). Medición y evaluación en educación, psicología y “enidance”. Barcelona.
md Álvarez-Monteserín, M. A., Cañas, A., Jiménez, S. y Petit, M. J. (1990). Desarro-

llo de las habilidades sociales en niños de 3-6 años. Madrid. Visor :
Bornstein, M. R., Bellack, A. S. y Hersen, M. (1977). Social-skalls trarming for unassertive
children: A multiple-baseline analysis. Journal of Applied Behavior Analysis, 10, 183-195.
Brown, L. y Hammill, D. D. (1978, 1983). Behavior Rating Profile. Austin (Tx). PRO-ED.
Ma-
Caballo, V. E. (1993). Manual de evaluación y entrenamiento de las habilidades sociales.
drid. Siglo XXI, 1993. | | |
hiatry, 5,
Doll,E.A 1935) A genetic scale of social maturity. American Journal of Orthopsyc
180-188.
788 Teresa Kirchner
Hresko, W. P. y Brown, L. (1984). TOESD. Test of Early Socioemotional Development. Aus-

tin. Pro-ed.
Hurtig, M. C. y Zazzó, R. (1969). Premiers commentaires sur Péchelle de développement
psycho-social. París. PUF. Laa
Kohn, M. (1977). Social competence, symptoms and underachievement in childhood: A longi-
tudinal perspective. Nueva York. Holt, Rinehart and Winston.
Marshall, R. J. y McCandless, B. T. (1957). A study in prediction of social behavior of pres-
chool children. Child Development, 28, 149-159. P
Matson, J. L., Rotatori, A. F. y Helsel, W. J. (1983). Development of a rating scale to measure
social skills in children: The Matson Evaluation of Social Skills in children. The Matson
Evaluation of Social Skills with youngers (MMESSY). Behavior Research and Therapy, 21,
335-340.
MeFall, R. M. (1982). A review and reformulation of the concept of social skills. Behavioral
Pelechano, V. (1975). Una escala de trastornos de conducta para deficientes mentales. Análisis
y Modificación de Conducta, 0, 129-148.
Pelechano, V. (1976). Una escala de hábitos sociales (AHS-1) en deficientes mentales. Análisis y
Modificación de Conducta, 2, 39-56.
Pelechano, V. y Báguena, M. J. (1980). Normas típicas de la escala ESE-2 de hábitos perturba-
dores de la socialización en ambientes educativos. Análisis y Modificación de Conducta, 6,
537-550.
Pelechano, V. y Barreto, P. (1979). La Escala ESE-1 de factores positivos de la socialización en
ambientes escolares. Análisis yModificación de Conducta, 5, 5-45.
Roff, M., Sells, S. B. y Golden, M. M. (1972). Social adjustment and personality development
in children. Minneapolis. University of Minnesota Press.
Rubin, K. H. (1982). Social and social-cognitive developmental characteristics of young isila-
te, normal, and sociable children. En K. H. Rubin y H. S. Ross (dirs.), Peer relationships
and social skills in childhood. Nueva York. Springer-Verlag.
Silva, F. y Martorell, M. C. (1983). BAS 1-2. Batería de socialización. Manual. Madrid. TEA.
Silva, F. y Martorell, M. C. (1987). BAS 3. Batería de socialización. Manual. Madrid. TEA.
Silva, F., Martorell, M. C. y Pelechano, V. (1981). Dimensiones de socialización escolar: re-
sultados obtenidos en base a una investigación con escalas de estimación. En R. Fernán-
dez-Ballesteros (dir.), Nuevas aportaciones en evaluación conductual. Madrid. Alfaplús.
Spivack, G. y Swift, M. (1973). The classroom behavior of children: A critical review of tea-
cher-administered rating scales. Journal of Special Education, 7, 55-89.
Walker, H. M. (1970). Walker Problem Behavior Identification Checklist. Los Ángeles.
Western Psychological Services.
Wood, R., Michelson, L. y Flynn, J. (1978). Assessment of assertive behavior in elementary
school children. Comunicación presentada en el Annual Meeting of the Association for
Advancement of Behavior Therapy. Chicago, EEUU.
Zigler, E. y Trickett, P. (1978). 1. Q., social competence, and evaluation of early childhood in-
tervention programs. American Psychologist, 33, 789-798.
Álvarez, A., Álvarez-Monteserín, M. A., Cañas, A., Jiménez, S. y Petit, M. J. (1990). Desarro-
llo de las habilidades sociales en niños de 3-6 años. Madrid. Visor.
Evaluación del desarrollo psicosocial 789
Kohn, M. (1977). Social competence, symptoms and underachievement in childhood: A longi-

tudinal perspective. Nueva York. Holt, Rinehart and Winston.
Roff, M., Sells, S. B. y Golden, M. M. (1972), Social adjustment and personality development
in children. Minneapolis. University of Minnesota Press.
Zigler, E. y Trickett, P. (1978). 1. Q., social competence, and evaluation of early childhood in-
tervention programs. American Psychologist, 33, 789-798.
peleuse,
e
vas Y. y Hágueos. 463LIO Monta

Sl E cifiacin de Cond
pla del
ya $
Y
LR da A
ES
4
. A sl ins
+
pecasa de oc
Mbs a pc. AS y PAGAR ade Corina, 55, eN
Ñ A ] + WE Ps 8 eN "LE e cala nod on E] ole* me
50d - Ñ aL pan el Misses ts Pa KI, maÑ

á e 5 E
. Pi á ent Al (és ansia
, F
ME
¿
Row peta 02 pad
1p99485
CHINET> y A MS HAS Y
eta de war e vd Madrid A
y Le 317 A : [Mad ¿ÑTEA: Y
E ed reci éso lane :

> esti 1 me K..1Fernán
; sal. Madad, NyMopliús, *
MICA MOVIE at tex
t. Los Angeles.
; > AS
> > mu
3
32. EVALUACIÓN DE LOS PROBLEMAS EMOCIONALES
Y CONDUCTUALES EN NIÑOS
ALAN E. KAZDIN
I INTRODUCCIÓN
La investigación de los problemas emocionales y conductuales en niños no se ha rea-

lizado de modo sistemático hasta hace poco tiempo. La ignorancia de los trastornos
de la infancia, en especial si se compara con la amplia investigación de los trastor-
nos en adultos, puede explicarse por un conjunto de factores interrelacionados. En
primer lugar, las ideas dominantes sobre las limitaciones de los niños han desalenta-
do en ocasiones la evaluación de varias formas de trastornos clínicos. Por ejemplo, la
opinión dominante era que la depresión como trastorno clínico en los niños no po-
día experimentarse debido al inadecuado desarrollo intrapsíquico (superego) (Mah-
ler, 1961; Rie, 1966). Investigaciones recientes han demostrado que la depresión,
además de otros muchos trastornos, puede ser identificada en niños de modo fiable
y consiguientemente investigarse con rigor. En segundo lugar, y relacionado con lo
anterior, ha existido un interés constante en que los niños son incapaces de informar
sobre sus propios problemas emocionales y conductuales. Pero, si bien es cierto que,
dependiendo de la edad del niño, el desarrollo cognitivo puede limitar las perspecti-
vas que los niños adoptan a reflexionar sobre su propio funcionamiento, en cambio
los avances en evaluación han mostrado que los niños pueden informar fácilmente
sobre una amplia gama de experiencias, sentimientos y dominios de funcionamien-
to. Finalmente, existe considerable ambigiedad al identificar muchos problemas
emocionales y conductuales en niños. Muchas conductas que los padres, maestros y
los propios jóvenes consideran problemáticas surgen y son relativamente comunes
en el curso normal del desarrollo (MacFarlane, Allen y Honzik, 1954; Lapouse y
Monk, 1958). Entre los muchos ejemplos están una variedad de miedos, períodos de
llanto, peleas, pesadillas y enuresis. Aunque las conductas se identifican a menudo
por padres y maestros como problemas al principio de la infancia, normalmente es-
tas conductas no son señal de desajustes o trastornos clínicos en la etapa adulta. El
patrón normal es la atenuación de las conductas problemáticas durante la infancia y
la adolescencia. El hecho de que cambios notables ocurran en conductas infantiles
problemáticas durante el desarrollo ha contribuido a dificultar la delimitación de la
gama de trastornos infantiles. Parte de las dudas al realizar investigaciones sobre
problemas emocionales y de conducta en niños se ha debido a la ambigúedad al deci-
dir qué problemas remitían en el curso normal del desarrollo y cuáles requerían in-
tervención.
University of Yale (EE UU).

792 Alan E. Kazdin
Varios avances han hecho aumentar la atención hacia los trastornos y su evalua-
ción. Entre éstos han destacado los progresos en diagnósticos psiquiátricos. Histór1-
camente, el diagnóstico en la práctica e investigación clínica se ha centrado principal-
mente en trastornos evidentes en la edad adulta. Pocos tipos de trastornos se
reconocían como evidentes en la infancia. En los últimos quince años, los sistemas
de diagnóstico han destacado aquellos trastornos que surgen en la infancia, niñez y
adolescencia. Las últimas versiones del Diagnostic and statistical manual of mental
disorders (DSM) (American Psychiatric Association, 1987, 1994) y la International
classification of diseases (ICD) (World Health Organization, 1988) reconocen un
gran número de trastornos que experimentan los niños. La especificación de múlti-
ples trastornos y los esfuerzos para emplear términos descriptivos en lugar de etioló-
gicos para identificarlos ha conducido a la investigación de los trastornos infantiles.
Naturalmente, el interés en una amplia variedad de trastornos ha requerido el de-
sarrollo de métodos de evaluación. En la última década han aparecido numerosas
técnicas para la evaluación de gran cantidad de problemas emocionales y conductuales
en niños.
El propósito del presente capítulo es describir la evaluación de los problemas
emocionales y conductuales en niños. El capítulo presenta los campos de evaluación
y los principales tipos de medidas empleados en la actualidad. Las estrategias e ins-
trumentos de evaluación específicos se ilustran con medidas de muestra de la litera-
tura sobre el tema. También se tratarán cuestiones y obstáculos que se presentan al
evaluar a niños junto con recomendaciones para la evaluación con fines clínicos y de
investigación.
II. EL ÁMBITO DE LA EVALUACIÓN
La evaluación de los problemas emocionales y conductuales en niños abarca tres

amplios campos. El primero y más evidente es la evaluación de los problemas emo-
cionales y conductuales mismos, entre los que se incluyen la ansiedad, depresión, hi-
peractividad, inadaptación social, trastornos mentales, tics, trastornos alimenticios,
entre otros. La tarea de la evaluación psicológica consiste en evaluar el tipo, la grave-
dad, la magnitud y cronicidad de los problemas emocionales y conductuales. Las ca-
racterísticas de los niños varían ampliamente en función de la edad y fase del de-
sarrollo. De este modo, la evaluación del funcionamiento del niño depende de una
perspectiva del desarrollo que considera el proceso del cambio, el origen y las fluc-
tuaciones en los campos de la actuación, y la evaluación con respecto al desarrollo.
Datos sobre las normas que permitan la comparación de niños a iguales del mismo
sexo y edad, y datos longitudinales que permitan examinar la relación del funciona-
miento en el presente y el ajuste futuro son de especial importancia al evaluar las ca-
racterísticas emocionales y conductuales de los niños.
El segundo campo es la evaluación de la competencia prosocial y el funciona-
miento adaptativo. Este campo refleja el interés en identificar cómo se comportan
los niños en áreas que indican un ajuste positivo. El ajuste y el bienestar no son me-
ramente la ausencia de daño sino que se refieren a la presencia de fuerzas personales
Evaluación de los problemas emocionales y conductuales en niños
793
e interpersonales que promueven un funcionamiento óptimo. La competencia pro-

social, la interacción interpersonal positiva, la habilidad para hacer frente al estrés y
la adversidad, la participación en actividades, y las relaciones con los otros son ámbi-
tos destacados de interés en la evaluación del funcionamiento adaptativo.
El tercer campo pertenece a los factores contextuales que influyen en los proble-
mas emocionales y conductuales de los niños. Teóricamente se puede identificar una
cantidad enorme de influencias (por ejemplo, condiciones de vida, clase social, con-
ducta de los hermanos...); sin embargo, las áreas primordiales de interés son el fun-
cionamiento de los padres y la familia debido a la dependencia que tiene el niño de
sus padres. Este funcionamiento incluye múltiples esferas tales como los trastornos
clínicos de los padres, el estrés, la violencia y los conflictos en el hogar, la forma de
educar a los niños y el apoyo social del padre, entre otros.
De los tres campos, la atención de la investigación y la práctica se ha centrado
principalmente en la evaluación de los problemas emocionales y conductuales mis-
mos. Los procedimientos de evaluación mejor desarrollados son los que se centran
en los problemas del niño, más que en el funcionamiento prosocial y adaptativo. Por
consiguiente, las ilustraciones para presentar la práctica y medidas actuales se toma-
rán principalmente del primer campo.
III. MÉTODOS DE EVALUACIÓN
La gama de técnicas existentes para la evaluación de los problemas emocionales y de

conducta en niños es extraordinariamente amplia (Mash y Terdal, 1988; Ollendick y
Hersen, 1993), sin que exista un único sistema de clasificación que organice los dis-
tintos métodos dentro de un marco coherente. Ante esta situación podemos identifi-
car varias características que distinguen las actuales técnicas de evaluación.
m1. Especificidad de la evaluación

Las técnicas de evaluación varían en la diversidad de áreas de funcionamiento que
abarcan. En un extremo están las baterías de medidas que evalúan varias áreas del
funcionamiento infantil; por ejemplo, las escalas de estimación del padre y del profe-
sor son las medidas más comunes para la evaluación de los problemas emocionales y
de conducta en niños. Normalmente, cada técnica incluye un gran número de ítems
que refleja los distintos campos del funcionamiento tales como ansiedad, depresión,
agresión, delincuencia, hiperactividad o aislamiento social. En el otro extremo se si-
túan los instrumentos que evalúan un único ámbito de respuesta, por ejemplo, las
que se centran en áreas como la depresión,laansiedad o la delincuencia. e]
Según su nivel de especificidad las técnicas de evaluación presentan distintas ven-
tajas. Los cuestionarios generales y las escalas de estimación proporcionan la evalua-
ción de varios campos y por tanto permiten obtener un perfil del niño; éste consiste
en medidas individuales de cada campo o subescala, revelando qué trastorno es más
grave, probl emático o agudo entre los que se evalúan en el individuo. Además, si
794 Alan E. Kazdin
existen datos de una norma, se puede examinar su posición en cada escala en relación
con sus compañeros. Así, los resultados de una escala general aportan mucha infor-
mación. | :
Tanto en la práctica clínica como en la investigación es muy útil la evaluación de
áreas múltiples de problemas emocionales y de conducta. La razón es que la investi-
gación ha demostrado que muchos problemas están relacionados (Jessor y Jessor,
1977; Elliot, Huizinga y Menard, 1988). De este modo, los individuos con trastor-
nos clínicos en un área son proclives a mostrar trastornos en otras (Caron y Rutter,
1991). Por ejemplo, los niños que muestran signos de depresión, a menudo presen-
tan ansiedad. Las baterías de evaluación que muestrean distintos campos identifican
un conjunto de áreas que pueden ser problemáticas y requieren atención. En el tra-
bajo clínico, estas baterías ayudan a comprobar que no se pasan por alto parcelas del
funcionamiento, aunque referidas al caso pueden estar basadas en un grupo particu-
lar de síntomas.
Los instrumentos de evaluación que se centran en campos de funcionamiento
específicos tales como la depresión o ansiedad infantiles evalúan áreas de problemas
específicas. Estos instrumentos pueden incluir subescalas de interés. Por ejemplo, el
autoconcepto se ha considerado y evaluado generalmente como una única dimen-
sión general de la autoestima; sin embargo, recientemente se han desarrollado eva-
luaciones adicionales que se centran en múltiples áreas de autoestima, tal como
aparecen reflejadas en las esferas más específicas de las relaciones sociales, el rendi-
miento académico, la apariencia física y las relaciones familiares (Offer, Ostrov y
Howard, 1984; Harter, 1990). Aunque los instrumentos se centren en un único cam-
po (el autoconcepto o la autoestima), otras subáreas son delimitadas. El hecho de
distinguir entre subcampos permite análisis más precisos y la distinción entre jóve-
nes en relación al autoconcepto.
112. Fuentes de información

La evaluación de los problemas emocionales y conductuales en niños varía según la
fuente de información (o informante) empleada para obtener los datos sobre el niño.
Entre las opciones más frecuentes están los informes de niños, padres, maestros,
compañeros y psicólogos. Los padres son normalmente la fuente primaria de infor-
mación por estar fácilmente disponibles como informadores y ser conocedores de la
conducta del niño en períodos largos y situaciones variadas. Además, los padres jue-
gan un papel central identificando trastornos infantiles y llevando a los niños para
solicitar tratamiento. Por ello, su visión de los niños es fundamental. Las evaluacio-
nes de los padres se obtienen generalmente a través de escalas estándar de estimación
que evalúan varios campos del funcionamiento infantil tales como la agresión o hi-
peractividad.
Los informes del propio niño son también empleados, en particular con niños de
sels O siete años. Existen distintas opiniones sobre los límites de edad para obtener
una evaluación significativa. Sin duda, el tipo de instrumento, su enfoque y nivel de
funcionamiento del niño son relevantes para realizar una evaluación concreta. El
desarrollo cognitivo —por ejemplo, la habilidad para reflexionar sobre la propia
795
conducta, y lacomprensión de la lengua escrita y hablada— puede imponer límites

en el tipo de instrumentos que se administran a niños. Dependiendo de la edad, los
instrumentos se suelen leer al niño o completarse como tests de lápiz y papel. El
autoinforme del niño ha demostrado ser una fuente de información válida y valiosa
en diversos problemas emocionales y conductuales (LaGreca, 1990). Las objeciones
de que los jóvenes ocultan información o introducen alteraciones mayores que las
evidentes en evaluación con adultos no están suficientemente fundamentadas.
Los maestros y compañeros también resultan útiles para evaluar los problemas
emocionales y conductuales en los niños. Se considera que ambos aportan perspecti-
vas especiales. Los maestros ven a los niños diariamente en actividades estructuradas
y no estructuradas y en relación con otros compañeros de la misma edad. De ahí que
su perspectiva aporte información única que es improbable que se duplique con la
obtenida de los padres. Lo mismo sucede con las evaluaciones de los compañeros.
La ventaja de los compañeros estriba en que se observan en una amplia gama de si-
tuaciones y durante largos períodos y, por tanto, poseen una buena base para su eva-
luación. Las evaluaciones de compañeros se han usado en una serie de campos que
coinciden con los evaluados por padres, maestros y autoinformes; no obstante, el
rasgo distintivo de la evaluación de un compañero es el ámbito del funcionamiento
interpersonal. El grado de rechazo, la amistad y, más generalmente, la interacción
personal se basan en informes de compañeros. El interés en las evaluaciones de com-
pañeros surge de los límites comprobados entre problemas tempranos con compa-
ñeros y trastornos clínicos posteriores. Así por ejemplo, el rechazo a los compañe-
ros se correlaciona con dificultades de ajuste del niño, así como con problemas
emocionales y conductuales en la adolescencia y madurez (Parker y Asher, 1987;
Landau y Milich, 1990).
Las evaluaciones realizadas por psicólogos y otros profesionales de salud mental
se emplean en ocasiones, aunque con menor frecuencia que las de padres y maestros.
Una excepción en la que las evaluaciones clínicas se aplican más es en el diagnóstico
clínico. Las entrevistas de diagnóstico aportan información sobre el funcionamiento
infantil. El entrevistador clínico a menudo integra información de distintas fuentes
(niños, padres, maestros, impresiones personales...) al evaluar la presencia, duración
y gravedad de los síntomas '.
1.3. Modalidad de la evaluación
La modalidad de la evaluación se refiere al formato. Las modalidades más frecuentes

en la evaluación de trastornos infantiles incluyen la entrevista, los cuestionarios,
tests de lápiz y papel y observaciones directas; Otras modalidades incluyen tests neu-
ropsicológicos (por ejemplo, para evaluar la actuación cognitiva, perceptiva y psico-
motriz), tests proyectivos (por ejemplo, para evaluar aspectos intrapsíquicos). Cada
de conducta, tal
1 El término “síntoma” se emplea para hacer referencia a una característica O rasgo
se reflej 2 en el afecto, conducta o cognición. En a
consonanci a con su uso actual en diagnóstico,
como resultado de
“síntoma” no implica un modelo de enfermedad d ene el quee elel síntoma se considere
“ínte
causas subyacentes (por ejemplo, primordialmente intrapsíquicas).
3 Alan E. Kazdin
una de estas áreas representa un ámbito destacado por sí mismo. En situaciones clí-
nicas, así como en investigación de trastornos infantiles, se presta frecuente atención
a las entrevistas, cuestionarios y observaciones directas. Por ello, se incluyen en el
presente capítulo (véanse las lecturas sugeridas que incluyen todas las modalidades
empleadas con niños).
En los últimos años, las entrevistas para evaluar psicopatologías se han empleado
a menudo para identificar de forma sistemática la variedad de síntomas y trastornos
que experimentan los niños. Diversos estudios con pacientes y comunidades han de-
mostrado la utilidad de las entrevistas de diagnóstico (Orvaschel, Ambrosini y Rabi-
novich, 1993). En los procedimientos de diagnóstico, el padre o la madre son entre-
vistados y preguntados sobre los síntomas del niño, el cual es entrevistado aparte
para solicitar información similar. Las discrepancias entre los informes de los padres
y los de los niños se resuelven en reuniones con ambos o buscando una tercera fuen-
te, como puede ser el maestro.
Los cuestionarios, inventarios, escalas de evaluación y otros tests de lápiz y papel
son los instrumentos más utilizados en la evaluación de los trastornos infantiles. Al-
gunos de éstos son accesibles a padres, maestros y niños, tal como se ilustra más ade-
lante. Las ventajas de los cuestionarios son que abarcan una diversidad de campos de
funcionamiento y se administran con relativa facilidad. Estas ventajas también facili-
tan una normalización a gran escala para obtener datos normativos de las medidas y
evaluar propiedades psicométricas. De este modo, los tests de lápiz y papel son los
instrumentos más válidos y estudiados en la evaluación de problemas emocionales y
conductuales de los niños.
La observación directa se aplica ocasionalmente para la evaluación infantil. Exis-
ten distintos tipos de métodos de observación directa. Algunas medidas directas
consisten en presentar tareas al niño y registrar respuestas características. Por ejem-
plo, en los tests de inteligencia estándar (por ejemplo, la escala de inteligencia
Wechsler para niños) se pueden presentar varias tareas y observar la actuación. La
observación directa en evaluación clínica se refiere a menudo a la observación de la
conducta en la vida diaria. Las observaciones se pueden realizar en casa, en el cole-
gio, en la comunidad o en la clínica. Además, la conducta en casa puede evaluarse en-
viando a un observador al domicilio. Los códigos de observación se han desarrolla-
do para calificar las conductas del niño (por ejemplo, rabietas o peleas), así como las
de los padres (por ejemplo, elogios o reprimendas). Igualmente, las observaciones se
realizan en el colegio para evaluar el comportamiento del niño en clase y la interac-
ción social en el juego. En trabajos clínicos con niños individuales se desarrollan ins-
trumentos para que los padres completen la evaluación en casa registrando campos
conductuales de interés (por ejemplo, obediencia o interacción social).
IIL.4. Situación
Los medios de evaluación varían en el modo de considerar la actuación en las diver-

sas situaciones. Algunos instrumentos se centran en características generales (por
ejemplo, rasgos y habilidades) que se considera que varían poco en función de las
distintas situaciones o contextos. Por el contrario, otros instrumentos están diseña-
797
dos para evaluar la actuación en situaciones específicas (por ejemplo, en casa o en el

colegio) con la idea de que la actuación en la situación es de interés directo. Es im-
portante evaluar el funcionamiento de un niño en distintas situaciones al menos por
dos razones. Primero, algunas conductas de interés son más evidentes y se evalúan
con más facilidad en algunas situaciones que en otras; por ejemplo, la hiperactividad
en los niños se aprecia con mayor precisión por los maestros en clase que por los pa-
dres en casa. Segundo, la actuación en distintas situaciones no se correlaciona nece-
sarlamente en gran medida (Kazdin, Siegel y Bass, 1992). Por ejemplo, las estimacio-
nes de padres y maestros acerca de la desviación infantil no muestran más que
moderadas correlaciones. Así, la evaluación del funcionamiento de la conducta in-
fantil en casa y en el colegio aporta información relevante.
En definitiva, la especificidad de las evaluaciones, fuentes de información, moda-
lidad de evaluación y situación reflejan rasgos destacados que distinguen los instru-
mentos y las prácticas de la evaluación infantil. En la investigación y en la práctica
clínica, la evaluación ha puesto el énfasis en los tests de lápiz y papel —en particular
las escalas de evaluación completadas por padres y maestros— debido a las razones
expuestas con anterioridad. Sin embargo, existe una gran cantidad de instrumentos
de evaluación, por lo que a continuación se discuten e ilustran los más importantes.
IV. INSTRUMENTOS DE EVALUACIÓN
1v.1. Funcionamiento del niño
El funcionamiento del niño se evalúa de modos diversos. A continuación se descri-

ben los instrumentos más destacados empleados en la evaluación de los problemas
emocionales y de conducta de los niños. Los instrumentos han sido seleccionados
por ser los más utilizados.
IV.1.1. Diagnóstico
En los últimos quince años se ha producido una serie de avances enel diagnóstico de
los trastornos en niños y adolescentes encaminados a una mejor delimitación y espe-
cificación de una amplia gama de problemas clínicos que surgen en estas edades. Los
esfuerzos en desarrollar criterios para una gran cantidad de trastornos ha dado lugar
al desarrollo de instrumentos para su diagnóstico. Entre éstos la entrevista se ha con-
vertido en una herramienta central de investigación. $
El diagnóstic o se suele completar con una entrevista en la que se obtiene infor-
mación sistemática de varios grupos de síntomas. Para niños entre 6 y 18 años de
edad se han desarrollado diversos instrumentos de diagnóstico entre los que desta-
can la Schedule of affective disorders and schizophrenia for school-age children [Pro-
tocolo para trastornos afectivos y esquizofrenia para niños en edad escolar], la Diag-
nostic interview for children and adolescents [Entrevista Coen ds niños y
adolescentes] y la Diagnostic interview schedule for children [Protocolo de entrevis-
798 Alan E. Kazdin
ta diagnóstica para niños] (Edelbrock y Costello, 1988; Hodges y Zeman, 1993; Or-
vaschel y cols., 1993). Los instrumentos difieren en el marco temporal que abarcan,
esto es, si evalúan diagnósticos del momento presente, pasado o ambos. Las técnicas
también varían en su estructura o formato. Las entrevistas estructuradas proporcio-
nan preguntas y respuestas alternativas en formatos fijos que permiten poca o nin-
guna variación en la presentación de los ítems al niño. Los formatos semiestructura-
dos aportan una mayor flexibilidad en la administración; las formas alternativas se
dan al entrevistador para que obtenga información. Para la mayoría de las entrevistas
de diagnóstico se hace uso de fuentes de información múltiples. Típicamente, padres
e hijos se entrevistan de forma separada preguntándoseles acerca de la gama comple-
ta de síntomas requeridos para obtener un diagnóstico.
El formato y método del diagnóstico puede ilustrarse con el Schedule for affecti-
ve disorders and schizophrenia for school-age children (K-SADS) [Protocolo para tras-
tornos afectivos y esquizofrenia para niños en edad escolar] (Chambers y cols.,
1985). Este instrumento se configura según el formato de la Schedule for affective di-
sorders and schizophrenia [Protocolo para trastornos afectivos y esquizofrenia] de
Endicott y Spitzer (1978) que se ha aplicado para el diagnóstico de trastornos en
adultos. En el X-SADS se examina un gran número de síntomas para permitir un diag-
nóstico basado en el criterio del DSM-111. Las revisiones de la entrevista han incorpo-
rado cambios en el diagnóstico basándose en el DSM-I11-R (American Psychiatric
Association, 1987) que han alterado algunos de los criterios de diagnóstico (Ambro-
sini y cols., 1989). Existen versiones separadas del K-SADS, así una de las versiones
evalúa trastornos crónicos y agudos (versión epidemiológica), considerando sólo la
presencia o ausencia de cada síntoma; otra versión se centra en trastornos agudos
(versión de los episodios actuales), evaluando la gravedad de cada uno de los sín-
tomas.
La evaluación diagnóstica basada en el K-SADS empieza con una entrevista no es-
tructurada en la que se hacen preguntas generales sobre el funcionamiento del niño
en casa, en el colegio, sus relaciones con los demás, sus dificultades emocionales y
conductuales, y el motivo para el tratamiento clínico. Tras completar la entrevista no
estructurada comienza la sección semiestructurada. Durante ésta se evalúa una am-
plia gama de síntomas específicos. Para cada síntoma, el entrevistador hace pregun-
tas que determinan si el síntoma está presente, y de ser así, en qué grado. Un ejemplo
del tipo de preguntas que pueden plantearse aparece en el cuadro 32.1; las preguntas
reflejan sondeos que el examinado puede realizar para identificar la presencia y gra-
vedad del síntoma. No se hacen todas las preguntas. Más bien las preguntas sirven de
guía para ayudar al entrevistador a obtener la información requerida. La evaluación
continúa con un gran número de cuestiones para identificar la presencia, gravedad y
duración de los síntomas específicos. La prueba se administra separadamente a pa-
dres e hijos, proceso que requiere entre una y dos horas para completarse. Las dis-
crepancias se resuelven para llegar a un consenso sobre la presencia de síntomas es-
pecíficos.
La fiabilidad y validez del diagnóstico es un tema de considerable interés. En ge-
neral, las propiedades psicométricas varían en función de los distintos trastornos y
con las diferentes versiones del K-SADS. En la última revisión, el acuerdo entre los en-
trevistadores indica que los diagnósticos pueden ser consistentes en diferentes tras-
799
CUADRO 32.1. EA del Schedule for affective disorders and schizophrenia for school-age
c q (K-SADS) [Protocolo para trastornos afectivos y esquizofrenia en edad
escolar,
AUTOIMAGEN NEGATIVA
Incluye sentimientos de insuficiencia, inferioridad, fracaso y carencia de

valor, autodes-
precio, inutilidad.
— ¿Cómo te sientes contigo mismo/a?

— ¿Te desapruebas a ti mismo/a?
— ¿Te gustas como persona?
— ¿Por qué?
— Descríbete
— ¿Te consideras feo/a? ¿Cuándo?
— ¿Crees que eres brillante o estúpido/a? ¿Por qué?
— ¿Piensas así a menudo?
— ¿Crees que eres mejor o peor que tus amigos?
— ¿Es alguno de tus amigos peor que tú?
— ¿En qué eres bueno/a?
— ¿Algo más?
— ¿En qué eres malo/a?
— ¿Cuántas veces sientes esto hacia ti?
— ¿Qué te gustaría cambiar de ti?
sin información
nada
ligeramente, sentimientos esporádicos de insuficiencia
en cierta medida, con frecuencia se siente inadecuado, o le gustaría cambiar su as-
pecto, su mente o su personalidad.
moderadamente, con frecuencia se siente fracasado o le gustaría cambiar a 2
SU
AE
O gravemente, sentimientos frecuentes de inutilidad, o querría cambiar todo a 3. En
Ocasiones dice que se odia.
tornos para información proporcionada por padres e hijos (kappa media = 0,86 y
0,79, respectivamente). La consistencia interna (alfa de Cronbach) para varios tras-
tornos y calificación de síntomas también es alta, alcanzando o superando el valor de
0,90 (Ambrosini y cols., 1989). La base primaria para la validez del K-SADS viene de
estudios de trastornos específicos y sus correlaciones, en particular el estudio de los
trastornos afectivos. Los niños deprimidos, identificados por el K-SADS e instrumen-
tos de diagnóstico similares, muestran diferencias de fiabilidad en una serie de carac-
terísticas (por ejemplo, marcas biológicas, otras medidas de depresión...) (Kazdin,
19904). Además, las observaciones de la gravedad de los síntomas en el K-SADS re-
flejan cambios terapéuticos después del tratamiento de niños con depresión (Puig-
Antich y cols., 1987). : aloe
El K-SADS y otros instrumentos similares de diagnóstico se aplican cada vez
más en la investigación clínica. Sin embargo, hay que hacer varias consideracio-
nes en la selección de los instrumentos de diagnóstico como parte de la batería
de evaluación. En primer lugar, entre los estudios disponibles, bien con el k-
SADS o instrumentos similares, el diagnóstico no proporciona una fiabilidad con-
sistente (test-retest, consistencia interna) entre los trastornos. En muchos estu-
800 Alan E. Kazdin
dios, el acuerdo en la interestimación para varios trastornos está muy por deba-
jo de los niveles aceptables (Orvaschel y cols., 1982; Kashani y cols., 1985;
Ivens y Rehm, 1988). Diagnósticos más específicos (por ejemplo, tipo de tras-
torno de ansiedad) se asocian con fiabilidades más bajas que la categoría más
amplia (por ejemplo, trastornos de ansiedad). En segundo lugar, los padres y
los niños son entrevistados por separado y con frecuencia proporcionan infor-
mación discrepante. PUPTET
Los sistemas de diagnóstico continúan su evolución y las limitaciones tanto de
fiabilidad como de validez pueden deberse en cierta medida a ambigúedades de las
propias categorías del diagnóstico. Por ello, es probablemente más útil discutir la fia-
bilidad y validez de los instrumentos de diagnóstico en relación con los tipos con-
cretos de trastornos en los que los datos apoyan una combinación de síntomas, que
aplicar los instrumentos a todo tipo de trastornos. Existen consideraciones prácticas
para emplear instrumentos de diagnóstico estándar. Las pruebas requieren un tiem-
po considerable para su administración. Al final, el resultado de muchos instrumen-
tos es la mera presencia o ausencia de diagnósticos alternativos. En muchas situacio-
nes, la necesidad de invertir demasiado tiempo para la evaluación del diagnóstico en
relación con los resultados limita su utilización. Otras pruebas administradas de for-
ma más práctica como las escalas de evaluación aportan a menudo información clíni-
camente útil y más fiable.
1V.12. Autoinforme del niño
Las técnicas de autoinforme hacen que el niño comente o evalúe directamente su

propio funcionamiento. Como ya se ha dicho, hay pocos estudios que empleen el
autoinforme con menores de seis años y existen pocas medidas con propiedades
comprobadas para esas edades. Desde los 6 ó 7 años y durante la adolescencia el
autoinforme se usa de forma extendida. Las pruebas están desarrolladas para evaluar
los distintos campos de funcionamiento incluyendo la autoestima, lugar de control,
ansiedad, depresión, soledad, desesperación, agresión o delincuencia (LaGre-
ca, 1990).
Entre estos autoinformes destaca el Children depression inventory (CDI) [Inven-
tario de depresión infantil] (Kovacs, 1981). Este instrumento está basado en el In-
ventario de depresión de Beck (Beck y cols., 1961) que ha sido utilizado ampliamen-
te para evaluar la depresión en adultos. El CDI es la prueba más empleada en la
evaluación de la depresión en niños de edades comprendidas entre 6 y 13 años. La
prueba incluye 27 ítems que consideran los aspectos cognitivos, afectivos y conduc-
tuales de la depresión. Los niños leen los ítems (o alguien se los lee), seleccionando
en cada uno de ellos una de las tres opciones que lo caracterice en las últimas dos se-
manas. Por ejemplo, en uno de los ítems los niños han de seleccionar una de estas
opciones:
a. Estoy triste de vez en cuando.

b. Estoy triste a menudo.
Cc. Estoy triste siempre.
801
_ La calificación del niño (0, 1 6 2 en el ejemplo anterior) se basa en la afirmación

más extrema que se seleccione (en relación con la depresión) en cada ítem. El cóm-
puto total se obtiene sumando todos los ítems.
El CDI está diseñado para ser completado por niños. No obstante, esta prueba, al
igual que otras muchas de autoinforme infantil, se redacta a veces para que padres y
maestros la completen. En la versión redactada los padres o maestros califican al
niño en cada síntoma. La validez de la medida de estas formas ha sido demostrada en
abundantes estudios del CD7 (Kazdin, 19904). Se ha mostrado que el CDI muestra
una elevada consistencia interna (alfa de Crombach superior a 0,80) y una moderada
fiabilidad test-retest (de una semana a seis meses) al distinguir grupos clínicos y no
clínicos de niños y al correlacionarse en un grado de moderado a alto con otras me-
didas de depresión y de aspectos relacionados como la autoestima, percepción de la
competencia personal, atribuciones cognitivas negativas, desesperación, etc. (Ko-
vacs, 1981; Kazdin y cols., 1983; Saylor y cols., 1984a; Saylor y cols., 1984b; Weisz y
cols., 1987). Los datos normativos que han aparecido en éstos y otros estudios para
facilitar la evaluación del nivel de depresión de niños con relación a sus compañeros
de edad y sexo hacen que sea uno de los instrumentos más utilizados (Finch, Saylor
y Edwards, 1985; Smucker y cols., 1986; Nelson y cols., 1987).
Los resultados también han puesto de manifiesto ambigúedades con respecto al
CDI. Por ejemplo, resultados concretos de los estudios citados indican que el CD/ no
discrimina siempre a niños deprimidos de niños con otros diagnósticos. Los datos
del test-retest también son complejos. En intervalos breves como una semana se en-
cuentran correlaciones bajas y elevadas (desde 0,38 a 0,87) para niños “normales” y
emocionalmente alterados respectivamente (Saylor y cols., 1984b). Más frecuente-
mente aparecen correlaciones moderadas test-retest en períodos de varias semanas
(Kovacks, 1981; Kazdin y cols., 1983). Puede haber diferencias importantes en la es-
tabilidad de los cálculos de gravedad del CD7 en función de la edad, el sexo y las
muestras clínicas frente a no clínicas.
Las técnicas de autoinforme tales como el CD7 son extremadamente útiles en in-
vestigación y en el trabajo clínico. La facilidad de administración y calificación y la
amplia gama de aspectos que pueden evaluarse son ventajas de este formato de eva-
luación. Por ejemplo, el instrumento probablemente más investigado sea el Minne-
sota multiphasic personality inventory (MMP1) [Inventario multifásico de personali-
dad de Minnesota]. Recientemente, el MMPI ha sido revisado dando lugar al MMPL-2
(Graham, 1990); como parte del procedimiento de renormalización se ha desarrolla-
do una versión para adolescentes (MMPI-A) que permite la evaluación de múltiples
campos de la psicopatología y personalidad (Williams y cols., 1992).
1v.13. Informe de los padres y el profesor

Las medidas realizadas por otras personas significativas, en concreto padres y maes-
tros, son los métodos empleados con más frecuencia en la evaluación de problemas
emocionales y conductual es en niños. Como se mencionó anteriormente, la gama de
conductas y situaciones que cu bren padres y maestros al completa r sus estimaciones
es uno de los aspectos más importantes de la evaluació n. Entre las medidas más usa-
802 Alan E. Kazdin
das están los cuestionarios generales que muestrean una gran variedad de conceptos.
Un gran número de cuestionarios para padres y maestros han sido desarrollados y
normalizados con muestras clínicas. Ejemplos destacados de escalas de evaluación
para padres son el Child behavior checklist [Cuestionario de conducta infantil], el
Revised behavior problem checklist [Cuestionario revisado de problemas de con-
ducta], el Personality inventory for children [Inventario de personalidad para niños]
y la Connors parent rating scale [Escala Connors de evaluación para padres); ejem-
plos de escalas de evaluación para maestros son el Child behavior checklist-teacher
report form [Informe del profesor de la conducta infantil), el School! behavior chec-
klist [Cuestionario de conducta escolar] y la Connors teacher rating scale [Escala
Connors de evaluación para profesores] (Barkley, 1988; Piacentini, 1993; Kazdin y
Buela-Casal, 1994).
Por ejemplo, el Child behavior checklist (CBCL) [Cuestionario de conducta in-
fantil] de Achenbach y Edelbrock (1983) que completan los padres incluye 118
ítems, cada uno puntuado en una escala de O a 2 dependiente del grado en que un sín-
toma (problema de conducta) caracteriza a un niño. Tres de estos ítems son los si-
guientes:
O 1 2 Demasiado asustado o ansioso

O 1 2 Requieremucha atención
0 1 2 Infeliz, triste o deprimido
0 =no0 es cierto, 1 =algo o a veces cierto y 2 =con frecuencia cierto.
Los ítems forman varias escalas de problemas de conducta que se han derivado
del análisis de factores de primer orden realizados por separado para niños y niñas
y para distintos grupos de edad (4-5, 6-11 y 12-16 años). Las escalas incluyen áreas
tales como aislamiento social, agresión, depresión, hiperactividad y delincuencia,
entre otras. Debido a los análisis de factores independientes, las escalas y los ítems
de una escala dada varían según la edad y el sexo. Escalas amplias de análisis de fac-
tores de segundo orden evalúan áreas más generales que pueden emplearse para to-
dos los grupos de edades y ambos sexos. Estas escalas de banda ancha incluyen la
interiorización, exteriorización y problemas de conducta globales. La escala de in-
teriorización incluye áreas hipercontroladas de trastornos (ansiedad, depresión o
aislamiento); la escala de exteriorización incluye áreas infracontroladas (agresión,
delincuencia o hiperactividad). La puntuación total es la suma de todas las áreas de
síntomas.
Además de las escalas de problemas de conducta, el Cuestionario de conducta in-
fantil incluye tres escalas apriorísticas (en lugar de derivadas de análisis factoriales)
que pertenecen a conductas sociales positivas en niños. Éstas incluyen escalas de ac-
tividades (participación en actividades), sociales (interacción con iguales) y escolares
(progresos académicos), todas ellas evaluadas por los padres. El resultado de la suma
de todas estas escalas proporciona el nivel de competencia social para evaluar el fun-
cionamiento de adaptación positiva. Las habilidades prosociales permiten el examen
del funcionamiento infantil en modos positivos de adaptación y constituyen un ras-
go importante de la escala. Antes de comentar las propiedades psicométricas del
Evaluación de los problemas emocionales y conductuales en niños 803
Cuestionario de conducta infantil, resulta apropiado describir la evaluación paralela

realizada por los maestros. Para evaluar la actuación escolar, los maestros pueden
completar el Child behavior checklist-teacher report form [Informe del profesor de
la conducta infantil] de Achenbach y Edelbrock (1986). Éste resulta paralelo a la ver-
sión de los padres (por ejemplo, estimación de ítems entre 0, 1, 2) y da lugar a medi-
das de factores de primer orden por edades y sexos en una serie de áreas. Los ítems
coinciden con los de la versión de los padres. Sin embargo, los ítems del informe del
profesor se relacionan más directamente con la actuación escolar (por ejemplo, poco
trabajo, interrupción de clase, dormir en clase...). También se realizan las escalas de
banda ancha de interiorización, exteriorización y problemas globales de conducta.
Las escalas prosociales se incluyen basadas en las estimaciones por parte de los maes-
tros del trabajo intenso, comportamiento adecuado, aprendizaje y felicidad que su-
madas dan la escala total de funcionamiento de adaptación. Finalmente, una única
estimación de actuación escolar se separa en una escala aparte basada en la estima-
ción del maestro de lo bien o mal que el niño rinde en las clases (1 = muy por debajo
de la media, 5 = muy por encima de la media). Cada asignatura (matemáticas, lengua,
historia...) que el niño cursa se evalúa y promedia para esta estimación.
El cuestionario de conducta infantil y el informe del profesor son medidas exce-
lentes por cuanto que existen numerosos datos de muestras clínicas y normativas
tanto para los ítems como para las escalas (Achenbach y Edelbrock, 1983, 1986). La
división de los datos por sexo y edad es importante dadas las frecuentes diferencias
de rendimiento en el curso del desarrollo. En segundo lugar, la inclusión de escalas
múltiples proporciona un perfil del niño en varios campos de funcionamiento. De
este modo, el patrón de funcionamiento y la gama de problemas pueden identificar-
se inmediatamente. Además, el cuestionario y el informe han dado lugar a una coin-
cidencia de moderada a alta en el test-retest (Piacentini, 1993). Una gran cantidad de
estudios ha empleado y relacionado las diversas escalas con otras medidas y caracte-
rísticas de padres e hijos. Sin embargo, también hay que resaltar que las versiones de
padres e hijos no se relacionan en gran medida, cuestión que será abordada más ade-
lante. Esto no es específico del cuestionario de conducta infantil sino que se extiende
a comparaciones de las estimaciones realizadas por los padres y maestros en general.
Igualmente, los grupos de edades (6-11, 12-16 años) que se emplearon para elaborar
los datos normativos del cuestionario son difíciles de defender. Estas edades no se
corresponden necesariamente al crecimiento (por ejemplo, la pubertad) y probable-
mente tienen una significación diferente en el desarrollo de niños y niñas. No obs-
tante, pocas medidas han evaluado grupos de edad, de modo que el cuestionario y el
informe son notables en su consideración preliminar del desarrollo. Otro aspecto
que merece subrayarse es que las estimaciones del cuestionario realizadas por los pa-
dres y maestros no reflejan necesariamente la conducta. Se hace referencia a las prue-
bas como cuestionarios de conducta infantil. Muchos de los ítems no incluyen res-
puestas basadas en información descriptiva. En su lugar, los ítems requieren un
juicio considerable relativo a si la conducta es “demasiado frecuente”, “infrecuente :
“grave”, como se ilustra en el ejemplo anterior. Por tanto, la evaluación de un niño
depende del umbral del estimador (padre, maestro...) que lo evalúa.
Tal como se ha mencionado, existe una gran número de escalas de evaluación
para padres y maestros. La flexibilidad y ventajas de tales medidas han facilitado la
804 Alan E. Kazdin
evaluación de las escalas y recogida de datos de amplia validación. Para evaluar los
problemas conductuales y emocionales de niños se recomienda el uso de uno de los
cuestionarios. Las puntuaciones en muchas variables permiten la comparación del
niño con otros de grupos no clínicos (no enviados a especialistas).
1v.1.4. Informe de un compañero

Emplear a compañeros para evaluar problemas emocionales y conductuales en ni-
ños representa un formato de evaluación único. La evaluación requiere la recogida
de información que aportan varios individuos (un grupo de compañeros). Normal-
mente, este grupo consta de los alumnos de una clase en la que unos evalúan a otros
en relación con una dimensión concreta (por ejemplo, popularidad) o grupo de sín-
tomas (por ejemplo, agresividad o aislamiento). La utilidad de la estimación de los
compañeros se deriva de la perspectiva que éstos tienen cuando se observan y rela-
cionan en una gama de situaciones en largos períodos. El procedimiento más común
de evaluación de un compañero es la obtención de estimaciones sociométricas para
evaluar el estatus social del niño o su popularidad —por ejemplo en clase— con un
conjunto de preguntas. Se pide al niño que nombre de uno a tres compañeros a los
que se refiere la pregunta. Un formato alternativo es proporcionar varias preguntas
y los nombres de todos los niños de la clase en forma de matriz o tabla. La tarea del
niño es colocar una X bajo los nombres de los niños a los que la característica de la
pregunta se aplica. El cuadro 32. 2 ilustra el formato adoptado generalmente.
CUADRO 32.2. Muestra de ítems que ilustran un formato para seleccionar a compañeros
Nombre de todos los alumnos de clase
Pregunta O
característica
1. ¿Con quién te
gustaría jugar?
2. ¿Quién se pelea
a menudo?
3. ¿Quién es un
buen amigo?
Marcar con una X la casilla significa que la pregunta se aplica al niño. La puntua-
ción de un niño es el número (o proporción) de veces que es seleccionado en cada ca-
racterística.
Por otro lado, un ejemplo de escala es el Peer nomination inventory for depres-
sion (PNID) [Inventario de selección de compañeros para la depresión] de Lefkowitz
y Tesiny (1980). La escala consta de 20 ítems que abarcan tres escalas: depresión (por
ejemplo «¿Con qué frecuencia parece triste?»), felicidad (por ejemplo, «¿Con qué
frecuencia sonríe?») y popularidad (por ejemplo, «¿Junto a quién te gustaría sentarte

en clase?»). En respuesta a cada pregunta, el niño identifica al compañero al que se
aplica la característica. La puntuación de un niño es la suma (o proporción) de las ve-
ces que es seleccionado en cada escala. Se ha evaluado este inventario en estudios que
aportan evidencia de consistencia interna (alfa de Cronbach superior a 0,85), estabi-
lidad test-retest (desde 2 a más de 6 meses), y acuerdo entre los evaluadores. Igual-
mente, se han recogido datos normativos de más de 30 niños de educación primaria.
Estudios de validación indican que las puntuaciones del PNID correlacionan con el
rendimiento escolar, concepto de uno mismo, estimación del profesor de las habili-
dades de trabajo y conducta social, y las estimaciones de los compañeros de la felici-
dad y popularidad (Lefkowitz, Tesiny y Gordon, 1980; Lefkowitz y Tesiny, 1985).
En general, las evaluaciones basadas en compañeros, en particular las selecciones
sociométricas, han gozado de un uso extendido. La estabilidad de los resultados de
estimaciones de compañeros ha sido demostrada en períodos de 3 a 5 años (Roff,
Sells y Golden, 1972; Coie y Dodge, 1983). Dicha estabilidad puede depender de las
características que se estiman. Por ejemplo, hay evidencias que sugieren que las esti-
maciones de atributos positivos pueden ser más estables que las de negativos; del
mismo modo, la estabilidad es mayor en niños de más edad (véase Landau y Milich,
1990).
Las pruebas de validación proceden de diversos estudios que relacionan estima-
ciones de compañeros y maestros, y observaciones directas de conducta interperso-
nal. Por ejemplo, niños considerados por compañeros como más populares tienden
a entablar más conversaciones, a mostrar más afecto positivo y a iniciar más interac-
ciones sociales (Dodge, 1983; Putallaz, 1983). Se ha relacionado el estatus social de
los compañeros con problemas emocionales y conductuales. Por ejemplo, niños re-
chazados por los compañeros tienden a mostrar niveles mayores de agresión y pro-
blemas de atención; en contraste, los jóvenes ignorados por sus compañeros tienden
a mostrar más timidez y aislamiento social (Gresham y Little, 1993).
Existen restricciones evidentes en el uso de medidas realizadas por compañeros;
por ejemplo, ha de tenerse acceso a un grupo de compañeros. En la investigación
realizada en colegios, tales estimaciones no son difíciles de obtener. En el trabajo clí-
nico con pacientes individuales es menos factible obtener estimaciones de compañe-
ros del individuo. No es viable entrar a la clase del niño a obtener estimaciones de él.
También surgen cuestiones éticas si se descubre que el niño está sometido a trata-
miento. Algunos procedimientos consistentes en nombrar a compañeros son con-
trovertidos y problemáticos. Ha habido interés en obtener información de identifi-
caciones negativas de compañeros (por ejemplo, ¿Quién disgusta? ¿Quién es
agresivo?). Los ítems negativos con frecuencia generan reacciones adversas en pa-
dres y maestros, preocupando el que la información sea discutida y usada negativa-
mente por los niños tras completar las medidas. Una opinión extendida es que la
evaluación puede sensibilizar a los jóvenes a evaluarse entre ellos y como resultado
alterar su interacción. Los trabajos para evaluar el impacto en la interacción infantil
no han mostrado una influencia perjudicial reflejada por conducta manifiesta de los
compañeros tras la evaluación (Hayvren y Hymel, 1984). Aun así, la preocupación
de padres y maestros tiene una importacia clave en la administración de las pruebas y
puede influir en el uso de estimaciones negativas.
806 Alan E. Kazdin
v1.5. Observación directa
Las conductas específicas del niño en casa, en el colegio o en la clínica pueden obser-
varse directamente. Los elementos clave de las observaciones directas son la defini-
ción de la conducta, la identificación de las situaciones en que la conducta será obser-
vada, el empleo de observadores entrenados para registrar la conducta y la
comprobación de que la conducta se observa con exactitud y fiabilidad. Los requisi-
tos de la observación directa varían en función de la complejidad de los procedi-
mientos de evaluación. El procedimiento puede referirse a una conducta única O
múltiple. Igualmente, los códigos pueden variar desde observaciones de los padres,
maestros u otra persona disponible en situaciones de la vida diaria del niño a obser-
vadores entrenados que se introducen en las situaciones. Finalmente, las evaluacio-
nes pueden variar si son realizadas en el laboratorio, la clínica o entornos más natu-
rales.
Como ilustración de los métodos de observación directa, el Family interaction
coding system (FICS) [Sistema de codificación de la interacción familiar] ha sido em-
pleado para registrar conductas de niños antisociales en su interacción con padres y
hermanos en casa (Patterson y cols., 1975; Reid, 1978). Más concretamente, esta
prueba está diseñada para evaluar las conductas agresivas y los antecedentes y conse-
cuencias (interacción familiar) con que están asociadas. Entre los sistemas de obser-
vación directa, el FICS es relativamente elaborado. Los observadores codifican vein-
tinueve conductas distintas como presentes o ausentes en cada uno de los diferentes
intervalos breves (por ejemplo, 30 segundos) de un período de una hora aproxima-
damente. La conducta se observa durante varios días para obtener estimaciones de la
actuación. Se incluyen conductas infantiles prosociales y desviadas (por ejemplo,
obededer a requerimientos, atacar a alguien o gritar) y conductas de los padres (por
ejemplo, mostrar aprobación, jugar con el niño o humillarle). Cada miembro de la
familia es evaluado durante un breve período (por ejemplo, cinco minutos), con el
fin de valorar la interacción de este miembro de la familia con los otros. Tras este pe-
ríodo, las observaciones cambian a otro miembro de la familia y así se continúa hasta
completar la sesión de observación. La medida primaria que se ha empleado para
evaluar la actuación del niño es la conducta aversiva total, que se refiere al número
total de conductas no deseables por minuto.
El FICS ha de cumplir varios requisitos importantes. En primer lugar, los obser-
vadores han de ser entrenados cuidadosamente y controlados estrechamente para
asegurar que los códigos son calificados con fiabilidad. Por otro lado, las situaciones
en las que los observadores completan su evaluación han de ser parcialmente contro-
ladas para limitar la variabilidad del entorno. Por ejemplo, cuando el FICS se emplea
en casa, se instruye a las familias para que estén en un número reducido de habitacio-
nes durante el período en que se realizan las observaciones y para que no vean la tele-
visión ni realicen llamadas telefónicas, para que todo ayude a los observadores a re-
gistrar las interacciones padres-hijos.
La fiabilidad y la validez del FICS han sido obtenidas primordialmente en rela-
ción con la conducta aversiva total del niño. El acuerdo entre observadores es relati-
vamente elevado (de 0,70 a 0,80). La estabilidad de la actuación de 1 a 3 semanas has-
ta más de un año también es estable (Patterson, 1982). Los datos de validez proceden
de estudios que comparan niños bajo tratamiento y sin tratamiento y sus familias
(Reid, 1978; Patterson, 1982). Del mismo modo, otros estudios han mostrado que el
tratamiento de problemas conductuales en niños y los cambios en la conducta de los
padres están asociados a reducciones en las puntuaciones totales de conducta aversi-
va (Patterson, 1982; McMahon y Forehand, 1988). El FICS y otros sistemas de obser-
vación similares han sido empleados frecuentemente en investigación (McMahon y
Forehand, 1988; Reid y cols., 1988). Los métodos son algo complejos, requieren ob-
servadores bien entrenados y no son fáciles de usar en trabajos clínicos. Los sistemas
de observación directa no tienen por qué llevar consigo tanta formalización y com-
plejidad como el F/CS. En ocasiones, los códigos de observación son preparados para
casos individuales tratando de observar una o más conductas en casa o en la escuela
(Kazdin, 1989a). Con definiciones relativamente simples y sólo uno o unos pocos
códigos, padres y maestros pueden sustituir a observadores entrenados. La sencillez
de la preparación en tales casos, en relación con sistemas más complejos, acarrea una
reducción proporcional en el ámbito de la información. Los códigos más complejos
evalúan conductas infantiles múltiples y normalmente proporcionan información
acerca de los intercambios padres-hijos; los códigos más simplificados tienden a cen-
trarse en una o dos conductas del niño.
No todos los procedimientos de observación que incluyen conductas infantiles
múltiples requieren que haya observadores entrenados en casa. Una medida única
diseñada para evaluar conductas domésticas es el Parent daily report (PDR) [Informe
diario de los padres] (Patterson, 1982; Chamberlain y Reid, 1987) realizado por los
padres, a quienes se llama por teléfono a diario durante un período de varios días
(por ejemplo, de 6 a 10 días). Cada día se examina una lista de problemas de conduc-
ta con los padres. Se les pregunta si alguna de las conductas ha ocurrido en el período
de 24 horas anterior. De las respuestas se extraen dos puntuaciones: el número total
de conductas y el número total de conductas señaladas. La puntuación total de con-
ductas es la suma de las que se observaron ese día y la puntuación de conductas seña-
ladas es la suma de los casos del subgrupo de conductas que los padres habían identi-
ficado previamente como problemáticas. El Informe diario de los padres presenta las
ventajas de la observación directa, incluyendo la especificación de las conductas y
observaciones restringidas a un período específico. Este procedimiento también
toma las muestras de conducta en situaciones diarias sin las limitaciones artificiales
que los observadores externos pueden imponer. Finalmente, el informe diario de los
padres puede evaluar conductas menos relevantes (peleas, rotura de objetos...) que
aparecen con menor probabilidad en períodos de observación breves, de una o dos
horas. No obstante, la medida se basa en impresiones y no en lo que realmente ocu-
rrió. La correspondencia entre lo que los padres dicen que el niño hizo y lo que éste
realmente hizo puede variar mucho. :
Se ha demostrado que el informe diario de los padres es fiable, como reflejan las
medidas de acuerdo entre evaluadores, consistencia interna, fiabilidad entre test y re-
test (en períodos de dos a cuatro semanas). La observación se correlaciona modera-
damente con las observaciones directas (Sistema de codificación de la interacción fa-
miliar) y refleja el cambio asociado a las intervenciones diseñadas para reducir las
conductas agresivas y antisociales (Patterson, 1982; Chamberlain y Reid, 1987; Kaz-
808 Alan E. Kazdin
din y cols., 1989). Hay algunos datos disponibles sobre ejemplos normativos que fa-
cilitan la interpretación de los resultados (Chamberlain y Reid, 1987). No obstante,
la baja concordancia entre los padres y las bajas correlaciones ocasionales con las ob-
servaciones directas producen ambigúedades en este procedimiento. Igualmente, la
observación no ha sido normalizada y las distintas versiones usadas varían en núme-
ro y contenido de categorías de conducta (Chamberlain y Reid, 1987; McMahon y
Forehand, 1988). Como tal, la observación se refiere más a un procedimiento o es-
trategia que a una escala específica.
Una ventaja de las observaciones directas es que proporcionan muestras de las
frecuencias reales de una conducta. Como tales, a menudo se consideran como las
evaluaciones más directamente relacionadas con el centro de interés. Las observacio-
nes directas tienen sus propios inconvenientes. Muchas conductas, en especial las ac-
ciones difíciles de detectar (robo, consumo de drogas, piromanía, promiscuidad se-
xual...) no aparecen claramente incluidas en sistemas codificados de observación. En
segundo lugar, y relacionado con lo anterior, las conductas con una baja frecuencia
son difíciles de observar porque por definición es improbable que su presencia sea
detectada en el marco temporal observado. En tercer lugar, puede producirse un
efecto de reacción de la observación (Kazdin, 1992), esto es, que cuando las conduc-
tas se observan directamente, el acto de observación influya en la actuación. En cuar-
to lugar, con códigos complejos, los observadores han de ser entrenados para evaluar
la conducta. La fiabilidad, o el acuerdo, de las observaciones debe evaluarse para ase-
gurar que las observaciones se obtienen de modo consistente. En la práctica es difícil
enviar observadores a los hogares o a los colegios. Otras limitaciones prácticas tales
como el coste de los observadores también pueden interferir en el empleo de obser-
vaciones directas. Finalmente, la mayoría de los métodos de observación directa no
está bien validada. Se parte del presupuesto de que evalúan directamente el problema
de interés. Sin embargo, existen pocos estudios que proporcionen datos sobre áreas
tales como la validez predictiva. Las observaciones de conducta pueden ser útiles en
la evaluación del funcionamiento infantil para identificar la gravedad y frecuencia de
los problemas de conducta. En muchos casos, además de la conducta del niño se ob-
serva la de otros, por ejemplo, padres y maestros. Los datos resultantes pueden iden-
tificar factores (refuerzo de los padres, castigo...) que pueden contribuir a la conduc-
ta. Para más información sobre procedimientos de observación véase Kazdin y
Buela-Casal (1994).
Iv.1.6. Informes y archivos institucionales

La evaluación del funcionamiento infantil puede precisarse evaluando informes y
archivos institucionales. Ejemplos de tales medidas incluyen la asistencia a clase, no-
tas, expulsiones, contacto con la policía e informes de detenciones. Los informes ins-
titucionales tienen una enorme importancia porque representan información de sig-
nificación social del funcionamiento del niño. Aunque tal información se relaciona
con conductas manifiestas, no es idéntica a la observación directa. Más bien, los da-
tos son el producto de los informes de conducta. Los informes incluyen los resulta-
dos evaluados en la vida diaria. Por ejemplo, los programas diseñados para promo-
ver la competencia social y evitar la conducta antisocial en niños emplean con fre-
cuencia los informes institucionales para evaluar los resultados. Datos tales como
contacto con la policía, casos de libertad condicional, tipo y gravedad de delitos y
coste monetario del tratamiento son medidas que se emplean para evaluar los efectos
de la intervención (Lally, Mangione y Honig, 1988). Además de otras modalidades
de evaluación, los informes y archivos institucionales reflejan a menudo informa-
ción del impacto social que conciernen extensamente a la sociedad.
La información del impacto social tiene una serie de limitaciones que recomien-
dan la cautela interpretativa. Datos tales como las notas, tasas de delitos o muertes
son relativamente insensibles a los efectos de la intervención o las diferencias de gru-
po. Se trata de informaciones amplias y sujetas a una variedad de influencias. El error
en las estimaciones puede ser relativamente elevado. El error aleatorio puede venir
de variaciones en la consistencia de la recogida de los datos, como es el caso de mu-
chos archivos (por ejemplo, asistencia a clase, informes judiciales...). Damos por sen-
tado que la mayoría de las puntuaciones psicológicas tiene métodos normalizados
de administración. Es más probable que las medidas de impacto social sean tomadas
y valoradas más irregularmente en el tiempo, lo que introduce una variabilidad de
error en los resultados. El error sistemático puede introducirse también por cambios
en el modo en como se recogen los datos en el tiempo. Cambios de política, procedi-
miento, responsables de la evaluación, procedimientos de evaluación y reducciones
presupuestarias pueden operar de modo sistemático para influir en los resultados.
Las estimaciones del impacto social son realizadas con frecuencia por personas
que no son investigadores como reflejo del criterio más importante para evaluar el va-
lor y eficacia de un tratamiento o programa de prevención. Así, si la intervención no
ha mostrado impacto social, esto se considera por los no investigadores como evi-
dencia de que la intervención no establece diferencias, no es importante y quizá ha
fracasado. En un caso dado, en muy posible que la interpretación sea exacta; sin em-
bargo, las estimaciones del impacto social han de ser evaluadas e interpretadas cuida-
dosamente. La ausencia de cambio en una variable, dada la propia naturaleza de mu-
chas de ellas, puede que no sea un índice adecuado, razonable o interpretable del
efecto del programa. El riesgo de la estimación del impacto social se debe a sus dos
características más acentuadas: su elevada verosimilitud y sus pobres propiedades
psicométricas (por ejemplo, tipos alternativos de fiabilidad y validez). Aparte de es-
tas limitaciones, los datos del impacto social pueden ser de gran utilidad en la rela-
ción de los resultados de la investigación psicológica y las medidas de interés social.
1v2. Anotaciones sobre el funcionamiento de los padres y familiares

La evaluación de los problemas emocionales y conductuales en niños incluye mu-
chas veces varias facetas del funcionamiento de los padres y la familia; esto responde
a varias razones. Obviamente, el funcionamiento del niño se ve afectado por el de és-
tos. De igual modo, el funcionamiento de los padres (por ejemplo, una depresión)
uede influir en su percepción y evaluación de los problemas emocionales y conduc-
tuales de los niños. Finalmente, la conducta de los padres puede representar un foco
importante de tratamiento para el cuidado del niño. Prácticas específicas de los pa-
810 Alan E. Kazdin
dres (por ejemplo, abusos físicos o abandono) pueden ser parte del interés al propor-
cionar cuidados al niño. :
El impacto de las influencias específicas de los padres y la familia varía sin duda
en función de los trastornos infantiles y las características familiares. Por ejemplo, en
el contexto de niños agresivos y antisociales, factores familiares que incluyen psico-
patologías en los padres, problemas socioeconómicos, familias de un solo progeni-
tor, ausencia de apoyo social o estrés de los padres influyen en quien participa en el
tratamiento, el grado en que se benefician del tratamiento y el grado en que los cam-
bios terapéuticos se mantienen entre aquellos que permanecen bajo tratamiento
(Dumas y Wahler, 1983; Webster-Stratton, 1985; Kazdin, 1990b; Kazdin y Buela-
Casal, 1994; Kazdin, Mazurick y Bass, en prensa). Como consecuencia, los factores
de los padres y la familia tienen una importancia crítica en la evaluación clínica de los
niños. Las modalidades de evaluación del funcionamiento de padres e hijos incluyen
las entrevistas, preguntas de lápiz y papel y observaciones directas entre otras. El
propósito de ilustrar las evaluaciones de los padres no es introducir nuevas modali-
dades de evaluación sino ilustrar instrumentos empleados a menudo en la investiga-
ción con niños.
Con frecuencia se evalúa el estrés experimentado por los padres. Entre las prue-
bas existentes para tal fin está el Parenting stress index (PSI) [Índice de estrés de los
padres] (Abidin, 1983; Lloyd y Abidin, 1985). Este índice está diseñado para padres
con hijos de 12 años o menores y consiste en una escala de autoinforme que incluye
101 ítems diseñados para evaluar varias fuentes de estrés para los padres. Cada ítem
se puntúa en una escala de cinco opciones (desde fuerte acuerdo a fuerte desacuerdo)
para reflejar el grado de características concretas propias de ellos. Ejemplos de los
ítems de la escala serían los siguientes:
Ser padre es más difícil de lo que pensaba.

A menudo tengo la impresión de que no puedo controlar las cosas.
Desde que nació mi hijo, he sido incapaz de hacer cosas nuevas y diferentes.
oMe siento solo/a y sin amigos.
DO
El ?S7 evalúa el estrés en relación con varias fuentes que incluyen al niño, a los
padres y hechos de la vida. El dominio del niño (47 ítems) relaciona a éste como
fuente de estrés e incluye seis subescalas: adaptabilidad, aceptabilidad, exigencia,
humor, distracción-hiperactividad y refuerzo de los padres. Las subescalas reflejan
áreas específicas en las que el niño puede ser percibido como causante de estrés en
los padres. El dominio de los padres (54 ítems) se relaciona con las opiniones de los
padres de su propio funcionamiento e incluye siete subescalas: depresión, depen-
dencia, restricciones de su papel, sentido de competencia, aislamiento social, rela-
ción con la pareja y salud física. Una parte independiente del índice incluye una es-
cala de estrés vital, consistente en 19 ítems que evalúan los factores de estrés (por
ejemplo, cambio de trabajo o muerte de un pariente) en el entorno. Los padres
marcan estos ítems como presentes o ausentes. Una cuantificación de los ítems in-
dependientes se emplea para obtener una puntuación total basada en investigación
previa del impacto de los factores individuales de estrés en el funcionamiento. El
PSI puede evaluarse por subescalas individuales de tres amplias áreas: dominio in-
fantil y dominio del padre, estrés total (dominio del padre + dominio del niño) y
estrés vital.
Las propiedades psicométricas del PS7 han sido bien estudiadas (Abidin, 1983).
La fiabilidad para las escalas generales (padres, hijo y total) es alta en la consistencia
de test-retest en períodos de varias semanas y en evaluaciones de consistencia inter-
na. Estudios de validación en la normalización original incluían la evaluación de gru-
pos con criterio alternativo cuyo nivel de estrés se esperaba que fuera diferente, estu-
dios de tratamiento en los que se esperaba que el estrés decreciera y correlaciones
con variables relacionadas. Por ejemplo, el PS7 se relaciona con la insatisfacción ma-
trimontal, insatisfacción del papel de padre y tener un hijo desviado en casa, consis-
tente con la actuación esperada en la escala. También existen datos normativos para
la escala con vías tentativas para niveles de estrés con significación clínica.
Otro autoinforme para padres es el Child abuse potential inventory (CAPI) [In-
ventario de potencial de malos tratos infantiles] de Milner (1986) que se emplea para
seleccionar a adultos sospechosos de malos tratos a niños. Se pregunta al progenitor
si él/ella está de acuerdo con cada uno de los 160 ítems que incluye la escala; de ellos,
77 forman la escala para evaluar los malos tratos de acuerdo con seis factores: angus-
tia, severidad, infelicidad, problemas con el niño y con uno mismo, problemas con la
familia y problemas con otros. Los ítems restantes comprenden escalas de validez
(mentiras, respuestas aleatorias, inconsistencia en las respuestas) diseñadas para eva-
luar las distorsiones de las respuestas y consiguientemente facilitar la interpretación
del resultado. Este instrumento se basa en la opinión de que varias facetas de los pa-
dres, de los hijos y su interacción incrementan el riesgo de malos tratos físicos al
niño. Los ítems están diseñados para evaluar los componentes relevantes. Ejemplos
de las escalas de malos tratos incluyen:
1. A menudo estoy furioso interiormente.

2. Los azotes que sólo producen cardenales no son malos.
3. Coger aun niño siempre que llora lo hace mimado.
4. Mi familia se pelea mucho.
El inventario ha sido extensamente evaluado y sigue gozando de un gran uso en

la investigación. Se han estimado distintas formas de fiabilidad y consistencia interna
que muestran alta aceptabilidad (Milner, 1986, 19894, 1989b). La validez del inventa-
rio también se ha estudiado para demostrar que la escala discrimina a los padres
identificados por los malos tratos y los relaciona con el estrés de los padres, estrés fa-
miliar y prácticas de educación infantil. Como parte de la validación de la escala ha
surgido un cuadro de los padres que maltratan. Los padres con un elevado potencial
de malos tratos consideran que sus hijos tienen problemas emocionales y conduc-
tuales, es más probable que muestren síntomas y presentan menor cohesión familiar
que los padres con bajo potencial de malos tratos (Kolko y cols., en prensa).
Los dos instrumentos anteriores son autoinformes, la modalidad más común de
evaluar a los padres tratados clínicamente. Las observaciones de los entornos fami-
liares también se completan a veces; entre éstas están las Home observation for mea-
surement of environment (HOME) [Observaciones domésticas de evaluación del en-
torno] de Caldwell y Bradley (1984) diseñadas para evaluar la calidad del entorno y
812 Alan E. Kazdin
cuidados del niño. Incluye varias subescalas: responsabilidad verbal y emocional de

los padres, la organización del entorno físico y temporal, calor y afecto, y materiales
y experiencias que favorecen el crecimiento. La observación varía en función de la
edad del niño en tres formatos (desde el nacimiento a los 10 años). Se completa en-
viando a un evaluador a casa para marcar sí/no en un número de apartados. En aque-
llos casos en que la observación directa no es posible se solicita un informe de los pa-
dres para puntuar los ítems. El número de ítems y escalas varía en los formatos. Por
ejemplo, la versión para 3-5 años incluye 45 ítems que comprenden seis subescalas
(responsabilidad emocional y verbal de la madre, evitar las limitaciones y castigos,
organización del entorno físico y temporal, provisión de materiales para juego apro-
piados, preocupación maternal por el niño y variedad de la estimulación diaria). Las
puntuaciones de las observaciones domésticas están relacionadas con facetas signifi-
cativas del funcionamiento infantil que incluyen el desarrollo del lenguaje y los re-
sultados de los tests de inteligencia posteriores (Bradley y Caldwell, 1979; Caldwell
y Bradley, 1984).
Los ejemplos señalados ilustran someramente áreas a las que se recurre con fre-
cuencia en la evaluación de los problemas emocionales y conductuales de los niños.
No existe un grupo normalizado de áreas o variables que se emplee necesariamente
en los trastornos infantiles. Por ejemplo, el estrés de los padres, la psicopatología y
trastornos familiares no son igualmente relevantes en todos los trastornos clínicos.
Con los niños maltratados físicamente es probable que la evaluación de los padres
incluya medidas de estrés y conflicto porque éstos se relacionan con los malos tratos.
Con niños deprimidos los trastornos afectivos de los padres pueden ser particular-
mente relevantes. No hay directrices claras de las áreas de los padres y la familia que
han de evaluarse en los problemas clínicos específicos. El área específica evaluada
puede determinarse por el conocimiento de los factores relacionados con el funcio-
namiento en dominios específicos o por hipótesis del trabajo clínico en las influen-
cias potenciales sobre el niño.
V. ALGUNAS CONSIDERACIONES Y CUESTIONES ACTUALES

v.1. Los niños y los padres como fuentes de información
La investigación ha suscitado varias cuestiones fundamentales sobre los instrumen-
tos actuales y el modo en que han de ser usados e interpretados sus resultados, en
particular en relación con los informes del niño y de los padres. En cuanto al autoin-
forme del niño, una cuestión destacada es el grado en que los niños están dispuestos
o son capaces de informar sobre sus estados emocionales y conductas, particular-
mente aquellas que pueden resultarles problemáticas. Al principio, la preocupación
es que los niños negarán los síntomas. Sin embargo, los datos indican que esto no es
necesariamente un problema. En un área en que cabe esperar que los niños nieguen
los problemas, el autoinforme ha aportado datos muy útiles y válidos. Por ejemplo,
la investigación muestra que los jóvenes (de 11 a 17 años) informan fácilmente sobre
sus actos delictivos y antisociales y que los datos del autoinforme predicen de modo
fiable y válido otros problemas tales como detenciones (Elliott, Huizinga y Ageton,
1985). Las razones en favor del autoinforme en la delincuencia son un caso destaca-
do ya que sería de esperar la negación de las conductas antisociales.
Quizá una preocupación mayor sea si los niños son capaces de contestar las pre-
guntas formuladas regularmente en las técnicas de autoinforme infantil y evaluación
del diagnóstico. Se realizan con frecuencia preguntas sutiles sobre la presencia, co-
mienzo, duración, frecuencia, intensidad y otras características de conductas y esta-
dos emocionales. Una pregunta de importancia clave es si los niños de distintas eda-
des son capaces de informar sobre estas facetas del funcionamiento. En el intervalo
de edad entre 6 y 18 años, la investigación ha establecido que tanto niños bajo trata-
miento como sin él informan sobre sus síntomas (por ejemplo, depresión, aislamien-
to social y agresividad) y que la información se relaciona significativamente con
otros criterios y medidas de trastornos (LaGreca, 1990).
Muchas veces los niños proporcionan información sobre menos síntomas que
los padres o los psicólogos clínicos (Orvaschel y cols., 1982; Kazdin y cols., 1983). El
hecho de que los niños informen de que sus síntomas son menos graves o frecuentes
que los de los demás sugiere que los niños infravaloran sus síntomas. No obstante, si
los niños infravaloran o exageran sus síntomas depende de otra norma con la que
pueda compararse el informe del niño. Los informes de otros, en particular el de los
padres, se emplean para esta comparación. La perspectiva de los informes de otros
(padres, psicólogos clínicos...) con los que se comparan los informes de los niños tie-
ne sus propios obstáculos de interpretación y no se debe presuponer que sirve como
criterio “verdadero” para evaluar informes de niños.
Como se ha mencionado, el informe de los padres es la fuente de información
más socorrida en la evaluación infantil. Las evaluaciones de los padres se obtienen
normalmente en escalas de evaluación normalizadas que miden varias áreas del fun-
cionamiento infantil (por ejemplo, agresividad, hiperactividad, ansiedad o depre-
sión). La información que los padres proporcionan sobre el comportamiento de sus
hijos depende de las características de los primeros. Distintos estudios han demos-
trado que el estrés y la psicopatología de los padres se correlacionan de forma baja a
moderada (0,20 a 0,50) con las estimaciones de los padres de los problemas emocio-
nales y conductuales infantiles (Moretti y cols., 1985; Brody y Forehand, 1986; Jen-
sen y cols., 1988; Webster-Stratton y Hammond, 1988; Phares, Compas y Howell,
1989). Las puntuaciones de síntomas más altas hechas por los padres se asocian con
estimaciones más altas de desviación infantil. Las madres, que son empleadas más a
menudo como evaluadoras, han sido más estudiadas que los padres. No obstante, la
relación del conjunto de síntomas de los padres y las estimaciones de trastornos clí-
nicos se ha demostrado que influye también en las evaluaciones del padre sobre los
síntomas del niño (Ivens y Rehm, 1988; Phares y cols., 1989).
También se ha investigado si hijos y padres varían de forma sistemática en sus in-
formes de los problemas conductuales y emocionales infantiles. Los estudios sugie-
ren que los niños tienden a ser mejores informadores de los síntomas relacionados
con experiencias privadas (por ejemplo, desesperación, baja autoestima, depresión,
ansiedad...), mientras que otros, como padres y profesores, son mejores informado-
res en relación a conductas manifiestas del niño (por ejemplo, patrones de sueño y
alimenticios, agresión, hiperactividad...) (para una revisión de estos aspectos véase
814 Alan E. Kazdin
Kazdin y cols., en prensa). La investigación se ha centrado en si elniño u otros esti-

madores, normalmente los padres, recogen una mayor frecuencia o gravedad de un
área de síntomas. Aunque hijos y padres proporcionan muchas veces distinta infor-
mación de los síntomas del niño, ambas perspectivas han sido validadas basándose
en el estudio de correlaciones coincidentes y predictivas.
v2. Convergencia de evaluaciones
Ha surgido una serie de cuestiones en relación con la convergencia o el acuerdo en-

tre diseños de evaluación alternativos, fuentes de información y actuación. La cues-
tión general es el grado de acuerdo entre las medidas que podría esperarse a prior
que proporcionaran información similar.
v.2.1. Relaciones entre medidas
El grado en que las distintas medidas de los trastornos infantiles se correlacionan en-
tre sí se ha estudiado a menudo. Por ejemplo, en la investigación de la depresión in-
fantil, varios estudios han mostrado que medidas alternativas de la depresión realiza-
das por el mismo informador (por ejemplo, medidas de la depresión infantil
realizadas por los padres) se correlacionan de forma moderada a alta (Kazdin y cols.,
1983; Reynolds, Anderson y Bartell, 1985; Rotundo y Hensley, 1985). Igualmente,
medidas de la depresión o aspectos relacionados se correlacionan de modo consis-
tente cuando el mismo informador realiza las medidas. De este modo, las medidas de
la autoestima, desesperación y atributos cognitivos negativos se relacionan con me-
didas de la depresión.
Como método inicial de validación, la convergencia de medidas relacionadas es
un paso importante. Sin embargo, por sí misma la validez convergente no propor-
ciona una base de validación sólida. La característica más destacada aquí es que la va-
lidez convergente se apoya sólidamente cuando el mismo informador completa me-
didas de áreas relacionadas. No obstante, se produce escasa o nula convergencia
cuando distintos informadores completan medidas que se considera que reflejan la
misma área, tema que se considerará a continuación.
v2.2. Correspondencia entre fuentes de información

Las relaciones entre medidas de distintos informantes sobre trastornos infantiles ha
suscitado cuestiones críticas de evaluación. Diversos estudios han examinado el
acuerdo entre padres, profesores y niños. En la actualidad existe un amplio conjunto
de investigaciones que muestran que las estimaciones de padres, profesores y niños
de los trastornos infantiles presentan relativamente poco acuerdo (Achenbach, Mc-
Conaughy y Howell, 1987; Kazdin y cols., en prensa). Por ejemplo, en la revisión de
Achenbach y cols. (1987), los resultados de varios estudios indican que las evaluacio-
nes de padres e hijos de problemas infantiles presentaban un acuerdo fiable pero re-
lativamente bajo (0,25). La correspondencia entre evaluaciones del niño y el profe-

sor o del niño y el trabajador social también era baja (0,20 y 0,27, respectivamente).
El acuerdo es bajo cuando los informadores completaban la misma medida. Por
ejemplo, se da con frecuencia el caso de que padres e hijos completan varias de las
mismas medidas que se vuelven a redactar (para el padre) para expresar que el tras-
torno del niño está siendo evaluado. De esta forma las bajas correlaciones que se ob-
tienen no se deben a distintos métodos de evaluación o a la variación particular de
escalas específicas.
Las bajas correlaciones entre los informadores pueden tener importantes impli-
caciones para la investigación y la práctica clínicas. La identificación de casos con un
tipo particular de trastorno o con un grado o gravedad especiales del trastorno pue-
de depender de la fuente de información. Por ejemplo, tres formas comunes de iden-
tificar a niños deprimidos es confiar en el autoinforme del niño, el informe del padre
de la depresión infantil o entrevistas de diagnóstico (basadas en información combi-
nada de entrevistas con padre e hijo). No obstante, en una población dada, casos dis-
tintos de jóvenes serán identificados como depresivos clínicos basándose en si los
padres, el hijo o alguna combinación de estimaciones se usa como fuente de la selec-
ción (Kazdin, 19895). Igualmente, las conclusiones sobre la eficacia del tratamiento
(Kazdin y cols., 1989) y los factores que predicen el resultado (Clarke y cols., 1992)
podrían ser muy distintos en un estudio particular dependiendo de la medida o la
fuente de información.
Las características de los síntomas del niño o las áreas alteradas tienden a influir
en los patrones de información sobre los síntomas y el acuerdo entre niños y padres.
Por ejemplo, cabría esperar que los niños fueran mejores informadores de sus esta-
dos internos o emocionales (por ejemplo, tristeza). Aunque los estados emocionales
presentan a menudo referentes de conducta externos, es probable que los niños sean
capaces de identificar mejor el ámbito, gravedad y gama de estados internos que pa-
dres y maestros. Existe evidencia de que síntomas interiorizados como la ansiedad,
quejas somáticas, pensamientos suicidas (síntomas de depresión), así como alucina-
ciones visuales y auditivas y manías persecutorias son informados con mayor fre-
cuencia por los niños que por los padres que estiman estos síntomas de los niños
(Kashani y cols., 1985; Ivens y Rehm, 1988). Los padres son más propensos a infor-
mar de las conductas exteriorizadas que les resultan molestas (por ejemplo, hiperac-
tividad o conductas de enfrentamiento). Sin embargo, no es posible simplificar al
considerar qué informador recoge un síntoma particular más a menudo. A veces los
niños informan de más conductas exteriorizadas que sus padres, como ausencias de
clase, ingestión de alcohol y drogas (Kashani y cols., 1985). La disponibilidad de la
información para los padres puede contribuir a sus infravaloraciones.
El tipo de síntomas o información contribuye al nivel de acuerdo. Algunos estu-
dios sugieren que el acuerdo entre informadores es más elevado en las conductas ex-
teriorizadas que en las interiorizadas (Edelbrock y cols., 1986; Jensen y cols., 1988;
Kolko y Kazdin, 1992). Se ha encontrado un mayor acuerdo en la evaluación de los
síntomas exteriorizados, en comparación con los interiorizados, entre niño y maes-
tro, niño y compañero, padre y maestro (Ledingham y cols., 1982; Kolko y Kazdin,
1992). También se han estudiado las variaciones en las conductas exteriorizadas. Por
ejemplo, se ha encontrado que el acuerdo entre miños y padres es mayor en conduc-
816 Alan E. Kazdin
tas de enfrentamiento que en conductas hiperactivas y de falta de atención (Loeber y

cols., 1990). En la actualidad, el hallazgo mejor establecido se refiere al resultado ge-
neral de que el acuerdo tiende a ser mayor en los síntomas exteriorizados. Las razo-
nes para ello no están todavía claras. Lo llamativo de las conductas (por ejemplo, el
grado en que son evidentes o detectables) no estaba relacionado con la correspon-
dencia entre las estimaciones de padres e hijos en un estudio de Kolko y Kazdin
(1992). No obstante, la gravedad de la conducta estaba relacionada con la correspon-
dencia (r = 0,35). Hace falta más investigación para evaluar el acuerdo entre las dis-
tintas conductas y relacionarlas con otras variables (por ejemplo, características del
informador) con las que el acuerdo puede actuar.
Las investigaciones han tratado de identificar las características de niños y padres
que influyen en el grado de acuerdo entre las estimaciones. Por ejemplo, se ha de-
mostrado que el acuerdo entre las niñas y sus padres es mayor que entre los niños y
sus padres (Kazdin y cols., 1983; Kolko y Kazdin, 1992). A pesar de ello, los resulta-
dos se restringen a escalas seleccionadas de un estudio particular y no representan un
patrón consistente entre medidas. Debido a que los niños y niñas pueden diferir en
sus síntomas y frecuencia relativa de los mismos (por ejemplo, la agresión), las dife-
rencias de sexo en relación con estas otras influencias no están claras. Los trastornos
de los padres también pueden influir en el acuerdo entre las estimaciones de padres e
hijos. Por ejemplo, las puntuaciones de los síntomas del padre y de la madre se rela-
cionan significativamente (0,20 a 0,40) con las diferencias de puntuaciones en las es-
timaciones de padres e hijos (Jensen y cols., 1988). El motivo de las relaciones entre
los síntomas de los padres con las estimaciones de los síntomas de los niños y con el
nivel de acuerdo no están claros. Algunas investigaciones sugieren que los síntomas
de los padres influyen en las percepciones de los desajustes infantiles y en las con-
ductas de los padres que influyen en la desviación infantil (Forehand y cols., 1986;
Webster-Stratron y Hammond, 1988). En general, el origen del desacuerdo entre ni-
ños y padres no está claro.
v2.3. Correspondencia entre situaciones
La evaluación del funcionamiento infantil en casa y en la escuela es común en la eva-

luación infantil. La evaluación de la conducta del niño en uno de estos entornos no
puede presuponer que representa la actuación en el otro. Las comparaciones entre
las estimaciones de padres y profesores del niño muestran relativamente poco acuer-
do. Por ejemplo, en uno de nuestros estudios de tratamiento de niños antisociales
con edades entre 7 y 13 años, las estimaciones de la conducta infantil fueron obteni-
das de padres y maestros para evaluar una amplia gama de síntomas en casa y en la
escuela (Kazdin y cols., 1989). Las puntuaciones totales de los síntomas en casa y en
la escuela no se correlacionaban significativamente (r = 0,08). Esta correlación tan
baja sugiere una especificidad considerable de la actuación en conductas desviadas
y/o grandes discrepancias en las perspectivas de padres y maestros. Tras el trata-
miento, el cambio entre antes y después del tratamiento en casa se correlacionaba
significativamente con el cambio en la escuela (7 = 0,26). Aunque las mejorías en la
actuación en un entorno se relacionaban con las mejorías en el otro, la magnitud de
la correlación es baja. Lo específico de la actuación entre entornos es lo que cabe es-

perar sí se reconocen las importantes influencias situacionales en la conducta. Las
bajas correlaciones de las actuaciones entre entornos reduce la importancia de las es-
trategias generales de evaluación. La actuación del niño en diferentes contextos y en-
tornos es importante para extraer conclusiones sobre el funcionamiento infantil.
v2.4. Correspondencia de síntomas y funcionamiento prosocial

Aparte de la actuación entre entornos, existe también interés en evaluar los distintos
tipos de conducta infantil. En el trabajo clínico, el interés por realizar la evaluación o
el tratamiento está en la presencia de conductas inadaptadas, alteradas o perjudicia-
les. La evaluación incluye una amplia gama de áreas de síntomas y problemas emo-
cionales y conductuales. Además de ello, el interés también cubre el comportamien-
to prosocial. Este comportamiento se refiere a la presencia de conductas adaptativas
positivas y experiencias tales como la participación en actividades sociales, interac-
ción social y hacer amigos. Con niños, el ajuste puede depender mucho de las con-
ductas o destrezas de adaptación positivas, dada la significación del grupo de compa-
ñeros y experiencias prosociales fuera de casa. La relación de los síntomas con el
funcionamiento prosocial es limitada. Por ejemplo, Kazdin y cols. (1989) encuen-
tran que las estimaciones de los padres del conjunto de síntomas (problemas de con-
ducta totales) y funcionamiento prosocial (competencia social total) del cuestionario
de conducta infantil se correlacionaban significativamente, y tal como cabría esperar,
negativamente (7 =-0,31). La magnitud de la correlación es relativamente baja (apro-
ximadamente, el 9% de la varianza compartida). Los cambios en los síntomas y el
funcionamiento prosocial de antes y después del tratamiento también mostraron
una escasa correlación (r = 0,17). Similares resultados fueron evidentes cuando se
examinaban los síntomas y el funcionamiento prosocial en la escuela evaluados por
el maestro. Así, incluso cuando el mismo informador (padre o maestro) evalúa el
conjunto de síntomas y el funcionamiento prosocial, la correlación entre estas áreas
es relativamente baja. Estos resultados indican que la conducta infantil desviada no
es meramente lo contrario de la conducta prosocial. Aquí también la evaluación del
funcionamiento infantil requiere la evaluación de los problemas conductuales y
emocionales además del funcionamiento prosocial.
En definitiva, los avances en la evaluación infantil han suscitado varias cuestiones
sustanciales. Las interrelaciones de estrategias de evaluación alternativas, las fuentes
de información y las medidas han producido complejidades inquietantes. Los dis-
tintos informadores pueden generar datos diferentes acerca del niño. Aunque las
medidas pueden estar escasamente relacionadas entre sí, cada una puede tener corre-
laciones predictivas coincidentes muy válidas. Igualmente, se ha apuntado que las
conductas desviada y prosocial, ambas importantes para el ajuste del niño, muestran
sólo pequeñas correlaciones incluso cuando se mantienen constantes las fuentes po-
tenciales de variación (el informador o la medida). En la actualidad, las investigacio-
nes sólo han comenzado a describir algunas de las complejidades de la evaluación m-
fantil. Las conceptualizaciones de los procesos de evaluación e integración de estos
procesos en un marco de desarrollo han de producirse todavía.
818 Alan E. Kazdin
VL RECOMENDACIONES PARA LA EVALUACIÓN INFANTIL

vii. Empleo de medidas múltiples
Los resultados indican que hay una variación significativa entre los métodos de eva-
luación de los problemas emocionales y conductuales infantiles, que los distintos
métodos pueden no intercorrelacionarse y que, a pesar de ello, las medidas que no se
correlacionan mucho pueden predecir fiablemente elementos externos. Como con-
secuencia, para el psicólogo clínico y el investigador, es obvio que la evaluación de-
bería incluir medidas múltiples que abarcaran:
Distintos métodos de evaluación (entrevistas, observaciones directas...).

Distintas fuentes de información (el niño y otras personas allegadas).
Actuación en distintos entornos (casa, escuela...).
A
LP Áreas múltiples de funcionamiento (síntomas y conducta prosocial).
Existen varias medidas de los problemas emocionales y conductuales infantiles.
Aunque falta investigación en las escalas individuales, el campo podría beneficiarse
de las indagaciones para ayudar a dirigir la selección adecuada entre medidas alterna-
tivas. La investigación de la relación y redundancia entre medidas alternativas y sus
aciertos y debilidades para los distintos fines sería igualmente útil. Las distintas me-
didas pueden resultar de modo diferente cuando se emplean para propósitos tan dis-
tintos como la selección inicial, el diagnóstico o la evaluación del resultado del trata-
miento. Las distintas facetas de un conjunto de síntomas, sus relaciones y la posible
significación diagnóstica también merecen estudio, así como la atención a los sínto-
mas y el funcionamiento prosocial.
vL2. Empleo de medidas que permiten comparaciones normativas

Uno de los retos de la evaluación con niños es la interpretación de las medidas. El
significado de una puntuación en una variable puede variar dependiendo de la edad,
sexo y fase de desarrollo del niño. La naturaleza dinámica del desarrollo significa
que la interpretación de las puntuaciones de las pruebas ha de basarse en la evalua-
ción del curso del desarrollo del niño en la variable. Desgraciadamente, ha habido
poca normalización de las medidas y evaluación de datos normativos en función de
edad y sexo. Una excepción ya citada es el Cuestionario de conducta infantil (Achen-
bach y Edelbrock, 1983) que se emplea con frecuencia en investigación infantil y de
adolescentes. Esta prueba tiene distintas versiones que completan los padres, profe-
sores y adolescentes. El cuestionario es una de las mejores medidas que proporciona
datos normativos por grupos de edad y sexo. Los datos normativos han facilitado la
evaluación del estado relativo de los jóvenes con relación al tratamiento. Del mismo
modo, para evaluar el tratamiento se puede examinar si el cambio terapéutico ha si-
tuado al joven dentro del espectro de funcionamiento “normal” de sus compañeros
(Kazdin y cols., 1992).
vI3. Evaluación de áreas múltiples de funcionamiento

Por diversas razones, es esencial evaluar áreas múltiples del funcionamiento infantil.
Inicialmente, se recomiendan las medidas que muestrean varias áreas y proporcio-
nen un perfil de la gama completa de problemas emocionales y conductuales. Las in-
vestigaciones indican que los problemas múltiples coinciden. Un procedimiento de
evaluación que muestree distintas áreas de síntomas asegura la evaluación sistemáti-
ca de áreas que podrían pasarse por alto. Un cuestionario que permita la evaluación
de muchos campos y su mapeo en un perfil es particularmente útil porque se puede
evaluar la gravedad relativa de un campo concreto entre las muchas características.
Evaluar áreas múltiples de síntomas con un cuestionario amplio también puede ser-
vir como instrumento de selección para sugerir más procedimientos de evaluación
que podrían ser empleados. Las puntuaciones del niño pueden revelar unos pocos
campos de problemas destacados (por ejemplo, hiperactividad o agresividad). La
evaluación más específica de estas áreas puede continuarse con escalas dedicadas a
aquellas áreas ya identificadas con importancia clínica.
Además de la evaluación de los síntomas, ha de evaluarse el funcionamiento
prosocial. Como se ha dicho, el ajuste del niño depende de algo más que la elimina-
ción o reducción de los síntomas. El funcionamiento prosocial positivo tal como se
evalúa por la interacción social, la participación con otros en actividades y los con-
tactos con amigos son igualmente importantes. Existen escalas para evaluar facetas
alternativas del funcionamiento prosocial. Por ejemplo, se dispone de varios cues-
tionarios para que niños, padres y maestros evalúen el funcionamiento social del
niño (Hops y Greenwood, 1988). Las medidas evalúan áreas tales como la interac-
ción positiva con compañeros, entablar conversaciones, aceptar críticas de otros,
negociar y llegar a acuerdos. Aunque existen muchas pruebas, se usan relativamen-
te poco en comparación con los instrumentos de evaluación de los síntomas y tras-
tornos. En general, también estas pruebas están menos desarrolladas que las de los
trastornos.
VII. CONCLUSIONES
La investigación de los problemas emocionales y conductuales en niños es un área

en continua actividad. Ello se comprueba en parte por el número de libros recientes
dedicados al tema de la evaluación infantil (Martin, 1988; Mash y Terdal, 1988; La
Greca, 1990; Ollendick y Hersen, 1993). Los libros reflejan el desarrollo de nuevos
instrumentos para evaluar una amplia gama de problemas emocionales y conductua-
les. Por supuesto, la evaluación infantil requiere más que eldesarrollo y validación
de medidas ya que produce desafíos particulares. Un reto inicial es comprender el
ámbito y naturaleza de los cambios en el desarrollo. Tanto los cambios cuantitativos
(por ejemplo, frecuencia del llanto, peleas, discusiones...) como los cualitativos (por
ejemplo, afecto, cognición, conducta...) transcurren durante la infancia. Al menos,
esto significa que no se puede esperar que un conjunto constante de elementos para
820 Alan E. Kazdin
evaluar un área de interés (por ejemplo, agresividad o depresión) englobe o se apli-

que a toda la infancia.
En relación con lo anterior, el desarrollo de las pruebas requiere atención hacia
los procesos fundamentales de desarrollo. Por ejemplo, entender el desarrollo cog-
nitivo y del lenguaje es importante porque presenta las condiciones límite de lo que
los niños tienden a concebir como posibilidades de descripción o explicación de su
experiencia. Cuando se pide a un niño que reflexione sobre su propia conducta o la
de los demás, un marco de referencia esencial es comprender las concepciones del
mundo que los niños tienen a esa edad. De forma similar, la interpretación de la ac-
tuación o las puntuaciones en una prueba requieren una perspectiva normativa. Una
puntuación dada puede o no separarse de los niveles normativos de actuación; las
normas de comparación pueden cambiar notablemente con la edad. Así, la interpre-
tación de las pruebas en niños debe nutrirse de datos normativos cuando sea posible.
La evaluación infantil no puede realizarse aisladamente. A menudo se da el caso de
que el funcionamiento de los padres o familiares afecta directamente al funciona-
miento infantil o ala interpretación de las evaluaciones que realiza el padre. En con-
secuencia, la evaluación del niño incluye muchas veces evaluaciones por parte de los
padres y de la familia que incluyen psicopatología de los padres, estrés, prácticas
educativas, disputas de pareja, apoyo social y otros aspectos.
La consideración de las modalidades de evaluación ha identificado varias cues-
tiones de investigación. La frecuentemente escasa correspondencia entre métodos
alternativos de evaluación y perspectivas (por ejemplo, niño, padres, profesor) susci-
tan múltiples interrogantes. La utilidad de la información de fuentes alternativas y su
integración requieren más investigación. La disponibilidad de pruebas para evaluar
una amplia gama de conceptos y múltiples perspectivas proporciona oportunidades
especiales para comprender el funcionamiento infantil. Las oportunidades incluyen
no sólo la investigación clínica sino también la práctica porque los análisis detallados
son posibles para identificar el ámbito del trastorno y la competencia prosocial, y las
interrelaciones del niño, los padres y el funcionamiento familiar.
pi R. R. (1983). Parenting Stress Index. Manual. Charlottesville. Pediatric Psychology

ress.
Achenbach, T. M. y Edelbrock, C. S. (1983). Manual for the Child Behavior Checklist and
Revised Child Behavior Profile. Burlington. University Associates in Psychiatry.
Achenbach, T. M. y Edelbrock, C. S. (1986). Manual for the Teacher's Report Form and tea-
cher version of the Child Behavior Profile. Burlington. University of Vermont.
Achenbach, T. M., McConaughy, S. H. y Howell, C. T. (1987). Child/adolescent behavioral
and emotional problems: Implications of cross-informant correlations for situational spe-
cificity. Psychological Bulletin, 101, 213-232. y
Ambrosini, P. J., Metz, C., Prabucki, K. y Lee, J. (1989). Videotape reliability of the third re-
vised edition of the K-SADS. Journal of the American Academy of Child and Adolescent
Psychiatry, 28, 723-728.
American Psychiatric Association (1987, 1994). Diagnostic and statistical mannal of mental
disorders-Revised. Washington, DC. APA.
Barkley, R. A. (1988). Child behavior rating scales. En M. Rutter, A. H. Tuma e 1 S. Lann
(dirs.), Assessment and diagnosis in child psychopathology. Nueva York. Guilford Press.
Beck, A. T., Ward, C. H., Mendelson, M., Mock, J. y Erbaugh, J. (1961). An inventory for
measuring depression. Archives of General Psychiatry, 4, 53-63.
Bradley, R. H. y Caldwell, B. (1979). Home observation for measurement of the environment:
A revision of the preschool scale. American Journal of Mental Deficiency, 84, 235-244.
Brody, G. H. y Forehand,R. (1986). Maternal perceptions of child maladjustment as a func-
tion of the combined influence of child behavior and maternal depression. Jomrnal of
Caldwell, B. y Bradley, R. H. (1984). Home observation for measurement of the environ-
ment. Homewood. Dorsey Press.
Caron, C. y Rutter, M. (1991). Comorbidity in child psychopathology: Concepts, issues, and
research strategies. Journal of Child Psychology and Psychiatry, 32, 1063-1080.
Chamberlain, P. y Reid, J. B. (1987). Parent observation and report of child symptoms. Be-
Chambers, W. J., Puig-Antich, J., Hirsch, M., Páez, P., Ambrosini, P. J., Tabrizi, M. A. y Da-
vies, M. (1985). The assessment of affective disorders in children and adolescents by se-
mistructured interview: Test-retest reliability. Archives of General Psychiatry, 42, 696-
702.
Clarke, G., Hops, H., Lewinsohn, P. M., Andrews,J.,Seeley,J.R. y Williams,J. (1992). Cog-
nitive-behavioral group treatment of adolescent depression: Prediction of outcome. Be-
Coie,J.D. y Dodge, K. A. (1983). Continuities and changes in children's social status: A five-
year longitudinal study. Merrill-Palmer Quarterly, 29, 261-282.
Dodge, K. A. (1983). Behavioral antecedents of peer social status. Child Development, 54,
1386-1399.
Dumas, J. E. y Wahler, R. G. (1983). Predictors of treatment outcome in parent training: Mo-
ther insularity and socioeconomic disadvantage. Behavioral Assessment, 5, 301-313.
Edelbrock, C. y Costello, A. J. (1988). Structured psychiatric interviews for children. En
M. Rutter, A. H. Tuma e 1. S. Lann (dirs.), Assessment and diagnosis in child psychopatho-
logy. Nueva York. Guilford Press.
Edelbrock, C. S., Costello, A. J., Dulcan, M. K., Conover, N. C. y Kalas, R. (1986). Parent-
child agreement on child psychiatric symptoms assessed via structured interview. Journal
of Child Psychology and Psychiatry, 27, 181-190.
Elliott, D. S., Huizinga, D. y Ageton, S. S. (1985). Explaining delinquency and drug use. Be-
verly Hills (Ca). Sage.
Elliott, D. S., Huizinga, D. y Menard, S. (1988). Multiple problem youth: Delinquency, subs-
tance, abuse, and mental health problems. Nueva York. Springer-Verlag.
Endicott,J.y Spitzer, R. L. (1978). A diagnostic interview: The Schedule for Affective Disor-
ders and Schizophrenia. Archives of General Psychiatry, 35, 837-844.
Finch, A. J., Saylor, C. F. y Edwards, G. L. (1985). Children's Depression Inventory: Sex
and grade norms for normal children. Journal of Consulting and Clinical Psychology, 53,
424-425,
Forehand, R., Lautenschlager, G. J., Faust, J. y Graziano, W. G. (1986). Parent perceptions
and parent-child interactions in clinic-referred children: A preliminary investigation of
the effects of maternal depressive moods. Behaviour Research and Therapy, 24, 73-75.
Graham, J. R. (1990). MMPL-2: Assessing personality and psychopathology. Nueva York. Ox-
ford University Press.
822 Alan E. Kazdin
Gresham, F. M. y Little, S. G. (1993). Peer-referenced assessment strategies. En T. H. Ollen-

dick y M. Hersen (dirs.), Handbook of child and adolescent assessment. Needham
Heights. Allyn and Bacon. JE
Harter, S. (1990). Issues in the assessment of the self-concept in children and adolescents. En
A. M. LaGreca (dir.), Through the eyes of the child: Obtaining self-reports from children
and adolescents. Boston. Allyn and Bacon. : : ;
Hayvren, M. y Hymel, S. (1984). Etthical issues in sociometric testing: Impact of sociometric
measures on interaction behavior. Developmental Psychology, 20, 844-849. :
Hodges, K. y Zeman, F. J. (1993). Interviewing. En T. H. Ollendick y M. Hersen (dirs.),
Handbook of child and adolescent assessment. Needham Heights. Allyn and Bacon.
Hops, H. y Greenwood, C. G. (1988). Social skills deficits. En E. J. Mash y L. G. Terdal
(dirs.), Behavioral assessment of childhood disorders (2* ed). Nueva York. Guilford Press.
Ivens, C. y Rehm, L. P. (1988). Assessment of childhood depression: Correspondence bet-
ween reports by child, mother, and father. Journal ofthe American Academy of Child and
Adolescent Psychiatry, 27, 738-741. :
Jensen, P. S., Traylor, J., Xenakis, S. N. y Davis, H. (1988). Child psychopathology rating
scales and interrater agreement: 1. Parents” gender and psychiatric symptoms. Journal of
the American Academy of Child and Adolescent Psychiatry, 27, 442-450. :
Jessor, R. y Jessor, S. L. (1977). Problem behavior and psychological development: A longitu-
dinal study ofyouth. Nueva York. Academic Press. :
Kashani, J. H., Orvaschel, H., Burk, J. A. y Reid, J. C. (1985). Inform variance: the issue of
parent-child disagreement. Journal of the American Academy of Child Psychiatry, 24,
437-441.
Kazdin, A. E. (19894). Behavior modification in applied settings (4* ed.). Pacific Grove.
Brooks/Cole.
Kazdin, A. E. (19895). Identifying depression in children: A comparison of alternative selec-
tion criteria. Journal ofAbnormal Child Psychology, 17, 437-454.
Kazdin, A. E. (19904). Childhood depression. Journal of Child Psychology and Psychiatry,
31, 121-160.
Kazdin, A. E. (1990b). Premature termination from treatment among children referred for
antisocial behavior. Journal of Child Psychology and Psychiatry, 31, 415-425. j
Kazdin, A. E. (1992). Research design in clinical psychology (2* ed.). Needham Heights. Allyn
and Bacon.
Kazdin, A. E. (en prensa). Informant variability. En W. Reynolds y H. Johnson (dirs.),
Handbook of depression in children and adolescents. Nueva York. Wiley.
Kazdin, A. E., Bass, D., Siegel, T. y Thomas, C. (1989). Cognitive-behavioral therapy and re-
lationship therapy in the treatment of children referred for antisocial behavior. Journal of
Kazdin, A. E. y Buela-Casal, G. (1994). Conducta antisocial. Madrid. Pirámide.
Kazdin, A. E., French, N. H., Unis, A. S. y Esveldt-Dawson, K. (1983). Assessment of child-
hood depression: Correspondence of child and parent ratings. Journal of the American
Academy of Child Psychiatry, 22, 157-164.
Kazdin, A. E., French, N. H., Unis, A. S., Esveldt-Dawson, K. y Sherick, R. B. (1983). Hope-
lessness, depression and suicidal intent among psychiatrically disturbed inpatient chil-
dren. Journal of Consulting and Clinical Psychology, 51, 504-510.
Kazdin, A. E., Mazurick, J. L. y Bass, D. (en prensa). Risk for attrition in treatment of antiso-
cial children and families. Journal of Clinical Child Psychology.
Kazdin, A. E., Siegel, T. y Bass, D. (1992). Cognitive problem-solving skills training and pa-
rent management training in the treatment of antisocial behavior in children. Journal of
Kolko, D. J. y Kazdin, A. E. (1992). Emotional/behavioral problems in clinic and nonclinic
children: Correspondence among child, parent, and teacher reports. Documento inédito.
Kolko, D. ]., Kazdin, A. E., Thomas, A. M. y Day, B. (en prensa). Heightened child physical
abuse potential: Child, parent, and family dysfunction. Journal of Interpersonal Violence.
Kovacs, M. (1981). Rating scales to assess depression in school aged children. Acta Paedopsy-
chiatrica, 46, 305-315.
LaGreca, A. M. (dir.) (1990). Through the eyes of the child: Obtaining self-reports from chil-
dren and adolescents. Needham Heights. Allyn and Bacon.
Lally, R., Mangione, P. L. y Honig, A. S. (1988). The Syracuse University Family Develop-
ment Research Program: Long-range impact on an early intervention with low-income
children and their families. En D. Powell (dir.), Parent education as early childhood inter-
vention: Emerging directions in theory, research, and practice. Norwood. Ablex.
Landau, S. y Milich, R. (1990). Assessment of children's social status and peer relations. En
A. M. LaGreca (dir.), Through the eyes of the child: Obtaining self-reports from children
and adolescents. Boston. Allyn and Bacon.
Lapouse, R. y Monk, M. A. (1958). An epidemiologic study of behavior characteristics in
children. American Journal of Public Health, 48, 1134-1144.
Ledingham, J. E., Younger, A., Schwartzman, A. y Bergeron, G. (1982). Agreement among
teacher, peer, and self-ratings of children's aggression, withdrawal, and likability. Journal
ofAbnormal Child Psychology, 10, 363-372.
Lefkowitz, M. M. y Tesiny, E. P. (1980). Assessment of childhood depression. Journal of
Consulting and Clinical Psychology, 48, 43-50. €
Lefkowitz, M. M. y Tesiny, E. P. (1985). Depression in children: Prevalence and correlates.
Journal of Consulting and Clinical Psychology, 53, 647-656. y cun
Lefkowitz, M. M., Tesiny, E. P. y Gordon, N. H. (1980). Childhood depression, family inco-
me, and locus of control. Journal of Nervous and Mental Disease, 168, 732-735.
Lloyd, B. H. y Abidin, R. R. (1985). Revision of the Parenting Stress Index. Journal of Pedia-
tric Psychology, 10, 169-177. ¡27
Loeber, R., Green, S. M., Lahey, B. B. y Stouthamer-Loeber, M. (1990). Optimal informants
on childhood disruptive behaviors. Development and Psychopathology, 1,317-337.
MacFarlane, J. W., Allen, L. yHonzik, M. P. (1954). A developmental study of the behavior
problems of normal peras between 21 months and 14 years. Berkeley. University of
California Press.
Mahler, M. (1961). On sadness and grief in infancy and childhood. Psychoanalytic Study of
the Child, 16, 332.
Martin, R. P. (1988). Assessment of personality and behavioral problems: Infancy through
adolescence. Nueva York. Guilford Press. | ,
Mash, E. y Terdal, L. (dirs.) (1988). Behavioral assessment of childhood disorders (2* ed.).
va York. Guilford Press.
a R. J. y Forehand, R. (1988). Conduct disorders. En E. J. Mash y Lo LEC
(dirs.), Behavioral assessment of childhood disorders (2* ed.). Nueva York. Gui or A ress.
Milner, J. S. (1986). The Child Abuse Potential Inventory: Manual (2 ed.). Webster. Psytec
10n. P
pe eeTirn Additional cross-validation of the Child Abuse Potential Inventory.
¡cal Assessment, 1, 219-223.
ón egos: and pa of the Child Abuse Potential Inventory.
ld Development and Care, 42, 85-97. |
ra Fine, edHaley, G. y Marriage, K. (1985). Child and ar
Child-report versus parent-report information. Journal of the American Academy
vag ln de td
'
Child Psychiatry, 24, 298-302.
1 tory: Normative data and ut1 :

de Academy of Child and Adolescent Psychiatry, 26, 43-48.
824 Alan E. Kazdin
Offer, D., Ostrov, E. y Howard, K. I. (1984). Patterns of adolescent self-image. San Francis-
co (Ca). Jossey-Bass.
Ollendick, T. H. y Hersen, M. (dirs.) (1993). Handbook of child and adolescent assessment.
Needham Heights. Allyn and Bacon. Sin eg€ 2
Orvaschel, H., Ambrosini, P. y Rabinovich, H. (1993). Diagnostic issues in child assessment.
En T. H. Ollendick y M. Hersen (dirs.), Handbook of child and adolescent assessment.
Needham Heights. Allyn and Bacon.
Orvaschel, H., Puig-Antich, J., Chambers, W., Tabrizi, M. A. y Johnson, R. (1982). Retros-
pective assessment of prepubertal major depression with the Kiddie-SADS-E. Journal of
the American Academy of Child Psychiatry, 21, 392-397.
Parker, J. G. y Asher, S. T. (1987). Peer relations and later personal adjustment: Are low-
accepted children at risk? Psychological Review, 102, 357-389.
Patterson, G. R. (1982). Coercive family process. Eugene. Castalia.
Patterson, G. R., Reid,J.B., Jones, R. R. y Conger, R. E. (1975). A social learning approach to
family interaction (vol. 1). Eugene. Castalia. ?
Phares, V., Compas, B. E. y Howell, D. C. (1989). Perspectives on child behavior problems:
Comparisons of children's self-reports with parent and teacher reports. Psychological As-
sessment, 1,68-71.
Piacentini, J. (1993). Checklists and rating scales. En T. H. Ollendick y M. Hersen (dirs.),
Handbook of child and adolescent assessment. Needham Heights. Allyn and Bacon.
Puig-Antich, J., Perel,J.,Lupatkin, W., Chambers, W. J., Tabrizi, M. A., King, J., Davies, M.,
Johnson, R. y Stiller, R. (1987). Imipramine in prepubertal majora depressive disorders.
Archives of General Psychiatry, 44, 81-89.
Putallaz, M. (1983). Predicting children's sociometric status from their behavior. Child De-
velopment, 54, 1417-1426.
Reid, J. R. (1978). A social learning approach to family intervention: Observation in home set-
tings (Vol. 2). Eugene. Castalia.
Reid, J. R., Baldwin, D. V., Patterson, G. R. y Dishion, T. J. (1988). Observations in the as-
sessment of childhood disorders. En M. Rutter, A. H. Tuma e 1. S. Lann (dirs.), Assess-
ment and diagnosis in child psychopathology. Nueva York. Guilford Press.
Reynolds, W. M., Anderson, G. y Bartell, M. (1985). Measuring depression in children: A mul-
ti-method assessment investigation. Journal of Abnormal Child Psychology, 13, 513-526.
Rie, H. E. (1966). Depression in childhood: A survey of some pertinent contributions. Jomr-
nal of the American Academy of Child Psychiatry, 5, 653-685.
Roff, M., Sells, B. y Golden, M. M. (1972). Social adjustment and personality development in
children. Minneapolis. University of Minnesota Press.
Rotundo, N. y Hensley, V. R. (1985). The Children's Depression Scale: A study of its vali-
dity. Journal of Child Psychology and Psychiatry, 26, 917-927.
Saylor, C. F., Finch, A. J., Baskin, C. H., Furey, W. y Kelly, M. M. (19844). Construct vali-
dity for measures of childhood depression: Application of multitrait-multimethod me-
thology. Journal of Consulting and Clinical Psychology, 52, 977-985.
Saylor, C. F., Finch, A. J., Spirito, A. y Bennett, B. (1984b). The Children's Depression In-
ventory: Á systematic evaluation of psychometric properties. Journal of Consulting and
Smucker, M. R., Craighead, W. E., Craighead, L. W. y Green, B. J. (1986). Normative and re-
hability data for the Children's Depression Inventory. Journal of Abnormal Child Psy-
chology, 14, 25-39.
Webster-Stratton, C. (1985). Predictors of treatment outcome in parent training for conduct
disordered children. Behavior Therapy, 16, 223-243.
Webster-Stratton, C. y Hammond, M. (1988). Maternal depression and its relationship to life
stress, perceptions of child behavior problems, parenting behaviors, and child conduct
problems. Journal ofAbnormal Child Psychology, 16, 299-315.
Weisz, ]. R., Weiss, B., Wasserman, A. A. y Rintoul, B. (1987). Control-related beliefs and
depression among clinic-referred children and adolescents. Journal of Abnormal Psycho-
logy, 96, 58-63.
Williams, C. L., Butcher, J. N., Ben-Porath, Y. S. y Graham,].R. (1992). MMPLA content sca-
e Assessing psychopathology in adolescents. Minneapolis. University of Minnesota
ress.
World Health Organization (1988). International classification of diseases, injuries, and can-
ses of death (10* ed.). Ginebra. World Health Organization.
Kazdin, A. E. y Buela-Casal, G. (1994). Conducta antisocial. Madrid. Pirámide.

LaGreca, A. M. (dir.) (1990). Through the eyes of the child: Obtaining self-reports from chil-
dren and adolescents. Needham Heights. Allyn and Bacon.
Martin, R. P. (1988). Assessment of personality and behavioral problems: Infancy through
adolescence. Nueva York. Guilford Press.
Mash, E. y Terdal, L. (dirs.) (1988). Behavioral assessment of childhood disorders (2* ed.).
Ollendick, T. H. y Hersen, M. (dirs.) (1984). Child behavioral assessment. Nueva York. Per-
amon Press.
Ollendick, T. H. y Hersen, M. (dirs.) (1992). Handbook of child and adolescent assessment.
Needham Heights. Allyn and Bacon.
Rutter, M., Tuma, A. H. y Lamn, 1. S. (dirs.) (1988). Assessment and diagnosis of child psycho-
pathology. Nueva York. Guilford Press.
Sattler, J. M. (1990). Assessment of children (3* ed.). San Diego. Autor.
Hand boob ud ios
Pr e] HankErPu Y cota su Abd AS piRA .
] Ñ che 4 : ni letal marora den
vr to al vesblo lo ho ARA e $1) ab JA al eHT %
fa ' a UL nati
0009 (a k aria Ao € 05
cell ejPe
1bie, orah, 48 RI *7 ib) £ 1l seri.) Y a da
; HACIAJSP INTAD dy , >! ddr. Av
e E mt ba"e) payb > uoh (000 Ppp J
Y Pr Ue Y y Dion, 1 A.O
. S BF A mu 5 e. ma10(din), As A
Pai A Ca sed PA 4 -
Sl > e pa 2
A 4 4 +7 A FE dr ú KA
a f , ..
Hi E +4
VETIBS
E AOCONAS,
Ye :
4 4
dl Col
4
' “
QUINTA PARTE
EVALUACIÓN DE LA PERSONALIDAD
33. EVALUACIÓN DE LOS RASGOS PSICOLÓGICOS
CARMEN GARCÍA-MONTALVO
Il. INTRODUCCIÓN
Abordar el tema de la evaluación de los rasgos de personalidad no es una tarea fácil

por diversos motivos, la mayoría de ellos relacionados con la dificultad inicial de defi-
nir los términos que componen el título del capítulo; en efecto, no es sencillo definir
la personalidad, y aunque la “expresión” rasgos de personalidad parece delimitar, y
de hecho lo hace, aquello a lo que deberíamos referirnos, la realidad es que esa deli-
mitación implica a su vez una nueva complicación, que es definir, caracterizar y de-
terminar lo que son rasgos, ya que parece obvio que deberíamos saber qué es aquello
que tenemos que evaluar. Además, la cuestión de los rasgos lleva asociada de forma
casi ineludible una de las polémicas más duraderas dentro del ámbito de la personali-
dad. Nos referimos, evidentemente, al problema de la consistencia conductual.
Por otro lado, deberíamos plantearnos también, al hilo de nuestra discusión teó-
rica sobre los rasgos, la tarea de averiguar qué estrategias de evaluación, como cate-
gorías, pueden permitirnos evaluarlos y deberemos elegir, de entre ellas, aquellas que
resulten ser más eficaces o que se hayan demostrado más potentes para ello. Una vez
efectuada la elección, se realizará un estudio detallado de las mismas, en el que se
analizarán su desarrollo histórico y su estatus actual. Finalmente, se hará un análisis
de las perspectivas futuras de la evaluación de los rasgos de personalidad, tal y como
se contemplan desde el momento actual.
IL. LA PROBLEMÁTICA DE LOS RASGOS EN PSICOLOGÍA DE LA PERSONALIDAD
Es ésta una cuestión que puede abordarse desde distintos puntos de vista, uno de los
cuales sería analizar, aunque de forma breve, cuál ha sido la evolución del concepto
de rasgo alo largo de la historia de la psicología de la personalidad, desde sus prime-
ras conceptualizaciones hasta las nuevas reformulaciones actuales, que han venido a
aparecer como consecuencia del declive del concepto de rasgo, sucedida a partir de la
obra de Mischel de 1968.
11. Teorías del rasgo

Resulta ya clásico remontarse a la definición de rasgo propuesta por Allport (1970):
un sistema neuropsíquico (peculiar al individuo) generalizado y focalizado, dotado
de la capacidad de convertir muchos estímulos en funcionalmente equivalentes y de

iniciar y guiar formas coherentes (equivalentes) de comportamiento adaptativo y ex-
presivo. Asimismo, Cattell (1972) nos define el término como una tendencia a reac-
cionar, relativamente permanente y amplia. En definitiva, las definiciones de rasgo
implican todas ellas la idea de que existe “algo interno” que determinalaconducta de
las personas y que permite, además, dar cuenta de las diferencias individuales, por un
lado, y de las semejanzas entre individuos, por otro (Maddi, 1968),yaque los sujetos
pueden distribuirse a lo largo de un continuo, en el que todos participarán en mayor
o menor grado.
Hasta aquí, la mayor parte de los autores que utilizan los rasgos como concep-
tos centrales en sus teorías acerca de la personalidad estarían básicamente de acuer-
do. Sin embargo, a partir de este punto de partida relativamente común, pronto
empezaron las controversias dentro de los propios defensores de este concepto. La
primera de ellas estaba relacionada con el hecho de o bien buscar sólo una parte
concreta de la estructura de la personalidad en la determinación del comporta-
miento (teorías del rasgo único) o bien intentar describir la estructura de la perso-
nalidad total (teorías multirrasgo). Estas últimas, a nuestro juicio las de mayor inte-
rés desde el punto de vista de la evaluación, pretenden localizar el conjunto de
rasgos que constituyen la estructura de la personalidad y de ellas se dedujeron gran
cantidad de instrumentos de medida, apropiados para cada uno de estos rasgos
(Hampson, 1982).
El segundo gran problema surge cuando se quiere determinar el número y la va-
riedad de rasgos que podrían dar cuenta del comportamiento humano. Ni siquiera el
hecho de recurrir a las técnicas de análisis correlacional y factorial para la obtención
de rasgos (tarea para la que se demostraron muy útiles) aportó soluciones, ya que los
distintos investigadores no llegaron a ponerse de acuerdo respecto a qué estrategias
factoriales eran las más adecuadas para cumplir ese objetivo. Entre los autores que
han desarrollado esta perspectiva multirrasgo a través del análisis factorial, se en-
cuentran Guilford, Eysenck y Cattell. Exponemos a continuación algunas de las
aportaciones más importantes de los dos últimos, añadiendo que con la polémica
que mantuvieron la teoría del rasgo se aseguró un “estatus” relevante en el ámbito de
la personalidad durante mucho tiempo. La obra de Eysenck podría resumirse en tres
períodos cronológicos (García Mérita, 1989), definidos por las circunstancias que a
continuación exponemos:
a. Primer período (1947-1955). Aparecen mediante análisis factorial dos di-

mensiones de personalidad (extraversión y neuroticismo) y se validan comparando
los resultados del análisis factorial con una clasificación independiente. A partir de
ahí se diseña una serie de cuestionarios para evaluar ambas dimensiones.
b. Segundo período (1958-1967). Hay un intento de explicación de bases bioló-
gicas de las dimensiones mencionadas y una incursión en el campo del psicoticismo,
lo que amplía su conceptualización de la estructura de personalidad a tres factores.
c. Tercer periodo (1967). Recurre definitivamente a la biología para explicar la
consistencia en el comportamiento de las personas (Ibáñez y Galdón, 1985), remo-
delando su teoría de la conducta en términos de “activación” y haciendo un énfasis
especial en los constructos pavlovianos.
Evaluación de los rasgos psicológicos
831
Por otro lado, los trabajos de Raymond B. Cattell tienen en común con los de
Eysenck el estar enmarcados dentro de la teoría de los rasgos y el utilizar el análisis
factorial como herramienta de trabajo a la hora de aislar los rasgos que explican el
comportamiento humano. Sin embargo, a partir de aquí Cattell, basándose inicial-
mente en dos de los tres tipos de datos que describió (L= basados en calificaciones,
Q= basados en cuestionarios y T= basados en pruebas objetivas) encontró una es-
tructura de la personalidad compuesta por 16 factores primarios (más tarde los des-
cribiremos brevemente al tratar el cuestionario 16PF) representativos de otros tantos
rasgos temperamentales. Á su vez, obtuvo en una segunda factorización ocho facto-
res de segundo orden formados por agrupaciones de los 16 primarios. Además, ob-
tuvo factores de humor o temple (Fransella, 1981), entendidos como estados en el
sentido de conductas afectadas por variables a corto plazo para los que elaboró una
prueba especial (el Erght state questionnaire (ESQ) [Cuestionario de ocho estados]) y
como rasgos motivacionales con el fin de investigar la dinámica de la personalidad,
distinguiendo dos tipos de factores: ergios (impulsos biológicos) y sentimientos (im-
pulsos modelados por la cultura). Algunos de los ergios y sentimientos descritos por
Cattell pueden evaluarse mediante el Motivational analysis test (MAT) [Test de análi-
sis motivacional].
Pero, volviendo a los factores temperamentales, podemos comprobar fácilmente
las diferencias entre la estructura hallada y propuesta por Eysenck y la que nos plan-
tea Cattell. Y es precisamente en la concepción de factores primarios y secundarios
en donde se inician las divergencias entre ambos autores. De este modo, Eysenck
trabaja con una estructura jerárquica en la que sólo interesan los superfactores, de
ahí que proponga sólo tres dimensiones: extraversión, neuroticismo y psicoticismo
de índole claramente superficial que, según él, se bastan para comprender la perso-
nalidad de un sujeto. Cattell, por el contrario, no sólo no desestima los factores pri-
marios sino que los considera igualmente estables y útiles para describir la personali-
dad. Esta controversia ha dado lugar a numerosa bibliografía (Eysenck y Eysenck,
1969; Cattell y Kline, 1977; Krug, 1978) que puso de relieve algunas cuestiones de
interés descritas por Fransella (1981):
a. Cattell trabaja con factores oblicuos rotados hasta la estructura simple; en

los factores de segundo orden hay acuerdo entre Cattell y Eysenck. pd.
b. De este modo, exvia y extraversión son el mismo factor y, de forma similar,
ansiedad y neuroticismo muestran el mismo modelo factorial. La diferencia en la
nomenclatura se debe meramente a la diferencia en la interpretación, existiendo tra-
bajos que avalan esta idea (Prieto, 1981; Blanco-Picabia, Pál-Hegedús y Polo Padillo,
1982). al
c. Eysenck no puede encontrar los factores primarios en sus datos. Con todo,
sus elementos se encuentran más circunscritos y sus análisis presentan características
subfactoriales (es decir, no todos los factores se encuentran rotados). Por tanto, exis-
ten razones técnicas que explican las diferencias.
Esta última es una apreciación que no sólo afecta a la polémica entre los autores
que nos ocupan, sino que además parece estar en la base de la mayoría de las diver-
gencias existentes a la hora de determinar el número y la variedad de rasgos que con-
forman la estructura básica de la personalidad. Sirva para ilustrar lo anterior elsi-

guiente ejemplo. Eysenck realizó en 1969 una investigación en la que factorizó las
escalas del EP7, Guilford y 16PE, mediante análisis factorial oblicuo rotado, en un in-
tento de aproximación a Cattell, que consideraba que utilizar rotaciones ortogonales
(lo que Eysenck hacía inicialmente) no era adecuado para el tipo de datos utilizados
ya que, en el mundo real y complejo, las dimensiones fundamentales suelen correla-
cionar (Cattell y Kline, 1977). El trabajo de Eysenck reveló la existencia de dos gran-
des factores (extraversión y neuroticismo), pero no logró describir la personalidad
mediante un número superior de factores primarios. La réplica de Cattell fue descu-
brir algunas “irregularidades” de tipo técnico: la rotación Promax, aunque es una so-
lución oblicua, no alcanzó la estructura simple, y el número de elementos pertene-
cientes a las tres escalas, en relación con el tamaño global de las mismas.
112. El situacionismo
En un contexto como el descrito anteriormente, el cual provocó una preocupación

cada vez mayor por cuestiones metodológicas básicas tales como la validez y fiabili-
dad de los instrumentos utilizados, aparecieron las aportaciones conductistas a la
personalidad y el concepto de rasgo comienza a tambalearse (García Mérita, 1989).
Siempre suele culparse a la obra de Mischel de 1968 del desmoronamiento de toda la
construcción dimensionalista, al menos inicialmente. En efecto, Mischel, apoyándo-
se en la falta de fiabilidad de los instrumentos, su escaso valor predictivo y su falta de
utilidad, construyó su crítica en torno a la consistencia y estabilidad de la personali-
dad (Fernández-Ballesteros, 1981; Ibáñez y Belloch, 1983) y propuso su acerca-
miento situacionista, que provocó un abandono del concepto de personalidad en fa-
vor de variables situacionales. Para Mishel, la inconsistencia de la conducta es
debida, en gran medida, a la especificidad de la misma, especificidad que está motiva-
da y controlada por la situación. De este modo, el centro de las investigaciones debe
ser el estudio de las situaciones. Es por eso que Ibáñez y Belloch (1983) nos hablan
de una “pérdida de la persona” durante la década de los años setenta, que se ve susti-
tuida por una serie de contingencias ambientales. Sin embargo, esta postura tan radi-
cal tuvo una vida relativamente corta y sufrió, a su vez, “contra-críticas”, como la de
Bowers (1973) y la de Eysenck y Eysenck (1980), de tal forma que el propio Mischel
y Otros situacionistas reformularon su modelo admitiendo la influencia de variables
cognitivas que inciden sobre la percepción de las situaciones. A partir de aquí, nos
encontramos primero con una generación de teorías que sugieren que tanto los fac-
tores de personalidad como los situacionales son determinantes de la conducta y, se-
gundo, con una serie de “reformulaciones” acerca del concepto de rasgo que resul-
tan de gran interés.
113. El interaccionismo
Tendríamos bastantes dificultades si pretendiésemos ser exhaustivos respecto al

tema que da título a este epígrafe y ya hemos planteado con anterioridad que no es
833
tarea nuestra “hacer” psicología de la personalidad en este capítulo. Es por ello que
únicamente nos referiremos a la teoría que resulta más representativa de este marco
conceptual, sin olvidarnos de que la perspectiva integradora que representa el inte-
raccionismo ya había sido intentada mucho antes por autores como Lewin (1935) y
Murray (1938).
El interaccionismo de Endler y Magnusson (1976) descansa sobre las siguientes
premisas:
a. La conducta está en función de un proceso de interacciones múltiples o

feedback entre las personas y las situaciones.
b. La persona es un agente activo e intencional en el proceso de interacción.
c. Con respecto a la persona, los factores cognitivos son los determinantes
esenciales de la conducta en el proceso de interacción.
d. Con respecto a la situación, el significado psicológico para la persona es el
factor determinante más importante.
Junto a este modelo teórico, se propugna una determinada metodología, que se

centra en la cuantificación y que utiliza tanto métodos extensivos como intensivos,
siendo el análisis correlacional y el de varianza sus pilares estadísticos, aunque el uso
de datos subjetivos no está descartado (Ibáñez y Belloch, 1983). El principal obs-
táculo que ha encontrado el interaccionismo se puede plantear desde dos posiciones,
aunque referidas a la misma problemática; por un lado, la dificultad de centrarse en
las variables moduladoras o mediadoras, pese a que teóricamente son las más rele-
vantes y, por otro, el problema de explicar cómo se produce la interacción. En este
contexto, Pelechano (1985) señala que las interacciones no son en sí mismas neutras
y nos pueden presentar una imagen irreal y deformada de la personalidad. Además,
aunque sea posible extraer algunas generalizaciones correctas persona x situación,
esta interacción puede ser, a su vez, influida por una nueva variable y así sucesiva-
mente. Esto plantea problemas graves ya expresados en la famosa frase de Cronbach
(1975, p. 119): «cuando nos ocupamos de las interacciones entramos en un salón de
espejos que se extiende hasta el infinito». En cualquier caso, el interaccionismo pro-
pició de forma clara una consideración del principio de la consistencia que ya no se
basa en supuestos de existencia absoluta, sino que se adapta a un punto de vista rela-
tivo, mucho más acorde con la realidad (Hampson, 1982).
14. Reformulaciones actuales del concepto de rasgo

Según Belloch (1989), el rasgo ha sobrevivido a las críticas situacionistas, aunque
también es cierto que las reformulaciones que ha sufrido han hecho variar en buena
medida los planteamientos clásicos señalados al comienzo del capítulo. Esta misma
autora nos habla de que una de las vías por las cuales se ha operado la reconceptuali-
zación del rasgo ha sido el enfoque de categorización proveniente del entorno cog-
nitivo. Tal modelo ha sido aplicado al estudio de la percepción de personas por dis-
tintos autores, que difieren entre sí básicamente en la definición del nivel básico de
categorización. De este modo, Buss y Craik (1985) hablan de disposiciones enfoca-
das como acciones más frecuentes y concebidas como categorías cognitivas de accio-
nes, que sirven para resumir las tendencias generales del comportamiento. Por su
parte, Cantor y Mischel (1977) definen un modelo en el que las categorías represen-
tan tipos de persona y los atributos que se asocian a esas categorías incluyen tanto
rasgos como conductas, y Hampson (1982) —interesada inicialmente en las teorías
implícitas de la personalidad— desarrolla un enfoque que se centra en la representa-
ción de rasgos, a los que considera como categorías cognitivas que hacen referencia a
unidades de acción específicas de las situaciones, es decir, a conductas. Finalmente,
Goldberg (1981) plantea que es el lenguaje la vía a través de la cual podremos descu-
brir las diferencias individuales. Para él, aquellas diferencias individuales que sean
más importantes en las interacciones que diariamente se producen entre las personas
estarán muy probablemente codificadas en su lenguaje. De este modo, cuanto más
significativa sea una característica que diferencia a las personas, mayor número de
lenguajes poseerá un término que la identifique. En sus trabajos concluye que todas
las dimensiones de personalidad se pueden agrupar en cinco: surgencia, simpatía, es-
crupulosidad, estabilidad emocional y cultura. Hay otros muchos autores que com-
parten este planteamiento (Fiske, 1949; Tupes y Cristal, 1961; Norman, 1963) y, en la
actualidad, la búsqueda y comprobación de los llamados “cinco grandes” (big five)
supone una de las fuentes de trabajo de investigación más prolíferas e importantes en
psicología de la personalidad. En este punto, nos gustaría plantear al lector un inte-
rrogante (en el supuesto de que no lo haya hecho ya): ¿tienen los planteamientos an-
teriores alguna implicación en el ámbito de la evaluación de rasgos de personalidad?
Actualmente se piensa que los procesos de categorización pueden ser una vía intere-
sante en este campo y, de hecho, existen algunos métodos de trabajo de gran utilidad
en este contexto. Analizaremos brevemente algunos de ellos, junto a las técnicas más
clásicas, en el apartado siguiente de este capítulo.
UI. TÉCNICAS DE EVALUACIÓN DE LOS RASGOS DE PERSONALIDAD
m1. Introducción
Una vez efectuada la descripción del rasgo a través de su evolución dentro del ámbi-
to de la psicología de la personalidad, ha llegado el momento de plantearnos a través
de qué instrumentos poder evaluarlo. De hecho, en la evaluación de los rasgos de
personalidad se han empleado diversos métodos más o menos alternativos o com-
plementarios (Sandín y Chorot, 1986), tales como autoinformes, escalas de datos
biográficos, observación de la conducta en situaciones representativas y técnicas
subjetivas como las Q-sort y el diferencial semántico. Sin embargo, a poco que repa-
semos con detalle la investigación sobre el tema y/o la práctica habitual de los eva-
luadores, percibiremos fácilmente que son los autoinformes (inventarios, cuestiona-
rios, escalas...) los instrumentos más ampliamente utilizados para el objeto que nos
ocupa. Y ello tanto desde un punto de vista histórico como desde una perspectiva
ceñida al presente (Keller, Butcher y Slutske, 1990). De este modo, Barton (1986) se-
ñala que en un repaso de cualquier edición del Mental measurement yearbook de
835
Buros se aprecia claramente el predominio de los tests de personalidad tipo cuestio-

nario. Hay publicados aproximadamente unos doscientos, y algunos más en edicio-
nes experimentales. En general, las diferentes estrategias de autoinforme se basan en
la recogida de información a partir de los propios mensajes verbales que un sujeto
emite sobre cualquier tipo de manifestación suya, sea motora, fisiológica o cognitiva
(García Mérita, 1989). Todos incluyen un formulario de preguntas a las que el sujeto
tiene que responder bien según una escala nominal (verdadero-falso, sí-no), una es-
cala ordinal o de intervalos, o bien eligiendo los elementos según sus preferencias.
Una vez determinada la preponderancia de este tipo de instrumentos en el contexto
de la evaluación de rasgos, deberíamos afrontar la tarea de proponer una clasifica-
ción de los mismos y, dentro de ella, de describir y analizar con cierta profundidad
aquellos que se consideran más importantes, utilizando para determinar su impor-
tancia, tanto criterios metodológicos como aplicados. Todo ello en el contexto de no
poder ofrecer una revisión completa ni siquiera de forma breve (recordemos la afir-
mación de Barton, 1986).
nz. Autoinformes
La mayor parte de los autoinformes para la evaluación de rasgos se ha construido
mediante tres tipos de estrategias, que han dado lugar a una categorización ya clási-
ca: racionales, empíricas y factoriales. En el capítulo dedicado a la clasificación de las
técnicas de evaluación en general, se ha explicado el fundamento de cada una de estas
estrategias, por lo que es nuestra intención ocuparnos ahora de forma más detallada
de algunas técnicas específicas. No obstante, se utilizarán las tres categorías para di-
ferenciar unas técnicas de otras.
112.1. Técnicas construidas según estrategias teórico-racionales
Recordemos que se trata de instrumentos cuyos ítems se seleccionan, escriben y/o se

agrupan según la teoría del creador del test (Keller y cols., 1990). Así, el investigador
que se propone construir una prueba según un criterio racional parte, en primer tér-
mino, de la idea que tiene sobre los posibles constructos teóricos que postula y des-
cribe la teoría en la que se sitúa y, posteriormente, elabora los ítems de acuerdo con el
lenguaje de la misma teoría. Veamos algunas de las pruebas más representativas.
Una prueba típica de esta estrategia es el Personal data sheet (PDS) [Hoja de datos
personales] de Woodworth (1920), que fue uno de los primeros instrumentos para
evaluar la personalidad. Se construyó durante la primera guerra mundial para el aná-
lisis psiquiátrico masivo de los reclutas, estando diseñado para funcionar como una
entrevista clínica estandarizada. Era un test de papel y lápiz que consistía en pregun-
tas sobre síntomas neuróticos (miedos, fobias, obsesiones, trastornos del sueño, ex-
ceso de fatiga, etc.). La puntuación del sujeto en el test era el número total de sínto-
mas que reconocía. :
Sin embargo, el más conocido de los instrumen tos construid os desde esta pers-
pectiva es la Edwards personal preference scale (EPPS) [Escala de preferencia personal
de Edwards]. Se construyó inicialmente para evaluar quince necesidades manifiestas,

basándose en la teoría del sistema de necesidades de Murray: rendimiento, deferen-
cia, orden, exhibición, autonomía, afiliación, intracepción, asistencia, dominancia,
humillación, tendencia a consolar, cambio, resistencia, heterosexualidad y agresión.
Se diseñó para alumnos en edad universitaria o mayores de edad, tardándose de 40 a
45 minutos en contestarlo. Desde el punto de vista psicométrico, esta prueba resulta
bastante refinada (Sandín y Chorot, 1986); así, utiliza un procedimiento de elección
forzada, posee un índice de consistencia y pretende controlar la influencia de la desea-
bilidad social, valorándose de forma positiva a partir de las revisiones efectuadas
(Heilbrum, 1972; McKee, 1972) con respecto a la amplitud y al significado de las es-
calas (validez de contenido) y también en lo referente a la fiabilidad; sin embargo, no
ocurre lo mismo con la validez concreta y de constructo. Posteriormente, Edwards
ha cambiado el formato del EPPS y ha construido un nuevo cuestionario: el Edwards
personality inventory (EPI) [Inventario de personalidad de Edwards] (no confundir
con el EPI de Eysenck). En esta nueva prueba ya no se utilizó la clasificación del sis-
tema de necesidades de Murray y se abandonó el formato del EPPS de respuesta obli-
gatoria y control de la deseabilidad social. Por el contrario, se eligieron ítems de de-
seabilidad social neutra y se cambiaron las instrucciones, pasando del habitual
formato de autoinforme a un formato en el que se pide a la persona que «calcule
cuántas personas que conozca bien eligiría cada una de las opciones si se les pidiera
que lo describiesen a usted». Se da una opción de respuesta de verdadero o falso. El
test va dirigido a sujetos comprendidos desde el nivel escolar hasta adultos y consta
de 53 escalas. Las escalas están divididas entre cuatro cuadernillos, cada uno de los
cuales se tarda unos 45 minutos en completar. Las críticas más y mejor fundamenta-
das que se han hecho a esta prueba provienen de Goldberg (1972) y podrían resu-
mirse de la siguiente manera:
a. La muestra de estandarización era de tamaño y composición «claramente

inadecuados».
b. Lavalidez «no aparece en ninguna sección del manual».
c. No hay datos test-retest.
d. No hay ninguna correlación de las escalas con otros tests.
Otros revisores (Bouchard, 1969; Kleinmuntz, 1970; Norman, 1972), a pesar de

tener una visión más optimista del futuro del test, coinciden con Goldberg en mu-
chos puntos y manifiestan que sin datos sobre validez el test sólo se debería utilizar
con fines investigadores.
11.22. Técnicas construidas según criterios empíricos

La estrategia empírica para elaborar tests, en lugar de agrupar los ítems en escalas
según nociones teóricas preconcebidas, de contenido relevante, utiliza el método
de grupos contrastados y, de este modo, selecciona ítems según su relevancia para
distinguir entre grupos de personas que difieren en el criterio. Los métodos empí-
ricos O “externos” de construcción y validación de tests son particularmente co-
Evaluación de los rasgos psicológicos 837
rentes para usos prácticos que llevan consigo la selección o clasificación de indivi-
duos en grupos predefinidos (Burish, 1984). El Minnesota multiphasic personality
inventory (MMPI) [Inventario de personalidad multifásico de Minnesota] de Hat-
haway y McKinley (1940) y su equivalente en personalidad “normal”, el Califor-
nia psychological inventory (CP1) [Inventario psicológico de California] de Gough
(1975) pueden considerarse las pruebas más representativas de las que se han cons-
truido, al menos en gran medida, con métodos empíricos. Por razones relacionadas
con las limitaciones de este capítulo, sólo vamos a describir el primero de ellos con
cierto detalle.
«El Minnesota multiphasic personality inventory (MMP1)» [Inventario

de personalidad multifásico de Minnesota]
Éste ha sido y, probablemente sigue siendo, el instrumento de evaluación de la per-

sonalidad más ampliamente utilizado e investigado. Sirvan algunos datos para ilus-
trar lo anterior: Butcher y Owen (1978) hallaron que el 84% de los artículos publica-
dos entre 1972 y 1977 en los que se utilizaba alguno de los principales tests objetivos
de personalidad hacía referencia a este inventario. Asimismo, Butcher y Keller
(1984) encontraron que entre 1978 y 1982 se mantuvo un patrón similar: el 87% de
los artículos utilizaba el MMP1. Keller y cols. (1990), en una revisión posterior, en-
contraron que esta prueba continúa con su fuerte dominio en la literatura publicada.
Los datos anteriores se refieren, evidentemente, a la amplia cantidad de trabajos de
investigación clínica sobre validación empírica dedicados al MMPI, lo que sin duda es
un reflejo de su amplia utilización en el contexto aplicado (para una mayor informa-
ción, véase Becoña, 1986).
En 1940, Hathaway y McKinley publicaron el primero de una serie de artícu-
los que detallan la construcción del Inventario multifásico de personalidad de Minne-
sota, concebido como un medio objetivo para obtener información diagnóstica clí-
nica sobre las personas en contextos médicos psiquiátricos y generales. Desde sus
inicios, el MMPI ha sido revisado en varias ocasiones; la edición inglesa de 1967 fue
traducida y adaptada al castellano por TEA (Técnicos Especialistas Asociados), pu-
blicándose la primera edición española en 1970, la segunda en 1975 y la última en
1988. La construcción de las escalas siguió, en su mayor parte, una estrategia empí-
rica; los ítems no se obtuvieron de acuerdo con un plan teórico de los diseñadores
del test (aunque también es cierto que los autores recogieron inicialmente más de
1 000 ítems procedentes de muy diversas fuentes: casos clínicos, libros de texto
—por ejemplo, el de Kraepelin— y otros tests publicados con anterioridad), sino
mediante procedimientos empíricos de análisis de ítems, efectuados para maximi-
zar la discriminación entre diversos grupos psiquiátricos predefinidos e individuos
“normales”.
Con este método de grupos contrastados se construyeron ocho escalas clínicas:
hipocondriasis (Hs), depresión (D), histeria (Hy), desviación psicopática (Pd), para-
noia (Pa), psicastenia (Pt), esquizofrenia (Sc) e hipomanía (Ma). Hathaway y Mc-
Kinley, a la vista de que los autoinformes son instrumentos muy vulnerables a los
efectos “distorsionadores” provenientes del estilo o de la actitud del sujeto ante el
test, incluyeron varias comprobaciones de validez:
a. Escala «No lo sé» (?): cuantifica el número total de ítems que no se respon-
dieron o que se respondieron en ambas direcciones. yroq
b. Escala de sinceridad (L): detecta la falta de voluntad de un individuo para re-
conocer incluso las faltas más comunes y de menor importancia.
c. Escala de validez (F): evalúa la desviación de las respuestas en comparación
con la muestra normativa.
d. Factor corrector (escala K): identifica la “defensividad” ante la prueba.
Posteriormente, se añadieron dos escalas clínicas: masculinidad-feminidad (Mf)

e introversión (Si). Esta última la desarrolló Drake (1946) contrastando alumnos
universitarios socialmente participativos con otros que no participaban en demasia-
das actividades fuera de las puramente académicas. Por su parte, la escala Mf estaba
concebida inicialmente para distinguir entre hombres homosexuales y heterosexua-
les, pero pronto se vio que pocos ítems funcionaban en este sentido, de forma que
Hathaway y McKinley ampliaron la escala añadiendo ítems que distinguían entre
hombres y mujeres heterosexuales. Con el tiempo se han obtenido otras escalas de-
rivadas de las básicas, llamadas “escalas adicionales”, dirigidas a la evaluación de ras-
gos normales de la personalidad. La edición española del MMPT incluye cuatro esca-
las adicionales (Hathaway y McKinley, 1975): fuerza del yo (Es), que indica
integración personal y cohesión de la estructura de la personalidad; dependencia
(Dy), que indica “necesidades de dependencia”; dominancia (Do), referida a la ini-
ciativa social, capacidad para el mando, persistencia, acciones esforzadas, etc.; y res-
ponsabilidad (Re), que indica sentimientos de pertenencia al grupo social en que esté
integrado, aceptación de las consecuencias de la conducta y conciencia de las propias
obligaciones.
Generalmente, el MMPI se administra con un cuadernillo reutilizable (tanto para
la forma colectiva como para la individual) y una hoja de respuestas que se puede co-
rregir a mano o mecánicamente. Sin embargo, existen otras formas de administra-
ción descritas por Keller y cols. (1990): forma de “caja original”, en la que cada ítem
está impreso en una tarjeta y el sujeto tiene que clasificarlas en grupos según que
considere los ítems verdaderos o falsos, formas en audio para quien tiene dificulta-
des de lectura y versiones administradas por ordenador.
Las puntuaciones brutas de cada escala del MMPI se calculan contabilizando el
número de respuestas dadas en la dirección indicada por esa escala. Con frecuencia,
varias de las puntuaciones brutas se “corrigen” para eliminar la defensividad con una
proporción del valor de la escala K que se ha convertido en parte estándar del proce-
dimiento de puntuación del MMP7. Las puntuaciones brutas se transforman a conti-
nuación en unidades de puntuaciones T cuando se trazan en la hoja de perfiles. Las
puntuaciones T del MMPI tradicional son puntuaciones estándar no normalizadas
con una media de 50 y una desviación estándar de 10, basadas en las distribuciones
de puntuaciones de la muestra de “normales de Minnesota”. Las elevaciones de esca-
las superiores a dos desviaciones estándar sobre la media (una puntuación elevada
por encima de una puntuación T de 70) se consideran por lo general clínicamente
significativas en el MMPI original.
La forma de interpretar esta prueba ha sufrido una evolución considerable desde
sus comienzos. Lógicamente, no podemos detenernos en exceso en esta cuestión, de
839
manera que únicamente se hará una breve referencia a los cambios más significati-
vos. Al principio se pensaba que las elevaciones escalares simples reflejarían directa-
mente la psicopatología evaluada por las escalas individuales de la prueba. No obs-
tante, pronto se encontró que el MMPI no funcionaba demasiado bien como medio
de clasificación de pacientes en grupos diagnósticos estrictos. De hecho, los pacien-
tes con puntuaciones altas en una escala tendían, asimismo, a tener elevaciones en
otras; también ocurría que algunos pacientes psiquiátricos no tenían elevaciones sig-
nificativas en las escalas “previsibles” o apropiadas e, incluso, que algunos indivi-
duos “normales” sí mostraban puntuaciones altas en una o más escalas. Todo ello
trajo como consecuencia una serie de alternativas de interpretación, que se propo-
nen a partir de un primer cambio de tipo formal: las diez escalas clínicas se suelen de-
nominar actualmente con números en lugar de con sus nombres originales (véase
cuadro 33.1).
CUADRO 33.1. Escalas clínicas del MMPI y sus códigos correspondientes

Código Denominación de las escalas clínicas
1 Hs Hipocondriasis
2 D Depresión
S Hy Histeria
4 Pd Psicopatía
[SS Mf Masculinidad-feminidad
6 Pa Paranoia
Y Pt Psicastenia
8 Sc Esquizofrenia
9 Ma Hipomanía
0 Si Introversión social
De modo muy resumido, a continuación se señalan las mencionadas alternativas:
a. Interpretación configural. A partir de la observación de que varias escalas del

MMPI presentaban altas puntuaciones de forma conjunta, se planteó la posibilidad de
que la interpretación de una escala podría variar dependiendo de las elevaciones rela-
tivas de otras escalas del perfil. Así, empezaron a hacerse descripciones empíricas de
base actuarial de diversos patrones del MMPT a los que se denomina tipos de código;
por ejemplo, una elevación escalar en las escalas 2 y 1 significaría un código 2-1, y los
correlatos de un patrón con ese código se pueden consultar en muchos de los llama-
dos “recetarios”, donde se recogen resultados de investigaciones al respecto (Gra-
ham, 1987; Núñez, 1987). o% yr st :
b. Interpretación mediante reglas objetivas o índices objetivos. En este método,
el evaluador, después de puntuar el registro y trazar el perfil, clasifica éste de acuerdo
con determinadas reglas de decisión. Existen varias de estas reglas como el índice
Goldberg (Goldberg, 1965) o las reglas de Henrichs (Henrichs, 1966). Por ejemplo,
el índice de Goldberg se computa sumando las escalas L, Pa y Sc y restando después
sea
las escalas Hy y Pt, para obtener un índice de la probabilidad de que el paciente
psicótico.
c. Interpretaciones basadas en el contenido. En este enfoque se asume que el su-

jeto, al responder a los ítems del test, está reaccionando y respondiendo abierta y di-
rectamente al significado y contenido del ítem. De ahí que éste puede representar
una importante fuente de información, a la que probablemente no se pueda acceder
mediante los procedimientos empíricos comentados. Se describen al menos tres mé-
todos de interpretación del contenido del MMP1: método analítico-factorial, método
racional y método de ítems críticos.
Con todo, la mejor prueba de que este instrumento es un ejemplo de evolución a

lo largo del tiempo es el proyecto que en el año 1982 puso en marcha la Universidad
de Minnesota para revisar, actualizar y reestandarizar el MMPI. El resultado de este
proyecto fue el MMPI-2 que describimos brevemente en los párrafos siguientes.
El <MMPI-2»
Esta nueva versión se fundamentó sobre los siguientes objetivos:
a. Conservar la integridad de las escalas de validez, clínicas y las más amplia-

mente utilizadas.
b. Revisar y modificar el lenguaje de algunos de los ítems existentes que esta-
ban desfasados o eran inadecuados, sexistas, etcétera.
c. Ampliar la base de ítems, incluyendo otros contenidos que no se encontra-
ban representados.
d. Elaborar normas nuevas actualizadas; los “normales de Minnesota” origina-
les representaban sólo a una pequeña muestra regional y un tanto localista
de adultos que vivieron hace cuarenta años.
e. Incluir formas independientes para adultos y para adolescentes.
La consecuencia directa de la puesta en marcha del proyecto fue la aparición de

una serie de cambios relevantes respecto al MMPI original (Ben-Porath y Graham,
1991):
a. Nuevas escalas de contenido (véase cuadro 33.2).
Diferencias en el proceso de administración.
c. Cambios en el método utilizado para derivar puntuaciones T. Básicamente,
en el MMPL-2 se derivan puntuaciones T uniformes, mientras que en el MMPI
original las puntuaciones T son lineales.
d. Cambios diferenciales en la elevación de las escalas: desplazamiento del
“punto de corte” de T-70 en el MMPI a T-65 en el MMPL-2.
e. Cambios en los tipos de código.
Como es lógico, todas estas modificaciones han provocado entusiasmo en algu-

nos autores y serias dudas en otros. Entre estos últimos se ha iniciado una discusión
que está provocando un incremento de la literatura acerca de la prueba, a la vez que
asegurará un mayor interés por estudiar y demostrar las posibilidades de la misma
841
CUADRO 33.2. Escalas de contenido del MMP1-2

A ee A
Escala Descripción y correlatos
Anx (Ansiedad) Síntomas generales de ansiedad y tensión.
Problemas de sueño y concentración; correlatos somáticos de
la ansiedad; preocupaciones excesivas; dificultad en la toma
de decisiones.
Frs (Miedos) Muchos miedos y fobias específicos, animales, alturas, insec-

tos, sangre, fuego, tormentas, agua, oscuridad, suciedad, lu-
gares cerrados.
Obs (Obsesividad) Excesivamente meditabundo, dificultad para tomar decisiones,

conductas compulsivas, rigidez, sentimientos de agobio.
Dep (Depresión) Pensamientos depresivos, de desesperanza e incertidumbre,

anhedonia, posibles ideas de suicidio.
Hea (Preocupación salud) Muchos síntomas en diversos sistemas corporales: gastrointes-

tinal, neurológico, sensorial, cardiovascular, dermatológico y
respiratorio.
Biz (Activ. mental excént.) Procesos de pensamiento psicótico, alucinaciones auditivas,

visuales u olfativas, ideas paranoides, ilusiones.
Ang (Ira) Problemas de control de la ira, irritabilidad, impaciencia, pérdi-

da de control, tendencia pasada o potencial a los malos tratos.
Cyn (Cinismo) Ideas misantrópicas y negativas sobre los motivos de los de-
más, desconfianza generalizada.
Asp (Prácticas antisoc.) Actitudes cínicas, conductas problemáticas; problemas con la

autoridad, robos, evitación de las normas en beneficio propio.
Tpa (Tipo A) Conducta orientada al trabajo; impaciencia; enojo; sentimien-

tos de presión temporal.
Lse (Baja autoestima) Sentimientos abrumadores de caer mal, poco importante, poco
atractivo, inútil.
Sod (Incomodidad social) Timidez, prefiere estar solo.
Fam (Problemas familiares) Discordia familiar, posibles malos tratos durante la infancia, fal-
ta de amor y afecto en la familia.
Wrk (Interferencia laboral) Conductas o actitudes que pueden interferir con el rendimiento
laboral, como baja autoestima, tensión, actitudes negativas ha-
cia la profesión o los compañeros de trabajo.
Trt (Indicadores negat. trat.) Actitudes negativas hacia los médicos y hacia el tratamiento de
salud mental. Preferencia por abandonar antes de intentar un
cambio. Incapacidad para discutir cualquier tema personal.
AA
Fuente: Tomado de Keller y cols. (1990).
(véase Strassberg, 1991). En cualquier caso, lo que sí parece claro, como manifiestan
Ben-Porath y Graham (1991), es que un test no se puede modificar sin cambiarlo.
Efectivamente, no está demostrado que el MMP7 original sea un instrumento psico-
métricamente perfecto, por lo que la aportación del MMP1-2 puede resultar de gran
utilidad en el camino hacia una “supuesta perfección”.
11123. Técnicas construidas según el método factorial o de consistencia

interna
Las técnicas elaboradas a partir de este método se construyen analizando factorial-
mente las correlaciones existentes entre una amplia base de ítems de personalidad. Se
trata de un método muy utilizado entre los investigadores que buscan descubrir las
dimensiones básicas de la misma (Keller y cols., 1990). El mejor ejemplo de empleo
del método analítico-factorial es el trabajo de Cattell y su cuestionario de dieciséis
factores: el Sixteen personality factor questionnaire (16PF) [Cuestionario de dieci-
séis factores de personalidad] (Cattell, Eber y Tatsuoka, 1970). Asimismo, tal como
ya se ha señalado en la primera parte de este capítulo, el Eysenck personality inven-
tory (EPI) [Inventario de Personalidad de Eysenck] es otro fiel reflejo de esta estrate-
gia de construcción de tests. Efectuaremos, a continuación, un análisis detenido del
primero de ellos.
Sixteen personality factor questionnaire (16PF) [Cuestionario de dieciséis factores

de personalidad]
Hablar de este instrumento implica, en primer lugar, contextuarlo en una “familia”

de tests o, dicho de otro modo, en un conjunto de escalas del ámbito de la conducta
normal: Early school personality quiz (ESPQ) [Test de personalidad para escuela pri-
maria] de 6-8 años, Child's personality questionnaire (CPQ) [Cuestionario de perso-
nalidad para niños] de 8-12 años y High school personality questionnaire (HSPQ)
[Cuestionario de personalidad para escuela secundaria de 12-15 años); todas ellas
tienen en común tres características básicas:
a. Están diseñadas para los factores primarios de personalidad en datos Q so-

bre un amplio intervalo evolutivo de edades.
Han sido replicadas en varios países, entre ellos España.
c. Proporcionan puntuaciones para los factores primarios, pero tienen siste-
mas de pesos de fácil aplicación, que proporcionan también puntuaciones de
los factores secundarios.
Igualmente, el hecho de tener un número de formas equivalentes (A, B, C y D)

muy superior al que normalmente tienen los tests, es considerado como una ventaja
de este instrumento. Desde un punto de vista descriptivo, consta de 187 ítems, que
saturan en los 16 factores primarios y que pueden describirse de manera bipolar, tal
y como aparece en la hoja de respuestas. Nosotros preferimos facilitar al lector en el
cuadro 33.3 una lista en la que figuran los nombres de los factores en sus dos niveles
843
de nomenclatura, popular y profesional (este último entre paréntesis), citando sólo

el polo alto de la escala.
CUADRO 33.3. Escalas primarias del 16PE de Cattell

——_—
A _ ____— A —
Denominación popular Denominación científica
E e A O A AE VERA AA
1) Abierto Afectotimia
2) Brillante, inteligente Medida de la fuerza cristalizada de la inteligencia
3) Emocionalmente estable Fuerza del ego alta
4) Asertivo Dominancia
5) Impulsivo Surgencia
6) Concienzudo Fuerza del superyó
7) Atrevido Parmia
8) Sensible Premsia
9) Desconfiado Protensión
10) Imaginativo Autia
11) Astuto Astucia
12) Aprensivo Tendencia a la culpabilidad
13) Experimentador Radicalismo
14) Independiente del grupo Autosuficiencia
15) Controlado Fuerza alta del autosentimiento
16) Tenso Tensión érgica alta
Estos dieciséis rasgos fuente correlacionan entre sí y, al ser factorizados, generan

ocho factores secundarios en población estadounidense (véase cuadro 33.4).
CUADRO 33.4. Factores de segundo orden del 16PF (escalas originales)

Factor Título Principales factores primarios relacionados
QÍ Exvia A+, E+, F+, H+, Q2-

Qi! Ansiedad C-, H-, L+, O+, Q3-, Q4+
Qi!! Cortesía A-, M-, -
QIV Independencia E+, L+, M+, Q1+, Q2+
QV Naturalidad N+
QVI Realismo frío I+, M+, L+
QVII Inteligencia B+
QVII! Superego G+, Q3+, F-
La factorización española realizada por Seisdedos (1978) mostró una estructura

factorial en la que aparecen definidos cinco de los ocho factores hallados en los estu-
dios originales, datos replicados posteriormente por Nieto, García-Montalvo y Mo-
rales-Meseguer (1985). El cuadro 33.5 muestra una comparación entre ambas facto-
rizaciones.
Como afirma Barton (1986), resulta interesante que en el nivel de segundo orden
todas las dimensiones implicadas han resultado muy útiles como constructos teórt-
cos y empíricos para muchos psicólogos de muy diversas tendencias.
Factores secundarios del 16PF en población española y su equiparación en

CUADRO 33.5.
Cattell
o — ——
Factor Denominación Escalas implicadas Cattell

arme parts e
Ql Ansiedad C-, O+, Q4+, H-, L+ Qi!
Qi Extraversión A+, F+, H+, (Q2>)*, (E+,L+)** QI
¡ell Mucha fuerza G+, N+, Q3+, F-, B+ QVII!
Socialización E-
QIV Independencia B+, Q1+, E+, (L+)*, (M+, A-)+* QIV
Qv Subjetividad +, M+, (E-)*, (G-, L+, Q2+)** QVI
o
Escalas propias sólo de varones.

rn
Escalas propias sólo de mujeres.
Por lo que se refiere a las propiedades de la prueba, tanto las internas (caracterís-
ticas de definición como origen y formato de los ítems, método de construcción, es-
tructura analítica factorial y significado psicológico de las escalas) como las externas
(uso aplicado o potencial del test, validez concreta y relaciones con otros tests) resul-
tan ser bastante satisfactorias (Bouchard, 1972). Concretamente, Barton (1986) nos
describe los siguientes aspectos positivos de la prueba:
a. Su factorización se efectuó sobre rasgos fuente de estructura simple signifi-

cativa.
b. Permite puntuar ocho factores de segundo orden (cinco en el caso de Es-
paña).
c. Posee la misma estructura factorial en sus traducciones y estandarizaciones
en otras culturas: Inglaterra, Alemania, Francia, Japón, India, Venezuela,
Brasil y España.
d. Está vinculado evolutivamente en cuestionarios para otras edades con los
mismos factores.
e. Tiene numerosos estudios en los que se han establecido relaciones con mu-
chas categorías de síntomas clínicos y con más de cuarenta profesiones.
Con respecto a este último punto, nos gustaría añadir que se ha comprobado que
el 16PF, pese a ser concebido como un instrumento de evaluación de la personalidad
normal, se muestra muy útil en la descripción de determinados patrones de “anor-
malidad”, como el comportamiento neurótico (García-Montalvo, Nieto y Morales,
1989).
Finalmente, no podemos terminar este epígrafe sin una mínima referencia al Ch-
nical analysis questionnaire (CAQ) [Cuestionario de análisis clínico] desarrollado
para su aplicación a la esfera anormal de la personalidad. Cubre los dieciséis factores
normales y los secundarios del 16PF más doce factores patológicos hallados en el
MMPI, en escalas de depresión y en otros cuestionarios clínicos concretos. En el cua-
dro 33.6 aparecen estos últimos descritos en su polo alto.
Respecto a las relaciones entre MMPI y CAQ, los dos instrumentos que más se
utilizan actualmente para el diagnóstico clínico, podemos decir que la diferencia
fundamental entre ellos es que el primero se construyó para separar tipos y el segun-
845
CUADRO 33.6. Escalas clínicas que evalúa el CAQ

AAIÍ__-=— AA IA A
Escala Denominación
Had Hipocondriasis
Sd Tendencias suicidas
Bd Agitación
Ad Depresión ansiosa
Fd Depresión baja energía
Gd Alta culpabilidad-resentimiento
Md Apatía
Pa Paranoia
Pp Desviación psicopática
Sc Esquizofrenia
As Psicastenia
Ps Desajuste psicológico
€ÉKÉ—_—_—_ — _— o + ++ ++ A €y€wy €€Uqyu
do para evaluar rasgos fuente, algunos de los cuales son iguales tanto en sujetos nor-
males como en muestras clínicas (Barton, 1986).
IV. ESTADO ACTUAL DE LA EVALUACIÓN DE LOS RASGOS PSICOLÓGICOS
En este apartado, se va a intentar resumir las diversas líneas actuales en la evaluación

de los rasgos de personalidad, como una muestra de lo que en el futuro puede ser
este campo. Por un lado, desde un punto de vista psicométrico, en las dos últimas
décadas los trabajos de construcción de tests normalmente han combinado varias es-
trategias en un proceso constructivo de múltiples pasos. Buen ejemplo de ello son
los instrumentos creados por Jackson, el Differential personality inventory (DPI)
[Inventario diferencial de personalidad] y el Personality research form (PRF) [For-
mulario de investigación de la personalidad], así como el Millon clinical multiaxial
inventory (CM1) [Inventario clínico multiaxial de Millon] a los que nos referiremos a
continuación brevemente. Los dos primeros se construyeron mediante una combi-
nación de consistencia racional interna basada en la teoría de necesidades de Murray
y la metodología de validación empírica. Ambos constan de escalas relativamente in-
dependientes con alta homogeneidad de contenido y están diseñados para minimi-
zar los efectos distorsionadores de ciertos estilos de respuesta subjetiva. Anastasi
(1988, p. 548) opina que el PRF es «en conjunto un excelente instrumento de investi-
gación, pero hace falta más información para determinar su eficacia en situaciones
prácticas». Por su parte, el MCMI se construyó utilizando una mezcla de métodos de
construcción de escalas (Keller y cols., 1990). En palabras de Kleinmutz (1982,
p. 242) «está destinado a reemplazar el monopolio del MMP1». El contenido de los
ítems y de las escalas está ligado a la teoría de la personalidad clínica del propio Mi-
llon, pero la selección final de los ítems y la composición de laescala fueron depura-
dos a partir de una combinación de métodos de consistencia interna y de comproba-
ción con un criterio externo. Actualmente, el autor ha construido una forma
revisada de MCMI con tres finalidades:
a. Incorporar nuevos avances en su teoría de la personalidad.

b. Ajustarse a las categorías diagnósticas revisadas del DSM-IIE-R.
c. Incorporar las investigaciones de validación de la prueba original.
De este modo, el MCM1-11 (Millon, 1987) incluye dos nuevas escalas de trastorno
de la personalidad, nuevas correcciones de validez y un nuevo sistema de pesos de
los ítems.
Otra alternativa que parece tener futuro, pese a que aún se encuentra en una fase
experimental, es el Central trait-scale kit (CTS) [Conjunto de escalas de rasgo cen-
tral]. Una de las ventajas fundamentales de este instrumento es que permite aislar es-
calas concretas, en el caso de que estemos interesados en evaluar sólo un aspecto de
los que en él se contemplan. Esta prueba contiene cinco escalas de rasgos idénticas a
los cinco factores de segundo orden más estables del 16PF y cinco escalas de estado,
diseñadas para reflejar los cambios en los mismos factores que pueden estar provo-
cados por diferentes situaciones medioambientales u orgánicas. Cada subtest consta
de 25 ítems, tardándose unos cinco minutos en administrarlo.
Por otro lado, no podemos olvidarnos en este apartado de los llamados “tests
automatizados”, que según Keller y cols. (1990) desempeñarán un gran papel en el
futuro de la tecnología de la evaluación de la personalidad. En efecto, se ha empeza-
do a utilizar la flexibilidad y las capacidades de adaptación únicas de los ordenadores
para modificar viejas estrategias de evaluación y crear otras nuevas. La puntuación
automatizada de hojas de respuesta de tests fue una de las primeras aplicaciones clí-
nicas de la tecnología informática; después vino la interpretación computadorizada
de tests psicológicos estándar. Posteriormente, se extiende a la administración de
pruebas. No puede decirse que éste sea un tema que esté libre de polémicas y contro-
versias, tales como la influencia o no de lo impersonal de la interacción con una má-
quina (Erdman y cols., 1981) o la idea de que las versiones administradas por orde-
nador no pueden considerarse formas paralelas de las de «papel y lápiz» (Moreland,
1987). No obstante, parece igualmente evidente que no es una línea de trabajo que
vaya a ser abandonada; muy al contrario, los datos existentes demuestran que la in-
vestigación y los trabajos sobre el tema proliferarán considerablemente en el futuro,
y no sólo por lo que se refiere a la administración estandarizada, recogida de datos o
aplicación de normas de decisión objetivas, sino también en otras aplicaciones como
la creación de sistemas de análisis dinámicos y adaptativos que mejoren la capacidad
humana de toma de decisiones (Keller y cols., 1990).
Se afirmaba en la exposición sobre la conceptualización del rasgo que existía en
la actualidad una serie de planteamientos remodelados respecto a este constructo; de
estos nuevos planteamientos también han surgido formas de evaluación. A modo de
ejemplo, se pueden citar las técnicas de simulación de rasgos. Dentro de las teorías
implícitas de la personalidad existen tres medidas de simulación de rasgos para seña-
lar las expectativas de los sujetos respecto a hasta qué punto ciertos atributos se en-
cuentran en la personalidad de alguien (García Mérita, 1989):
a. Método de inferencia del rasgo. Este método consiste en presentar al sujeto

evaluado un rasgo estímulo (por ejemplo, serio) y pedirle que infiera la probabilidad
de que esa misma persona pueda ser también caracterizada por otros atributos, por
847
ejemplo, popular, triste, responsable... La evaluación se realiza sobre un continuo

que va desde “muy improbable” hasta “muy probable”, para cada uno de los rasgos
estímulo presentados.
_ b. Método de clasificación del rasgo. Otra forma de evaluar los rasgos es me-
diante la tarea de clasificar cada uno de los diferentes estímulos personales sobre una
serie de escalas de clasificación de rasgos. De tal forma que el sujeto vaya clasificando
a un número determinado de personas según el mayor o menor peso que considera
que tiene en un número de rasgos también determinado.
c. Método de descripción libre. Este método, a diferencia de los anteriores, nos
puede permitir evaluar la propia estructura cognitiva del perceptor ya que en este
método no le facilitamos ningún rasgo al sujeto, sino que le pedimos que él mismo
especifique los atributos que mejor describen a las personas que vamos a pedirle que
enjuicie.
Mediante un análisis de contenido de las descripciones, y realizando un estudio

para determinar qué atributos tienden a coexistir, podremos obtener medidas de las
expectativas del sujeto sobre qué es lo que acompaña a qué en la personalidad de los
demás. Cualquiera que sea el método utilizado podemos posteriormente someter
los datos obtenidos a factorización o dimensionalización para determinar si los ras-
gos “simulados” se agrupan en factores o dimensiones diferentes.
Por último, nos gustaría añadir que, aunque ya justificamos el motivo de la dedi-
cación de este capítulo a los autoinformes, no debemos olvidar la posibilidad de que
otros tipos de estrategias como la observación o las técnicas psicofisiológicas com-
plementen y completen la evaluación de los rasgos de personalidad.
Allport, G. W. (1970). Psicología de la personalidad. Buenos Aires. Paidós.

Barton, K. (1986). Personality assessment by questionnaire.EnR. B. Cattell y R. C. Johnson
(dirs.), Functional psychological testing. Principles and instruments. Nueva York. Brun-
ner/Mazel. Aa aria :
Becoña, E. (1986). Discrepancias entre la investigación y la práctica clínica de la terapia de
conducta. Revista Española de Terapia del Comportamiento, 4, 221-258.
Belloch, A. (1989). Personalidad: una realidad construida. En E. Ibáñez y V. Pelechano
(dirs.), Personalidad. Madrid. Alhambra. ' AM 90
Ben-Porath, Y. S. y Graham, J. R. (1991). Resolutions to interpretative dilemmas created by
the Minnesota Multiphasic Personality Inventory 2 (MMP1-2): A reply to Strassberg. Jour-
nal ofPsychopathology and Behavioral Assessment, 13, 173-179. JE
Blanco-Picabia, A., Pál-Hegedis, C. y Polo Padillo, J. (1982). Estudio de pacientes neuróticos
Cat-
mediante el cuestionario EPI de Eysenck y los factores de segundo orden del 16PF de
tell. Revista de Psiquiatría y Psicología M édica, 15,499-503,
Bouchard,J.T. (1969). Review of the EPI. Clinical Psychologist, 22, 206-208.
Bouchard, J. T. (1972). Review of the 16PF. En O. K. Buros (dir.), Seventh mental measure-
ment yearbook. Highland Park. Gryphon. 8
Bowers, K. S. (1973). Situacionism in psychology: An analysis and a critique. Psychological
Review, 80, 307-336. :
Burish, M. (1984). Approaches to personality inventory construction: A comparison of me-
rits. American Psychologist, 39, 214-227. de ;
Buss, D. M. y Craik, K. H. (1985). Why not measure that trait? Alternative criteria for iden-
tifying dispositions. Journal of Personality and Social Psychology, 48, 4, 934-946.
Butcher, J. N. y Keller, L. S. (1984). Objetive personality assessment. En G. Goldstein y
Butcher, J. N. y Owen, P. L. (1978). Objetive personality inventories: Recent research and
some contemporary issues. En B. Wolman (dir.), Handbook of clinical diagnosis of men-
tal disorders. Nueva York. Plenum Press.
Cantor, N. y Mischel, W. (1977). Traits and prototypes: Effects on recognition memory.
Journal of Personality and Social Psychology, 35, 38-48.
Cattell, R. B. (1972). El análisis científico de la personalidad. Barcelona. Fontanella.
Cattell, R. B., Eber, H. N. y Tatsuoka, M. (1970). Handbook for the sixteen personality factor
questionnatre. Champaign. IPAT.
Cattell, R. B. y Kline, P. (1977). The scientific analysis of personality and motivation. Lon-
dres. Academic Press.
Cronbach, L. J. (1975). Beyond the two disciplines of scientific psychology. American Psy-
chologist, 30, 116-117. y
Drake, L. E. (1946). A social I.E. scale for the MMP1. Journal of Applied Psychology, 30, 51-54.
Endler, N. S. y Magnusson, D. (1976). Toward an interactional psychology of personality.
Erdman, H. P., Greist, J. H., Klein, M. H., Jefferson, J. W. y Getto, C. (1981). The computer
psychiatrist: How far have we come? Where are we heading? How far dare we go? Beha-
vior Research Methods and Instrumentation, 13, 393-398.
Eysenck, H. J. y Eysenck, S. B. G. (1969). Personality structure and measurement. Londres.
Routledge and Kegan Paul.
Eysenck, M. W. y Eysenck, H. J. (1980). Mischel and the concept of personality. British Jonr-
nal of Psychology, 71, 191-204.
a R. (1981). Psicodiagnóstico. Concepto y metodología. Madrid. Cincel-
Kapelusz.
Fiske, D. (1949). Consistency of the factorial structures of personality ratings from different
sources. Journal of Abnormal and Social Psychology, 44, 329-344.
Eransella, F. (comp.) (1981). Personalidad. Madrid. Pirámide.
García Mérita, M. (1989). El qué y el cómo de la evaluación de la personalidad. En E. Ibáñez
y V. Pelechano (dirs.), Personalidad. Madrid. Alhambra.
García-Montalvo, C., Nieto, J. y Morales, J. M. (1989). El cuestionario 16PF de Cattell como
instrumento de discriminación entre sujetos neuróticos y normales. Anales de Psiquiatría,
4, 183-187.
Goldberg, L. R. (1965). Diagnosticians vs. diagnostic signs: The diagnosis of psychosis vs.
neurosis from the MMP1. Psychological Monographs, 79.
Goldberg, L. R. (1972). Review of the CPI. En O. K. Buros (dir.), Seventh mental measure-
ments yearbook. Highland Park. Gryphon.
Goldberg, L. R. (1981). Language and individual differences: The search for universals in
personality lexicons. En L. Wheeler (dir.), Review of Personality and Social Psychology
(vol. 2). Nueva York. Sage Publications.
Gough, H. G. (1975). California Psychological Inventory (revised manual). Palo Alto. Con-
sulting Psychologists Press.
849
e J. R. (1987). The MMPI: A practical guide (2* ed.). Nueva York. Oxford Universit
y
Hampson, S. (1982). The construction ofpersonality. Londres. Routlege and Kegan.
Hathaway, S. R. y McKinley, J. C. (1940). A multiphasic personality schedule (Minnesota):
[. Construction of the schedule. Journal of Psychology, 10, 249-254.
Hathaway, S. R. y McKinley, J. C. (1975). Cuestionario de personalidad MMP1. Madrid. TEA.
Heilbrum, A. B. (1972). Review of the EPPS. En O. K. Buros (dir.), Seventh mental measure-
Henrichs, T. (1966). A note on the extension of MMPI configural rules. Journal of Clinical
Ibáñez, E. y Belloch, A. (1983). Interaccionismo y psicología de la personalidad. Análisis y
Modificación de Conducta, 20, 47-68.
Ibáñez, E. y Galdón, M. J. (1985). Una historia interminable de psicología de la personalidad.
En M. J. Báguena y A. Belloch (dirs.), Extraversión, psicoticismo y dimensiones emociona-
les de la personalidad. Valencia. Promolibro.
Keller, L. S., Butcher, J. N. y Slutske, W. S. (1990). Objetive personality assessment. En
Pergamon Press.
Kleinmuntz, B. (1970). Review of the EPI. Journal of Educational Measurement, 7, 131-133.
a B. (1982). Personality and psychological assessment. Nueva York. St. Martin's
ress.
es Pf od El trabajo de Eysenck y Cattell. En F. Fransella (dir.), Personalidad. Madrid.
irámide.
Krug, S. E. (1978). Reliability and scope in personality assessment: A comparison of the Cat-
tell and Eysenck inventaries. Multivariate Experimental Clinical Research, 3, 195-204.
Lewin, K. (1935). A dinamic theory ofpersonality. Nueva York. McGraw-Hill.
Maddi, S. R. (1968). Personality theortes. The Dorsey Press.
McKee, M. G. (1972). Review of the EPPS. En O. K. Buros (dir.), Seventh mental measure-
Millon, T. (1982). Millon Clinical Multiaxial Inventory (3* ed.). Minneapolis. National Com-
uter Systems.
Millon, T-(1987) Manual for the MCMI-11 (2* ed.). Minneapolis. National Computer Sys-
tems.
Moreland, K. L. (1987). Computerized psychological assessment: What's available. En J. N.
Butcher (dir.), Computerized psychological assessment: A practitioner's guide.
Murray, H. A. (1938). Explorations in personality. Nueva York, Oxford. University Press.
Nieto, J., García-Montalvo, C. y Morales-Meseguer, J. M. (1985). Factorización de segundo
orden del cuestionario 16PF. Folia Neuropsiquiátrica del Sur y Este de España, XX, 46-55.
Norman, W. T. (1963). Toward an adequate taxonomy of personality attributes: Replicated
factor structure in peer nomination personality ratings. Journal of Abnormal and Social
Norman, Y. T. (1972). Review of the EPI. En O. K. Buros (dir.), Seventh mental measure-
ments yearbook. Highland Park. Gryphon. de 2
Núñez, R. (1987). Pruebas psicométricas de la personalidad. Manual práctico del MMP1. Méxi-
co, D.F. Trillas. Sl
Pelechano, V. (1985). Cognición y personalidad. En J.Mayor (dir.), Actividad humana y pro-
cesos cognitivos (Homenaje a]. L. Pinillos). Madrid. Alhambra.
Prieto, J. M. (1981). Factores de segundo orden en personalidad a partir de datos Q en adul-
tos españoles. Revista de Patología General y Aplicada, 36, 33-52.
Sandín, B. y Chorot, P. (1986). Evaluación de rasgos psicológicos. En R. Fernández-Balleste-
ros (dir.), Psicodiagnóstico (vol. 11). Madrid. UNED.
Seisdedos, N. (1978). 16PF. Monografía técnica. Madrid. TEA.
Strassberg, D. S. (1991). Interpretative dilemmas created by the Minnesota Multiphasic Per-

sonality Inventory 2 (MMP1-2). Journal of Psychopatology and Behavioral Assessment, 13,
53-59.
Tupes, E. y Cristal, R. (1961). Recurrent personality factors bases on trait ratings. Technical
report ASD-TR-61-97. Texas. Lackland Air Force Base.
Woodworth, R.S. (1920). Personal Data Sheet. Chicago. Stoelting.
Barton, K. (1986). Personality assessment by questionnaire. En R. B. Cattell y R. C. Johnson

(dirs.), Functional psychological testing. Principles and instruments. Nueva York. Brun-
ner/Mazel.
Butcher, J. N. y Keller, L. S. (1984). Objetive personality assessment. En G. Goldstein y
Butcher, J. N. y Owen, P. L. (1978). Objetive personality inventories: Recent research and
some contemporary issues. En B. Wolman (dir.), Handbook of clinical diagnosis of men-
tal disorders. Nueva York. Plenum Press.
García Mérita, M. (1989). El qué y el cómo de la evaluación de la personalidad. En E. Ibáñez
y V. Pelechano (dirs.), Personalidad. Madrid. Alhambra.
Sandín, B. y Chorot, P. (1986). Evaluación de rasgos psicológicos. En R. Fernández-Ballesteros
(dir.), Psicodiagnóstico (vol. 11). Madrid. UNED.
34. EVALUACIÓN COGNITIVA DE LA PERSONALIDAD
BERNARDO MORENO-JIMÉNEZ
I. FORMULACIÓN HISTÓRICA DE LA PSICOLOGÍA COGNITIVA

DE LA PERSONALIDAD
Hace años Mischel (1981) trazaba la evolución histórica de los grandes modelos de la
psicología de la personalidad. Aunque su perspectiva era voluntariamente teleológi-
ca al basar la historia en el paradigma cognitivo, reflejaba una posible interpretación
del transcurso histórico de los hechos. Anteriormente, Caparrós (1979) había traza-
do una evolución semejante, pero centrando el proceso histórico en el sucesivo de-
sarrollo de los paradigmas hacia un modelo científico-experimental. Según la pers-
pectiva de Mischel, los comienzos de la psicología de la personalidad parten de la
psicología de los rasgos a principios de siglo, cuando no era sino una psicología del
sentido común, allá por las décadas de los años veinte y treinta. La metodología del
análisis factorial (Cattell, 1946; Eysenck, 1947) intentó dar a la psicología de los ras-
gos una base más estadística y establecer una taxonomía mínima de rasgos funda-
mentales. A partir de entonces, y durante largos años, la psicología de la personali-
dad no fue sino una psicología de rasgos.
La formulación del situacionismo (Mischel, 1968) fue un duro golpe, teórico y
empírico, para la teoría de los rasgos. La crítica de Passini y Norman (1966), mos-
trando la importancia del lenguaje en cualquier taxonomía de rasgos, había supuesto
ya anteriormente una importante crítica. Aunque la nueva reformulación de los ras-
gos (Bowers, 1973; Bem y Allem, 1974; Snyder, 1979; Pelechano, 1985) supusiera un
realce para la teoría, su limitación heurística para la psicología de la personalidad ha-
bía quedado fuertemente establecida.
La aparición en 1960 de una teoría del aprendizaje social proporcionó nuevas
perspectivas a la psicología de la personalidad. La nueva corriente se centraba más en
los problemas reales de la vida cotidiana e introducía elementos explicativos explíci-
tamente cognitivos. La obra de Dollard y Miller (1950) ha significado probablemen-
te el primer hito en esta dirección. Las teorías del aprendizaje social han recurrido
paulatinamente al protagonismo de los procesos cognitivos introduciéndolos como
variables mediadoras de la conducta social. Esta tendencia ha provocado un redirec-
cionamiento del objeto de estudio de la psicología de la personalidad dirigiéndolo
hacia procesos tales como las expectativas subjetivas del sujeto (Rotter, 1954; Rotter
y Hochreich, 1975) o las autoinstrucciones, planes y sistemas de autorregulación
(Bandura, 1976, 1986). Este proceso llevó a la conclusión de que la “construcción
del estímulo era decisiva, de forma que un estímulo no sería portador de una valencia
estimular universal, sino que estaría mediado por la estructura cognitiva del sujeto.
Universidad Autónoma de Madrid.

852 Bernardo Moreno-Jiméncz
La consecuencia de este proceso ha sido el realce de la mediación cognitiva en toda

conducta, tanto reactiva como proactiva.
La teoría de los constructos personales (Kelly, 1955) es probablemente la última
gran teoría de la personalidad y anticipo del emergente paradigma cognitivo (More-
no, 1985). Su falta de adscripción reconocida a tal paradigma proviene de su propia
formulación de la naturaleza de los constructos, irreductibles a meras categorías
mentales y a la actitud de Kelly, reacio a incorporarse a un paradigma que enarbola-
ba la metáfora del ordenador y del procesamiento computacional como señales de
identidad. No obstante, la influencia de la obra de Kelly ha sido seminal en el nuevo
paradigma. Otros factores de influencia en su desarrollo y auge han sido el modelo
de la cognición social ( Fiske y Taylor, 1991; Augoustinos y Walker, 1995) y el cada
vez más dominante modelo cognitivo-conductual en psicología clínica (Beck, 1970;
Kendall y Hollon, 1981).
La herencia de todo este proceso ha sido recogida por las formulaciones cogniti-
vas de la personalidad. No obstante, tales formulaciones son más una pretensión que
un logro. Wiggins (1971) consideraba que las teorías cognitivas de la personalidad
eran en aquel momento más una perspectiva que una realidad; por su parte, Baldwin
(1969) señala que no eran otra cosa sino una reelaboración de los presupuestos inge-
nuos del hombre de la calle. En los últimos años no han faltado los esfuerzos por re-
formular la personalidad desde una perspectiva cognitiva (Forgus y Schulman, 1979;
Cantor y Kihlstrom, 1981; Fierro, 1983; Hamilton, 1983; Hutteau, 1985; Bermúdez,
1989; Avia y Sánchez, 1995) o más sencillamente exposiciones de sus aspectos cogni-
tivos (Belloch y Báguena, 1986).
Es probable que pueda afirmarse que en la actualidad la psicología de la persona-
lidad predominante se elabora desde el paradigma cognitivo. Los modelos cogniti-
vos, afianzados en el ámbito del estudio de la personalidad, tratan por una parte de
recuperar viejas propuestas históricas de otros modelos desde planteamientos cogni-
tivos (Hutteau, 1985) y de asumir nuevas tareas que reflejen la personalidad como la
construcción individual de la propia identidad. En parte, la reconceptualización en
psicología de la personalidad que ha suscitado entusiasmos en no pocos autores (Re-
velle, 1995) proviene básicamente de su nuevo énfasis en el análisis de los procesos y
en el estudio de la subjetividad. Como ha sugerido McAdams (1994), el enfoque
cognitivo permite dejar de hablar del sujeto como si de un extranjero se tratara. La
elaboración de una psicología cognitiva de la personalidad es un proceso abierto en
el que no existe actualmente una teoría integradora (Zumalabe, 1990) y que induda-
blemente necesitará en el futuro de otras aportaciones y ampliaciones.
l. LAS VARIABLES COGNITIVAS DE LA PERSONALIDAD
A pesar de los diferentes esfuerzos por formular la personalidad desde una perspec-
tiva cognitiva, el intento de Mischel (1973) de reconceptualizar la personalidad desde
un enfoque cognitivo-social sigue siendo una referencia básica. Tras su crítica, inten-
cionalmente demoledora, del valor explicativo de los rasgos en la psicología de la
personalidad (Mischel, 1968), este autor recoge las propuestas de la crítica interac-
Evaluación cognitiva de la personalidad
853
cionista y trata de formular un modelo de variables de personalidad centrado en el

cambio y los procesos de adaptación discriminativa. Según Mischel, los rasgos no se-
rían epistemológicamente adecuados para la explicación de la conducta y habría que
buscar esta explicación en las variables cognitivas que el sujeto utiliza en su vida dia-
ria. De alguna manera su propuesta es afín a la de Fiske (1978), quien proponía bus-
car los códigos subjetivos que guían la conducta del sujeto. La propuesta de Mischel
destaca tanto por su radicalidad como por su esfuerzo de presentar un repertorio re-
presentativo de los recursos cognitivos del sujeto.
Para Mischel (1973, 1981), los elementos principales de la actividad cognitiva del
sujeto, relevantes para la psicología de la personalidad, son cinco: las competencias
cognitivas, los constructos personales, las expectativas, los valores subjetivos, y los
planes y sistemas reguladores. Otros autores han intentado igualmente inventariar
los componentes cognitivos de la personalidad. Aunque los repertorios no son coin-
cidentes, suelen ser muy semejantes. Kendall y Rogerski (1979) han distinguido seis
tipos de variables cognitivas: imaginación, estilos cognitivos, creencias, atribuciones,
autoeficacia y automensajes. Landau y Goldfried (1981) han utilizado un criterio di-
ferente y, partiendo del concepto central de esquema, han propuesto los siguientes
elementos: mapas cognitivos, guiones situacionales, instrumentales y personales, y
esquemas semánticos. Por su parte, Kendall y Braswell (1982), en su revisión de la
evaluación cognitiva, proponen los siguientes elementos: expectativas, proyectos,
atribuciones, estilos atributivos, creencias, autorreferencias, imágenes y resolución
de problemas.
Poner orden en estos elencos no es tarea fácil. Hay elementos que aparecen repe-
tidamente como las expectativas, otros que parecen aludir más a la capacidad cogni-
tiva del sujeto que a los tipos de procesos empleados por los sujetos en sus tareas co-
tidianas, como la capacidad de resolución de problemas y las competencias
cognitivas; de otros, como el tipo de imágenes, no se tienen suficientes elementos de
conceptualización y evaluación específicos. Un intento por sistematizar todos estos
elementos equivaldría a proponer un modelo cognitivo de la personalidad, tarea to-
davía inmadura. A título de propuesta se van a considerar aquí cinco variables cogni-
tivas: constructos, atribuciones, expectativas y dos tipos de conductas autorreferen-
ciales (autoconcepto y autoestima).
II. LOS CONSTRUCTOS PERSONALES
La teoría de los constructos personales proviene exclusivamente de la obra de Kelly

(1955). Ésta es una reacción contra la psicología objetivista y reactiva, predominante
or esas fechas en la universidad norteamericana (Moreno Jiménez, 1985). El postu-
lado básico de la teoría —los procesos psicológicos de una persona están psicológi-
camente canalizados por su forma de anticipar los eventos— establece el carácter bá-
sico de la naturaleza de un constructo. Desde la perspectiva de Kelly, los constructos
no son verdaderos o falsos, sino útiles o inútiles. Kelly considera que un constructo
de
no es un concepto, porque ni es universal ni pertenece estrictamente a la lógica
enunciados. Un constructo es una discriminación que incluye contenidos emotivos,
854 Bernardo Moreno-Jiménez
conductuales y motivacionales. Desafortunadamente, en la práctica de laevaluación

de los constructos, la técnica más común ha sido la de reducirlos a adjetivos bipola-
res, frecuentemente del tipo de antónimos. Con ello, se desvirtúa la intuición origr-
nal de Kelly. Ejemplos de constructos serían: «se parece a mi hermano», «es mi amu-
go», «es muy difícil vivir con él», «enfada a todo el mundo», etc. Los ejemplos
mencionados se refieren todos ellos a personas, pero de la misma manera se constru-
yen constructos sobre el paisaje («tiene un clima maravilloso»), sobre los coches
(«tiene buena aceleración») o sobre el ámbito escolar («son cosas con las que se estu-
dia»). Reducir este tipo de constructos a adjetivos es empobrecer la conceptualiza-
ción cotidiana y abandonar la idea original de Kelly.
Una de las posibles razones que ha promovido el deslizamiento hacia la reduc-
ción del constructo a adjetivos bipolares es la idea de Kelly de que todo constructo
es por naturaleza bipolar. Kelly alude con ello a dos fenómenos. El primero de ellos
es que a todos los objetos o hechos a los que se les puede aplicar el constructo se les
puede aplicar de una forma positiva o negativa; el segundo de ellos es más importan-
te y se refiere a la naturaleza subjetiva del constructo. Un constructo no es una cons-
trucción lógica, sino que se refiere a la construcción personal de la realidad, a la for-
mulación subjetiva que el individuo hace del lenguaje. Según esto si un polo del
constructo está formado por la idea de “amistoso”, el otro polo del constructo no
puede ser inferido lógicamente y no existe deducción posible que conduzca inevita-
blemente a él. El otro polo del constructo podría estar configurado por las ideas de
estúpido, superior jerárquico, enemigo, subordinado y un largo etcétera inabarca-
ble. Si los constructos son personales es porque cada cual los construye a su manera.
Sin entrar en los pormenores de la cuestión, es obvio que los constructos no for-
man un conjunto desarticulado de apreciaciones sobre la realidad; el lenguaje inter-
no de cada sujeto tiene su organización, su cohesión, su jerarquización, en una pala-
bra, su estructuración personal. La estructura cognitiva del sujeto, tal como se
manifiesta a través de los constructos, posee una serie de características propias.
Kelly enfatizó dos de ellas: organización y jerarquización. La organización supone
que los constructos están interconectados formando una red binaria que organiza la
realidad, y la jerarquización establece que los constructos poseen una mayor ampli-
tud aplicativa que otros, de forma que unos se contienen en otros. Por otra parte,
cada constructo tiene una serie de características propias, y así se puede decir de ellos
que son rígidos, vacíos, permeables, etc. Sin embargo, esta área se ha estudiado bas-
tante menos. Mayor atención ha merecido la distinción del tipo de constructos no
por sus características formales o su posición dentro del sistema, sino por su conte-
nido. Así, cabe mencionar los estudios de Little (1968), Landfield (1971), Duck
(1975) y Barrat (1977).
51. Evaluación de los constructos personales

Para la evaluación de los constructos, Kelly (1955) ideó un sistema original conocido
como “rejilla de Kelly”. La cuestión de la evaluación de los constructos puede redu-
cirse a dos partes fundamentales: saber cuáles son y determinar la relación entre
ellos. Información sobre ambos aspectos se puede encontrar en los trabajos de Ban-
Evaluación cognitiva de la personalidad 855
nister y Mair (1968) y Fransella y Bannister (1977). Kelly se centró casi exclusiva-
mente en la determinación de los constructos interpersonales, es decir, en la forma
que tenemos de “construir” a los demás, de percibir cómo son los otros. Para deter-
minar cuáles eran esos constructós interpersonales, Kelly utilizaba una rejilla de do-
ble entrada donde las columnas representaban a los otros significativos en la vida de
la persona. Los ejemplos de Kelly incluían entre 15 y 24 personajes. Posteriormente,
Slater (1977) ha encontrado que el número modal en un millar de rejillas era de
12 elementos.
Los personajes pueden ser directamente propuestos por el investigador, entresa-
cados por el sujeto de una larga lista que se le suministra o elaborados directamente
por el sujeto. Si el interés está en la determinación de los constructos de otro ámbito
distinto al interpersonal hay que proporcionar elementos adecuados para ello: mar-
cas de coches si se quieren determinar los criterios de su compra, personajes políti-
cos si se quiere conocer la construcción cognitiva de los líderes políticos, partidos
políticos si lo que se quiere es establecer las coordenadas de su mundo político (Ji-
ménez, López y Moreno-Jiménez, 1985), las situaciones de tartamudez si lo que se
busca es ver cuándo y por qué tartamudea un sujeto, etc. Además, se puede utilizar
sustituyendo a las palabras, dibujos, fotografías, carteles o símbolos para facilitar o
hacer más ágil la aplicación del instrumento; en determinados casos, con niños pe-
queños o deficientes mentales, éste es el recurso habitual (Honess, 1978).
Establecido el ámbito a estudiar y elegidos los objetos-estímulos correspondien-
tes que figurarán en las columnas se pasa a determinar los constructos correspon-
dientes. Existen varios procedimientos para ello. El primero es el método de la tría-
da, original de Kelly. El método consiste en tener en cuenta tres elementos o papeles,
y decidir en qué se parecen dos de ellos y en qué se diferencian del restante. De esta
forma, el constructo obtenido es bipolar y personal, pudiéndose obtener construc-
tos tales como gentil-detestable o gentil-estúpido. Este tipo de constructos idiográ-
ficos era lo que Kelly originalmente buscaba y lo que diferencia el constructo del
concepto.
Una forma más sencilla de elicitación es la díada, propuesta por Ryle y Lunghi
(1970). Según este método, se comparan sólo dos elementos, estableciendo el sujeto
en qué se parecen y preguntando por el término opuesto al obtenido. Normalmente,
los constructos así obtenidos son bipolares de forma negativa (gentil-no gentil) o de
forma antinómica (gentil-grosero). Una tercera posibilidad es la de utilizar sólo
constructos unipolares, suponiéndose el otro constructo como un constructo su-
mergido o no explicitado. Existe además una cuarta posibilidad que no tiene como
objetivo determinar los constructos del sujeto, sino estudiar la estructura de algunos
constructos supuestamente importantes; consiste en proporcionar al sujeto una lista
de constructos para que evalúe con ella un determinado grupo de elementos, papeles
o personajes. Es un método que facilita la aplicación colectiva. Existen algunas reji-
llas de este tipo con fines específicos; Vacc (1980) ha propuesto un modelo de este
tipo de rejilla que puede aplicarse a niños en edad escolar.
Establecidos los constructos, elicitados o suministrados, el segundo paso es estu-
diar la estructura global de los mismos. Otra tarea posible es determinar la estructura
global de los elementos. Los procedimientos son afines y, en algún caso, con ayuda
de programas de ordenador, simultáneos. La primera operación es determinar qué
tipo de puntuación se va a utilizar. Existen tres formas. La primera de ellas, sugerida

por Kelly, es de tipo dicotómico y consiste en marcar si el personaje posee lacaracte-
rística señalada por el primer polo del constructo; un segundo sistema es utilizar una
puntuación de rango o jerárquica, lo que significa que los elementos se van ordenan-
do según la importancia en ellos del primer polo del constructo; finalmente, otra po-
sibilidad es utilizar una puntuación de tipo escalar según el modelo de Likert, siendo
los sistemas más utilizados los que van de 5 a 7 categorías; la ventaja de este sistema
es que permite el uso de los estadísticos más habituales. .
Obtenidas las puntuaciones existen diferentes formas de análisis. En primer lu-
gar, existe un tipo de análisis cualitativo que permite observar cómo alguno de los
elementos —por ejemplo, el sí mismo— es evaluado en cada uno de los constructos
y de forma global; este tipo de análisis resulta en la mayoría de los casos insuficiente.
El segundo tipo de análisis trata de obtener las correlaciones que existen entre dos o
más constructos o entre dos o más elementos (Moreno-Jiménez, 1984). El tipo de
coeficiente de correlación a manejar dependerá del tipo de puntuación utilizada. El
coeficiente fi se utiliza para la puntuación dicotómica, el de rango para la puntuación
jerárquica y el de Pearson para la puntuación escalar; el primero y el tercero pueden
utilizarse simultáneamente para elementos y constructos, y en el de Spearman hay
que atender a la dirección de la escala de rango utilizada.
Una metodología accesible al cálculo manual es la desarrollada por Bannister
(1963) y expuesta detalladamente en Fransella y Bannister (1977) y Rivas (1981); se
trata de la puntuación Intensity score (15) que permite establecer un orden jerárquico
de los constructos y una gráfica de la interrelación de todos ellos. Existen formas
más complejas de análisis de una rejilla pero exigen normalmente programas infor-
máticos. Existen tres técnicas de análisis multivariado que se han aplicado amplia-
mente al análisis de las rejillas: el análisis factorial, el análisis de conglomerados y el
análisis multidimensional (Slater, 1977; Keen y Bell, 1980; Shaw, 1981). Existen me-
todologías muy particulares dirigidas a obtener resultados muy específicos dentro
de la ingente información contenida en la rejilla de Kelly. Feixas y Cornejo (1992)
han elaborado un programa informático para la corrección de la rejilla!.
IV. LAS ATRIBUCIONES DE CONDUCTA
En el lenguaje de la psicología actual el término atribuir se ha convertido en sinóni-

mo de percibir las causas de la conducta. La teoría de la atribución, elaborada inicial-
mente a partir del primer modelo de inferencia causal de Heider (1958), se ha desa-
rrollado hasta constituir actualmente una de las áreas más importantes en el análisis
de los procesos cognitivos, especialmente de aquellos que influyen en la conducta
diaria del hombre real. Heider decía que atribuir es una actividad espontánea ante la
actividad de los demás. Si comprender a los demás en sus acciones es una de las tareas
.
Se puede encontrar en Internet un excelente servidor sobre el tema de constructos personales en la
siguiente dirección: http//ksi.cpsc.ucalgary.ca:80/PCP/PCP.html. El servidor permite tanto una intro-
ducción teórica como metodológica al tema.
857
más importantes que el sujeto humano tiene, una parte importante de esta tarea es
comprender las causas de la conducta de los demás. La exploración de la causalidad
interpersonal determina en gran manera nuestra actitud y conducta en las relaciones
interpersonales. Probablemente, toda acción suscita una interpretación de sus cau-
sas, aunque no todas lo hacen del mismo modo. El análisis causal es especialmente
importante cuando los hechos sorprenden o no coinciden con las expectativas con-
cretas o creencias generalizadas. Nadie hace preguntas ante una conducta banal, to-
dos las hacen frente a una conducta llamativa. La pregunta acerca del porqué está
siempre presente en la vida humana y constituye una parte importante del estilo de
vida y la filosofía del mundo de cada sujeto. De aquí la importancia de las atribu-
ciones.
Las atribuciones rigen, o al menos influyen, una amplia gama de conductas. Los
modelos más clásicos de esta línea de investigación son los de Weiner (1978, 1990)
que muestran la importancia de las atribuciones en la motivación y en la emoción. Si
un mal examen se atribuye a la falta de preparación, la reacción más habitual será la
de prepararlo mejor para la próxima ocasión; por el contrario, si se atribuye a falta de
capacidad lo más probable es el abandono. Algo semejante ocurre con las emocio-
nes, si la atribución ante el éxito es de habilidad, la emoción consecuente será la de
seguridad y competencia personal, si se atribuye a la influencia de otros aparece la
gratitud. De forma parecida se pueden originar la culpa, la sorpresa, la cólera, etc.
(Moreno-Jiménez, 1986). Clásicos en la misma línea de investigación son los estu-
dios de Seligman y cols. (1979).
En áreas más específicas son múltiples los trabajos realizados: la atracción inter-
personal, el conflicto y la separación en la relación de pareja, la conducta altruista, la
tartamudez, la conducta moral, la conducta asertiva, etc. El presupuesto general de
todas las aplicaciones mencionadas es la influencia de las atribuciones sobre la con-
ducta. Consecuencia de ello es el desarrollo de estrategias terapéuticas atributivas
para la modificación de conducta (Antaki y Brewin, 1982). Las causas posibles que
pueden ser atribuidas son múltiples. El estudio de ellas ha obligado a sistematizar-
las para poder controlar sus efectos. Así, hay dos líneas preferentes de investigación:
la primera trata de establecer los factores de atribución más importantes y la segunda
busca establecer las dimensiones en las que pueden resolverse todas las atribuciones.
Heider (1958) se incluye en la primera línea de investigación y trató de establecer
los tipos de causas principales a las que se atribuye la conducta. Según Heider habría
dos tipos de causas: personales e impersonales. Dentro de las primeras cabría distin-
guir la habilidad o la capacidad personal y el esfuerzo o la motivación, dentro de las
segundas se podrían distinguir la dificultad interna de la tarea, alta o baja, y la suerte.
Kelley (1967) ha seguido un modelo de probabilidad estadística y ha formulado el
principio de covariación: un efecto es atribuido a aquel elemento que está presente
cuando se da el efecto, y ausente cuando el efecto notiene lugar. Tres son los elemen-
tos principales sobre los que puede recaer la atribución: el sujeto de la acción, elob-
jeto de la acción y la situación en la que se da la acción. Kelley (1972) ha determinado
los diferentes criterios lógicos por los cuales se rige la atribución a uno u otro delos
elementos mencionados. No obstante, Cunninghan y Kelley (1975) han reconocido
que, a pesar de los criterios lógicos aludidos, en los individuos pueden darse tenden-
cias que favorecen la atribución a uno cualquiera de estos elementos.
La segunda línea de investigación está constituida por los trabajos emprendidos

principalmente por Weiner (1971, 1974). Weiner ha tratado de establecer las dimen-
siones dentro de las cuales puede incluirse cualquier tipo de atribución. Propone tres
dimensiones principales que tienen la forma de continuos bipolares. La primera di-
mensión está formada por los polos interno-externo. Cualquier factor al que se atri-
buya un hecho o es interno o es externo a la persona; Weiner propone no considerar
estos dos polos como excluyentes y en cambio suponer que existe un continuo que
va desde una perfecta internalidad a una absoluta externalidad. Además de esta di-
mensión existirían otras dos dimensiones: estable-inestable y controlable-incontro-
lable. Las tres dimensiones serían ortogonales y cualquier hecho puede situarse en
un punto cualquiera del espacio determinado por estos tres ejes. Las causas concre-
tas difieren entre sí no sólo por su naturaleza, sino por la percepción diferente que
los sujetos pueden tener de ella. Weiner comenta que la paciencia como causa puede
ser percibida como estable o inestable, lo que indica que su ubicación dentro del es-
pacio interdimensional es interpersonalmente variable. La variabilidad de la percep-
ción de las causas, dentro de las tres dimensiones, es un hecho real aunque ha sido es-
casamente investigado. Así por ejemplo, la suerte puede llegar a ser percibida por
algunos sujetos como un factor interno y estable; de la misma manera, el esfuerzo es
teóricamente una atribución interna e inestable; sin embargo, determinados sujetos
pueden verlo como una característica de la persona y, por lo tanto, interno y estable.
Abramson, Seligman y Teasdale (1978) han distinguido, además de las dimensio-
nes interno-externo y estable-inestable, otra dimensión que han denominado globa-
lidad-especificidad. Esta dimensión se refiere específicamente a la generalización de
las causas de la conducta y la posible extensión de un tipo de causa de un hecho de-
terminado a todas las áreas de la conducta. El conjunto de las tres dimensiones así
definidas se ha aplicado al modelo atributivo de la indefensión aprendida. Abramson
y cols. (1978) han mantenido que la dimensión de globalidad sería ortogonal a las di-
mensiones de internalidad y estabilidad; por su parte, Weiner ha propuesto que se
considere la globalidad como una forma de estabilidad transituacional. La estabili-
dad indicaría que el mismo tipo de causa aparece de modo estable en la misma situa-
ción, y la globalidad indicaría la estabilidad a través de situaciones diferentes.
Un planteamiento radicalmente diferente es el de Kruglanski (1975), quien pro-
pone una dimensión única: endógeno-exógeno. Según este autor, la dimensión se re-
fiere a la consideración de si la acción es emprendida por ella misma o por sus conse-
cuencias. Es por lo tanto una dimensión que tiene el sentido de delimitar si la acción
es instrumental o final. Los trabajos desarrollados desde esta perspectiva y su funda-
mentación no persiguen establecer una sistematización de las causas de la conducta.
1V1. La evaluación de las atribuciones
La evaluación de las atribuciones puede referirse a la evaluación de las dimensiones

atributivas o de las categorías atributivas. En principio, la teoría de la atribución
trató de establecer los modelos básicos y normativos a través de los cuales se efec-
tuaba la atribución correcta. Los modelos de Heider (1958) y Kelley (1967, 1972)
eran modelos principalmente racionales que concebían al sujeto cognitivo como
procesador racional de la información. El estudio de la heurística humana de la

cognición (Iversky y Kahneman, 1974) y de los sesgos en los procesos cognitivos
(Nisbett y Ross, 1980) han mostrado la importancia de las variables del sujeto en el
proceso.
La consecuencia de estos hechos es la posibilidad de una psicología diferencial de
la atribución. Los estudios acerca de las diferencias individuales (Deaux y Emswiller,
1974), los estudios evolutivos (Schantz, 1975) y las investigaciones que vinculan la
atribución a variables de personalidad como la autoestima, la motivación de logro y
el lugar de control (Zuckerman,1979) son una buena muestra de una posibilidad to-
davía insuficientemente desarrollada. Las categorías atributivas preferentemente es-
tudiadas han sido las cuatro propuestas por Heider: habilidad, esfuerzo, dificultad
de la tarea y suerte. Las cuatro categorías han sido estudiadas preferentemente en
contextos de éxito, fracaso y logro. A estas categorías en determinados estudios se le
han añadido otras como la situación y los otros. En contextos muy específicos se
han utilizado categorías especiales como las características físicas, la disponibilidad o
la apariencia.
Elig y Frieze (1979) han resumido los sistemas de evaluación seguidos para los
estudios de la atribución del éxito o del fracaso. Su exposición puede servir para des-
cribir en general la evaluación de las atribuciones. Los autores distinguen seis mé-
todos:
a. Método no estructurado. Consiste en permitir que el sujeto responda libre-

mente exponiendo las causas del hecho.
Ejemplo:
¿Por qué cree Ud. que ha tenido éxito en la tarea que se le ha pedido?
Este tipo de evaluación se ha efectuado para determinar si las causas que los suje-
tos exponían se corresponden con las causas teóricamente expuestas. Así, en el ám-
bito del logro académico aparecieron, además de las cuatro citadas, el ánimo del mo-
mento, la personalidad y el interés por la tarea.
b. Escalas unipolares. Consiste en evaluar en forma de escalas de Likert las ca-

tegorías atributivas que se suponen importantes.
Ejemplo:
Evalúe de uno a nueve la importancia de los siguientes factores en la prueba que Ud.
acaba de pasar :
Su inteligencia :
La facilidad de 1 9
la tarea:
c. Evaluación de porcentajes. Es un tipo de evaluación ipsativa, es decir un tipo

de evaluación en el que la puntuación dada es siempre igual a una constante, en este
caso igual a cien. Aplicado aquí permite que a una causa se atribuya la totalidad del
resultado o la parte ajustada del mismo.
Ejemplo:
Aprecie Ud. el porcentaje de influencia que ha tenido en su éxito las siguientes cuatro
causas:
Capacidad Esfuerzo
Facilidad _ Suerte
d. Elección de una causa. Se trata de evaluar cuál es la causa más importante de

todas las que han podido intervenir.
Ejemplo:
¿Cuál es la causa que más ha influido en el resultado? Señale con una x
Inteligencia Esfuerzo
Facilidad Suerte
e. Escalas bipolares. Se trata de evaluar las categorías disponiéndolas dentro de
escalas bipolares expresadas a lo largo de un continuo.
Ejemplo:
¿Cuál es la importancia en el resultado obtenido de los siguientes pares de causas?

Coloque una señal en el punto de la escala adecuado.
Capacidad 5 + 3 2 1 Esfuerzo
Facilidad Sl 4 3 2 1 Suerte
f.. Comparación de pares. Es el método probablemente menos utilizado. Se tra-

ta de ofrecer una alternativa semejante a la anterior, pero sin intervalos escalares,
combinando las causas pertinentes.
Ejemplo:
De cada par de posibles causas rodee con un círculo cuál es más importante para expli-
car el resultado obtenido:
Capacidad-Esfuerzo
Capacidad-Suerte
Esfuerzo-Suerte
Etc.
De todas estas metodologías, Elig y Frieze (1979) consideran que las mejores son
las más estructuradas y, de éstas, las metodologías de porcentajes y de escalas bipola-
861
res. “Tales metodologías comparten varias limitaciones, siendo la más importante el

upo de elección forzosa. Una solución a este problema es la propuesta por Russell
(1982) que permite que el sujeto elija las causas que considere más pertinentes y pos-
teriormente las dimensionalice. De esta forma, se reúnen las ventajas de los métodos
no estructurados y estructurados. La propuesta de Russell (1982) establece un nexo
entre la evaluación de las categorías y las dimensiones atributivas; en realidad, es ya
una medida de las dimensiones de la atribución. La evaluación de las dimensiones
atributivas consiste usualmente en pedirle al sujeto que, en primer lugar, exponga la
causa concreta que explique el hecho en cuestión, y, posteriormente, el mismo sujeto
debe dimensionar la causa, evaluando su ubicación en los continuos bipolares.
Ha sido este enfoque de la atribución el que ha propiciado el estudio de los esti-
los atributivos. Layden (1971) define los estilos atributivos como la manera habitual
de contestar cuestiones acerca de la causalidad; por su parte, Metalsky y Abramson
(1980) los definen como la tendencia a hacer tipos particulares de inferencia de for-
ma consistente a través de los tiempos y las situaciones diferentes. El estudio de los
estilos atributivos fue iniciado por Ickes y Layden (1978) que, considerando sólo la
internalidad-externalidad, distinguieron nueve tipos de estilos atributivos frente al
éxito y al fracaso. De los nueve, cuatro tienen una clara importancia teórica: el estilo
atributivo externalista, internalista, egotista y depresivo.
Probablemente las investigaciones más conocidas en este campo sean las de Se-
ligman y cols. (1979) y Peterson y cols. (1982), quienes han supuesto que la indefen-
sión aprendida estaría mediada por un estilo atributivo frente a hechos positivos y
negativos. Para comprobar esta hipótesis elaboraron el Attributional style question-
natre [Cuestionario de estilo atributivo], un cuestionario con doce situaciones, seis
positivas y seis negativas. De ellas, seis se refieren a relaciones interpersonales y seis a
situaciones de logro. Los autores propusieron tres dimensiones: internalidad, estabi-
lidad y globalidad.
El trabajo de Seligman y cols. (1979) tiene un marco muy definido consistente en
la determinación de las variables cognitivas antecedentes a la indefensión aprendida,
por lo que su contexto teórico es forzosamente limitado, usando sólo las dimensio-
nes consideradas pertinentes para la indefensión aprendida, refiriéndose sólo a he-
chos claramente positivos o negativos, y limitándose a estudiar la autoatribución.
Otro intento en esta línea ha sido el establecido por Fletcher y cols. (1986) quienes
parten del presupuesto de las diferencias en la complejidad atributiva delos sujetos.
Para ello elaboraron la Attributional complexity scale [Escala de complejidad atribu-
cional] que consta de siete dimensiones, todas las cuales varían a lo largo de un conti-
nuo simplicidad-complejidad. Las dimensiones presentes en el cuestionario son: ni-
vel de motivación, preferencia por lo complejo, presencia de metacogniciones,
conciencia de interacción, tendencia a atribuciones internas abstractas, tendencia a
atribuciones externas abstractas y tendencias a atribuciones temporales pasadas. El
supuesto teórico es que los individuos atributivamente complejos tendrían mayor
capacidad de discriminación en su interacción personal. sub
Otro modelo de estilos atributivo s ha sido el propuest o por Moreno- Jiménez
(1985) en el que se formula un patrón de estilos heteroatributivos ante situaciones
cotidianas. Una ventaja de este modelo es que permite establecer las creencias del su-
¡eto acerca de las variables fundamentales de la acción. Para ello, se recogen cuarenta
situaciones que no parecen provocar sesgos de respuesta y que representan situacio-

nes cotidianas. Las dimensiones seleccionadas son tomadas de la propuesta de Wi-
mer y Kelley (1982) de cinco dimensiones básicas: evaluación, esquematicidad, in-
ternalidad, estabilidad y controlabilidad. 31
Recientemente, el tema se ha dirigido hacia la evaluación del estilo explicativo y
sus implicaciones en el continuo optimismo-pesimismo. Según el modelo desarro-
llado (Seligman, 1995), los estilos explicativos se aprenderían en la infancia y se pro-
longarían hasta la vida adulta desarrollando estilos de vida y posibles problemas
adaptativos y funcionales.
V. LAS EXPECTATIVAS
El concepto de expectativa fue incorporado al estudio de la personalidad por Rotter

(1954) en el contexto de su modelo de psicología social del aprendizaje y de la pro-
puesta de un modelo algorítmico del potencial de conducta. Por expectativa se en-
tiende la probabilidad subjetiva de que ocurra algo como consecuencia de una con-
ducta. Según Rotter, las expectativas del refuerzo que siguen a una determinada
conducta y el valor concedido a ese refuerzo determinan el potencial para una con-
ducta determinada en una situación específica. Ambas variables cognitivas, expecta-
tivas y valores, son en el modelo de personalidad de Rotter (Rotter y Hochreich,
1975) los elementos determinantes en la unidad de análisis principal de la psicología
de la personalidad: la interacción sujeto-situación. Inicialmente, Rotter distinguía
dos tipos de expectativas: específicas y generalizadas. Las primeras se referían a la
probabilidad subjetiva de sucesos específicos y las segundas son del orden de creen-
cias acerca de las secuencias habituales de los acontecimientos. Las expectativas es-
pecíficas son innumerables y dependen del tipo de conducta en cuestión como, por
ejemplo, las expectativas asociadas al consumo de alcohol (Cárdenas y Moreno-Ji-
ménez, 1990). Como tales, se basan en la historia personal del sujeto de la secuencia
de acontecimientos vividos y observados en un área específica. Las expectativas ge-
neralizadas son de gran importancia en la conducta debido a que determinan la
orientación de ella ante situaciones nuevas y no experimentadas previamente. Adop-
tan la forma de convicciones y creencias generalizadas sobre lo que cabe esperar en
una amplia gama de situaciones. Rotter ha estudiado de forma específica dos tipos de
expectativas generalizadas: las expectativas de lugar de control y las de confianza in-
terpersonal. El lugar del control (Rotter, 1966) se refiere a los supuestos sobre las
causas generales de los acontecimientos y la confianza interpersonal (Rotter, 1967) a
los supuestos sobre el ánimo y las intenciones de las personas con quienes se interac-
túa. Sin embargo, mientras el estudio de las expectativas de lugar de control ha teni-
do un desarrollo notorio, las expectativas de confianza interpersonal apenas han
sido exploradas.
La vigencia del modelo de expectativas de lugar de control en psicología provie-
ne principalmente del esfuerzo realizado por Rotter (1966) por evaluar la expectati-
va de contingencia de la propia conducta. Según Rotter, ante los acontecimientos se
pueden mantener dos tipos de creencias básicas generalizadas: considerar que de-
863
penden de uno mismo y considerar que obedecen a otros factores externos al sujeto.
Según el primer tipo de creencia, el sujeto considera que su conducta y la línea de ac-
ción que desarrolla interviene decisivamente en las cosas que le pasan, el segundo
tipo de creencia considera que la suerte, el destino, los otros o las instituciones son
los factores decisivos de los hechos que le afectan, de forma que su conducta poco
tiene que ver con los sucesos que le afectan cada día. Rotter (1966), en función del
tipo de creencias mantenidas, distinguía dos tipos de sujetos: internalistas y externa-
listas. Internalistas serían aquellos que mantienen expectativas de que su acción re-
percutirá sobre el medio influyendo en él; por el contrario, los externalistas son
aquellos que sitúan el control de la situación fuera de ellos. La distinción no debe en-
tenderse como una tipología excluyente, sino como los polos de un continuo a lo
largo del cual se distribuyen los sujetos.
Posteriormente al trabajo de Rotter, los estudios e investigaciones sobre el lugar
de control han proliferado vertiginosamente hasta constituir en la década de los años
setenta, y parte de los ochenta, una de las áreas más prolíficas de la psicología (Lef-
court, 1981a, 1983), aunque en los últimos años ha conocido un notorio declive. Lle-
vado de la mano del tema, la investigación acerca de la percepción de control se ha
convertido en un paradigma de investigación básica (Langer, 1983; Fischer, 1984;
Skinner, 1995) y la base de desarrollos como los de causación personal (Decharms,
1968), autoeficacia (Bandura, 1977) o competencia personal (Harter y Connell,
1984).
Los aspectos de la conducta y de la personalidad que han sido puestos en rela-
ción con el lugar de control son múltiples (Lefcourt, 1976; Phares, 1976). Parece
ser que existe una clara relación entre el lugar de control general y diversos tipos de
control específico. Seeman y Evans (1962) observaron que en un hospital de tuber-
culosos los pacientes internalistas poseían mayor información sobre su condición
física y pedían más información a médicos y enfermeras. Seeman (1963) observó en
un reformatorio que los presos con un sistema de creencias interno conocían mu-
cho más sobre la política del reformatorio y sus reglas y regulaciones acerca de la
libertad condicional. El lugar de control también es relevante para determinar la
preferencia por ciertos tipos de actividades. Schneider (1972) encontró que los su-
jetos internalistas prefieren actividades de habilidad, mientras que las actividades de
azar eran preferidas por los sujetos externalistas. Igualmente, los sujetos externalis-
tas parecían más claramente susceptibles de ser influidos en sus apreciaciones y
más aptos para sufrir procesos de conformidad del tipo de los descritos por Asch
(Tolor, 1978). Tolor (1978) encontró que cuando se sugería que una luz estacionaria
se movía, era más probable que fueran los externalistas los que asintieran y vieran
la luz en movimiento. La mayor capacidad de persuasión de los externalistas se re-
fleja igualmente en los estudios de cambio actitudinal. Ritchie y Phares (1969) en-
contraron que los externalistas cambiaban más en respuesta a una fuente de eleva-
do prestigio que de bajo prestigio. Parece contrastado que las creencias de lugar de
control están relacionadas con el bienestar físico (Strickland, 1978). Son múltiples
las investigaciones que sugieren que las relaciones entre lugar de control y desajus-
te y ansiedad son lineales: a mayor externalidad mayor desajuste. Es posible que las
cualidades de mayor actividad, esfuerzo y autoconfianza de los internalistas con-
duzcan a un éxito mayor.
864 Bernardo Moreno-Jiméncz
La lista de investigaciones y de temas relacionados con el lugar de control sería

interminable. En general, la mayoría de tales estudios favorece la condición de los
internalistas y consideran perjudicial la condición de los externalistas. Sin embargo,
Rotter (1975) ha señalado los peligros de tal generalización. Hay ocasiones en las
que el internalismo acarrea consecuencias negativas como la culpa y la depresión.
Rotter ha sugerido igualmente que los externalistas podrían agruparse en dos moda-
lidades: congruentes y defensivos. Los congruentes mantendrían genuinamente que
los acontecimientos están determinados básicamente por factores externos mientras
que los defensivos lo harían como un tipo de defensa contra la autodevaluación. Una
de las líneas de investigación más seguidas en los últimos años ha sido la aproxima-
ción entre las expectativas y las atribuciones; sin embargo, tratar de completar la teo-
ría de las expectativas con la teoría de las atribuciones parece más bien crear confu-
sión que ayudar a dilucidar los problemas (Palenzuela, 1984). Como establecía
Rotter (1982), mientras las atribuciones son explicaciones del pasado, las expectati-
vas son perspectivas de futuro.
v.1. La evaluación de las expectativas de lugar de control

La primera escala de evaluación se desarrolló en Ohio a partir de dos tesis doctora-
les. En primer lugar, Phares (1955) estableció una escala breve que posteriormente se
desarrolló y depuró en una escala de sesenta ítems, treinta de los cuales eran de en-
mascaramiento. Esta escala conocida como James-Phares locus of control scale [Es-
cala James-Phares de lugar de control] fue la base de otra mucho más conocida, la
Rotter internal-external control scale [Escala de control interno-externo de Rotter]
(Rotter, 1966); ésta es el resultado de dos cuestionarios previos y consta de 23 ítems
más seis de relleno que ayudan a enmascarar la naturaleza del cuestionario. Los
ítems son representativos de una amplia gama de situaciones sin pretender represen-
tar a ninguna de ellas. Cada ítem consta de un doble enunciado, debiendo el sujeto
optar por aquel que mejor representa su opinión. La intención inicial de Rotter fue
la de elaborar un cuestionario que constara de subescalas que evaluaran creencias en
áreas tales como reconocimiento, amor, afecto, dominancia, etc. Los resultados
mostraron que tales subescalas no eran independientes y que los efectos de la desea-
bilidad social eran excesivamente altos, por lo que optó por uno de tipo genérico.
Aunque la escala se presenta como unidimensional, diferentes trabajos han mostra-
do que se necesitan al menos dos factores para explicar suficientemente la varianza
explicada por la escala, aunque la solución factorial más correcta sea probablemente
la de cuatro factores: general, político, rendimiento y relaciones interpersonales (Pé-
rez García,1984; Moreno-Jiménez, 1987).
El modelo desarrollado por Levenson (1981) aportaba la posibilidad de perfiles
diferenciales, algo escasamente analizado en el modelo de Rotter. Según la perspecti-
va de Levenson, es posible concebir que alguien mantenga una fuerte creencia en la
suerte y al mismo tiempo considere importante el esfuerzo personal, por otra parte
se diferenciaba del modelo propuesto por Rotter en su distinción entre enunciados
ideológicos y enunciados personales, por lo que proponía todos sus ftems en prime-
ra persona y no de forma impersonal. Otro paso importante en la evaluación del lu-
865
gar de control fue el establecido por Paulhus (1983), quien se centró en elaborar una
escala que estableciera el lugar de control de forma multidimensional; así, distinguió
tres áreas relevantes (social, personal y sociopolítica), pudiendo el sujeto diferir en
cada una de estas áreas, por lo que podría establecerse un perfil diferencial en fun-
ción de las mismas.
Tras los primeros cuestionarios han aparecido muchos otros, dedicados unos a la
evaluación de expectativas de control generales, otros a expectativas de control espe-
cíficas como el envejecimiento, la salud, el dolor, el alcoholismo o el estrés (Lefcourt,
1981b, 1983). Si bien las primeras escalas solían ser genéricas, la tendencia posterior
ha consistido en hacerlas específicas y propias de los campos a investigar. Así por
ejemplo, Peterson (1985) ha desarrollado una escala relativa al trabajo, Tennenbaum,
Furst y Weingarten (1984) han trabajado sobre el logro deportivo, Furham (1986) ha
desarrollado una basada en la situación económica personal, y Rose y Medway
(1981) en el control de las conductas de los estudiantes por sus profesores. En cual-
quier caso, a pesar de la relevancia del constructo en el desarrollo teórico, la impor-
tancia de la varianza explicada por las diferentes medidas ha distado mucho de ser
óptima y considerable (Lefcourt, 1991). En el cuadro 34.1 se puede encontrar un re-
sumen de algunas de las escalas más utilizadas.
VL EL AUTOCONCEPTO Y LA AUTOESTIMA
Ambos conceptos han recibido en los últimos años una apreciable atención, proba-
blemente como consecuencia del aumento concedido a las actividades y procesos
autorreferenciales, considerados como factores claves en el funcionamiento global
de la personalidad. En su uso, incluso científico y académico, no siempre queda cla-
ramente establecida la diferencia entre autoconcepto y autoestima. No obstante, la
indudable proximidad entre ambos conceptos no debe propiciar su confusión, lo
que en la práctica sucede no pocas veces cuando, de hecho, ambos términos son uti-
lizados como sinónimos. Por autoconcepto se entiende la representación mental que
el sujeto hace de sí mismo, mientras que la autoestima sería la evaluación de esa re-
presentación (Blascovich y Tomaka, 1991). Rosemberg (1965) insistía en la misma
idea de la autoestima como una actitud favorable o desfavorable hacia uno mismo.
Entre los diferentes autores que han estudiado específicamente el autoconcepto cabe
destacar a Epstein (1973, 1980) y su propuesta del autoconcepto como una teoría del
sí mismo que cumple diferentes funciones. Siguiendo su modelo, aunque modifica-
do, el autoconcepto juega tres funciones básicas:
a. Proporciona una identidad al sujeto en el marco de una teoría implícita de la

realidad.
b. Proporciona una integración histórica de la experiencia vivida por el sujeto.
c. Proporciona unos niveles mínimos de autoestima aceptables para el sujeto.
Recientemente, Markus y Nurius (1986) han propuesto la presencia en el suje-

to de diferentes representaciones de sí mismo que actúan como alternativas y po-
CUADRO 34.1. Cuestionarios de lugar de control

Escala Población Ítems
Internal-external lo- Rotter (1966) Global, interperso- Adulta NN(o
cus of control scale nal
Internality, powerful Levenson (1981) Otros poderosos y Adulta 24

others and chance suerte
scale
Spheres of control Paulhus (1983) Personal, social y Adulta 90

sociopolítica
Adult Nowicki-Stric- Nowicki y Duke Adulta 40

kland internal-exter- (1974)
nal control scale
Intelectual achieve- Crandall, Katkovsky Hechos positivos y Infantil 34

ment responsability y Crandall (1965) hechos negativos
questionnaire
Nowicki-Strickland Nowicki y Strickland Global Infantil 40

internal-external (1973)
control scale for
children
Multidimensional Conmnel (1985) Escolar, social, físi- Infantil 48

measure of chil- co, general
dren's perceptions
of control
Multidimensional- Lefcourt (1981 b) Logro y afiliación Adultos 18

multiattributional
causality scale
Marital locus of con- Miller, Lefcourt y Satisfacción marital Parejas 44

trol scale Ware (1983)
The desidered con- Reid y Ziegler Control de hechos Ancianos 70

trol scale (1981) deseables, control
cotidiano
Parenting locus of Campis, Lytman y Multidimensional, Padres 47

control scale Prentice-Dunn control sobre los hi-
(1986) jos
Multidimensional Wallston, Wallston y Internalidad, otros y Adultos 18

health locus of con- Devellis (1978) suerte referidos a la
trol scale salud
Mental health locus Hill y Bale (1980) | Internalidad ante la Pacientes en tera- 22
of control scale salud mental pia
Drinking related lo- Keyson y Janda Externalidad al al- Alcohólicos 25

cus of control scale (1972) coholismo
The weight locus of Saltzer (1982) Externalidad al so- Obesos

control scale brepeso
Diadic sexual regu- Catania, McDermott Internalidad a la ac- Parejas 30

lation scale y Wood (1984) tividad sexual
Lucam Pelechano y Bá- Multidimensional Adultos 87

guena (1983a)
Lucad Pelechano y Bá- | Multidimensional Adolescentes y ni- 88

guena (19836) ños
Internalismo y se- Moreno (1986a) Externalidad ante Conductores 30

guridad vial accidentes de trá-
fico
867
sibilidades globales que tiene ante sí. Los sujetos poseerían varios autoconceptos
que le permitirían diferentes actuaciones en diferentes situaciones y contextos, de
forma que en cada una de ellas puede estar operando prevalentemente una deter-
minada forma de autoconcepto con sus propias características (Markus y Wurf,
1987).
El estudio y la evaluación de la autoestima han conocido en los últimos años una
notable extensión dada la importancia individual y social que se le ha concedido. La
autoestima baja ha sido asociada a la soledad (Peplau y Perlman, 1982), a la aliena-
ción (Johnson, 1973) y, en general, al síndrome de absentismo social, compañera de
viaje de la mayor parte de los problemas sociales como delincuencia, marginación,
prostitución, toxicomanías, etc.; por otra parte, una autoestima alta suele ir asociada
con elevada motivación de logro, una red social extendida e, incluso, mejores niveles
de defensa inmunológica. De hecho, la autoestima ha sido relacionada con la prácti-
ca totalidad de las variables (Crandall, 1973).
Se ha discutido qué metodos de autoevaluación eran mejores predictores, si los
métodos de evaluación global o los específicos. Mientras algunos autores (Marsh,
Smith y Barnes, 1983) proponen autoevaluaciones específicas de aspectos concretos
del sí mismo, otros prefieren medidas más globales (Rosemberg, 1965). Probable-
mente, la mejor medida corresponde al tipo de predicción que se desea establecer,
global o específico, sin que pueda establecerse una preferencia global por uno u otro
tipo de medidas. El desarrollo de escalas multidimensionales aditivas como la Ten-
nesse self concept scale [Escala Tennesse de autoconcepto] de Roid y Fitts (1988) ha
quitado vigencia al debate.
vi1. La evaluación del autoconcepto

Son múltiples las medidas del autoconcepto desarrolladas. Wylie (1961) en su
clásico estudio analizaba 463 trabajos en los que podía advertirse la multiplici-
dad de enfoques y de instrumentos desarrollados, muchos de ellos sin validez
establecida y de difícil localización. La evaluación del autoconcepto ha sido un
campo abonado de iniciativas, no pocas de ellas sin los suficientes requisitos me-
todológicos. Básicamente existen dos formas de evaluar el autoconcepto: las téc-
nicas autodescriptivas y los métodos inferenciales (Wylie, 1974; Wells y Marwell,
1976). Las primeras se basan en la información que el sujeto proporciona de sí
mismo, las segundas consisten en las inferencias que se realizan a partir de la
conducta del sujeto.
Las técnicas autodescriptivas son consideradas por numerosos autores como las
más adecuadas ya que el autoconcepto es la representación o percepción que el suje-
to tiene de sí mismo. Pueden adoptar diferentes modalidades aunque se pueden re-
sumir en dos fundamentales: autodescripción libre y autodescripción estructurada.
La modalidad de autoinforme abierto, no estructurado, consiste en la petición al su-
jeto de que se describa a sí mismo completando unas frases de forma espontánea, O
escribiendo un breve ensayo sobre las características más importantes de sí mismo.
Este tipo de técnicas tiene la ventaja de permitir al sujeto expresarse en sus propios
términos, por lo que facilita la aportación de información relevante para el sujeto sin
elementos distorsionadores; asimismo, tiene el inconveniente de favorecer la omi-

sión de aspectos desagradables para el sujeto y que pueden ser importantes en auto-
concepto del sujeto (Wylie, 1974). La utilización en la investigación de este tipo de
técnicas ha sido limitada por su dificultad de cuantificación precisa y exacta, por lo
que su uso se ha centrado en contextos aplicados de tipo educativo y de desarrollo
personal. En los últimos años, con el relanzamiento de las técnicas cualitativas en la
investigación, se ha producido una revalorización de esta metodología (McGuire y
McGuire, 1981; Rosemberg, 1986). Probablemente, entre las técnicas de esta moda-
lidad la más conocida sea la desarrollada por Bugental y Zelen (1948) conocida como
«¿Quién eres tú?».
Los autoinformes estructurados o de final cerrado consisten en inventarios o es-
calas con cuestiones, frases o adjetivos de carácter autodescriptivo, especificados
previamente por el autor de la prueba en los que el sujeto debe identificar un deter-
minado grado de reconocimiento personal. Existen múltiples técnicas que se ajustan
a esta modalidad aunque las más conocidas sean básicamente tres: escalas de respues-
tas aditivas, la técnica Q y el diferencial semántico.
Las escalas de respuestas aditivas, escalas de tipo Likert o tipo listas de adjetivos,
son probablemente las más extendidas y utilizadas. Las listas de adjetivos suelen pre-
sentar características del sujeto representadas por un adjetivo o palabra en las que el
sujeto debe reconocerse positiva o negativamente. Este tipo de formatos ha sido
fuertemente criticado debido a su gran susceptibilidad a responderse en función de
la deseabilidad del término y la pobreza discriminativa de los resultados. Un ejem-
plo de ello es la Self concept scale for children [Escala de autoconcepto para niños] de
Lipsitt (1958). Las escalas de tipo Likert poseen mejores características psicométri-
cas, lo que las hace instrumentos más idóneos para el análisis del autoconcepto. Por
estas razones, son las técnicas más extendidas en la investigación del tema. Este tipo
de metodología puede también resultar fácilmente afectado por los fenómenos de
aquiescencia y de deseabilidad social. Las categorías de respuesta suelen variar entre
tres y nueve, aunque las más extendidas sean de cinco puntos. Wells y Marwell
(1976) consideran que la fiabilidad de la escala tiende a aumentarse cuando el núme-
ro de categorías es superior a dos, aunque el beneficio es mínimo cuando sobrepasan
los siete puntos. Hay autores (McGuire y McGuire, 1981) que consideran este tipo
de técnicas como medidas del autoconcepto reactivo por oposición a las técnicas li-
bres que evaluarían el autoconcepto espontáneo. Ejemplos de este tipo de escalas
son The Tennessee self concept scale [Escala Tennesse de autoconcepto] de Roid y
Fitts (1988), The self description questionnaire [Cuestionario autodescriptivo] de
Marsh y cols. (1983) y The academic self concept scale [Escala de autoconcepto aca-
démico] de Reynolds y cols. (1980).
La técnica Q fue desarrollada por Stephenson (1953) y consiste en solicitar a los
sujetos que organicen un grupo de sentencias autodescriptivas en bloques de acuer-
do con su nivel de identificación con ellas, atendiendo a colocar un determinado nú-
mero de sentencias en cada bloque siguiendo un tipo de distribución semejante a la
curva normal. Según este procedimiento, en el caso de establecer nueve bloques des-
criptivos, en el primero, nivel de mínimo reconocimiento, se situarían cuatro senten-
cias, en el segundo nueve, dieciséis en el tercero, veitiséis en el cuarto, cuarenta en el
quinto y comenzar a disminuir hasta el noveno grupo, grupo de máximo reconoci-
miento, con cuatro sentencias, el mismo número que en el primero. Fierro (1982) ha
propuesto y explicado la técnica. Su empleo es adecuado en estudios individuales,
pero es inaplicable en estudios de muestras o grupos elevados. Su ejecución no es
sencilla y requiere tiempo y esfuerzo, por lo que su utilización se ha reducido al ám-
bito clínico, siendo especialmente utilizada en el enfoque de la terapia centrada en el
cliente desarrollado por Rogers. González y Tourón (1992) proponen el diferencial
semántico como otra técnica apta para evaluar el grado con el que un sujeto se siente
caracterizado por un atributo particular o forma de ser. Siguiendo la técnica pro-
puesta por Osgood, Suci y Tannenbaum (1957), el sujeto debe evaluar un concepto o
reactivo en función de diversos criterios: cómo me percibo, cómo me ven los demás,
cómo me gustaría ser, etcétera.
Complementariamente a las técnicas descritas, se utiliza la evaluación del auto-
concepto mediante técnicas de reconocimiento de dibujos o viñetas con diferentes
tipos de acciones o conductas en las que el sujeto debe reconocerse. Este tipo de me-
todología es especialmente valiosa cuando al sujeto le faltan competencias léxicas, lo
que sucede en niños pequeños que, según Harter (1988), cuando son menores de
ocho años tienen dificultades para expresar verbalmente sus autoapreciaciones. No
obstante, su uso no tiene por qué limitarse a población infantil. Un ejemplo de esta
metodología es el Pictorial perceived competence scale for young children [Escala
gráfica de competencia percibida para niños] de Harter y Pike (1984). Por técnicas
inferenciales pueden entenderse todas aquellas técnicas en las que la información no
proviene del autoinforme directo del sujeto sino de muestras de conducta del mis-
mo. Para algunos autores (Combs, Soper y Courson, 1963; Savin-Williams y Jac-
quish, 1981) la inferencia a partir de la conducta sería el mejor método para evaluar el
autoconcepto real del sujeto a partir del supuesto de la determinación o influencia
del autoconcepto sobre la conducta. La evaluación de tal conducta pueden efectuarla
observadores avezados, amigos o compañeros del sujeto en cuestión. Este tipo de
metodología evitaría de raíz el sesgo en el autoinforme y ofrecería una perspectiva
complementaria del autoconcepto subjetivo. Ejemplos de este tipo de enfoques se-
rían The behavioral rating form [Forma escalar conductual] de Coopersmith y Gil-
berts (1981) y The self esteem rating scale for children [Escala de autoestima infantil]
de Chiu (1987).
Además de las técnicas mencionadas, en algunos casos se ha utilizado la en-
trevista, aunque su uso es más bien escaso y reducido a una forma de validación
de medidas de autoconcepto estandarizadas (Wells y Marwell, 1976). También se
ha empleado su evaluación a partir de técnicas proyectivas con el objeto de eva-
luar no el autoconcepto fenoménico, sino el inconsciente. La idea fue propuesta
inicialmente por Wylie (1961), aunque posteriormente consideró que el estudio
de este tipo de evaluación no indica mejoras con respecto a lo ofrecido por las
técnicas tradicionales (Wylie, 1974). Wells y Marwell (1976) han corroborado
esta apreciación y consideran que dichas técnicas tienen escasa consistencia pst-
cométrica.
Entre las escalas aditivas mencionadas cabe destacar la Tennesse self-concept scale
[Escala Tennesse de autoconcepto] de Roid y Fitts (1988) por la amplitud de sus
planteamientos y sus buenas características psicométricas. Su objetivo es evaluar
tanto el autoconcepto como la autoestima del sujeto a partir de cien ftems que cu-
bren cinco aspectos específicos: físico, ético, personal, familiar y social. Su formato
de respuesta es tipo Likert de cinco categorías. Su aplicación puede efectuarse a par-
tir de los doce años de edad. El estudio de Roid y Fitts (1988) ha permitido el de-
sarrollo de numerosas medidas complementarias: identidad, satisfacción y conducta,
autocriticismo, adaptación, trastorno de personalidad y otras complementarias has-
ta un total de 29 medidas. Garanto (1984) ha realizado una adaptación experimental
de la misma.
v12. La evaluación de la autoestima
Una de las formas de evaluación de la autoestima proviene de su conceptualización

como la discrepancia existente entre la percepción del sí mismo actual y el ideal
(Cohen, 1959), de forma que a mayor discrepancia menor nivel de autoestima.
Aunque autores como Bills, Vance y McLean (1951) y Miskimins y Braucht (1971)
hayan optado por este tipo de metodología, la mayoría ha preferido el método más
sencillo de evaluación directa de la autoestima. Otro enfoque teórico proviene de
James (1890), según el cual la autoestima era igual al éxito partido por las preten-
siones, fórmula prácticamente sin utilización. Entre las escalas de evaluación de la
autoestima, la desarrollada por Rosemberg (1965) es, sin duda, la más utilizada y
ha constituido con frecuencia el criterio estándar de evaluación y convergencia en
el desarrollo de otras escalas. La Self-esteem scale (SES) [Escala de autoestima] ori-
ginalmente fue diseñada para la evaluación de los sentimientos globales de autova-
loración y autoaceptación de adolescentes. Consta de diez ítems y, aunque origi-
nalmente se elaboró con las características de una escala Guttman, su utilización
habitual recurre al formato de Likert con cuatro categorías, aunque algunos auto-
res han utilizado formatos más amplios. Diferentes estudios han indicado que su
estructura es unifactorial (Simpson y Boyal, 1975; Hensley, 1977), aunque otros re-
sultados muestran una estructura bifactorial agrupándose los ítems positivos y ne-
gativos (Hensley y Roberts, 1976). Además de sus buenas características psicomé-
tricas, la SES es de fácil administración y corrección. No es posible su uso cuando
se persigue una evaluación multidimensional de la autoestima. Existe una versión
abreviada de seis ítems para poblaciones muy jóvenes y se aplica mediante entre-
vista (Rosemberg y Simmons, 1972).
El Self esteem inventory (SEI) [Inventario de autoestima] de Coopersmith (1967)
es el segundo cuestionario más utilizado en la evaluación de la autoestima. El SE7 fue
originalmente diseñado para niños y contenía 50 ítems que evaluaban cuatro áreas
específicas: compañeros, padres, escuela e intereses personales. La respuesta a los
ítems es dicotómica: sí/no u otras formas semejantes. Posteriormente, Coopersmith
(1975) reelaboró el inventario adoptando una forma B con 25 ítems obteniéndolos
de aquéllos con mayor correlación con el resultado total. Otros autores han elabo-
rado formas para adultos (Ryden, 1978). Ninguna de las factorializaciones ha repli-
cado los supuestos cuatro factores iniciales, por lo que su uso multidimensional debe
efectuarse con cautela. Igualmente, alguno de sus ítems carece de validez aparente.
Como el resto de los cuestionarios de autoestima está afectado por un marcado ses-
go negativo, de forma que los sujetos tienden a obtener puntuaciones altas y mues-
tran una correlación alta con la deseabilidad social. Su formato de respuesta parece
inadecuado y se ha sugerido su transformación en un formato Likert, con ello se
produciría probablemente una disminución de su deseabilidad social y se obtendría
una disminución del sesgo de respuesta.
Otros dos cuestionarios ampliamente utilizados son The feelings of inade-
cuacy scale [Escala de percepción de la imperfeccion] de Janis y Field (1959) y el
Texas social behavior inventory [Inventario Texas de conducta social] de Helm-
reich, Stapp y Erwin (1974). El primero de ellos, el F7S, consta de 36 ítems, ha
sido objeto de diferentes estudios y tiene la ventaja de que puede utilizarse tanto
para una apreciación global como de factores específicos. Los aspectos específi-
cos que considera son: autoconfianza, habilidades escolares, autoconsideración,
apariencia física y habilidad física. Por su parte, el 75B7 tiene la ventaja de contar
con dos versiones paralelas de 16 ítems con lo que facilita su utilización en de-
terminadas investigaciones. Aunque consta de cuatro factores específicos, se cen-
tra en los aspectos y habilidades sociales por lo que se le ha criticado su validez
de constructo.
La evaluación de la autoestima en los niños ha merecido un especial interés dada
su importancia en los aspectos evolutivos y los problemas específicos que entraña.
La escala más utilizada en este contexto ha sido la Piers-Harris children's self concept
scale [Ecalas Piers-Harris de autoconcepto infantil] (Piers, 1984), que evalúa autoes-
tima en niños y adolescentes a pesar de que su título haga referencia al autoconcepto.
Consta de 80 ítems a los que se responde dicotómicamente; factorialmente se han
extraído seis aspectos específicos: conducta, aspectos escolares, apariencia física, an-
siedad, popularidad y satisfacción. Su utilización ha dado mejores resultados con ni-
ños que con adolescentes.
Debido a los problemas léxicos que puede representar la evaluación de la autoes-
tima en los niños más pequeños y la importancia de tener referencias sobre ello se
han elaborado escalas basadas en el dibujo. Una de las más conocidas es el Self-
perception profile for children (SPPC) [Perfil de autopercepción infantil] de Harter
(1985). La SPPC evalúa diferentes aspectos de la autocompetencia y autoaceptación
infantil. Consta de dos formas en función de la edad: preescolar y primeros años es-
colares; ambas proporcionan información sobre cinco aspectos específicos: compe-
tencia escolar, aceptación social, competencia física, apariencia física y conducta. Se
presenta en dos series de dibujos, una representando un aspecto positivo y la otra
uno negativo, debiendo el niño identificarse con uno u otro. Cada una de las escalas
tiene seis ítems o dibujos. Su utilización capta el interés y la colaboración de los ni-
ños. En el cuadro 34.2 se puede encontrar un resumen de los instrumentos más utili-
zados en la evaluación de la autoestima que responden a criterios científicos de ela-
boración.
CUADRO 34.2. Cuestionarios de autoestima
The selfresteem | Rosenberg (1965) | Global Adolescentes y 10

scale adultos
The feelings of Janis y Field | Confianza social, | Jóvenes 36

inadecuacy sca- (1959) habilidad esco-
le lar, autoaprecio,
apariencia física
y habilidad física
The selfresteem | Coopersmith | Global Niños 58

inventory (1967)
Piers-Harris, chil- | Piers (1984) Conducta, esta- | Niños y adoles- 80

dren's self-con- tus escolar, apa- | centes
cept scale riencia física,
ansiedad, popu-
laridad y satis-
facción
Tennesse self- Roid y Fitts (1988) | Aspecto físico, Adultos 100

concept scale moralidad, as-
pectos persona-
les, familia y rela-
ciones sociales
Texas social be- Helmreich, Stapp Confianza, domi- Adultos 16

havior inventory y Erwin (1974) nancia, compe-
tencia social e in-
hibición social
Self-description | Marsh, Smith y | Académica y no | Niños 66

questionnaire Barnes (1983) académica
Personal evalua- | Shrauger (1990) | Estudios, ejerci- | Adultos 54

tion inventory cio, apariencia fí-
sica, relaciones
afectivas, relacio-
nes interpersona-
les y contacto
personal
The body-esteem Franzoi y Shields Hombres: atracti- | Adultos: hombres 52

scale (1984) vO físico, fuerza y | y mujeres
condición física.
Mujeres: atracti-
vo físico, peso y
condición física
Self-perception | Harter (1985) Competencia es- Niños en jardín 24

profile for chil- colar, aceptación de infancia, pri-
dren social, compe- mer grado
tencia atlética,
apariencia física
y conducta
Abramson, L. Y. y Seligman, M. (1981). Depression and the causal inference process. En

J. H. Harvey, W. Ickes y R. 1. Kidd (dirs.), New directions in attribution research (vol. 3).
Hillsdale. LEA.
Abramson, L. Y., Seligman, M. y Teasdale, J. D. (1978). Learned helplessness in humans: Cri-
tique and reformulation. Journal ofAbnormal Psychology, 87, 49-74.
Antaki, 2 y Brewin, C. (1982). Attributions and psychological change. Nueva York. Acade-
mic Press.
Augoustinos, M. y Walker, I. (1995). Social cognition. Londres. Sage.
Avia, a y Sánchez, M. L. (1995). Personalidad: aspectos cognitiwos y sociales. Madrid. Pi-
rámide.
Baldwin, A. L. (1969). A cognition theory of socialization. En D. A. Goslin (dir.), Handbook
of socialization, theory and research. Chicago. Rand MacNally.
Bandura, A. (1976). Social learning theory. Nueva York. Prentice Hall.
Bandura, A. (1977). Self-eficacy: Toward a unified theory of behavioral change. Psychological
Review, 84, 191-215.
Bandura, A. (1986). Social foundations of thongt and action. Englewood Cliffs. Prentice Hall.
-Bannister, D. (1963). The genesis of schizophrenic thought disorder: A serial invalidation hy-
pothesis. British Journal of Psychiatry, 109, 680-686.
Bannister, D. y Mair, T. M. M. (1968). The evaluation ofpersonal constructs. Londres. Aca-
demic Press.
Barrat, B. B. (1977). The development of peer perception systems in childhood and early
adolescence. Social Behavior and Personality, 5, 351-360.
Beck, A. (1970). The core problem in depression: The cognitive triade. En J. H. Masserman
(dir.), Depression: Theories and therapies. Nueva York. Grune and Stratton.
Belloch, A. y Báguena, M. J. (1986). Dimensiones cognitivas, actitudinales y sociales de la per-
sonalidad. Valencia. Promolibro.
Bem, D.J. y Allem, A. (1974). On predicting some of the people some of the time. Psycholo-
gical Review, 81, 506-520.
Bermúdez, J. (1989). Análisis procesual de la personalidad. En E. Ibáñez y V. Pelechano
(dirs.), Personalidad. Madrid. Alhambra.
Bills, R., Vance, E. y McLean, O. (1951). An index of adjustement and values. Journal of
Consulting Psychology, 15, 257-261.
Blascovich, J. y Tomaka, J. (1991). Measures of self-steem. En J. P. Robinson, P. R. Shaver y
L. S. Wrightsman (dirs.), Measures ofpersonality and social psychological attitudes. Nueva
Bowers, K. S. (1973). Situationism in psychology: An analysis and a critique. Psychological
Review, 80, 307-336.
Bugental, J. y Zelen, S. (1948). Who are you? A preliminary report on a method of studying
the phenomenal self. American Psychologist, 4, 387-396.
Campis, L. K., Lyman, R. D. y Prentice-Dunn, S. (1986). The Parental Locus of Control Sca-
le: Development and validation. Journal of Clinical Child Psychology, 15, 260-267.
Cantor, N. y Kihlstrom, J. F. (1981). Personality, cognition and social interaction. Hillsdale.
LEA.
Caparrós, A. (1979). La siempre problemática personalidad. En Introducción histórica a la
Psicología Contemporánea. Barcelona. ROL.
Cárdenas, C. y Moreno-Jiménez, B. (1990). Las expectativas asociadas al alcohol. Boletín de
Catania, J. A., McDermott, L. V. y Wood, J. A. (1984). Assessment of locus of control: Situa-
tional specificity in the sexual context. Journal of Sex Research, 20, 310-324.
Cattell, R. B. (1946). Description and measurement ofpersonality. Londres. Harrap.

Chiu, L. H. (1987). Development of Self-Esteem Rating Scale for Children. Measurement
and Evaluation in Counseling and Development, 23, 36-41.
Cohen, A. R. (1959). Some implications of self-esteem for social influence. En C. Hovland e
L L. Janis (dirs.), Personality and persuability. New Haven. Yale University Press.
Combs, A. W., Soper, D. W. y Courson, C. C. (1963). The measurement of the self-concept
and self-report. Educational and Psychological Measurement, 23, 493-500.
Connel, J. P. (1985). A new multidimensional measure of children's perceptions of control.
Coopersmith, S. (1967). The antecedents of self-esteem. San Francisco. Freeman.
Coopersmith, S. (1975). Coopersmith Self-Esteem Inventory. Technical manual. Palo Alto.
Consulting Psychologist Press. :
Coopersmith, S. y Gilberts, R. (1981). Behavioral academic self-esteem. En M. D. Linch,
A. A. Norem-Hebeisem y K. J. Gergen (dirs.), Self-concept. Advances in theory and re-
search. Cambridge (Ma). Ballinger.
Crandall, R. (1973). The measurement of self-esteem and related constructs. En J. P. Robin-
son y P. R. Shaver (dirs.), Measures of social psychological attitudes. Ann Arbor. Institute
for Social Research.
Crandall, V. J., Katkovsky, W. y Crandall, V. C. (1965). Children's belief in their own con-
trol of reinforcement in intellectual-academic situations. Child Development, 36, 91-106.
Cunningham, J. D. y Kelley, H. H. (1975). Causal attributions for interpersonal events of
varying magnitude. Journal of Personality, 43, 74-93.
Deaux, E. y Emswiller, T. (1974). Explanations of sucessful performance in sex linked-task.
What is skill for the male is luck for the female. Journal of Personality and Social Psycho-
logy, 29, 80-85.
Decharms, R. (1968). Personal causation. Nueva York. Academic Press.
Dollard, J. y Miller, N. E. (1950). Personality and psychotherapy. Nueva York. MacGraw Hill.
Duck, S. W. (1975). Personality similarity and friendship choices by adolescents. European
Journal of Social Psychology, 37, 621-634.
Elig, T. Y. y Frieze, L. H. (1979). Measuring causal attribution for success and failure. Journal
of Personality and Social Psychology, 37, 621-634.
Epstein, S. (1973). The self-concept revisited: Or a theory of a theory. American Psychologist,
28, 404-416.
Epstein, S. (1980). The self-concept: A review and a proposal of an integrated theory of per-
sonality. En E. Staub (dir.), Personality: Basic issues and current research. Nueva Jersey.
Prentice Hall.
Eysenck, H. J. (1947). Dimensions ofpersonality. Londres. Routledge and Kegan Paul.
Ferxas, G. y Cornejo, J. M. (1992). La técnica de la rejilla. Madrid. TEA.
Fierro, A. (1982). Técnicas de investigación de la personalidad. Salamanca. Instituto de Cien-
cias de la Educación.
Fierro, A. (1983). Elementos cognitivos y otros en el sistema de personalidad. Estudios de
Fischer, S. (1984). Stress and the perception of the control. Londres. LEA.
Fiske, D. W. (1978). Cosmopolitan constructs and provincial observations: Some prescrip-
tions for a cronically ill speciality. En H. London (dir.), Personality: A new look to meta-
theories. Nueva York. Wiley.
Fiske, S. T. y Taylor, S. E. (1991). Social cognition. Nueva York. MacGraw Hill.
Fletcher, ED Danilovics, pS Fernández, G., Peterson, D. y Reeder, G. D. (1986). Attri-
butional complexity: An individual differences measure. Journal of Personality and Social
oa R. y Schulman, B. H. (1979). Personality: A cognitive view. Nueva York. Prentice
all.
Evaluación cognitiva de la personalidad - 875
Eransella, F. y Bannister, D. (1977). A manual for the repertory grid technique. Londres. Aca-
demic Press. ]
EFranzo1,S.L. y Shields, S. A. (1984). The Body Esteem Scale: Multidimensional structure and
sex differences in a college population. Journal of Personality Assessment, 50, 24-31.
Furham, M. (1986). Economic locus of control. Human Relations, 39, 29-43.
Garanto, J. (1984). Las actitudes hacia símismo y su medición. Barcelona. Ediciones Universi-
tarias.
González, M. C. y Tourón, J. (1992). Autoconcepto y rendimiento escolar. Pamplona. Edicio-
nes Universidad de Navarra.
Hamilton, V. L. (1983). The cognitive structures and processes of human motivation and per-
sonality. Nueva York. Wiley and Sons.
Harter, S. (1985). Manual for the Self-Perception Profile. Denver. University of Denver.
Harter, S. (1988). Issues in the assessment of the self-concept of children and adolescents. En
A. La Greca (dir.), Chilhbood assessment: Trough the eyes of a child. Nueva York. Allyn
and Bacon ;
Harter, S. y Connell, J. P. (1984). A model of children's achievement and related self-percep-
tions of competence, control and motivational orientation. Advances in Motivation and
Achievement (vol. 3).
Harter, S. y Pike, R. (1984). The Pictorial Perceived Competence Scale for young children.
Heider, F. (1958). The psychology of interpersonal relations. Nueva York. Wiley.
Helmreich, R., Stapp, J. y Erwin, C. (1974). The Texas Social Behavior Inventory (TSBI): An
objective measure of self-esteem or social competence. JSAS, Catalog of Selected Docu-
ments in Psycholog).
Hensley, W. E. (1977). Differences between males and females on Rosemberg Scale of Self-
Esteem. Psychological Reports, 38, 583-584.
Hensley, W. E. y Roberts, M. K. (1976). Dimensions of Rosemberg's Scale of Self-Esteem.
Psychological Reports, 38, 583-584.
Hill, D. J. y Bale, R. M. (1980). Development of the Mental Health Locus of Control (MHLC)
and Mental Health Locus of Origin (MHLO) Scales. Journal of Personality Assessment, 44,
148-156.
Honess, T. (1978). A comparison of the implication and the repertory grid techniques. Bri-
tish Journal of Psychology, 69, 305-314.
Hutteau, M. (1985). Les conceptions cognitives de la personalité. París. PUF.
Ickes, W. y Layden, M. A. (1978). Attributional styles. En J. H. Harvey, W. S. Ickes y
R. F. Kidd (dirs.), New directions in attributions research (vol. 2). Nueva Jersey. LEA.
James, W. (1890). Principles ofpsychology. Nueva York. Holt.
Janis, 1. S. y Field, P. B. (1959). A behavioral assessment of persuability: Consistency of indi-
vidual differences. En C. 1. Hovland y L. L. Janis (dirs.), Personality and persnability. New
Haven. Yale University Press. Y
Jiménez, A., López, J. y Moreno-Jiménez, B. (1985). La representación cognitiva del mapa
electoral. Estudios de Psicología, 23-24, 99-107.
Johnson, F. (1973). Alienation: Concept, term and word. En F. Johnson (dir.), Alrenation:
Concept term and meanings. Nueva York. Seminar Press. e
Keen, T. R. y Bell, R. (1980). One thing lead to another. A new approach to elicitation in the
repertory grid technique. International Journal Man-Machine Studies [Número mono-
ráfico].
a H. (1967). Attribution theory in social psychology. Nebraska Symposium of Mo-
tivation, 15, 192-238.
Kelley, H. H. (1972). Cansal schemata and the attribution process. Hillsdale. General Lear-
ning Press.
Kelly, G. (1955). The psychology ofpersonal constructs. Nueva York. Norton and Company.
Kendall, P. C. y Braswell, L. (1982). On cognitive behavioral assessment: Model measures

and madness. En C. D. Spielberg y S. N. Butcher (dirs.), Advances in personality assess-
ments. Hillsdale. LEA. 2, AR,
Kendall, P. C. y Hollon, S. D. (1981). Assessment strategies for cognitive behavioral interven-
tions. Nueva York. Academic Press. Fa (2801
Kendall, P. C. y Rogerski, G. P. (1979). Assessment and cognitive behavioral interventions.
Cognitive Therapy and Research, 3, 1-21. 2
Keyson, M. y Janda, L. (1972). The internal-external scale for alcoholism. Manuscrito inédito.
St Luke”s Hospital, Phoenix. beba
Kruglanski, A. Y. (1975). The endogenous-exogenous partition in attribution theory. Psy-
chological Reviero, 82, 387-406. ps
Landau, R. J. y Goldfried, M. R. (1981). The assessment of schemata: A unifiyng framework
for cognitive, behavioral and traditional assessment. En P. C. Kendall y S. D. Hollon
(dirs.), Assessment strategies for cognitive behavioral interventions. Nueva York. Acade-
mic Press.
Landfield, A. W. (1971). Personal constructs systems in psychotherapy. Chicago. Rand Mc-
Nally.
Langer, E. J. (1983). The psychology of control. Beverly Hills. Sage.
Layden, M. A. (1971). Attributional style therapy. En C. Antaki y C. Brewin (dirs.), Attribu-
tions and psychological change. Nueva York. Academic Press.
Lefcourt, H. M. (1976). Locus of control: Current trends in theory and research. Nueva Jer-
sey. LEA.
efóaién H. M. (19814). Research with the locus of control construct (vol. 1). Nueva York.
Academic Press.
Lefcourt, H. M. (19815). The construction and development of the multidimensional-
multiattributional causality scales. En H. M. Lefcourt (dir.), Research with the locus of
control construct (vol 1). Nueva York. Academic Press.
Lefcourt, H. M. (1983). Research with the locus of control construct (vol 2). Nueva York. Aca-
demic Press.
Lefcourt, H. M. (1991). Locus of control. En J. P. Robinson, P. R. Shaver y L. S. Wrightsman
(dirs.), Measures ofpersonality and social psychological attitudes. Nueva York. Academic
Press.
Levenson, H. (1981). Differentiating among internality, powerful others and chance. En
H. M. Lefcourt (dir.), Research with the locus of control construct (vol. 1). Nueva York.
Academic Press.
Lippsitt, L. P. (1958). A self-concept scale for children and its relationship to the children's
form of the MAS. Child Development, 29, 463-469.
Little, B. R. (1968). Factors affecting the use of psychological versus non-psychological cons-
tructs on the rep test. Bulletin of the British Psychological Sociology, 21, 34.
Markus, H. y Nurius, P. (1986). Possible selves. American Psychologist, 41, 954-969.
Markus, H. y Wurf, E. (1987). The dinamic self-concept: A social psychological perspective.
Annual Review of Psychology, 38, 299-337.
Marsh, H. W., Smith, L. D. y Barnes, J. (1983). Multitrait-multimethod analyses of the Self-
Description Questionnaire: Student-teacher agreement on multidimensional ratings of
the self concept. American Education Research Journal, 20, 330-357.
McAdams, D. P. (1994). The person: An introduction to personality psychology. Forth Worth.
Harcourt Brace.
McGuire, W. J. y McGuire, C. V. (1981). The spontaneous self-concept as affected by perso-
nal distinctiveness. Psychology in the Schools, 14, 295-298.
Metalsky, G. I. y Abramson, L. Y. (1980). Attributional styles: Toward a framework for con-
ceptualizations and assessment. En P. C. Kendall y S. D. Hollon (dirs.), Cognitive beha-
vioral interventions: Assessment methods. Nueva York: Academic Press.
Miller, PG Lefcourt, H. M. y Ware, E. E. (1983). The construction and development of the

a Marital Locus of Control Scale. Canadian Journal of Behavioral Science, 15, 266-

Mischel, W. (1973). Toward a cogñitive social learning reconceptualization of personality.
Psychological Review, 80, 252-283.
Mischel, W. (1981). Personality and cognition. En N. Cantor y J. F. Kihlstrom (dirs.), Perso-
nality, cognition and social interaction. Hillsdale. LEA.
Miskimins, R. W. y Braucht, G. (1971). Description of the self. Fort Collins. Rocky Mountain
Behavioral Ins.
Moreno, B. (1984). Complejidad cognitiva y atribución de conducta. Salamanca. Universidad
de Salamanca.
Moreno, B. (1985). La psicología de los constructos personales. Historia, presupuestos y al-
cance de una teoría. Estudios de Psicología, 23-24, 57-65.
Moreno-Jiménez, B. (1986). La heteroatribución: un modelo de estilos atributivos. Boletín de
Moreno- Jiménez, B. (19864). El estrés y los accidentes de tráfico. Documento inédito. Ma-
drid. Universidad Autónoma de Madrid.
Moreno-Jiménez, B. (1986b). Emotion and attribution. Revista de Psicología Social, 1, 71-78.
Moreno-Jiménez, B. (1987). La evaluación cognitiva del Patrón A de conducta: el lugar de
control. Evaluación Psicológica/Psychological Assessment, 3, 79-100.
Nisbett, R. E. y Ross, L. (1980). Human inference: Strategies and shortcoming of social judge-
ment. Englewood. Prentice Hall.
Nowicki, S. y Ducke, M. P. (1974). The locus of control scale for college as well as non colle-
ge adults. Journal of Personality Assessment, 38, 36-137.
Nowicki, S. y Strickland, B. R. (1973). A locus of control scale for children. Journal of Con-
sulting and Clinical Psychology, 40, 148-154.
Osgood, C., Suci, G. J. y Tannenbaum, P. H. (1957). The measurement of meaning. Mlinois.
University of Illinois Press.
Palenzuela, D. (1984). Critical evaluation of locus of control: Toward a reconceptualization
of the construct and its measurement. Psychological Reports, 54, 683-709.
Passini, T. T. y Norman, W. T. (1966). A universal conception of personality structure? Jour-
nal of Personality and Social Psychology, 4, 44-49.
Paulhus, D. L. (1983). Sphere specific measures of perceived control. Journal of Personality
and Social Psychology, 44, 1253-1265.
Pelechano, V. (1985). Cognición y personalidad. Una pareja indisoluble aunque mal avenida.
EnJ. Mayor (dir.), Actividad humana y procesos cognitivos. Madrid. Alhambra.
Pelechano, V. y Báguena, M. J. (19834). Un Cuestionario de Locus of Control (LUCAM).
Análisis yModificación de Conducta, 9, 5-46.
Pelechano, V. y Báguena, M. J. (1983b). El Cuestionario LUCAD: Locus of Control para ni-
ños y adolescentes. Análisis y Modificación de Conducta, 9, 349-392.
Peplau, L. A. y Perlman, D. (1982). Loneliness: A current source book of theory, research and
therapy. Nueva York. Wiley.
Pérez García, A. (1984). Dimensionalidad del constructo locus of control. Revista de Psicolo-
gía General y Aplicada, 39, 471-485.
Peterson, C., Semmel, A., Von Baeyer, C., Abramson, L. Y., Metalsky, G. Y. y Seligman, M.
(1982). The attributional Style Questionnaire. Cognitive Therapy and Research, 6, 287-
O
Petterson, N. (1985). Specific ws. generalized locus of control scales related to job satisfaction.
Psychological Reports, 56, 60-62. de quis
Phares, E. J. (1955). Changes in expectancy in skill and chance in situations. Tesis doctoral
inédita. Ohio State University, Columbus.
Phares, E. J. (1976). Locus of control in personality. Nueva Jersey. General Learning Press.
Piers, E. V. (1984). Piers-Harris Children's Self Concept Scale: Revised manual. Los Ángeles.
Western Psychological Services. :
Reid, D. W. y Ziegler, M. (1981). The desidered control measure and ajustement among the
elderly. En H. M. Lefcourt (dir.), Research with the locus of control construct (vol. 1).
Revelle, W. (1995). Personality processes. Annual Review of Psychology, 46, 295-328.
Reynolds, W. M., Ramírez, M. P., Magriña, A. y Allen, J. E. (1980). Initial development and
validation of the Academic Self-Concept Scale. Educational and Psychological Measure-
ment, 40, 1013-1016.
Richtie, D. E. y Phares, E. J. (1969). Attitude change as a function of internal-external control
and comunicator status. Journal of Personality, 37, 429-443. SN
Rivas, F. (1981). La rejilla como técnica psicométrica de medida de la ejecución típica indivi-
dual. Análisis y Modificación de Conducta, 15, 171-246.
Roid, G. H. y Fitts, W. H. (1988). Tennesse Self-Concept. Los Ángeles. Western Psychologi-
cal Services.
Rose, J. S. y Medway, F. J. (1981). Measurement of teachers” beliefs in their control over stu-
dent outcome. Journal of Educational Research, 74, 185-190.
Rosemberg, M. (1965). Society and the adolescent self-image. Princeton. Princeton Univer-
sity Press.
RObEE M. (1986). Self-concept from middle childhood through adolescence. En J. Suls
y A. Greenwald (dirs.), Psychological perspectives on the self (vol. 3). Hillsdale. Lawrence
Erlbaum.
Rosemberg, M. y Simmons, R. G. (1972). Black and white self-esteem: The urban school
child. Washington. American Sociological Association.
Rotter, J. B. (1954). Social learning and clinical psychology. Nueva York. Prentice Hall.
Rotter, J. B. (1966). Generalized expectancies for internal vs. external control of reinforce-
ment. Psychological Monographs, 80, 609.
Rotter, J. B. (1967). A new scale for the measurement of interpersonal trust. Journal of Perso-
nality, 35, 651-665.
Rotter, J. B. (1975). Some problems and misconceptions related to the constructs of internal
vs. external control of reinforcement. Journal of Consulting and Clinical Psychology, 48,
56-67.
Rotter, J. B. (1982). Social learning theory. En N. T. Feather (dir.), Expectations and action.
Hillsdale. Erlbaum.
Rotter,J.B. y Hochreich, D. J. (1975). Personality. Glenview. Scott, Foresman.
Russell, L. (1982). The causal dimensions scale: a measure of how individual perceive causes.
Journal of Personality and Social Psychology, 42, 1137-1145.
Ryden, M. B. (1978). An adult version of the Coopersmith Self-Esteem Inventory: Test, re-
test, reliability and social desirability. Psychological Reports, 43, 1189-1190.
Ryle, A. y Lunghi, M. W. (1970). The dyad grid: A modification of repertory grid technique.
British Journal of Psychiatry, 117, 323-327.
Saltzer, E. B. (1982). The Weight Locus of Control (WLOC) Scale: A specific measure for obe-
sity research. Journal of Personality Assessment, 46, 620-628.
Savin-Williams, R. C. y Jacquish, G. A. (1981). The assessment of adolescent self-esteem:
A comparison of methods. Journal of Personality, 49, 324-335.
Schantz, C. U. (1975). The development of social cognition. En E. M. Hetherington (dir.),
Review of Child Development Research (vol. 5). Chicago. University of Chicago.
Schneider, J. M. (1972). Relationships between locus of control and activity preferences.
Seeman, M. (1963). Alienation and social learning in a reformatory. American Journal of So-
ciology, 69, 270-284.
Seeman, M. y Evans, J. W. (1962). Alienation and learning in a hospital setting. American So-
ciological Review, 27, 772-783.
Seligman, M. (1995). The optimistic child. Hougthon. Mifflin.
Seligman, M., Abramson, L. Y., Semmel, A. y Von Baeyer, C. (1979). Depressive attributio-
nal style. Journal ofAbnormal Psychology, 88, 242-247.
Sharauger, J. S. (1990). Self-Confidence: Its conceptualization, measurement, and behavior
implications. Buffalo. Sunny.
A M. L. G. (1981). Recent advances in personal construct technology. Londres. Academic
ress.
Simpson, C. K. y Boyal, D. (1975). Esteem construct generality and academic performance.
Educational and Psychological Measurement, 35, 897-907.
Skinner, E. A. (1995). Perceived control, motivation and coping. Londres. Sage.
Slater, P. (1977). Dimensions of intrapersonal space (vol. 2). Londres. Wiley.
Snyder, M. L. (1979). Self-monitoring processes. En L. Berkowitz (dir.), Advances in experi-
mental social psychology. Nueva York. Academic Press.
Soares, A. T. y Soares, L. M. (1979). The affective perception inventory-advanced level,
Trumbell. Also.
Stephenson, W. (1953). The study of behavior, Q technique and its methodology. Chicago.
Strickland, B. R. (1978). Internal-external expectancies and health-related behavior. Journal
of Consulting and Clinical Psychology, 46, 1192-1211.
Tennembam, G., Furst, D. y Weingarten, G. (1984). Attribution of causality in sport events.
Validation of the Wingate Sport Achievement Responsability Scale. Journal of Sport Psy-
chology, 6, 430-439.
Tolor, A. (1978). Some antecedents and personality correlates of health locus of control. Psy-
chological Reports, 43, 1159-1165.
Tversky, A. y Kahneman, D. (1974). Judgement under uncertainty: Heuristics and biases.
Science, 184, 1124-1131
Vacc, N. A. (1980). Further development of the adapted modified role repertory test. Measu-
rement and Evaluation in Guidance, 12, 216-222.
Wallston, K. A., Wallston, B. S. y Devellis, R. (1978). Development of the multidimensional
health locus of control scales. Health Education Monograpbs, 6, 161-170.
Weiner, B. (1971). Perceiving the canses of success and failure. Hillsdale. General Learning
Press:
Weiner, B. (1974). Achievement motivation and attribution theory. Hillsdale. General Lear-
ning Press.
Weiner, B. (1978). Affective consequences of causal ascriptions. En J. Harvey, W. J. Ickes y
R. F. Kidd (dirs.), New directions in attribution research (vol. 2). Hillsdale. LEA.
Weiner, B. (1990). Attribution processes in personality. En L. A. Pervin (dir.), Handbook of
personality. Theory and research. Nueva York. Academic Press.
Wells, L. E. y Marwell, G. (1976). Self-esteem: Its conceptualization and measurement. Be-
verly Hills. Sage Publications.
Wiggins, J. S. (1971). The psychology of personality. Massachusetts. Addison Wesley.
Wimer, S. y Kelley, H. H. (1982). An investigation of the dimensions of causal attributions.
Journal of Personality and Social Psychology, 43, 6, 1142-1162.
Wylie, R. C. (1961). The self-concept. Lincoln. University of Nebraska Press.
Wylie, R. C. (1974). The self-concept (vol. 1). Lincoln. University of Nebraska Press.
Zuckerman, M. (1979). Attribution of success and failure revisited or the motivational bias 1
alive and well in attribution theory. Journal of Personality, 47, 245-287.
Zumalabe, J. M. (1990). La psicología de la personalidad y las teorías cognitivas y del procesa-
miento de la información. Revista de Psicología General yAplicada, 43, 225-231.
Avia, M. D. y Sánchez, M. L. (1995). Personalidad: aspectos cognitivos y sociales. Madrid. Pi-

rámide.
Belloch, A. y Báguena, M. J. (1986). Dimensiones cognitivas, actitudinales y sociales de la per-
sonalidad. Valencia. Promolibro.
Cantor, N. y Kihlstrom, J. F. (1981). Personality, cognition and social interaction. Hillsdale.
EAS
Fierro, A. (1983). Elementos cognitivos y otros en el sistema de personalidad. Estudios de
Moreno-Jiménez, B. (1987). La evaluación cognitiva del Patrón A de conducta: el lugar de
control. Evaluación Psicológica/Psychological Assessment, 3, 79-100.
35. EVALUACIÓN DE LAS ACTITUDES
FÉLIX NETO y J. CARLOS SIERRA
I. INTRODUCCIÓN
Las técnicas de evaluación psicológica tienen como objetivo la recogida de informa-

ción sobre las características de las personas evaluadas. Estas características pueden
ser directamente observables, como por ejemplo el peso, la altura o el color de la piel;
en este caso, el instrumento de evaluación puede ser el mero registro de los resulta-
dos de las observaciones. Pero, en otras situaciones más complejas, las características
no son directamente observables, por lo que la información recogida por medio del
instrumento de evaluación es utilizada para inferir las particularidades de las perso-
nas; la inteligencia, la introversión y la ansiedad constituyen ejemplos de estas carac-
terísticas. La gran mayoría de los instrumentos de evaluación psicológica describe
características que encajan en esta última categoría.
El concepto particular de actitud es un constructo y, como tal, nos permite cono-
cer la consistencia de lo que las personas dicen, piensan o hacen, de forma que dadas
determinadas conductas se pueden predecir otras futuras. La actitud no es algo sus-
ceptible de ser evaluado de la misma forma que registramos la tasa cardíaca, por
ejemplo. Solamente se puede inferir que una persona tiene determinadas actitudes a
través de sus palabras y acciones; ello hace que no sea una tarea sencilla. Cuando in-
tentamos evaluar una actitud compleja nos encontramos que presenta múltiples fa-
cetas y manifestaciones; así por ejemplo, las actitudes escolares incluyen los senti-
mientos y las creencias sobre los profesores, los compañeros, las materias estudiadas,
las actividades, la productividad, la atención, etc. El concepto de actitud ocupa un lu-
gar destacado en la historia de la psicología social. Al menos durante la primera mi-
tad de este siglo fue uno de los principales focos de atención, tanto de sociólogos
como de psicólogos. En 1918, los sociólogos Thomas y Znaniecki incluyen el con-
cepto de actitud dentro de su disciplina; Allport se refiere a la actitud como la «pie-
dra angular» en el crecimiento de la psicología social. En la segunda mitad del s1-
glo XX este interés no decrece, y así de 1970 a 1979 se contabilizan más de verte mil
artículos o libros en los que aparece el término “actitud” en el Psychological Abs-
tracts (Dawes y Smith, 1985).
A pesar de la falta de acuerdo con respecto a determinados aspectos, el estudio de
las actitudes todavía es de interés en la actualidad para los investigadores en las cien-
cias sociales y humanas, e incluso para otros grupos de profesionales; los políticos se
interesan por conocer sus índices de popularidad; los industriales, las preferencias de
la población con respecto a sus productos, etc. Dada la ubicuidad y frecuencia del
concepto de actitud en la vida cotidiana, y que todo individuo, grupo o colectividad
Universidad de Oporto (Portugal) y Universidad de Granada.

882 Félix Neto y J. Carlos Sierra
muestra actitudes con mayor o menor compromiso con respecto a otro individuo u
otro grupo, es comprensible la importancia que tiene el conocimiento objetivo de las
actitudes, la previsión de su evolución y, si es posible, su modificación, A l
El término actitud, derivado de la palabra latina aptitudo, que significa disposi-
ción natural para realizar determinadas tareas, hacía referencia a la posición corporal
del modelo de los pintores italianos del renacimiento. Por medio de determinada
posición corporal se expresaba un sentimiento o un deseo. Así, la actitud adquiere
un significado susceptible de ser comprendido por otras personas. Según Kahale
(1984), la introducción del término actitud en la literatura científica se debe a Dar-
win en su libro Expression of the emotions in man and animals publicado en 1872.
Para Darwin este concepto implica respuestas motoras estereotipadas asociadas a la
expresión de una emoción, y que hacen referencia a la postura de todo el cuerpo; las
actitudes se desarrollarían para el restablecimiento del equilibrio. El término actitud
aparece relativamente pronto en la psicología experimental con el alemán Oswald
Kulpe. A principios de siglo, Kulpe habla de que las personas ante una misma esti-
mulación responden de forma diferente según la orientación de su percepción; por
tanto, la actitud permitirá explicar la relación fluctuante entre estímulo y respuesta.
La introducción del concepto de actitud en la literatura sociológica es atribuida a
Thomas y Znaniecki en 1918 con el estudio de los problemas con los que se enfren-
taban los emigrantes polacos en Estados Unidos. Estos autores utilizaron el concep-
to de actitud para referirse al sentimiento mostrado por las personas hacia algún ob-
jeto, como el dinero o el trabajo. Este énfasis en los aspectos psicológicos tuvo un
importante efecto en las ciencias sociales; la mayor parte de los psicólogos sociales
adoptó el constructo de actitud para referirse a acontecimientos mentales. Subya-
cente a la popularidad suscitada por la noción de actitud parece estar la suposición de
muchos psicólogos sociales de que las actitudes son «comportamientos en miniatu-
ra». De esta forma, para poder predecir un determinado comportamiento lo que ha-
bría que hacer es determinar la actitud de las personas hacia el objetivo del compor-
tamiento. Así, surge el problema metodológico, pues era necesario elaborar
instrumentos adecuados para la evaluación de las actitudes; este supuesto contribuye
al incremento de la literatura en la década de los años treinta.
McGuire (1985) señala tres períodos en el estudio de las actitudes. El primero,
correspondiente a los años treinta, se centra en la evaluación de las actitudes; en el se-
gundo período, durante los años cincuenta y sesenta, se desarrolla la mayor parte de
las teorías sobre el cambio de las actitudes; por último, el tercer período está en curso
y se focaliza en los sistemas actitudinales.
Il. DEFINICIÓN DE ACTITUD
111. Definiciones
Las definiciones de las actitudes son casi tan numerosas como los autores que se de-
dican a su estudio. En la revisión de Dawes y Smith (1985) sobre la evaluación de las
actitudes y de la opinión se concluye que en la actualidad existe tanta controversia en
Evaluación de las actitudes 883
su definición como cuando se propuso por primera vez. La diversidad de definicio-

nes deja entrever que este concepto es una realidad psicosocial ambigua y difícil de
estudiar. No obstante, a pesar de esta diversidad, la mayoría de las definiciones de ac-
titud puede agruparse en tres apartados diferentes (Olson y Zanna, 1993).
Una de las orientaciones en el estudio de las actitudes considera a éstas como una
evaluación o reacción emocional. Fishbein (1963) define la actitud como un afecto
positivo o negativo en relación a algún objeto. Una definición semejante había sido
utilizada años atrás por Thurstone (1928), quien define la actitud como la intensidad
de afecto a favor o en contra de un objeto psicológico. Por ejemplo, para esta orien-
tación la actitud en relación al aborto sería definida por la respuesta afectiva hacia el
aborto. Otros autores adoptaron una posición más compleja, concibiendo la actitud
como una prontitud o rapidez para responder de una manera particular con respecto
al objeto de la actitud. Allport (1935) afirma que la actitud es una disposición mental
o neurológica de preparación para la acción que se organiza mediante la experiencia,
y que ejerce una influencia directiva o dinámica sobre la respuesta del individuo a to-
dos los objetos y a todas las situaciones con las que se relaciona. Finalmente, un ter-
cer grupo, constituido fundamentalmente por teóricos con una orientación cogniti-
va, propone un esquema tripartito todavía más complicado. La actitud englobaría
tres componentes: afectivo, cognitivo y conductual (McGuire, 1985). El componen-
te afectivo se refiere a los sentimientos subjetivos y a las respuestas fisiológicas que
acompañan a la actitud; el componente cognitivo hace referencia a las creencias y
opiniones a través de las que la actitud se expresa, no teniendo por qué ser conscien-
tes; y el componente conductual se refiere al proceso mental o físico que prepara al
individuo a actuar de una determinada forma (Eagly y Chaiken, 1992). Este esque-
ma tripartito puede verse en el cuadro 35.1.
La forma de interrelación entre cada uno de estos componentes no está nada
clara. En muchas ocasiones la presencia de un componente implica la presencia de
los otros. Supongamos que su actitud en relación a la caza de las ballenas es extre-
madamente negativa, y que se encuentra en una ocasión con un cazador de ballenas
que le relata sus experiencias. Usted puede sentir repulsa hacia esa persona (compo-
nente afectivo), tener diferentes opiniones negativas con respecto al cazador (com-
ponente cognitivo) e intentar desligarse de la conversación con esa persona (compo-
nente conductual). Investigaciones recientes demostraron que cada componente
puede contribuir de forma particular al concepto de actitud. Breckler (1984) evaluó
las contribuciones independientes de los tres componentes (afectivo, cognitivo y
conductual) en relación a las serpientes. Registró el ritmo cardíaco y las emociones
de las personas en presencia de una serpiente (componente afectivo) y sus creencias
favorables o desfavorables acerca de estos animales (componente cognitivo). Se en-
contró que cada componente, aun estando relacionado de forma moderada con el
otro, tiene una contribución importante y distinta al constructo que denominamos
actitud. En definitiva, la actitud es una variable latente, que se manifiesta externa-
mente por medio de expresiones verbales o no verbales, opiniones y comporta-
mientos.
Frecuentemente, se encuentra en la literatura el concepto de opinión como algo
más específico que la actitud (Aiken, 1985). Allport (1935) define cuatro conceptos
(opinión, actitud, interés y valor) a lo largo de un mismo continuo, yendo de lo más
CUADRO 35.1. Modelo tripartito de las actitudes
ESTÍMULO
Individuos, acontecimientos sociales, grupos
sociales, objetos
ACTITUD
AFECTO COMPORTAMIENTO COGNICIÓN
Respuestas del Acciones Respuestas

sistema nervioso perceptivas
simpático Afirmaciones
verbales sobre Afirmaciones
Afirmaciones el comportamiento verbales de
verbales de afecto creencias
específico a lo más general. Por su parte, Alexandre (1971), con el objetivo de estable-
cer las relaciones entre opiniones y actitudes, distingue dos niveles: nivel genotípico y
nivel fenotípico. El nivel genotípico comprende las actitudes que actuarían como cau-
sas; el nivel fenotípico se manifestaría, de modo privilegiado, pero no exclusivo, a tra-
vés del estudio de las opiniones o comportamientos verbales que serían los efectos.
Eysenck (1954) ya distinguía cuatro niveles: la opinión accidental, la opinión habi-
tual, la actitud y la ideología. La opinión accidental no es una característica del indivi-
duo (una persona puede afirmar hoy algo y al día siguiente lo contrario). La opinión
habitual, relativamente constante, es una característica del individuo (una persona pa-
triótica se comporta siempre del mismo modo cuando su país es criticado). La actitud
como conjunto de opiniones estables interrelacionadas hace referencia a un compo-
nente importante de la personalidad. Finalmente, el nivel de la ideología alude a la in-
terdependencia de las actitudes. De una persona que manifiesta una actitud etnocén-
trica, un modo severo de educar a sus hijos, actitudes prorreligiosas y un gran
patriotismo, se puede decir que posee una personalidad de tipo conservador.
112. Características
Los objetos de las actitudes pueden ser muy diversos; puede tratarse de objetos con-
cretos (caderas, casas, coches deportivos...), personas (padres, presidente del gobier-
no, profesores...) grupos (socialistas, esquimales...), ideas abstractas (democracia,
Justicia, tolerancia...) o comportamientos (beber, fumar, preferencias sexuales...). La
actitud como realidad psicológica posee determinadas características propias de las

realidades físicas. Puede ser considerada como un continuo psíquico, o sea, una enti-
dad que tiene un comienzo y un final, pasando de uno a otro por medio de variacio-
nes de grado. En este continuo resaltan tres características: la dirección, la intensidad
y la dimensión. La dirección designa el nivel positivo o negativo del objeto de la acti-
tud. En relación a este objeto el sujeto puede sentir atracción o rechazo. Por ejem-
plo, «¿Estamos a favor o en contra de una plantación de eucaliptos?». La dirección
muestra la concordancia o discordancia con respecto a la plantación de eucaliptos.
Sin embargo, el sujeto puede ser indiferente a esa cuestión. Esta respuesta, ¿sería
considerada una actitud? Este problema que se plantea es resuelto con la segunda ca-
racterística de la actitud: la intensidad. En este caso, las diferentes posiciones de los
sujetos se expresarían en un continuo que oscila entre dos extremos (favorable y des-
favorable) con un punto intermedio, es decir, desacuerdo total, desacuerdo, indife-
rente, acuerdo y acuerdo total. La intensidad de la actitud hace referencia a la fuerza
de atracción o de repulsa hacia el objeto. Así, se puede manifestar una oposición to-
tal a la plantación de eucaliptos o una oposición ligera. La intensidad se puede repre-
sentar por una escala con los siguientes calificativos: neutral, levemente, moderada-
mente y fuertemente. Por último, la dimensión de la actitud nos permite conocer si
se trata de un objeto complejo que no está bien definido. Así, una actitud puede ser
unidimensional si abarca un solo dominio de la actividad conductual y multidimen-
sional si incluye varios dominios. La dirección, los grados y la dimensión permiten
caracterizar una actitud sin tener que definirla como hemos visto anteriormente.
Así, Debaty (1967) define la actitud como un síndrome resultado de diferentes sín-
tomas manifiestos que son las opiniones verbales o no verbales de un sujeto con res-
pecto a un objeto definido.
Los psicólogos sociales no se limitan a conocer las actitudes, sino que intentan
evaluarlas —evaluar su dirección e intensidad— lo cual permitirá efectuar compara-
ciones entre los individuos y los grupos. La evaluación de las actitudes se realiza fun-
damentalmente, aunque no exclusivamente, por medio de las escalas de actitudes
(Aiken, 1985; Olson y Zanna, 1993). Una escala de actitud permite situar a los indivi-
duos en diferentes posiciones que representan grados o tipos de determinadas actitudes.
II. LAS ESCALAS DE ACTITUDES

ma. Definición
El estudio de las actitudes se puede hacer al menos en dos niveles. En primer lugar, se
puede pedir al propio sujeto que evalúe el grado de intensidad de sus actitudes; se
trata de una aproximación que se asemeja a la introspección. Por ejemplo, se solicita
a la persona: ¿Qué piensa de...? Esta forma de proceder presenta la ventaja de ser
simple y fácil de aplicar, siendo su principal problema la subjetividad. La validez de
la medida depende totalmente de la evaluación de la persona, pudiendo existir ries-
gos de deformación. El primer riesgo puede ser resultado de la falta de sinceridad
voluntaria por parte del sujeto; el segundo es que la apreciación subjetiva del sujeto
886 Félix Neto y J.Carlos Sierra
no se refiere a un patrón objetivo. Así, puede acontecer que dos sujetos se sitúen
subjetivamente en dos lugares diferentes de la escala, a pesar de que sus actitudes
presenten el mismo grado de intensidad. Los psicólogos sociales intentaron cons-
truir instrumentos de medida más fiables que superaran estas dificultades.
Las escalas de actitudes pueden ser consideradas como la respuesta técnica a las si-
guientes cuestiones: ¿cómo probar de modo objetivo la existencia de actitudes siéstas
son variables inferidas, esto es, no directamente observables?, y ¿cómo determinar la
dirección y la intensidad de una actitud? Sólo se habla de actitud cuando se puede ob-
servar una coherencia lógica en una serie de respuestas o cuestiones puntuales. Se
puede pensar que cuando nos encontramos ante una relación lógica entre opiniones,
éstas son la expresión de una misma variable subyacente. Por tanto, las actitudes van a
ser evaluadas a partir de opiniones lógicamente ordenadas, lo cual constituye una es-
cala de actitud. Para Michelat y Thomas (1966) una escala de actitud es una serie de
cuestiones cuyas respuestas permiten clasificar el conjunto de la población estudiada
en función de la actitud evaluada, desde el grado más bajo hasta el más alto. Una esca-
la de actitud se presenta como un tipo de cuestionario particular, que muestra en cada
cuestión una opinión sobre la que el sujeto se debe pronunciar.
Ejemplos:
— Por naturaleza, los hombres están más capacitados que las mujeres en el cam-
po de las finanzas.
Sí/ No / Sin opinión
— Parece ser una ley de la naturaleza el hecho de que los hombres dominen y
que las mujeres sean totalmente dependientes.
Sí/ No / Sin opinión
— Por naturaleza, las mujeres están menos capacitadas que los hombres en pen-
samiento lógico y científico.
Sí/ No / Sin opinión.
Si una persona del sexo masculino aceptara en conjunto estas afirmaciones po-
dríamos decir que la coherencia de sus elecciones se explicaría por una actitud par-
ticular en relación a las mujeres: una actitud falocrática.
El principio general de las escalas de actitudes es presentar al sujeto una serie de
proposiciones, denominadas preguntas o cuestiones, pidiéndole que indique cuál
aprueba y cuál desaprueba. Estas respuestas serán combinadas, y su resultado deter-
minará la intensidad de la actitud del sujeto. Un problema que se presenta es el de la
construcción inicial de la escala de forma que nos proporcione resultados válidos.
Este aspecto será tratado en el apartado siguiente para cada una de las escalas de acti-
tudes más usuales. Veamos antes la clasificación de las escalas.
uL2. Clasificación de las escalas de actitudes

Una medida consiste en hacer corresponder a datos cualitativos valores cuantitati-
vos. De forma general, una medida exige la definición de una unidad de medida. Por
tanto, medir consiste en contabilizar las unidades presentes en los datos. Por ejem-
plo, es más fácil que no exista riesgo de confusión cuando se dice «Pesa 90 kilogra-
mos» que cuando se afirma «Es un hombre gordo». Existen numerosos tipos de es-
calas que se pueden clasificar en función del nivel de precisión que permiten obtener
en la medida. Estos tipos son por orden creciente de precisión las escalas nominales,
las ordinales, las de intervalo y las de razón.
111.2.1.. Escalas nominales
Son las escalas más elementales, correspondiéndose con el nivel de medida menos
preciso. Permiten una distribución en clases de las observaciones en función de cri-
terios propios a cada una de ellas. Las categorías socioprofesionales no jerarquizadas
constituyen un ejemplo de escala nominal; otro ejemplo sería el sexo.
Ejemplo de escala de evaluación nominal:
¿Cuál es el sexo de su último hijo?
MasculOroen tas des 1

Femenm md li 2
Otro ejemplo es la clasificación de una población en tres categorías en función de

que los sujetos estén de acuerdo, en desacuerdo o sin opinión en relación a una de-
terminada opinión. El tipo de evaluación que se puede realizar con estas escalas con-
siste fundamentalmente en contar los efectivos de cada clase. Este tipo de escalas es
raramente utilizado en la evaluación de las actitudes.
111.2.2.. Escalas ordinales
Una escala ordinal se caracteriza por la existencia de una relación de orden en dife-
rentes clases. La relación de orden permite colocar las diferentes clases en un conti-
nuo. El estatus económico de una persona (alto, medio o bajo) es un ejemplo de una
medida ordinal. La medida consistente en que una persona esté totalmente de acuer-
do con una afirmación, de acuerdo, en desacuerdo o totalmente en desacuerdo es
considerada por algunos autores como una medida ordinal; para otros constituye
una medida de intervalos.
Ejemplo de una escala de evaluación ordinal:
¿Cuál es su niwel educativo más alto?
SERANZADIIIIANION atanas con cios 1

Enseñanza secundariA ..ooomnonionennocionnos de
Enseñanza UNtVEYISILATIA coocccccccnnccnananass So)
Este tipo de escalas ha sido ampliamente utilizado para evaluar actitudes. Vere-
mos más adelante las escalas de Bogardus, de Likert y de Guttman, las cuales pueden
ser consideradas escalas ordinales.
112.3. Escalas de intervalos
En las escalas de intervalos, además de ordenar las categorías, se evalúan las distan-
cias que las separan. El rendimiento anual puede constituir un ejemplo de este tipo
de escala. Las 200 000 pesetas de diferencia entre un millón y un millón doscientas
mil por año significan lo mismo en la diferencia entre dos millones y dos millones
doscientas mil pesetas por año. Sin embargo, si se tiene un ingreso de dos millones de
pesetas no significa automáticamente que uno es dos veces más rico que una persona
que tiene unos ingresos de un millón, pues intervienen muchas variables (número de
personas en la familia, alquiler de la casa...); por ello, hay que ser cautelosos a la hora
de considerar este tipo de escalas.
Ejemplo de escala de evaluación de intervalos:
¿Cuánto estaría dispuesto a pagar por una casa?
De siete millones quinientas mil a diez millones de pesetas

De diez millones a doce millones quinientas mil pesetas
De doce millones quinientas mil a quince millones de pesetas
Nit
>
A El dinero no tiene importancia
La Escala de Thurstone, estudiada más adelante, pertenece a este tipo de escalas.
111.2.4. Las escalas de razón
También se denominan escalas proporcionales. Además de poseer todas las propie-

dades de las escalas anteriores, su punto de partida es absoluto, lo cual permite colo-
car todos sus valores en relación, siendo por tanto las primeras escalas de las que se
conocen las relaciones entre los valores. La altura y el peso son ejemplos de este tipo
de medida. Si usted pesa 60 kilogramos y su compañero 120, su compañero pesa dos
veces más que usted.
Ejemplo de escala de evaluación de razón:
¿Cuánto pesaba en el último control que se hizo?
Peso en kilogramos
El uso de las escalas de razón es infrecuente en psicología, utilizándose eventual-
mente en psicofísica.
IV. MÉTODOS CLÁSICOS DE CONSTRUCCIÓN DE ESCALAS DE ACTITUDES
En este apartado se describirán cinco tipos de escalas de actitudes: Escala de distan-

cia social, Escala de intervalos aparentemente iguales, Escala de Likert, Escala de
Guttman y el Diferencial semántico. Una escala de actitud da lugar a una sola pun-
tuación que indica simultáneamente la dirección y la intensidad de la actitud de la
"persona; no obstante, algunas escalas dan lugar a puntuaciones en diferentes subes-
calas. Por ejemplo, para evaluar las actitudes en relación a la culturización se pueden
incluir cuestiones referidas a la integración, asimilación, separación y marginación
(Neto, 19934); para evaluar las actitudes con respecto al amor se pueden obtener
hasta seis puntuaciones: eros (apasionado y amor romático), ludus (juegos de amor),
storge (amor basado en la amistad), pragma (amor práctico), manía (amor posesivo y
amor dependiente) y agape (amor altruista) (Neto, 19935).
IvV.1. Escala de distancia social
Esta escala fue propuesta por Bogardus en 1925 con el fin de evaluar las actitudes ét-
nicas, siendo revisada en 1933. Este instrumento evalúa el grado de distancia que una
persona desea mantener en las relaciones con personas de otros grupos. La escala se
presenta en forma de un cuadro o tabla de doble entrada, teniendo como abscisa el
nombre de diferentes grupos humanos (estadounidenses, canadienses, franceses...).
A estos grupos se les pueden sumar grupos raciales, grupos culturales, comunidades
religiosas, etc.; incluso, a veces, se incluyen grupos imaginarios (por ejemplo, brom-
binianos) para estudiar las relaciones entre ignorancia y ansiedad. En el eje de orde-
nadas aparecen siete proposiciones que caracterizan el tipo de relaciones que el suje-
to desearía tener con personas pertenecientes a esos grupos.
Ejemplo de preguntas de la Escala de distancia social para la evaluación de acti-
tudes:
Según mis primeras reacciones aceptaría personas de raza negra (como una cate-
goría, sin considerar ni los mejores miembros que he conocido ni los peores) para una
o más de las siguientes situaciones:
parentesco próximo por medio de casamiento

miembro de mi club de amigos personales
vecino de mi calle
empleado en mi lugar de trabajo
ciudadano de mi país
solamente como visitante de mi país
lo excluiría de mi país MA
NO
hn
Los números colocados a la derecha indican el grado de distancia social que re-
presenta cada proposición; cuanto mayor sea el número, mayor será la distancia so-
cial. Diversos aspectos de esta escala han sido criticados, en particular la cuestionable
linealidad de la escala y sus intervalos desiguales. Para algunos sujetos, la admisión
en el local de trabajo significa una mayor proximidad que la admisión como vecino,
lo cual exigiría un orden de grados. En relación a la suposición de la igualdad de la
distancia entre los puntos de la escala, no es evidente, por ejemplo, que la distancia
entre 2 y 3 sea equivalente a la distancia entre 5 y 6.
1v2. Escala de Thurstone
Thurstone (1928) defendió la existencia de un continuo psicológico de afecto a lo

largo del que se pueden situar los individuos. Este continuo tendría las mismas pro-
piedades básicas que un continuo físico de pesos. Basándose en este supuesto,
Thurstone intentó desarrollar una técnica para localizar a los individuos a lo largo de
este continuo. De las diferentes escalas desarrolladas por Thurstone, la más amplia-
mente utilizada es la Escala de intervalos aparentemente iguales. La elaboración de
esta escala se resume en los siguientes pasos:
A. Obtención de un determinado número de cuestiones relacionadas con el ob-

jeto de la actitud (cerca de cien).
b. Las preguntas son evaluadas por un conjunto de jueces con características si-
milares a las de las personas que servirán de sujetos.
Se pide a los jueces que ordenen las preguntas en once categorías desde la
más favorable (1), pasando por la neutra (6), hasta la más desfavorable (11).
Se seleccionan las preguntas que son ordenadas por los jueces en las mismas
categorías, mientras que aquellas en las que los jueces muestran desacuerdo
son eliminadas.
A cada una de las cuestiones se le atribuye un valor en la escala, el cual se
corresponde con la mediana de la distribución de respuestas dadas por los
jueces.
Se selecciona un cierto número de proposiciones (normalmente, se escogen
cerca de veinte), de forma que quede representada la extensión de los valores
de la escala a lo largo de la dimensión favorable-desfavorable, existiendo in-
tervalos aproximadamente iguales entre los pares de valores adyacentes de la
escala.
Se presentan a una población las preguntas seleccionadas en orden aleatorio,
pidiendo a los sujetos que escojan aquellas con las que estén de acuerdo.
La actitud del sujeto se determinará por medio del cálculo de los valores me-
dios de las puntuaciones en la escala de las cuestiones seleccionadas. Por eso,
en el análisis final la actitud de un sujeto estará representada por un número
entre l y dl.
A continuación se presentan algunas preguntas de una Escala de Thurstone para

evaluar las actitudes en relación a las personas negras.
(1,7) 1. Nose debería autorizar a los negros a asociarse con los blancos de nin-
guna forma.
(4,3) 2... El negro debería disfrutar de libertad, pero nunca debería ser tratado
igual que un blanco.
(7,3) 3. No se puede condenar la totalidad de la raza negra como consecuen-
cia de las acciones de algunos de sus miembros.
(10,3) 4. Considero que el negro merece los mismos privilegios sociales que los
blancos.
Los sujetos deben señalar las preguntas con las que están de acuerdo. Los nú-
meros entre paréntesis indican los valores de la escala atribuidos a las preguntas a
partir de las evaluaciones de los jueces. Estos números no aparecen actualmente en
los cuestionarios que se entregan a los sujetos. Cada cuestión proporciona al sujeto
la alternativa de estar de acuerdo o en desacuerdo, y cada punto en la escala repre-
senta una puntuación. Las puntuaciones de las preguntas seleccionadas por el suje-
to dan lugar a una medida de la actitud de una persona en relación a las personas
negras.
La Escala de intervalos aparentemente iguales presenta algunas dificultades.
En primer lugar, la preparación de la escala es complicada, habiéndose encon-
trado resultados muy similares utilizando técnicas menos complejas que la Es-
cala de Thurstone. En segundo lugar, puede haber una distancia relativamente
grande entre el conjunto de jueces o informadores y la población a la que se
administra la escala. Generalmente, el grupo de jueces está constituido por inte-
lectuales, pudiendo ser su comprensión de las preguntas sustancialmente dife-
rente a la de otro grupo de población. En tercer lugar, Thurstone partió de la
idea de que los jueces ordenan las afirmaciones o proposiciones independiente-
mente de sus actitudes, habiéndose comprobado lo contrario. Mientras que las
investigaciones iniciales indicaban que las actitudes de los jueces no afectaban al
orden de las afirmaciones, otros estudios no van en esta dirección; así, Hovland
y Sherif (1952) encontraron que los jueces con actitudes personales extremas
ordenaban un mayor porcentaje de proposiciones en una determinada categoría,
contaminando la escala.
Iv3. Escala de Likert
En la Escala de Thurstone las afirmaciones representan una serie graduada de puntos

en un continuo, y el sujeto selecciona entre dos respuestas una de ellas (acuerdo-
desacuerdo). En la Escala de Likert la situación se invierte: las afirmaciones repre-
sentan las dos categorías generales “favorable” o “desfavorable”, y el sujeto indica el
grado de acuerdo seleccionando una de ellas en una serie graduada de cinco puntos
desde “acuerdo total” hasta “desacuerdo total”. Likert (1932) diseña uno de los mé-
todos que más influencia ha tenido en la evaluación de las actitudes. Este autor exa-
minó cinco grandes áreas de las actitudes: relaciones internacionales, relaciones ra-
ciales, conflictos económicos, conflictos políticos y religión. La construcción de las
escalas de Likert se puede sintetizar en tres etapas:
a. Se selecciona un conjunto de preguntas relacionadas con varios aspectos de

una actitud; esta selección es realizada por investigadores en función de la experien-
cia, intuición o un pretest. Se incluye un número aproximadamente igual de propo-
siciones favorables que de desfavorables.
b. Las cuestiones son distribuidas a diferentes sujetos, a quienes se les pide que
indiquen sus opiniones haciendo un círculo sobre un punto de una escala de cinco
grados cuyos extremos son totalmente de acuerdo (5) y totalmente en desacuer-
do (1). Los investigadores pueden variar el número de unidades utilizadas en la es-
cala. A continuación se presenta una pregunta de un cuestionario para evaluar las

actitudes con respecto a los emigrantes.
Nunca me casaría con un emigrante.
Totalmente De acuerdo Neutro En desacuerdo Totalmente

de acuerdo en desacuerdo
> 4 y 2 1
Una puntuación de 5 muestra un total acuerdo, mientras que el total desacuerdo

se atribuye a la puntuación 1.
c. Las actitudes de una persona con respecto a un objeto están determinadas
por la suma de las respuestas a todas las cuestiones que muestran una correlación sa-
tisfactoria con la puntuación total.
La principal ventaja de la Escala de Likert es que su construcción es muy rápida

y con menos costos que la Escala de Thurstone. Esas ganancias no están asociadas
con una pérdida de precisión y de información, tal como la investigación viene con-
firmando. Así, actitudes obtenidas mediante escalas de Likert correlacionan con las
medidas de las escalas de Thurstone (Edwards y Kenney, 1946). No obstante, esta
escala tampoco está exenta de críticas; entre éstas, la más frecuente es que si las pun-
tuaciones de dos individuos son iguales, éstos deben tener la misma actitud. Sin em-
bargo, es frecuente observar puntuaciones totalmente iguales a partir de diferentes
respuestas a las cuestiones, y que presuponen actitudes diferentes.
1V.4. Escala de Guttman
La Escala de Guttman se basa en el supuesto de que las opiniones pueden ser orde-
nadas en función de favorabilidad, de modo que la concordancia con una determina-
da proposición implica estar de acuerdo con todas las preguntas que reflejen opinio-
nes más favorables. Según Guttman, cualquier escala que reproduzca perfectamente
este modelo será unidimensional. A diferencia de la Escala de Likert en la que la
puntuación total de la actitud de una persona podía reflejar uno de los diversos pa-
trones de respuesta, una puntuación en la Escala de Guttman teóricamente sólo pue-
de ser obtenida de una forma. Si conocemos la puntuación de un individuo, entonces
conoceremos la forma en que la persona responde a cada pregunta de la escala. La
elaboración de una escala de este tipo incluye tres etapas:
a. Se agrupa un considerable número de opiniones acerca de la actitud que de-
seamos evaluar. Estas opiniones deberán permitir la exploración de los dominios
que constituyen el campo de expresión de la actitud. Por ejemplo, si consideramos la
actitud de un grupo social con respecto a un partido político, existe un conjunto de
opiniones de los miembros del grupo acerca del partido: opiniones sobre la política
extranjera de este partido, sobre su política cultural, su política en relación a la juven-
tud, la educación, etc. Las opiniones seleccionadas deberán igualmente permi-

tir tomar todos los matices de la dirección de la actitud (de la más favorable a la
más desfavorable). Las opiniones serán formuladas de forma dicotómica (acuerdo-
desacuerdo). y
b. Se administra el cuestionario de opinión a una población de sujetos.
c. Se efectúa un análisis de respuestas para determinar si corresponden al mo-
delo ideal. Así, si hubiera tres preguntas (1=3) en las que A es el más favorable y Cel
menos favorable, existen cuatro patrones de respuesta (n+1) aceptables según el si-
guiente patrón:
Acuerdo Desacuerdo
Puntuación A B ce A B €
3 PS Xx Xx
de o Xx Xx
1 Xx Xx Xx
0 Xx Xx Xx
Cualquier otro patrón de respuestas como, por ejemplo, estar de acuerdo con A
y C, y estar en desacuerdo con B, es considerado erróneo. Si efectivamente A es más
favorable y C menos favorable, no tendría sentido concordar con A y estar en desa-
cuerdo con B o C. Esto se tendrá en cuenta a la hora de ordenar las cuestiones. La
proporción de puntuaciones del pretest que concuerdan con el patrón ideal se consi-
dera un índice de adecuación de la escala o de reproductibilidad. La unidimensiona-
lidad de esta escala se puede ilustrar por medio de las actitudes sexuales en relación al
comportamiento sexual preconyugal. Reiss (1967) elaboró un continuo unidimen-
sional de comportamiento preconyugal que va desde besar hasta tener relaciones se-
xuales completas. Véase el cuadro 35.2.
Esta escala se basa en el supuesto de que la persona que apruebe acariciar inten-
samente, también aprueba acariciar ligeramente o besar, y la persona que desapruebe
acariciar ligeramente también desaprueba acariciar intensamente o el contacto oral y
las relaciones sexuales completas.
La unidimensionalidad de esta escala se puede representar tal como aparece en el
cuadro 35.3.
La escala unidimensional de Guttman evita el problema de los diferentes pa-
trones de actitud con la misma puntuación. Entre los problemas que presenta
esta escala destaca el hecho de que un conjunto de preguntas que da lugar a res-
puestas escalonadas (o unidimensionales) en una determinada población no lo
haga en otra población. Las cuestiones de la escala pueden ser ordenadas de
modo diferente o pueden no tener un orden consistente. Por eso, la escala debe
ser validada en una muestra de sujetos semejantes a aquellos con los que se va a
utilizar la escala en el estudio final. Una mayor información sobre las escalas de
Thurstone, Likert y Guttman se puede obtener en el capítulo de Pascual: y Sie-
rra en este mismo manual.
CUADRO 35.2. Escala para evaluar las actitudes en relación al comportamiento sexual pre-
E
conyugal A A AA zea
1. Considero que besar es aceptable para el hombre/la mujer antes de casarse si
él/ella está comprometido/a para casarse.
él/ella está apasionado/a.
él/ella siente un gran afecto por su compañera/o.
4. Considero que besar es aceptable para el hombre/la mujer antes de casarse aun
cuando él/ella no sienta un afecto particular por su compañera/o.
5. Considero que las caricias son aceptables en el hombre/la mujer antes de casarse
si él/ella está comprometido/a para casarse.
si él/ella está apasionado/a.
si él/ella siente un gran afecto por su compañera/o.
aun cuando él/ella no sienta un afecto particular por su compañera/o.
9. Considero que las relaciones sexuales son aceptables en el hombre/la mujer antes
de casarse si él/ella está comprometido/a para casarse.
de casarse si él/ella está apasionado/a.
de casarse si él/ella siente un fuerte afecto por su compañera/o.
de Casarse aun cuando él/ella no sienta un afecto particular por su compañera/o.
De acuerdo: (1) Totalmente, (2) A medias, (3) Ligeramente.

En desacuerdo: (1) Totalmente, (2) A medias, (3) Ligeramente.
Fuente: Reiss (1967).
CUADRO 35.3. Representación esquemática de una escala de permisividad prematrimonial

de Guttman
A
Caricias Relaciones sexuales
Compro- Apasio- Fuerte Compro- Apasio- Fuerte Ningún

metido nado afecto metido nado afecto afecto
¡iLáI)
___——a——_—__—+4+41
—_— o o
Elevada permisividad E sE
+ =
+++
0N
mAs00
1 +++++
++
Poca permisividad = = E le
A > _— QQ _ —_ AI Dn A AA
Iv.5. Diferencial semántico

El Diferencial semántico fue desarrollado por Osgood, Suci y Tannenbaum (1957)
para evaluar la connotación de un concepto para un determinado sujeto o grupo de
sujetos. Esta connotación incluye toda su significación implícita. Osgood y cols.
(1957) postularon que las actitudes de un individuo en relación a un concepto están
incluidas en el sentido connotativo ligado a ese concepto. Por tanto, se trata de una
combinación de un método de asociaciones forzadas y de un procedimiento de esca-
las, permitiendo obtener la dirección y la intensidad del significado del concepto.
Concretamente, los sujetos deben diferenciar en un conjunto de escalas bipolares de
adjetivos antónimos, con siete grados de intensidad, una serie de conceptos de un
campo semántico. La dirección de la evaluación puede ser positiva o negativa, yendo
de 3 a +3. Por ejemplo, el árbitro de un partido de fútbol puede ser juzgado por
un individuo como bastante bueno (+2), como muy rápido (+3) y como muy fuer-
te (+3).
A continuación se muestra un ejemplo de escalas del Diferencial semántico. Los
sujetos deben colocar un aspa en cada escala para manifestar su actitud en relación al
aspecto en cuestión.
En cada una de las escalas abajo indicadas señale su opinión con respecto al árbi-
tro del partido del sábado:
Bueno /- A A A A MO
Lento //72—/—//—/—/—-/—X—/ Rápido
AAA A A A a E) E
Este sujeto manifiesta claramente una actitud positiva en relación al árbitro del
partido.
El Diferencial semántico ofrece tres tipos de información acerca del objeto de la
actitud: evaluación, potencia y actividad. La dimensión de evaluación (en el ejemplo
anterior sería bueno-malo) permite conocer si se está en una posición favorable o
desfavorable con respecto al objeto de la actitud; la dimensión potencia (fuerte-
débil) y la dimensión actividad (rápido-lento) informan también sobre el significado
de un concepto para la persona.
El Diferencial semántico ha sido utilizado de diferentes formas y para diversos
objetivos. Algunos de sus usos son el estudio de las diferencias socioculturales en las
actitudes y el estudio de las diferencias sexuales; los sujetos masculinos y femeninos
pueden presentar diferentes respuestas connotativas hacia determinados conceptos
y objetos; también se utiliza para evaluar el autoconcepto. El Diferencial semántico
presenta la ventaja de ser fácil de construir y que casi toda la escala, una vez elabora-
da, puede ser utilizada como modelo para otra variable a estudiar, dado que los adje-
tivos son independientes de cualquier variable. Entre las críticas realizadas al Dife-
rencial semántico se señala la existencia, a veces, de falsas bipolaridades.
V. MEDIDAS INDIRECTAS DE LAS ACTITUDES
Los cuestionarios son con diferencia las técnicas de evaluación de las actitudes más
ampliamente utilizadas. No obstante, la facilidad en detectar su intención puede in-
fluir en ciertas personas; este hecho ha llevado a algunos investigadores a utilizar mé-
todos indirectos. Las medidas indirectas más comunes en las que no se pregunta a las
personas su actitud directamente son las técnicas psicofisiológicas, las técnicas com-
portamentales y las técnicas proyectivas.
Las técnicas psicofisiológicas utilizadas para la evaluación de las actitudes, tales
como la resistencia electrodérmica o la contracción pupilar, parten del presupuesto
de que el componente afectivo de las actitudes produce una reacción psicofisiológi-
ca que puede ser registrada. Se encontró que sujetos blancos mostraban una eleva-
da respuesta electrodérmica delante de un experimentador negro y no ante uno
blanco (Rankin y Campbell, 1955). Este resultado podría interpretarse como una
señal del preconcepto de los sujetos en relación al experimentador negro. Sin em-
bargo, más recientemente se llegó a la conclusión de que la novedad del estímulo
produce una elevada respuesta electrodérmica (Cacioppo y Sandman, 1981). La
sorpresa al encontrarse con un experimentador negro podría haber producido la
respuesta electrodérmica. El problema suscitado por la interpretación de esta expe-
riencia muestra las dificultades existentes al utilizar este registro psicofisiológico en
la evaluación de las actitudes. Otra medida que está asociada al sistema nervioso
autónomo es el cambio en el tamaño de la pupila ocular. Su dilatación se interpretó
como un indicador de una actitud positiva y su contracción como un indicador de
una actitud negativa (Hess, 1965). A su vez, Cacioppo y Tassinary (1990) utilizan
la actividad electromiográfica facial en situaciones estructuradas como medida in-
directa de las actitudes.
Las medidas conductuales se asientan en el supuesto de que el comportamiento
es consistente con las actitudes. Así, si un sujeto es afable con los inmigrantes, se pre-
supone que el sujeto tiene una actitud favorable en relación a los inmigrantes. Meh-
rabian (1967) estudió el aspecto comportamental de las actitudes utilizando algunas
de las ideas de la proxemia, la cual se refiere al grado de intimidad de la interacción
no verbal entre dos personas que se comunican. Según Mehrabian, se pueden eva-
luar las actitudes de un sujeto en relación a otro a través de la medida de la distancia,
del contacto ocular y de la tensión corporal en el momento en que interactúan. Otra
forma de evaluar las actitudes es a través de tareas cuya realización sea sistemática-
mente influenciada por las actitudes. Por ejemplo, en un experimento se ha pedido a
un número de estudiantes que desempeñaran el papel de jueces en un debate y que
evaluaran imparcialmente los argumentos sobre asuntos raciales sin hacer referencia
a sus propias actitudes (Brighan y Coock, 1979). Los autores partían de la hipótesis
de que a pesar de los intentos por ser imparciales, las evaluaciones de los estudiantes
estarían fuertemente afectadas por sus actitudes, pudiendo utilizar, por tanto, estas
evaluaciones como medidas indirectas de las actitudes. Tal como se hipotetizaba los
juicios realizados constituyeron una medida indirecta válida de las actitudes raciales
de los sujetos. Por último, recientemente se están utilizando medidas implícitas de la
memoria para evaluar de forma indirecta las actitudes (Dovidio y Fazio, 1992).
La utilización de técnicas indirectas para evaluar las actitudes presenta una se-
rie de ventajas y de desventajas, a su, vez. Entre las ventajas se señala que estas téc-
nicas son menos susceptibles de suscitar respuestas socialmente aceptables; la per-
sona no conoce qué actitud está siendo evaluada. Entre las desventajas destaca la
dificultad para evaluar la intensidad de la actitud y, dado que las actitudes son in-
feridas, estas técnicas pueden tener problemas de fiabilidad. A pesar de esto, las
medidas indirectas son la única alternativa a seguir cuando se trabaja en asuntos
sociales sensibles.
VL VALIDEZ Y FIABILIDAD DE LAS ESCALAS DE ACTITUDES
La evaluación de la validez y de la fiabilidad nos permite conocer la confianza que

podemos tener en un determinado instrumento de medida. La validez muestra si el
instrumento es apropiado para lo que vamos a evaluar; la fiabilidad indica si los re-
sultados obtenidos son consistentes. Entre las amenazas a la validez de las escalas de
actitudes destacan la deseabilidad social (las respuestas pueden no ser totalmente sin-
ceras por el recelo de los sujetos a ser juzgados negativamente) y la utilización de po-
cas preguntas (una sola pregunta es susceptible de errores de interpretación y de for-
mulación de una respuesta). El método más antiguo para calcular la fiabilidad es el
de test-retest, volviendo a aplicar la prueba dentro de un período de tiempo en el que
no se espera un cambio en la actitud. Los coeficientes de 0,70 Ó más son generalmen-
te considerados como dignos de confianza; en el caso de la evaluación de las actitu-
des, coeficientes por debajo de 0,70 pueden ser aceptados a veces, aunque con ciertas
reservas. La fiabilidad para las escalas de Thurstone en general es de 0,80 (Aiken,
1985); con respecto a la escala de distancia social se ha obtenido un máximo de 0,90
de fiabilidad, lo cual es un valor satisfactorio, y existe también alguna evidencia posi-
tiva con respecto a su validez (Alexandre, 1971). En cuanto al diferencial semántico,
se han conseguido índices de precisión test-retest entre 0,83 y 0,91 según Osgood y
cols. (1957), alcanzando un coeficiente de 0,97 según Jenkins, Russell y Suci (1957).
Osgood y cols. (1957) informan también de altos índices de validez concurrente del
Diferencial semántico con las escalas de Thurstone (entre 0,74 y 0,82) y las de Gutt-
man (alrededor de 0,79).
Aiken, L. R. (1985). Psychological testing and assessment. Boston. Allyn and Bacon, Inc.
Alexandre, V. (1971). Les échelles d'attitude. París. Editions Universitarres.
Allport, G. (1935). Attitudes. En C. Murchison (dir.), A handbook of social pyschology. Wor-
certer. Clark University Press.
Bogardus, E. (1925). Measuring social distance. Journal ofApplied Sociology, 9, 299-308.

Breckler, S. (1984). Empirical validation of affect, behavior, and cognition as distinct compo-
nents of attitude. Journal of Personality and Social Psychology, 47, 1191-1205. _
Brighan, J. C. y Cook, S. W. (1979). The influence of attitude on judgements of plausibi-
lity: A replication and extension. Educational and Psychological Measurement, 30, 283-
ZIzE
Cacioppo, J. T. y Sandman, C. (1981). Pyschophysiological functioning, cognitive respon-
ding and attitudes. En R. E. Petty, T. Ostrom y T. Brock (dirs.), Cognitive responses to
persuasion. Hilldsdale, Erlbaum. oyo
Cacioppo, J. T. y Tassinary, L. G. (1990). Infering pyschological significance from physiolo-
gica signals. American Psychologist, 45, 16-28. ,
Dawes, R. y Smith, T. (1985). Attitude and opinion measurement. En G. Lindzey y E. Aron-
son (dirs.), Handbook of social psychology (vol. 1). Nueva York. Random House.
Debaty, P. (1967). La mesure des attitudes. París. PUF. so%
Dovidio, J. F. y Fazio, R. H. (1992). New technologies for the direct and indirect assessment
of attitudes. En J. M. Tanur (dir.), Questions about questions: Inquiries into the cognitive
bases of surveys. Nueva York. Russell Sage.
Eagly, A. H. y Chaiken, S. (1992). The psychology of attitudes. San Diego. Harcourt Brace Ja-
novich.
Edwards, A. y Kenney, K. (1946). A comparison of the Thurstone and Likert techniques of
attitudes scale construction. Journal ofApplied Pyschology, 30, 72-83.
Eysenck, H. (1954). The psychology ofpolitics. Londres. Routledge and Kegan Paul.
Fishbein, M. (1963). An investigation of the relationships between beliefs about an object and
the attitude toward that object. Human Relations, 16, 233-240.
Hess, E. (1965). Attitude and pupil size. Scientific American, 212, 46-54.
Hovland, C. y Sherif, M. (1952). Judgmental phenomena and scales of attitude measurement:
Item displacement in Thurstone scales. Journal of Abnormal and Social Psychology, 47,
822-832,
Jenkins, J. J., Russell, W. A. y Suci, G. J. (1957). An atlas of semantic profiles for 360 words.
Minneapolis. University of Minnesota.
Kahale, L. (1984). Attitudes and social adaptation. Oxford. Pergamon Press.
Likert, R. (1932). A technique for measurement of attitudes. Archives of Psychology, 140.
McGuire, W. J. (1985). Attitudes and attitude change. En G. Lindzey y E. Aronson (comps.),
Handbook of social psychology. Nueva York. Random House.
Mebhrabian, A. (1967). Orientation behaviors and nonverbal attitude communication. Jonr-
nal of Communication, 17, 324-332.
Michelat, G. y Thomas,J.P. (1966). Les dimensions du nationalism. París. Armand Colin.
Neto, F. (19934). Psicología da migracao portuguesa. Lisboa. Universidade Aberta.
Neto, F. (19935). Love styles and self-representations. Personality and Individual Differen-
ces, 6, 795-803.
Olson, J. M. y Zanna, M. P. (1993). Attitudes and attitude change. Annual Review Psycho-
logy, 44, 117-154,
Osgood, C. E., Suci, G. J. y Tannenbaum, P. H. (1957). The measurement of meaning. Uli-
nois. University of Illinois Press.
Rankin, R. y Campbell, D. (1955). Galvanic skins response to negro and white experimen-
ters. Journal ofAbnormal and Social Psychology, 51, 30-33.
Reiss, L. (1967). The social contact of premarital sexual permissiveness. Nueva York. Holt,
Rinehart and Winston. -
Thurstone, L. (1928). Attitudes can be measured. American Journal of Sociology, 33, 529-554.
Olson, J. M. y Zanna, M. P. (1993). Attitudes and attitude change. Annual Review Psycho-
logy, 44, 117-154.
Thorndike, R. M., Cunningham, G. K, Thorndike, R. L. y Hagen, E. P. (1991). Measurement
and evaluation in psychology and education. Nueva York. Maxwell McMillan.
M
se de
e
za ET,
A lt €.
de - Yaa 5 orar á
Astro all Appiod Di
.
+7.Pbe Dv A
, 4d 3 y 7 Vos
h Ñ ,
4 x cl 0 3
P A Mor a ed
' % Le ys
A a
; MAL TAN añ?
| pa ch
e E
LA Es ARIAS 200 compo
/ ; » da MIN wiecios. Ja
de lies
e 4 uN
Ni PET
, . De
. E)
el
.
36. EVALUACIÓN DE LOS INTERESES
JO-IDA C. HANSEN Y J. CARLOS SIERRA
Il. INTRODUCCIÓN
La importancia de los intereses profesionales en la selección de personal fue recono-

cida por primera vez por los educadores a principios de siglo y, poco después, por la
industria. Los primeros teóricos en el campo, como Parsons (1909), formularon la
hipótesis de que el ajuste laboral se acentuaba si las características e intereses del in-
dividuo se ajustaban a los requisitos de la ocupación. Tal como señaló Strong (1943),
los intereses suministran información adicional para tomar decisiones sobre la carre-
ra profesional no proporcionada por los análisis de las habilidades o aptitudes. La
consideración de los intereses junto con las habilidades, valores y características de
personalidad proporcionan una completa evaluación del individuo que supera la
consideración de cualquier rasgo aislado.
II. HISTORIA DE LOS INVENTARIOS DE INTERESES
El método más antiguo de evaluación de los intereses fue la estimación, la cual se rea-
lizaba pidiendo a los individuos que indicaran cómo se sentían en varias actividades.
Para mejorar la exactitud de su estimación, se animaba a la gente a probar las activi-
dades antes de realizar sus estimaciones. Sin embargo, estas técnicas de evaluación de
los intereses eran costosas en tiempo y dinero, lo que llevó al desarrollo de cuestio-
narios y escalas de estimación de los intereses (Miner, 1922; Kitson, 1925) y, final-
mente, a los inventarios de intereses que empleaban procedimientos estadísticos
para reducir las respuestas de un individuo a series de cuestiones que representasen
varias actividades y trabajos.
La elaboración de inventarios de intereses se basa en una serie de presupuestos;
en primer lugar, una persona puede dar respuestas justificadas del grado de interés
(por ejemplo, agrado, indiferencia, desagrado) en actividades y trabajos familiares; y,
en segundo lugar, las actividades no familiares tienen la misma estructura factorial
que las actividades familiares, por lo tanto, las actividades y trabajos habituales pue-
den ser empleados como cuestiones de los inventarios de intereses para identificar
los intereses laborales no familiares.
La primera batería de cuestiones de intereses en actividades fue elaborada en un
seminario dado por Clarence S. Yoakum en el Instituto Carnegie de Tecnología en
1919. La batería que incluía mil cuestiones fue desarrollada empleando un enfoque
University of Minnesota (EE UU) y Universidad de Granada.

902 Jo-Ida C. Hansen y J. Carlos Sierra
de muestreo racional diseñado para representar el área completa de interés. Con los
años se realizaron análisis estadísticos para determinar el valor de cada cuestión y
numerosos inventarios emplearon esta primera batería de cuestiones como base para
su desarrollo. Entre estos inventarios podemos citar los siguientes: el Occupational
interest inventory [Inventario de intereses laborales] de Freyd (1923), el Interest re-
port blank [Formulario de intereses] de Cowdery (1926), la General interest survey
[Encuesta general de intereses] de Kornhauser (1927), el Vocational interest blank
[Formulario de intereses vocacionales] de Strong (1927), el Purdue interest report
[Informe Purdue de intereses] de Remmers (1929), el Interest analysis blank [For-
mulario de análisis de intereses] de Hubbard (1930) y el Minnesota interest inven-
tory [Inventario de intereses de Minnesota] de Paterson y cols. (1930).
ni. Características de las cuestiones de los inventarios de intereses
Las cuestiones de los inventarios de intereses han de ser evaluadas periódicamente,

puesto que los cambios sociales pueden hacerlas obsoletas, por lo que surge la nece-
sidad de cuestiones nuevas.
En primer lugar, las cuestiones deben diferenciar entre grupos, puesto que el
propósito de los inventarios de intereses es distinguir a los individuos de intereses si-
milares de aquellos otros de intereses distintos. Las muestras de sujetos con intereses
similares deberían tener índices semejantes de respuesta a las cuestiones. Las cuestio-
nes no deben discriminar por sexos; ninguna cuestión debe sugerir que un trabajo es
más apropiado para un sexo que para el otro. Además de las cuestiones, los materia-
les de interpretación e instrucciones de los inventarios tampoco deben ser discrimi-
natorios en este aspecto. Los inventarios pueden adaptarse con más facilidad a otras
culturas para su uso con minorías étnicas O para su uso internacional si las cuestiones
no son ambiguas ni discriminan culturalmente. Las cuestiones directas tienden a te-
ner el mismo significado para todos los que realizan el inventario con independencia
de su orientación cultural o laboral, y serán más fáciles de traducir.
Las cuestiones deben ser revisadas periódicamente para asegurar que son actua-
les y familiares a los sujetos que las contestan. La validez formal, además de la de
contenido, de un inventario de intereses queda afectada si la batería de cuestiones
contiene elementos anticuados que no son familiares a la población general. Por otra
parte, a medida que se desarrollan las nuevas tecnologías, han de producirse nuevas
cuestiones que aseguren que todas las áreas de intereses están representadas en la ba-
tería. Finalmente, las cuestiones deben tener una fácil lectura. Todos los materiales
que acompañan a los inventarios de intereses (por ejemplo, instrucciones, perfil e in-
formación interpretativa), así como la batería misma deben ser fáciles de leer para
que el inventario sea útil a una población de variado nivel educativo y para la explo-
ración en sujetos jóvenes.
Los primeros inventarios de intereses fueron desarrollados empleando el méto-
do empírico ateórico de grupos de contraste, basado en el presupuesto de que las
personas con intereses similares pueden ser agrupadas y, al mismo tiempo, diferen-
ciadas de grupos con intereses distintos. El inventario que mejor ilustra esta técnica
es el Strong vocational interest blank [Formulario de intereses vocacionales de
Evaluación de los intereses 903
Strong] publicado en 1927, ahora llamado Strong interest inventory [Inventario de

intereses profesionales de Strong] (Hansen y Campbell, 1985). Posteriormente, los
resultados de las investigaciones empíricas sobre los intereses fueron empleados para
formular hipótesis sobre su estructura. Roe (1956) y Holland (1959) utilizaron el
análisis factorial de Guilford y encontraron siete factores: intereses mecánicos, cien-
tíficos, de bienestar social, de expresión estética, administrativos, comerciales y de
trabajo al aire libre.
III. ELABORACIÓN DE LAS ESCALAS DE LOS INVENTARIOS DE INTERESES
Los inventarios de intereses más importantes incluyen escalas homogéneas o hetero-

géneas; el Minnesota vocational interest inventory [Inventario de intereses vocacio-
nales de Minnesota] (Clark, 1956) y el Strong interest inventory [Inventario de inte-
reses profesionales de Strong] son dos instrumentos que combinan escalas laborales
heterogéneas y homogéneas de intereses básicos. Las escalas heterogéneas son más
válidas para usos predictivos (por ejemplo, predecir el trabajo futuro o los estudios
de licenciatura a realizar), mientras que las homogéneas son más útiles para propor-
cionar descripciones exhaustivas de la estructura de los intereses de la muestra.
m1. Desarrollo de escalas homogéneas

En la elaboración de una escala se pueden seleccionar las cuestiones por la consisten-
cia interna o el ajuste homogéneo. Las cuestiones elegidas de este modo muestran al-
tas correlaciones. Métodos empíricos como el análisis de agrupaciones numéricas O
el análisis factorial se pueden emplear para identificar las cuestiones relacionadas; así
por ejemplo, las escalas del Vocational interest inventory (V11) [Inventario de intere-
ses vocacionales] (Lunneborg, 1976) fueron elaboradas empleando el análisis facto-
rial. Las escalas también pueden basarse en la selección racional de cuestiones; este
método emplea una teoría para determinar aquellas cuestiones apropiadas para eva-
luar el constructo representado por cada escala; por ejemplo, los temas laborales ge-
nerales del Inventario de intereses profesionales de Strong se elaboraron racional-
mente usando la definición teórica de Holland de los seis tipos vocacionales.
112. Desarrollo de escalas heterogéneas

Las escalas ocupacionales del Strong interest inventory [Inventario de intereses pro-
fesionales de Strong] y la Kuder occupational interest survey-Form DD [Encuesta de
intereses laborales de Kuder-Forma DD] (Kuder, 1966) están formadas por cuestio-
nes con bajas correlaciones, denominándose por tanto heterogéneas. Estas escalas
son ateóricas: la elección de cuestiones se basa en resultados empíricos más que en
una teoría. El Inventario de intereses profesionales de Strong emplea el método em-
pírico de contraste de grupos para seleccionar las cuestiones. Esta técnica compara
los índices de respuesta de grupos criterio y los grupos de contraste, que representan
los intereses de los individuos en general, con el objetivo de identificar las cuestiones
que distinguen significativamente las dos muestras. La Kuder occupational interest
survey [Encuesta de intereses laborales de Kuder] emplea un método empírico dis-
tinto, el cual compara directamente los patrones individuales de respuesta con los
patrones de respuesta de las muestras criterio que representan los intereses de varios
trabajos y licenciaturas.
IV. INVENTARIOS DE INTERESES ACTUALES
De todos los inventarios de intereses, el más usado es el Inventario de intereses pro-

fesionales de Strong, versión más reciente del Strong vocational interest blank [For-
mulario de intereses vocacionales de Strong]. Otros inventarios muy difundidos son
las distintas formas del Kuder, el Vocational preference inventory [Inventario de pre-
ferencias vocacionales], y el Self-directed search [Registro autodirigido] (Engen,
Lamb y Prediger, 1982; Zytowski y Warman, 1982). Otros instrumentos menos usa-
dos, con aplicaciones más restringidas que los anteriores son los siguientes: el Ohio
vocational interest survey [Encuesta de intereses vocacionales de Ohio] (D'Costa y
cols., 1969), el Vocational interest inventory [Inventario de intereses vocacionales]
(Lunneborg, 1976), el Career assessment inventory [Inventario de evaluación de ca-
rreras profesionales] (Johansson, 1975, 1986), la Jackson vocational interest survey
[Encuesta de intereses vocacionales de Jackson] (Jackson, 1977) y el Temario voca-
cional de García Yagúe (Alonso Tapia, 1992).
Iv.1. Inventarios de intereses de Strong

El Inventario de intereses profesionales de Strong (Hansen y Campbell, 1985) es la
última versión del Strong vocational interest blank [Formulario de los intereses pro-
fesionales de Strong]. Este último es uno de los inventarios de intereses más anti-
guos; fue objeto de investigación, revisión y uso durante más de 50 años. La primera
versión, publicada en 1927, empleaba el método empírico de contraste de grupos
para elaborar las escalas laborales que representan los intereses de sujetos varones en
diez trabajos diferentes. La primera versión para mujeres se publicó en 1933, y hasta
1974 el instrumento se publicó en versiones separadas para hombres y mujeres.
En 1974 las dos versiones se combinaron seleccionando las mejores 325 cuestiones
de ambos. En 1981 se completó otra revisión en un esfuerzo por proporcionar esca-
las laborales por sexos; destacan las de Forester para hombres y para mujeres, las es-
calas de asistentes de vuelo para hombres y para mujeres, y las escalas de dirección de
personal para hombres y para mujeres.
La elaboración de la versión actual del Inventario de intereses profesionales de
Strong en 1985 supuso el fin del proceso de igualdad de sexos comenzado en 1971.
Otro cambio importante en la revisión de 1985 fue la ampliación del perfil para in-
cluir más escalas laborales no profesionales y vocacionales/técnicas; en esta versión,
el 32% de las escalas laborales representa ocupaciones con requisitos académicos

menores a un título universitario e incluyen escalas adicionales para hombre (h) y
mujer (m) tales como conductor de autobús, carpintero, electricista, técnico de
emergencias médicas, neumólogo, jefe de cocina, florista, director de funeraria, Ópti-
co, agente de viajes y director de servicios alimenticios.
En cada una de las revisiones recientes del Inventario de intereses profesionales
de Strong, se han realizado esfuerzos por hacer un instrumento más útil. Existe una
serie de materiales que ayudan a interpretar el perfil obtenido con esta prueba; desta-
camos la guía del usuario para el SVIB-SCH (Hansen, 1984), la guía ocupacional
Strong-Hansen (Hansen, 1987), el informe de interpretación (Hansen, 1988), así
como un programa informático para la realización de las pruebas.
Iv.1.1. Baterías y perfiles de las cuestiones

El Inventario de intereses de Strong incluye 325 cuestiones divididas en siete seccio-
nes: lista de trabajos, asignaturas escolares, actividades relacionadas con el trabajo,
actividades de ocio, tipos de personas, elección forzada de preferencia entre dos acti-
vidades y características autodescriptivas. El formato de las cuestiones requiere que
los sujetos indiquen el grado de interés seleccionando la opción “agrado”, “indife-
rencia” o “desagrado”; por ejemplo:
Actor/actriz A
Observar una operación a corazón abierto A
Las páginas de deportes del periódico A
Gente abierta con nuevas ideas A aRADUDO
A
El perfil incluye tres grupos de escalas: 6 temas laborales generales, 23 escalas de

intereses básicos y 207 escalas laborales que representan ocupaciones profesionales y
no profesionales (granjeros, geógrafos, fotógrafos, trabajadores sociales, comprado-
res, directores de banco...).
Escalas laborales
Las escalas laborales constituyen un ejemplo clásico de elaboración de pruebas em-

pleando el método empírico de grupos de contraste. El primer paso del procedi-
miento es determinar el índice de popularidad de cada cuestión en muestras de con-
traste llamadas Mujeres en general (MEG) para las escalas laborales con normas para
mujeres y Hombres en general (HEG) para las escalas con normas para varones. Este
paso es necesario porque las cuestiones varían en popularidad. Por ejemplo, sólo un
30% de MEG seleccionan la opción “Me gusta” en la cuestión «Expresar juicios pú-
blicamente con independencia de lo que digan los demás», pero el 58% de MEG eli-
gen “Me gusta” en la cuestión “Esquiar”. Ignorar este aspecto implicaría que en la
mayoría de las escalas apareciesen cuestiones muy populares, mientras que las me-
nos habituales aparecerían en muy pocas escalas. Las MEG y HEG están compuestas
por 300 sujetos seleccionados de una gran variedad de trabajos. Los sujetos varones
906 Jo-Ida C. Hansen y ].Carlos Sierra
y mujeres del MEG y HEG de 1985 están equiparados en la lista de trabajos; por ejem-
plo, si la muestra del HEG incluye tres electricistas, hay el mismo número en la
de MEG. :
El siguiente paso es recoger una muestra nacional de 200 a 300 mujeres y de
200 a 300 hombres de trabajos específicos que sirvan como muestras criterio. Los
sujetos incluidos en estas muestras tienen como mínimo 25 años, han estado en el
trabajo al menos 3 años y están satisfechos con él. El porcentaje de respuesta de la
muestra criterio a cada cuestión se compara con el de la muestra de contraste del
mismo sexo para identificar las cuestiones que diferencian a las dos muestras. Nor-
malmente, se identifican de 50 a 70 cuestiones como intereses (“Me gusta”) o aver-
siones (“Me disgusta”) de cada muestra de criterio laboral. Las puntuacionbru- es
tas de un individuo realizadas en las escalas laborales se convierten en puntuaciones
normalizadas basadas en la muestra criterio, con una media igual a 50 y desviación
típica de 10.
Se ha procurado proporcionar escalas laborales por sexos en el perfil del Inven-
tario de intereses profesionales de Strong; sólo 5 de las 106 ocupaciones (207 escalas)
están representadas por una única escala (por ejemplo, ayudante de dentista —m, hi-
giénico dental —m, profesor de economía nacional —m, secretaria —m y empresa-
rio agrícola —h). Las escalas laborales están ordenadas en el perfil según su código
Holland, comenzando por los trabajos cuyo código primario es “realista” y siguien-
do con ocupaciones “investigadoras”, “artísticas”, “sociales”, “empresariales” y
“convencionales”.
Las escalas laborales por sexos se siguen elaborando dado que hombres y muje-
res presentan claras diferencias que impiden realizar escalas válidas para ambos se-
xos. Strong (1943) intentó elaborar una versión para ambos sexos sin éxito; intentos
más recientes han resultado igualmente fallidos (Hansen, 1976; Kuder, 1977; Webber
y Harmon, 1978; Campbell y Hansen, 1981). Hasta que coincidan los intereses de
hombres y mujeres, las escalas laborales por sexos proporcionarán los resultados
más válidos y una mayor amplitud de exploración de los intereses de ambos sexos.
Temas laborales generales
Los Temas laborales generales (TLG) constituyen una fusión del empirismo del Zn-
ventario de intereses de Strong con la teoría de Holland de tipos vocacionales. Cada
uno de los seis temas homogéneos contiene 20 cuestiones seleccionadas para repre-
sentar los tipos de Holland (realista, investigador, artístico, social, empresarial y con-
vencional). Los TLG correlacionan ampliamente (entre 0,72 y 0,79) con las escalas
del mismo nombre del Vocational preference inventory [Inventario de preferencias
vocacionales] (Hansen, 1983). Las correlaciones entre los TLG indican que el orden
hexagonal que propone Holland para describir la relación entre sus tipos (los tipos
adyacentes tienen más en común que los diametramente opuestos) también describe
la relación entre los temas del inventario de Strong (Hansen y Campbell, 1985). Las
puntuaciones normalizadas están basadas en una muestra de referencia general com-
puesta por 300 mujeres y 300 hombres con una media de 50 y una desviación típica
de 10. La integración de la teoría de Holland con el empirismo de Strong da lugar al
marco organizativo del actual perfil Strong.
Escalas de intereses básicos
Las escalas de intereses básicos támbién están agrupadas según los tipos de Holland
identificando el tema con el que cada escala de interés básico tiene su mayor correla-
ción. Las 23 escalas se realizaron empleando la técnica estadística del análisis de
agrupamientos numéricos para identificar las cuestiones con una alta correlación
(Campbell y cols., 1968). Las escalas de intereses básicos fueron desarrolladas para
centrarse en la evaluación de un solo factor por escala y, por consiguiente, son más
fáciles de interpretar que las escalas laborales heterogéneas que incorporan cuestio-
nes que representan varios factores de interés, además del agrado y desagrado en
cada escala. Los nombres de las escalas describen el contenido homogéneo de las
cuestiones y el rasgo de interés evaluado por cada una de ellas.
1V.1.2.. Fiabilidad y validez

La fiabilidad test-retest de las escalas en el perfil de Strong es elevada, tanto en inter-
valos breves, como en intervalos prolongados. Las medias de fiabilidad en períodos
de dos semanas, treinta días y tres años de los TLG fueron 0,91, 0,86 y 0,81, respecti-
vamente, de las escalas de intereses básicos fueron 0,91, 0,88 y 0,82, y de las escalas
laborales fueron 0,91, 0,89 y 0,87 (Campbell y Hansen, 1981; Murphy y Davidsho-
fer, 1991). Los datos de validez concurrente entre los TLG y las escalas de intereses
básicos —que por su naturaleza ajustada homogéneamente son más útiles para la
descripción de intereses que para su predicción— incluyen puntuaciones medias de
centenares de muestras de trabajos en cada escala. Generalmente, las escalas distri-
buyen los trabajos en desviaciones típicas de 2 a 2,5; los patrones de trabajos con
puntuación alta y baja indican que las puntuaciones en estas escalas están relaciona-
das con los trabajos que se buscan (Hansen y Campbell, 1985). La validez concu-
rrente de las escalas laborales está determinada por la identificación de la capacidad
de cada escala para discriminar entre las muestras criterio y la muestra adecuada. La
coincidencia media entre puntuaciones de la muestra criterio y de contraste es del
36%, lo que representa dos desviaciones típicas de separación entre las muestras.
Debido a que los inventarios de intereses se emplean para tomar decisiones a lar-
go plazo, la validez predictiva es importante. El Inventario de intereses profestonales
de Strong fue objeto de múltiples estudios de validez predictiva; los resultados indi-
can que las puntuaciones altas en las escalas laborales están relacionados con los tra-
bajos que finalmente se obtienen; generalmente, según los diferentes estudios, entre
el 50 y el 75% de los sujetos se dedicarán a trabajos predecibles a partir de sus pun-
tuaciones (Campbell, 1966; Harmon, 1969; Dolliver, Irvin y Bigley, 1972; Spokane,
1979; Hansen, 1986). También se evaluó la utilidad del Inventario Strong para pre-
decir la elección de carreras universitarias, hallándose unos índices de acierto simila-
res a los laborales (Hansen y Swanson, 1983).
iv2. Inventarios de intereses de Kuder
El Personal preference record-form A [Registro de preferencias vocacionales-Forma

A] fue publicado en 1939 por Kuder e incluía siete escalas homogéneas casi indepen-
dientes. Kuder añadió otras dos escalas homogéneas en 1943 (Forma B) y otra más
en 1948 (Forma C). La Kuder general interest survey [Encuesta de intereses genera-
les de Kuder-Forma E] (Kuder, 1988) evalúa las diez áreas de intereses de la forma C,
pero con una redacción más sencilla de las cuestiones. La primera edición de la Km-
der occupational interest survey-form DD (Encuesta de intereses laborales de Ku-
der-Forma DD] fue publicada en 1966; sus últimas modificaciones y revisiones apa-
recen en el Kuder DD manual supplement (Zytowska, 1985).
1V2.1. Kuder Aa interest survey-form E [Encuesta de intereses

generales-Forma E]
Esta prueba de intereses generales está compuesta por escalas homogéneas que eva-
lúan los intereses en diez áreas diferentes: aire libre, mecánica, cálculo, ciencia, per-
suasión, arte, literatura, música, servicio social y área administrativa. Kuder desarro-
lló inicialmente las escalas agrupando las cuestiones relacionadas por la validez de
contenido; más tarde, realizó un análisis de cuestiones con el fin de establecer grupos
de cuestiones (escalas) con elevada consistencia interna.
La prueba incluye 168 grupos de tres ítems de elección forzada con un nivel de
lectura de sexto curso. El sujeto debe comparar cada una de las tres actividades con las
otras dos y las gradúa como la más preferida (+) y menos preferida (-). Por ejemplo:
a. Fijarte especialmente en la gente al viajar (ds riko

b. Buscar bellos escenarios al viajar Mhrén)
c. Fijarte especialmente en los campos cultivados al viajar (+ (+
d. Leer las lecciones a estudiantes ciegos E) ers)
e. Observar el número de coches que pasa por un punto Y O
f. Hablar con la gente para conocer su opinión para un periódico (+) (-)
La calificación de la Kuder general interest survey-form E [Encuesta de intereses

generales de Kuder-Forma E] puede hacerse manualmente o a máquina, obtenién-
dose en ambos casos puntuaciones brutas con las que se rellena una hoja de perfil.
Estas puntuaciones del sujeto se comparan con las distribuciones percentiles de cada
grupo de chicos y chicas de sexto curso, de octavo y del último curso del bachiller. El
Kuder reference record-vocational-form C [Registro de preferencias vocacionales de
Kuder-Forma C] es una revisión anterior diseñada para su uso entre alumnos de los
últimos cursos de instituto y adultos. Emplea un vocabulario más difícil que la for-
ma E, pero evalúa las mismas diez áreas de intereses.
1v22. Kuder occupational interest survey-form DD [Encuesta

de intereses laborales de Kuder-Forma DD]
La forma DD está compuesta por 100 grupos de tres actividades similares a las de la
forma E descrita anteriormente. El perfil incluye 104 escalas laborales y 39 estudios
universitarios que, del mismo modo que el Inventario de Strong, compara los intere-
ses del sujeto con los de las muestras criterio. A diferencia del Inventario de Strong,
esta encuesta no emplea el método empírico de contraste de grupos para la elabora-
ción de la escala. En su lugar, las respuestas del individuo se comparan directamente
con las de las muestras criterio, y las puntuaciones se dan como coeficientes lambda,
lo que no permite la comparación de puntuaciones entre perfiles de distintas perso-
nas como se puede hacer con las puntuaciones normalizadas. Así, las puntuaciones
de un sujeto se interpretan según la posición que una escala tenga entre todas las de-
más. Esta forma debe ser calificada a máquina. Las 104 escalas laborales representan
28 trabajos (56 escalas) que se desarrollaron empleando muestras criterio de hom-
bres y mujeres, 37 basadas en muestras de hombres y sólo 11 en muestras de muje-
res. Las 39 escalas de especialidades universitarias representan 12 carreras basadas en
muestras criterio de hombres y mujeres, 10 en muestras de hombres y 5 de mujeres.
Zytowski (1985) diseñó un nuevo perfil de la encuesta de Kuder, añadiendo diez
estimaciones de intereses vocacionales a las escalas existentes. Este nuevo perfil se
describe como una forma reducida (menos cuestiones en cada escala) del instrumen-
to anterior que evalúa áreas homogéneas de intereses. Zytowski (1985) reconoce que
la fiabilidad de la nueva escala es menor que la de las formas E o C, haciendo que re-
ciban el nombre de “estimación” de intereses. Asimismo, el perfil ofrece instruccio-
nes para convertir los percentiles de la estimación en códigos Holland combinando
las distintas escalas. Por ejemplo, las escalas “aire libre” y “mecánica” se combinan
para estimar el tipo “realista” de Holland, y la “administrativa” e “informática” se
combinan para representar el tipo “convencional”.
I1v.2.3. Fiabilidad y validez
Un inventario como el Kuder, el cual más que discriminar entre individuos propor-
ciona resultados ordenados en rangos para discriminar los intereses del sujeto, tiene
unos requisitos especiales para los análisis de la fiabilidad. La fiabilidad test-retest
sólo puede evaluarse en términos de lo consistente que es el orden de las puntuacio-
nes de un sujeto de una prueba a la siguiente. Kuder y Diamond (1979) comproba-
ron la fiabilidad —a las dos semanas— de la escala laboral en estudiantes de instituto
y universidad; la media de la fiabilidad en todos los casos fue de 0,90. Zytowski
(1985), empleando 192 estudiantes universitarios, obtuvo una estabilidad del perfil
de la estimación de intereses en un intervalo de dos semanas de 0,80. Zytowski
(1985) realizó un estudio de validez predictiva con más de 800 sujetos a los que loca-
lizó después de 12-19 años de haber completado esta encuesta; un 51% de los sujetos
estaba empleado en trabajos predichos por las puntuaciones de la encuesta de intere-
ses laborales de Kuder.
1v3. Inventarios de intereses de Holland
La aparición de la teoría de las carreras profesionales de Holland (1959, 1966) coin-

cidió con el desarrollo del Vocational preference inventory [Inventario de preferen-
cias vocacionales] (Holland, 1958). Basándose en los datos de intereses recogidos
con el inventario vocacional, junto con datos de otros inventarios de intereses, de
personalidad y de valores, Holland formuló su teoría de la vocación y la personali-
dad. Según Holland, las personas pueden dividirse en seis tipos o alguna combina-
ción de éstos: realista (R), artístico (A), investigador (1), social (S), empresarial (E) y
convencional (C). Holland indica que los tipos pueden organizarse en un hexágo-
no en el orden R-I-A-S-E-C; los tipos adyacentes en el hexágono (por ejemplo,
realista-investigador, empresarial-convencional) están más relacionados que los
diametralmente opuestos (por ejemplo, realista-social, artístico-convencional). Los
intentos para verificar la representación hexagonal de Holland en el mundo laboral
muestran, en general, que la estructura de los intereses se aproxima a la organiza-
ción teórica propuesta por el autor (Cole y Hansen, 1971; Edwards y Whitney,
1972; Campbell y Hansen, 1981). La teoría de Holland ha conducido al desarrollo
de inventarios y conjuntos de escalas para evaluar sus seis tipos, como por ejemplo
el Self-directed search [Registro autodirigido] (Holland, 1971), el ACT interest in-
ventory [Inventario de intereses ACT] (Lamb y Prediger, 1981), el System for career
decision-making [Sistema para la toma de decisiones sobre la carrera profesional]
(Harrington y O'Shea, 1976) y el General occupational themes [Temas generales de
ocupación] del Inventario de intereses profesionales de Strong (Campbell y Ho-
lland, 1972; Hansen y Johansson, 1972).
v3.1. Vocational preference inventory [Inventario de preferencias

vocacionales]
El desarrollo del Vocational preference inventory [Inventario de preferencias voca-

cionales] se basó en una serie de informes teóricos y empíricos. Holland identificó
los factores de personalidad e intereses y formuló hipótesis de cómo se relacionan
entre ellos. Para ello, empleó una lista de 160 trabajos con el fin de desarrollar una
batería de cuestiones que representara los factores de intereses o tipos; por ejemplo:
Criminólogo SóiNo
Camarero de un restaurante SímuiNo
Fotograbador Sí No
Domador de fieras SiphNo
La versión actual del inventario vocacional (Holland, 19854) tiene siete escalas
homogéneas, construidas a partir de una serie de pasos empírico-racionales que eva-
lúan el autocontrol, más los seis tipos de Holland (realista, artístico, investigador, so-
cial, empresarial y convencional). Otras escalas del inventario vocacional desarrolla-
das empleando métodos empíricos de construcción de escalas son las siguientes:
aquiescencia, que evalúa la disposición a decir “sí” a las cuestiones; estatus, que indi-
ca el interés en el estatus laboral; masculinidad-feminidad, que evalúa el interés por
trabajos tradicionalmente preferidos por hombres o mujeres; e infrecuencia, que
evalúa la tendencia a contestar a las cuestiones en una dirección atípica.
El Vocational preference inventory [Inventario de preferencias vocacionales]
puede ser puntuado manualmente; las puntuaciones brutas se marcan en el perfil
masculino o en el femenino. Aunque Holland es un firme defensor del uso de pun-
tuaciones brutas para predecir la ocupación, el perfil proporciona puntuaciones nor-
malizadas. El coeficiente medio de fiabilidad test-retest de las once escalas en un in-
tervalo de dos semanas es de 0,72.
1v.3.2. Self-directed search [Registro autodirigido] (Holland, 1985b, 1987)
El Self-directed search [Registro autodirigido)], similar al Vocational preference in-

ventory [Inventario de preferencias vocacionales], fue elaborado para evaluar los seis
tipos de Holland. Puede autoadministrarse, autopuntuarse y, en cierta medida, ser
interpretado por uno mismo. La prueba, con 228 cuestiones, incluye cuatro seccio-
nes: actividades que al sujeto le gustaría hacer, aptitudes, trabajos y autoestimacio-
nes; por ejemplo:
Actividad:
Arreglar aparatos eléctricos ...oiicioniononsmonmmmmnmmmnss Me gusta Me disgusta
Aptitud:
Sé programar un ordenador para
estudiar un problema CientifiCO ..ocociocnincinanincaninonas 4 No
TIA Al A AAA
E IA TR 55 No
Autoestimación:
Habilidad MAdAGICA ao as. abad ia llo danes 7654321
El nivel de lectura de esta prueba se sitúa en séptimo u octavo curso; la forma fá-
cil (E), que sólo tiene 203 cuestiones, presenta una dificultad equivalente a cuarto
curso. Las puntuaciones brutas obtenidas más altas implican la asignación al sujeto
de los códigos primario, secundario o terciario (Thorndike y cols., 1991). El coefi-
ciente de fiabilidad media de las seis escalas del Self-directed search [Registro autodi-
rigido] es de 0,82 en estudiantes de instituto en un intervalo de dos semanas y de 0,92
en un intervalo de 7 a 10 meses en estudiantes universitarios (Holland, 1978, 1979,
1985b, 1985c). Los estudios sobre la validez predictiva, tanto del Vocational prefe-
rence inventory [Inventario de preferencias vocacionales] como del Self-directed
search [Registro autodirigido), para la elección de trabajo y especialidad universita-
ria en intervalos de uno, dos y tres años varía del 35 al 66% de exactitud (Holland,
1962, 1979, 1985c, 1987; Holland y Lutz, 1968).
912 Jo-Ida C. Hansen y J.Carlos Sierra
1v4. Otros inventarios de intereses
Posteriores al Strong, Kuder o Holland se han elaborado otros inventarios de intere-

ses; su uso no es tan frecuente como los descritos anteriormente y representan una
variedad de técnicas de construcción de escalas.
1v.41. Jackson vocational interest inventory [Inventario de intereses

vocacionales de Jackson]
La Jackson vocational interest survey [Encuesta de intereses vocacionales de Jack-
son] (Jackson, 1977), dirigida a estudiantes de instituto y universidad, y adultos que
necesitan ayuda en la decisión sobre la educación y la carrera profesional, está com-
puesta por 289 cuestiones de elección forzosa que describen actividades laborales.
Las 34 escalas homogéneas que evalúan funciones y estilos de trabajo contienen cada
una 17 cuestiones con un nivel de lectura de séptimo curso. Las escalas de funciones
incluyen cinco que caracterizan trabajos específicos (por ejemplo, ingeniería o edu-
cación elemental) y veintiuna que representan una agrupación de trabajos (por ejem-
plo, artes creativas o ciencias sociales). Las ocho escalas de estilos de trabajo evalúan
las preferencias por ambientes que requieren ciertas conductas (por ejemplo, lide-
razgo dominante o responsabilidad). El perfil del Inventario de Jackson puntuado
manualmente incluye sólo las 34 escalas de intereses básicos; el perfil puntuado me-
cánicamente incluye además diez temas laborales generales que evalúan patrones
amplios de intereses, los cuales reflejan la orientación hacia el trabajo del sujeto más
que sus intereses (por ejemplo, lógico o empresarial), diecisiete grupos de especiali-
dades universitarias (clasificaciones educativas) y treinta y dos grupos laborales (cla-
sificaciones laborales).
El desarrollo de las 34 escalas homogéneas de intereses básicos se fundamenta en
la elaboración de escalas basadas en una teoría. El proceso se inició con la identifica-
ción de los intereses que se evaluarían a partir de la investigación previa en psicología
vocacional. Entonces se redactaron 3 000 cuestiones que representaran los construc-
tos de interés. Finalmente, la batería de cuestiones se sometió a una serie de análisis
factoriales para identificar las 289 cuestiones que tenían correlaciones altas con pun-
tuaciones de factores en sus propias escalas y correlaciones bajas con otras escalas de
la encuesta de Jackson. Después se elaboraron los diez temas laborales generales
analizando factorialmente las 34 escalas básicas. Las normas de puntuación normali-
zada para las escalas básicas y de temas se basan en una muestra de ambos sexos de
estudiantes de instituto y universidad. Las clasificaciones educativa y laboral impli-
can análisis del perfil completo de un individuo en varias especialidades universita-
rias y de los empleados en una gran variedad de trabajos. Los índices de fiabilidad de
esta escala son aceptables; en cuanto a su validez predictiva, hasta el momento no
existen apenas estudios (Murphy y Davidshofer, 1991).
Iv.42. Vocational interest inventory [Inventario de intereses vocacionales]

El Inventario de intereses vocacionales (Lunneborg, 1976, 1981), diseñado para el
uso con jóvenes, es similar al de Jackson en varias dimensiones. Primero, los intere-
ses evaluados se seleccionaron basándose en consideraciones teóricas. Las ocho es-
calas homogéneas del inventario se desarrollaron para representar a los ocho grupos
descritos en la teoría de las clasificaciones laborales de Roe: servicios, contactos co-
merciales, organización, técnica, trabajo al aire libre, ciencia, cultura general, artes y
diversión. Segundo, las escalas se construyeron usando una serie de análisis factoria-
les que redujeron la batería inicial hasta las 112 cuestiones finales de elección forzosa.
Cada una de las ocho escalas contiene 28 elecciones de respuesta que presentan ele-
vadas correlaciones con las puntuaciones de factores de sus propias escalas y bajas
correlaciones con otras escalas del inventario. Tercero, las escalas fueron normaliza-
das en una muestra de estudiantes de ambos sexos. Según Lunneborg (1981), sólo las
puntuaciones de dos escalas son independientes del sexo y de este modo el inventa-
rio puede tener problemas de sesgo en la interpretación para un sexo o el otro.
1V.43. -Ohio vocational interest survey [Encuesta de intereses vocacionales

de Ohio]
La primera edición de la Ohzo vocational interest survey [Encuesta de intereses vo-

cacionales de Ohio] (D'Costa y cols., 1969, 1970) también fue elaborada para su uso
con jóvenes, especialmente a partir de séptimo curso y en el instituto. Las escalas ho-
mogéneas de esta encuesta se realizaron a partir del modelo de datos-personas-cosas
del diccionario de títulos ocupacionales. Las primeras escalas (trabajo de industria,
oficios, servicios al cliente o enfermería) se formularon racionalmente, pidiendo a las
personas familiarizadas con las definiciones de las escalas que asignaran valores, se-
gún su estimación, a la escala o escalas apropiadas. Tras el agrupamiento racional ini-
cial de cuestiones relacionadas, se empleó una serie de análisis factoriales para refinar
la batería de cuestiones, de lo que resultaron 280 cuestiones más correlacionadas con
sus propias escalas que con las otras. La Ohio vocational interest survey II [Encuesta
de intereses vocacionales de Ohio II] (Winefordner, 1983) está compuesta por 253
cuestiones, de las que aproximadamente una cuarta parte procecen de la versión L.
Debido a que las versiones 1 y II de la encuesta están basadas en esquemas distintos
de clasificación, la equivalencia entre los dos grupos no es exacta; por ejemplo, los
agrupamientos de la versión L, “servicios personales” y “cuidado de las personas” se
fundieron en “servicios básicos” en la versión IT. El perfil de esta última proporciona
un orden percentil para hombres y mujeres en tres grados: 7-9, 10-12 y 13-14.
1v.44. Career assessment inventory (Inventario de evaluación de carreras

profesionales)
La primera edición del Career assessment inventory [Inventario de evaluación de ca-
rreras profesionales] (Johansson, 1975; Johansson y Johansson, 1978) fue desarrollada
914 Jo-Ida C. Hansen y ]. Carlos Sierra
para su uso con individuos que estaban pendientes de una inmediata entrada en una
carrera, educación universitaria o preparación técnica, y se elaboró según elInventario
de intereses profesionales de Strong. En 1982 se tomó la decisión de cambiar de escalas
laborales por sexos a las de sexo combinado. La versión mejorada publicada en 1986
(Johansson, 1986) se ha ampliado para incluir varias escalas laborales que representan
ocupaciones profesionales. La versión de 1986 incluye 370 cuestiones y el perfil, al
¡gual que el inventario de Strong; contiene tres grupos de escalas: 6 temas generales ho-
mogéneos, 25 áreas homogéneas de intereses básicos y 111 escalas laborales homogé-
neas. El inventario emplea también la teoría de Holland para organizar las áreas de in-
tereses básicos y escalas laborales en el perfil, agrupando aquellas que representan cada
uno de los tipos de Holland. Los temas generales y las áreas de intereses básicos están
ajustadas según una muestra de referencia de ambos sexos compuesta por adultos con
empleo y estudiantes, obtenida a partir de las seis áreas de intereses de Holland; 75 mu-
jeres y 75 hombres de cada uno de los seis grupos, un total de 900 sujetos, componen la
muestra. Las escalas laborales fueron elaboradas empleando el método empírico de
muestras de contraste utilizado por Strong pero, a diferencia de las de éste, se desarro-
llaron con un criterio de sexos combinados y muestras de referencia general. Muchas
de estas muestras de ambos sexos distan mucho del objetivo ideal de representar igual-
mente a hombres y mujeres dentro de la muestra (por ejemplo, no aparece ninguna
mujer mecánica aeronáutica y ningún hombre secretario). Los índices de fiabilidad se
sitúan entre 0,70 y 0,90 (Murphy y Davidshofer, 1991), y la validez de las escalas es
cuestionable por la escasa representación de los sexos.
IV.4.5, «Temario vocacional de García Yagúe»
Esta prueba, aplicable a los niveles superiores del bachiller, está formada por
139 cuestiones que permiten evaluar los intereses en ocho ocupaciones diferentes:
teórico-especulativas, técnico-aplicadas, estéticas, físico- matemáticas, biológicas,
humanísticas, terapéuticas y personales. Asimismo, permite relacionar los intereses
del sujeto con los de diferentes grupos de estudiantes varones de los últimos cursos
de 28 carreras (Alonso Tapia, 1992).
V. ESTABILIDAD DE LOS INTERESES
El grado en que los intereses son estables es un factor importante para la capacidad
predictiva de los inventarios. Si los intereses son inconstantes e inestables, las pun-
tuaciones obtenidas en los inventarios no explicarán la variación de la predicción. La
duración de los intereses fue una de las primeras preocupaciones de los investigado-
res de la evaluación de intereses (Strong, 1943). Los métodos longitudinales y seccio-
nales han sido empleados en multitud de estudios para documentar que los intereses
son estables, incluso en edades tempranas de 15 ó 16 años. A los 20 años, la estabili-
dad de los intereses es obvia, incluso en intervalos test-retest de 5 a 10 años; a los 25
años muestran una mayor estabilidad (Johansson y Campbell, 1971). En la larga his-
toria del Inventario de intereses profesionales de Strong, más de 30 ocupaciones se

han comprobado al menos tres veces: en las décadas de los años treinta, sesenta y se-
tenta. Los análisis de estos datos han mostrado que los intereses de grupos de trabajo
muestreados al azar son estables..
VI. USO DE LOS INVENTARIOS DE INTERESES
Los inventarios de intereses son utilizados por parte de una serie de instituciones
(asesorías de institutos y universidades, agencias de servicios sociales, agencias de
empleo, firmas consultoras, corporaciones y organizaciones comunitarias...) para
evaluar con eficacia los intereses.
vI1. Exploración de las carreras profesionales

El principal objetivo de la evaluación de intereses es aconsejar sobre carreras, con el
fin de tomar decisiones acerca de la elección de especialidad, elección de trabajo, ha-
cer un cambio de carrera o preparar la jubilación. Primero, los asesores emplean los
perfiles de los inventarios para formular hipótesis sobre los clientes, las cuales pue-
den discutirse, confirmarse o descartarse. Entonces, las puntuaciones y perfiles pro-
porcionan un marco de exploración de los intereses y un mecanismo para ayudar al
cliente a integrar su historia pasada con los intereses actuales. Los resultados del in-
ventario sirven de punto de partida para la evaluación de los intereses, como un mé-
todo eficaz para identificar objetivamente los intereses y como estructura para el
asesoramiento. Los resultados ayudan a los asesorados a aumentar las opciones que
están considerando. Algunos emplean los resultados para reducir la gama de eleccio-
nes posibles; otros sólo quieren confirmar las decisiones vocacionales o educativas
que ya han tomado.
v12. Selección de personal

Los inventarios de intereses también se emplean para evaluar los intereses durante la
selección de empleos, ayudando a identificar entre los candidatos aquellos que reali-
zarán con mayor probabilidad el programa de preparación y permanecerán en la pro-
fesión (Berdie y Campbell, 1968; Reeves y Booth, 1979). Incluso, después de la selec-
ción inicial, los inventarios de intereses pueden emplearse para ayudar a un empleado
a encontrar el trabajo adecuado dentro de la empresa (Dunnette y Kirchner, 1965).
vi3. Investigación
Los investigadores usan las técnicas de evaluación de intereses (cuestionarios, auto-

evaluaciones, escalas de estimación e inventarios) para organizar los rasgos de intere-
ses, investigar el origen y desarrollo de éstos, explorar los cambios o estabilidad de la

sociedad y comprender la relación entre intereses y Otras variables psicológicas
como habilidades, satisfacción, éxito y personalidad. Los estudios que evalúanlaes-
tructura de los intereses, así como los de varios colectivos laborales, proporcionan
información para comprender la organización del mundo del trabajo y las relaciones
entre ocupaciones. La mayoría de los inventarios de intereses se elabora para eva-
luar los intereses vocacionales. Sin embargo, las investigaciones recientes indican
que instrumentos como el Inventario de intereses profesionales de Strong no sólo
evalúan los intereses vocacionales, sino también los de ocio (Cairo, 1979). Holland
(1973) propuso que los instrumentos que evalúan sus seis tipos de personalidad tam-
bién pueden identificar, además de las actividades laborales, las preferencias del suje-
to por ambientes y tipos de personas.
VII. PERSPECTIVAS FUTURAS EN LA EVALUACIÓN DE LOS INTERESES
La frecuencia de uso de pruebas para asesoramiento no ha cambiado apreciablemen-

te en los últimos veinticinco años; sin embargo, el uso de inventarios de intereses ha
aumentado, mientras que el de otras pruebas de habilidades, aptitudes, logros, etc.
ha decrecido (Zytowski y Warman, 1982). Existe en el mercado una gran variedad de
materiales nuevos, paquetes de guías de estudios y sistemas informatizados para la
interpretación de inventarios y exploración de carreras. Las evaluaciones del uso de
los inventarios de intereses indican que los distintos modos y medios de presenta-
ción son igualmente eficaces (Smith y Evans, 1973; Johnson, Korn y Dunn, 1975;
Maola y Kane, 1976; Rubinstein, 1978; Miller y Cochran, 1979). La perspectiva fu-
tura, con presupuestos restrictivos y reducción de personal en las instituciones edu-
cativas, implicará una mayor utilización de ordenadores para la administración e in-
terpretación de inventarios de intereses. En la actualidad son accesibles las técnicas
de desarrollo de inventarios de intereses válidos y fiables, y los métodos de realiza-
ción han llegado a un nivel óptimo de fiabilidad y validez. Por tanto, los autores de-
ben dirigir sus esfuerzos a aumentar el énfasis en la interpretación y competencia de
asesoramiento.
A medida que el uso de inventarios de intereses se extiende a nuevas poblaciones,
las investigaciones han de ir en la misma dirección para ayudar a comprender las ca-
racterísticas de las poblaciones. El uso intercultural de los inventarios de intereses
está aumentando la demanda de traducciones adecuadas de los inventarios, elabora-
dos en un primer momento para la población estadounidense.
VI. CONCLUSIONES
Estos inventarios se seguirán empleando en el futuro igual que en el pasado con el

objetivo de organizar los rasgos de intereses. Se seguirán realizando esfuerzos para
contestar a las viejas cuestiones de la interacción entre intereses y personalidad, éxi-
to, valores, satisfacción y habilidades. La teoría de Holland sin duda seguirá provo-
cando investigaciones en el campo. Los estudios diseñados para comprender los
abandonos y cambios educativos y laborales, analizar la satisfacción laboral, enten-
der el desarrollo de los intereses y predecir el trabajo o el éxito académico se basarán
en los constructos teóricos de Holland para las variables independientes y en los in-
ventarios de intereses para identificarlos. La exploración de los intereses vocaciona-
les ha sido siempre un tema popular en la psicología de asesoramiento; el uso cre-
ciente de inventarios y programas de guías de carreras indica que los inventarios de
intereses seguirán siendo un componente importante de la investigación psicológica.
Investigaciones más recientes intentan ir más allá de la evaluación de los intereses,
tratando de explicar el desarrollo de los mismos (Barak, Shiloh y Haushner, 1992).
Alonso Tapia. J. (1992). Evaluación de la motivación. En R. Fernández-Ballesteros (dir.), In-

Barak, A., Shiloh, S. y Haushner, O. (1992). Modification of interest through cognitive res-
tructuring: Test of a theoretical model in preschool children. Journal of Counseling Psy-
chology, 39, 490-497.
Berdie, R. F. y Campbell, D. P. (1968). Measurement of interest. En D. K. Whitla (dir.),
Handbook of measurement and assessment in behavioral sciences. Reading. Addison-
Wesley.
Cairo, P. C. (1979). The validity of the Holland and Basic Interest Scales of the Strong Voca-
tional Interest Blank: Leisure activities versus occupational membership as criteria. Jonr-
nal of Vocational Behavior, 15, 68-77.
Campbell, D. P. (1966). Occupations ten years later of high school seniors with high scores
on the SVIB life insurance salesman scale. Journal ofApplied Psychology, 50, 369-372.
Campbell, D. P., Borgen, F. H., Eastes, S. H., Johansson, C. B. y Peterson, R. A. (1968). A set
of basic interest scales for the Strong Vocational Interest Blank for Men. Journal of Ap-
plied Psychology Monograph, 52, 1-54.
Campbell, D. P. y Hansen, J. C. (1981). Manual for the SVIB-SCII (3.2 ed.). Stanford. Stanford
University Press.
Campbell, D. P. y Holland, J. L. (1972). Applying Holland's theory to Strong's data. Journal
of Vocational Behavior, 2, 353-376.
Clark, K. E. (1956). Manual for use of the Navy Vocational Interest Inventory. Minneápolis.
University of Minnesota Press.
Cole, N. S. y Hansen, G. (1971). An analysis of the structure of vocational interests (ACT Re-
search Report No. 40). lowa City. American College Testing Program.
Cowdery, K. M. (1926). Measurement of professional attitudes: Differences between law-
yers, physicians, and engineers. Jomrnal of Personnel Research, 5, 131-141...
D'Costa, A. G., Winefordner, D. W., Odgers, J. G. y Koons, P. B. (1969). Ohio Vocational
Interest Survey. Nueva York. Harcourt, Brace, and World.
D'Costa, A. G., Winefordner, D. W., Odgers,J.G. y Koons, P. B. (1970). Ohio Vocational
Interest Survey Manual for interpreting. Nueva York. Harcourt, Brace and Jovanovich.
Dolliver, R. H., Irvin, J. A. y Bigley, S. E. (1972). Twelve —year follow-up of the Strong Vo-
cational Interest Blank. Journal of Counseling Psychology, 19, 212-217.
Dunnette, M. D. y Kirchner, W. K. (1965). Psychology applied to industry. Nueva York. Ap-

“pleton-Century-Crofts. !
Edwards, K. J. y Whitney, D. R. (1972). A structural analysis of Holland's personality types
using factor and configural analysis. Journal of Comnseling Psychology, 19, 136-145.
Engen, H. B., Lamb, R.R. y Prediger, D. J. (1982). Are secondary schools still using standar-
dized tests? Personnel and Guidance Journal, 60, 287-290.
Freyd, M. (1923). The measurement of interests in vocational selection. Journal of Personnel
Research, 1, 319-328.
Hansen, J. C. (1976). Exploring new directions for Strong-Campbell Interest Inventory oc-
cupational scale construction. Journal of Vocational Behavior, 9, 147-160.
Hansen, J. C. (1983). Correlation between VPI and SCI scores. Manuscrito inédito. Center for
Interest Measurement Research, University of Minnesota.
Hansen, J. C. (1984). User's guide to the SVIB-SCI1. Stanford. Stanford University Press.
Hansen, J. C. (1986). 12-year longitudinal study of the predictive validity of the SVIB-SCIT.
Comunicación presentada en Meetings of the American Psychological Association. Was-
hington, D.C., EE UU.
Hansen, J. C. (1987). Strong-Hansen Occupational Guide. Palo Alto. Consulting Psycholo-
ists Press.
EA J. C. (1988b). Strong Interest Inventory interpretive report. Palo Alto. Consulting
Psychologists Press.
Hansen, J. C. y Campbell, D. P. (1985). Manual for the SVIB-SCII (4.* ed.). Stanford. Stan-
ford University Press.
Hansen, J. C. y Johansson, C. B. (1972). The application of Holland's vocational model to the
Strong Vocational Interest Blank for Women. Journal of Vocational Behavior, 2, 479-493.
Hansen, J. C. y Swanson, J. L. (1983). Stability of interests and the predictive and concurrent
validity of the 1981 Strong-Campbell Interest Inventory. Journal of Counseling Psycho-
logy, 30, 194-201.
Harmon, L. W. (1969). The predictive power over 10 years of measured social service and
scientific interests among college women. Journal ofApplied Psychology, 53, 193-198.
Harrington, T. F. y O'Shea, A. ]. (1976). Manual for the Harrington/O'Shea Systems for Ca-
reer Decision-Making. Needham. Career Planning Associates.
Holland, J. L. (1958). A personality inventory employing occupational titles. Journal of Ap-
plied Psychology, 42, 336-342.
SS J. L. (1959). A theory of vocational choice. Journal of Counseling Psychology, 6, 35-
Holland, J. L. (1962). Some explorations of a theory of vocational choice: 1. One- and two-
year longitudinal studies. Psychological Monographs, 76. > .
Holland, J. L. (1966). The psychology of vocational choice.M- 11m. Blaisdell.
Holland, J. L. (1971). The connselor's guide to the Self-Dircued Search. Palo Alto. Consul-
ting Psychologists Press.
Holland, J. L. (1973). Making vocational choices: A theory of careers. Englewood Cliffs.
Prentice-Hall. |
Holland, J. L. (1978). Manual for the Vocational Preferen . wentory (3.2 ed.). Palo Alto.
Consulting Psychologists Press.
Holland, J. L. (1979). The Self-Directed Search Professional Manual. Palo Alto, Consulting
Psychologists Press.
Holland, J. L. (19854). (VP1) Manual-1985 Edition. Odessa. Psychological Assessment Re-
SOUrces.
Holland, J. L. (1985b). The Self-Directed Search professional manual-1985 edition. Odessa,
Psychological Assessment Resources.
Holland, J. L. (1985c). The Occnpations Finder. Odessa. Psychological Assessment Resour-
ces.
Holland, J. L. (1987). 1987 manual supplement for the Self- Directed Search. Odessa. Psycho-
logical Assessment Resources.
Holland, J. L. y Lutz, S. W. (1968). Predicting a student's vocational choice. Personnel and
Guidance Journal, 46, 428-436.
Hubbard, R. M. (1930). Interest Analysis Blank. En D. G. Paterson, R. M. Elliott, L. D. An-
derson, H. A. Toops y E. Heidbrider (dirs.), Minnesota Mechanical Ability Test. Minneá-
polis. University of Minnesota Press.
Jackson, D. N. (1977). Jackson Vocational Interest Survey Manual. Londres. Research Psy-
chologists Press.
Johansson, C. B. (1975). Manual for the Career Assessment Inventory. Minneápolis. Natio-
nal Computer Systems.
Johansson, C. B. (1986). Career Assessment 1nventory: Enhanced Version. Minneápolis. Na-
tional Computer Systems.
Johansson, C. B. y Campbell, D. P. (1971). Stability of the Strong Vocational Interest Blank
for Men. Journal of Applied Psychology, 55, 24-26.
Johansson, C. B. y Johansson, J. C. (1978). Manual Supplement for the Career Assessment In-
ventory. Minneápolis. National Computer Systems.
Johnson, W. F., Korn, T. A. y Dunn, D. J. (1975). Comparing three methods of presenting
occupational information. Vocational Guidance Quarterly, 24, 62-65.
Kitson, H. D. (1925). The psychology of vocational adjustment. Filadelfia. Lippincott.
Kornhauser, A. W. (1927). Results from a quantitative questionnaire of likes and dislikes
used with a group of college freshmen. Journal ofApplied Psychology, 11, 85-94.
Kuder, G. F. (1939). Kuder Preference Record-Form A. Chicago. University of Chicago
Bookstore.
Kuder, G. F. (1943). Vocational Preference Record-Form B. Chicago. Science Research Asso-
ciates.
Kuder, G. F. (1948). Kuder Preference Record-Form C (Vocational). Chicago. Science Re-
search Associates.
Kuder, G. F. (1966). General Manual: Occupational Interest Survey Form-DD. Chicago.
Science Research Associates.
Kuder, G. F. (1977). Activity interests and occupational choice. Chicago. Science Research
Associates.
Kuder, G. F (1988). Kuder General Interest Survey, Form E. Chicago. Science Research As-
sociates.
Kuder, G. F. y Diamond, E. E. (1979). Kuder Occupational Interest Survey: General
Manual. Chicago. Science Research Associates.
Lamb, R. R. y Prediger, D. J. (1981). Technical Report for the unisex edition of the ACT Inte-
rest Inventory. lowa City. American College Testing Program. EP
Lunneborg, P. Y. (1976). Manual for the Vocational Interest Survey. Seattle. University of
Washington, Educational Assessment Center. 2
Lunneborg, P. W. (1981). Vocational Interest Inventory Manual. Los Angeles. Western Psy-
chological Services. .
Maola,J. y Kane, G. (1976). Comparison of computer-based versus counselor-based occupa-
tional information systems with disadvantaged vocational students. Journal of Counse-
ling Psychology, 23, 163-165.
Miller, M. J. y Cochran, J. R. (1979). Evaluating the use of technology in reporting SCII re-
sults to students. Measurement and Evaluation in Guidance, 12, 166-173.
Miner, J. B. (1922). An aid to the analysis of vocational interests. Journal of Educational Re-
search, 5, 311-323.
Murphy, K. R. y Davidshofer, C. O. (1991). Interest assessment. En K. R. Murphy y C. O.
Davidshofer (dirs.), Psychological testing. Principles and aplications. Nueva Jersey. Prenti-
ce-Hall.
Parsons, F. (1909). Choosing a vocation. Boston. Houghton Mifflin. :

' Paterson, D. G., Elliott, R. M., Anderson, L. D., Toops, H. A. y Heidbreder, E. (dirs.) (1930).
Minnesota Mechanical Abilities Test. Minneápolis. University of Minnesota Press.
Reeves, D. ]. y Booth, R. F. (1979). Expressed versus inventoried interests as predictors of pa-
ramedical effectiveness. Journal of Vocational Behavior, 15, 155-163.
Remmers, H. H. (1929). The measurement of interest differences between students of engt-
neering and agriculture. Journal ofApplied Psychology, 13, 105-119.
Roe, A. (1956). The psychology of occupations. Nueva York. Wiley.
Rubinstein, M. R. (1978). Integrative interpretation of vocational inventory results. Journal
of Counseling Psychology, 25, 306-309. 5.
Smith, R. D. y Evans, J. (1973). Comparison of experimental group and individual counse-
ling facilitators of vocational development. Journal of Counseling Psychology, 20, 202-
208.
Spokane, A. R. (1979). Occupational preferences and the validity of the Strong-Campbell In-
terest Inventory for college women and men. Journal of Counseling Psychology, 26, 312-
318.
Strong, E. K. (1927). Vocational Interest Blank. Stanford. Stanford University Press.
Strong, E. K. (1943). Vocational interests of men and women. Stanford. Stanford University
Press.
Thorndike, R. M., Cunningham, G. K., Thorndike, R. L. y Hagen, E. P. (1991). Interest, per-
sonality, and adjustment. En R. M. Thorndike, G. K. Cunningham, R. L. Thorndike y
E. P. Hagen (dirs.), Measurement and evaluation in psychology and education. Nueva
York. Maxwell McMillan.
Webber, P. L. y Harmon, L. W. (1978). The reliability and concurrent validity of three types
of occupational scales for two occupational groups. En C. K. Tittle y D. G. Zytowski
(dirs.), Sex-fair interest measurement: Research and implications. Washington, D. C. Na-
tional Institute of Education.
Winefordner, D. W. (1983). Ohio Vocational Interest Survey: Manual for interpreting
(2.* ed.). Nueva York. Harcourt Brace Jovanovich.
Zytowski, D. G. (1985). Kuder DD Manual Supplement. Chicago. Science Research Asso-
ciates.
Zytowski, D. G. y Warman, R. E. (1982). The changing use of tests in counseling. Measure-
ment and Evaluation in Guidance, 15, 147-152.
Aiken, L. R. (1985). Psychological testing and assessment. Boston. Allyn and Bacon.
Hansen, J. C. (1990). Interest inventories. En G. Goldstein y M. Hersen (dirs.), Handbook of
Psychological assessment (2.* ed.). Nueva York. Pergamon Press.
Kaplan, R. M. y Saccuzzo, D. P. (1993). Psychological testing. Principles, applications, and is-
sues (3.2 ed.). Belmont. Brooks/Cole Publishing.
Murphy, K. R. y Davidshoffer, C. O. (1991). Psychological testing. Principles and aplicatio-
nes. Nueva Jersey. Prentice-Hall.
Brooks/Cole Publishing.
y us DADO
+
El AE
Sion ER (19277 Y > mm
Seroag; E K Ajo re Les
3 De ZATAA PY
A
á
Tho? e R. M Cc iban ¡cATS
q E
E deny ¿ 311 dalt: HE a En de wi virruda e 657.5 Cuna
E 7 Pinos Adios od chusta LES re
ES s ” 1] '
he 3
a n ñ hi
y mo e PA fiar Ma we Wash son

E 4 €
Fis Y 4
iq E AMroey! Mara Lo rel
/ Mid CH, Sata nte 1 Aad Vusno

paul
Ds 2. Mess,
37. EVALUACIÓN EN PSICOLOGÍA DEL DEPORTE
JAUME CRUZ y LLUÍS CAPDEVILA
I.. EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN EN PSICOLOGÍA DEL DEPORTE
La psicología del deporte tiene una corta historia en la mayoría de los países. Esta
área de aplicación de la Psicología no obtuvo de hecho su reconocimiento oficial, a
nivel internacional, hasta el 1Congreso Mundial de Psicología del Deporte celebra-
do en Roma en el año 1965, pese a que ya existían trabajos de autores pioneros como
Rudik y Puni en la antigua Unión Soviética y Griffith en Estados Unidos, en la déca-
da de los años veinte. Estos pioneros realizaron estudios sobre dos temas fundamen-
tales: el aprendizaje de destrezas motoras y la evaluación de la personalidad de los
deportistas (Cruz, 1991).
En la evaluación de los deportistas, los autores soviéticos utilizaron fundamen-
talmente tests de personalidad, tests de inteligencia y tests psicomotores para identi-
ficar las características individuales que podían predecir el éxito deportivo. Así, a
partir de 1925, Rudik evaluaba el tiempo de reacción en el Instituto de Cultura Física
de Moscú, y Puni, en Leningrado, realizaba una investigación complementaria al es-
tudiar los efectos de la práctica de algún deporte —el esquí, en su caso— en el de-
sarrollo de la personalidad del deportista (Rudik, 1960). En Europa occidental, el es-
tudio de la personalidad de los deportistas también ocupó un lugar destacado
durante los comienzos de la psicología del deporte. Así, en Alemania, Neumann
(1957) estudió las diferencias de personalidad entre deportistas y no deportistas. En
diferentes centros de Medicina del Deporte de España e Italia también se analizaba la
dinámica de grupo en equipos deportivos y se estudiaba empíricamente la aptitud
deportiva mediante tests de papel y lápiz y de una serie de pruebas de laboratorio so-
bre tiempo de reacción, percepción, concentración y vigilancia, como se comprueba
en los trabajos de Antonelli (1964) y Roig-Ibáñez (1964). En Gran Bretaña, Kane
(1973) realizó trabajos para comparar la personalidad de deportistas con la de alum-
nos universitarios de su misma edad pero no deportistas. En Francia, Thill (1975),
partiendo del supuesto de que existe relación entre el deporte que se practica y el
tipo de personalidad, pretendía establecer unos perfiles de personalidad ideales para
cada deporte.
En Estados Unidos, Griffith (1926), a partir de observaciones y entrevistas con
deportistas profesionales y universitarios, identificó una serie de características de
los atletas de éxito como vigor, valentía, inteligencia, euforia, confianza, ajuste emo-
cional, optimismo, diligencia, lealtad y respeto por la autoridad. Posteriormente, en
Universidad Autónoma de Barcelona. A. "> pa

Parte de este trabajo se realizó gracias a una subvención del Ministerio de Educación y Ciencia, Pro-
yecto I+D. Dep. 91-0757.
924 Jaume Cruz y Lluís Capdevila
1962, Ogilvie y Tutko iniciaron una serie de estudios sistemáticos sobre la personali-
dad de los nadadores olímpicos. En una revisión del tema, Ogilvie (1968) concluía
afirmando que ciertos rasgos de personalidad (autoconfianza, determinación, con-
trol emocional, liderazgo, agresividad) —semejantes a las características halladas por
su compatriota Griffith— estaban asociados a los deportistas de éxito. Para evaluar
dichos rasgos, Ogilvie y sus colaboradores desarrollaron el Athletic motivation in-
ventory [Inventario de motivación deportiva] de Tutko, Lyon y Ogilvie (1969). De
acuerdo con la teoría de rasgos, los factores o rasgos de personalidad mencionados
eran relativamente estables y muy consistentes y resultaban útiles para predecir la
conducta en todas las situaciones deportivas. Por esta razón, el Athletic motivation
inventory fue uno de los tests de personalidad deportiva más utilizados.
A partir de la década de los años setenta, se publican los primeros trabajos que
plantean una serie de problemas conceptuales, metodológicos y de interpretación de
los estudios sobre personalidad y rendimiento deportivo (véase Martens, 1975). Ade-
más, los psicólogos del deporte comprueban que diferentes estudios caracterizan a
los deportistas de éxito con diferentes rasgos de personalidad y llegan a resultados y
conclusiones contradictorias, por lo que autores como Fisher, Ryan y Martens (1976)
concluyen que los tests de personalidad, incluso aquellos que son válidos y fiables,
tienen una utilidad práctica muy limitada para predecir el rendimiento deportivo.
A partir de 1975, disminuye el número de artículos sobre evaluación de la perso-
nalidad del deportista y se sustituye progresivamente el enfoque de rasgos por un
enfoque más interaccionista, debido fundamentalmente a la influencia del libro de
Mischell (1968) Personality and assessment. Este nuevo enfoque teórico, junto con el
interés por las características cognitivas de los deportistas provocó un gran aumento
de tests específicos a la situación deportiva, tal como se comprueba en las revisiones
de Aguerri (1986), Landers, Boutcher y Wang (1986) y Vealey (1989, 1992). Los re-
sultados de estos tests se completan, en muchos casos, con una serie de medidas fi-
siológicas y con estudios de observación para obtener un perfil más completo del
deportista, entrenador o árbitro que se estudia.
II. CLASIFICACIÓN DE LOS INSTRUMENTOS DE EVALUACIÓN EN PSICOLOGÍA

DEL DEPORTE
Para evaluar el comportamiento de un deportista o un entrenador en situación de

competición deportiva, normalmente analizamos una o varias respuestas determina-
das en un momento temporal concreto. Podemos suponer que tales respuestas vie-
nen determinadas, en parte, por unos antecedentes y que implican unos consecuen-
tes. Si examinamos la conducta a través del tiempo, estos consecuentes pueden
convertirse en antecedentes y determinar el comportamiento posterior del deportis-
ta. De esta forma, de acuerdo con Fernández-Ballesteros y Carrobles (1981) y Laza-
rus y Folkman (1984), la conducta se tendría que examinar secuencialmente según
las relaciones funcionales con antecedentes y consecuentes. Sin embargo, dada la
complejidad del análisis continuo, la mayoría de los investigadores separa la conduc-
ta en segmentos para su análisis desde un punto de vista pragmático.
Evaluación en psicología del deporte 925
Una vez hemos determinado el segmento de conducta a analizar, tenemos que

decidir el nivel de análisis, que muchas veces se reduce a escoger una técnica o instru-
mento concretos de evaluación. A continuación se clasifican las técnicas de evalua-
ción más utilizadas en psicología del deporte, agrupándolas según la modalidad de
respuesta que globalmente están evaluando.
Autores como Fernández-Ballesteros y Carrobles (1981) proponen una revi-
sión de los sistemas de clasificación y evaluación tradicionales de las conductas
humanas, debido a que presentan algunos inconvenientes importantes: los siste-
mas de respuesta no son excluyentes, existe confusión en los principios clasifi-
catorios utilizados y no hay instrumentos para evaluar objetivamente las dife-
rentes categorías de respuesta. Una clasificación del comportamiento en tres
modalidades de expresión que intenta superar estos inconvenientes, sería la si-
guiente:
a. Modalidad cognitiva (pensamientos, sentimientos, expectativas...)

b. Modalidad conductual externa (lo que hace o dice el sujeto).
c. Modalidad psicofisiológica (frecuencia cardíaca, sudoración, tensión mus-
clar).
En este capítulo utilizaremos el término “indicadores de respuesta” para referir-

nos a los diferentes niveles de clasificación de la conducta.
Dentro del ámbito específico de la psicología del deporte, y en concreto en el
campo de la evaluación conductual de la ansiedad y el estrés en la competición de-
portiva, también encontramos clasificaciones similares del comportamiento de los
deportistas. Por ejemplo, Suinn (1989) propone el estudio de tres indicadores de res-
puesta básicos para inferir la presencia del estrés en la competición: cognitivo, auto-
nómico-fisiológico y conductual-somático. Hackfort y Schwenkmezger (1989)
también distinguen tres niveles para evaluar la ansiedad competitiva: cognitivo, fi-
siológico y conductual. Por último, Scanlan (1984) propone la evaluación del estrés
competitivo en niños a partir de las respuestas de estado de ansiedad a tres niveles:
psicológico, fisiológico y conductual.
Realizando una síntesis de las diferentes clasificaciones, y teniendo en cuenta las
técnicas que se utilizan para la evaluación, existen bases suficientes para considerar
tres indicadores de respuesta que se expresan en la mayor parte de los comporta-
mientos humanos, aunque las denominaciones particulares de cada autor aporten al-
gunos matices diferentes:
a. Indicador cognitivo, cuando se obtiene información psicológica mediante

técnicas subjetivas para evaluar aspectos relacionados con las percepciones, cogn1-
ciones y motivaciones de los individuos, normalmente a partir de tests, cuestionarios
de lápiz y papel, inventarios específicos, autoimftormes o de entrevistas.
b. Indicador conductual, cuando se obtiene información psicológica a partir de
técnicas de observación sistemática de la conducta externa, es decir, lo que hace o
dice el sujeto. En todas las clasificaciones nombradas se distingue un indicador con-
ductual (la conducta observable del atleta), que incluiría a la modalidad motora ex-
terna expresada por otros autores.
c. Indicador fisiológico-bioquímico, cuando se obtiene información psicológi-

ca a partir de técnicas psicofisiológicas de registro (como la electrocardiografía o la
electromiografía), o a partir de técnicas bioquímicas (como el registro de niveles
hormonales, de enzimas o de lactatos en la sangre). Este indicador se etiqueta en al-
gunas ocasiones como psicofisiológico. Le hemos añadido, por su similitud, los re-
gistros bioquímicos relacionados con la conducta, ya que quizás no tengan una ent1-
dad propia y son utilizados frecuentemente en relación con la competición
deportiva.
Así pues, la clasificación que se propone está en función de la naturaleza de los

instrumentos de evaluación utilizados, no atendiendo a ningún enfoque teórico en
especial. A continuación, en los siguientes apartados se sistematizan las principales
técnicas de registro utilizadas en psicología del deporte para recoger información
psicológica relacionada con la competición deportiva y su entorno. Finalmente, se
resumen algunos aspectos metodológicos a tener en cuenta en la evaluación de los
diferentes indicadores.
IM. EVALUACIÓN DEL INDICADOR COGNITIVO
En este apartado intentaremos realizar una clasificación de los instrumentos estan-

darizados (tests y cuestionarios) más utilizados en la evaluación del indicador cogni-
tivo, específicos para la psicología del deporte. Así pues, dejaremos sin comentar
aquellos instrumentos: a) no referenciados en la literatura especializada en psicología
del deporte; b) escasamente utilizados (aunque sean específicos en psicología del de-
porte); c) no específicos de la psicología del deporte, que provienen del ámbito de la
psicología clínica o de la psicología conductual. Como ejemplos de tests no específi-
cos muy utilizados en psicología del deporte cabe destacar el State trait anxiety in-
ventory (STA1) [Cuestionario de estado y de rasgo de ansiedad] utilizado para eva-
luar la ansiedad competitiva (Spielberger, Gorsuch y Lushene, 1970), el Test of
attentional and interpersonal style (TAIS) [Test de estilo atencional e interpersonal]
utilizado para evaluar la atención en situaciones deportivas (Nideffer, 1976) y el Pro-
file of mood states (POMS) [Perfil de estados de ánimo] utilizado para evaluar los es-
tados de ánimo del deportista en situaciones de entrenamiento y de competición
(McNair y Droppleman, 1971). Hay que tener en cuenta que la mayoría de los tests
y cuestionarios utilizados en psicología del deporte están elaborados para evaluar as-
pectos cognitivos del deportista frente al entrenamiento o a la competición, siendo
escasos los instrumentos que pretenden recoger información sobre otros persona-
jes involucrados en la actividad deportiva, como los entrenadores o los árbitros y
jueces.
Desde finales de los años setenta se ha incorporado la especificidad situacional
en el diseño de nuevos tests, que tratan de evaluar tanto los rasgos estables como los
estados temporales de los deportistas ante determinadas situaciones competitivas.
De esta forma, ha surgido una gran cantidad de tests específicos para diferentes mo-
dalidades deportivas. A nivel de clasificación de los tests específicos al deporte, dis-
tinguiremos tres procesos psicológicos básicos que se pretenden evaluar con los ins-
trumentos correspondientes al indicador cognitivo: evaluación de procesos emocio-
nales, evaluación de procesos atencionales y evaluación de procesos motivacionales.
Según esta clasificación, en los siguientes cuadros se enumeran los principales instru-
mentos, especificando el título del test o cuestionario, el autor y el año de publica-
ción. Así, en los cuadros 37.1 y 37.2 se especifican los instrumentos de evaluación de
a emocionales, distinguiendo entre ansiedad (cuadro 37.1) y activación (cua-
Odd:
CUADRO 37.1. Instrumentos para la evaluación de procesos emocionales: ansiedad
Instrumento
— Anxiety assessment for Wrestlers Gould, Horn y Spreeman 1984

— Athletic ways of coping checklist Crocker 1989
— Basketball S-R sport inventory of anxious-
ness Fisher, Horsfall y Morris 1977
— Competitive golf stress inventory Richardson y Norton 1983
— Competitive state anxiety inventory-1 (CSAl-1) | Martens 1977
— Competitive state anxiety inventory-2 (CSAl-2) | Martens, Burton, Vealey, Bump y Smith | 1982
— Precompetitive stress inventory Silva, Hardy, Crace y Slocum 1987
— Sources of stress scale Gould, Horn y Spreeman 1983
— Sport anxiety interpretation measure Hackfort
— Sport competition anxiety test (SCAT) Martens
— Sport pressure checkilist Rushall y Sherman
— The S-R sport inventory of anxlvusness Fisher
— Worry cognition scale Weiss, Klint y Wiese
CUADRO 37.2. Instrumentos para la evaluación de procesos emocionales: activación
Instrumento
— Activation-deactivation adjective checklist Thayer

— Activation-deactivation adjective checklist,
short form Thayer
— Children's arousal scale Anshel 1985
— Ratings of perceived exertion scale (RPE) Borg 1982
— Perceived exertion scale (revised) Noble, Borg, Jacobs, Cici y Kaiser 1983
— Pre-competition psychological checklist Rushall 1979
— Sport pressure checklist Rushall y Sherman
En el cuadro 37.3 se especifican los instrumentos de evaluación de procesos

atencionales. A S
En los cuadros 37.4, 37.5 y 37.6 se especifican los instrumentos de evaluación de
procesos motivacionales, distinguiendo entre motivación para la práctica de activi-
dad física (cuadro 37.4), motivación para el deporte (cuadro 37.5), y autoconfianza y
autoeficacia (cuadro 37.6).
CUADRO 37.3. Evaluación de procesos atencionales
Instrumento
— Baseball test of attentional and interpersonal

style (B-TAIS) Albrecht y Feltz 1987
— Relflery attention questionnaire (RAQ) Etzel 1979
— Tennis test of attentional and interpersonal
style (T-TAIS) Van Schoyck y Grasba 1981
— Testofscoccer attentional style Fisher y Taylor
CUADRO 37.4. Instrumentos para la evaluación de procesos motivacionales: motivación para

la práctica de actividad física
Instrumento
— Adherence to exercise questionnaire Siegel, Johnson y Newhof

— Barriers to exercise and sport questionnaire | Burton, Raedeke y Carroll 1989
— Commitment to physical activity scale Corbin, Nielsen, Borsdorf y Laurie 1987
— Commitment to running scale Carmack y Martens 1979
— Exercise and sport goal inventory Burton, Raedeke y Carroll 1989
— Exercise motivation questionnaire Dzewaltowski 1988
— Freeling scale Rejeski 1989
— General affect scale Hochstetler, Rejeski y Best 1985
— Motivation for participation in physical acti-
vity questionnaire Watkin 1978
— Motivation for physical activity questionnaire | Telama y Silvennoinen 1979
— Personal incentives for exercise question- | Duda y Tappe 1989
nalre
— Reasons for running scale Robbins y Joseph 1985
— Rehabilitation adherence questionnaire Fisher y Domm 1988
— Self-motivation inventory Dishman, Ickes y Morgan 1980
— Test ofendurance athlete motives Johnsgard 1985
CUADRO 37.5. Instrumentos para la evaluación de procesos motivacionales: motivación para

el deporte
Instrumento
— Coaching orientation inventory Martens y Gould 1979

— Competition-related motives scales Willis 1982
— Incentive motivation inventory Alderman y Wood 1976
— Intrinsic/extrinsic sport motivation scale Weiss, Bredemeier y Shewchuk 1985
— Minor sport enjoyment inventory Wankel y Kreisel 1982
— Motives for competition scale Youngblood y Suinn 1980
— Motives for participating in gymnastics Klint y Weiss 1987
— Participation motivation questionnaire Gill, Gross y Huddleston 1983
— Sport competence information scale Horn y Hasbrook 1987
— Sport intrinsic motivation scale Ryan 1979
— Sport non-participation questionnaire MeNally y Orlick 1977
— Sport satisfaction inventory Whittall y Orlick 1979
— Women's sports orientation scales Siegal y Newhof
CUADRO 37.6. Instrumentos para la evaluación de procesos motivacionales: autoconfianza

y autoeficacia
Instrumento
— Diving self-efficacy scale Feltz, Landers y Raeder 1979

— Gymnastic efficacy measure McAuley 1985
— High-risk activity inventory Brody, Hatfield y Spalding 1988
— Motor skill perceived competence scale Rudisill, Mahar y Meaney 1989
— Movement confidence inventory Griffin, Keogh y Maybee 1984
— Perceived physical competence scale Lintunen 1987
— Perceived physical fitness scale Abadic 1988
— Perceived soccer competence subscale Feltz y Brown 1984
— Personal assessment questionnaire Fisher y Zwart 1982
— Physical estimation and atraction scales Sonstroem 1978
— Physical self-efficacy scale Ryckman, Robbins, Thornton y Cantrell | 1982
— Physical self-perception profile Fox y Corbin 1989
— Playground movement confidence inventory | Crawford y Griffin 1986
— Self-confidence of ability questionnaire Willimczik, Rethorst y Riebel 1986
— Sport competence information scale Horn y Hasbrook 1987
— State sport-conficence inventory Vealey 1986
— Stunt movement confidence inventory Griffin y Crawford 1989
— Swin skills efficacy scale Hogan y Santoomier 1984
— Trait sport-confidence inventory Vealey
Para obtener la referencia completa o una descripción más detallada de dichos

instrumentos, se pueden consultar las revisiones de Anshel (1987), donde constan
tanto instrumentos específicos como no específicos utilizados en el ámbito restringi-
do de la psicología del deporte, y de Ostrow (1990), donde sólo constan instrumen-
tos específicos para el ámbito de las ciencias de la actividad física y del deporte. Asi-
mismo, en estas revisiones se incluyen los instrumentos utilizados para evaluar otros
aspectos psicológicos como agresión, actitudes hacia el ejercicio y el deporte, atribu-
ciones, imagen corporal, estrategias y estilos cognitivos, cohesión, visualización, li-
derazgo, locus de control, etcétera.
IV. EVALUACIÓN DEL INDICADOR MOTOR
Actualmente en psicología cada vez se da mayor importancia a la recogida de datos

conductuales descriptivos en su entorno natural (Bakeman y Gottman, 1986; An-
guera, 1991). Esta misma tendencia se observa en el ámbito de la psicología de la acti-
vidad física y del deporte a partir de la segunda mitad de los años setenta en que se
desarrolla una serie de instrumentos para registrar y clasificar lo que hacen y dicen
los entrenadores, los profesores de educación física y sus jugadores o alumnos, tal
como se comprueba en los trabajos de Tharp y Gallimore (1976), Rushall (1977) y
Smith, Smoll y Hunt (1977). En este apartado se describen, en primer lugar, los ims-
trumentos de evaluación de las interacciones entrenador-jugador y, en segundo lu-
gar, los instrumentos de evaluación de las interacciones profesor de educación física-

alumno.
ivi. Instrumentos de evaluación de las interacciones entrenador-jugador

Uno de los primeros instrumentos de evaluación de la conducta del entrenador fue
elaborado por Tharp y Gallimore (1976); se trata del What a coach can teach a tea-
cher [Qué puede enseñar un entrenador a un profesor]. Este trabajo se basa en la
observación de la conducta de John Wooden, legendario entrenador de baloncesto
de la Universidad de California-Los Ángeles, durante 30 horas de entrenamiento.
Wooden consiguió una marca muy difícil de superar: 10 campeonatos universitarios
en 12 temporadas. Por este motivo, Tharp y Gallimore decidieron observarle para
ver cómo enseñaba un maestro excepcional. En la figura 37.1 se muestran las catego-
rías de observación y el perfil conductual de John Wooden durante las quince sesio-
nes de entrenamiento.
Darst y cols. (1981), a partir del estudio de Tharp y Gallimore, trataron de ope-
racionalizar mejor las diez categorías, mostradas en la figura 37.1, para observar las
conductas del famoso entrenador de fútbol americano de la Universidad de Arizo-
na, Frank Kush. Además, estos autores dividieron la sesión de entrenamiento en su
hoja de registro en diferentes segmentos —por ejemplo, calentamiento versns táctica
de equipo, o práctica individual versus práctica grupal— para determinar mejor los
posibles cambios conductuales del entrenador durante las diferentes actividades del
entrenamiento. Entre los resultados más interesantes hallados con estos instrumen-
tos hay que señalar que Tharp y Gallimore (1976) comprobaron que el 50,30% de
las conductas de Wooden pertenecía a la categoría de instrucción y el 8% adicional a
la categoría de broncas y reinstrucción. Darst y cols. (1981) constataron que el 36%
de las conductas de Kush eran de instrucción y un 12% adicional de broncas y reins-
trucción. Asimismo, Lacy y Darst (1985), utilizando un instrumento de once cate-
gorías derivado de los anteriores, encontraron que el 42,50% de las conductas de
diez entrenadores de fútbol americano de High School correspondía a la categoría de
instrucción. Lacy y Darst (1989) desarrollaron un nuevo instrumento de observa-
ción de la conducta de los entrenadores —The Arizona State University observation
instrument (ASUOI1) [Registro de observación de la Universidad del Estado de Ari-
zona]— debido a que las conductas de instrucción representan un porcentaje muy
amplio de las conductas observadas en los estudios anteriores y resultan importantes
para la enseñanza efectiva de las destrezas técnicas y tácticas de un deporte. Dicho
instrumento de 14 categorías —véase el cuadro 37.7— introduce como principal
modificación respecto a los mencionados previamente la subdivisión de la categoría
de instrucción en varias subcategorías: preinstrucción, instrucción concurrente, pos-
instrucción, pregunta y ayuda física.
Otro de los instrumentos de evaluación de la conducta del entrenador más utili-
zados es el Coaching behavior assessment system (CBAS) [Sistema de evaluación de la
conducta del entrenador] de Smith, Smoll y Hunt (1977). En el CBAS se registran, tal
como puede verse en el cuadro 37.8, dos tipos de conductas: conductas reactivas y
conductas espontáneas. Las primeras son respuestas del entrenador a aciertos, erro-
FIGURA 37.1. Categorías de observación para evaluar la conducta de John Wooden durante
los entrenamientos
CATEGORÍAS
Instrucciones 50,3%
Intensific. esfuerzo
Modelo positivo
Modelo negativo
Elogios
Broncas
Recompensa no verbal
Censura no verbal
Bronca-Reinstrucción
Otras
No codificables
MS HEMNES LISAS ISA OY
Fuente: Tharp y Gallimore (1976).
CUADRO 37.7. Categorías del registro de observación de la Universidad de Arizona (ASUOI)

Utilización del apodo o mote
Preinstrucción
Instrucción concurrente
Posinstrucción
Pregunta
Ayuda física
Modelo positivo
Modelo negativo
DEN
TSComentarios para intensificar el esfuerzo
10. Elogios
11. Reprensiones
12. Organización
13. No codificables
14. Silencio
Fuente: Lacy y Darst (1985).

res y conductas disruptivas de alguno o algunos de sus jugadores; las segundas son
respuestas iniciadas por el entrenador, que no tienen antecedentes inmediatos ni bien
definidos en el juego del equipo. Dichas respuestas pueden estar relacionadas con el
juego o ser irrelevantes al mismo.
CUADRO 37.8. Categorías del sistema de evaluación de la conducta del entrenador (CBAS)
. Reforzamiento
El
ACIERTOS
2 . No reforzamiento
3. Ánimo al error
4. Instrucción técnica al error
REACTIVAS ERRORES 5. Castigo : 13
6. Instrucción técnica punitiva
q . Ignorar el error
CONDUCTAS DISRUPTIVAS 8 . Mantener el control
9 . Instrucción técnica general

RELEVANTES AL JUEGO 0 . Animo general
ESPONTÁNEAS 1 . Organización
IRRELEVANTES AL JUEGO . Comunicación general
Fuente: Smith, Smoll y Hunt (1977).
El CBAS permite evaluar las interacciones psicológicas que se dan entre entrena-
dores y jugadores y analizar, mediante la ayuda de cuestionarios, los efectos de di-
chas conductas en los jugadores. Por este motivo se ha utilizado mucho con entre-
nadores de equipos infantiles y cadetes de béisbol (Smith, Smoll y Curtis, 1979), de
baloncesto (Smith y cols., 1983) y de béisbol, fútbol americano y tenis (Sherman y
Hassan, 1986). En España se han realizado diferentes estudios con el CBAS. En uno
de ellos con entrenadores de baloncesto de equipos infantiles y cadetes se evaluó la
conducta de los entrenadores y la percepción que los jugadores tenían de la con-
ducta de su entrenador (Cruz y cols., 1987). En otro estudio, se realizó una inter-
vención conductual para mejorar la actuación del entrenador y se utilizó el CBAS
para evaluar la efectividad del cambio producido en la conducta de los entrenado-
res (Ruiz y cols., 1990; Cruz, 1992). Por su parte, Rejeski, Darracott y Hutslar
(1979) han utilizado el CBAS para comparar las conductas que emiten los entrena-
dores ante los jugadores con altas expectativas de rendimiento y con bajas expecra-
tivas de rendimiento.
Otros instrumentos importantes de evaluación de la conducta del entrenador y
de sus jugadores, que también pueden utilizarse con profesores de educación física
y sus alumnos, son los de Rushall (1977), Quaterman (1980) y Crossman (1981),
que el lector interesado puede hallar descritos en Darst, Zakrajsek y Mancini
(1989).
IV2. Instrumentos de evaluación de las interacciones profesor

de educación física-alumno
Los instrumentos de observación sistemática de la conducta del profesor de educa-
ción física se derivan, en su mayor parte, del trabajo de Flanders en el campo educa-
tivo, a mediados de los años sesenta. Flanders (1965) elaboró una técnica que ha re-
sultado ser una herramienta útil para el estudio de las interacciones verbales entre el
profesor y sus alumnos: The Flanders” interaction analysis system (FIAS) [Sistema de
análisis de la interacción de Flanders]. Se han realizado diversas adaptaciones del
FIAS al ámbito de la educación física, tratando la mayor parte de ellas de incluir tam-
bién las interacciones no verbales entre profesores y alumnos. Una descripción resu-
mida de la mayoría de estas adaptaciones se puede encontrar en el manual de Darst,
Mancini y Zakrajsek (1983).
Actualmente, la adaptación hecha por Cheffers y Mancini (1989) del FIAS es uno
de los instrumentos de observación más utilizados en el campo de la educación físi-
ca. El Cheffers? adaptation of the Flanders” interaction analysis system (CAFIAS)
[Adaptación de Cheffers del sistema de análisis de la interacción de Flanders] divide
las conductas en tres categorías: conductas del profesor, conductas del alumno y
otras conductas, que incluye las categorías de confusión y de silencio. El CAFIAS
—véase el cuadro 37.9— proporciona información sobre las conductas verbales y no
verbales de los profesores de educación física y sus alumnos, así como de la secuen-
cia de sus interacciones. Este instrumento se ha utilizado especialmente para evaluar
clases de profesores de educación física en prácticas o para comparar la efectividad
de diferentes profesores (Mancini, Wuest y Van der Mars, 1985).
CUADRO 37.9. Adaptación de Cheffers del sistema de análisis de la interacción de Flanders

(CAFIAS). Todas las categorías de conductas del profesor y del alumno se sub-
dividen en verbales y no verbales
. Elogia o anima
Acepta o utiliza ideas de los alumnos
Hace preguntas
CONDUCTAS DEL PROFESOR
Da información
Da órdenes
Crítica o justifica su autoridad
Respuesta predecible del alumno

CONDUCTAS DEL ALUMNO Conducta interpretativa del alumno
Conducta iniciada por el alumno
Confusión (comunicación no oída)

OTRAS Silencio
SCI
IES
SIR
a
—L
A
Fuente: Cheffers y Mancini (1989).
Otros sistemas de observación ampliamente utilizados en el ámbito de la act1-

vidad física son los desarrollados por Pieron y sus colaboradores de la Universi-
dad de Lieja, que se pueden revisar en castellano en la obra de Pieron (1986), En-
señanza de las actividades físicas y deportivas: observación e investigación. Además

de las técnicas de observación de las interacciones globales entre profesores de
educación física y sus alumnos, existen instrumentos que se centran en aspectos
más específicos de las clases de educación física como, por ejemplo, el tiempo que
un alumno realiza actividad motriz (Godbout, Brunelle y Tousignant, 1983; Par-
ker, 1989) o el tipo de retroalimentación que proporcionan los profesores de
educación física (Pieron y Delmelle, 1983). Asimismo, hay que recordar los ins-
trumentos desarrollados por Rushall (1977) y Quaterman (1980) que sirven igual-
mente para evaluar la conducta de entrenadores, como ya se mencionó en el apar-
tado IV.1.
Además de los instrumentos de evaluación de las interacciones de entrenadores
y profesores de educación física con sus respectivos jugadores y alumnos, se han de-
sarrollado otras técnicas menos sistematizadas para evaluar aspectos tales como las
conductas de preparación de los deportistas en los instantes previos a la competición
y las reacciones a su actuación y la actividad motora como evaluación continua del
rendimiento del deportista. En el primer aspecto, destaca el trabajo de Salmela y
cols. (1980) en el que durante los Juegos Olímpicos de Montreal observaron la ac-
tuación de 159 gimnastas de ambos sexos, evaluando las conductas de preparación
para la actuación (locomoción, concentración, activación, ejecución parcial...) la re-
lación social de los gimnastas (soledad, estar con compañeros, con el entrenador...)
el tipo de retroalimentación que recibían (positiva o negativa) y la fuente de dicha re-
troalimentación (entrenador, compañeros o adversarios), y la reacción emocional
del gimnasta a la actuación y a la puntuación que le otorgaban los jueces. En cuanto a
los trabajos que evalúan la ejecución deportiva como indicador del rendimiento hay
que mencionar el estudio de la recepción del servicio en voleibol a partir de la filma-
ción en vídeo de Crocker, Alderman y Smith (1988) y los de Riera y Aguado (1989)
realizados a partir del análisis informático de los movimientos filmados en vídeo de
entrenamientos y competiciones.
V. INDICADOR FISIOLÓGICO-BIOQUÍMICO (F-B)
Las técnicas utilizadas en psicología del deporte para el registro del indicador fisio-
lógico-bioquímico (F-B) no difieren esencialmente de las que se usan habitualmente
en otros ámbitos de la psicología, o incluso de las utilizadas en medicina del deporte.
Lo interesante es determinar la información relevante que le puede proporcionar al
psicólogo el registro de este indicador. En general, el parámetro fisiológico o bioquí-
mico que se analiza se considera como variable dependiente, en un intento de eva-
luar el reflejo de la influencia de factores psicológicos que, a veces, son manipulables.
Principalmente, el indicador F-B proporciona dos tipos de información interesantes
para el psicólogo del deporte:
a. Evaluación del estrés psicológico, al relacionar el nivel de los parámetros re-

gistrados con la activación, la ansiedad o el estrés a los que se ven sometidos depor-
tistas y entrenadores en relación a la competición deportiva.
Ab Evaluación del estrés fisiológico, al relacionar el nivel de los parámetros re-

gistrados con la fatiga, la eficiencia o el rendimiento fisiológicos de los deportistas en
entrenamientos y competiciones.
v1. Aparatos de registro

Podemos distinguir tres clases generales de aparatos de registro fisiológico que pue-
de utilizar el psicólogo del deporte: aparatos poligráficos convencionales (de varios
registros), aparatos poligráficos portátiles (a menudo de un solo registro) y aparatos
telemétricos portátiles. En general, los psicólogos del deporte que trabajan a nivel
aplicado no utilizan los registros poligráficos convencionales, dado que no permiten
evaluaciones de campo principalmente por dos motivos: la dificultad práctica de
trasladar los polígrafos a las pistas y la poca o nula maniobrabilidad en situaciones
deportivas que permiten los cables que conectan a sujetos y polígrafos. No obstante,
el polígrafo continúa siendo el instrumento más utilizado en situación de laborato-
rio por el investigador en psicología del deporte, tanto para analizar situaciones de
reposo como situaciones de esfuerzo simuladas en aparatos ergométricos (Riera y
Gordillo, 1982; Ziegler, Klinzing y Williamson, 1982).
Los aparatos poligráficos portátiles y los aparatos telemétricos son la solución
ideal para los registros de campo en psicología del deporte, ya que permiten el análi-
sis en situaciones reales de entrenamiento o de competición, normalmente sin inter-
ferir en la conducta deportiva. En general, en la mayoría de las situaciones deporti-
vas se requiere de movimiento corporal y de algún nivel de esfuerzo físico. Por
tanto, la eliminación de cables y de la sujeción material que impide el desplazamien-
to permite una adecuada ejecución deportiva. Habitualmente, los aparatos telemé-
tricos permiten escoger el intervalo temporal de registro de los datos y el almacena-
miento de los mismos en función del tiempo. Posteriormente, los datos recogidos
podrán ser analizados mediante su recuperación a través del mismo aparato, o me-
diante su volcado a un ordenador y su recuperación con algún programa de análisis
gráfico o estadístico. No obstante, el uso de estos aparatos se restringe habitualmen-
te al entrenamiento deportivo, ya que el sujeto tiene que cargar con el peso del apara-
to, aunque sea reducido. Su uso en competición real está muy limitado, puesto que
puede ser penalizado por los jueces o se puede traducir en un peor rendimiento (por
ejemplo, en deportes donde es importante la velocidad del sujeto como es el caso del
atletismo o la natación).
v2. Técnicas de registro más utilizadas en psicología del deporte

Dado que en psicología del deporte a menudo se estudia la conducta de los deportis-
tas en situación de movimiento y de esfuerzo físico, describiremos las técnicas de re-
gistro del indicador fisiológico-bioquímico más útiles y más utilizadas en tales situa-
ciones. Así, clasificaremos las técnicas distinguiendo dos apartados en función del
tipo general de registro utilizado: registro de respuestas fisiológicas (generalmente
no invasivos) y registro de respuestas bioquímicas (generalmente invasivos).
v2.1. Registro de respuestas fisiológicas

Registro de la actividad cardíaca
La electrocardiografía supone una medida directa de la actividad cardíaca, ya que los

electrodos se sitúan normalmente en el tórax con el objetivo de registrar directamen-
te los cambios en los potenciales de acción relacionados con las contracciones del co-
razón. Algunos aparatos permiten obtener el electrocardiograma (ECG), que repre-
senta la actividad continua en frecuencia del músculo cardíaco (pulsación a
pulsación) reflejada por una onda característica (complejo P-Q-R-5). No obstante, el
análisis de la onda completa del ECG se restringe al ámbito de la cardiología deporti-
va, siendo muy pocos los estudios experimentales que la consideran en psicología
del deporte; entre éstos cabe destacar el de Landers (1985), que analiza patrones car-
díaco-respiratorios en deportes de precisión. Normalmente, mediante la cardiotaco-
metría, en las investigaciones psicofisiológicas se convierte la señal ECG en frecuen-
cia cardíaca (pulsos/minuto), siendo el tipo de registro de la actividad cardíaca más
habitual en estudios con deportistas (Hanson, 1967), entrenadores (Husman, Han-
son y Walker, 1970; Porter y Allsen, 1979) y árbitros (Cuadras y Cruz, 1988).
Otras variables relacionadas con el sistema cardiovascular que se pueden regis-
trar en situaciones deportivas son la presión y el flujo sanguíneos. De todas formas,
su registro es poco frecuente, restringiéndose a situaciones estáticas, debido a la co-
locación de los transductores y a su conexión mediante cables.
Registro de la actividad muscular
La técnica por excelencia utilizada para el análisis de la actividad muscular es la elec-

tromiografía (EMG), que consiste en el registro de los potenciales eléctricos que pro-
vocan la contracción en los músculos esqueléticos. Normalmente, en situaciones de-
portivas el electromiograma se obtiene a partir de la colocación de electrodos
bipolares sobre la superficie muscular. La señal resultante suele ser la suma algebrai-
ca de los potenciales de acción musculares que se registran entre los dos electrodos,
reflejando la actividad conjunta de las unidades motoras próximas. Por ello, es de
suma importancia la distancia física entre los electrodos y su colocación en idéntica
posición respecto al músculo evaluado cuando se pretenden comparar diferentes re-
gistros —véase Carrobles y Godoy (1987) para más detalles en la colocación de los
electrodos. En cambio, en condiciones deportivas normales no se utilizan los elec-
trodos de aguja, ya que deben insertarse directamente dentro del músculo, constitu-
yendo una técnica invasiva, aunque registran con mayor precisión la actividad mio-
eléctrica. Como información útil para el psicólogo, la EMG puede ser utilizada en
situaciones deportivas para analizar distintos elementos:
a. Aspectos psicofisiológicos relacionados con el rendimiento durante el es-

fuerzo, por ejemplo el análisis de la fatiga muscular en carreras de fondo.
b. Aspectos emocionales en situaciones de reposo, en relación con el nivel de
activación o de relajación de determinados grupos musculares.
Cc. Aspectos conductuales en situaciones de movimiento, donde puede intere-

sar analizar el nivel exacto de la actividad motora y la precisión del momento
en que se produce (por ejemplo, al analizar el tiempo de reacción en las sali-
das de velocidad).
Análisis de la temperatura corporal
La temperatura de la superficie de la piel correlaciona de forma razonable con el flu-

Jo sanguíneo subyacente, ya que depende del sistema vascular periférico. Habitual-
mente se registra indirectamente a partir de transductores (termistores) sensitivos al
calor, colocados en las extremidades (dedos de las manos o los pies), y que convier-
ten la temperatura en impulsos eléctricos. Además de ser una variable importante a
nivel médico por diferentes motivos (Sandweiss, 1985), su registro también es útil
para la psicología del deporte porque puede ser un índice del nivel y del control del
estrés del deportista frente a la competición. Ello es debido a que la temperatura cor-
poral es un reflejo indirecto del flujo sanguíneo y a que éste muestra su reacción
como respuesta al estrés. De todas formas, debido a la colocación de los transducto-
res y a su conexión mediante cables, el registro de la temperatura de la piel se restrin-
ge a situaciones de reposo, como por ejemplo el período precompetitivo o poscom-
petitivo.
Registro de la actividad eléctrica de la piel
La electrodermografía agrupa un conjunto de técnicas muy utilizadas en psicofisio-

logía, como por ejemplo la resistencia, la conductancia y el potencial eléctrico de la
piel (Carrobles, 1981). Tales registros reflejan los cambios en la actividad de las glán-
dulas sudoríparas, con los que correlacionan significativamente. Debido a ello, cons-
tituyen un índice de la activación simpática, aunque muchos investigadores relacio-
nan la actividad electrodermal con aspectos emocionales (como ansiedad o miedo).
La variable más frecuentemente analizada, y que se incluye de manera habitual en
los aparatos de biorretroalimentación comerciales, es la conductancia de la piel.
Análisis de la sudoración
También existen métodos directos para analizar la actividad de las glándulas sudorí-
paras, normalmente basados en el recuento del número de glándulas activas en mo-
mentos puntuales. Una técnica de uso sencillo y factible en situaciones deportivas
consiste en aplicar una capa delgada de parafina en la yema del dedo que, una vez so-
lidificada por el contacto con el aire, se puede recoger con una cinta adhesiva trans-
parente. Luego, esta cinta se visiona en un microscopio detectándose perfectamente
las glándulas sudoríparas abiertas (activas) en un área concreta. A partir de esta téc-
nica es posible realizar comparaciones intrasujeto contabilizando, mediante una
cuadrícula incorporada en el microscopio, el número de glándulas activas en una
misma zona. Como reflejo de la activación simpática, la actividad de las glándulas
sudoríparas puede ser un índice de activación general del deportista en situaciones
de reposo, pudiéndose relacionar con aspectos emocionales. En situaciones de acti-
vidad física, es difícil establecer esta relación, ya que el factor principal que determi-
nará la abertura de las glándulas será el esfuerzo fisiológico realizado. En este senti-
do, tal vez la técnica pueda ser un índice del nivel de esfuerzo realizado en una deter-
minada situación deportiva.
Análisis de parámetros respiratorios
La frecuencia respiratoria (FR) es un parámetro fácilmente observable que puede ser

controlado, hasta cierto límite, por el deportista. Puede oscilar desde 10-15 respira-
ciones/minuto en reposo, hasta 40-50 durante el esfuerzo máximo. Existen diversas
técnicas para el registro de la FR, de las que citamos las más frecuentemente utilizadas:
a. Através de un aparato analizador de gases, que contabiliza el número de ins-

piraciones.
b. A partir de goniómetros situados en el pecho que producen señales eléctri-
cas cada vez que se expande o contrae la cavidad torácica.
c. A partir de transductores térmicos situados en la nariz que registran los
cambios de temperatura producidos al inspirar el aire.
Otro parámetro respiratorio susceptible de ser controlado voluntariamente

—hasta cierto punto— por el deportista es el volumen ventilatorio (VV) o cantidad
de aire inspirado y espirado con cada respiración. Su valor oscila entre 0,5 litros en
reposo y 2,5-3,0 litros durante el esfuerzo máximo. Su registro se realiza a través de
una mascarilla sujeta a la cara del sujeto y conectada mediante un tubo a un aparato
analizador de gases, de tal forma que todo el aire que inspira y espira el deportista
pueda ser controlado.
La regulación de la FR versus el volumen de aire inspirado es una de las pocas
funciones metabólicas sobre las que el deportista tiene control. Aparentemente, el
deportista experimentado aprende la mejor razón FR/VV por ensayo y error. Cuanto
mayor es el nivel de esfuerzo, mayor es el incremento de ambas variables (ER y VV).
No obstante, hay pocas investigaciones centradas en la eficacia relativa de incremen-
tar o disminuir alguno de los parámetros. Éste es un aspecto conductual sobre el que
el psicólogo del deporte debería preocuparse, ya que la razón óptima de ER versus
VV en la respiración es individual para cada atleta (Sime, 1985). Dado que ambos pa-
rámetros son fácilmente monitorizables, su control podría ser una excelente área de
trabajo interdisciplinar entre el psicólogo y el fisiólogo, sobre todo con deportistas
novatos, O con sujetos no deportistas que practican actividad física.
v2.2. Registro de respuestas bioquímicas

Consumo de oxígeno
En los laboratorios de fisiología del esfuerzo, el método utilizado más frecuente-

mente para determinar el metabolismo energético del deportista es la termoquímica
respiratorla, que consiste en registrar los intercambios gaseosos respiratorios, ya sea
en circuitos abiertos o en circuitos cerrados (Monod y Flandrois, 1986). A través de

un embudo bucal o de una mascarilla a los que se adapta un juego de válvulas inspi-
ratorias y espiratorias, el deportista inspira el aire ambiente y manda el aire espirado
a un saco herméticamente cerrado. El consumo de oxígeno (VO,) y la eliminación del
dióxido de carbono (VCO,) se calculan a partir del registro del volumen espirado por
unidad de tiempo (mediante un gasómetro o un neumotacógrafo) y de la determina-
ción de las fracciones espiradas de oxígeno y de dióxido de carbono (mediante méto-
dos químicos o físicos).
Aunque se puede considerar una técnica invasiva debido a la dificultad que su-
pone la realización de esfuerzo físico respirando a través de un embudo bucal o de
una mascarilla, el consumo de oxígeno es uno de los parámetros más válidos para
evaluar el rendimiento fisiológico de los deportistas en pruebas ergométricas de la-
boratorio. Así, en algunas investigaciones en psicología del deporte se ha utilizado
como variable dependiente para analizar los efectos del entrenamiento psicológico
sobre el control del estrés (Morgan, 19804; Suinn, 1980; Ziegler, Klinzing y William-
son, 1982; Capdevila, 19894). En situaciones de reposo, se han relacionado valores
bajos de consumo de oxígeno con estados de relajación (Benson y Wallace, 1972;
Benson, 1975), considerándose la existencia de un gasto energético mínimo insosla-
yable ligado al funcionamiento base de las células y de los principales órganos (Mo-
nod y Flandrois, 1986).
Análisis de lactatos en sangre
El análisis de la concentración de lactato en la sangre es una de las técnicas bioquími-

cas más utilizadas en el deporte de alto nivel para evaluar el rendimiento fisiológico
del deportista en entrenamientos y en competiciones, ya que resulta un buen índice
del nivel de fatiga fisiológica. Podemos considerar que su forma de análisis más habi-
tual constituye una técnica invasiva, ya que hay que proceder a una toma de muestra
de sangre capilar al finalizar cada período de esfuerzo. Normalmente, la toma se rea-
liza mediante un pequeño pinchazo con una aguja estéril en el lóbulo de la oreja o en
la yema de algún dedo de la mano. La muestra de sangre se recoge mediante un pe-
queño capilar de cristal con anticoagulante para su posterior análisis.
El uso más frecuente de la técnica corresponde al ámbito de la medicina del de-
porte, principalmente para cubrir los siguientes objetivos (Galilea, Riera y Ruiz,
1992):
a. Determinar unas intensidades óptimas de rendimiento.
b. Evaluar la eficacia de un plan de entrenamiento.
c. Predecir el rendimiento en competición.
No obstante, existe algún trabajo que ha utilizado el análisis de lactato para estu-
diar el comportamiento de ésta y de otras variables psicobiológicas en relación con
aspectos conductuales de la competición deportiva (Sanchís y cols., 1991). En situa-
ciones deportivas son escasos los estudios con un control experimental adecuado
que muestren la relación entre factores psicológicos y niveles de lactato sanguíneo.
No obstante, en situaciones de reposo se ha analizado la posibilidad de modificar el
nivel de lactato sanguíneo por medio de programas específicos de preparación psi-

cológica (Benson y Wallace, 1972; Benson, 1975).
Análisis de respuestas endocrinas
Las hormonas juegan un papel importante en los procesos fisiológicos y en las adap-
taciones metabólicas que tienen lugar durante la actividad física. Igual que en el aná-
lisis de lactatos, su forma de registro más habitual parte de la extracción de una
muestra de sangre capilar antes o después de cada período de esfuerzo. En el ámbito
de la psicofisiología, y también en el de la psicología del deporte, va en aumento la
atención prestada a los factores endocrinos, partiendo de la base de que muchosde
ellos son sensibles a diferentes tipos y niveles de estrés, incluido el estrés competiti-
vo. Así por ejemplo, se ha estudiado la reacción de hormonas como la testosterona,
el cortisol y la prolactina en diferentes situaciones deportivas con distintos niveles de
estrés, encontrándose cambios en los niveles hormonales en relación a la situación
(Salvador, 1992).
VI. ASPECTOS METODOLÓGICOS DE LA EVALUACIÓN EN PSICOLOGÍA

DEL DEPORTE
A partir de los aspectos tratados en los diferentes apartados de este capítulo, a modo
de conclusión, resumiremos la evolución de las técnicas de evaluación en psicología
del deporte, así como aquellos aspectos psicológicos que se deberían tener en cuenta
en la utilización de dichas técnicas.
En primer lugar, estamos de acuerdo con Vealey (1992) cuando concluye que los
primeros estudios de evaluación en psicología del deporte trataron de obtener perfi-
les de rasgos de personalidad de diferentes grupos de deportistas y de no deportistas
y estudiar la relación entre diferentes rasgos de personalidad y diferentes conductas
deportivas, especialmente, el rendimiento. En estos estudios se utilizaron tests gene-
rales como el Minnesota multiphasic personality inventory (MMP1) de Hathaway y
McKiunley (1943) o el 16 Personality factor questionnaire (16PF) de Cattell para com-
parar los perfiles de personalidad de diferentes grupos de deportistas o de un grupo
de deportistas respecto a la población normal (véase Vanek y Cratty, 1970; Morgan,
1980b). La conclusión general de estos estudios es que no hay ningún perfil de per-
sonalidad que diferencie a los deportistas de los no deportistas y que los rasgos de
personalidad no son unos buenos predictores del éxito deportivo (Fisher, Ryan y
Martens, 1976; Gill, 1986). Morgan (1980c), uno de los más acérrimos defensores de
los tests de personalidad en psicología del deporte, concluye su trabajo señalando
que los resultados de los tests de rasgos de personalidad se deben utilizar, de forma
complementaria, con otro tipo de datos como los estados de personalidad, las cogni-
ciones y las medidas fisiológicas para predecir el éxito deportivo.
Ante el fracaso de los tests de personalidad para predecir el éxito deportivo, los
psicólogos del deporte se han dado cuenta cada vez más de la importancia de nume-
rosos factores situacionales como por ejemplo los sistemas de entrenamiento, las
instrucciones del entrenador, la organización de la competición o las normas del

equipo. Estos factores tienen mayor influencia en el rendimiento deportivo que los
rasgos de personalidad. Por este motivo, a partir de los años ochenta, los psicólogos
del deporte han desarrollado tests específicos a las situaciones deportivas, instru-
mentos de observación de la conducta del deportista o entrenador y técnicas de eva-
luación de indicadores fisiológicos o bioquímicos.
En la última década, los instrumentos de evaluación que más se han utilizado en
psicología del deporte han sido los correspondientes al indicador cognitivo, funda-
mentalmente por la facilidad de aplicación de los tests y cuestionarios respecto a los
instrumentos de evaluación de los otros dos indicadores. Los tests no específicos al
deporte más usados han sido el 7475, el STAZ y el POMS. Estas pruebas pretenden ana-
lizar cómo algunas características individuales como los estilos atencionales, la an-
siedad competitiva o los estados de ánimo interactúan con los factores situacionales
propios de cada situación deportiva. Sin embargo, en numerosas ocasiones, estas
pruebas se emplean junto con tests específicos y con otras medidas complementarias
de indicadores conductuales o fisiológicos en estudios longitudinales de caso único.
Según nuestro punto de vista, la competición deportiva se debería entender
como un proceso donde la conducta del deportista evoluciona a lo largo del tiempo
según la interacción de factores individuales y factores situacionales. Así, el rendi-
miento deportivo ya no sería el resultado final de la competición (marcas, títulos,
trofeos, clasificaciones, medallas...), sino toda la conducta de afrontamiento que rea-
liza el deportista de forma continua durante la competición. Así, resulta adecuado
estudiar este proceso por medio del análisis continuo de los indicadores de la con-
ducta deportiva (Capdevila y Cruz, 1992). Los análisis puntuales, en instantes con-
cretos de la competición, se deberían suplir por análisis de proceso. Pero, aunque en
la investigación en psicología del deporte se considere a nivel teórico la conducta
deportiva como un proceso, se continúa evaluando como un fenómeno puntual y
aislado.
El indicador cognitivo continúa siendo el más utilizado, sin tener en cuenta que es
difícil que los registros a partir de tests y cuestionarios permitan analizar los datos de
forma continua durante todo el curso del entrenamiento o la competición. Además,
la recogida de datos de este indicador implica habitualmente el problema de la inte-
rrupción de la conducta deportiva. La evaluación se puede realizar antes o después
del entrenamiento o competición, pero existe el problema de interpretar las cogni-
ciones prospectiva o retrospectivamente. Por tales motivos, parece que las técnicas
de registro correspondientes a los indicadores conductual y fisiológico-bioquímico
resultan las más adecuadas para la evaluación de procesos.
La evaluación del indicador conductual a partir de la observación sistemática de
entrenadores, deportistas y profesores de educación física ha supuesto un importan-
te cambio metodológico: centrarse en lo que hace el entrenador o el deportista, en
lugar de centrarse en cómo es. No obstante, hay que reconocer que el uso del méto-
do de observación es bastante inferior al de los tests en el ámbito deportivo. La expli-
cación más plausible puede estar en el mayor tiempo y dedicación que exige el méto-
do para obtener unos resultados válidos. Así, cuando se utiliza este enfoque, se
requiere un buen entrenamiento de los observadores para obtener una adecuada fia-
bilidad en los resultados. Asimismo, hay que realizar una planificación de las sesio-
nes de observación para lograr unos datos válidos, ya que las conductas de los en-
trenadores difieren a veces entre los partidos y los entrenamientos, como han encon-
trado Horn (1985) y Wandzilack, Ansorge y Potter (1988), o entre diferentes activi-
dades de los entrenamientos, como han señalado Lacy y Darst (1985).
Además de la fiabilidad y la validez de los instrumentos de observación, habría
que tener también en cuenta la sensibilidad de los mismos para distinguir lascatego-
rías que producen mayor impacto en los jugadores o alumnos de educación física.
Así por ejemplo, los estudios de Horn (1987) y Chaumeton y Duda (1988) muestran
que no es tanto la frecuencia de reforzamiento por parte de los entrenadores como la
cualidad del mismo (contingencia, especificidad...) lo que resulta crucial para el ren-
dimiento y la motivación del deportista. Sin embargo, muy pocos instrumentos de
observación han incorporado dicha categoría a sus hojas de registro. En definitiva, la
validez y fiabilidad de los resultados del indicador conductual en el entorno depor-
tivo dependerán del instrumento de registro elegido y el entrenamiento de los obser-
vadores en el mismo, del procedimiento utilizado para planificar las sesiones de ob-
servación y de la sensibilidad del instrumento para evaluar las conductas que
resultan más relevantes en la situación estudiada.
La utilización, todavía minoritaria, del indicador fisiológico-bioquímico supone
retomar una línea de evaluación que ya habían desarrollado los psicólogos del de-
porte en Europa del Este (Vanek y Cratty, 1970). En la mayor parte de los estudios
publicados donde se registran variables psicofisiológicas o bioquímicas se efectúa el
análisis según valores medios en períodos de tiempo concretos, siendo pocos los es-
tudios que consideren tales variables de forma continua en el tiempo. Mediante la
evaluación continua en el tiempo del indicador fisiológico-biológico se pueden ob-
tener los siguientes tipos de información —que pasarían desapercibidos al reducir
los datos a un único valor medio: nivel de la variable en momentos puntuales de la si-
tuación estudiada, patrones individuales de conducta y nivel de actividad física a lo
largo de la situación, que refleja la conducta del deportista (Capdevila, 1989b).
En la investigación dentro del ámbito de la psicología del deporte es frecuente la
evaluación a partir de diseños de grupo. Del conjunto de estudios de este tipo publi-
cados sobre los factores psicológicos involucrados en la competición deportiva, se
puede deducir que no está nada clara la efectividad del entrenamiento psicológico
para potenciar el rendimiento deportivo. Ello es debido a que muy a menudo las re-
laciones de causa/efecto que se pretenden y los efectos obtenidos con las interven-
ciones no son consistentes o no se pueden traducir en ninguna aplicación práctica.
En nuestra opinión, esto se debe principalmente a dos motivos; por un lado, el uso
abusivo que se hace de los coeficientes de correlación o de regresión, sobre todo al
intentar relacionar diferentes indicadores y, por otro lado, a la poca representativi-
dad de los individuos en los diseños de grupo. Así pues, puede que el problema no
esté en la eficacia en sí misma de la intervención psicológica, sino en la evaluación
conductual que se efectúa del rendimiento del deportista. Así, creemos que el punto
de vista más adecuado es considerar la conducta de rendimiento deportivo de forma
continua, como un proceso implícito en la competición —y no como un resultado
final de la competición— (Capdevila, 19894). Este proceso puede ser evaluado a par-
tir de técnicas estadísticas como el análisis de series temporales (Capdevila, Cruz y
Viladrich, 1992).
A partir de los aspectos comentados, se deduce que una buena estrategia meto-
dológica a considerar en la evaluación de la conducta deportiva, es complementar el
uso del indicador cognitivo con una mayor utilización de los indicadores conduc-
tual y fisiológico-biológico. En euanto a los diseños de investigación en psicología
del deporte, se recomienda un empleo más generalizado de los diseños de caso úni-
co, tal como ya se observa en un número creciente de estudios empíricos y de publi-
a teóricas que recomiendan su uso (Zaichkowsky, 1980; Bryan, 1987; Smith,
Aguerri, P. (1986). The development of sports psychology as seen through the analysis of the
first fifteen years of the “Journal”. International Journal of Sport Psychology, 17, 87-99.
Anguera, M. T. (dir.) (1991). Metodología observacional en la investigación psicológica. Bar-
celona. PPU.
Anshel, M. H. (1987). Psychological inventories used in sport psychology research. The
Sport Psychologist, 1, 331-349.
Antonelli, E. (1964). La valutazione psicologica dell'atleta. Roma. Scientiche Leonardo.
Bakeman, R. y Gottman, J. M. (1986). Observing interaction: An introduction to sequential
analysis. Cambridge. Press Syndicate of the University of Cambridge.
Benson, H. (1975). The relaxation response. Nueva York. William Morrow.
Benson, H. y Wallace, R. K. (1972). Decreased drug abuse with transcendental meditation-a
study of 1862 subjects. En C. J. D. Zarafonetis (dir.), Drug abuse-proceedings of the Inter-
national Conference. Filadelfia. Lea and Febiger.
Bryan, A. J. (1987). Single-subject designs for evaluation of sport psychology interventions.
The Sport Psychologist, 1, 283-292.
Capdevila, L. (19894). Efectos del entrenamiento psicológico sobre el estrés de competición y
sobre la eficiencia cardiorrespiratoria en atletas mediofondistas. Tesis doctoral inédita.
Universidad Autónoma de Barcelona.
Capdevila, L. (19895). Evaluación de la eficacia del entrenamiento psicológico. En Actas de
las V Jornadas de la ACPE. Esplugues de Llobregat. ACPE.
Capdevila, L. y Cruz, L. (1992). Análisis de series temporales aplicado al estudio de la emo-
ción y de la conducta en un atleta. Revista de Psicología General y Aplicada, 45, 103-111.
Capdevila, L., Cruz,J.y Viladrich, C. (1992). Conducta deportiva en diseños de grupo: análi-
sis de series temporales. Revista de Psicología General y Aplicada, 45, 453-460.
Carrobles, J. A. (1981). Registros psicofisiológicos. En R. Fernández-Ballesteros y J. A. Ca-
Carrobles,J.A. y Godoy,J.(1987). Biofeedback. Barcelona. Martínez Roca.
Chaumeton, N. y Duda,J.(1988). It is how you play the game or whether you win or lose?
The effect of competitive level and situation on coaching behaviors. Journal of Sport Be-
havior, 11, 157-174.
Cheffers, J. T. y Mancini, V. H. (1989). Cheffers” Adaptation of the Flanders” interaction
Analysis System (CAFIAS). En P. W. Darst, D. B. Zakrajsek y V. H. Mancini (dirs.),
Analysing physical education and sport instruction. Champaign. Human Kinetics.
Crocker, P. R. E., Alderman, R. B. y Smith, F. M. R. (1988). Cognitive-affective stress mana-
gement training with high performance youth volleyball players: Effects on affect, cogni-
tion and performance. Journal of Sport and Exercise Psychology, 10, 448-460,
Crossman, ]. E. (1981). The objective and systematic categorization of athlete and coach be-
havior using two observational codes. Journal of Sport Behavior, 8, 195-208. A
Cruz, J. (1991). Historia de la psicología del deporte. En J. Cruz y J. Riera (dirs.), Psicología
del deporte: aplicaciones y perspectivas. Barcelona. Martínez Roca. ette
Cruz, J. (1992). Evaluación de las interacciones entre entrenadores y deportistas jóvenes y ase-
soramiento conductual a entrenadores. Comunicación presentada en el 1Congreso Inter-
nacional sobre el Conductismo y las Ciencias de la Conducta. Guadalajara, México.
Cruz, J., Bou, A., Ferrández, J. M., Martín, M., Monras, J.. Monfort, N. y Ruiz, A. (1987).
Evaluació conductual de les interaccions entre entrenadors i jugadors de basquet escolar.
Apunts. Medicina de Esport, 24, 89-98.
Cuadras, A. y Cruz, J. (1988). Analisi de la freqiiencia cardíaca pre-partit en una parella d'ar-
bitres de basquet. Apunts. Medicina de Esport. 25, 201-207. :
Darst, P. W., Langsdorf, E., Richardson, D. E. y Krahenbubhl, G. S. (1981). Analyzimg coa-
ching behavior and practice time. Motor Skills. Theory into Practice, 5, 13-22.
Darst, P. W., Mancini, V. H. y Zakrajsek, D. B. (1983). Systematic observation instrumenta-
tion for physical education. Champaign. Leisure Press.
Darst, P. W., Zakrajsek, D. B. y Mancini, V. H. (1989). Analysing physical education and
sport instruction (2* ed.). Champaign. Human Kinetics.
Fernández-Ballesteros, R. y Carrobles, J. A. (1981). Evaluación conductual. Madrid. Pirá-
mide.
Fisher, A. C., Ryan, E. D. y Martens, R. (1976). Current status and directions of personality
research related to motor behavior and sport: Three panelists” views. En A. C. Fisher
(dir.), Psychology of sport. Palo Alto. Maytield.
Flanders, N. A. (1965). Teacher influence, pupil attitudes and achievement. (Cooperative re-
search monograph 12). Washington. US Office of Education.
Galilea, P. A., Riera, J. y Ruiz, O. (1992). Aplicación de la medición del lactato sanguíneo en
la práctica deportiva. LAB2000, 40, 5-8.
Gill, D. (1986). Psychological dynamics of sport. Champaign. Human Kinetics.
Godbout, P., Brunelle, J. y Tousignant, M. (1983). Academic learning time in elementary and
secondary physical education classes. Research Quarterly for Exercise and Sport, 54, 11-19.
Griffith, C. R. (1926). Psychology of coaching. Nueva York. Scribners.
Hackfort, D. y Schwenkmezger, P. (1989). Measuring anxiety in sports: perspectives and
problems. En D. Hackfort y C. D. Spielberger (dirs.), Anxiety in sports: An international
perspective. Nueva York. Hemisphere P.C.
Hanson, D. L. (1967). Cardiac response to participation in little league baseball competition
as determined by telemetry. The Research Quarterly, 38, 384-388.
Hathaway, J. R. y McKinley, J. C. (1943). MMPI Manual. Nueva York. Psychological Corpo-
ration.
Horn, T. (1985). Coaches” feedback and changes in children's percepcions of their physical
competence. Journal ofEducational Psychology, 77, 174-186.
Horn, T. (1987). The influence of teacher-coach behavior on the psychological development
of children. En D. Gould y M. Weiss (dirs.), Advances in pediatric sport sciences. Cham-
paign. Human Kinetics.
Husman, B. F., Hanson, D. y Walker, R. (1970). The effect of coaching basketball and swim-
ming upon emotion as measured by telemetry. En G. J. Kenyon (dir.), Contemporary
psychology of sport. Chicago. Athletic Institute.
Kane, J. E. (1973). Personality, body concept and performance. En]. E. Kane (dir.), Psycholo-
gical aspects ofphysical education and sport. Londres. Routledge and Kegan Paul.
Lacy, A. C. y Darst, P. W. (1985). Systematic observation of behaviors of winning high
school head football coaches. Journal of Teaching in Physical Education, 4, 256-270.
Lacy, A. C. y Darst, P. W. (1989). The Arizone State University Observation Instrument

(ASUO1). En P. W. Darst, D. B. Zakrajsek y V. H. Mancini (dirs.), Analysing physical edu-
cation and sport instruction. Champaign. Human Kinetics.
Landers, D. M. (1985). Psychophysiological assessment and biofeedback applications for
athletes in closed-skill sports. En J. H. Sandweiss y S. L. Wolf (dirs.), Biofeedback and
sports science. Nueva York. Plenum Press.
Landers, D. M., Boutcher, S. H. y Wang, M. Q. (1986). The history and status of the Journal
of Sport Psychology: 1979-1985. Journal of Sport Psychology, 8, 149-163.
Lazarus, R. S. y Folkman, S. (1984). Stress, appraisal and coping. Nueva York. Springer Pu-
blishing Company.
Koehler, T. y Voegele, C. (1989). Laboratory estudies on a potential stress indicator in field
research: The palmar sweat index. En N. W. Bond y D. A. Siddle (dirs.), Psychobiology:
Issues and applications. Elsevier. Science Publishers.
Mancini, V. H., Wuest, D. A. y Van der Mars, H. (1985). Use of instruction and supervision
in systematic observation during undergraduate professional preparation. Journal of Tea-
ching in Physical Education, 4, 22-33.
Martens, R. (1975). The paradigmatic crisis in American sport personology. Sportwissens-
chaft, 1, 9-24.
McNaarr, L. y Droppleman (1971). EDITS Manual for POMS. San Diego. Educational and In-
dustrial Testing Service.
Mischell, W. (1968). Personality and assessment. Nueva York. Wiley.
Monod, H. y Flandrois, R. (1986). Manual de fisiología del deporte. Barcelona-México. Mas-
son.
Morgan, W. P. (19804). The mind of the marathoner. Psychology Today, 11, 38-49.
Morgan, W. P. (19805). The trait psychology controversy. Research Quarterly for Exercise
and Sport, 51, 70-76.
Morgan, W. P. (1980c). Sport personalogy: The credulous-skeptical argument in perspective.
En W. Straub (dir.), Sport psychology: An analysis of athlete behavior. Ithaca, Nueva
York. Mouvement.
Neumann, O. (1957). Sport und personlichkeit. Múnich. Barth.
Nideffer, R. M. (1976). Test of attentional and interpersonal style. Journal of Personality and
Social Psychology, 34, 394-404.
Ogilvie, B. C. (1968). Psychological consistencies within the personality of high-level com-
petitors. Journal of the American Medical Association, 205, 156-162.
Ostrow, A. C. (1990). Directory ofpsychological tests in the sport and exercise sciences. Mor-
gantown. Fitness Information Technology, Inc.
Parker, M. (1989). Academic learning time-physical education (ALT-PE). 1982 revision. En
P. Y. Darst, D. B. Zakrajsek y V. H. Mancini (dirs.), Analysing physical education and
sport instruction. Champaign. Human Kinetics.
Pieron, M. (1986). Enseñanza de las actividades físicas y deportivas. Observación e investiga-
ción. Málaga. Unisport. 4
Pieron, M. y Delmelle, V. (1983). Le retour d'information dans Penseignement des activités
physiques. Motricité Humaine, 1, 12-17. ES
Porter, D. T. y Allsen, P. E. (1979). Heart rates of basketball coaches. The Physician and
Sport Medicine, 6, 84-90.
Quaterman, J. (1980). An observational system for observing the verbal and nonverbal beha-
viors emitted by physical educators and coaches. The Physical Educator, 37, 15-20.
Rejeski, W., Darracott, C. y Hutslar, S. (1979). Pygmalion in youth sports: A field study.
Journal of Sport Psychology, 1, 311-319.
Riera, J. y Aguado, X. (1989). Sistema informátic per mesurar els desplagaments en compen-
ció. Apunts. Educació Física 1 Esport, 15, 61-64. con. a
Riera, J. y Gordillo, A. (1982). Relación entre la frecuencia cardíaca y el inicio del movimien-
to durante el aprendizaje y ante el estrés. Apunts d'Educació Física y Medicina Esportiva,

73, 49-59. pe
Roig-Ibáñez, J. (1964). Estudio sociométrico de un grupo de nadadores. Apuntes de Medici-
na Deportiva, 1, 33-41.
Rudik, P. (1960). Psichologija sporta. Moscú.
Ruiz, A., Martínez, F., Mateu, G., Monfort, N., Martín, M., Ferrández, ]. M., Bou, A y
Cruz, J. (1990). Observació ¡ intervenció psicologica amb entrenadors de joves esportis-
tes. En Actas V Jornades de l'Associació Catalana de Psicologia de Esport. Barcelona.
IND
Rushall, B. S. (1977). Two observation schedules for sporting and physical education envi-
ronments. Canadian Journal ofApplied Sport Sciences, 2, 15-21.
Rushall, B. S. (1978). Environment specific behavior inventories: Developmental procedures.
International Journal of Sport Psychology, 9, 97-110. >
Salmela, J. H., Petiot, B., Halle, M. y Regnier, G. (1980). Competitive behaviors of olympic
gymnasts. Springfield. Thomas.
Salvador, A. (1992). Evaluación psicobiológica del deportista: variables bioquímicas. En Ac-
tas VII Jornades de l'Associació Catalana de Psicologia de l'Esport. Barcelona. ACPE.
Sanchís, C., Suay, F., Salvador, A., Llorca,J.y Moro, M. (1991). Una experiencia en la valora-
ción fisiológica de la competición de judo. Apunts, 18, 51-58.
Sandweiss, J. H. (1985). Biofeedback and sports science. En J. H. Sandweiss y S. L. Wolf
(dirs.), Biofeedback and sports science. Nueva York. Plenum Press.
Scanlan, T. K. (1984). Competitive stress and the child athlete. En J. M. Silva y R.S. Weinberg
(dirs.), Psychological foundations of sport. Champaign. Human Kinetics.
Sherman, M. y Hassan, J. (1986). Behavioral studies in youth sport coaches. En M. Pieron y
G. Graham (dirs.), The 1984 Olympic Scientific Congress Proceedings (vol. VI). Cham-
paign. Human Kinetics.
Sime, W. E. (1985). Physiological perception. En J. H. Sandweiss y S. L. Wolf (dirs.), Biofeed-
back and sports science. Nueva York. Plenum Press.
Smith, R. E. (1988). The logic and design of case study research. The Sport Psychologist, 2,
1-12.
Smith, R. E., Smoll, F. L. y Curtis, B. (1979). Coach effectiveness training: A cognitive beha-
vioral approach to enhancing relationship skills in youth sport coaches. Journal of Sport
Smith, R. E., Smoll, F. L. y Hunt, E. B. (1977). A system for the behavioral assessment of
athletic coaches. Research Quarterly, 48, 401-407.
Smith, R. E., Zane, R. W., Smoll, F. L. y Coppel, D. B. (1983). Behavioral assessment in
youth sports: Coaching behaviors and children's attitudes. Medicine and Science in Sports
and Exercise, 15, 208-214.
Spielberger, C. D., Gorsuch, R. L. y Lushene, R. E. (1970). STA1 Manual for the state-trait
anxiety inventory (“Self-evaluation questionnaire”). Palo Alto. Consulting Psychologists
Press.
Suinn, R. M. (1989). Behavioral intervention for stress management in sports. En D. Hack-
fort y C. D. Spielberger (dirs.), Anxiety in sports: An international perspective. Nueva
York. Hemisphere P. C.
Suinn, R. M. (1980). Psychology and sports performance: Principles and applications. En
R. M. Suinn (dir.), Psychology in sports: methods and applications. Minneápolis. Burgess.
A G. y Gallimore, R. (1976). What a coach can teach a teacher. Psychology Today, 9,
Thill, E. (1975). Sport et personalité. París. Jean P. Delange.

Tutko, T. A., Lyon, L. P. y Ogilvie, B. C. (1969). Athletic motivation inventory. San José.
Institute for the Study of Athletic Motivation.
Vanek, M. y Cratty, B. J. (1970). Psychology and the superior athlete. Londres. Collier.
Vealey, R. S. (1989). Sport personology: A paradigmatic and methodological analysis. Jonr-

nal of Sport and Exercise Psychology, 11, 216-235.
Vealey, R. S. (1992). Personality and sport: A comprehensive view. En T. S. Horn (dir.), Ad-
vances in sport psychology. Champaign. Human Kinetics.
Wandzilack, T., Ansorge, C. y Potter, G. (1988). Comparison between selected practice and
game behaviors of youth sport soccer coaches. Journal of Sport Behavior, 11, 78-88.
Zaichkowsky, L. D. (1980). Single case experimental designs and sport psychology research.
En C. H. Nadeau, W. R. Halliwell, K. M. Newell y G. C. Roberts (dirs.), Psychology of
motor behavior and sport-1979. Champaign. Human Kinetics.
Ziegler, S. G., Klinzing, J. y Williamson, K. (1982). The effects of two stress management
training programs on cardiorespiratory efficiency. Journal of Sport Psychology, 4, 280-
289.
Anshel, M. H. (1987). Psychological inventories used in sport psychology research. The

Sport Psychologist, 1, 331-349.
Cruz, J. y Riera, J. (dirs.) (1991). Psicología del deporte: Aplicaciones y perspectivas. Barcelona.
Martínez Roca.
Darst, P. W., Zakrajsek, D. B. y Mancini, V. H. (1989). Analysing physical education and
sport instruction (2* ed.). Champaign. Human Kinetics.
Hackfort, D. y Spielberger, C. D. (dirs.) (1989). Anxiety in sports: An international perspecti-
ve. Nueva York. Hemisphere.
Ostrow, A. C. (1990). Directory ofpsychological tests in the sport and exercise sciences. Mor-
gantown. Fitness Information Technology, Inc.
Pieron, M. (1986). Enseñanza de las actividades físicas y deportivas. Observación e investiga-
ción. Málaga. Unisport.
Sandweiss,J.H. y Wolf, S. L. (dirs.) (1985). Biofeedback and sports science. Nueva York. Ple-
num Press.
Smith, R. E., Smoll, F. L. y Hunt, E. B. (1977). A system for the behavioral assessment of
athletic coaches. Research Quarterly, 48, 401-407.
ITALO A A
A ys Y Ue
¿PONE
O
4 E f
AA
Y ELA ds
e
> “3 1, db crrroajó 4
A AUT 46 7 es cl ná his del JS ñ qe 57 Ñ

e P - . fa
! nr o > ie pe Mp AA.
104A A pal MA AR TOO Ys qu Be ey
isbleared YoION 14M
h ñ 55 pr
a Lab,EMIR
9543 O A lr a di
| nd ddr: dy retegreh, Tgialla
Jr TAO! bw MM Y, 2D) ha do W 4
v Í
' +4 114
'
6 MER
e E
o
38. EVALUACIÓN EN TRÁFICO Y SEGURIDAD VIAL
HÉCTOR MONTERDE
Con la promulgación en España del Real Decreto 1467/82, publicado en el Boletín

Oficial del Estado del 6 de julio de 1982, por el que se promovió la creación de cen-
tros específicos para efectuar el reconocimiento de una serie de aptitudes físicas y
psicológicas requeridas para la obtención o renovación de los permisos de conducir,
transfiriendo “el testigo” de una tradición psicológica desarrollada por los Institutos
de Psicotecnia y concediendo a la intervención psicológica un papel destacado, po-
demos decir con propiedad que se inicia el interés, tanto institucional como social,
por la psicología vial o del tráfico, entendida ya como campo de especialización de la
psicología. En la actualidad, la psicología del tráfico se sitúa, según datos del Colegio
Oficial de Psicólogos, como la quinta fuente de empleo de los “nuevos” psicólogos.
I. INTRODUCCIÓN AL PROBLEMA DE LA PREVENCIÓN DE ACCIDENTES
Los problemas derivados de la utilización de vehículos automóviles por las vías pú-
blicas están suponiendo un costo social alarmante en los últimos años, que se centra
en los accidentes y su prevención. Hasta el punto de que los gobiernos de todos los
países desarrollados están dedicando grandes esfuerzos y volúmenes de su presu-
puesto a encontrar e introducir medidas para reducir las tasas de accidentes y sus
costes económicos. Según la revista Tráfico (mayo de 1989), editada por la Dirección
General de Tráfico, los costes sociales directos e indirectos de los accidentes en Espa-
ña durante el año 1987 supusieron un billón de pesetas.
De los tres grandes factores a los que se atribuye la causalidad de los accidentes,
vehículo, vía y conductor, tradicionalmente las medidas adoptadas han incidido en
los dos primeros, produciéndose un gran desarrollo de la investigación en ellos, tra-
ducido en mejoras técnicas provenientes del campo de la ingeniería (estructura y di-
seño de vehículos, sistemas de seguridad pasiva, ergonomía, trazado de vías, vallas,
señalización, etcétera).
Con respecto a los vehículos, aunque algunos de los medios de reciente apari-
ción (ABS, airbag, tracción integral...) se ofrecen aún como opciones a precios (ya no
tan) prohibitivos o son elementos de serie en vehículos de alto standing de poca ad-
quisición popular, no se puede negar que los automóviles de hoy en general, y hasta
los más baratos, incluyen en su diseño elementos de seguridad que, comparados con
los automóviles fabricados hace quince años, ofrecen una seguridad pasiva y activa
elogiable. Hasta el punto de que todo automóvil que sale de las factorías actuales
Universidad de Valencia.
950 Héctor Monterde
cuenta con la mayoría de los elementos de seguridad descubiertos hasta el momento.

Hay que reconocer que los fabricantes fueron los primeros en asumir la necesidad
de tales medidas, de hacerlas asequibles y de introducirlas.
Podríamos pensar que estas mejoras en seguridad introducidas por los fabrican-
tes han sido el resultado de un aumento de la demanda social de seguridad. Pero no
parece que la demanda popular de seguridad haya ido por delante de la que posible-
mente sea la única demanda social planteada al automóvil: que cumpla cada vez me-
jor su papel, es decir, que permita desplazar personas o cosas a cualquier lugar en el
menor tiempo y costo posible. Éste ha sido el éxito del automóvil, en una sociedad
que valora cada vez más el tiempo, y que ni siquiera el avión ha podido superar. Y
ésta va a ser posiblemente, mientras exista el automóvil y por mucho que nos pese,
su principal característica de aceptación. Ello lo vieron muy claro los primeros fabri-
cantes de esas “nuevas máquinas”, y si se esforzaron por investigar e introducir me-
didas de seguridad en sus vehículos automóviles fue, posiblemente, para poder aumen-
tar su velocidad, y con ello la reducción del tiempo de transporte, buscando hacerlos
más competitivos frente a otros medios de locomoción, manteniendo las condicio-
nes de seguridad que permitieran al vehículo soportar una mayor velocidad sin salir-
se a la primera curva o cambio de rasante, menores daños en caso de colisión e inten-
tar “salvar” al nuevo comprador de un accidente fatal. Así, las medidas técnicas
introducidas, desarrolladas en ese excelente campo de pruebas que constituyen las
carreras, llevaron aparejado un aumento de las cilindradas en los coches de serie, en
los coches destinados al gran público.
Pero no todo ha de verse tan negativamente; los fabricantes no han hecho sino dar
respuesta, desde su campo, a las demandas sociales (el catalizador es un ejemplo reciente
de respuesta a una nueva demanda social que está cobrando actualmente especial inten-
sidad), en las que la reducción del tiempo invertido en el desplazamiento, como en cual-
quier otro proceso, es una de las principales. El aumento de velocidad conseguido, y
posiblemente por las mismas razones, obligó también a los gobiernos a plantearse una
estrategia parecida, cuyo resultado fue la investigación e incorporación de una serie de
medidas a la red viaria que, manteniendo las condiciones de seguridad y, si fuese posible,
aumentándolas, permitieran circular a los nuevos vehículos a mayores velocidades. Si
analizamos la historia de la automoción, desde la perspectiva de la seguridad, compro-
baremos cómo primero la atención se centró en el vehículo, después en la vía y, final-
mente, adquiriendo especial relevancia en nuestros días, en el conductor, en el denomi-
nado factor humano, a cuyo giro ha contribuido enormemente la psicología.
El interés por el factor humano, del que existen precedentes desde el comienzo
del desarrollo del automóvil, ha originado en la actualidad numerosos estudios y la
construcción de algunos modelos explicativos de la conducta de riesgo en la conduc-
ción, que han ido pasando desde un punto de vista centrado en las aptitudes a otro
centrado en las actitudes, factores motivacionales y cognitivos, de la conducta hu-
mana al volante. El primer intento de intervención sobre el factor humano para re-
ducir los accidentes, en cuyo desarrollo participaron destacablemente investigadores
españoles (Mira y Germain, entre otros), respondió a un modelo teórico explicativo
de la conducta de riesgo basado en el concepto (defendido como teoría) de «propen-
sión al accidente» (Summala, 1988), que dominó las primeras décadas de este siglo
(Munstenberg, 1914; Mira, 1920; Tramm, 1921) (véase Blasco y Casas, 1985). Este
Evaluación en tráfico y seguridad vial 951
primer acercamiento explicativo al factor humano ha sido denominado modelo de

habilidades (destrezas), de exigencia de tareas o aptitudinal. Basado en la suposición
de que la conducción no tiene por qué ser esencialmente diferente a cualquier otra
actividad humana que implique destreza (Reig y Soler, 1986), considera que la segu-
ridad de un conductor está determinada por el nivel de sus habilidades psicofísicas
en relación con las demandas del entorno. Defendiendo como medidas, por una par-
te, la selección de aquellos conductores con aptitudes suficientes y, por otra, el incre-
mento de las habilidades psicofísicas de los conductores (entrenamiento) y disminu-
ción de las exigencias del medio o tarea (mejorar carreteras, hacer más fácil y seguro
el manejo de los vehículos...).
No obstante, la publicación del artículo de Forbes (1939) «El conductor normal
como problema de tráfico» supone la primera llamada de atención acerca de la nece-
sidad de cuestionar la adecuabilidad, o limitación, de este modelo teórico y/o forma
de entender el problema de la prevención de accidentes, dando lugar a partir de la
década de los años cincuenta a numerosas críticas (Summala, 1988) en las que se va
pasando progresivamente el énfasis de los aspectos aptitudinales a los actitudinales y
motivacionales (Smeed, 1949; Haight, 1964; Taylor, 1964; Náátánen y Summala,
1974; Summala, 1988). A partir de la década de los años sesenta y setenta es cuando la
conducción es considerada como una tarea de autocontrol, en la que el conductor
mismo es capaz de ajustar su dificultad (Summala, 1988), incidiendo en los aspectos
cognitivos (entre los que destacan la percepción de riesgo y los procesos de toma de
decisiones en situaciones de riesgo).
Paralelamente, hay que destacar también la evolución que se ha producido en
nuestra sociedad en los valores asociados al automóvil y a la conducción. Conducir
un automóvil ya no es tarea de especialistas; en la inmensa mayoría de los casos ya no
es una actividad laboral en sí misma, sino que ha llegado a formar parte de nuestro
repertorio básico de conductas, de las habilidades que todo (o casi todo) nuevo
miembro de una sociedad desarrollada ha de aprender para, supuestamente, desen-
volverse en la sociedad. El cambio de punto de vista en la forma de abordar el pro-
blema de la prevención de los accidentes —hoy con una frecuencia tal que eleva el
problema a uno de los más graves que padecen las sociedades desarrolladas— ha
propiciado la aparición de modelos alternativos para explicar la conducta de riesgo y
la conducción misma: desde el modelo de “habilidades” (consideradas en este con-
texto como destrezas psicofísicas, a cuyo desarrollo contribuyeron como pioneros
investigadores españoles y cuyo reflejo constituye el actual examen psicotécnico le-
gislado en nuestro Estado) hasta los últimos modelos referidos como motivaciona-
les, por centrarse en el estudio de las motivaciones del conductor en el proceso de
toma de decisiones, actualmente en discusión.
IL MODELOS TEÓRICOS EN LA EXPLICACIÓN DE LA CONDUCTA DE RIESGO

EN LA CONDUCCIÓN
Actualmente pueden ser recopilados varios modelos explicativos de la conducta de

riesgo al volante, pero únicamente cuatro son considerados de obligada referencia en
,
una revisión, bien por el considerable período de tiempo en que han estado vigentes
o aceptados, bien por la cantidad de discusión y literatura científica que han provo-
cado en su defensa y en su crítica. El primer modelo, al que ya se ha hecho alguna re-
ferencia, lo constituye el modelo que aquí denominaremos de habilidades psicofísi-
cas, aunque distintos autores lo han referido con diferentes nombres (habilidades,
exigencia de tareas...), y que también puede ser denominado modelo aptitudinal, por
referencia a la psicología de las aptitudes, base conceptual, sobre la que se asienta y
que dominó la psicología en el período histórico en el que se desarrolló. Los otros
modelos, más recientes, han sido presentados por sus autores como teorías, de carác-
ter general; uno de ellos está basado en la teoría del aprendizaje, que también domi-
nó otro período del desarrollo de la psicología, y los otros dos cognitivo-motivacio-
nales, base conceptual de reciente dominio en la psicología.
11. El modelo de “habilidades” o destrezas psicofísicas

El modelo de “habilidad”, entendida como destreza psicofísica o aptitudinal, fue
respaldado por las primeras teorías de “propensión al accidente”, sugiriendo que al-
gunas personas eran menos habilidosas al volante y, por ello, más propensas a sufrir
accidentes (Summala, 1988). Este modelo ocupó la primera etapa de desarrollo de la
psicología del tráfico, estuvo vigente durante largo tiempo y aún hoy ejerce notable
influencia en la mentalidad de nuestra sociedad. En la base de su desarrollo estuvo la
idea de que la conducción no tiene por qué ser esencialmente diferente a cualquier
otra habilidad humana que implique destreza y, por lo tanto, puede entenderse apli-
cando las mismas técnicas y consideraciones desarrolladas para el estudio y manipu-
lación de cualquier conducta o desempeño que requiera habilidades psicofísicas
(Reig y Soler, 1986).
Durante las primeras décadas de la motorización fue natural el considerar a la
conducción como una habilidad perceptivomotora, y a los accidentes como caracte-
rísticas de esta habilidad (Summala, 1988). La importancia, en cuanto a intervención,
se centraba exclusivamente en las habilidades psicofísicas de los conductores, única
variable independiente, hasta hace bien poco, del denominado factor humano. El
modelo de “habilidad” implicaba que la seguridad de un conductor estaba determi-
nada por el nivel de sus habilidades psicofísicas en relación con las demandas del en-
torno (Summala, 1988). Así, la estrategia general seguida para incrementar la seguri-
dad en el tráfico tenía un doble objetivo: por un lado, incrementar las habilidades
psicofísicas de los conductores y, por otro, disminuir las exigencias ambientales.
Sólo aquellas personas menos hábiles y, por ello, más propensas al accidente debían
ser apartadas del tráfico o reeducadas (Summala, 1988). Por otra parte, disminuir la
exigencia del entorno mejorando las vías, los sistemas de señalización, aumentando
la seguridad (por ello denominada “pasiva”) de los vehículos entra dentro del pano-
rama de aplicación práctica de este modelo.
Fue Forbes (como bien indica el título de su artículo publicado en 1939: «El con-
ductor normal como problema de tráfico») el primero en cuestionar la adecuabili-
dad del modelo de habilidades y del concepto de “propensión al accidente”, en el
contexto del tráfico, iniciando un cambio de planteamiento al entender la conduc-
ción como una tarea de autocontrol, en la que el conductor mismo es capaz de ajus-
tar su dificultad, que empieza a ganar popularidad a partir de la década de los años
sesenta y setenta (Summala, 1988). Desde entonces, el número de críticas que ha su-
frido este modelo ha ido en aumento, hasta el punto de que, en ausencia de una ac-
tualización científica o desarrollo conveniente, ha sido abandonado por la mayoría
de los investigadores. Sin embargo, hay que reconocer que los conceptos de “habili-
dad” y “propensión al accidente” tienen aún fuertes influencias sobre la idea de se-
guridad de los conductores (Svenson, 1981; Sivack y Soler, 1987) y están presentes en
las decisiones tanto individuales como sociales (Summala, 1988; Real Decreto
2272/1985). En el fondo es innegable que el nivel de destreza del conductor, que
puede hoy ser entendido no ya como un rasgo o dotación natural en el individuo
para el aprendizaje de la conducción (deficiencia del modelo clásico) sino como una
habilidad aprendida y por tanto susceptible de ser modificada o reeducada, juegue
algún papel como lo demuestra la necesidad de formación y entrenamiento de los
conductores. El examen actualmente legislado en España es reflejo de este modelo.
12. Elmodelo de “evitación de amenaza” de Fuller
El modelo de “evitación de amenaza” es elaborado por Fuller (1984, 1986, 1988) a

partir de la teoría del aprendizaje. Para este autor, la conducta de riesgo no está sólo
determinada por el proceso de toma de decisiones consciente sino por el historial de
condicionamiento individual del conductor (Fuller, 1988), según el cual, como en
cualquier conducta sujeta al paradigma del aprendizaje, las conductas que han sido
reforzadas positivamente en el pasado adquieren mayor probabilidad de presentar-
se, bajo las mismas condiciones estimulares, en el futuro. Así, Fuller analiza la con-
ducta de riesgo tomando como modelo el condicionamiento de evitación, según el
cual el sujeto puede evitar el estímulo aversivo (en este caso, la experiencia de riesgo
de accidente o, a un nivel mayor, el accidente mismo) emitiendo la respuesta apro-
piada antes de que éste tenga lugar (Nevin y Reynolds, 1973). Concretamente, se
basa en la evidencia experimental obtenida con animales en situación de laboratorio,
en el condicionamiento de evitación diferido, en el que la emisión de la respuesta de
evitación se retrasa voluntariamente hasta el último momento, señalando que la evi-
tación diferida o tardía, es decir, la espera hasta el último momento, puede constituir
en sí misma una recompensa para el conductor de un vehículo, lo que supone un ma-
yor nivel general de riesgo en las situaciones de tráfico (Fuller, 1988). Dentro del
modelo de condicionamiento de evitación, el estímulo condicionado (EC) señala la
oportunidad para realizar la respuesta de evitación (RC), si el sujeto falla o no emite
dicha respuesta dentro de un tiempo determinado (el intervalo entre EC e El) el estí-
mulo aversivo (El) es presentado. Fuller (1984) distingue —dentro del proceso por el
cual un estímulo neutro se convierte en condicionado o aviso del peligro viniente,
hasta que se presenta dicho peligro real o estímulo incondicionado aversivo— dos
etapas consecutivas. La primera comienza con la presentación de un estímulo condi-
cionado por su asociación con el incondicionado (El), que denomina EC2 y que
constituirá un “aviso” lejano o de segundo orden, al que sucedería un determinado
período de tiempo durante el cual el sujeto puede realizar la respuesta de evitación.
CUADRO 38.1. Modelo de condicionamiento de evitación diferido de Fuller
Estímulo neutro
(EN)
curva al frente sin visibilidad
Curva suave
(velocidad adecuada)
Estímulo condicionado
de segundo orden
(EC,)
curva cerrada
Respuesta de
evitación anticipada
(REA)
reducción a velocidad
adecuada
Estímulo condicionado
de primer orden
(Ec,)
comienzo ruedas a derrapar
Respuesta de
evitación diferida
(RED)
maniobra corrección
derrape
Estímulo incondicionado
(El)
salida calzada
La segunda, que sucedería a continuación si el sujeto no ha emitido la respuesta de

evitación, comienza con la presentación, o conversión del anterior EC2, de un segun-
do estímulo condicionado que constituiría un estímulo aversivo potencial, denomi-
nado EC1, mucho más cercano al El y al que sigue otro período de tiempo durante el
cual el sujeto, en peores condiciones, puede emitir la respuesta de evitación que no
hizo antes. Transcurrido este segundo período de tiempo, si el sujeto aún no ha emi-
tido la respuesta de evitación, el estímulo aversivo El se presenta, con sus consecuen-

cias negativas para el conductor, vehículo o terceros. La respuesta adecuada dada en
la primera etapa es denominada respuesta de evitación anticipada, y la dada en la se-
gunda etapa, más cercana al El, es denominada respuesta de evitación diferida, y por
extensión a dicha etapa se hace referencia como condicionamiento de evitación dife-
rido, que es el que, según Fuller, constituye el verdadero problema para la seguridad
vial, al tener efectos recompensantes y constituir la última etapa o últimos momen-
tos de oportunidad de evitación (y por lo tanto menor probabilidad de éxito) antes
de las negativas consecuencias, en este caso el posible accidente. El modelo de Fuller
puede ser resumido en el esquema del cuadro 38.1.
Veamos un ejemplo concreto. Un estímulo neutro (cualquier situación de tráfi-
co) puede llegar a convertirse en un estímulo condicionado EC2 (coche a determina-
da velocidad acercándose a una curva), o continuar siendo un estímulo neutro (al lle-
gar al comienzo de la curva, ésta es suave, por lo que la velocidad del vehículo es
adecuada). Si el estímulo neutro se convierte en condicionado de segundo orden EC2
(al llegar a la curva se observa que ésta es cerrada) el conductor puede decidir realizar
la respuesta de evitación anticipada del posible accidente (reducción de velocidad al
nivel adecuado para las características de la curva), con lo que el estímulo condiciona-
do retorna a ser neutro (velocidad adecuada, y por lo tanto “segura”). Pero si el con-
ductor no realiza la respuesta de evitación en este período, el estímulo condicionado
de segundo orden se transforma o aparece de nuevo otro estímulo condicionado de
primer orden EC1, más imperativo y potencialmente aversivo (las ruedas comienzan
a derrapar), a partir del cual el conductor tiene una segunda oportunidad para reali-
zar la respuesta de evitación, diferida, que en este caso requerirá una mayor destreza,
experiencia y rapidez, puesto que se dispondrá de menor tiempo para realizar la res-
puesta de evitación, posiblemente no dé tiempo para corregir errores por lo que la
toma de decisiones habrá de ser certera, y la ejecución de la respuesta entrañará ma-
yor dificultad (corrección del derrape del vehículo, ajustar la velocidad y volver a
poner el vehículo bajo control). Si la respuesta de evitación diferida es realizada co-
rrectamente y a tiempo, el estímulo condicionado EC1 retornará a la condición de
neutral (mantenimiento del control del vehículo, velocidad adecuada...), pero si tal
respuesta no es ejecutada o no lo es correctamente, aparecerá el estímulo aversivo
real (salida del vehículo de la carretera, accidente).
Como la evidencia experimental con animales en situación de laboratorio sos-
tiene la existencia de predilección por realizar la respuesta de evitación al final del
intervalo EC-El, a medida que se va conociendo su existencia, especialmente cuan-
do el EC tiene una duración fija y/o el intervalo entre el EC y el El es también fijo
(Rachlin, 1976) o conocido, existen buenas razones, según Fuller, para atribuir a la
realización diferida propiedades reforzantes, por lo que representa un panorama
desolador para la seguridad vial (Fuller, 1988) y para el éxito de las medidas ten-
dentes a incrementarla. Por otra parte, la evidencia experimental de las mismas ca-
racterísticas prueba que esta tendencia a retardar la respuesta de evitación aumenta,
y por lo tanto se demora (y “apura”) más, cuando se ofrecen alsujeto señales o pis-
tas informativas sobre la magnitud del intervalo EC-El (Hineline, 1981); ello plantea
sugerencias (y críticas) a los sistemas de señalización empleados o que puedan em-
plearse en el futuro, ya que un incremento de la información vial o de la precisión
de ésta puede producir efectos contrarios a los deseados con ello (pensemos que sl
se nos pudiera informar —en función de la marca, modelo y extras de nuestro ve-
hículo—, en cada curva, el momento en que hemos de empezar a reducir y Cuánto,
muy posiblemente en la mayoría de las ocasiones no lo haríamos antes, ni más de
lo indicado). Estas derivaciones del modelo de Fuller le otorgan una consideración
de predicción negativa o fatalista en la seguridad vial, y en concreto a las medidas
tendentes a incrementarla.
13. El modelo homeostático del riesgo de Wilde

Este modelo, presentado por Wilde (1982a, 1982b) como teoría homeostática de
riesgo (THR), tiene su base en el “principio de compensación”, según el cual toda
medida de seguridad introducida en un sistema produce un efecto contrarrestador
consistente en un aumento de la conducta de riesgo, de forma que el nivel de riesgo
aceptado por el conductor (que cada conductor está dispuesto a aceptar) tiende a ser
constante sea cual sea el riesgo objetivo de la situación de tráfico. La idea del princi-
pio de compensación, en el que Wilde basa su modelo, ha sido propuesta con ante-
rioridad y tiene lejanos antecedentes (véase Summala, 1988). Gibson y Crooks
(1938) introdujeron la idea de reacción del conductor a los cambios ambientales.
Smeed (1949) informó de la existencia de un cuerpo de opinión que sostenía que la
provisión de mejores carreteras o de mejoras en la señalización sólo capacitaban al
motorista a conducir más rápido, dando como resultado el mismo número de acci-
dentes. Finalmente, fueron Cownie y Calderwood (1966) quienes formularon el
principio de compensación, por el cual se argumenta que los accidentes son produc-
to de un simple modelo de círculo cerrado del proceso del accidente, en virtud del
cual los efectos favorables de una medida de seguridad son contrabalanceados cuan-
do el feedback de alarma es eliminado del sistema. Más recientemente, Evans (19854,
1985b) ha descrito extensivamente las adaptaciones conductuales humanas a los
cambios en el sistema de tráfico en términos de un proceso de círculo cerrado com-
pensatorio (Summala, 1988).
Este modelo (Wilde, 1982a, 1982b, 1984a, 1985a, 1985b, 19864, 1986b, 1986c;
Wilde, Claxton-Oldfield y Platenius, 1985) hace un planteamiento atrevido e inno-
vador, característica por la que ha levantado considerable polémica al considerar que
la única variable independiente verdadera en el proceso circular de la producción de
accidentes es la cantidad de riesgo que la gente está dispuesta a aceptar (Wilde, 1987),
considerando el riesgo “real” de las carreteras (variable tradicionalmente considera-
da como independiente) como la variable dependiente, consecuencia directa de la
cantidad de riesgo que la población está dispuesta a aceptar. La percepción del riesgo
y las motivaciones juegan un importante papel en este modelo. Así, la cantidad de
prudencia ejercida por el colectivo de conductores depende del nivel de riesgo perci-
bido en la situación (que, para Wilde, es una función del riesgo “real” de accidente
que tiene dicha situación), y que, de forma circular, el nivel “real” de riesgo depende
de la cantidad de prudencia ejercida por el conductor (Wilde, 1987). De esta forma,
el conductor adaptará su conducta según el riesgo percibido en cada situación de
forma que se mantenga siempre el nivel de riesgo (por unidad de tiempo de exposi-
ción al tráfico) que está dispuesto a aceptar, nivel que estará determinado por aspec-
tos motivacionales, de los costos y beneficios percibidos para cada una de las posi-
bles alternativas de respuesta.
La teoría homeostática de riesgo, apoyándose en el principio de compensación,
mantiene que cualquier conductor tiene en todo momento un determinado nivel
preferido, aceptado, tolerado, deseado, etc. de riesgo de accidente (Wilde, 19884), el
cual intenta mantener ajustando su conducta (Janssen y Tenkink, 19884). Por tanto,
los accidentes son el resultado de esa conducta con la que se intenta equilibrar dicho
nivel de riesgo aceptado (y buscado) contra el riesgo percibido (Adams, 1988). Así,
después de introducir en el sistema de tráfico una medida no motivacional de la cual
se espera que afecte al nivel de riesgo prevalente (mejoras en el diseño de los vehícu-
los, carreteras...), el riesgo de accidente tornará finalmente al nivel inicial aceptado
(Janssen y Tenkink, 19884). La riqueza sugerente de este modelo es eclipsada por el
pesimismo impotente de su aplicación práctica.
14. El modelo de “riesgo-cero” de Naátánen y Summala

A diferencia de la teoría homeostática de riesgo de Wilde, que supone la aceptación
en todo momento de un determinado nivel de riesgo, la presentada por Náátánen y
Summala (1974, 19764) como teoría de riesgo-cero sostiene que el objetivo persegul-
do por todo conductor es asumir el menor riesgo posible; para este modelo los con-
ductores tienden siempre a un nivel de riesgo “cero”, pero los aspectos motivaciona-
les producen una distorsión en la percepción y control del riesgo que da como
resultado la realización de conductas arriesgadas y los accidentes.
Así, el modelo de “riesgo-cero” explica la conducta de conducción como resul-
tado de dos fuerzas contrapuestas: una de carácter motivacional con efectos excita-
torios sobre la conducta de riesgo y la otra de carácter adaptativo (supervivencial)
con efectos inhibitorios sobre la conducta de riesgo. Náátánen y Summala se cen-
tran sobre los procesos motivacionales (excitatorios) y de alarma (imhibitorios) en
la determinación de la conducta del conductor (Summala, 1988). Los dos puntos
de arranque más importantes de este modelo son las bases motivacionales de la
conducta del conductor y la adaptación al riesgo percibido sobre la vía (Summala,
1988).
Náátánen y Summala definen la conducta de conducción como una satisfacción
de motivos a través del sistema de tráfico. La movilidad proporcionada por el coche
es el motivo primario para ser usuario del sistema-tráfico; sin embargo, el simple
transporte de un sitio a otro no es el único motivo (Summala, 1988). Naátánen y
Summala concentran en la velocidad toda la conducta de riesgo y dan numerosas
pruebas de cómo la velocidad proporciona un escape para muchos otros “motivos
extra”, uno de ellos lo constituye el hecho de servir de medio para poder acortar el
tiempo de viaje (Svenson, 1973), adelantar para dejar atrás (y mostrar desprecio) a un
conductor que nos ha irritado; en otras Ocasiones, la velocidad será un buen recurso
para demostrar habilidades ante un amigo o amiga, o simplemente para destacar O
causar impresión (conducir a alta velocidad es una vía más fácil de llamar laatención
que la académica o la deportiva) (Summala, 1988). Así, la fuerza inhibidora de la
conducta de riesgo, que constituye la adaptación al riesgo percibido (para evitar la

experiencia de riesgo), es obstaculizada por los motivos “extra”, distintos y más im-
portantes al del mero desplazamiento, que para Náátánen y Summala se centran y
expresan en la velocidad. La velocidad, en sí misma o como resultado final de la sa-
tisfacción de otros motivos que tienen en ella su vía de escape, constituye la fuerza
motivacional excitatoria de la conducta de riesgo, enfrentada a la supervivencial o de
alarma que constituye el deseo de adaptación en cada momento a las condiciones del
sistema.
Para explicar el mecanismo que controla el proceso supervivencial de adapta-
ción al riesgo, es decir, de adaptarse a las circunstancias para controlar el riesgo y
mantenerlo (o reducirlo) a nivel “cero”, Náátánen y Summala (1974, 19764) recu-
rren al concepto de monitor de riesgo subjetivo, el cual llega a ser activado en un
determinado valor umbral, influyendo en la conducta subsiguiente del conductor
(Van der Molen y Bótticher, 1988) generando diferentes grados de riesgo subjetivo
(experiencia de riesgo) o temor y provocando la reacción inmediata del conductor
al estímulo amenazante, reacción que involucra un mecanismo corporal básico (del
sistema nervioso simpático) para preparar al organismo a reunir energías (Summa-
la, 1988). Náátánen y Summala (19764) listan dos tipos de efectos resultantes de la
activación del monitor de riesgo subjetivo del conductor: los inmediatos sobre la
toma de decisiones y la conducta en ese momento y los efectos sobre la toma de
decisiones y conducta futuras (cuyos posteriores resultados pueden involucrar si-
tuaciones similares a aquellas en las que el riesgo subjetivo fue previamente experi-
mentado). El primer efecto cubre una función inhibitoria inmediata (respuesta de
escape), el segundo se refiere al proceso de aprendizaje de evitación en el que la ex-
periencia de riesgo o temor constituye el estímulo aversivo primario (Summala,
1988). Con la experiencia, tiene lugar la extinción extensiva del temor o incerti-
dumbre (Náátánen y Summala, 19764), que los nóveles sienten en casi todas las si-
tuaciones de tráfico, adquiriéndose representaciones internas del sistema-tráfico y
modelos internos o expectativas en situaciones específicas (Summala, 1988) como
un mecanismo básico que va produciendo en el conductor una incapacidad para
tomar en consideración pequeños riesgos, y una extinción de las respuestas de te-
mor originales y básicas a una variedad de situaciones de tráfico. Así, la conduc-
ción, afirma Summala (1988), se convierte en una actividad ampliamente automati-
zada y habitual en la que los conductores no son capaces de considerar la
variabilidad en el sistema de tráfico, las posibles alternativas de respuesta en el pro-
ceso de toma de decisiones quedan severamente distorsionadas, los conductores
aprenden a desestimar los riesgos pequeños, y cuando utilizan cualquiera de las
oportunidades que la conducción ofrece para satisfacer sus motivos, generalmente
de ello resulta una mayor velocidad. Adicionalmente, las funciones de utilidad de
la velocidad para los conductores son distorsionadas por factores perceptuales,
cognitivos y motivacionales, lo que produce inadecuados márgenes de seguridad y,
consecuentemente, deriva en accidentes provocados por la conducta «muy nor-
mal»... (Summala, 1988).
Las implicaciones prácticas del modelo de “riesgo-cero” tienen como conse-
cuencia la defensa de la necesidad de introducir restricciones conductuales en la con-
ducción, bastante contrarias a las propuestas del modelo homeostático de Wilde
(Summala, 1988). Estas restricciones conductuales se reducen prácticamente a las li-

mitaciones de velocidad, alternativa de la que Náátánen y Summala son máximos
defensores.
15. Otros modelos
Existen otros modelos que suponen propuestas críticas, matizaciones, mejoras o

ampliaciones de los anteriormente descritos. Entre ellos destacan los fundamenta-
dos en la teoría de la decisión y los que proponen una estructura jerárquica en la
que sitúan una variedad múltiple de factores. Estos modelos no pueden ser consi-
derados como estrictamente psicológicos, pues en unos casos sostienen una base
matemática, intentando explicar la conducta a través de fórmulas y funciones, con
antecedentes lejanos en la psicología que han mostrado no pocos problemas a la
hora de su aplicabilidad y verificación práctica, y en otros introducen un conglo-
merado de factores que van más allá de los psicológicos. Así, Janssen y Tenkink
(19884, 1988b) defienden un modelo jerárquico basado en la consideración de la
conducta del conductor como maximización de la utilidad, donde el riesgo como
un daño o costo esperado es sólo un componente en la estructura de la toma de de-
cisiones (Janssen y "Tenkink, 19884), proponiendo junto con O”Neill (1977) una
fórmula de utilidad o beneficio de la conducta de riesgo (O*Neill, 1977; Janssen y
Tenkink, 19885), en la que la aceptación de riesgo es consecuencia de la maximiza-
ción de la utilidad o beneficio (Janssen y Tenkink, 19884). Para Janssen y Tenkink,
el usuario de la vía debe encontrar un balance entre los componentes estructurados
jerárquicamente en su modelo, para lograr un coste total con el fin de que el error
sea mínimo (Janssen y Tenkink, 19884). Bótticher y Van der Molen (1985) y Van
der Molen y Boótticher (1988) proponen un modelo mixto, similar al anterior, en el
que se combina la defensa de una estructura jerárquica con conceptos economicis-
tas basados en la fórmula de la utilidad esperada subjetiva de Edwards (1954).
Conceptos no exentos de discusión y de problemas en su aplicación práctica
(Adams, 1988). El modelo propuesto por Bótticher y Van der Molen está estructu-
rado jerárquicamente en tres niveles, que denominan operacional, táctico y estraté-
gico (Bótticher y Van der Molen, 1985; Van der Molen y Bótticher, 1988). Por otra
parte, la idea de que las tareas de tráfico puedan ser concebidas como estructuradas
jerárquicamente es defendida o, al menos, aceptada ampliamente (Rockwell, 1972;
Michon, 1979, 1985; Moraal, 1980; Summala, 1985, 1986; Bótticher y Van der Mo-
len, 1985; Van der Molen y Boótticher, 1988).
Existe otro modelo basado en la teoría de la decisión en el que se contempla al
acercamiento teorético del aprendizaje no como competitivo sino aditivo al acerca-
miento teorético de la información (Oppe, 1988). Por su parte, Huguenin (1988) de-
fiende un acercamiento ecléctico, considerando que el análisis de la conducta de trá-
fico debe ser realizado sobre tres niveles, que denomina de predisposición, de acción
y situacional, en los cuales distribuye y tiene en consideración tanto las habilidades
motoras, de conducción y la experiencia en el manejo del vehículo, como las actitu-
des, motivaciones y la complejidad de las situaciones.
HL REVISIÓN CRÍTICA DE LOS PRINCIPALES MODELOS: EL ESTADO

DE LA CUESTIÓN
El apartado anterior ha sido dedicado a la presentación y explicación de estos mode-

los, en éste se hará un análisis de las críticas y objeciones con el fin de acercar más al
lector al estado en el que la controversia, por la aceptación de un modelo aplicable, se
encuentra.
De los modelos explicativos del factor humano y/o conducta de riesgo al volan-
te, el modelo aptitudinal (o de habilidades psicofísicas), primer modelo desarrollado
y que ha sido considerado como clásico, y los más recientes, que por incidir en los
aspectos motivacionales y de autocontrol pueden ser considerados como modelos
de toma de decisiones, el de evitación de amenaza de Fuller (1984, 1986, 1988), el de
homeostasis de riesgo de Wilde (1982a, 1982b) y el de riesgo-cero de Náátánen y
Summala (1974, 19764), los cuatro presentados por sus defensores como teorías, se-
rán revisados. Los otros modelos (Janssen y Tenkink, 1988; Van der Molen y Bótti-
cher, 1985, 1988; Oppe, 1988; Huguenin, 1988), bien por estar siendo aún desarrolla-
dos o bien por suponer matizaciones, ampliaciones o posiciones intermedias entre
los anteriores, no serán considerados en este apartado.
En primer lugar, a pesar de la base experimental aportada sobre cada uno de los
modelos gestados, hasta el momento ninguno de ellos ha sido total y consensuada-
mente aceptado por la comunidad científica, permaneciendo actualmente la cuestión
en un estado de indeterminación e insatisfación del que no se logra salir (Janssen y
Tenkink, 19884; Adams, 1988), por ello, los cuatro modelos conviven en la actuali-
dad entre la comunidad científica. La realidad es que, desde un punto de vista cientí-
fico, ninguno de los modelos considerados está exento de objeciones, adoleciendo
todos ellos de aspectos críticos tanto en su favor como en su contra. A su favor cuen-
ta el estar todos ellos basados en principios sólidos aisladamente comprobados expe-
rimentalmente, en su contra pesan problemas e insuficiencias, fundamentalmente de
definición operativa y en su intento de ofrecer una explicación generalizada o teoría
de la conducta de riesgo, y especialmente en las posibilidades de aplicación práctica y
en las soluciones derivadas.
ma. Acerca del modelo de habilidades
Las pruebas a favor del denominado modelo de habilidades o aptitudinal arrancan

de una antigua tradición experimental (Munsterberg, 1914; Mira, 1920; Tramm,
1921). Por contra, las críticas, también basadas en datos experimentales, se centran
en la viabilidad del concepto de propensión al accidente, que ocupa un lugar destaca-
do en la elaboración de este modelo y que rechazan los principales investigadores ac-
tuales en el campo (Summala, 1988), y en que, como consecuencia, no incluye aspec-
tos actitudinales y de autocontrol del conductor. Así, Taylor (1964) sugirió que las
demandas de conducción son gobernadas por el nivel de tensión emocional o la an-
siedad que el conductor desea tolerar; Summala (1988) afirma que las verdaderas ba-
ses de la conducta humana en tráfico, como en el resto de las situaciones, son moti-
vacionales. Deficiencia del modelo clásico frente al cual han surgido los modelos ac-
tuales, que se apoyan sobre bases motivacionales. Sin embargo, estos nuevos mode-
los alternativos a la posición clásica dejan de lado los aspectos psicofísicos, la adqui-
sición y papel de las habilidades motoras, sobre los que es innegable algún grado de
influencia. El modelo de habilidades, por dejar fuera los aspectos actitudinales y mo-
tivacionales, y los modelos motivacionales, por dejar fuera los psicofísicos, enten-
diendo que éstos también son aprendidos, resultan desde esta perspectiva incomple-
tos. Sin embargo, no hay que olvidar que el modelo de habilidades es el modelo que
más tiempo ha estado vigente —en la actualidad aún lo sigue estando—, que más ha
influido en la idea popular de seguridad tanto de los individuos como de las respecti-
vas administraciones de los Estados desarrollados, y, aún más, que más resultados
positivos ha dado. Prácticamente la totalidad de las medidas adoptadas, en el pasado
y en el presente, para prevenir la accidentalidad (mejora de vías, diseño de vehículos
para aumentar su seguridad pasiva y su facilidad de manejo) siguen y derivan de la
aplicación de este modelo. El desarrollo de la estructura instruccional/formativa
(educación vial, autoescuelas, exámenes de teoría y práctica de la conducción...) y de
la exploración médico-psicológica (con la derivación de restricciones en función del
estado psicofísico del conductor), en ambas facetas como condición previa a la con-
cesión del permiso de conducir, que caracterizan al Estado español frente a otros
países en los que la importancia concedida a estos aspectos ha sido menor, también
siguen y se derivan de este modelo.
Si el viejo modelo de aptitudes dejó de lado los aspectos actitudinales, los poste-
riores modelos alternativos, considerados como motivacionales, dejan de lado los
aspectos psicofísicos, la adquisición y el papel de las habilidades motoras, que desde
una perspectiva más actual también pueden considerarse como aprendidas, y por
tanto modificables, susceptibles de cambio, lo que permitiría una actualización del
modelo tradicional, revisando y desplazando los conceptos de aptitud y de propen-
sión al accidente, y recuperando el papel del entrenamiento, ya no sólo limitado a las
habilidades motoras sino ampliándose también a las cognitivas y sociales intervi-
nientes en la conducción.
m2. Acerca del modelo de evitación de Fuller
El modelo de evitación de Fuller está basado en una evidencia experimental sólida

aportada por la teoría del aprendizaje, pero plantea problemas a la hora de dar una
explicación generalizada fuera del laboratorio, además de en sus consecuencias prác-
ticas, nada optimistas y bastante ambiguas, de las medidas de solución derivadas.
Baste hacer referencia a la tendencia comprobada a emitir la respuesta de evitación
en el último momento (Hineline, 1981) que plantea múltiples contradicciones a la
hora de ser aplicada en el sistema tráfico, lo que muestra que la falta de información
sobre las circunstancias del medio puede producir más accidentes; pero, según esta
derivación del modelo de Fuller, una información completa (o altamente precisa)
también sería negativa para la seguridad vial (por ejemplo, si se informa de la veloci-
dad límite a que puede ser tomada una curva, a partir de la cual se producirá la salida
de la vía, los conductores tenderían a tomar dicha curva a velocidad cercana al lími-
te), lo que constituye una contradicción que afectaría, entre Otras cosas, a la hora de
decidir una señalización. Por otra parte, la presencia del riesgo de/o accidente como
EL, dentro del condicionamiento de evitación, es criticada, pues los conductores ra-
ramente lo experimentan (McKenna, 1982; Summala, 1988), planteando dificultades
a la identificación de un proceso cierto de condicionamiento de evitación en la situa-
ción de conducción. Fuller (1984, 1986) realiza una formulación bien desarrollada de
este aprendizaje de evitación y del paradigma del condicionamiento de evitación en
la conducción (Summala, 1988), si es que tiene lugar, pero ¿ocurre siempre?, ¿es sufi-
ciente para explicar toda la conducta del conductor?
13. Acerca del modelo homeostático de Wilde
El modelo homeostático de Wilde es, como se dijo, el que parece que más polémica
ha desatado, polémica que se mantiene en la actualidad en gran parte de los trabajos.
Las pruebas y críticas al modelo homeostático de Wilde se centran en el “principio
de compensación”. A su favor, existe evidencia de que fenómenos de compensación
se dan en la vida diaria. La existencia de este fenómeno ha sido comprobada experi-
mentalmente, en determinadas situaciones y procesos, como consecuencia de la in-
troducción de medidas técnicas (ingeniería) de seguridad. Así, han sido aportados
datos en el sentido de que en los parques y zonas de juegos infantiles diseñados bajo
criterios de seguridad ocurren más accidentes que en aquellos que no han sido dota-
dos de medidas específicas de seguridad (Ward, 1961; Hurtwood, 1968; Major, 1986;
Adams, 1988). Adams (1985; 1988) aporta el dato de que cuando en Suecia se pasó
de la conducción por la vía izquierda a hacerlo por la derecha, el número de acciden-
tes fatales descendió al 40% de su nivel “normal”; Adams (1985b) aporta datos acer-
ca de los efectos compensatorios producidos por la introducción de la obligación del
uso del cinturón de seguridad. La introducción de la obligatoriedad del casco en los
motoristas y el posible aumento de las velocidades sería otro dato en favor de este fe-
nómeno. Otros argumentos favorables se refieren a numerosas anécdotas, comenta-
das por los ingenieros responsables del tráfico sobre tramos de carretera que la gente
local considera peligrosos pero los cuales son estadísticamente “seguros”, con una
frecuencia de accidentes baja (Adams, 1988). No obstante, estos hechos u otros que
demuestren la existencia de fenómenos de compensación, no son suficientes para
que sea aceptada su ocurrencia con carácter generalizado y completo. Ello ha levan-
tado numerosas críticas (y lógicamente bastantes reservas y algunos recelos), situán-
dolo en un estado de indeterminación e insatisfacción, del que no parece terminar de
salir (Shannon, 1986; Janssen y Tenkink, 19884; Adams, 1988). El problema funda-
mental que plantea este modelo hace referencia a su aplicabilidad práctica, pues nie-
ga el efecto de cualquier medida técnica de seguridad (en el sentido de ingeniería) in-
troducida en el sistema tráfico, pues el nivel de riesgo tornará a su estado inicial
aceptado (el que cada conductor, cada sociedad, está dispuesto y “quiere” aceptar).
Según este modelo, las vías, la señalización, la seguridad pasiva de los vehículos no
deberían ser mejorados, puesto que no sólo no disminuirán la frecuencia de acciden-
tes, por los efectos compensatorios, sino que incluso su balance será negativo, bien
por aumentar la aceptación de riesgo (en ése o, por migración de efectos, en otro
campo de la conducta humana), bien, caso de mantenerse igual, por los altos costes
adicionales que representan para obtener el mismo resultado, lo que constituye un
gran obstáculo para la aceptación y puesta en práctica del modelo.
El fenómeno de compensación, que parece ser generalmente aceptado, es objeto
también de muchas matizaciones y objeciones. Unas reducen el fenómeno a deter-
minadas condiciones o situaciones. Así, Fuller (1986) señala que sólo en ciertas con-
diciones puede ser esperada la actividad compensatoria, especialmente en aquellos
casos en que la aceptación de riesgo es intrínsecamente recompensante. Brown
(1980) y Summala (1988) consideran inconcebible que los conductores deseen ope-
rar continuamente bajo el estrés emocional que implica la aceptación del riesgo, re-
duciendo la aceptación (cuando se da) a algún grado de incertidumbre o temor a al-
gunas circunstancias en las que se esté bajo una alta presión motivacional o a algunas
personas, especialmente jóvenes, que pueden incluso “buscar” riesgo (Summala,
1986). Otras objetan el desarrollo completo del proceso de homeostasis; es el caso de
Janssen y Tenkink (19884), quienes defienden que el proceso de compensación no
tiene por qué ser necesariamente completo, con lo que, admitiendo la existencia del
fenómeno, dejan libre la posibilidad de lograr efectos positivos a las medidas técni-
cas de seguridad introducidas, verdadero escollo del modelo de Wilde. En esta línea,
Evans (19854), después de revisar meticulosamente los hallazgos relevantes, concluye
que toda estimación de la futura efectividad de una medida de seguridad debe conte-
ner alguna asunción en relación a los efectos interactivos (por ejemplo, compensato-
rios), pero los esfuerzos futuros de investigación deberían ser dirigidos a averiguar
qué grado de compensación puede ser esperado que ocurra bajo estas condiciones
(que puede no siempre darse o darse en distinta forma), para prever sus efectos. Por
otra parte, al único tipo de medidas de intervención que Wilde reconoce efectos po-
sitivos, medidas de carácter motivacional, Huguenin (1988) contesta que el incre-
mento de seguridad conseguido interviniendo a nivel motivacional (por ejemplo,
aumentando el deseo de seguridad y el valor de la vida futura [Wilde, 1987]) no está
exento, por las mismas razones que en el caso de las medidas técnicas (ingeniería), de
compensación, añadiendo que las medidas técnicas también implican aspectos moti-
vacionales, por lo que una estricta disociación entre los dos tipos de soluciones no es
posible en ninguna forma. Otras críticas se dirigen a la circularidad que presenta el
modelo, a lo que Adams (19884) contesta diciendo que hasta el modelo de conducta
de Skinner (1971) la presenta en su definición y efecto del refuerzo. Otras críticas 1n-
tentan atribuir la aceptación de riesgo, que reconocen como motivación, a Otras cau-
sas. Así, Janssen y Tenkink (19884) afirman que es más apropiado pensar en algún ni-
vel aceptado de riesgo como producto de un proceso de maximización de la utilidad
(beneficio) en lugar de una variable control independiente. En definitiva, s1 se han
encontrado pruebas experimentales a favor de la existencia de procesos de compen-
sación, no menos experimental han sido las presentadas en contra del carácter gene-
ral de este modelo (McKenna, 1985a, 1985b, 1985c; Shannon, 1986). Para avalar es-
tos últimos comentarios con una referencia a aspectos metodológicos, cabe señalar,
además de las muchas críticas realizadas, que no menos problemático y sutil resulta
el concepto de migración de efectos, que constituye para los defensores de este mo-
delo (versus teoría) una “salida de escape” difícilmente contrastable, cuando aparen-
temente no se observan fenómenos compensatorios después de introducir una me-
dida (no motivacional) de seguridad. A pesar de todo, el modelo constituye también

una de las hipótesis más sugerentes y radicales que jamás se haya planteado para ex-
plicar la conducta humana en el sistema-tráfico.
1.4. Acerca del modelo de “riesgo cero” de Náátánen y Summala

Respecto al modelo de riesgo cero de Náátánen y Summala, la defensa, de la que
existe poca evidencia experimental (véase Rumar y cols., 1976; Summala y Merisalo,
1980), se reduce exclusivamente a los argumentos expuestos por sus dos autores y
colaboradores, en los distintos artículos publicados (Náátánen y Summala, 1974,
19764, 1976b; Summala, 1980, 1985, 1986, 1988; Summala y Merisalo, 1980; Summa-
la y cols., 1981; Summala y Hietamáki, 1984). Las críticas a este modelo se centran en
la ambigúedad y falta de definición operativa de algunos conceptos o elementos bá-
sicos en los que se apoya, especialmente el defendido “monitor de riesgo subjetivo”,
de reminiscencias psicoanalíticas, que supuestamente controla la conducta de evita-
ción del accidente, y del que no queda muy claro cómo realiza ese control de la con-
ducta ni cuál es su umbral de activación. Así, Van der Molen y Bótticher (1988) obje-
tan que no está claro cómo debe operar el modelo y que, como ejemplo para ello, no
ha sido dado un valor específico para el componente crítico (o umbral de activación)
del referido monitor de riesgo subjetivo, en el que se basa dicho modelo.
Por otra parte, una de las limitaciones prácticas de este modelo lo constituye su
reduccionismo en la consideración de la conducta de riesgo, que queda directa o in-
directamente expresada en la velocidad: la velocidad es la vía de escape para los moti-
vos extra “reprimidos” (en analogía con el cuerpo de pensamiento psicoanalítico).
Así, este modelo considera a la velocidad como expresión última de todas las con-
ductas de riesgo en la cual se canalizan o se expresan. Proponiendo como única me-
dida de prevención (de los accidentes) derivada del modelo la limitación de la velo-
cidad. Esto plantea dos problemas en su aceptación. En primer lugar, el problema
del reduccionismo de las conductas, actitudes y factores de riesgo a la velocidad, y
consecuentemente reduciendo toda medida de intervención a una sola, la limitación
de velocidad; cuestión que puede constituir una visión limitada del universo de la se-
guridad vial. En segundo lugar, que dicha medida de solución que defiende el mode-
lo en su aplicación práctica, limitar la velocidad, se enfrenta con la demanda social
previsiblemente futura y con la función principal que nuestra sociedad atribuye a la
conducción. El desarrollo de la automoción responde al objetivo social de reducir el
tiempo de desplazamiento y aumentar la capacidad de movilidad de los individuos,
para los que la velocidad de desplazamiento en condiciones “seguras” (o, dicho de
otra forma, el aumentar la velocidad de los desplazamientos manteniendo la misma
tasa de accidentes) constituye un reto social inevitable.
m.s. Problemas comunes a los modelos motivacionales
Desde una perspectiva general, los modelos actualmente propuestos de carácter mo-
tivacional, dejando aparte el de habilidades cuyo principio de “propensión al acci-
dente” ha sido puesto en entredicho y abandonado, adolecen, además de los proble-

mas específicos comentados, de una serie de problemas y objeciones comunes, no
menos importantes a considerar.
El primer problema consiste en el fatalismo o predicción pesimista que suponen
los tres modelos. En el modelo de Fullers se sostiene el carácter reforzante en sí mis-
mo de retrasar la respuesta de evitación (realización diferida) hasta el último mo-
mento, lo que supone la existencia de motivación por el riesgo (Fuller, 1988). En el
modelo de Wilde, el paradigma está basado en la suposición de que los individuos
tienen un nivel establecido de sesgo que no están dispuestos a que disminuya, de for-
ma que por muchas medidas de carácter técnico (o no motivacionales) que se pon-
gan en práctica para disminuir el nivel de riesgo prevalente (diseño de los vehículos,
mejoras en las carreteras, en la señalización...), el riesgo de accidente tornará final-
mente al mismo nivel aceptado por cada individuo (Wilde, 1987; Janssen y Tenkink,
19884; Summala, 1988). En el caso del modelo de Náátánen y Summala, no tan pesi-
mista en su elaboración como en la solución propuesta, nada se conseguirá si no se
aplican restricciones de velocidad, lo que posiblemente, tal y como evoluciona la so-
ciedad, no constituya una solución de mucho futuro, tanto en su aceptación como
en su aplicación.
El segundo problema reside en la comunalidad de los distintos aspectos en los
que se basa cada uno de ellos, que hace difícil considerarlos como modelos indepen-
dientes y alternativos. Los elementos que constituyen la base para un modelo son
aceptados, aunque con menos protagonismo, por otros, hasta el punto de que algu-
nos de ellos tendrán perfectamente lugar dentro de otros modelos, aparentemente
enfrentados, o incluso complementarse. Así, Wilde (1988b) da entrada en su modelo
a principios del aprendizaje al considerar las recompensas como medio para reducir
los accidentes. Náátánen y Summala (Summala, 1988) también apelan a procesos de
condicionamiento de evitación. Por otra parte, tanto Wilde (1987) como Summala
(1988) hacen referencia a la teoría de la decisión. Wilde (1987) recurre a términos
economicistas para explicar el riesgo de los comportamientos (costos-beneficios de
las distintas alternativas de respuesta que puede ejecutar el conductor), Summala
(1988) apela a la función de utilidad en la conducción y a una estructura jerárquica al
referirse a la representación interna del sistema tráfico y la concurrente automatiza-
ción de las subtareas de conducción. Por otra parte, existen continuas referencias a
los aspectos motores que, junto con los perceptuales, son gobernados interactiva-
mente por estos modelos internos, en trabajos citados en apoyo de los distintos mo-
delos (Kelley, 1968; Conant y Ashby, 1970; Neisser, 1976; Schneider y Schiffrin,
1977; Summala, 1988); estas características hacen difícil la aceptación en exclusiva de
alguno de los modelos.
El tercer problema reside en deficiencias de definición y especificación de mu-
chos de los elementos en los que se apoyan los modelos, que no están suficientemen-
te definidos y descritos (Adams, 1988), recurriendo a conceptos que algún autor ha
considerado como metafísicos, como la utilidad (Robinson, 1962). En un intento ex-
perimental por usar los tres modelos (Fuller, Wilde y Náátánen-Summala) para pre-
dicciones cuantitativas en una situación concreta (maniobra de adelantamiento),
Bótticher y Van der Molen (1985) encontraron que muchos de los componentes de
los modelos no han sido completamente definidos, sólo parcialmente, y algunos in-
cluso de forma contradictoria (Van der Molen y Bótticher, 1988). El grado de especi-
ficación y definición operativa de los tres modelos deja mucho que desear, problema
que hace difícil el tratamiento científico, y por lo tanto su verificación empírica, así
como su aplicación práctica en forma de medidas concretas.
En conclusión, y como cuarto problema, habría que decir que los modelos hasta
el momento presentados con carácter de teorías, estando basados en principios com-
probados y aportando interesantes sugerencias, fallan precisamente en que no cum-
plen su carácter pretendido de teoría. Así, Huguenin (1988), haciendo un balance,
concluye que el concepto de propensión al accidente ha sido considerado anticuado,
la homeostasis de riesgo es también problemática y aplicable a un dominio muy li-
mitado, las teorías del aprendizaje explican los procesos de formación de la conducta
en el sistema-tráfico, pero no están cualificadas para predecir acciones específicas
que tienen lugar fuera de los modelos de conducta aprendidos; otros modelos deben
ser considerados pero explican sólo ciertos aspectos, etc. Es decir, todos los modelos
existentes, sin negar su base experimental y su aportación al estudio de la conducta
del conductor en aspectos concretos, resultan incompletos para explicar la conducta
humana (del conductor y del peatón) en el sistema tráfico en general. Son capaces de
explicar algunos fenómenos y bajo determinadas circunstancias, pero no todos los
fenómenos conocidos bajo todas las circunstancias conocidas hoy, en relación al fac-
tor humano y a la toma de decisiones en situaciones de tráfico. Los modelos pro-
puestos fallan precisamente en su pretensión de ser teorías, y, por lo tanto, en la pre-
dicción. En el campo de la psicología del tráfico, como afirma de forma optimista
Huguenin (1988), son pocas las teorías que permiten la predicción de la conducta del
conductor en general. Tal vez el problema sea que es demasiado pronto para estable-
cer teorías (modelos generales) de la conducta al volante. Sin pretender quitar mérito
a los intentos realizados y aceptando algunos de los principios básicos sobre los que
los modelos han sido construidos y a los que han servido para aportar evidencia
experimental, que a partir de ahora habrá que considerar, tal vez falten aún más estudios
parciales que dirijan la investigación hacia el conocimiento de aspectos concretos,
camino en el que los estudios realizados para desarrollar los modelos comentados
han de ser considerados como pioneros, para algún día, quizá, estar en condiciones
de pasar a la elaboración de una teoría explicativa de la conducta al volante y de las
relaciones en el sistema tráfico, si es que existe, en los que la percepción de riesgo
y los procesos de toma de decisiones deben jugar un importante papel, aún no escla-
recido.
Para terminar este apartado, hay que reconocer que, a pesar de estos problemas,
el mérito de estos modelos alternativos al clásico lo constituye el hecho de que se
plantean desde el punto de vista del conductor, como procesador de información,
tomador de decisiones y, en definitiva, responsable de la situación de riesgo, con un
papel activo, de autocontrol, que no le otorgaba el modelo de habilidades (o aptitu-
dinal) clásico. Así, frente al modelo clásico, constituyen importantes intentos por in-
corporar y conceder protagonismo a los aspectos motivacionales y cognitivos, cuya
importancia vienen poniendo de manifiesto la psicología y la investigación actuales.
IV. EL MODELO ESPAÑOL DE INTERVENCIÓN

Iv.1. Pasado y presente.
La estrategia de intervención para aumentar la seguridad vial en España, en cuanto a
los grandes factores vehículo y vía, ha seguido las mismas pautas que en el resto de
los países desarrollados. En cuanto al vehículo, la introducción de las mismas medi-
das de seguridad, por el carácter multinacional de los criterios de fabricación; y en
cuanto a la vía, la mejora de la señalización y de la red vial, si bien en este punto con
algún retraso respecto al resto de los Estados europeos. La diferencia más importan-
te se da en el aspecto de intervención sobre el conductor, en el que además de conce-
derse especial importancia a los aspectos de adiestramiento y educación del conduc-
tor (España se caracteriza también por poseer un modelo de aprendizaje de la
conducción desarrollado en centros específicos, con profesorado especializado titu-
lado, con una reglamentación detallada y con muchos años de experiencia), existe un
modelo de intervención médico-psicológico desarrollado y con una larga tradición.
El denominado actualmente como examen médico-psicológico de conductores (o
simplemente, reconocimiento de conductores) ha sido referido en muchas ocasiones
por los investigadores extranjeros simplemente como “modelo español” de inter-
vención.
En España es obligado pasar una exploración médica y psicológica cada vez que
se obtiene un muevo permiso o se renueva el período de vigencia de un permiso en
posesión. Función que ha sido asociada al término selección de conductores, por sus
reminiscencias históricas. El objeto de dicha exploración, más que predecir el mayor
o menor riesgo de un sujeto al accidente, es el realizar una evaluación de la situación
presente de cada conductor, con arreglo a unos parámetros de normalidad (física y
psíquica) para prever la evolución de su estado psicofísico y su posible influencia so-
bre la conducción, lo que sirve de base para establecer las condiciones restrictivas,
caso de ser necesarias, para conducir (Monterde, 19884; Martínez y Martín, 1989). El
examen español responde a una tradición en la que España, junto con algunos otros
países, fue pionera (Germain, Pinillos y Pascual, 1959; Prieto, 1982; Soler, 1983; Ca-
parrós, 1987; López de Aberasturi, 1984; Soler, Tortosa y Re1g, 1986), cuyo origen se
sitúa en la celebración en Barcelona, en el año 1921, de la II Conferencia Internacio-
nal de Psicotecnia, en la que participaron investigadores españoles —Mira y Ger-
main entre otros— y cuya conclusión más importante fue el acuerdo de recomendar
a las respectivas administraciones de los países participantes que en el sector de los
servicios de transporte se exigiera como condición previa al contrato de trabajo un
examen psicológico de las aptitudes profesionales, además de pasar un control médi-
co, que debería renovarse periódicamente. Al siguiente año el Ayuntamiento de Bar-
celona exigió este examen a los conductores de autobuses municipales, y en el año
1935 fue incluida esta obligatoriedad en el Código de la Circulación para los permi-
sos profesionales (camión, autobús...), siendo España el primer estado en instaurarla.
Desde entonces, esta obligación ha estado vigente, si bien, en el año 1982, un Real
Decreto unifica en un solo acto las dos exploraciones, médica y psicológica, y legiti-
ma a la figura del psicólogo como el profesional encargado de la parte psicológica
(aunque limitada sólo a los permisos profesionales: B-2, CA, C-2,D y E), posibili-
tando la creación de unos centros específicos para realizar dichas exploraciones. Es-
tos centros, denominados Centros de Reconocimiento de Conductores, en su as-
pecto médico pasan a sustituir la función hasta entonces encomendada al médico * de
cabecera” de extender una certificación médica, y en su aspecto psicológico sustitu-
yen a los antiguos Institutos de Orientación Educativa y Profesional e/o Institutos
de Psicotecnia, donde los conductores de permisos “profesionales” debían pasar el
examen entonces denominado psicotécnico. 2...
Es a principios del año 1983 cuando empiezan a funcionar, desde la iniciativa pri-
vada, los primeros centros con estas características en España, y con ellos, se reinicia
el interés, después de un largo letargo, por el estudio psicológico de la conducta de la
conducción de automóviles, ahora bajo la denominación específica de psicología del
tráfico o vial (Soler, 1982, 1984; Prieto, 1982, 1987; Soler y Tortosa, 1985). Después
de casi tres años de funcionamiento de los centros de reconocimientos médico-
psicológicos, y de la consolidación de la psicología del tráfico o vial como línea de
investigación actualizada y área de estudio específica en el seno de la psicología espa-
ñola, lo.que favoreció la actitud de apoyo de la Administración, es publicado el 9 de
diciembre de 1985 el Real Decreto 2272/85 que sustituyendo al anterior extiende la
obligatoriedad de la exploración psicológica a todos los permisos y categorías exis-
tentes en España. La intervención psicológica en la exploración de conductores era
ya plena. Dicha extensión del reconocimiento (y otro Real Decreto que lo extiende
también a los poseedores de armas) entró en vigencia a mediados del año 1986.
Pero la intervención psicológica en la seguridad vial se había quedado en España
donde la dejaron sus pioneros iniciadores, no experimentando evolución destacable
desde el año 1935 en el que fue recogida en el Código de la Circulación, quedando
reducida a la, y entendida como, selección de conductores bajo la perspectiva de la
psicología de la época, resultado de lo que la sociedad de entonces, que afrontaba la
explosión del desarrollo industrial, demandaba a las ciencias. Así, en la parte psicoló-
gica, el actual examen (que recogía el primer Real Decreto y que se mantiene con li-
geras modificaciones en el segundo, vigente en la actualidad) es prácticamente la
continuación congelada de aquel ideado por Mira que comprendía básicamente la
evaluación de cuatro dimensiones (Monterde, 1987), consideradas como aptitudes:
coordinación manual, apreciación de velocidades y distancias, tiempos de reacción
selectivos con precisión de las reacciones y la atención. La utilización de material in-
formatizado (aplicación por ordenador) fue la única evolución destacable hacia los
avances actuales.
Este modelo de examen, justificado en su época, responde a un enfoque psicoló-
gico observacional-clasificatorio (Pelechano, 1979) más identificado con los oríge-
nes de la psicología científica que con las tendencias intervencionistas actuales. El
automóvil ya no es una máquina para unos pocos especialistas privilegiados que ha-
bía que seleccionar en función de sus aptitudes. Como consecuencia de este cambio
social y desarrollo de la automoción, el problema de la prevención de accidentes ha
ido pasando desde un punto de vista centrado en las aptitudes, cuya solución se cen-
traba en la selección, a un punto de vista centrado en las actitudes, cuyas soluciones
propuestas van a ser de carácter social, menos fisiológicas, centradas en el cambio de
actitud y en la intervención sobre los procesos de toma de decisiones. Aspecto dife-
rencial, curiosamente, ya denunciado por Germain hacia mediados de la década de

los años sesenta. Respecto al modelo teórico subyacente, las características del exa-
men español responden fielmente y son consecuencia de la aplicación práctica del
clásico modelo de habilidades (aptitudes psicofísicas) dominante en la época en que
dicho examen fue desarrollado, que reduciendo, como ya se ha dicho, la interven-
ción psicológica a la selección de conductores, ha permanecido prácticamente sin
evolución desde su instauración hace más de cincuenta años, durante los cuales mu-
chas investigaciones realizadas han dado origen a nuevos modelos alternativos (Fu-
ller, Wilde, Náátánen-Summala... ya tratados), a nuevas corrientes y a evidencia ex-
perimental que el modelo de intervención español tiene pendiente incorporar
(Monterde y cols., 1986; Prieto, 1987).
No obstante, la existencia sin precedentes de dicho modelo y la experiencia acu-
mulada gracias a él, en sus muchos años de funcionamiento, sitúa a nuestro país en
un lugar privilegiado para estudiar e intervenir sobre el factor humano en el sistema
tráfico. Recientemente, este modelo vuelve a tener por parte de la administración es-
pañola la atención e incentivos para su necesaria actualización, que nunca debió per-
der. En el cuadro 38.2 se presenta una evolución de los criterios y dimensiones de
evaluación estudiados (con una breve descripción) desde el origen hasta la actualidad
del modelo español de intervención/evaluación.
1vV2. El futuro
Las limitaciones del modelo de intervención actualmente aplicado en España en los
Centros de Reconocimiento de Conductores han sido expuestas a través de trabajos
de investigación y de reflexión (Germain, 1966; Monterde y cols., 1986; Prieto, 1987;
Monterde, 1987; Soler y cols., 1988; Monterde, 19884; 1988b; 1989; Monterde, Soler
y Reig, 19904; Monterde, Soler y Reig, 1990b; Monterde, Carbonell y Montoro,
19914; Monterde, Carbonell y Montoro, 1991»). Entre las limitaciones de tipo cien-
tífico destacan las siguientes:
a. Unanticuado modelo psicológico subyacente de carácter exclusivamente

“aptitudinal” frente a la tendencia “actitudinal” actual.
b. Ausencia del aspecto intervencionista-asistencial.
c. Falta de consideración de variables actitudinales, motivacionales y/o cogni-
tivas y, por lo tanto, falta de exploración de tales dimensiones, cuya impor-
tancia en el contexto-tráfico ha sido puesta de manifiesto por las investiga-
ciones psicológicas recientes.
En definitiva, no se trata más que de la adaptación a las tendencias de la psicolo-

gía actual, que no son sino resultado de los cambios socioculturales producidos en
nuestra sociedad como consecuencia de su desarrollo. En este campo, como se ha
venido insistiendo, la conducción ya no es una tarea para especialistas con predomi-
nante carácter profesional, sino que ha pasado a formar parte de nuestro modo de
vida, es decir, del repertorio de conductas que los nuevos miembros de nuestra so-
ciedad tienen que aprender para desenvolverse adecuadamente en ella.
OLAVNO
“8€ 0J9POy/ ¡ouvdsa
9p UIPAJPAI-UIUIALIJUL
2 + +
+++++ + + o ooo
+ o eee o óá 970
BPe9209
Ov6! épe9909
0S6! 9461-0961 1861-9261
A AA A A A 0 a
9861
Si0NLILIV el9usbleju]
-2uebB e9usbl¡aju]
-2usf e/9uaBIjaju]
-2us6
SITWNLIITILNI
ap
¡e 0U) "(1eq8A
-2ueb erdusb1ajul
¡el 'eme¡ndiueu
|eJ "emye¡ndiueuy
Ov6L-3G61
v861-3861
ey
e|
ap
181
159,uo
ejed
Sm
-elo0aelde
jeqo¡B
—
-auyue
—
"pequen
pnindy
“0911
:e/9usB1ajul
sepepiliqey—
UBUOZey
-QuINU -J8, -S9
elouaB1jaju|
Az A A A A EQ
— "1eq — “¡erned
'uadapu!-'daq
ap
“OQUuIBo
"WBUOZey
AA II A A A RE PER A ____—_—_——
Ñ A —_——
"INSO9
NO/O43O083d
SOAIL
-3A
SOT111S3
UO/DdanJay
Sp -2, uoroda91ad
ep e]
Sp
-=SsI0/'AVvalgo7
-9,
ap
sapepioo]
Á -UB]sIp -edu/pepioo|an
Á
Á
VIONVL selo -e]01da9/9d) “elgualo
) pasas,
Á
)
onaunb
ep (BIN
ap ZId8],)
-UB]sIp
uvonedionue
SeIo
159]
ep
UO/OdaDIS4
ep
sepepIoo]
ep euweÁnien
uorIodaniad
zide],)
Á
uol9e1oaldy
Seldue]sIp
ap -81)A -I1ulg
“(enn
Á
SBIDUe]sIp
,1s8]
uolderioaldy
“eigualo
ep
“(¿¡eded
pasds,
:SOI|
seioJ98Á
“(e/1nueuy
y
oneunmb
(,¡eded
A zzAA AAA A AÁAÁKÁK KÁ— KA _—
pepioedeo
-9891 — 1 "Y -IWIOSIQ"yl SUB -NuUNSo yr] ajdhinu-119SIp yl ajd4inus-1OSIp yl ajdnu -1OSIp
uonedionue
B| -eduw!/pep190/9n
en]
eueÁniena
-0X9pIque) 'Oneu so| sajensin

Á -¡pne uu OAe -19151804) oneur
ajue -O|09 OAjeuu
3]ue -0/09
“(e1muey
-e]01d99/9d) -OSIA
INW
oje1B
ap “(ddny zapidey—
-Jed “SOM (URwIao “sal SBUJO]
Á
:90V38d
-JUOS “sa, SBUUIO]
Á -lUOS
NOIO
3191
OdMWN3I1
endao zide],)
A 'sop
Á sejsendsa/
sopÁ sejsandsa/
sajd
SAUOIDIOBIY
sepercose
e epeo sepeldose
e epeo
— y] JBnsia-98 O/quiau -a111/0d)
“(old
OJqualw -911110d)
SEJOJOLWOIPne
-uuISseAe/cose
on109|1189)-N| “(oje1Bnoe “(oje1Bnoe
(,J¡aded
“(sosouluu
OAILVNINI39SIO
AN A NN A O RÁáÚó_5_oÓ 0 ___ A AAA AAA
UO/DUA]Y -SI9804) UOIDUaJy
Á -SIS9J UO/9UaJy
Á -SIsa1
A
UOQIDUAIY
Á -SIS9J
-0950pe1qinbe])
SP
38
YH]
“UBUIaO)-19]
-19A ergua]
ergua]e e
e e] -Ou
-0U0Uu ejgua]
e e] -0U0Uu
se]
Uu0IS eA1j99/09 eJuojou u0IsidaJd)“eJuo] owoo e61]e, 'eJuo] ouwoJ9 e61]e,
ajue
VIV
-SaNASI
'U/reuIaO)-19151904
ua ja ofeueu
¡ep epipawJod “y epipauw
lod "y'1
alas
NOION31V
ap
Á seoep zide],
Á ajuejon -e|¡nuis—
ap sejsendsaJ
-ou ap sejsandsal
-ou
ap
eB1e]
VION3LSIS
(,¡eded —J0pap "(wua|y seo] ajue salas sejo] ajue sales
seJjojou -JOld
euojououl
Á so|nuse
sebiej
Á seanmeda) sebe]
Á seamedal
VINOLONOMN
ojelede)
ap so¡nunse
-0d) ap so¡nunse
-0d)
"(dISMOY
“(oje/Bnoea111| "(oje1Bnoeau!|
q
Héctor Monterde
O
971
(dVANI
2917S)|/AOWOJNE "((291S//NOLWONE
pninoe ep oleuo!] pni/oe ep o1Buo!]
-SaAND) UVOIDINPUOD -sanQ) uOo1VaNpuos
e] e1oey sopainoy: e| e1oey sepnnoy Ss3gnLILOV
“SO9
-ISI] SOJEP Á “yl
Evaluación en tráfico y seguridad vial
"UOIDINP "UO/DINP (sen)

-u09 B| UO9 sop -Uu09 B| UO9 sop -o098foJd seganid) '(sonosÁoJd s]sa)) lap Inied e sepeu “Y 118p nied e
-2uo0/9e¡al pep¡¡eu -2uo/9e¡al pep¡jeu pepijeuosiad ap soombjsd souJo] -11S9 1911Y9SI91N epenj¡ena «eua!]
s80/]5/119I08/89 -SBJ] UQOIDENn|eA3 se¡Bojod1| -x9pepinnou3»
OVANVNOSYIA
ap
-osjad ap soBsey -osjad ap soBsey
“JOJOUJOO "JOJOUIOD dOLONOJ9ISd
-Isd afezipualde -Isd afezipualde 3PVZIOUN38AV
ap pepioedeo op pepioedeo avia (O Vid VEO
"(wua|y ep Jop '(upi9noes
NOI9VNIQYOOO
-e¡nuls) ajue| -O1d SP 10104)
ZIBlONOSIA
IVANVIA
“(¡epreuuog (¡9preuuog (Jepreuuog -01 |ap ofeueu ¡enuewouou
BI1OJOLJOSIA
ap oJulleqe| a¡qop) ap ojuleqe| alqop) ua Uu0QIsI0ald— UQ/DRUIPI00)—
ap ojuaqe| a¡qop)
ojsandu! ou e ojsanduu ou e ojsandu ou e “(,¡oded Á zid (Aye ap ou
-B],)
-18
¡enueulg ZzlJoLuOS ¡enueuliq zIJouulOs ¡enueuq zI/jOuJOS -J0|) ¡enueuq
“lA UOIDBUIPJOOD -IA UOQI9BUIPIOOL) “IA UOIOBUIPIOOL) UO/DRUIPIO0O0D)— UQO/DRUIPIOO0D)—
Entre las limitaciones que podríamos denominar de tipo técnico-profesional,

cabe destacar las siguientes:
a. Ausencia de restricciones al conductor por motivos psicológicos, verdadero

“caballo de batalla” y herramienta necesaria para que la labor del psicólogo pase de
tener un carácter meramente sancionador a un carácter asistencial y preventivo, de
prestación de ayuda al conductor, que no solamente le hará consecuente con la fun-
ción de la psicología como ciencia de la salud, sino más útil a lasociedad en la educa-
ción para la seguridad y en la prevención de la exposición al riesgo.
b. Limitaciones en el desarrollo futuro de instrumentos y métodos de evalua-
ción, que supone la no diferenciación entre los nombres de las dimensiones a evaluar
y el nombre de las pruebas propuestas para su evaluación.
Es por ello por lo que se ha elaborado una propuesta de reforma del actual exa-
men psicológico de conductores, que implicara un nuevo modelo de actuación, de
carácter marcadamente intervencionista y comunitario, más acorde con los plantea-
mientos de la psicología actual y a las características actuales y necesidades próximas
de nuestra sociedad, y a la vez, compatible con el sistema seguido hasta el momento
en los centros de reconocimiento españoles.
1v.2.1. Características generales del modelo de intervención propuesto

Se ha hecho ya referencia a la superación del modelo psicológico subyacente al de-
nominado “modelo español”, basado en la exigencia de tareas, en el que la idea bási-
ca es que la conducción no es esencialmente diferente de cualquier actividad que im-
plique destreza, considerándola a la conducción como una habilidad exclusivamente
perceptivo-motora y a los accidentes como características de dicha habilidad, siendo
las habilidades psicofísicas la única variable independiente del denominado factor
humano. Bajo este supuesto, la seguridad del conductor se ha considerado determi-
nada por el nivel de sus habilidades psicofísicas en relación con las demandas del en-
torno. La estrategia intervencionista derivada de este modelo, para incrementar la
seguridad vial, ha tenido un doble objetivo; por un lado, incrementar las habilidades
psicofísicas de los conductores (selección y entrenamiento) y, por otro, disminuir las
exigencias del entorno (coches más fáciles de conducir, mejores carreteras...). El mo-
delo español de intervención, dada la oportunidad de desarrollar una labor preventi-
va sin 1gual, a la vez que propicia la investigación en este campo y la formación de un
cuerpo de profesionales especializados (tanto de la medicina como de la psicología),
es perfecta y obligadamente aprovechable, y susceptible de revisión para adecuarlo a
las tendencias y demandas actuales, incorporando el estudio de las nuevas variables
de interés, avaladas por las investigaciones recientes.
En este objetivo, compartido por muchos profesionales e investigadores del sec-
tor, a la hora de plantearse la revisión del actual examen psicológico, la tendencia de
opinión inicial entre los especialistas ha venido siendo ampliar el reconocimiento
con nuevas exploraciones, evaluando las nuevas dimensiones puestas de manifiesto
por la investigación reciente y otras que no fueron incluidas en la normativa vigente.
Esta ampliación transversal del reconocimiento plantea el problema, no menos im-

portante, de producir un aumento considerable del tiempo empleado en el centro
para cada reconocimiento. La solución nos llevó a optar por una estructura pirami-
dal: reconocimiento psicológico basado en una sola prueba, de aplicación con carác-
ter general, sobre la que en función de las deficiencias observadas en el sujeto al reali-
zarla y del cumplimiento de ciertas condiciones, en las que se tiene en cuenta desde el
tipo de permiso hasta el historial del conductor, se decide la conveniencia de ampliar
la exploración con otras pruebas con el objetivo de completar el diagnóstico y obte-
ner una solución lo más satisfactoria posible a las deficiencias encontradas en el esta-
do presente del conductor.
El tiempo de reacción, con larga tradición de estudio en psicología e ingeniería,
es la variable que ha acumulado mayor riqueza y extensión de datos experimentales,
y sobre la que más se conocen efectos de otras variables. Sabemos que sobre el tiem-
po de reacción del conductor tienen influencia multitud de factores (alcohol, drogas,
estados depresivos, estados de ánimo, fármacos, neuropatologías, etc.), por lo que
puede considerarse como un buen indicador de normalidad psicofísica o, lo que es lo
mismo, un buen indicador de la existencia de algún trastorno o circunstancia de rele-
vancia para la conducción, además del propio tiempo de reacción. La prueba básica,
única que se propone con carácter obligado, es la prueba de tiempo de reacción dis-
criminativo, con ligeras modificaciones en una de las existentes en todos los equipos
“normalizados” (en España por la Dirección General de Tráfico) para permitir, por
una parte, obtener evaluaciones parciales para cada miembro (con posibilidad de
anular el registro de alguno de ellos si falta anatómicamente en el sujeto, aspecto, por
otra parte, recogido en la parte médica pero no en la psicológica de la normativa ac-
tual), y, por otra, eliminar los efectos de aprendizaje (variable extraña comprobada),
utilizando estímulos simples y directos (pues la discriminación auditiva y cromática
ya está cubierta en la parte médica del reconocimiento), que a su vez permitirá ade-
más una comprobación somera de la rapidez y comprensión lectora, y un acorta-
miento considerable del tiempo actualmente necesario para pasar la prueba (al elimi-
narse el período de aprendizaje de la tarea a realizar por el sujeto).
Por ello, el proyecto propuesto supone una modificación importante en el
modo de hacer y entender la psicología en los centros de reconocimiento. Á conti-
nuación se expondrán las características generales más importantes de este nuevo
modelo:
a. Ahorro de tiempo, no empleando más tiempo del estrictamente necesario,

sin detrimento, como se verá, de una exploración más completa, para llegar a detec-
tar el factor de riesgo, y más funcional, intentando su solución o neutralización y
evitando una actuación rutinaria.
b. Actuación diferencial según las características físicas y psicológicas de los
sujetos, actuales y pasadas, entre otras circunstancias, de forma que reciban más
atención, y más completa exploración, los denominados “grupos de riesgo” (por
ejemplo, la evaluación de la “percepción de la velocidad/impac iencia” será obligada
en aspirantes a A-1 menores de edad, y la de la “coordinación visomotriz bimanual
en caso de rehabilitados de toxicodependencia). Circunstancias que también serán
tenidas en cuenta por el psicólogo, junto con los resultados que vaya obteniendo a lo
largo de la exploración, para decidir la conveniencia de exploraciones complementa-

rias y la estrategia de evaluación y actuación en cada caso concreto.
c. No aplicar una prueba (o realizar una exploración) si no está justificada y/o
existen indicios de que tal dimensión pueda estar alterada. Con ello nos acercamos a
los criterios imperantes en el resto de los países europeos (basados en lapresunción
de inocencia, en este caso, de la presunción de capacidad para conducir de todo po-
seedor de un permiso).
d. Complementación del examen médico en aquello que puede ser materia de
estudio por ambas disciplinas. En concreto, en lo referente a la motilidad, la explora-
ción psicológica aporta una ampliación de la evaluación de la deficiencia en el aspec-
to funcional cuando no exista carencia anatómica. También se incluye en este aspec-
to la coordinación entre los tres reconocimientos, eliminando de la parte psicológica
las referencias a discriminación de colores, comprobada por el oftalmólogo, y a so-
nidos, comprobada por el médico general, que además dificultan el pase y la validez
de los resultados de las pruebas de tiempo de reacción. Esta complementación, a la
que se está haciendo referencia, también se extiende a las necesidades inmediatas de
los organismos responsables de la Administración, al incluirse en muchas pruebas,
como condición adicional, el requerimiento de la Dirección General de Tráfico al
haber incluido una estrategia específica de actuación, con examen especial (de aplica-
ción con carácter extraordinario), para el caso de aspirantes con reiterados suspensos
en el examen de conducción o de conductores con destacado historial de riesgo (que
da respuesta a una demanda reciente de las Jefaturas Provinciales de Tráfico en algu-
nas provincias).
e. Se ha buscado un interés especial en conceder peso al seguimiento y a la ubi-
cación social del centro de reconocimiento en la comunidad territorial de pertenen-
cia y sus recursos, sin detrimento de la libertad de elección de centro que ha venido
existiendo. Se trata de posibilitar que puedan ser tenidos en cuenta en la decisión de
datos sobre el sujeto provenientes de fuentes externas al propio centro, si los hay, los
resultados de reconocimientos anteriores, en aquellos casos en que sea conveniente
(por ejemplo, para el control de un trastorno en evolución o de un tratamiento reco-
mendado como consecuencia del reconocimiento), y de poder utilizar los recursos
disponibles en la población o barrio donde está ubicado un centro. Así, se propone
una serie de medidas: posibilidad de solicitud de informes a diferentes instituciones,
en la medida en que vayan desarrollando los mecanismos de contacto, hincapié en la
existencia de antecedentes de toxicodependencia y de conducta de riesgo, revisión
anual (siguiente) en el mismo centro, condición de “No apto temporal” que sólo se
podrá anular por el mismo centro que la impuso (para control del seguimiento), et-
cétera.
f. Paso de una labor sancionadora (actual, en el caso de la parte psicológica) a
una labor predominantemente preventiva, con la introducción de restricciones al
conductor en función de los resultados globales y/o parciales del reconocimiento
psicológico. Consecuentemente con la actitud general de ayuda al conductor que
desde aquí es defendida, y que significa adecuar las condiciones de conducción a las
deficiencias de cada conductor, de forma que puedan conducir el mayor número de
personas con ciertas garantías de seguridad para la sociedad, es decir manteniendo, y
s1 es posible reduciendo, el riesgo provocado por el estado físico y psicológico de los
conductores (que como sabemos es sólo una parte del riesgo en la conducción la que
corresponde evaluar y controlar a los centros).
g- Introducción de nuevas exploraciones. Algunas que podríamos considerar
clásicas en psicología, como la rapidez y velocidad lectoras (en aquellos casos en los
que existan indicios de deficiencia considerable o fracaso reiterado en el examen
“teórico” de conducción), exigiéndose un mínimo de rapidez en la comprensión de
textos y limitando la velocidad cuando el grado de deficiencia en este aspecto así lo
aconseje (téngase presente que gran parte de la información vial se expresa a través
de textos, y que en el caso de las señales informativas de dirección, especialmente en
vías rápidas, exigen una rapidez de procesamiento y decisión cuya imposibilidad de
logro dificulta la fluidez y la seguridad del sistema tráfico). Otras exploraciones son
tan nuevas en psicología como en este campo de aplicación, resultado de la investiga-
ción y literatura científica recientes (véase Monterde, 1989) en el campo de la psico-
logía del tráfico, tendentes a considerar, junto a las dimensiones clásicas, aspectos ac-
titudinales, motivacionales y/o cognitivos, como la percepción de riesgo, la actitud
temeraria y la toma de decisiones, en las que se ha venido trabajando, demostrando
su posibilidad de exploración y su viabilidad de aplicación dentro del modelo.
h. Desarrollo de un verdadero modelo de intervención/actuación psicológica,
que teniendo al centro de reconocimiento como base excede sus propios límites. En-
tendiendo la función del centro como primaria (primera exploración) y definitiva
(decisión final), controlando siempre el proceso entre ambos momentos, pueda re-
mitirse al sujeto a entidades públicas o privadas para completar una exploración, am-
pliarla, confirmar una deficiencia o los mismos resultados de la exploración realizada
en el centro, así como para recibir un tratamiento.
1. Finalmente, mínimas modificaciones en los equipos y pruebas ya adquiridas
que sólo afectan a la prueba de tiempo de reacción.
V. CONCLUSIONES
Somos conscientes de la gran dificultad que supone el control, para la Administra-

ción, del cumplimiento, por parte del conductor afectado, de algunas de las medidas
y/o restricciones propuestas en este modelo. Nos queremos manifestar en defensa
de que sean mantenidas las máximas posibles, dada la necesidad que los psicólogos
tenemos de ellas para lograr convertir nuestra intervención en un servicio al con-
ductor. by
En primer lugar, es importante defender que es consecuente (con la experiencia
psicológica) confiar en la voluntad de cumplimiento del conductor, ya que las res-
tricciones propuestas no tienen carácter sancionador, al no impedírsele al sujeto el
derecho a conducir, sino todo lo contrario, garantizar su derecho a continuar condu-
ciendo, en unas condiciones perfectamente asumibles por éste, tendentes a mante-
ner, en función de su estado actual (y en cada momento, según sus circunstancias
personales), la seguridad para él y para el resto de los conductores. Téngase presente
que las compañías de seguros exigen en la actualidad condiciones para hacer frente a
sus responsabilidades derivadas de la contratación de las pólizas frente a la ocurren-
cia de un accidente, y presumiblemente, estas exigencias 1rán en aumento y muy po-

siblemente en un futuro incluyan en sus cláusulas el cumplimiento de las restriccio-
nes resultantes del reconocimiento médico-psicológico, en función del estado psico-
físico del conductor tomador del seguro, por lo que dicho reconocimiento puede
convertirse también en garantía al conductor de que las responsabilidades frente a
un posible accidente serán asumidas por la aseguradora. y
En segundo lugar, advertir a nuestras Administraciones con responsabilidad en
el tema, que el costo o esfuerzo que suponga el cumplimiento de una norma, no ha
sido ni debe ser condición para su promulgación. Por ejemplo, recuérdese que la ve-
locidad ha estado limitada desde prácticamente el nacimiento del automóvil, mucho
antes de que aparecieran, se imaginaran y se inventaran los métodos e instrumentos
para medirla y, más aún, para ejercer su control.
Adams, J. G. U. (19854). Risk and freedom: The record of road safety regulation. Cardiff.
Transport Publishing Projects.
Adams, J. G. U. (1985b). Seed”s seat belts and the emperors's new clothes. En L. Evans y
R. C. Schwing (dirs.), Human behavior and traffic safety. Nueva York. Plenum Press.
Adams, J. G. U. (1988). Risk homeostasis and the purpose of safety regulation. Ergonomacs,
Sl
Blasco, R. D. y Casas, R. (1985). Polirreactímetro y batería de aptitudes psicomotrices para la
exploración de conductores. Tesis de licenciatura inédita. Universidad de Barcelona.
Bótticher, A. y Van der Molen, H. (1985). Risicomodellen als determinanten van voorlichting
en andere verkeersvelligherdsmaatregelen. Groninga. University of Groningen.
Bótticher, A. y Van der Molen, H. (1988). Predicting overtaking behavior on the basis of the
hierchical risk model for traffic participants. En J. Rothengatter y R. de Bruin (dirs.),
Road user behaviour: Theory and research. Assen/Maastricht. Vam Gorcum.
Brown, J. D. (1980). Error correction probability as a determinant of drivers” subjetive risk.
En D. J. Oborne y J. A. Levis (dirs.), Human factors in transport research. Londres. Aca-
demic Press.
Bruin, R. D., Vaa, T. y Ostvik, E. (1989). Opinions of drivers and police officers about the se-
riousness of traffic violations. Documento inédito.
Caparrós, A. (1985). Aspectos históricos de la psicología aplicada a la conducción. En DGT
(dir.), Primera reunión internacional de psicología de tráfico y seguridad vial. Madrid. Di-
rección General de Tráfico.
Conant, R. C. y Ashby, W. R. (1970). Every goad regulator of a system must be a model of
that system. International Journal of Systems Science, 1.
Cownie, A. R. y Calderwood, J. H.(1966). Feedback in accident control. Operational Re-
search Quarterly, 17.
Edwards, W. (1954). The theory of decision making. Psychological Bulletin, 81.
Evans, L. (19854). Human behavior feedback and traffic safety. Human Factors, 27.
Evans, L. (1985b). Factors controlling traffic crashes. Comunicación presentada al Tenth Re-
pe Conference on Subjetive Probability, Utility, and Decision Making. Helsinki, Fin-
andia.
Forbes, T. W. (1939). The normal automovile driver as a traffic problem. Journal of General
Psychology, 20.
Fuller, R. (1984). A conceptualization of driving behavior as threat avoidance. Ergonomics,
27, 1139-1155. .
Fuller, R. (1986). Reflections on risk homeostasis theory. En B. Brehmer, H. Jungerman,
P. Lourens y G. Sevon (dirs.), Nezw directions in research on decision making. Amsterdam.
North Holland.
Fuller, R. (1988). On learning to make risky decisions. Ergonomics, 31.
la J. (1966). El psicólogo y la seguridad vial. Revista de Psicología General y Aplicada,
Germain, J., Pinillos, J. L. y Pascual, M. (1959). Las pruebas de selección de conductores y su

validez. Revista de Psicología General Aplicada, 14.
Gibson, J. J. y Crooks, L. E. (1938). A theoretical field-analysis of automobile-driving. Ame-
rican Journal of Psychology, 51.
Haight, F. A. (1964). Accident proneness, the history of an idea. Automobilismo e Automobi-
lismo Industriale, 4.
Hineline, P. N. (1981). The several roles of stimuli in negative reinforcement. En P. Harzem
y M. D. Zeiler (dirs.), Predictability, correlation and contignity. Chichester. Wiley.
Huguenin, R. D. (1988). The concept of risk and behaviour models in traffic psychology. Er-
gonomaics, 31.
Hurtwood, A. (1968). Planning for play. Londres. Thames and Hudson.
Janssen, W. H. y Tenkink, E. (19884). Risk homeostasis theory and its critics: Time for an
agreement. Ergonomacs, 31.
Janssen, W. H. y Tenkink, E. (1988b). Considerations on speed selection and risk homeostasis
in driving. Documento inédito.
Kelley, C. R. (1968). Manual and automatic control. Nueva York. Wiley.
López de Aberasturi, N. (1984). Psicología de la conducción en España. En DGT (dir.), Pri-
mera reunión internacional de psicología de tráfico y seguridad vial. Valencia. DGT.
Major, V. (1986). Playboard's adventure playground specialist. Documento inédito.
Martínez, C. y Martín, B. (1989). Maquinitas para matar marcianos. Tráfico, 40.
McKenna, F. P. (1982). The human factor in driving accidents. Ergonomics, 25.
McKenna, F. P. (19854). Do safety measures really work? An examination of risk homeosta-
sis theory. Ergonomics, 28.
McKenna, F. P. (1985b). Another look at the “New Psychophysics”. British Journal of Psy-
chology, 76.
McKenna, F. P. (1985c). Comments on “Risk homeostasis in an experimental context”. En
L. Evans y R. C. Schwing (dirs.), Human behavior and traffic safety. Nueva York.
Plenum Press.
Michon, J. A. (1979). Dealing with danger. Traffic Research Centre Report, 79.
Michon, J. A. (1985). A critical review of driver behaviour models: What do we know, what
should we do? En L. Evans y R. C. Schwing (dirs.), Human behavior and traffic safety.
Nueva York. Plenum Press.
Mira, E. (1920). Laboratori psicometric. Anals de l'Institut d'Orientació Professional, 1.
Mischel, Y. (1973). Toward a cognitive social learning reconceptualization of personality.
Psychological Revierw, 80, 252-283.
Monterde, H. (1987). La evaluación psicológica por medio del ordenador: validez de cons-
tructo y fiabilidad de las actuales pruebas psicológicas para conductores basadas en orde-
nador. Psicología del Trabajo y de las Organizaciones, 6.
Monterde, H. (19884). Algunas reflexiones en torno al modelo de intervención en psicología
vial. Informació Psicologica, 34. e
Monterde, H. (1988b). Notas acerca del criterio de validez de las pruebas psicofísicas para el
examen de conductores. Informació Psicologica, 35.
Monterde, H. (1989). Percepción de riesgo y toma de decisiones en situaciones simuladas de

conducción. Valencia. Universitat de Valencia. ,
Monterde, H., Carbonell, E. y Montoro, L. (19914). El reconocimiento psicológico de con-
ductores: propuesta para una nueva normativa. Recosevial, 4.
Monterde, H., Carbonell, E. y Montoro, L. (1991b). Propuesta de un nuevo modelo de ac-
tuación en Centros de Reconocimiento de Conductores. Papeles del Psicólogo, 49.
Monterde, H., Ripoll, F., Núñez, V., Calvo, J., Barberá, T. y Llobregat, C. (1986). Por un rol
profesional del psicólogo en Centros de Reconocimiento de Conductores. Informació
Psicológica, 25.
Monterde, H., Soler, J. y Reig, A. (19904). Nuevas dimensiones e innovaciones metodológicas
en la exploración de conductores (1): Percepción de riesgo. Comunicación presentada al
II Congreso del Colegio Oficial de Psicólogos. Valencia.
Monterde, H., Soler, J. y Reig, A. (1990b). Nuevas dimensiones e innovaciones metodológicas
en las exploraciones de conductores (11): Toma de decisiones de riesgo. 1! Congreso del Co-
legio Oficial de Psicólogos. Valencia.
Montoro, L. (1990). La psicología y la seguridad vial en España. Comunicación presentada en
el Il Congreso del Colegio Oficial de Psicólogos. Valencia.
Moraal, J. (1980). De studie van het verkeersgegrag. Ergonomte, 5.
Munsterberg, H. (1914). Psicología de la actividad industrial. Madrid. Daniel Jorro.
Náátánen, R. y Summala, H. (1974). A model for the role of motivational factors in drivers
decision-making. Accident Analysis and Prevention, 6, 243-261.
Naátánen, R. y Summala, H. (19764). Road-user behavior and traffic accidents. Groninga.
North-Holland.
Naátánen, R. y Summala, H. (1976b). Effort in driving as a traffic-safety problem. En
G. Borg (dir.), Physical work and effort. Oxford. Pergamon Press.
Neisser, U. (1976). Cognition and reality. San Francisco. Freeman.
Nevin, J. A. y Reynolds, C. S. (1973). The study of behavior. Ulinois. Scott, Foresman and
Co.
Nunnally, J. C. (1978). Psychometric theory (2.* ed.). Nueva York. McGraw-Hill.
O'Neill, B. (1977). A decision-theory model of danger compensation. Accident Analysis and
Prevention, 9.
Oppe, S. (1988). The concept of risk: A decision theoretic approach. Ergonomics, 31.
Pelechano, V. (1979). Psicología educativa comunitaria. Valencia. Alfaplús.
Pinillos, J. L. (1985). Personalidad y conducción. En DGT (dir.), Primera reunión internacio-
nal de psicología del tráfico y seguridad vial. Valencia. DGT.
Prieto,J.M. (1982). Puestos de trabajo para psicólogos en seguridad vial. Papeles del Colegio, 6.
Prieto, J. M. (1987). La intervención psicológica en los Centros de Reconocimiento. En ]. So-
ler y E. Tortosa (dirs.), Psicología y tráfico. Valencia. Nau Llibres.
Rachlin, H. (1976). Behavior and learning. San Francisco. Freeman.
Reig, A. y Soler, J. (1986). Comportamiento humano y accidentes de tráfico: Un estudio empí-
rico en Alicante. Documento inédito.
Reig, A. y Soler, J. (1988). Comportamiento de riesgo y accidentes de tráfico: Un estudio en
Alicante. Documento inédito.
Robinson,J.(1962). Economic philosophy. Londres. Pelican.
Rockvell, T. (1972). Skills, judgement and information acquisition in driving. En T. V. For-
bes (dir.), Human factors in highway traffic safety research. Nueva York. Wiley.
Rumar, K., Berggrund, U., Jerberg, P. y Ytterbom, U. (1976). Driver reaction to a technical
safety measure: Studded tires. Human Factors, 18.
Schneider, W. y Schiffrin, R. N. (1977). Controlled and automatic human information pro-
cessing; Detection, search, and attention. Psychological Review, 84.
Shannon, H. S. (1986). Road-accident data: Interpreting the British experience with particu-
lar referencia to the risk homeostasis theory. Érgonomics, 29.
Sivak, M. y Soler, J. (1987). Driver self-assessment in Spain and the USA. Documento inédito.
Skinner, B. F. (1971). Beyond freedom and dignity. Nueva York. Bantam Books.
Smeed, R. J. (1949). Some statistical aspects of road safety research. Journal of the Royal Sta-
tistical Society, 112.
Soler, J. (1982). El factor humano en la conducción de vehículos automóviles: un estudio bi-
pie en la R.P.G.A. (1946-1980). Tesis de licenciatura inédita. Universidad de Va-
encia.
Soler, J. (1983). Desarrollo histórico de las pruebas de aptitud psicotécnica para la conducción
en España. Documento inédito.
Soler, J. (1984). El factor humano en la conducción de vehículos automóviles: un estudio bi-
bliométrico en el S.S.C.I, Tesis doctoral inédita. Universidad de Valencia.
Soler, J., Reig, A., Monterde, H. y Mayor, L. (1987). Induced stress and risk-taking under
dummy driving conditions. Comunicación presentada al Second International Conferen-
ce on Road Safety. Groninga, Holanda.
Soler, J. y Tortosa. F. (1985). Psicología y seguridad vial: autores, temas y fuentes. Papeles del
Colegio, 21.
Soler, J., Tortosa, F., Montoro, L. y Monterde, H. (1988). Psicología y seguridad vial. Recose-
vial, 3.
Soler, J., Tortosa, F. y Reig, A. (1986). Psicología y seguridad vial en España: una perspectiva
histórica. Informació Psicologica, 25.
Summala, H. (1980). Driving-speed regulation and other means to reduce risks when mee-
ting a pedestrian on a dark road. International Revierw ofApplied Psychology, 29.
Summala, H. (1985). Modeling driver behavior: A pessimistic prediction? En L. Evans y
R. C. Schwing (dirs.), Human behavior an traffic safety. Nueva York. Plenum Press.
Summala, H. (1986). The deterministic man in stochastic world: Risk management on the
road. En B. Brehmer, H. Jungermann, P. Lourens y G. Sevon (dirs.), New directions in re-
search on directions making. Amsterdam. Elseviers Science Publishers/Nort-Holland.
Summala, H. (1988). Risk control is not risk adjustment: The zero-risk theory of driver beha-
vior and its implications. Ergonomics, 31, 491-506. ce
Summala, H. y Hietamaki, J. (1984). Drivers” inmediate responses to traffic signs. Ergono-
mics, 27. i
Summala, H. y Merisalo, A. (1980). A psychophysical method for determining the effects of
studded tires on safety. Scandinavian Journal of Psychology, 21. A.
Summala, H., Vierimaa, J., Hietamaki,J. y Keinánen, K. (1981). Varortusvilkku ja jalankulki-
joiden turvallisuus. Roads and Waterways Administration Publication, 74, 19-66.
Svenson, O. (1973). Change of mean speed in order to obtain a prescribed increase or decrea-
se in travel time. Ergonomacs, 16 y
Svenson, S. (1978). Risks of road transportation in a psychological perspective. Accidental
Anales Prevention, 10.
Svenson, O. (1981). Are we all less risky and more skillful than our fellow drivers? Acta Psy-
chologica, 47. ascreatde
Taylor, D. H. (1964). Drivers galvanic skin response and the risk of accident. Ergonomics, 7.
Tramm, K. A. (1921). Psychotechnik und Taylor-System (vol. 1). Arbeitsuntersuchungen.
ringer. -.
o rs H. y Bótticher, A. M. T. (1988). A hierarchical risk model for traffic partici-
ants. Ergonomicts, 31, 537-555.
Ward, (e 1961). Adventure playground: A parable of anarchy. Anarchy: A Journal of Anar-
chist Ideas, 7. 06
Wilde, G. ]. S. (19824). The theory of risk homeostasis: Implications for safety and health.
sk Analisys, 2, 209-225.
Fada GJ3S. (1982b), Criticals issues in risk homeostasis theory. Risk Analisys, 2, 249-258.
Wilde, G. ]. S. (1984a). Evidence refuting risk homeostasis theory? A rejoinder to Frank

P. McKenna. Ergonomacs, 27. ¿4
Wilde, G. J. S. (19854). The use of incentives for the promotion of accident-free driving. Jour-
nal of Studies on Alcohol (supl. 10).
Wilde, G.].S. (1985b). Assumptions necessary and unnecessary to risk homeostasis. Ergono-
macs, 28.
Wilde, G. J. S. (19864). Notes on the interpretation of traffic accident data and of risk homeos-
tasis: A reply to L. Evans. Risk Analysis, 6.
Wilde, G. J. S. (1986b). La théorie du risque homéostatique: Les débats actuels. París. Procee-
dings, Atec-86.
Wilde, G. J. S. (1986c). Beyond the concept of risk homeostasis: Suggestions for research and
application towards the prevention of accidents and lifestyle-related disease. Accident
Analysis and Prevention, 18.
Wilde, G. J. S. (1987). Perspectivas de investigaciones futuras. En J. Soler y F. Tortosa (dirs.),
Psicología y tráfico. Valencia. Nau-Llibres.
Wilde, G. J. S. (19884). Risk homeostasis theory applied to a fictious instance of an individual
drivers decision making. En J. Rothengatter y R. de Bruin (dirs.), Road user behaviour:
Theory and research. Assen/Maastricht. Van Gorcum.
Wilde, G. J. S. (19885). Risk homeostasis theory and traffic accidents: Propositions, deduc-
tions and discussion of dissension in recent reactions. Ergonomics. 31, 441-468.
Wilde, G. J. S., Claxton-Oldfield, S. P. y Platenius, P. H. (1985). Risk homeostasis in a experi-
mental contex. En L. Evans y R. C. Schwing (dirs.), Human behavoir and traffic safety.
Brown, J. D. (1980). Error correction probability as a determinant of drivers” subjetive risk.

En D. J. Oborne yJ. A. Levis (dirs.), Human factors in transport research. Londres. Aca-
demic Press.
López de Aberasturi, N. (1984). Psicología de la conducción en España. En DGT (dir.), Pri-
mera reunión internacional de psicología de tráfico y seguridad vial. Valencia. DGT.
Michon, J. A. (1985). A critical review abdriver behaviour models: What do we know, what
should we do? En L. Evans y R. C. Schwing (dirs.), Human behavior and traffic safety.
Monterde, H. (1989). Percepción de riesgo y toma de decisiones en situaciones simuladas de
conducción. Valencia. Universitat de Valencia.
Prieto, J. M. (1987). La intervención psicológica en los Centros de Reconocimiento. En J. So-
ler y F. Tortosa (dirs.), Psicología y tráfico. Valencia. Nau Llibres.
39. EVALUACIÓN AMBIENTAL
F. JAVIER PÉREZ-PAREJA
I. INTRODUCCIÓN
Como señala Fernández-Ballesteros (1987, p. 17) «la evaluación psicológica ha pasa-

do de ser una disciplina a través de la cual se pretendía la clasificación y descripción
de los sujetos humanos en base a un conjunto de características psicológicas, a ocu-
parse del análisis del sujeto en su contexto y a la propia evaluación y valoración de
contextos desde una perspectiva ecopsicológica». En esta línea, el tradicional objeti-
vo de la psicología —es decir, el estudio de la conducta humana— parece haberse
ampliado (Stokols, 1978). Por su parte, Dunlap (1980) sostiene que se está constitu-
yendo un nuevo paradigma ecológico en el modelo de conducta humana. Para Fer-
nández-Trespalacios (1990) la irrupción del punto de vista ecológico en la psicología
ha supuesto los siguientes aspectos fundamentales:
a. El reconocimiento de que la conducta humana está dirigida por su adecua-

ción al ambiente.
b. Tanto el ambiente como nuestra capacidad adaptativa (que parte de la unici-
dad del ser humano) son fruto de una misma evolución; por ello, lo funda-
mental radicaría en el estudio de la actividad evolutiva del universo.
c. El cambio ambiental no sólo produce cambios en el propio ambiente, sino
que también afecta a nuestra propia psicología. Esta cuestión implica que la
degradación ambiental afectará, consecuentemente, a nuestra psicología, de-
gradándola.
d. Por último, el enfoque ecológico supone la ruptura con el paradigma cogni-
tivo y con ello con la ciencia cognitiva e incluso con el desarrollo técnico de
los estudios de inteligencia artificial.
Sin embargo, desde nuestro punto de vista, el hablar de una perspectiva o un

paradigma ecológico en psicología plantea, al menos en el campo de la evaluación,
algunos problemas fundamentales. En primer lugar, no resulta claro si el denomi-
nar modelo ecopsicológico a esta manera de actuar en psicología es debido al he-
cho de que lo ecológico está de moda o, por contra, porque la concepción ecológi-
ca se ha convertido en una condición necesaria para el estudio de la conducta
humana. Admitiendo que esta última lectura sea cierta, deberíamos preguntarnos sl
esta perspectiva ecopsicológica se ha traducido suficientemente en modificaciones
conceptuales y tecnológicas que afecten a la psicología científica, y por tanto a la
evaluación psicológica o, por contra, lo único que se ha producido ha sido una am-

pliación en el análisis sistémico de los distintos niveles de complejidad de la con-

ducta humana, intentando el estudio simultáneo de un mayor número de variables.
Todo ello, tan sólo como fruto de una mayor complejidad tecnológica derivada de
los instrumentos de evaluación y de un análisis estadístico más sofisticado de las
relaciones entre el número “creciente” de variables estudiadas. Es decir, si bien no
parece discutible la introducción de la perspectiva ecológica en elquehacer de la
psicología científica, al menos metodológicamente, dicha concepción plantea apre-
ciables dificultades a la hora de ser operativizada. Sin embargo, hemos de hacer
hincapié en que a pesar de los problemas señalados, «el ambiente ha de ser tenido
en cuenta si pretendemos explicar el comportamiento» (Fernández-Ballesteros,
1987, p. 18). Asimismo, y siguiendo a Fernández-Ballesteros (1987), la INCOrpora-
ción del estudio del ambiente a la psicología, tendría una doble repercusión para la
evaluación. Por un lado, desde una concepción puramente tecnológica se plantea la
necesidad de desarrollar técnicas adecuadas para analizar las variables ambientales
y, por otro, el objeto de la evaluación ha de ampliarse al estudio de los ambientes
específicos, «o mejor, a la interrelación entre los distintos ambientes y sus habitan-
tes» (Fernández-Ballesteros, 1987). Por último, no debemos olvidar que los pro-
blemas que aparecen a la hora de caracterizar la evaluación ambiental se derivan de
la propia concepción de psicología ambiental que se establece desde el campo de la
psicología científica.
II. LAPSICOLOGÍA AMBIENTAL
11. Características y definición

Numerosos autores han insistido en definir el campo de la psicología ambiental como
interdisciplinario. Esta definición, tal como destaca Pol (1991), a pesar de tener sus
justificaciones históricas, también puede generar errores importantes. Es indudable
que tanto la ecología como la sociología, arquitectura, urbanismo, geografía, etc. se
interesan por el ambiente; sin embargo, autores como Moore (1987) resaltan que es
preferible hablar de una problemática común a todas estas disciplinas sobre la que
cada una de ellas hace su aportación. Así, la psicología ambiental sería una disciplina
más, desarrollando sus planteamientos y aportaciones teóricas específicas. No obs-
tante, como señala De Castro (1982, p. 7) «el término psicología ambiental ha ido
siendo asumido, desde diferentes áreas disciplinares, como el descriptor general del
ámbito científico cuyo foco de investigación es el estudio de la interrelación entre el
medio físico y la experiencia y conducta humanas». Esta definición coincidiría casi
literalmente con la propuesta por Holahan (1991, p. 21), autor para el que la psicolo-
gía ambiental es «un área de la psicología cuyo foco de investigación es la interrela-
ción del ambiente físico con la conducta y la experiencia humana». Para autores
como Jiménez Burillo y Aragonés (1986), este tipo de definiciones resultarían insufi-
cientes al no contemplar otros aspectos relevantes del ambiente, como por ejemplo
la propia realidad social que en el caso humano se convierte en el factor determinante
del medio. Sin embargo, tal como señalan Craik (1968), Proshansky (1972) o Hola-
Evaluación ambiental 983
han (1982), entre otros, el origen de la psicología ambiental se encuentra estrecha-

mente unido a cuestiones prácticas planteadas por personas interesadas en el diseño
de ambientes físicos. Por tanto, la psicología ambiental se presenta como un área de
conocimiento orientada a fines; asumiendo problemas axiológicos y normativos.
Desde sus inicios la psicología ambiental ha mantenido una profunda preocupación
por los aspectos prácticos y aplicados. Tal como indican Jiménez Burillo y Aragonés
(1986), la estrecha relación entre teoría y práctica constituye una de las característi-
cas fundamentales de esta parcela del saber.
Por otra parte, la psicología ambiental se caracteriza por la importancia que se
atribuye a los procesos de adaptación, ya que, como señala White (1974), la adapta-
ción abarca todos los procesos que presentan los habitantes de un ambiente al inte-
ractuar con el mismo. Según el propio White (1974), la perspectiva adaptativa de la
psicología ambiental hace hincapié en los siguientes aspectos:
a. Losprocesos psicológicos actúan como mediadores del efecto que producen

los distintos ambientes en la actividad humana. Por ejemplo, al estudiar los efectos
que provoca el ruido en el rendimiento laboral, habría que analizar no sólo qué efec-
tos se producen en el comportamiento laboral, sino también cómo se originan tales
efectos. Así, hemos de destacar que uno de los procesos psicológicos fundamentales
y que más ha enfatizado la psicología ambiental es el de la percepción ambiental.
Ello se ha debido a que uno de los aspectos más importantes de dicho proceso es la
información que proporciona a la persona para orientarse y dirigir sus actividades
cotidianas (Ittelson, Franck y O'Hanlon, 1976). Por otra parte, la mayoría de los
autores destacan la importancia de la percepción ambiental y del control percibido
sobre el medio en problemas relativos a la calidad de vida y el bienestar humanos.
Como formula Ittelson (1970, 1973, 1976), el ambiente proporciona a las personas
tal cantidad de información perceptual que resulta imposible su procesamiento in-
mediato. Por ello, la percepción del ambiente implica acciones intencionales. Para
Fernández-Ballesteros (1987) tan importante es el análisis objetivo del contexto en
el que se desenvuelven las personas como la percepción que del mismo pueden te-
ner sus habitantes. Consecuentemente, la evaluación ha de tener en cuenta ambas
variables.
b. La naturaleza holística de las relaciones que existen entre el ambiente y la
conducta; es decir, para comprender la conducta humana de forma adecuada, el am-
biente y la conducta deben contemplarse como partes interrelacionadas de un todo
indivisible.
c. El papel activo que juegan los organismos vivos en su adaptación al ambien-
te. Frente al modelo determinista según el cual la conducta era consecuencia de las
condiciones ambientales, la psicología ambiental, desde su formulación adaptativa,
plantea un modelo de determinación recíproca donde las personas influyen en las
condiciones del ambiente, así como que el ambiente también influye en la conducta
humana.
En resumen, y tal como hemos venido desarrollando, parece claro que la psico-
logía ambiental, y por consiguiente la evaluación ambiental, se conceptualiza desde
un modelo ecopsicológico en el que el propio medio, así como la interacción perso-
na-medio, aparecen como los elementos fundamentales para la comprensión de la

conducta humana en relación al medio ambiente.
12. Elementos del análisis ambiental
112.1. El medio
Como señalan Magnusson (19814) o Pinillos (1981), términos como ecosistema,

medio ambiente, contexto, situación, entorno, circunstancia, e incluso el de estímu-
lo, habitualmente utilizados en este campo, si bien presentan dificultades para esta-
blecer claras distinciones conceptuales entre ellos, todos podrían ser ordenados en
un continuo molaridad-molecularidad. Siguiendo a Fernández-Ballesteros (1987), el
concepto de estímulo designaría una realidad ambiental de menor complejidad.
Desde el enfoque conductista el estímulo es la variable independiente por excelencia
en todo experimento, y sus propiedades funcionales son consideradas como el mo-
tor de la conducta humana. Sin embargo, tal como ya señalaba Skinner, el estímulo
no es más que una parte del ambiente. Por su parte, para la gran mayoría de los auto-
res una situación estaría integrada por diversos estímulos. Este hecho supone una
realidad superior e implica una determinada organización. El concepto de contexto
aparece como un término fundamentalmente utilizado, tal como señala Fernández-
Ballesteros (1987), desde el enfoque de la psicología ecológica (Bronfenbrenner,
1977; Cairns, 1979; Gibbs, 1979) y propuesto para dar cuenta de una realidad más
amplia (temporal, espacial y física) que incluye no sólo la situación inmediata sino
también un amplio contexto social en el cual tales situaciones están comprendidas.
Mischel (1977), al igual que Stern (1970) o Sundberg (1977), señala que el término
contexto entraña una realidad de orden superior al concepto de situación. En con-
clusión, y con independencia del modelo teórico, lo que parece claro es que tanto el
estímulo como la situación o el contexto se integran en realidades ambientales de or-
den superior. Sin embargo, tal como apuntaba Jenkins (1974), la delimitación del
ambiente o el análisis de un contexto depende de los objetivos del investigador, lo
cual implica una cierta arbitrariedad en la limitación de dicho análisis. De este modo,
hay que tener en cuenta que siempre se podría realizar un análisis de mayor comple-
jidad ambiental. Asimismo, la posible arbitrariedad que impone la necesaria limita-
ción del análisis ambiental compensaría, en cierta medida, las enormes dificultades
que en orden a la operativización del análisis supondría realizar una investigación
extensa de la realidad ambiental. En cualquier caso, como señala Pinillos (1981), lo
importante es tener en cuenta una estructura o conjunto totalizado de estímulos o si-
tuaciones susceptible de ser utilizado como unidad de análisis rigurosa; es decir, par-
timos de que un contexto implica un conjunto organizado de la realidad física y so-
cial que puede ser definido operativamente y que pertenece y está integrado en otras
estructuras o sistemas de mayor complejidad. Sin embargo, la jerarquización de la
realidad ambiental en un continuo molaridad-molecularidad se ve afectada por una
segunda dimensión: el tiempo (Fernández-Ballesteros, 1987).
Evaluación ambiental
985
11.22. El tiempo
La mayoría de los autores admite que el término ambiente remite a una concepción
fundamentalmente molar, pero que el ambiente no sólo contiene objetos y acciones
sino que también cubre un amplio espacio de tiempo, lo cual implica que el ambiente
ha de ser concretado necesariamente a la hora de su análisis. Según Fernández-
Ballesteros (1987, p. 20), «mientras que la primera dimensión molar=-molecular ha
permitido jerarquizar los términos que estamos tratando de definir en función del
tamaño-espacio y organización según una dimensión proximal-distal (de tipo verti-
cal), la dimensión horizontal nos permitirá dar cuenta en el tiempo al que se refieren
los conceptos ambientales que estamos manejando».
112.3. La interacción
Siguiendo a Fernández-Ballesteros (1987, pp. 31-35), fue Kantor quien en 1924 sos-
tuvo por primera vez, no sólo la influencia de las condiciones ambientales sobre la
conducta, sino un planteamiento interactivo. Así, los planteamientos no sólo am-
bientalistas sino también interactivos aparecen desde el modelo conductista, aunque
generalmente y de manera errónea se sostiene que fue Kurt Lewin en 1935 con su
formulación en la que la conducta se considera una función de variables de la perso-
na y del ambiente o de la situación cuando comienza a tomar valor el estudio del am-
biente.
Desde una perspectiva idiográfica la evaluación se dirige al análisis objetivo del
comportamiento de una persona (Fernández-Ballesteros, 1979, 1981, 1983). Este
análisis se efectuó, en un principio, en función de una serie de características pro-
cedentes de los estudios correlacionales y diferenciales a través de los cuales se pre-
tendía la descripción y/o clasificación de la persona (o personas). En este caso la con-
ducta aparece como función de una serie de características de la persona (variables
organísmicas), es decir, C =f(P). Por su parte, desde el modelo conductista, la eva-
luación propugnaba el análisis experimental de la conducta a partir del supuesto de
que ésta es una función de ciertas propiedades funcionales de los estímulos ambien-
tales, es decir, C =f (A). Sin embargo, en palabras de Fernández-Ballesteros (1987,
p. 25), «la evidencia empírica desmontó tanto el modelo reduccionista organísmico
o personologista /C =f (P)] como el radicalismo situacionista /C =f(A)), avalando
un modelo interactivo /C =f (Px A))». En este modelo, el énfasis se centra en el in-
tercambio que mantienen las variables de la situación y del organismo o de la perso-
na, y que explica la mayor parte de la variancia de la conducta (Endler y Magnusson,
1976), como ya había planteado Kantor en su modelo de campo, en el que un com-
portamiento quedaría definido por una función de estímuloyuna función de res-
puesta en relación recíproca. Sin embargo, tal como señalan Silva y López (1992), en
el campo de la evaluación psicológica, las formulaciones teóricas de Murray, en las
que se incluyen tanto las necesidades individuales como las presiones ambientales,
parecen haber tenido mayor influencia que los planteamientos teóricos antes señala-
dos. Por su parte, Bandura (1974, 1978) plantea, al menos formalmente, una refor-
mulación a través de su modelo de determinación recíproca en el que tanto la con-

ducta como la persona y el ambiente se determinan mutuamente. Por otra parte, tal
como destaca Fernández-Ballesteros (1987), Staats plantea sobre la base del llamado
conductismo social un modelo de síntesis en el que se establece una nueva concep-
ción de la personalidad junto al énfasis en los principios básicos del aprendizaje. En
resumen, su teoría incluye las siguientes características:
a. Lanecesidad de especificar temporalmente el ambiente.

b. El ambiente pasado determina a través del aprendizaje un conjunto de re-
pertorios básicos de conducta (RBC) que conforman la personalidad del su-
jeto.
Los REC, en el presente, pueden estar determinando la conducta.
as El ambiente actual en interacción con los RBC puede también ejercer un pa-
pel causal del comportamiento presente de la persona.
Por otra parte, McReynolds (1971) distingue seis acercamientos posibles en la

evaluación de las interacciones:
a. Evaluación sistemática de la persona, combinada con evaluaciones informa-

les del ambiente relevante.
b. Evaluaciones objetivas de la persona en relación con una situación específica
y delimitada.
c. Evaluaciones objetivas de la persona en relación con diferentes situaciones
específicas y delimitadas.
d. Evaluaciones sistemáticas de la persona combinadas con evaluaciones siste-
máticas, pero por separado, del ambiente relevante.
e. Registro directo de las conductas de las personas en situación.
f. Registro de las conductas simuladas de las personas en situación.
En resumen, y tal como propone Fernández-Ballesteros (1987), la evaluación de

una persona se debería realizar teniendo en cuenta no sólo las variables personales,
sino también las transacciones que ésta establece con su medio ambiente. El proceso
de evaluación de la conducta de una persona en su contexto debería de seguir las si-
guientes etapas:
a. Identificar los contextos relevantes de la persona en función de los objetivos

de la evaluación.
b. Estudiar las características físicas, sociales, organizativas, etc. de tales am-
bientes.
c. Analizar las variables ambientales tal y como son percibidas por el suje-
to, contrastándolas con las percepciones de otros habitantes del mismo con-
texto.
d. Examinar los comportamientos y papeles sociales diferenciales inter e intra-
sujeto realizados en los distintos ambientes.
e. Análisis funcional de las relaciones entre los comportamientos relevantes y
las variables ambientales que los anteceden.
f. Planear intervenciones.
g. Evaluar las modificaciones producidas en función de las intervenciones.
Por último, continuando con las propuestas que al respecto realiza Fernández-
Ballesteros (1987), la importancia del análisis ambiental no proviene tan sólo de su
poder explicativo sobre la conducta de una persona, sino que en otro nivel de análisis
podemos evaluar al propio ambiente, lo que permitirá a través de diseños grupales
constatar las relaciones generales persona-medio y conducta-ambiente en sus distin-
tos niveles de complejidad ambiental.
13. Principales enfoques en psicología ambiental

Los principales enfoques teóricos que podemos destacar en la investigación ambien-
tal serían los siguientes:
a. El enfoque denominado ecología social. Moos destaca que el interés, desde

esta perspectiva, se centra en un amplio grupo de variables físicas, sociales y psicoso-
ciales. El concepto clave de este enfoque es el de clima social y sus objetivos son bási-
camente descriptivos.
b. El enfoque conductista o conductismo ecológico centrado en el análisis de
las relaciones funcionales entre ambiente y conducta. Mantiene un acercamiento
fundamentalmente interventivo (Buss, 1979; Cone y Hayes, 1980; Pelechano, 1981),
con el objetivo de resolver los problemas ambientales planteados (Jiménez-Gómez,
1990).
c. El modelo de la psicología ecológica (Barker, 1965, 1968, 1978; Wicker, 1981)
ligado al concepto de escenario de conducta, que según lo define Wicker (1956) sería
la parte estable del medio ambiente físico y social de la comunidad que incluye un
patrón prevalente de comportamiento humano. Así, los escenarios de conducta se-
rían «sistemas activos, autorregulados y que imponen su programa de actividades
sobre las personas y objetos que contienen» (Jiménez Burillo y Aragonés, 1986,
p. 30).
d. El denominado por Stokols (1978) “enfoque cognitivo-perceptivo”, cuyos
objetivos se centran en el estudio del ambiente percibido, y a través de él pretende
describir y clasificar el ambiente (Magnusson, 1981b). Sin embargo, como señala Ji-
ménez-Gómez (1990, p. 21) el contexto o el ambiente desde esta perspectiva «no es
considerado en términos objetivos, reales, externos, sino que es reducido a una va-
riable organísmica o personal más». No obstante, a pesar de que desde este enfoque
parece defenderse una visión intrapsíquica de la relación persona-medio ambiente,
también es cierto, como destacamos con anterioridad, que si bien el análisis objetivo
del ambiente en el que se desenvuelve la persona resulta imprescindible, en ese análi-
sis igualmente se ha de tener en cuenta la percepción que la persona tiene de dicho
ambiente, aunque dicho análisis también debe realizarse de manera objetiva.
e. Por último, podríamos incluir en este apartado el modelo o modelos de
orientación fenomenológica. Sin embargo, hemos de señalar que este tipo de mode-
los no podemos incluirlos entre los modelos científicos de psicología, y que la inclu-
sión en este apartado sólo ha de considerarse a título meramente informativo. Desde

esta perspectiva se trataría de describir cualitativamente la relación persona-medio a
través de una actitud comprensiva. Igualmente, desde este enfoque se destaca cómo
la persona es inseparable de su mundo y lo importante que resulta esta relación debi-
do fundamentalmente a que dicha relación proporciona a la persona una determina-
da experiencia ambiental.
Por otra parte, tal como señala Fernández-Ballesteros (1992, p. 450), «de la so-
mera enumeración de los principales enfoques teóricos se deriva una clasificación de
las condiciones implicadas en cualquier contexto» entre las que destacamos las ca-
racterísticas físicas, variables organizativas, características de los habitantes, varia-
bles psicosociales y variables conductuales. Igualmente, la misma autora señala que
en la descripción de las variables o dimensiones en las que puede ser operacionaliza-
do un ambiente nos encontramos con un problema importante referido a la necesi-
dad de evaluar los distintos ambientes como realidad física, social o cultural, o bien
cómo éstos son percibidos por sus habitantes; es decir, antes de realizar cualquier
evaluación ambiental «habremos de establecer cuáles son las variables objeto de aná-
lisis y determinar si lo que nos interesa es el ambiente tal y como es o tal y como es
percibido por las personas que lo ocupan» (Fernández-Ballesteros, 1992, p. 451).
HL. ASPECTOS METODOLÓGICOS
11. Aspectos generales

Como recoge Amérigo (1991), dentro de la problemática relativa a los aspectos me-
todológicos en la evaluación ambiental, la estructura propuesta por Fernández-
Ballesteros (1987, pp. 30-31) formada por cuatro dimensiones (medio natural versus
medio artificial, método o técnica metódica correlacional versus método o técnica
metódica experimental, técnicas objetivas versus técnicas subjetivas y variables inde-
pendientes conductuales versus variables ambientales) resulta sumamente clarifica-
dora en la consideración de dicha problemática. Por otra parte, esta estructura metodo-
lógica sería, tal como señala Fernández-Ballesteros (1987), paralela a una estructura
conceptual formada igualmente por cuatro dimensiones que se corresponderían con
las anteriores: ambiente molar versus ambiente molecular, objetivos descriptivos
versus objetivos de intervención, medio real versus medio percibido y variables con-
ductuales versus variables físicas y socioculturales. A través de estos dos sistemas se-
ría posible situar las distintas investigaciones a realizar en algunas de las dimensiones
citadas. Como señala Coan (1968), las relaciones entre estas dimensiones han dado
lugar a dos enfoques fundamentales que se presentan como opuestos: enfoque cen-
trado en la molecularidad-objetivismo-experimentación-artificialidad y enfoque
centrado en la molaridad-subjetivización-covariación-naturalidad.
112. El problema de la validez en investigación ambiental

Como indicamos en párrafos anteriores, la psicología ambiental está profundamente
orientada a la resolución de problemas e interrogantes relativos a la aplicabilidad de
sus investigaciones. Así, la posibilidad de aplicar y generalizar los resultados obteni-
dos a través de las distintas investigaciones vendrá determinada por el uso de las téc-
nicas y métodos utilizados en las mismas, lo cual nos plantea el problema de la vali-
dez de los resultados obtenidos. Como es de sobra conocido, las condiciones que
permiten mantener una elevada validez interna a menudo se contraponen con aque-
llas que fortalecen la validez externa. Asimismo, los métodos de investigación que
fortalecen un tipo de validez tienden al mismo tiempo a debilitar al otro. De este
modo, cuando se desea establecer un alto nivel de validez interna en una investiga-
ción se utilizan métodos experimentales en situaciones artificiales o de laboratorio.
Por contra, cuando el objetivo es mantener un alto grado de validez externa en los
hallazgos de una investigación, los estudios se realizan a través de métodos correla-
cionales en el medio natural. Sin embargo, la vocación aplicada ha conducido a la
psicología ambiental a intentar mantener un equilibrio entre ambas. Así, el denomi-
nado experimento de campo pretende mantener una alta validez ecológica que per-
mita generalizar los resultados obtenidos junto a las exigencias de control de varia-
bles que se derivan del uso de la metodología experimental que permiten, gracias a
dicho control, la manipulación de las mismas y, de esta manera, la intervención am-
biental: es decir, en el experimento de campo, el investigador manipula sistemática-
mente la variable experimental en estudio permitiendo al mismo tiempo que los fac-
tores externos que se dan en la situación de campo sucedan de forma natural.
IV. LASTÉCNICAS EN EVALUACIÓN AMBIENTAL
Como ya hemos señalado con anterioridad, la importancia de la evaluación ambien-

tal como objetivo de la evaluación psicológica supone también una dimensión de
adaptación y/o elaboración tecnológica pertinente a dicha evaluación (Fernández-
Ballesteros, 1987). Así, del desarrollo de la propia evaluación ambiental surgen dis-
tintos planteamientos de evaluación que van desde lo más puramente ambiental y
físico a lo más personal u organísmico (Cone y Hayes, 1980). A continuación, si-
guiendo a Fernández-Ballesteros (1987), intentaremos, de forma resumida, desarro-
llar cada uno de los enfoques propuestos.
1v.1. Evaluación de variables físicas del medio ambiente

desde un enfoque ecológico
Es indudable la influencia de las variables físicas y arquitectónicas en la conducta hu-
mana. Las condiciones físicas han sido asociadas a la salud, al rendimiento intelectual
y laboral, a las relaciones interpersonales, etc. Aunque la evaluación de las caracterís-
ticas físicas del medio han sido consideradas patrimonio de otros científicos (ecólo-
gos, urbanistas, etc.), no podemos olvidar que tal como señala Moos (1974) lacon-
ducta ocurre en un contexto físico específico, lo que permite considerar este tipo de
variables desde una perspectiva psicológica. Según el nivel de inferencia de las unida-
des de análisis ambientales utilizado, podemos clasificar las estrategias de evaluación
en dos tipos diferentes:
a. Unidades de análisis que no requieren ningún grado de abstracción, como

por ejemplo, luz eléctrica gastada en una comunidad específica, ruido, densidad de
población, desechos, etc. Este tipo de unidad de análisis es observado a través de có-
digos y medidas según parámetros de frecuencia, intensidad, amplitud, etc. El méto-
do básico utilizado es la observación (dentro de una estrategia experimental). Las
unidades de análisis son evaluadas según características físicas y no implican inferen-
cias, por tanto, este tipo de tecnología representa la vía que menos fuentes de error
entraña en evaluación ambiental.
b. Por otra parte, también se han evaluado atributos físicos del ambiente con el
fin de encontrar dimensiones estables en él. Este interés es propio del enfoque corre-
lacional. Un ejemplo es el Physical and architectural features checklist (PAE) [Inven-
tario de rasgos físicos y arquitectónicos] que evalúa nueve dimensiones físicas y ar-
quitectónicas aplicables a instituciones de cuidado al anciano (Moos y Lemke, 1979).
El objetivo del PAF es evaluar los recursos físicos y arquitectónicos de instituciones
de ancianos, pensando que es perfectamente extensible a otros lugares de caracterís-
ticas semejantes.
1v2. Evaluación de escenarios de conducta desde enfoques

ecopsicológicos
La unidad de análisis básica de la psicología ecológica como ya comentamos en apar-
tados anteriores es el escenario de conducta. En estos escenarios existen dos tipos de
componentes: la conducta y los objetos físicos que se encuentran en un espacio de-
terminado y cuyas interrelaciones se producen en un tiempo específico.
La idea fundamental que desarrolla este enfoque es la existencia de una relación en-
tre los patrones de conducta que ocurren y los componentes no conductuales, los ob-
jetos. Se supone que estos escenarios de conducta son estables, extraindividuales y de
gran poder coercitivo para la conducta que ocurre en ellos. Según Wicker (1981), exis-
ten tres pasos fundamentales que han de seguirse para evaluar escenarios de conducta:
a. Definir los límites del estudio: objetivos y recursos del investigador y las ca-
racterísticas temporales y espaciales del sistema objeto de estudio.
b. Identificar los distintos escenarios (settings) que existen en el sistema, locali-
zando y listando los escenarios potenciales.
c. Describir los escenarios a través de parámetros.
El método básico de reconocimiento o aislamiento de estos escenarios es la ob-

servación, que se acompaña del análisis de mapas, planos, guías y documentos sobre
el escenario. Una vez que se ha establecido un posible escenario ha de constatarse si

éste cumple las características estructurales y dinámicas que según Barker (1968) es-
tablecen la existencia de un escenario. Estas pruebas implican la respuesta afirmativa
a preguntas tales como: ¿los patrones de conducta ocurren independientemente de
las personas implicadas?, ¿la conducta está ligada a un escenario específico y com-
plejo?, ¿las conductas ocurren en un espacio y tiempo determinado?, ¿existe interde-
pendencia entre conducta y escenario?, etc. Por otra parte, existe una serie de pará-
metros que dan lugar a medidas relativamente objetivas a través de las cuales se
pueden describir los escenarios de conducta. Los más relevantes son los siguientes:
a. Ocurrencia (O): número de días en un año que se da un escenario de con-

ducta en un período de tiempo preestablecido.
b. Duración (D): número de horas que se da un escenario de conducta en una
unidad de tiempo.
c. Población (P): número total de personas que habitan en un período de tiem-
po el lugar donde ocurre el escenario de conducta.
d. Tiempo de ocupación (TO): número total de personas por hora que habitan
durante un período de tiempo en el lugar donde ocurre el escenario de con-
ducta.
e. Penetración: grado de participación o responsabilidad de los ocupantes de
un escenario.
f. Patrones de acción: grado en el cual ocurre un patrón de conducta en un es-
cenario y en un período de ocupación determinado.
A pesar de que algunos de estos parámetros se obtienen a través de procedimien-

tos de archivo, la mayor parte de tests y parámetros de descripción de los escenarios
se basan en datos procedentes de la observación.
1v3. Evaluación de características psicosociales de grupos e instituciones:

enfoque ecológico-social
Como puntualiza Moos (1976), la perspectiva del clima social asume que los am-
bientes tienen una personalidad igual que las personas. Así, unos ambientes son rígi-
dos, organizados, controlados, etc. La importancia de estas dimensiones de clima so-
cial radica en que la conducta de un sujeto varía según percibe el clima social de la
situación en la que se desenvuelve. Las investigaciones se han venido realizando bá-
sicamente en:
Situaciones de tratamiento ambiental: comunitario y psiquiátrico.

Instituciones: correccionales, compañías militares, etc.
Ambientes educativos: universidades, colegios mayores y escuelas.
A Ambientes comunitarios: familia, trabajo, grupos sociales y terapéuticos.
Desde el enfoque del clima social se ha elaborado una serie de instrumentos
como método para evaluar las dimensiones de cada uno de estos ambientes.
iv. Análisis de las relaciones funcionales entre conducta y ambiente

y sus interacciones: enfoque ecológico conductual
Como ya hemos señalado, es desde el conductismo desde donde se enfatiza la rela-
ción ambiente-conducta. Igualmente, Kantor, en la década de los años veinte, señala
la importancia de la interacción conducta-ambiente, lo que desde el desarrollo del
propio enfoque conductual ha desembocado en lo que podríamos denominar con-
ductismo ecológico. Los estudios desde esta perspectiva presentan dos vertientes
fundamentales:
a. Porun lado desde una perspectiva molecular con objetivos de intervención,
usando la metodología experimental, se trata de manipular ciertas condiciones am-
bientales y comprobar sus efectos sobre la conducta.
b. Por otro lado, modificar la conducta y verificar sus efectos sobre ciertas va-
riables ambientales que se desea modificar.
En ambos casos la tecnología se centra en precisos códigos de observación con
puntuales unidades de análisis.
1v.5. Evaluación de la percepción subjetiva del ambiente

Dentro de lo que Stokols (1978) considera como enfoque reactivo-cognitivo, existe
una serie de investigaciones ambientales que pretenden conocer cómo los humanos
perciben, valoran, conocen o se sienten afectados por el medio social y físico que les
rodea. Los objetivos fundamentales de este tipo de investigaciones son:
a. Clasificar ambientes.
b. Estudiar las percepciones individuales del medio ambiente.
c. Conocer las preferencias personales de cara a la planificación ambiental.
El primer objetivo se basa en la necesidad de realizar una taxonomía ambiental y
en la posibilidad de realizar esta labor desde las evaluaciones de los perceptores hu-
manos. Otro de los objetivos ha sido el de conocer las preferencias personales de
cara a la planificación ambiental. Uno de los instrumentos más utilizados en la inves-
tigación de actitudes hacia el medio ambiente es la Escala de medida de actitudes y
conocimientos ecológicos de Maloney y Ward (1973), modificada por Maloney, Ward
y Brancht (1975). Estos autores parten de que la actual crisis ecológica no entraña
tanto un problema técnico como una crisis de conductas desadaptadas en la pobla-
ción. Con esta base, y con independencia de la intervención pública en el medio am-
biente físico, es necesario realizar un cambio de actitudes y comportamientos en los
sujetos ante variables ambientales. Para su conocimiento y posible modificación,
utilizan dicha escala que consta de 128 elementos agrupados en cuatro subescalas:
a. Compromiso verbal (CV): evalúa la extensión en la cual la persona desea ac-

tuar en relación con los problemas de la contaminación ambiental.
b. Compromiso actual (CA): evalúa lo que actualmente hace la persona para

evitar la contaminación.
c. Afecto (A): evalúa el grado de emocionalidad de la persona ante este tipo de
temas. ;
d. Conocimiento (C): evalúa los conocimientos específicos de la persona ante
este tipo de temas.
El método más utilizado en este enfoque es el autoinforme.
Iv.6. Evaluación de disposiciones ambientales

Esta orientación en el estudio ambiental está ligada a la investigación sobre diferen-
cias individuales de personalidad que se producen en relación con el medio am-
biente físico y que han venido tomando el nombre de disposiciones ambientales
(McKechnie, 1977). En estos estudios se aúna el interés por el descubrimiento de
dimensiones intrapsíquicas y la influencia de las variables ambientales en estos atri-
butos. Se parte de que cualquier dimensión intrapsíquica está íntimamente unida al
funcionamiento interpersonal y que tiene como último referente el sistema social.
La búsqueda de dimensiones específicamente ambientales sería importante para
completar el panorama de la personalidad del individuo. La importancia de estas
disposiciones ambientales estaría en la medida en que a través de ellas pudiera pre-
decirse el comportamiento de los sujetos en el ambiente que actúan. Dentro de esta
área, uno de los instrumentos más utilizados y con base en las técnicas de autoin-
forme es el Environmental personality inventory [Inventario de personalidad am-
biental] de Sonnenfeld (1969), modificado por McKechnie (1974, 1977). Este im-
ventario consta de 184 elementos integrado en ocho dimensiones y una escala de
validez:
a. Pastorismo: oposición a la manipulación artificial de la tierra, gusto por la

conservación de la naturaleza.
. Urbanismo: gusto por la alta densidad de población.
c. Adaptación ambiental: deseo de que el ambiente sea modificado en función
de la satisfacción, gustos y necesidades de confort.
d. Búsqueda de estímulos: interés por los viajes y por las exploraciones de luga-
res inusuales.
e. Confianza en el ambiente: apertura hacia el ambiente, responsabilidad y
confianza.
f. Gusto por lo antiguo: preferencia por el diseño tradicional frente al moder-
no, gusto por las antigúedades y lugares históricos.
Necesidad de vida privada: necesidad de aislamiento físico de estímulos.
300 Orientación mecánica: interés por lo mecánico en sus formas varias, por la
tecnología y las propiedades funcionales de los objetos.
Sin embargo, este enfoque está sesgado por todos los problemas que la metodo-
logía correlacional lleva implícitos.
Hasta aquí unos ejemplos básicos de tecnología utilizada más frecuentemente en

evaluación ambiental. Señalar, para finalizar, que toda esta tecnología no sólo es im-
portante en la vertiente clínica, sino que también supone un potencial de hallazgos
que podrían dar cuenta de algunos problemas sociambientales.
V. EVALUACIÓN AMBIENTAL
Craik (1968) y Craik y Feimer (1987) postulan la existencia de una triple posibilidad
de evaluación ambiental: valorativa, descriptiva y predictiva. La evaluación valorati-
va, tal como señalan Íñiguez y Valera (1991), es utilizada bien para determinar las in-
tervenciones iniciales en una intervención ambiental o bien para evaluar, junto a las
personas implicadas en un ambiente determinado sobre el que se ha intervenido, la
actuación ya realizada. «En este caso, observamos cómo la evaluación ambiental se
enmarca en la valoración ambiental» (Íñiguez y Valera, 1991, p. 515). Por su parte, la
evaluación descriptiva busca identificar criterios comunes y comprensivos para eva-
luar tipos específicos de unidades ambientales. Por último, la evaluación predictiva
suele basarse en la generalización empírica o en la extracción de predicciones a partir
de modelos de simulación. Como destacan Iñiguez y Valera (1991), podemos seña-
lar dos momentos fundamentales en evaluación ambiental: uno, previo a la realiza-
ción de cualquier intervención en el cual se tienen en cuenta las intenciones de los
promotores de la intervención, las directrices del proyecto de intervención y las va-
riables pertinentes de carácter predictivo cuyo control puede optimizar la interven-
ción; y un segundo momento, posterior a la intervención, donde se establecerá el
grado de ajuste entre los objetivos de la intervención y las respuestas de las personas
afectadas por la misma. Los resultados de esta evaluación servirán para establecer
nuevos criterios para posteriores intervenciones de características similares. Por su
parte, Fernández-Ballesteros (1987) señala cómo a pesar de que evaluar y valorar son
términos sinónimos en lengua castellana, frecuentemente presentan un uso diferen-
ciado. Mientras que evaluación supone el análisis de variables conductuales y am-
bientales relevantes, en un momento dado, en una persona o grupo de personas; va-
loración implica la estimación del valor de un determinado tratamiento, programa o
intervención que se ha aplicado en un contexto o ambiente predeterminado. En con-
clusión, el término valoración parece referirse a un momento posterior a la inter-
vención. Por tanto, parece claro que evaluación, intervención y valoración se consti-
tuyen en los tres momentos claves de todo proyecto de intervención ambiental. Sin
embargo, en la realidad, el papel del psicólogo ambiental se limita, en la mayoría de
las ocasiones, a la evaluación de la intervención una vez realizada. Así, de una tarea
ideal de valoración de criterios de optimización se ha pasado a la evaluación de los
daños, y de predecir y promover efectos positivos se ha pasado a detectar y corregir
efectos negativos. Por último, uno de los aspectos importantes a tener en cuenta a la
hora de evaluar una investigación valorativa es su relevancia social o validez social.
Se considera validez social a la aceptación de un determinado tratamiento por parte
de los usuarios, allegados o expertos no implicados en el mismo; este tipo de validez
se establece generalmente por medio de pruebas subjetivas. Es significativo cómo
Wolf (1978) enfatiza la resignación que supone el tener que utilizar procedimientos
subjetivos a la hora de contrastar el análisis conductual aplicado. Por otra parte, di-
versos autores han resaltado la frecuericia con que datos de valoración subjetiva con-
tradicen indicadores objetivos de validación de intervenciones. En nuestra opinión,
la llamada validación social o consenso de utilidad social debe ser considerada tan
sólo como un elemento más, pero en ningún caso puede sustituir la constatación ob-
Jetiva de la intervención. De aquí se desprende la necesidad de objetivar las decisio-
nes valorativas con avales empíricos.
VI. ELPROCESO DE EVALUACIÓN DE AMBIENTES
Siguiendo a Jiménez-Gómez (1990, pp. 40-42), las distintas etapas a través de las
cuales debe realizarse una evaluación serían las siguientes:
a. Fijar los objetivos de la evaluación y/o intervención ambiental. Así, de la

concreción de los objetivos de nuestra acción dependerá, en gran medida, la formu-
lación de las etapas posteriores. Desde una perspectiva aplicada, la evaluación de
contextos se debe realizar contando con la participación de las personas implicadas
en la misma.
b. Delimitación de las variables a estudiar. Es necesario delimitar el objeto de
estudio tanto temporal como física, espacial y conductualmente, haciendo especial
hincapié en las variables relevantes que intervienen en la interacción conducta-con-
texto.
c. Operativización. Es evidente que para poder realizar cualquier evaluación
psicológica, la condición necesaria y suficiente para ello es la operativización de las
variables en estudio.
d. Elección de técnicas y procedimientos de evaluación. Seleccionadas, formu-
ladas y operativizadas las variables se ha de seleccionar la técnica o técnicas pertinen-
tes para su evaluación en función del nivel de complejidad de las mismas.
e. Obtención de datos.
f. Elaboración de resultados y conclusiones. La elaboración de los resultados,
así como las conclusiones que de ellos se deriven, estarán en función tanto de los ob-
jetivos de la evaluación como de las variables y técnicas seleccionadas.
g. Elinforme. Por lo general, la evaluación de un ambiente específico suele rea-
lizarse a petición, bien de gestores públicos o privados, o bien de los habitantes y
usuarios del mismo. De este modo, el informe ambiental debe recoger los problemas
detectados, así como las posibilidades de intervención y las posibles formas de reali-
zarlas.
h. Valoración. Como señalamos con anterioridad, la valoración de programas
ambientales debe considerarse como una etapa más del proceso de evaluación am-
biental.
Por su parte, uno de los campos de aplicación donde más estrechamente se rela-
cionan evaluación e intervención ambiental es en el ámbito de la evaluación del im-
pacto ambiental. Rubio (1987) entiende por evaluación de impacto ambiental los es-
tudios realizados para identificar, predecir e interpretar, así como para prevenir las
consecuencias o efectos ambientales que determinadas acciones, planes, programas
o proyectos puedan causar a la salud y al bienestar humano y al entorno. De esta
definición se desprende un carácter marcadamente instrumental del proceso de eva-
luación del impacto ambiental, estableciéndose dos momentos: la evaluación del im-
pacto ambiental y la valoración del mismo. El propio Rubio (1987) entiende la valo-
ración de intervenciones como una etapa del proceso de análisis ambiental dondelo
que se busca es determinar el grado en el que se han conseguido determinados obje-
tivos tras una intervención. Así, tal como recogen Íñiguez y Valera (1991), se puede
realizar una clarísima «distinción entre el proceso de evaluación del impacto am-
biental, valoración del impacto ambiental y valoración de intervenciones. Mientras
que los dos primeros conceptos son dos momentos en el proceso de evaluación [...]
del ambiente, el tercero sería propio de las intervenciones» (p.516).
Por último, y de manera resumida, destacaremos la propuesta que Iñiguez y Va-
lera (1991, pp. 521-525) realizan para evaluar y actuar en ambientes urbanos. En pri-
mer lugar, estos autores distinguen dos fases fundamentales en su modelo de acción:
fase de evaluación que incluiría el momento anterior a la toma de decisiones, y la fase
de valoración que se correspondería al momento posterior a la intervención urbanís-
tica. A su vez cada fase ha de responder a una serie de objetivos y contestar a una se-
rie de cuestiones precisas. Veamos cada una de ellas.
vL1. Fase de evaluación
— Análisis de la demanda. En esta fase habría que responder a las siguientes cues-
tiones: ¿quién es el demandante?, motivación de la demanda, contrastación de la
motivación con la realidad del lugar, etcétera.
— Evaluación del contexto: memoria histórica del lugar necesaria para conocer
la realidad sociohistórica del mismo, inventario de recursos, valoración del usuario
(información, percepción, imagen y actitudes que el mismo tiene sobre el contexto),
estudio de las necesidades y expectativas (donde el usuario vuelve a ser el referente
principal) y diagnóstico.
— Análisis del lugar de la intervención, para lo que será necesario conocer la de-
finición de los límites del contexto en el que se va a intervenir y apreciar dicho con-
texto desde lugares colindantes. Igualmente, antes de la intervención sería necesario
determinar el grado de conservación de la interacción socioambiental actual.
— Estudio de preimpacto de la intervención propuesta desde un ejercicio de
prospectiva que debería de tener en cuenta la evaluación de impacto en las zonas co-
lindantes, la evaluación del impacto en el lugar mismo, las prospectivas del uso tem-
poral del ambiente concreto y el mantenimiento que requerirá la futura interven-
ción.
— Representación de la intervención, informe sobre la misma. El tipo de inter-
vención propuesta ha de reunir las condiciones de asequibilidad y comprensión sufi-
cientes para que pueda ser entendida no sólo por expertos, sino también por cual-
quiera de los posibles usuarios.
v12. Fase de valoración
En esta fase habrá que evaluar la correspondencia entre objetivos y consecuencias, la

funcionalidad de la intervención, la adecuación a las necesidades y expectativas del
usuario, el impacto socioambiental y el grado de satisfacción del usuario.
Por último, como señalan Íñiguez y Valera (1991, p. 525) «tanto los aspectos de
procedimiento como los metodológicos pueden seguir el plan de evaluación previa-
mente presentado, realizando un proyecto para todas o parte de las etapas allí pro-
puestas». Igualmente, durante el proceso el investigador utilizará las técnicas e ins-
trumentos de evaluación pertinentes a cada caso.
Amérigo, M. (1991). La evaluación del hábitat. En R. de Castro (dir.), Psicología ambiental:

intervención y evaluación del entorno. Sevilla. Arquetipo Ediciones.
Bandura, A. (1974). Behavior theory and the models of man. American Psychologist, 29, 859-
869.
Bandura, A. (1978). The self system in reciprocal determinism. American Psychologist, 33,
344-3568.
Barker, R. G. (1965). Explorations in ecological psychology. American Psychologist, 20, 1-14.
ment of human behavior. Standford. Standford University Press.
Barker, R. G. (1978). Habitats, environments and human behavior. San Francisco. Jossey-
Bass.
Bronfenbrenner, V. (1977). Toward an experimental ecology of human development. Amer:-
can Psychologtst, 32, 513-531.
Buss, A. (dir.) (1979). Psychology in social context. Nueva York. Irvington Pub.
Cairns, R. (dir.) (1979). The analysis of social interactions. Hillsdale. Erlbaum.
Coan, R. Y. (1968). Dimensions of psychological theory. American Psychologist, 30, 15-40.
Cone, J. D. y Hayes, S. C. (1980). Environmental problems/behavioral solutions. Monterrey.
Brooks and Cole.
Craik, K. H. (1968). The comprehension of every day physical environment. Journal of the
American Institute of Planners, 34, 29-37.
Craik, K. H. (1981). Environmental assessment and situational analysis. En D. Magnusson
(dir.), Toward a psychology of situations: An interactional perspective. Nueva Jersey. LEA.
Craik, K. H. y Feimer, N. (1987). Environmental assessment. En D. Stokols e L Altman
(dirs.), Handbook of environmental psychology (vol. 2). Nueva York. Wiley. l
De Castro, R. (dir.) (1991). Psicología ambiental: intervención y evaluación del entorno. Sevi-
lla. Arquetipo Ediciones. i | a
Dunlap, R. E. (1980). Paradigmatic change in social science. American Behavioral Scientist,
24, 5-15.
Endler, N. S. y Magnusson, D. (1976). Toward an interactional psychology of personality.
Fernández-Ballesteros, R. (1979). Los métodos en evaluación conductual. Madrid. Pablo del

Río.
Fernández-Ballesteros, R. (1981). Evaluación en psicología ambiental. En F. Jiménez Burillo
(dir.), Psicología ambiental. Madrid. CEOTMA.
Fernández-Ballesteros, R. (1983). Evaluación del ambiente. En R. Fernández-Ballesteros
(dir.), Psicodiagnóstico. Madrid. UNED. sed
Fernández-Ballesteros, R. (1987). El ambiente. Análisis psicológico. Madrid. Pirámide.
Fernández-Ballesteros, R. (1992). Técnicas de evaluación ambiental. En R. Fernández-
Ballesteros (dir.), Introducción a la evaluación psicológica (vol. 11). Madrid. Pirámide.
Fernández-Trespalacios, J. L. (1990). ¿Qué es la psicología? Una visión actual de sus puntos de
vista teóricos y de sus aplicaciones. Madrid. Maravillas.
Gibbs, J. C. (1979). The meaning of ecologically oriented inquiry in contemporary psycho-
logy. American Psychologist, 34, 127-140.
Holahan, C. ]. (1982). Environmental psychology. Nueva York. Random House.
Íñiguez, L. y Valera, S. (1991). Intervención y evaluación ambiental: el psicólogo ambiental
en la transformación del medio ambiente urbano. En R. de Castro (dir.), Psicología am-
biental: intervención y evaluación del entorno. Sevilla. Arquetipo Ediciones.
Ittelson, W. H. (1970). Perception of the large-scale environment. Transactions of the New
York Academy of Sciences, 32, 807-815.
Ittelson, W. H. (1973). Environment and cognition. Nueva York. Seminar Press.
Ittelson, W. H. (1976). Some issues facing a theory of environment and behavior. En H. M.
Proshansky, W. H. Ittelson y L. G. Rivlin (dirs.), Environmental psychology: People and
their physical settings. Nueva York. Rinehart and Winston.
Ittelson, W. H., Franck, K. A. y O'Hanlon, T. J. (1976). The nature of environmental expe-
rience. En S. Wapner, S. B. Cohen y B. Kaplan (dirs.), Experiencing the environment.
Jenkins, J. A. (1974). Remember that old theory of memory? Well, forget it! American Psy-
chologist, 29, 785-795.
Jiménez Burillo, F. y Aragonés, J. I. (dirs.) (1986). Introducción a la psicología ambiental. Ma-
drid. Alianza.
Jiménez-Gómez, F. (1990). La psicología ambiental y su evaluación. En F. Jiménez y R. de
Diegi Vallejo. Lecturas de psicodiagnóstico. Salamanca. Amarú.
Magnusson, D. (dir.) (19814). Toward a psychology situations. An interactional perspective.
Nueva Jersey. LEA.
Magnusson, D. (1981b). Wanted: A psychology situations. En D. Magnusson (dir.), Toward
a psychology situations. An interactional perspective. Nueva Jersey. LEA.
Maloney, M. P. y Ward, M. O. (1973). Ecology: Let's hear from the people. American Psy-
chologist, 28, 583-586.
Maloney, M. P., Ward, M. O. y Brancht, C. N. A. (1975). A revised scale for the measure-
ment of ecological attitudes and knowledge. American Psychologist, 30, 787-790.
Martens, K. B. y Witt, J. C. (1988). Ecological behavior analysis. En M. Hercen, R. M. Eisler
y P. M. Miller (dirs.), Progress in behavior modification (vol. 22). California. Sage.
McKechnie, G. E. (1974). Manual for the environmental response inventory. Palo Alto. Con-
sulting Psychologist Press.
McKechnie, G. E. (1977). The environmental response inventory in application. Environ-
ment and Behavior, 9, 225-276.
McReynolds, P. (dir.) (1971). Advances in psychological assessment (vol. 11). Palo Alto. Scien-
ce and Behavior Books.
Mischel, W. (1977). On the future of personality assessment. American Psychologist, 32, 246-
254,
Moore, G. (1987). Environment and behavior researchs in North America. En D. Stokols e
I. Altman (dirs.), Handbook of environmental psychology (vol. 2). Nueva York. Wiley.
a (1973). Conceptualizations of human environments. American Psychologist, 28,
Moos, R. H. (1974). The social climate scales: An overview. Palo Alto. Consulting Psycholo-
gists Press.
Moos, R. H. (1976). The human context, environmental determinants of behavior. Nueva
York. Wiley.
Moos, R. H., Gauvain, M., Lemke, S., Max, W. y Mehren, B. (1979). Assessment the social
environment of sheltered care settings. Geronthologist, 19, 74-82.
Moos, R. H. y Lemke, S. (1979). Multiphasic environmental assessment procedure: preliminary
manual. Palo Alto, Medical Center. Social Ecology Laboratory, Standford University.
Moos, R. H. y Lemke, S. (1980). Assessing the physical and architectural features of sheltered
care setting. Journal of Gerontology, 8, 207-210.
Pelechano, V. (dir.) (1981). Intervención psicológica. Valencia. Alfaplús.
Pinillos, J. L. (1981). Modelos ambientales de conducta. En F. Jiménez (dir.), Psicología y me-
dio ambiente. Madrid. CEOTMA.
Pol, E. (1991). Formación y profesión del psicólogo ambiental. En R. de Castro (dir.), Psico-
logía ambiental: intervención y evaluación del entorno. Sevilla. Arquetipo Ediciones.
Proshansky, H. M. (1972). Methodology in environmental psychology: Problems and issues.
Human Factors, 14, 451-460.
Rubio, V. J. (1987). Evaluación del impacto ambiental. En R. Fernández-Ballesteros (dir.), El
ambiente. Análisis psicológico. Madrid. Pirámide.
Silva, F. y López, M. C. (1992). Evaluación de las interacciones del sujeto con su ambiente.
En R. Fernández-Ballesteros (dir.), Introducción a la evaluación psicológica (vol. 11). Ma-
drid. Pirámide.
Sonnenfeld, J. (1969). Equivalence and distorsion of the perceptual environment. Environ-
ment and Behavior, 1, 83-100.
Stern, G. G. (1970). People in context: Measuring person-environment congruence education
and industry. Nueva York. Wiley.
Stokols, D. (1978). Environmental psychology. Annual Review, 29, 253-295.
Stokols, D. y Shumaker, S. O. (1981). Peoples in places: A transactional view of settings. En
J. H. Harvey (dir.), Cognition, social behavior and environment. Hillsdale. Lawrence Erl-
baum.
Sundberg, N. D. (1977). Assessment ofpersons. Englewood Cliffs. Prentice Hall.
White, R. N. (1974). Strategies of adaptation: An attempt at systematic description. En
G. V. Coelho, D. A. Hamburg y J. E. Adams (dirs.), Coping and adaptation. Nueva York.
Basic Books.
Wicker, A. W. (1981). Nature and assessment of behavior settings: Recent contributions
from the ecological perspective. En P. McReynolds (dir.), Advances in psychological as-
sessment (vol. V). San Francisco. Jossey Bass.
Wolf, M. M. (1978). Social validity: The case for subjetive measurement or how applied beha-
vior analysis is fiding it heart. Journal of Applied Behavior Analysis, 11, 203-214.
De Castro, R. (dir.) (1991). Psicología ambiental: intervención y evaluación del entorno. Sevi-
lla. Arquetipo Ediciones. an o
Fernández-Ballesteros, R. (1987). El ambiente. Análisis psicológico. Madrid. Pirámide.
Holahan, C. ]. (1991). Psicología ambiental. Madrid. Trillas. pe bl
Jiménez, F. (1990). La psicología ambiental y su evaluación. En F. Jiménez y R. de Diegi
- (dirs.), Lecturas de psicodiagnóstico. Salamanca. Amarú.
y
'"y 0 A z
JEAE mit,
vtr g ió
PUEDO ANDA ALCOY Y

¿rro dl,spore:
n E P ; A z 00.
y 1 AR
] » e ES
pe FAC Cc mA
om Y
ur h
olor]esla 37 hase
| E EE 7 le JS oe Y EJ ddnas t] + ( Y EN
1) O
Le E a ho 210 TIE DUO $ “E VA sd un A YH go
se Mu
Í 16 Ú y ' 4 . 4 ) *
, ' ; 3
¿ A ] tudrá
' 1 + ml lu) WMA
LADA e COIE
GS, JUSA rin EN GIA OL
E, leds
o
, yA ATI IS
3 UE Cl]
P A 4
MILI OGOSR PTA EU
4 y ¡7 al
d t PLA MINAS
4 , ' a
e AE A TOA]
E 161
; Il 150
APPO A soni
.
k . + Ln DS La +10 0%
40. DISEÑOS DE EVALUACIÓN DE PROGRAMAS
MARIANO ÁLVARO Y GUALBERTO BUELA-CASAL
Il. INTRODUCCIÓN
En la actualidad, la evaluación de programas supone una actividad de gran interés en

numerosos sectores. Pero quizás sea en el ámbito educativo donde se le concede una
mayor importancia, lo cual resulta lógico, si se tiene en cuenta la gran inversión que
realizan en el campo educativo los países más desarrollados. Por otra parte, podría
argumentarse que los resultados de un determinado programa no se ponen de mani-
fiesto hasta varios años después de su implantación, por lo que resulta necesario dis-
poner de una información continua sobre su evolución, con vistas a su modificación
parcial o total.
El creciente interés por la evaluación de programas e incluso sistemas educativos
comenzó a finales de la década de los años sesenta. En 1969 se pone en marcha el Na-
tional Assessment of Educational Progress (NAEP) en Estados Unidos. Desde en-
tonces, la preocupación por la calidad de los sistemas educativos es constante. Hoy
en día, ya se hacen comparaciones entre diversos países, creándose para ello entida-
des supranacionales como la International Association for the Evaluation of Educa-
tional Achievement (IEA). La OCDE está trabajando desde 1987 en la configuración
de una lista de indicadores que permita contrastar el funcionamiento de los progra-
mas educativos de diferentes países; la Sociedad para la Investigación Evaluativa
(SIE), que se preocupa por la calidad de la evaluación, ha establecido un total de 55
normas que se deben seguir para realizar una evaluación válida y eficaz (Stuffebeam
y Shinkfield, 1987); el Joint Committee on Standards for Educational Evaluation
(1988) editó un manual en el que se recogen 30 normas que garantizan la calidad de
la evaluación, etcétera.
Según Tiana (1990), el problema principal que subyace a la demanda de eva-
luación podría enunciarse de la siguiente forma: ¿cómo pueden los países distri-
buir en sus sistemas educativos unos recursos escasos, asegurando simultáneamen-
te la máxima efectividad? Para contestar a este interrogante y, sobre todo, para
encontrar criterios operativos, los diversos países han ido estableciendo mecanis-
mos de evaluación que garanticen una información continua sobre el funciona-
miento del sistema educativo. En opinión de Diéguez (1990), la evaluación de pro-
gramas supone un proceso continuo y dinámico que implica tomar alguna de las
siguientes opciones: mantener, suprimir o corregir. Desde una perspectiva ciberné-
tica, la evaluación de programas y sistemas sería un mecanismo de retroalimenta-
ción que facilita la toma de decisiones. Así por ejemplo, los innumerables estudios
sobre el sistema educativo en Estados Unidos han demostrado que en los últimos
Instituto de la Mujer y Universidad de Granada.

1002 Mariano Álvaro y Gualberto Buela-Casal
años el nivel de rendimiento en matemáticas y lenguaje ha disminuido de forma

considerable, lo cual lleva a la necesidad de una reforma del sistema educativo (Ba-
nathy, 1991). de
La evaluación de programas y sistemas implica, en muchos casos, unas peculiari-
dades muy especiales que afectan a la metodología utilizada. Evaluar el rendimiento
académico de muchos sujetos y muchas asignaturas al mismo tiempo, en una misma
aplicación, es una pretensión habitual cuando se trata de evaluar cualquier sistema y
algunos programas. En estos casos se necesita que haya representatividad de alum-
nos y contenidos curriculares. Con el fin de poder mantener la validez externa de es-
tos estudios (generalización de resultados a la población) y validez de contenido (re-
presentatividad de los contenidos curriculares), se han utilizado de manera bastante
generalizada los diseños matriciales con sus diferentes variantes. En el presente capí-
tulo nos limitaremos a abordar los diseños de evaluación que están basados en el uso
de la técnica denominada muestreo matricial.
IL. DISEÑOS MATRICIALES SIMPLES

m1. Características generales
Sin duda, este tipo de diseños es el más clásico y, por tanto, más conocido. Entre sus
características fundamentales podrían mencionarse las siguientes:
a. Todos los sujetos pertenecientes a la muestra pasan las mismas pruebas.

b. La matriz muestral de sujetos siempre es representativa de la población a la
que pertenece.
c. Las pruebas aplicadas incluyen la totalidad de ítems elaborados para evaluar
el programa o, en su defecto, una muestra representativa de éstos.
d. Sólo se utiliza una muestra por población, de sujetos, de ítems o de unos y
otros, lo cual no indica que no puedan existir distintas submuestras.
12. Tipos de diseños matriciales simples

Según el tipo de muestreo realizado sobre los sujetos e ítems, se pueden distinguir
cuatro tipos de diseños matriciales simples:
a. Evaluación exhaustiva. Todos los sujetos de la población responden a todos

los ítems. En teoría resulta el diseño más adecuado, pues facilita información a nivel
individual, de grupo o global, de toda la población y de la totalidad de los ítems. El
principal inconveniente en la práctica es que resulta sumamente costoso cuando se
trata de poblaciones grandes. Véase la figura 40.1.
b. Muestreo de sujetos. Una muestra aleatoria de sujetos responde a todos los
ítems. Este tipo de diseño es uno de los que más se ha empleado, puesto que utilizan-
do muestras representativas se pueden hacer inferencias sobre el total de la pobla-
ción (véase la figura 40.2). Este fue el diseño utilizado en la evaluación de la Reforma
Diseños de evaluación de programas 1003
de las Enseñanzas Medias. Para una descripción detallada, véase Álvaro (1988a,
1988b, 1990).
FIGURA 40.1. Muestreo exhaustivo.
Población de ítems
ADE
oo
RON
E
NAO
FIGURA 40.2. Muestreo de sujetos
PM
O
b, e
INES
ELO
Sac
Pa
Ó
n
d 3]
=D
MO
0
"E
c. Muestreo de ítems. Todos los sujetos de la población responden a una mues-

tra representativa de ítems. Véase la figura 40.3.
FIGURA 40.3. Muestreo de ítems
Población de Ítems
Muestra
TIDO*=0Op—
us
Da”
"0
==:
0
O
a
d. Muestreo de sujetos e ítems. Una muestra representativa de sujetos responde

a una muestra representativa de ítems. Resulta un diseño apropiado en aquellos ca-
sos en que las poblaciones de ítems y de sujetos son difíciles de abordar por su eleva-
do tamaño. Véase la figura 40.4.
13. Ventajas e inconvenientes de los diseños matriciales simples

Entre las ventajas propias de este tipo de diseños pueden citarse las siguientes:
a. Facilitan información detallada a nivel de la población.

b. Permiten hacer comparaciones entre los distintos estratos y entre diferentes
grupos dentro de un mismo estrato.
c. Puede obtenerse una amplia información a nivel individual de aquellos suje-
tos pertenecientes a la muestra.
Se adaptan a cualquier tamaño de la población.
e. Seadaptan a poblaciones muy heterogéneas, con diversos estratos y desigual
distribución entre éstos.
f. Resultan adecuados para comparar los resultados de la aplicación de dos o
más programas.
Diseños de evaluación de programas
1005
MIGURA 40.4. Muestreo de sujetos e ítems
Muestra
PM
ou
b e
las
aaJU
ur
la
Ó
n
d
e
S
u
J
e
t
O
S
g En el análisis de datos pueden obtenerse las correlaciones entre las distintas

áreas evaluadas, tanto a nivel global como de los distintos estratos.
El principal inconveniente de estos diseños es el elevado coste económico que

supone aplicar todas las pruebas a todos los sujetos de la muestra, además del esfuer-
zo que implica para los propios alumnos.
TI. DISEÑOS MATRICIALES MÚLTIPLES

m1. Características generales
Si se pretenden evaluar los efectos de un programa, no es necesario que cada estu-
diante que está siguiendo el programa responda a la totalidad de los ítems de las
pruebas construidas para evaluarlo. Los resultados a nivel individual son o pueden
ser importantes para los propios alumnos, para los padres, para los profesores, e in-
cluso para el propio evaluador. Sin embargo, éste no es el objetivo esencial en la eva-
luación de un programa, puesto que lo que interesa es conocer los resultados de su
aplicación en el conjunto de sujetos que han participado.
Este diseño fue utilizado originalmente por el National Assessment of Educatio-
nal Progress (NAEP), a finales dela década de los años sesenta, para evaluar el sistema
educativo en Estados Unidos. El diseño inicial se basaba en la utilización del muestreo
matricial múltiple, según el cual cada sujeto no responde a todos losítems utilizados en
la evaluación, sino a una pequeña muestra de ellos. El muestreo matricial múltiple, tal
como fue implementado por el NAEP, dividía la población de ftems de un determinado
nivel de edad en diferentes cuadernillos, de tal forma que cada uno de éstos contenía
tantos ítems como el sujeto era capaz de contestar en un período de tiempo dado. Los
ejercicios que aparecían en un cuadernillo, no aparecían en otro, aunque sí podían in-
cluirse en cuadernillos de diferente nivel de edad (Messick, Beaton y Lord, 1983).
La cuestión primordial para el NAEP era recoger datos representativos a nivel na-
cional, pero al mismo tiempo asegurar a las administraciones estatales y locales que
los estándares nacionales no serían impuestos, ni se harían comparaciones entre esta-
dos o distritos. Se trataba de evaluar el sistema a nivel global. Por tanto, no era nece-
sario aplicar todos los ítems a todos los sujetos.
El proceso de elaboración y aplicación de las pruebas se realiza según las siguien-
tes fases:
a. Se estima el número de ítems que puede responder un alumno en el tiempo

asignado para la evaluación; así, se establece el número de ítems que se incluyen en
cada cuadernillo.
b. Se divide el número total de ítems (población de ítems) por el número de
ítems del cuadernillo; se obtiene entonces el número total de cuadernillos. Los ítems
se distribuyen al azar entre los distintos cuadernillos, pero de tal forma que cada
ítem sólo puede aparecer en un cuadernillo.
c. Los cuadernillos se empaquetan según el número de sujetos que componen
los grupos a los que se aplicarán. Así, si en el grupo 1 de la escuela 1 hay 20 alumnos,
se aplica un paquete con 20 ejemplares del cuadernillo 1; en el grupo 2 de la muestra
(que puede ser de la misma o de otra escuela) se aplica un paquete con ejemplares del
cuadernillo 2 y así sucesivamente. Es decir, todos los alumnos de un grupo dado re-
ciben un mismo paquete de ejercicios.
2. Tipos de diseños matriciales múltiples

Los diseños matriciales múltiples pueden clasificarse en muestreos matriciales sola-
pados y no solapados. Se denominan diseños matriciales solapados o con reposición
cuando los ítems que han sido elegidos aleatoriamente son repuestos al banco de
ítems (población de ítems). Así, diferentes muestras de sujetos responden a ítems co-
munes. Normalmente, los sujetos no son muestreados con reposición, ya que ello
implicaría que algunos sujetos podrían responder más de una vez a un mismo ítem.
Muestreos matriciales no solapados son aquellos en los que los sujetos y los ítems
aparecen solamente una vez. Es decir, un grupo de muestras no solapadas resulta si
los sujetos y los ítems son muestreados sin reposición. Otra clasificación hace refe-
rencia al tamaño de las muestras de sujetos o ítems que participan en la evaluación.
Cuando participan todos los sujetos y se aplican todos los ítems se denomina mues-
treo exhaustivo, en el caso contrario se está haciendo referencia a un muestreo no ex-
haustivo. También puede ser un diseño exhaustivo en cuanto a las muestras de una
población y no exhaustivo en cuanto a las muestras de la otra población. Por último,
los diseños matriciales también pueden clasificarse en función de la igualdad o desi-
gualdad de las distintas muestras matriciales utilizadas, bien sean de sujetos o de

ítems. Si se combina el tamaño de las muestras y la exhaustividad, tenemos los si-
guientes diseños: diseños exhaustivos en cuanto a las dos poblaciones (ítems y suje-
tos), diseños no exhaustivos en cuanto a las dos poblaciones (ítems y sujetos), dise-
ños exhaustivos en cuanto a la población de ítems y no exhaustivos en cuanto a la de
sujetos y diseños exhaustivos en cuanto a la población de sujetos y no exhaustivos en
cuanto a la de ítems. Veamos con un poco más de detalle cada uno de ellos.
11121. Diseños exhaustivos en cuanto a las dos poblaciones

(ítems y sujetos)
Teniendo en cuenta el tamaño de las muestras, resultan cuatro modalidades:
a. Diseño exhaustivo en cuanto a las dos poblaciones y muestras de igual tama-

ño, tanto de ítems como de sujetos. Este diseño es aplicable cuando se pretende esti-
mar la media y la desviación típica de una población en la totalidad de los ítems,
pero, por motivos económicos o de otra índole, no resulta posible aplicar todos los
ítems a todos los sujetos. Como puede apreciarse en la figura 40.5, todas las muestras
son iguales, participando todos los sujetos y aplicando todos los ítems. Sin embargo,
a cada muestra de sujetos se le aplican unos pocos ítems, elegidos de forma aleatoria.
FIGURA 40.5. Igual tamaño en las dos poblaciones
OO
DADOS
GIN
—=:
10:
MO
= Muestra de ítems y sujetos

b. Diseño exhaustivo en cuanto a las dos poblaciones y muestras de igual tama-

ño en cuanto a ítems y desigual tamaño en cuanto a sujetos. Este diseño resulta apro-
piado en aquellos casos en que la población no se distribuye de una forma homogé-
nea con respecto a una o más variables que pueden incidir sobre la evaluación. Un
ejemplo podría ser el hábitat, puesto que si la población no se distribuye de una for-
ma homogénea entre los distintos estratos establecidos, es evidente que hay que ha-
cer una distribución proporcional por estrato, con la consiguiente desigualdad en el
tamaño de las muestras. Véase la figura 40.6.
FIGURA 40.6. Igual tamaño en ítems y desigual en sujetos
Sy
Mé
“O
FO
(a
07
Os
MN
0
E
+0
O
c. Diseño exhaustivo en cuanto a las dos poblaciones y muestra de igual tama-

ño en cuanto a sujetos y desigual tamaño en cuanto a ítems. Es característico de
aquellas evaluaciones en las que una o más matrices de la muestra deben responder a
unos ítems adicionales, que evalúan algún contenido exclusivo de esa muestra matri-
cial o submuestra. Véase la figura 40.7.
d. Diseño exhaustivo en cuanto a las dos poblaciones y muestras de desigual
tamaño en cuanto a las dos poblaciones (ítems y sujetos). Este diseño sería el resulta-
do de la combinación de los dos anteriores. Dado que en la realidad las poblaciones
no se distribuyen de una forma homógena con respecto a las categorías y estratos
que se utilizan para clasificarlas, resulta necesario seleccionar las muestras de forma
proporcional, según la población que representan. Por tanto, este diseño suele ser
muy frecuente en la práctica. Véase la figura 40.8.
FIGURA 40.7. Igual tamaño en sujetos y desigual en ítems

5708
oo
0519"
3
WO.
DE
0
FIGURA 40.8. Desigual tamaño en las dos poblaciones
.
Q=i0O
TU
0/0
DD
DT
ooQ
100)
MIDE

mL.22. Diseños no exhaustivos en cuanto a las dos poblaciones

(ítems y sujetos)
Hasta la aparición de los tests referidos a criterio, estos diseños apenas eran utiliza-
dos. Por ello, puede afirmarse que se emplean casi exclusivamente cuando se aplica
este tipo de tests. Es decir, cuando interesa saber si los sujetos alcanzan un nivel de-
terminado para considerarse aptos, más que si dominan todo el contenido de la ma-
teria. Al igual que el caso anterior, teniendo en cuenta el tamaño de las muestras re-
sultan cuatro modalidades.
a. Diseño no exhaustivo en cuanto a las dos poblaciones y muestras de igual ta-

maño en cuanto a ítems y a sujetos. Véase la figura 40.9.
00.
3O—0O»)=00
ANO
10
D=S
b. Diseño no exhaustivo en cuanto a las dos poblaciones y muestras de igual ta-

maño en cuanto a ítems y desigual tamaño en cuanto a sujetos. Véase la figura 40.10.
c. Diseño no exhaustivo en cuanto a las dos poblaciones y muestras de igual ta-
maño en cuanto a sujetos y desigual tamaño en cuanto a ftems. Véase la figura 40.11.
d. Diseño no exhaustivo en cuanto a las dos poblaciones y muestras de desi-
gual tamaño en cuanto a las dos poblaciones (ítems y sujetos). Véase la figura 40.12.
FIGURA 40.10. /gual tamaño en ítems y desigual en sujetos
ADOOS
TOS
oo
EU
(DS
AO"
FIGURA 40.11. Igual tamaño en sujetos y desigual en items

A
OO
Pr
IOI=RO
O
(Up
O
A)

OU
—Q
[COR
=010
0
3
0
(DS
MIO
1.23. Diseños exhaustivos en cuanto a la población de ítems

y no exhaustivos en cuanto a la de sujetos
Tal como se puede deducir, en estos diseños se muestrean todos los ítems, pero no
todos los sujetos. En la práctica, resulta un diseño bastante utilizado, puesto que en
la mayoría de los casos la población de sujetos suele ser muy superior a la de ítems;
además, no siempre es posible poder evaluar a todos los sujetos. El tamaño de las
muestras puede ser igual o desigual. En función de ello, tenemos los siguientes di-
seños:
a. Diseño exhaustivo en cuanto a la población de ítems y no exhaustivo en

cuanto a la de sujetos, muestras de igual tamaño en cuanto a ítems y a sujetos. Véase
la figura 40.13.
b. Diseño exhaustivo en cuanto a la población de ítems y no exhaustivo en
cuanto a la de sujetos, muestras de igual tamaño en cuanto a ítems y desigual tamaño
en cuanto a sujetos. Véase la figura 40.14.
c. Diseño exhaustivo en cuanto a la población de ítems y no exhaustivo en
cuanto a la de sujetos, muestras de igual tamaño en cuanto a sujetos y desigual tama-
ño en cuanto a ítems. Véase la figura 40.15.
Diseños de evaluación de programas i 1013
Doo
ie)
ENS]
0.0
0
=—50=-E
FIGURA 40.14. [gual tamaño en ítems y desigual en sujetos
050
=0
"00
AO
oo
0
10,0,
STO

FIGURA 40.15. [gual tamaño en sujetos y desigual en ítems
ORD
PIO
OJO
MO
ANIOS
d. Diseño exhaustivo en cuanto a la población de ítems y no exhaustivo en

cuanto a la de sujetos, muestras de desigual tamaño en cuanto a las dos poblaciones
(ítems y sujetos). Véase la figura 40.16.
11.24. Diseños exhaustivos en cuanto a la población de sujetos

y no exhaustivos en cuanto a la de ítems
En esta modalidad se procede de forma inversa a los diseños del apartado anterior,
es decir, se seleccionan todos los sujetos de la población, pero no todos los ítems.
Resulta válido cuando se aplican tests referidos a criterio. Sin embargo, en la prácti-
ca apenas se utiliza, pues, como ya se dijo anteriormente, no siempre es posible
evaluar a todos los sujetos de una POurcOr y, además, la población de sujetos sue-
le ser muy superior a la de ítems. Por ello, estos diseños quedan desplazados por
los diseños no exhatstivos en cuanto a las dos muestras (ítems y sujetos). Conside-
rando la igualdad o desigualdad de las matrices de las muestras, Aia distinguirse
cuatro diseños:
a. Diseño exhaustivo en cuanto a la población de sujetos y no exhaustivo en

cuanto a la de ítems, muestras de igual tamaño en cuanto a ítems y a sujetos. Véase la
figura 40.17,

TIO
ODIO
10
+*D0=E
NO
Y
(MOR
DUO
SOS
"OD
=
INDAGA

b. Diseño exhaustivo en cuanto a la población de sujetos y no exhaustivo en

cuanto a la de ítems, muestras de igual tamaño en cuanto a ítems y desigual tamaño
en cuanto a sujetos. Véase la figura 40.18
FIGURA 40.18. Igual tamaño en ítems y desigual en sujetos
O)
HAS
OA
RO
DO
DR
PQ
c. Diseño exhaustivo en cuanto a la población de sujetos y no exhaustivo en

cuanto a la de ítems, muestras de igual tamaño en cuanto a sujetos y desigual tamaño
en cuanto a ítems. Véase la figura 40.19.
d. Diseño exhaustivo en cuanto a la población de sujetos y no exhaustivo en
cuanto a la de ítems, muestras de desigual tamaño en cuanto a las dos poblaciones
(ítems y sujetos). Véase la figura 40.20.
m3. Ventajas y limitaciones de los diseños matriciales múltiples

La idea central del muestreo matricial múltiple es que para estimar el resultado de
aplicar un programa no hay que evaluar a todos los sujetos en todos los ítems de las
pruebas diseñadas para analizar los objetivos del programa. Por tanto, estos tipos de
diseños son especialmente útiles cuando:
FIGURA 40.19. Igual tamaño en sujetos y desigual en ítems
MIO
QQ
10
OY
ONIS)
=
Mp)
E
(¿MSG
COSO
oo
ION
PROS
TD
DIC

a. Interesa conocer el nivel de un grupo y no es posible aplicar un test comple-

to a cada miembro.
b. Sólo se dispone de un limitado tiempo por asignatura, pero se desea obtener
información suficiente sobre el conjunto de asignaturas.
c. Las pruebas son de aplicación individual. En estos casos el tiempo resulta un
factor muy importante en la evaluación. Para obtener más información so-
bre el grupo es mejor aplicar unos pocos ítems a cada sujeto que la prueba
completa a unos pocos sujetos.
Hay otras razones de carácter técnico que justifican la utilización de los diseños
matriciales múltiples. Así, en cualquier evaluación referida a grandes poblaciones de
sujetos y de ítems, estos diseños resultan recomendables, puesto que, además de per-
mitir la estimación de parámetros de una población de sujetos dada, se pueden calcu-
lar las diferencias entre parámetros para dos o más poblaciones.
Entre las limitaciones más importantes que presentan los diseños matriciales
múltiples podemos destacar las siguientes:
a. No permiten establecer relación entre los distintos ítems, pues para ello es
necesario que un mismo grupo de sujetos responda a los mismos ítems. La
matriz de correlaciones entre ítems tan sólo puede obtenerse para aquellos
ítems que se aplicaron a una misma muestra de sujetos.
b. Imposibilidad de estimar parámetros a nivel individual. Sólo se pueden ob-
tener a nivel global.
c. Un problema importante es que el muestreo matricial está basado en la
asunción de que la respuesta de un sujeto a un ítem es independiente del con-
texto en el que se presenta el ítem. Es decir, la respuesta a un ítem no depende
del orden ni del tipo de ítems entre los que se incluye.
d. Otra dificultad es la falta de guías teóricas con las que el usuario pueda deter-
minar el diseño matricial más eficaz para cada caso particular que se le pre-
sente.
e. Porúltimo, hay que resaltar lo complejo que resulta utilizar el muestreo ma-
tricial múltiple, desde la construcción de las pruebas, la planificación y el di-
seño de la evaluación, hasta el análisis de los datos.
IV. DISEÑO DE BLOQUES INCOMPLETOS BALANCEADOS (BIB)
1v.1. Características generales

Los diseños matriciales múltiples señalados son apropiados para dar una informa-
ción global sobre el funcionamiento de un programa a nivel nacional. De hecho, es-
tos diseños fueron utilizados durante varios años por el NAEP, pues se ajustaban a la
necesidad de la evaluación educativa imperante en las décadas de los años sesenta
setenta en Estados Unidos. Sin embargo, según Messick y cols. (1983), a partir del
año 1980 se producen diversos cambios sociopolíticos que llevan a la necesidad de
plantear un nuevo diseño de evaluación. Entre los factores más importantes destaca
la concesión de una mayor autonomía a los Estados para gestionar los programas
educativos. Así, los departamentos educativos de los Estados adquieren una mayor
competencia en la mejora de las escuelas, pero, para ello, necesitan una información
más amplia sobre la efectividad de los programas educativos y la relación del rendi-
miento con factores tales como organización de las escuelas, formación del profeso-
rado, actitudes hacia las tareas educativas, etc. Esto tiene como consecuencia que el
NAEP deba realizar una evaluación que sea relevante para las administraciones loca-
les, estatales y nacionales. Por tanto, es necesario disponer de resultados a nivel de
centro, pero sin perderel referente de los estándares nacionales.
Con estos planteamientos, es necesario establecer correlaciones entre variables
de background, por una parte, y entre los distintos ítems, por otra. Para ello fue ne-
cesario buscar un diseño que permitiera que cada par de ítems fuera respondido por
el mismo grupo de sujetos. Es decir, en cada cuadernillo hay un número determina-
do de bloques de ítems, pero distribuidos de tal forma que con la totalidad de cua-
dernillos se consigue que todos los bloques estén emparejados al menos una vez.
Cada ítem es administrado el mismo número de veces, pero, además, cada par de
ejercicios es aplicado también un número de veces determinado. Esto implica que
cada ejercicio o ítem está incluido en diferentes cuadernillos. Por tanto, podría decir-
se que en el BIB cada estudiante contesta a diferentes ítems, y cada cuadernillo tiene
diferentes ítems. Sin embargo, hay unos pocos ítems que son comunes entre distin-
tos cuadernillos y que son contestados por más de una matriz muestral de sujetos.
Esto permite que se pueda hacer correlación de ítems. Véase la figura 40.21.
El muestreo que se ha utilizado en la década de los años ochenta se compone
de tres fases. En la primera fase, la unidad muestral eran las unidades primarias de
muestreo (UPM). Éstas se clasificaban por estratos definidos por la región geográfi-
ca y el tipo de comunidad. Si las UPM (o distritos de muestreo) resultaban muy pe-
queñas, se agrupaban de forma que tuviesen un mínimo de 1 500 sujetos por cada
grupo de edad muestreado. En la segunda fase, la unidad de muestreo es la escuela.
En esta fase se enumeraban, estratificaban y seleccionaban escuelas, tanto públicas
como privadas, dentro de cada una de las UPM seleccionadas anteriormente. En la
tercera fase, la unidad muestral es el alumno. Se eligen los alumnos dentro de cada
escuela; aproximadamente, se seleccionaban entre 16 y 25 alumnos por cada grupo
de edad.
Otra característica distintiva del nuevo diseño es que se recoge una amplia infor-
mación sobre los sujetos excluidos de la evaluación. Anteriormente, se utilizaban
tres criterios para descartar a los sujetos como miembros de la muestra: tener deft-
ciente uso de la lengua inglesa, desajuste funcional y retraso mental. Se decidió am-
pliar información sobre los sujetos excluidos por dos razones fundamentales. Pri-
mero, para saber hasta qué punto la exclusión de los sujetos con las características
mencionadas podría sesgar la representatividad de las muestras utilizadas. La segun-
da razón era saber si el grupo excluido está compuesto, a su vez, por grupos suficien-
temente importantes en cuanto a su tamaño y considerablemente homogéneos
como para ser estudiados. Así, se comprobó que la población de hispanos tenía unas
características culturales propias y un tamaño suficiente como para ser evaluados.
Dado que los hispanos no están distribuidos de una forma homogénea en los distin-
FIGURA 40.21. Diseño de bloque incompleto balanceado
53
oy
0D
O
oQ
"DC
DIR
|] Ítems no comunes
Ítems comunes
tos Estados, fue necesario modificar el muestreo a nivel nacional para asegurar la re-
presentatividad del grupo hispano.
En el proceso de elaboración y aplicación de las pruebas, se siguen las mismas fa-
ses que en el muestreo matricial múltiple. Sin embargo, hay una diferencia funda-
mental. En el diseño BIB cada cuadernillo está compuesto por tres bloques diferen-
tes. La composición de los distintos cuadernillos se realiza de forma que cada par de
bloques aparezcan juntos en un mismo cuadernillo al menos una vez. Esto constitu-
ye la característica principal del diseño BIB. El hecho de emparejar los bloques, al
menos una vez, permite calcular la matriz de correlaciones entre todos los ítems. No
obstante, este diseño implica la edición de un mayor número de cuadernillos. Así
por ejemplo, si para evaluar un área determinada se necesitan 165 ítems, en el diseño
matricial múltiple se construirían 5 cuadernillos con 33 ítems cada uno, es decir, un
cuadernillo sería un bloque. En el diseño BIB un cuadernillo estaría compuesto de
tres bloques de 11 ítems cada uno. Si tenemos en cuenta que los bloques deben per-
mutarse de forma que todos aparezcan emparejados una vez, sería necesario impri-
mir un total de 35 cuadernillos.
Iv2. Ventajas y limitaciones del diseño BIB

Este diseño permite cubrir de forma extensa la evaluación de los contenidos de un
programa, con la ventaja añadida de que se dispone de una muestra representativa de
sujetos para cada matriz muestral de ítems. En el diseño BIB, basándose en la matriz
de correlaciones, se pueden realizar análisis factoriales para comprobar la dimensio-
nalidad de las pruebas. No obstante, hay que señalar que la matriz de correlaciones
generada a partir de este diseño difiere de la matriz normal de correlaciones, puesto
que los datos están tomados de diferentes muestras aleatorias. Esto significa que la
matriz general puede no ser consistente con resultados procedentes de un grupo de
puntuaciones de una muestra parcial.
V. DISEÑO DÚPLEX
v.1. Características generales

La creación del diseño dúplex responde a la necesidad de satisfacer las demandas de
distintos colectivos, que en unos casos hacen referencia a la consecución de objetivos
de tipo general y en otros a resultados académicos de sujetos concretos. A los técni-
cos que diseñan y planifican los programas educativos, les interesa conocer el rendi-
miento global de un grupo de sujetos bajo determinadas condiciones, más que el
rendimiento concreto de un alumno en particular. A los administradores locales,
también les interesan los resultados a nivel de grupo más que a nivel individual, y,
además, saber si ha habido mejoras o no a lo largo de los años. Los responsables de
los departamentos educativos a nivel de Estado, que son los encargados de formular
los objetivos de los programas, están interesados en conocer con detalle en qué me-
dida se van cumpliendo los objetivos. Por otra parte, a los legisladores a nivel nacio-
nal les interesa conocer si hay pérdidas o ganancias entre los distintos Estados, por lo
que necesitan resultados a nivel global. Por último, los directores de las escuelas, los
profesores, los padres y los mismos alumnos están interesados en conocer los resul-
tados individuales.
Con el fin de satisfacer estas diferentes demandas, Bock y Mislevy (1986) crea-
ron el diseño dúplex, que fue desarrollado para el California Assessment Program
(CAP). Este diseño permite evaluar el rendimiento y la consecución de objetivos de
forma simultánea. Por tanto, se pretende recoger una información general a nivel in-
dividual y otra más concreta y específica a nivel de grupo. En el primer nivel se con-
siguen puntuaciones en amplias áreas o categorías, mientras que en un segundo nivel
se obtienen puntuaciones sobre detallados objetivos curriculares. Para ello, se pro-
cede de la siguiente forma. Cada área que cubre el programa se divide en subáreas o
categorías; éstas, a su vez, se dividen según los distintos objetivos específicos que
componen cada categoría. Por tanto, hay tres niveles de medida y, como es lógico,
para evaluar cada nivel se necesitará un número considerable de ítems. Así, para eva-
luar la totalidad de los objetivos específicos se necesita una cantidad tan elevada de
ítems, que resultaría excesivo aplicárselos todos a un mismo sujeto. Por ello, para
cada alumno se obtienen las puntuaciones en las distintas categorías y la puntuación
global del área se consigue promediando los valores de las categorías. Los objetivos
específicos se evalúan a nivel de grupo, para lo que se utiliza la totalidad de las prue-
bas aplicadas.
El procedimiento de elaboración de las pruebas comienza estableciendo la
población de ítems que evalúan los distintos objetivos del programa. A conti-
nuación, se clasifican por áreas y categorías. Luego, teniendo en cuenta el tiem-
po disponible para la aplicación, es decir, el número de ítems que puede respon-
der un alumno, se elaboran tantas pruebas paralelas como sea necesario para
cubrir la totalidad de los ítems, pero esto debe hacerse de tal forma que cada
una de las pruebas individuales (cuadernillo) constituya una muestra representa-
tiva de la población de ítems que evalúan las categorías. Ello permite que se
puedan obtener puntuaciones individuales a nivel de las categorías. Sin embargo,
el número de ítems que evalúa objetivos específicos que se incluyen en cada una
de las pruebas paralelas no es suficiente como para evaluar dichos objetivos a
nivel individual, por lo que es necesario analizarlo a nivel de grupo, pues de esta
forma se obtiene la totalidad de la población de ítems que evalúa los objetivos
específicos.
En la fase de aplicación o administración de los cuadernillos, las distintas formas
paralelas se distribuyen en rotación dentro de las clases. Así, los datos individuales
(relativos a las categorías) se recogen por medio de cada cuadernillo, mientras que
los datos a nivel de grupo (relativos a los objetivos específicos) se recogen a través de
K cuadernillos.
v2. Ventajas e inconvenientes del diseño dúplex

Las principales ventajas del diseño dúplex son que permite obtener puntuaciones in-
dividuales para cada sujeto y simultáneamente una información más específica a ni-
vel de grupo, y es muy sensible a los cambios curriculares, tanto a través del tiempo
como a nivel geográfico. Por tanto, resulta apropiado cuando se trate de evaluar pro-
gramas centralizados y que estén estabilizados.
El principal inconveniente que presenta el diseño dúplex es que no se puede asu-
mir la unidimensionalidad referida a todas las formas paralelas en su conjunto. Por
otra parte, la información que facilita a nivel individual es de ámbito general.
VI. DISEÑO DÚPLEX COMPLEMENTARIO
Este diseño es una variación del diseño descrito anteriormente. Podría definirse
como mixto entre el dúplex y el matricial múltiple. De hecho, para la elaboración y
aplicación de las pruebas debe seguirse el procedimiento descrito en ambos. Por una
parte, el diseño dúplex complementario facilita información general a nivel indivi-
dual sobre aquellas áreas que interesen. Simultáneamente, facilita información deta-
llada sobre las áreas analizadas a nivel global y, además, de otras áreas que sólo inte-
rese evaluar a nivel de grupo.
En la elaboración de las pruebas, se procede de igual modo que en el diseño dú-
plex, construyendo diversas pruebas paralelas para evaluar las áreas que interese ana-
lizar a nivel individual y de grupo, pero, además, en cada cuadernillo se incluye un
número determinado de ítems correspondientes a una o más áreas, cuyos resultados
sólo interesan a nivel de grupo. Para la inclusión de estos ítems, se sigue el procedi-
miento del muestreo matricial múltiple. Así, en cada cuadernillo, se incluye una ma-
triz muestral de ítems hasta completar la totalidad de la población de ítems para esa
área. Véase la figura 40.22.
Por ejemplo, si en la evaluación de un determinado programa nos interesa eva-
luar dos áreas, una de ellas a nivel individual y de grupo y la otra sólo a nivel de gru-
po, se seguirá el procedimiento del diseño dúplex para evaluar la primera, mientras
que la segunda se efectuaría según el diseño matricial múltiple, pero todo ello en los
mismos cuadernillos. Es decir, éstos tendrían dos secciones, una correspondiente a
los ítems que evalúan la primera área y que serían formas paralelas y representativas
de la población de ítems de dicha área, cuyo análisis se podría realizar a nivel indivi-
dual o de grupo. La otra sección estaría compuesta por una matriz muestral, no re-
presentativa, de la segunda área. Por tanto, sólo cabría hacer análisis a nivel de grupo.
En definitiva, se puede concluir diciendo que el muestreo dúplex complementa-
rio es el más apropiado cuando se pretende obtener resultados a nivel individual y
global en algunas áreas y sólo global en otras.
VIL PROPUESTA DE UN DISEÑO MIXTO
viL1. Características generales

La combinación de los distintos diseños descritos anteriormente daría lugar a un
gran número de diseños mixtos, que no entraremos a comentar aquí. Sin embargo,
consideramos conveniente describir de forma breve el diseño mixto que el Servicio
de Evaluación del Centro de Investigación, Documentación y Evaluación (CIDE) del
Ministerio de Educación y Ciencia propuso en 1988 como un proyecto de Evalua-
ción Permanente del Sistema Educativo (EPSE).
En dicho proyecto se planteaba que para realizar una evaluación sistemática y
general del sistema educativo, habría que hacer un análisis lo más detallado posible
de todos aquellos aspectos que resulten relevantes para la evaluación. Por ello, con-
siderando la complejidad que entraña el funcionamiento de un sistema educativo, se
diseñó un modelo de evaluación en el que se incluían los siguientes apartados:
Evaluación de la administración educativa.

Evaluación de centros y Servicios.
Evaluación del profesorado.
Evaluación del alumnado.
SA Evaluación
DAN de la opinión pública sobre el sistema educativo.
FIGURA 40.22. Diseño dúplex complementario
Forma A FormaB
Muestra de ítems Muestra de ítems
M M
u u
e e
Ss Ss
t t
r E r
a - a
d : d
e - e
a "
S E . Ss -
u : ; u .
] ; : ] ,
e . 2 e .
t ” r t r
O > O :
5) 6 S =
Forma C Forma N
Muestra de ítems Muestra de ítems
M a M
u - u
e y e
S . S
t + e AA os
F L r z
a : a :
d : d .
e A
.
O e
MA A => .
,
5 ES P A
E El . ¿
] ] : ,
e e - >
t t
o) o)
S S
= Muestras matriciales paralelas
= Muestras matriciales complementarias
A continuación, nos limitaremos a exponer aquellos aspectos íntimamente rela-

cionados con el diseño. Nos referimos al proceso de elaboración de las pruebas, la
selección de la muestra (de alumnos) y la fase de aplicación.
vi2. Elaboración de las pruebas |

La elaboración de las pruebas constituye una de las fases más importantes de la eva-
luación del programa, puesto que, además de tener que cumplir con los requisitos
psicométricos exigidos, deben adaptarse totalmente al tipo de diseño utilizado. Por
tanto, lo primero que hay que tener presente es su finalidad, es decir, qué objetivos se
pretenden evaluar y en qué forma se realizará.
Los objetivos que se deben alcanzar en cada uno de los niveles educativos vienen
marcados por el Estado. Para elaborar los ítems que permitan evaluar dichos objeti-
vos, es necesario contar con la colaboración de técnicos o expertos en currículo que
conozcan lo que se debe exigir en cada nivel, así como profesores en activo y aseso-
res psicopedagógicos de editoriales de libros de textos, ya que en éstos se intentan
plasmar los objetivos legales. Una vez definidos los objetivos y delimitadas las áreas
a evaluar, el siguiente paso sería la formulación de ítems. Para ello se pueden utilizar
dos procedimientos. Uno sería la construcción de pruebas para cada ocasión y el
otro construir un banco de ítems que se fuera renovando parcialmente a lo largo del
tiempo y del cual se pudieran extraer, de forma aleatoria, los ítems que sean necesa-
rios para cada aplicación. En el proyecto propuesto, se optaba por la segunda op-
ción, la cual, en un principio, es más costosa, pero resulta más rentable a largo plazo,
ya que permite construir pruebas en cualquier momento y adecuarse a las necesida-
des específicas de cada aplicación.
vin3. La selección de la muestra de sujetos

La muestra sería de ámbito estatal y representaría a la población escolar de un deter-
minado nivel educativo. El tamaño estimado sería de 12 000 alumnos, trabajando a
un nivel de confianza de un 95,5%. El procedimiento de muestreo constaría de dos
fases, en la primera se seleccionan los centros y en la segunda los alumnos.
En la primera fase de la selección, habría que tener en cuenta que, en la ac-
tualidad, en España hay siete comunidades autónomas con competencias plenas
en materia educativa. El hecho de tener o no competencias plenas en este ámbi-
to es lo suficientemente importante como para dividir la muestra total en ocho
submuestras: Galicia, País Vasco, Navarra, Cataluña, Valencia, Andalucía, Cana-
rias y el resto del territorio controlado por el Ministerio de Educación y Cien-
cia. Cada una de las submuestras estaría compuesta por 1500 alumnos, lo cual
sería suficiente para dar resultados por cada uno de los estratos. No obstante, a
la hora de analizar los datos a nivel estatal sería necesario ponderar los datos de
cada estrato, puesto que al utilizar el mismo número de sujetos por estrato,
siendo los correspondientes tamaños poblacionales diferentes, el coeficiente de
elevación o número de sujetos de la población representados por cada sujeto de
la muestra varía.
El número de alumnos posibles por centro se estableció en 25. Por tanto, en cada
una de las submuestras habría que seleccionar un total de 60 centros. Para ello, se
tendrían en cuenta dos categorías: el hábitat (rural, urbano o capital de provincia) y
su dependencia (público o privado). Se realizaría una afijación proporcional de la

muestra según estas categorías. EP
El último paso sería la selección de los alumnos en cada centro, que se haría apli-
cando un muestreo aleatorio sistemático. No obstante, no todos los alumnos po-
drían ser seleccionados, ya que habría dos criterios de exclusión: ser diagnosticado
de educación especial y alumnos con alguna incapacidad física, temporal o perma-
nente, que les impidiese resolver las pruebas con normalidad.
vin4. Fase de aplicación de las pruebas

Esta fase debe planificarse de forma que se establezca una adecuada relación entre
los resultados que se obtengan y el coste invertido. Así, se consideró conveniente
proponer el diseño de dos procedimientos, en paralelo, para la aplicación de las
pruebas: el primero se utilizaría para las pruebas de rendimiento y el segundo para
las restantes pruebas.
vIL4.1. Pruebas de rendimiento
El objetivo de partida es hacer una estimación del rendimiento de los alumnos en

distintas áreas o materias en determinados cursos escolares y del grado en que se van
alcanzando los objetivos curriculares en cada una de ellas. En consecuencia, no es
necesario obtener las puntuaciones de los alumnos a nivel individual, pues sería sufi-
ciente con conocer el rendimiento de los distintos grupos de sujetos en las distintas
asignaturas. Según este planteamiento, no habría que realizar una evaluación que
proporcionara datos a nivel de alumno. Ello permitiría evitar el costoso trabajo de
pasar, a cada alumno, todas y cada una de las pruebas construidas para evaluar el ren-
dimiento. Esto tiene su fundamento en la teoría de respuesta al ítem, que, como es
bien sabido, postula que, cuando un grupo de sujetos suficientemente grande res-
ponde a un solo ítem, resulta un estimador que reduce el error típico respecto al que
cabría esperar si un grupo menor de sujetos respondiera a más ítems. Esta teoría per-
mite construir escalas comparables, independientemente del área en que se evalúe y
del momento en que se realiza la evaluación. Éste es el modelo de base para los dise-
ños matriciales múltiples y en el que se apoyaba parcialmente el proyecto que se pre-
senta. Véase la figura 40.23.
El procedimiento propuesto era el siguiente:
a. Dividir el número total de ítems construidos para una materia en bloques

que contuvieran el mismo número de ejercicios cada uno, de tal forma que los ejerci-
cios no debían repetirse de un bloque a otro.
b. Los bloques se combinarían en cuadernillos, de tal forma que:
— Hubiera el mismo número de bloques en cada clase en el cómputo total de

cuadernillos.
— Cada bloque se combinara con todos los demás.
FIGURA 40.23. Propuesta de un diseño mixto
Po bular olirómnucrrdccuió tee mia
MUBSIra e Ítems
M
po
Po
DA
¡A
a 4
CUA
as
OS
no t
d 0.
e Ss
S
ú
J
e
t
O
S)
= Ítems de diversas pruebas
A = Ítems no comunes de rendimiento
ES = Ítems comunes de rendimiento
— Cada posible pareja de bloques apareciera sólo una vez.

— Cada bloque estuviera compuesto por ítems asignados al azar, de forma que
quedaran representados todos los posibles cruces entre contenidos a evaluar
en una materia y las aptitudes y procesos cognitivos implicados en las res-
puestas a los ítems.
c. Los cuadernillos o pruebas resultantes estarían formados por tres bloques

diferentes que respondieran a la misma materia evaluada y otro bloque más pequeño
común para todos los cuadernillos, en el que se incluyeran cuestiones sobre infor-
mación básica para esa área.
d. El tiempo máximo estimado para cada prueba de rendimiento sería de 50
minutos, de forma que 45 se dedicarían a los ítems sobre rendimiento (15 por cada
bloque) y 5 a las preguntas de información básica. A cada alumno, se le aplicarían
dos cuadernillos pertenecientes a dos áreas distintas del currículo.
e. El resultado final sería una lista ordenada de cuadernillos.
f. Puesto que en cada centro se seleccionarían 25 sujetos, se aplicarían los pri-

meros 25 cuadernillos de la lista en la primera escuela, los 25 siguientes en la segunda
y así sucesivamente hasta el último cuadernillo de la lista, momento en el que se vol-
vería a comenzar con el primero. Este proceso circular se repetiría tantas veces como
fuese necesario para cubrir la totalidad de la muestra seleccionada (1 500) en cada es-
trato (las siete comunidades autónomas más el territorio bajo el control del Ministe-
rio de Educación y Ciencia).
vIL42. Aplicación de las restantes pruebas

Aquí se incluye una batería de aptitudes, un cuestionario sobre reacciones emocio-
nales ante el estudio, un cuestionario sobre hábitos de estudio y un cuestionario para
recoger datos sociofamiliares y actitudes cívico-sociales. Con el objetivo de poder
hacer estudios correlacionales entre estas variables y las de rendimiento, resulta im-
prescindible que todos los sujetos de la muestra pasasen las mismas pruebas. La apli-
cación de las pruebas se realizaría a lo largo de una sola jornada escolar, en sesiones
de mañana y tarde. Para evitar el posible efecto de la fatiga se proponía hacer un des-
canso de 15 minutos por la mañana, intentando que éste se correspondiera con el
tiempo dedicado habitualmente al recreo.
El orden de aplicación de las distintas pruebas podría ser el siguiente:
a. Mañana:
— Prueba de rendimiento (A o B) (50”).

— Cuestionario de información general y actitudes (25”).
— Descanso (15').
— Prueba de aptitudes (40”).
b. Tarde:
— Prueba de rendimiento (B o A) (50').

— Cuestionario de reacciones ante el estudio (15').
— Cuestionario de técnicas de estudio (15”).
Es importante precisar que el orden de aplicación de las pruebas de rendimiento

se balancearía; es decir, la mitad de la muestra contestaría la prueba A por la mañana y
la B por la tarde, aplicando las mismas en orden inverso a la otra mitad de la muestra.
VII. CONCLUSIONES
Después de revisar los distintos diseños que se pueden utilizar para la evaluación de
programas educativos, la pregunta lógica sería ¿qué diseño se debe utilizar? La res-
puesta no es fácil. Pues, como veremos a continuación, además de las preferencias
personales y/o institucionales hacia uno u otro diseño, puede haber una gran varie-
dad de programas susceptibles de ser aplicados en una gran variedad de contextos,
por lo que la decisión sobre el diseño más adecuada sólo es válida para cada caso par-
ticular. No obstante, consideramos que puede establecerse una especie de guía que
sirva para identificar a aquellos factores que estarían directamente relacionados con
el diseño utilizado. En el cuadro 40.1 se presenta de forma esquemática una relación
de dichos factores.
CUADRO 40.1. Factores a considerar en la elección del diseño
1. Objetivos de la evaluación
— Evaluar un programa estabilizado
— Evaluar la eficacia de dos o más programas
— Evaluar de forma permanente
— Evaluar objetivos generales o específicos
2. Características de la población
— Tamaño
— Estructura homogénea/heterogénea
— Distribución de los estratos
— Número de lenguas utilizadas y su situación
3. Tipos de resultados
— Nivel individual, de grupo o global
— Resultados sobre la totalidad de objetivos o sobre un criterio
4. Tipos de análisis
— Se pretende comparar grupos
— Se pretende hacer estudios correlacionales entre áreas
5. Presupuesto económico, infraestructura y recursos humanos
Un primer aspecto a considerar en la elección del diseño sería el tipo de objetivos

que se persigue en la evaluación. Por ejemplo, si se pretende evaluar la efectividad de
un programa nuevo con respecto a otro ya instaurado, los diseños matriciales simples
serían los más adecuados, puesto que permitirían hacer comparaciones a todos los ni-
veles entre ambos programas. En cambio, si lo que interesa es analizar la evolución, a
lo largo del tiempo, de un programa ya estabilizado, los diseños matriciales múltiples
serían adecuados. Por otra parte, si sólo interesa saber si se cumple un determinado
criterio en la consecución de los objetivos del programa, sería suficiente utilizar un di-
seño matricial múltiple no exhaustivo en cuanto a Ítems y a sujetos.
Las características de la población a la que se aplica el programa es otro factor a
tener en cuenta en la elección del diseño. Así por ejemplo, cuando se trate de pobla-
ciones pequeñas, los diseños matriciales múltiples no resultan válidos, puesto que
cada matriz muestral de ítems sería contestada por un número reducido de sujetos.
De igual forma, si la población es muy heterogénea, con muchos estratos y con una
distribución desigual entre ellos, los diseños matriciales múltiples resultarían muy
complejos. Un tercer factor a considerar sería el nivel de resultados que se persigue.

Si interesan resultados detallados por individuo habría que utilizar un diseño matri-
cial simple. Por el contrario, si lo que se pretende es obtener resultados a nivel de
grupo, sería suficiente un diseño matricial múltiple o el diseño de bloques incomple-
tos balanceados. También podría interesar tener resultados a nivel individual y glo-
bal, para lo cual se podría utilizar el diseño dúplex. El tipo de análisis de los resulta-
dos es otro factor determinante en la elección del diseño. La obtención de
correlaciones entre las distintas áreas evaluadas no es posible con los diseños matr1-
ciales múltiples. El coste económico de la evaluación es otro aspecto importante en
la elección del diseño, pues es necesario tener presente el balance de la inversión con
relación a los resultados obtenidos. Éstos serían sólo algunos ejemplos de los mu-
chos aspectos que habría que analizar antes de elegir un diseño determinado. Por
tanto, el diseño más adecuado sería aquel que mejor se adapte a las demandas con-
cretas de la evaluación.
Por último, es importante resaltar que la evaluación educativa tiene algunas limi-
taciones que no debemos olvidar (Wolf, 1987). Una limitación es que sus resultados
no son generalizables. Normalmente, se estudian los efectos de uno o más progra-
mas educativos en un contexto concreto. Por tanto, los resultados de tales estudios
no pueden ser generalizables a otras poblaciones o a otros contextos educativos.
Otra limitación es que los programas educativos son dinámicos, están en continuo
cambio. Por ello, las evaluaciones sobre los mismos deben contextualizarse en el
tiempo. Por otra parte, la evaluación de un programa nos da información sobre el
grado en que se consiguen unos determinados objetivos, pero en la mayoría de los
casos no aporta recomendaciones sobre cómo mejorar las deficiencias detectadas.
Alvaro, M. (19884). Evaluación externa de la Reforma Experimental de las Enseñanzas Me-

_ dias (1). Madrid. Centro de Publicaciones del Ministerio de Educación y Ciencia.
_ dias (segunda generación). Revista de Educación, 287, 5-30.
dias (11). Madrid. Centro de Publicaciones del Ministerio de Educación y Ciencia.
eS: (1991). Systems design of education. Nueva Jersey. Educational Technology Pu-
ications.
Bock, R. y Mislevy, R. (1986). Comprehensive educational assessment for the states: The Du-
_plex Design. Chicago. University of Chicago Press.
Diéguez, J. (1990). Evaluación de programas de salud mental. En A. Blanco (dir.), Apuntes de
diagnóstico clínico. Valencia. Promolibro.
Messick, K., Beaton, A. y Lord, F. (1983). A ner design for new era. Nueva Jersey. Educatio-
nal Testing Service (ETS).
Stufflebeam, D. y Shinkfield, A. (1987). Evaluación sistemática. Guía teórica y práctica. Bar-
celona. Paidós/MEC.
Tiana, A. (1990). Prólogo al libro de M. Álvaro. Hacia un modelo causal del rendimiento aca-
démico. Madrid. Centro de Publicaciones del Ministerio de Educación y Ciencia.
Wolf, R. (1987). The nature of educational evaluation. International Journal of Educational
Research, 1, 11.
Álvaro, M. (1990). Evaluación externa de la Reforma Experimental de las Enseñanzas Me-

días (11). Madrid. Centro de Publicaciones del Ministerio de Educación y Ciencia.
Hernández, J. M. (1995). Evaluación en programas de salud. En G. Buela-Casal, V. E. Caba-
Siglo XXI.
Medina, M. (1987). Evaluación de programas. En M. Martín, F. Chacón y M. Martínez
(dirs.), Psicología comunitaria. Madrid. Visor.
ES
Je 07 ea JA
mes olvidar.(Welkks
a
4 os- | Morasalmente, sees
est el viA
CALVO <A epalerio conecto Dra
+28. bi izables ona pollo
«SL OS
beros,
vn peto.
en | ps
4 Sm0 mejoras le
+ ¿eficiene as
6 A
1 sv Do E
pi. +
|
41. EVALUACIÓN DE PROGRAMAS
JOSÉ L. ARCO, GUALBERTO BUELA-CASAL y FERNANDO JUSTICIA
L INTRODUCCIÓN
En España, el retraso acumulado en evaluación de programas en el sector público

obedece a factores tanto del pasado como del presente. A la falta de una tradición
evaluadora en el ámbito de los servicios sociales hay que unir la herencia de un siste-
ma de servicios sociales poco menos que caótico (Fernández, 1995) que dejaba gran-
des capas de la población fuera de su cobertura. Durante la década de los años
ochenta se fue transformando esa situación hacia una red de servicios sociales similar
a la de otros países desarrollados de nuestro entorno. Sin embargo, el tiempo récord
en el que ese proceso se desarrolló ha tenido diferentes efectos secundarios. Quizás
el más llamativo ha sido la falta de planificación y, junto a ésta, la omisión de otro
componente intrínseco y fundamental a cualquier proceso de intervención a gran es-
cala como es la evaluación. Las continuas reformas del sistema sanitario y del sistema
educativo en nuestro país son buenos ejemplos de las condiciones en las que durante
mucho tiempo se han planificado y puesto en práctica las políticas sociales del llama-
do Estado del bienestar.
Por otro lado, la cada vez mayor presencia de profesionales de las ciencias socia-
les en experiencias evaluadoras de las intervenciones llevadas a cabo en el sector pú-
blico (Fernández-Ballesteros, 1995) no disimula, a nuestro juicio, la lentitud en la in-
corporación de este tipo de prácticas evaluadoras (formativas y sumativas) al
conjunto de actividades que comprende cualquier proceso de intervención social.
No obstante, y a pesar de las dificultades, la evaluación de programas se ha consoli-
dado no sólo como área de conocimiento científico, sino también como actividad
profesional con un cuerpo teórico y metodológico propio. Para delimitar con preci-
sión tales períodos de evolución y desarrollo hemos de tener en cuenta no sólo los
países a los que nos referimos, sino también los ámbitos profesionales y sociales a los
que hagamos referencia. De este modo, mientras que en países como Estados Un1-
dos se vienen realizando actividades evaluadoras de una forma sistemática en deter-
minadas áreas de servicios sociales desde hace más de treinta años, como ocurre en
drogodependencias por ejemplo, en otros países como España su incorporación no
va más allá de una década, al menos bajo condiciones de sistematicidad.
Las razones que acompañan la emergencia de este tipo de prácticas en nuestro
país no difieren, en términos generales, de los factores que provocaron la aparición y
extensión en el uso de investigaciones evaluadoras en otros países. La principal ra-
zón que subyace a la relativa urgencia con la que se demandan estos estudios es de
tipo económico-político. Frente al mecanismo tradicional que ha regulado la distri-
1034 José L. Arco, Gualberto Buela-Casal y Fernando Justicia
bución de recursos, esto es, disponer y/o generar los apoyos políticos suficientes que
garantizasen la continuidad de los programas, independientemente de sus resultados
(Cronbach y Shapiro, 1982), se va imponiendo la necesidad de que sea la competen-
cia entre recursos y/o programas, basada en los resultados obtenidos, el mecanismo
que ajuste la supervivencia de unos servicios frente a otros y racionalice, con ello, el
uso de los recursos y fondos públicos. De esta forma, la incorporación de este tipo
de prácticas evaluadoras por parte de las distintas áreas y departamentos de educa-
ción, salud, empleo, etc. es una consecuencia de la progresiva estructuración y plani-
ficación de tales sectores desde instituciones y gobiernos, tanto a nivel nacional
como regional. Por tanto, la importancia de los efectos derivados de utilizar la eva-
luación como instrumento selectivo de las intervenciones a nivel social hizo depurar
al máximo los distintos modelos de evaluación que se utilizaban. De esta forma, fue-
ron los modelos experimentales, basados en el esquema tradicional de identificación
de variables, manipulación de las mismas y evaluación de los efectos de tales cambios,
los que gozaron de mayor prestigio, por su rigor, entre aquéllos encargados de po-
nerlos en práctica. Sin embargo, a mediados de los setenta parecía ya estar bastante
claro que no sólo con rigor metodológico se iban a solucionar los serios problemas
de utilidad que amenazaban el crecimiento y consolidación definitiva del área (Pat-
ton, 1984). Las críticas no tardaron en aparecer y cada vez más autores se revelaban
contra un modelo que en la práctica de la evaluación de programas sociales resultaba
inviable. La base para tal afirmación la constituyen las características presentes en la
mayoría de los programas sociales; éstas son la complejidad de los tratamientos, el
alto grado de indefinición de los mismos y la falta de datos que reflejen el “compor-
tamiento” de las variables relevantes durante los procesos que tienen lugar en el de-
sarrollo de los programas.
En la necesidad de realizar intervenciones evaluadoras se encuentra una parte
importante de nuestra red de servicios sociales. La consecuencia de esta situación es
la demanda creciente de modelos de intervención que permitan ir tomando decisio-
nes respecto al tipo y alcance de las evaluaciones a realizar durante los diferentes mo-
mentos y fases a tener en cuenta en un proceso complejo, como es la planificación,
puesta en práctica y posterior evaluación de un programa. Quizás, en esta situación,
el riesgo más importante que corre el área de evaluación de programas es el escaso ri-
gor con el que a veces se utiliza la palabra evaluación. Con el término evaluación se
definen, a veces, actividades que ni por sus objetivos (mejora de programas y de las
condiciones de información en las que se toman las decisiones), ni por el rigor de sus
procedimientos (recogida sistemática de información sobre un amplio conjunto de
circunstancias), ni por el uso inadecuado de sus resultados (por gente indicada), nada
tienen que ver con la auténtica evaluación de un programa. No obstante, es necesario
manifestar que la aplicación del rango de evaluación a investigaciones evaluadoras
dependerá de multitud de variables y factores imposibles de determinar a priori. So-
lamente, tras la evaluación de la evaluación, es decir, mediante la metaevaluación po-
dremos decidir si el conjunto de decisiones, actividades, datos y resultados obteni-
dos en una investigación puede ser aceptado como evaluación de un programa. En
este capítulo no se aborda el tema del análisis de necesidades, previo al diseño y
puesta en práctica de un programa de intervención; se asume que han sido procesos
correctos desde un punto de vista metodológico y técnico, los que justifican la perti-
Evaluación de programas 1035
nencia de un programa de intervención, bien de carácter preventivo, bien de carácter

asistencial, destinado a cubrir un estado de necesidad contrastado.
Del conjunto de componentes, procedimientos y mecanismos de supervisión y
control, aplicables a cada uno de los tres niveles potencialmente evaluables que Her-
nández (1996) establece (político y de gestión —primer nivel—, de gestión y técnico
—segundo nivel—, y técnico y profesional —tercer nivel—), en este capítulo vamos
a intentar describir, sin pretender ser exhaustivos, aquellos componentes y activida-
des correspondientes al tercer nivel de evaluación, por considerarlo el más genuino a
la evaluación de programas; es decir, el que baraja unidades estructurales y funciona-
les más acorde con los contenidos y objetos de intervención tradicionalmente inclui-
dos en la evaluación de programas.
UI. DETERMINACIÓN DEL TIPO Y ALCANCE DE LA EVALUACIÓN
La mejor forma de evitar futuros problemas en el desarrollo de una evaluación es

disponer de un buen conocimiento sobre evaluación de programas o, en su defecto,
de profesionales a los que acudir en caso de necesidad. Esto es debido a la interrela-
ción entre las distintas fases y componentes del proceso de evaluación, especialmen-
te hasta el momento de elegir el tipo y alcance de la evaluación a realizar, lo cual obli-
ga a la anticipación constante de posibles variables que puedan limitar el desarrollo
de fases posteriores a la que nos encontramos. Pero antes de entrar a detallar qué ha-
cer en cada uno de los tres momentos que engloba una evaluación, es decir, su plani-
ficación, su realización y su evaluación (metaevaluación), hagamos referencia a algu-
nos aspectos clave para el desarrollo posterior del proceso de evaluación.
1.1. Determinar el papel del evaluador

En los primeros compases del diseño de la evaluación es importante determinar cuál
va a ser la función del evaluador durante la investigación, puesto que ello va a condi-
cionar la calidad y cantidad de relaciones personales y profesionales que se generen
entre el evaluador y los miembros del programa (responsables, usuarios, agentes,
etc.). En función de que el evaluador sea alguien externo o interno a la organización
va a estar presente una serie de ventajas e inconvenientes asociadas a cada condición.
Lo ideal sería poder combinar las ventajas de la evaluación externa con las ventajas
de la evaluación interna, pero a veces ello no es posible. En este tema, quizás más que
en ningún otro, no es conveniente ofrecer una pauta general a seguir. No obstante, es
recomendable dejar perfectamente claro cuáles son los acuerdos en relación a los ob-
jetivos de la evaluación, los métodos a seguir, los recursos necesarios y las responsa-
bilidades de cada cual antes, durante y tras el proceso de evaluación. Esto resulta es-
pecialmente importante respecto a cuestiones relativas al uso que se hará de la
información obtenida.
12. Planificación de la evaluación

Evaluar un programa es como armar un rompecabezas, da igual la pieza por la que se
comience, lo importante es el rompecabezas completo. Sin embargo, en rompecabe-
zas de cierta dificultad, se suele comenzar combinando las piezas de los extremos en
primer lugar, para después ir completándolo hacia el centro. En evaluación de pro-
gramas las dificultades suelen estar referidas al tiempo y al dinero necesarios para rea-
lizar la evaluación, y siguiendo el símil, las piezas de los extremos pueden ser averi-
guar si se trata de un programa nuevo o bien está ya en funcionamiento. Plantearse
esta cuestión parece de perogrullo, pero no es así, estar ante un tipo de programa u
otro implica objetivos y actividades diferentes para el evaluador.
113. Aspectos teóricos

113.1. Planteamiento de objetivos operativos
En el primer caso, es decir, si estamos ante un programa aún por poner en práctica,
nuestro objetivo como evaluadores será dotar al programa de aquellos rasgos que
permitan su evaluación posterior, tanto de su cobertura, como de los procesos impli-
cados, de sus resultados o incluso de la relación coste-efectividad. Para ello, debe-
mos, en primer lugar, incorporar al programa objetivos que se puedan evaluar, es de-
cir, que deberán redactarse en términos de acciones, productos o cifras a alcanzar en
un período de tiempo limitado y en unas condiciones concretas. Para ello se especifi-
carán las acciones que se esperan que los sujetos realicen mediante la utilización de
verbos que expresen acción y que permitan operativizar (contar) las veces en que esa
conducta o condición se da. A continuación es necesario determinar la condición o
situación en la que se tiene que producir esa conducta objetivo. Y, por último, se
debe especificar el criterio que se adoptará para considerar que el objetivo se ha con-
seguido; es decir, cómo de bien ha de ejecutarse la conducta para aceptar que el obje-
tivo se alcanzó. Por ejemplo, si en lugar de expresar como objetivo “mejorar el nivel
de uso de materiales de educación para la salud en las escuelas” decimos “incremen-
tar en un 20% el número de consultas (de material sobre educación para la salud) en
las bibliotecas de los colegios del distrito norte de Granada en los próximos seis me-
ses” estamos asegurando que trabajamos con objetivos que podremos evaluar. Sin
embargo, la situación más frecuente en programas de intervención social es la de uti-
lizar objetivos imprecisos respecto a los resultados que se espera conseguir, es decir,
que no se especifiquen ni las acciones, ni las condiciones, ni el criterio a seguir, lo cual
dificulta seriamente su evaluación. En algunas ocasiones, es el desconocimiento de
tipo técnico de estas cuestiones por parte de los profesionales lo que explica esta cir-
cunstancia. En otras ocasiones esa ambigúedad calculada responde al cruce de inte-
reses, fundamentalmente políticos, a los que algunos programas de carácter social
suelen servir.
1132. Elaboración de un modelo de impacto (intervención)

El siguiente paso a seguir es dotár al programa de lo que se denomina un modelo de
impacto o modelo de intervención, el cual hace referencia al conjunto de ideas sub-
yacentes a cómo el problema se generó y se está manteniendo (Rossi y Freeman,
1993). Esas ideas se organizan en torno a tres hipótesis: una hipótesis causal, una hi-
pótesis de intervención y otra hipótesis de acción.
Con la hipótesis causal se hace referencia a los factores o procesos determinantes
de la conducta o condición que el programa pretende modificar. Mediante la hipóte-
sis de intervención se especifica la relación entre lo que se va a hacer en el programa y
los procesos o determinantes especificados en la hipótesis causal. Por último, con la
hipótesis de acción se pretende asegurar que los cambios producidos en los factores
o procesos identificados en la hipótesis causal tienen lugar en las mismas condiciones
que se dan cuando esos cambios ocurren de una forma natural.
La condición necesaria que han de satisfacer, para su selección, las variables y re-
laciones objeto de la evaluación en cada una de las hipótesis anteriormente descritas
es que se puedan manipular. Como fuentes de hipótesis se pueden utilizar desde la
bibliografía al uso hasta el propio metaanálisis, pasando por los propios usuarios.
113.3. Definición de la población objetivo

El siguiente eslabón de este proceso consiste en definir la población objetivo de una
forma exhaustiva, que aleje las dos fuentes de sesgos más importantes en este mo-
mento: incluir sujetos en la población objetivo pertenecientes a otras poblaciones no
objeto de nuestra intervención, o bien lo contrario, que sujetos posibles beneficia-
rios de la intervención queden excluidos de la misma. Sobra advertir acerca de los
perniciosos efectos que puede tener para nuestro programa no aislar conveniente-
mente ambas amenazas. La forma más directa de comprobar o no la presencia de
estos efectos negativos puede ser a través de la realización de una evaluación de la co-
bertura del programa, por ejemplo. Desde nuestra experiencia recomendamos de-
terminar la situación de los programas a este respecto, independientemente del tipo
de evaluación que posteriormente se haya elegido llevar a cabo, ya que los proble-
mas de sobreinclusión o infrainclusión de sujetos en la población objetivo suelen es-
tar en la base de muchos otros problemas presentes en el desarrollo de un programa.
113.4. Maximización del rango de experimentalidad del diseño

Con el objetivo de que el diseño de evaluación que posteriormente utilicemos se
aproxime al diseño ideal de cualquier investigación evaluadora, intentaremos garan-
tizar, hasta donde sea posible, la presencia de los cinco elementos que caracterizan
un auténtico diseño experimental:
a. Aplicar el programa a una muestra representativa de la población objetivo.

b. Disponer de una o más medidas pretest.
c. Establecer uno o más grupos control no expuestos al tratamiento.

d. Asignar de una forma aleatoria los sujetos de la muestra al grupo control o
experimental.
e. Disponer de una o más medidas postest para evaluar los efectos de la inter-
vención.
Todos los elementos recogidos en los cinco puntos anteriores son importantes
de cara a disponer de un auténtico diseño experimental. Sin embargo, la realidad nos
dice que en la mayoría de las situaciones aplicadas no sólo no se dan todas las condi-
ciones, sino que tampoco lo hacen en la forma más adecuada, por lo que el grado de
experimentalidad del diseño elegido varía en función de cuántos de esos elementos
estén presentes y también de cómo se combinen entre sí. Las variables que a la postre
amenazan a la validez interna y externa del diseño elegido se distribuyen entre los
cinco elementos mencionados antes, en interacción con el tipo de programa objeto
de la evaluación. Por ejemplo, si estamos tratando de evaluar el impacto de un pro-
grama de prevención del consumo de tabaco mediante una campaña publicitaria en
medios de comunicación es difícil garantizar la neutralidad de las condiciones en las
que los sujetos del grupo control recibirán un tratamiento neutro, ya que los mensa-
jes contra el consumo de tabaco están presentes a través de distintos medios de co-
municación, en distintos ámbitos, lugares, etcétera.
113.5. Especificación del sistema de implantación

Los siguientes esfuerzos han de concentrarse en el diseño de un sistema de puesta en |
práctica del programa que reduzca al mínimo lo que algunos autores han llamado el
“margen de reinvención” (Anguera, 1990) con el que el programa se pone en prácti-
ca respecto a cómo se diseñó en la teoría. Mediante esta tarea se determina el grado
de definición estructural del programa en cuanto a la especificación pormenorizada
de las unidades, personas y momentos en que han de implantarse cada una de las ac-
ciones anteriormente identificadas (Hernández, 1996). A veces se realizan evaluacio-
nes cuyos resultados son la confirmación de que un programa ha funcionado; no
obstante, este dato carece de relevancia de cara a repetir el programa si no estamos en
condiciones de identificar qué es lo que ha permitido al programa funcionar, es decir,
qué variables del proceso han contribuido en mayor medida a alcanzar sus objetivos
en un grado u otro. Para poner la evaluación de nuestro programa a salvo de tales pe-
ligros lo mejor es diseñar un sistema de puesta en práctica, o sea, de implantación,
que ponga en conexión los procedimientos (instrumentos, materiales y frecuencia
de uso) con los objetivos. No obstante, lo más probable es que el proceso de implan-
tación no siga un desarrollo lineal y ajustado a lo previsto, ya que no podemos olvi-
dar que (y especialmente en servicios sociales) trabajamos con poblaciones de huma-
nos y profesionales, los cuales gozan generalmente de un alto grado de discreción y
autonomía en sus prácticas.
Otra forma, complementaria de la anterior, de evitar problemas relacionados
con este “desvío” consiste en incorporar algún procedimiento que permita ir regis-
trando las posibles desviaciones que se puedan ir produciendo respecto al diseño ini-
cialmente previsto; especialmente de aquellas características o componentes del pro-

grama más susceptibles a esas desviaciones. Una fuente de información importante a
tener en cuenta para cubrir este objetivo pueden ser los propios responsables del
programa o aquellos que lo ponen en práctica, al tener un contacto directo con tales
procesos. También podemos acudir a la propia planificación del programa, la cual,
en caso de estar realizada de una forma adecuada, deberá de tener en cuenta cuestio-
nes de esta índole. Con todo ello, estamos en disposición, en caso de necesitarlo, de
proporcionar información clara y precisa sobre la aportación de las distintas varia-
bles presentes durante el proceso de implantación del programa a los resultados fi-
nalmente obtenidos.
Elegir los métodos con los que vamos a recoger los datos correspondientes a esa
implantación es el siguiente paso. Éstos pueden ser los propios registros del progra-
ma, autoinformes, o bien realizar observaciones. La utilización de métodos de reco-
gida de datos complementarios a los previstos en el programa dependerá, obviamen-
te, de la fiabilidad y validez de los del propio programa. La tarea siguiente será la de
muestrear la recogida de datos respecto a dónde mirar, a quién observar o preguntar
y, por último, a cuándo se realizará la recogida de datos. A modo de conclusión, de-
cir que la necesidad de realizar metaevaluaciones sobre el plan de supervisión diseña-
do es inversamente proporcional a la simplicidad, transparencia y eficacia del plan de
implantación diseñado por un lado, y a su grado de seguimiento por otro.
Para finalizar, es recomendable poner en práctica en forma de estudio piloto o a
escala reducida el programa en cuestión, con lo que podremos apreciar y corregir, en
caso de que se produzcan, posibles dificultades que afecten negativamente a la cali-
dad de nuestro programa. Es mejor corregir dificultades antes de la puesta en fun-
cionamiento del programa, que cuando el programa se haya lanzado y no sólo parte
del presupuesto se haya malgastado, sino también sea más difícil introducir esos
cambios o mejoras.
Nos hemos extendido en este apartado, referido a las aportaciones más impor-
tantes que la evaluación tiene que hacer a los programas cuando se encuentran en su
fase de planificación, porque, y de acuerdo con Wholey (1979), constituye el mo-
mento crítico en el que la evaluación de programas puede hacer su aportación más
valiosa.
114. Aspectos prácticos

114.1. Variables relevantes a la toma de decisiones
La realidad presente en la mayoría de los programas es la ausencia, a los niveles nece-

sarios, de los rasgos identificados anteriormente como relevantes a las posibilidades
de llevar a cabo investigaciones evaluadoras potentes. De ahí que en el siguiente su-
puesto, es decir, si el programa a evaluar ya está establecido, no sólo la forma de pro-
ceder va a ser otra, sino que también se va a ver limitada, probablemente, nuestra
ambición por alcanzar resultados concluyentes. a
Mientras que en el caso anterior de programas en proceso de planificación, la
aportación fundamental de la evaluación consistía en dotar al programa de aquellas
características que permitiesen a cualquier evaluador llevar a cabo los distintos tipos
de evaluaciones posibles, en esta situación los objetivos de la evaluación, en un pri-
mer momento, han de dirigirse a determinar cuál, de entre los posibles tipos de eva-
luación, es la más idónea en función de la interrelación de los siguientes grupos de
variables:
a. Elpropósito de la evaluación en función de los intereses y prioridades de los

responsables del programa.
Los medios económicos disponibles.
La disponibilidad de los agentes del programa (no sólo de los responsables).
y Las características del programa respecto a variables relacionadas con la
ap
operatividad con que los objetivos están definidos, modelo de intervención
(impacto) desarrollado, magnitud y distribución de la población objetivo,
grado de detalle y concreción con que cuenta el sistema de puesta en práctica
planificado, disponibilidad de datos respecto a posibles desviaciones del sis-
tema de puesta en práctica inicialmente previsto, y fiabilidad y validez de los
datos que reflejan el comportamiento de las variables implicadas en los pro-
cesos anteriores (Arco, 1997).
114.2. Decidir qué evaluación aplicar

La estrategia más efectiva antes de iniciar el proceso de estimación del tipo y alcance
de la evaluación a realizar y, por tanto, determinar el valor y peso de cada uno de los
grupos de variables anteriores en la decisión final es obtener tanta información del
programa como sea posible; casi de una forma indiscriminada. En cualquier caso,
nos aseguraremos de recoger toda la información disponible, tanto de las cuestiones
específicas mencionadas anteriormente (modelo teórico de partida, población obje-
tivo, modelo de intervención, sistema de implantación, precisión y seguimiento del
sistema de supervisión de los procesos anteriores, y fiabilidad y validez de los datos
recogidos) como de cuestiones generales (contexto, historia, orígenes, justificación,
personal del programa, presupuesto y cuestiones administrativas), normalmente
predictores válidos de la situación que a nivel de planificación, respaldo político, me-
dios, etc. encontraremos más adelante al evaluar el programa.
Aunque sí parecen estar sistematizadas las distintas variables relevantes al proce-
so de evaluación en programas ya establecidos, las decisiones en torno a qué factores
han de prevalecer en las situaciones reales donde se plantean esas evaluaciones es más
complicado. Ello es debido a que normalmente los programas no fallan en conseguir
sus objetivos por una única razón; por ejemplo, que no se defina con precisión la po-
blación objetivo a la que va destinado el programa, o bien que no se disponga de los
materiales o instrumentos necesarios para desarrollar las actividades que contempla
el programa, o bien que la puesta en práctica del programa no coincida con lo plan-
teado, etc. La bibliografía sobre evaluación de programas ha sistematizado las razo-
nes por las que los programas no consiguen alcanzar sus objetivos en torno a tres
grupos de variables: conceptuación del problema desde un modelo teórico inapro-
prado, una pobre implantación y una pobre evaluación (Arco, 1997).
Antes de entrar a determinar las razones específicas por las que eso ocurre es ne-
cesario preparar una descripción del programa que nos aporte una idea, lo más pre-
cisa posible, de todo lo que ocurre en el programa, desde el principio hasta el final.
Para ello, podemos acudir tanto a la información que el programa va acumulando
para su control y seguimiento interno, como a posibles informes o evaluaciones pro-
cedentes de agencias u organismos externos, o bien acudir a entrevistar al personal
del programa para confirmar por ejemplo la precisión de la información recogida en
los informes o memorias de los programas. En cualquier caso hemos de tomar cuan-
tas iniciativas se consideren necesarias para acceder a la información, fases y compo-
nentes del programa a analizar.
El resultado final de este proceso ha de ser un modelo de evaluación del progra-
ma no sólo susceptible de ser llevado a la práctica, sino también que satisfaga las ne-
cesidades de aquellos que financian, respaldan o participan activamente en la evalua-
ción. Quizás sea éste el extremo que diferencia, tal y como formula Patton (1986), a
la evaluación de la investigación básica. En este momento es cuando se han de tomar
las decisiones más importantes respecto al tipo de evaluación a desarrollar, alcance
de la misma, y especialmente los esfuerzos requeridos al personal del programa para
mejorar aquellos componentes del programa que no permiten por distintos motivos
(falta de registros de los procesos, insuficiente definición de los tratamientos, etc.)
llevar a cabo investigaciones evaluadoras más potentes. Veamos esto que acabamos
de decir en un ejemplo. Supongamos que nos piden evaluar un programa de carácter
asistencial, y tras analizar tanto las características del programa (por ejemplo, objet1-
vos, modelo de intervención y sistema de puesta en práctica) como los intereses de la
audiencia principal (por ejemplo, responsables del programa) concluimos que el tipo
de evaluación más idónea es una evaluación de los procesos implicados en el progra-
ma frente a la alternativa de una evaluación del impacto que ese programa ha tenido
sobre la población objetivo. En este caso, tenemos que tener en cuenta el riesgo de
llevar a cabo evaluaciones de los procesos que tengan lugar en el programa, ya que
por ejemplo, puede que podamos determinar la fidelidad de su implantación, res-
pecto al diseño inicialmente previsto en la planificación, pero no poder determinar
su idoneidad, si no disponemos de los resultados sobre cuál es el impacto real del
programa (Rossi y Freeman, 1993). Sin embargo, y de acuerdo con la obra citada de
estos dos autores, para poder disponer de datos sobre el impacto real del programa
es necesario primero disponer de los datos sobre los procesos reales del programa, es
decir, un conocimiento detallado de los procesos subyacentes a ese programa, lo cual
a su vez depende de que se haya dispuesto o no de un sistema para registrar los datos
procedentes de la supervisión llevada a cabo de los distintos componentes del pro-
grama.
MI. CONCLUSIONES
Las necesidades de evaluación que se pueden plantear en programas ya establecidos

varían en función de la voluntad política, los medios económicos, la prioridad en las
necesidades y las características del programa en los planos organizacional y meto-
dológico. Asimismo, los distintos objetivos de la evaluación pueden plasmarse, por

ejemplo, en estudios acerca de la cobertura del programa, es decir, si elprograma está
llegando en la misma proporción a todos los miembros de la población objetivo o,
por el contrario, subgrupos de esa población están siendo favorecidos por eltrata-
miento en mayor medida que otros; o bien si todos los sujetos de la población obje-
tivo definida tienen las mismas posibilidades de acceso al tratamiento, en cuyo caso
estaríamos aplicando estudios sobre el sistema de puesta en práctica o implantación,
es decir, las llamadas evaluaciones de procesos; o bien estudios dirigidos a determi-
nar qué proporción del cambio experimentado por la población objetivo, si es el
caso, se debe exclusivamente al tratamiento recibido, en este caso estaríamos reali-
zando estudios de impacto; o bien estudios destinados a determinar la eficacia de un
programa en alcanzar los objetivos marcados en relación a lo que ha costado conse-
guirlos, es decir, estudios de coste-efectividad. Otras posibilidades, como son los es-
tudios de coste-beneficio, o estudios destinados a clarificar la situación fiscal o legal
de los programas son mucho menos frecuentes en la literatura referida como evalua-
ción de programas. Y ello es debido, en el caso de los estudios coste-beneficio, a las
dificultades que plantea reducir a un valor monetario algunos de los objetivos o con-
diciones que esos programas pretenden alcanzar. Por ejemplo, ¿cómo se puede cal-
cular el valor monetario de que los niños lean más libros o consuman menos chuche-
rías, o que los adultos hagan más ejercicio?
Dentro de esta modalidad de evaluación referida a programas ya establecidos,
existen algunos casos en los que los objetivos de la evaluación puede que estén refe-
ridos a reformar determinados aspectos del programa ya en funcionamiento, pero
sin modificar el núcleo central constituido por el modelo de impacto. En estos casos,
los esfuerzos se dirigen por ejemplo a modificar la fundamentación teórica sobre la
que descansa el programa, o bien a centrar la atención en otros componentes que
normalmente acompañen a los objetivos y resultados de los programas, y suelen es-
tar motivados por la insatisfacción de los agentes y responsables de los programas
con la eficacia y/o eficiencia del programa puesta de manifiesto de forma reiterada
por sucesivas evaluaciones de resultados, procesos u otras. En el fondo, los diseños
de evaluaciones destinadas a programas ya establecidos o evaluaciones de programas
nuevos comparten gran parte del proceso y actividades implicadas en sus objetivos
(Rossi y Freeman, 1993).
Lo ideal es ajustar el tipo y alcance de la evaluación a la situación de “madurez”
en que se encuentra el programa (Vedung, 1995). No obstante, las condiciones de ur-
gencia y presión por los resultados, que rodean el inicio de algunas evaluaciones, res-
tringen, notablemente, el tipo y alcance de la evaluación que finalmente se lleva a
cabo. En estos casos es responsabilidad del evaluador anticipar a los responsables de
esa situación las consecuencias perniciosas que puede tener para el programa y, por
tanto, para los agentes y los usuarios un énfasis excesivo sobre la necesidad de poder
hacer inferencias causales a partir de la evaluación realizada, lo cual a veces precipita
el uso de evaluaciones “duras”, experimentales, primando aspectos como la fiabili-
dad del estudio en detrimento de evaluaciones más de carácter formativo, en donde
se priman aspectos de utilidad y generalización de los resultados. Ésta es una situa-
ción de constante amenaza para el presente y futuro del área, ya que la mayoría de
los programas ni son simples, ni los tratamientos están lo suficientemente definidos,
ni existe un trabajo prolijo de seguimiento del programa por parte de los agentes y
responsables de los mismos; condiciones éstas, tal y como veíamos anteriormente,
vitales para garantizar una evaluación con los niveles de fiabilidad y validez desea-
bles. En la figura 41.1 se puede apreciar de forma resumida y ordenada el conjunto
de elementos y componentes a tener en cuenta durante esta primera fase.
IV. ELECCIÓN DE MÉTODOS Y TÉCNICAS
Iv.1. En la evaluación de procesos

La elección de métodos, técnicas e instrumentos de recogida de datos está ligada al
tipo de evaluación que se va a realizar. Si optamos por una evaluación de procesos, lo
más probable es que se utilicen fundamentalmente métodos cualitativos para la ob-
tención de datos, lo cual no excluye el uso de datos cuantitativos, cuestión ésta que
suele confundirse con relativa frecuencia. Puesto que en evaluación de programas se
otorga prioridad a la identificación y priorización de tareas relevantes al tipo de eva-
luación a desarrollar, es precisamente el tipo de tarea de evaluación que vamos a rea-
lizar lo que determina la técnica a utilizar y la fuente de información más idónea para
esa tarea. No obstante, el rasgo más relevante en evaluación de programas, con res-
pecto a la utilización de técnicas, fuentes de información y tareas a realizar es la esca-
sa especificidad de su uso; es decir, que tanto la entrevista, como la encuesta, como
los cuestionarios, por ejemplo, se suelen utilizar para multitud de tareas durante la
evaluación (análisis de necesidades, de objetivos, de procesos, de resultados, etc.), y
éstos pueden ser aplicados a distintos miembros del programa (responsables, usua-
rios, agentes, etc.) en función de las necesidades. Quizás el principio que ha de guiar
nuestro trabajo en esta fase sea el de ir a buscar el dato allí donde esté. De este modo,
optimizar el uso de métodos, técnicas e instrumentos depende, en gran medida, de la
capacidad del evaluador para identificar y comprobar relaciones entre fases del pro-
grama, elementos del programa y conductas de los implicados (Arco, 1997).
1v2. En la evaluación de impacto

Si, por el contrario, nuestra opción consiste en realizar una evaluación de Impacto,
aunque tendremos que dilucidar igualmente qué instrumentos son los más indica-
dos para recoger los datos relevantes a los objetivos de muestra evaluación, la dife-
rencia fundamental radica en que hemos de seleccionar el tipo de diseño de investi-
gación en el que apoyaremos nuestra evaluación. De este modo, a continuación, una
vez administrados los instrumentos seleccionados de recogida de datos, obtener esos
datos y proceder a su comparación y análisis, estar en condiciones de extraer conclu-
siones sobre la eficacia o no del tratamiento que aplica el programa.
El grado de certeza con el que se podrán extraer conclusiones sobre los efectos
del programa está ligado obviamente al grado de experimentalidad del diseño utili-
zado; éste depende a su vez de:
VANDIA
*T"Tp ISP“Y APUIUMLILIO(T
od4 9IUPID
9p 2] UNIDPN]PAD
1044
NOISID3a
30 avavoOJ4 OSI008d
30 NO/993
EVZIIV38
YNA VUNIXYIN NOIOVINEOW3NI
13013
NO/OVANI
130 LS3 Odil
A JONVITV
NOIOVNIVA3 130 VNV4DO484 OdIL30 NOI9OVATIVA3 30 V1 NOIOVNIWA3
seunuialag
¡9 sauonsano sajelsusf
9/q0s VIVA
18 "SI Vanl43go0o9—
ousodoJd
ap e] ja :euelBold 'o]xajuoo pejunjopeomod
— SOSIIOQUIÍ—
uOIden|ena erJo]sIy
Á 'sausBllo SOIPAN— SO9ILUQUODA -9U/3)(Gujun
u9roeonsní'sonelgo pepilo1J
ua se¿— OLOVINI—
sepepIsaoau
¡euosjed
lap “ewelBold opejs3—
ep ewelbold /AVAINILOI4I-I1
sisipeuy
ap Se| uoSejgod 'ontalgo OlO|43N39
SA|ARIEA
[99 ojsandnseaJld
Á seuoljsans
:0]x8]UOO "SEAIJe1IsIUILUpe
seuo!seno
:S9|euoldezIuebo uoOloeou
ap ep|
sold
Á
sen!jezlueBbliO—
sIUILupSA
y— senuooesred
¡a odh ap
Sseoluouos3—
SeompoJd— seAmeJod10)— uorcenjena epiBaja
seyeuolduny—
ja
saje1nog—
ep
9/gqos
seuonsan7)
Á
uoIsinay
ap sonelq
Á o
ep
seo,oedse
ope1lb
seoBojopojaul
:ewelBold
osodoJ
ap e|d
J8yulleg
¡o1 ¡ap sonelgo— son!elado
uordenjena
epiBaja
e] ap
oJepoyy— uOI9uanJaju!
ep euagold
uoroIUIJap
'uorouanajul
Jopen¡ena
eua]sis
ojaepou 'onnelgo
u0!98zIjesoduwa] eua]sig— ejsand
ue eonogid
ejsand
a
seuolsan;) uorde¡god
eonoe1d
g— ue ap uOIsIMadns
pepiiqel4
Á —
zapIreaSOJEp
sa|qiuodsip
jap ue '"sopepini]08)
José L. Arco, Gualberto Buela-Casal y Fernando Justicia
El grado de representatividad de la muestra.

La disponibilidad de una o más medidas pretest.
Disponibilidad de uno o más grupos control no expuestos al tratamiento.
PA
LO Asignar de una forma aleatoria los sujetos de la muestra al grupo control o
experimental.
e. Disponer de una o más medidas postest para evaluar los efectos de la inter-
vención (Buela-Casal y Arco, 1998).
En este marco se sitúan las llamadas evaluaciones ex ante en las que los evaluado-
res pueden planificar cómo se van a seleccionar los grupos control o comparación
previamente a la implantación del programa y por supuesto a su evaluación, aunque
sin poder asignar aleatoriamente a los sujetos a uno u otro grupo, es decir, que traba-
jamos con diseños cuasi-experimentales. Sin embargo, tal y como veíamos anterior-
mente, las características presentes en la mayoría de los programas no satisfacen lo
que la teoría establece como condiciones ideales para un diseño experimental, ni se
han incorporado los prerrequisitos de la evaluación en la fase de planificación del
programa. Al contrario, la circunstancia más frecuente que se plantea a la hora de lle-
var a cabo la evaluación de un programa, es que ésta no fue prevista durante la fase de
planificación (o lo fue de una forma incompleta), con lo que en la mayor parte de las
ocasiones nos veremos obligados a realizar evaluaciones de las llamadas ex post. La
principal implicación de esta circunstancia es que no se dispone de grupos control
con los que comparar los resultados obtenidos en el grupo que ha recibido el trata-
miento o programa, con lo cual hay que “construir” los grupos control una vez que
el programa está en funcionamiento o incluso ha finalizado.
Esta circunstancia es especialmente amenazante para aquellos programas deno-
minados de cobertura total, es decir, que ningún miembro de la población objetivo
ha escapado al tratamiento, por lo que no se dispone de sujetos para construir el gru-
po control. En estos casos, la construcción del grupo control se realiza mediante
procedimientos que podríamos llamar de “baja exigencia”, con lo que la validez y
fiabilidad de las conclusiones quedan seriamente reducidas. Entre otros procedi-
mientos tenemos los controles reflexivos, análisis de series temporales, medidas pre-
post, etc. En realidad, en estos casos no existe un grupo control auténtico, sino que el
grupo que recibe el tratamiento hace de grupo control, mediante el registro de medi-
das pre antes de aplicar el tratamiento y de grupo experimental, mediante el registro
de medidas post, tras aplicarle el tratamiento. Si, por el contrario, la cobertura del
programa es parcial, es decir, que en el momento de plantear la evaluación aún hay
sujetos pertenecientes a la población objetivo que no han estado expuestos al trata-
miento que facilita el programa, el rango de métodos de construcción de grupos
control es mayor. Es decir, que se dispone de más opciones a nivel metodológico,
con las que mejorar el grado de experimentalidad del diseño obtenido y por tanto in-
crementar el grado de certeza con el que se podrán plantear las conclusiones sobre
los efectos del programa.
Los procedimientos que se utilizan para la construcción de grupos control están
en función de que la evaluación sea del tipo ex ante o ex post. En el primer caso, por
ejemplo, si la asignación de los sujetos a los grupos control o experimental es aleato-
ria disponemos de los procedimientos estadísticos simples y complejos que la bi-
bliografía al uso pone a nuestra disposición para garantizar la equivalencia entre los
grupos control y experimental. Si, por el contrario, tenemos una de las evaluaciones
llamada ex post, los procedimientos estadísticos de construcción de grupos control
se hacen más complejos: análisis de regresión, controles genéricos, encuestas cross-
seccionales, etc. Para un análisis de las implicaciones que para el área de evaluación de
programas ha tenido la incorporación de los diseños de grupos a la investigación
evaluadora puede acudirse a Buela-Casal y Arco (1998). En la figura 41.2. se puede
apreciar de forma resumida y ordenada el conjunto de elementos y componentes a
tener en cuenta durante esta segunda fase.
V. PLANIFICACIÓN TEMPORAL
La temporalización del proceso de evaluación consiste en asignar unos plazos de

tiempo limitados a las distintas fases y componentes a lo largo de los cuales la evalua-
ción se va a desplegar. Este componente del proceso juega un papel muy importante
dentro de la planificación, ya que nos va a permitir, entre otras cosas, comprobar el
grado de precisión con el que el evaluador por ejemplo ha previsto lo imprevisible;
es decir, el grado en que el evaluador ha sabido identificar y conceder el tiempo nece-
sario a cada fase del proceso para solucionar las distintas demandas (previstas e 1m-
previstas) que la evaluación podía plantear. Por tanto, se trata de un índice importan-
te del grado de conocimiento y dominio del evaluador sobre las distintas fases y
componentes que implica la evaluación de un programa. No obstante, hay que seña-
lar que si estamos ante una evaluación a gran escala de un programa como, por ejem-
plo, cobertura, procesos e impacto, el margen de error en los plazos de tiempo atri-
buidos a las distintas actividades a realizar puede ser mayor. Esto suele ocurrir en
mayor medida cuando la participación en el proceso de la evaluación del programa,
por parte de los agentes o usuarios del mismo, se hace por ejemplo sobre la base del
voluntarismo (Arco, 1997).
Es importante mencionar una cuestión relacionada con este tema. Como se
ha dicho anteriormente, la mayor parte de los programas en servicios sociales
(educación, salud, etc.) son programas complejos en sus objetivos, modelos de
intervención y sistemas de implantación; esto hace que las necesidades de infor-
mación de los programas, y por tanto de sus evaluaciones, sean también com-
plejas y alcanzables sólo mediante planes de investigación a desarrollar en años
sucesivos, lo cual compite en muchas ocasiones con la urgencia de resultados a
corto plazo que mueve las decisiones sobre evaluación de programas a nivel
político.
VI. PUESTA EN PRÁCTICA DEL PLAN DE EVALUACIÓN
A medida que se avanza en el proceso de desarrollo del plan de evaluación diseña-

do mayor es el grado de conocimiento e información con que el evaluador cuenta
1047
SINOIOVIMIdNI
SsIsIpeue
ap UO/9ezI|eal
ap odula| “g
sopezI|1n sojuauun11sul o91081d ¡anu y—
SO| 9P ZAPIJEA o91Bojopojau ¡anu y—
epibooal
soyep
Ssauo/oe nas qo— Á pepIqel ey uezeusule 091/09] [anu y—

anb saqelen se]
odual]
SauJojuloIny— -UOISRONNSAP
op
euwelbold Jap soido1J— ap sisijgue Á UO1De o nuap]

ap
“y
:SOJep ap epiboday
sojuavn1]sul
u019ezInn
UOIDBJOQB|3
o10|1d
OMPeneno—
¡euo¡9e¡aJJo9—
08]sanu ap
3p Á
VINVE4DONOYO ¡ejuauedxa-senog—
JeJoqel3 elSoye]se Je/0qe|3 ¡ejuawladx3—
30 NOIOVA
Md ON3SIO
IVA
SOLWO 30 VAIDODIS
Evaluación de programas
SOLVWO 30 SISIIYNV
aliSada
NOIOVZIVEOdAN31 A VdAIDODI8 30 30 SOLNINAELSNI
NV ld 4V4O4V13 A'SOCOLAIALSOS a JS Ta
sul a sopojau 9p Uu01999]] «JISPYT
UOIPAIPAOS 9p SoJugun “ETp VIADIA
respecto a la idoneidad de la evaluación elegida y la forma de llevarla a la práctica y,

por tanto, se hacen menos necesarias pautas de tipo general. La necesidad de super-
visión de la puesta en práctica de la evaluación diseñada guarda lógicamente una re-
lación inversa con la fiabilidad y validez con la que el proceso se ha diseñado y so-
bre todo se ha seguido. De todas formas, no conviene bajar la guardia en este
aspecto y estar siempre pendientes de posibles indicadores que nos alerten sobre la
presencia de variables que pudieran dar lugar a que los llamados efectos no desea-
dos del tratamiento, esto es tratamiento incompleto, tratamiento distinto y trata-
miento equivocado (Klitzner, 1990), se mezclen con nuestros datos. Para conseguir
este objetivo la investigación ha incorporado la metaevaluación como método y es-
trategia de seguimiento y control del proceso de evaluación seguido. La metaeva-
luación consiste en supervisar el propio proceso seguido durante la planificación,
puesta en práctica y evaluación del programa con el fin de detectar aquellas posi-
bles variables que pudieran afectar negativa o positivamente a la calidad de la eva-
luación realizada.
VII. ELABORACIÓN DEL INFORME
A este apartado quedan reservadas la conclusiones que hemos obtenido y su discu-

sión después de seguir todo el proceso de evaluación descrito. Si es necesario, el
informe puede incluir un repaso a los principales componentes y momentos del
proceso seguido, si con ello mejoramos la comprensión de los resultados y conclu-
siones. No obstante, es conveniente la brevedad y especialmente no extender las
conclusiones a temas o áreas sin datos que los avalen. Si la evaluación ha sido refe-
rida a los procesos inherentes al programa, quizás se esté en condiciones de reco-
mendar posibles modificaciones que corrijan, por ejemplo, las posibles desviacio-
nes detectadas en la práctica respecto al sistema de implantación planificado; en
este caso, deberá de adjuntarse un plan que organice adecuadamente la incorpora-
ción y seguimiento de los cambios propuestos. O bien hacer referencias, si es el
caso, a la idoneidad del modelo de impacto subyacente al programa en relación a
los objetivos que se marcan, o bien a la capacidad de la teoría desde la que se define
el problema para identificar variables susceptibles de ser manipuladas para la inter-
vención, etc. En cualquier caso tendremos que elaborar un informe que favorezca
la diseminación de sus resultados, es decir, que llegue al mayor número de posibles
audiencias interesadas en el mismo. En la figura 41.3 se puede apreciar de forma re-
sumida y ordenada el conjunto de elementos y componentes a tener en cuenta du-
rante esta tercera fase.
1049
¿Uuo!9ejue¡duul
ap uejd aqrsog?
sopez!¡eue sope]nsas sope1nsaJ ap
so| ap uo1oezJueBio se| qe) ¡euor9oajuo?)
SINOI/OVONINOD38 Á uo 1080 !!Iselo
soyep so] JaBo99)
SseuoIsn|9uo9 sopeynsaJ Á sojuaun4]sul
JeJ0epay SO| SP SISIPUy SO] Je.ISIUILUPY
OUdYNIIAVY SYIN VOVN3SIO
3INHOWNI 30 OdiL SsOLVO NOI/OVA IVA
Evaluación de programas
130 NOIDOVO38 sol vV1VOILOYVed

ANOIOV8O8V13 avVZIIVNV VIVEVA311
EL OL 6
oo fur 19P UOIDPLOGP]A ( SOPPp 9p SISI PUD “vp18092Y ¿D) 959] “E Tp VANOIA
Anguera, M. T. (1990). Programas de intervención. ¿Hasta qué punto es factible su evalua-

ción? Revista de Investigación Educativa, 8, 77-93.
Arco, J. L. (1997). La evaluación del proceso de intervención en drogodependencias desde la
perspectiva de la evaluación de programas. Tesis doctoral inédita. Universidad de Gra-
nada.
Buela-Casal, G. y Arco, J. L. (1998). Metodología en evaluación de programas. En M. A. Si-
món (dir.), Manual de psicología de la salud. Madrid. Siglo XXI.
Cronbach, L. J. y Shapiro, K. C. (1982). Designing evaluations of educational and social pro-
grams. San Francisco. Jossey-Bass.
Fernández, J. M. (1995). Evaluación de programas en Servicios Sociales. En R. Fernández-
Ballesteros (dir.), Evaluación de programas. Una guía práctica en ámbitos sociales, educa-
tivos y de salud. Madrid. Síntesis.
Hernández, J. M. (1996). Evaluación de programas de salud. En G. Buela-Casal, V. E. Caba-
Siglo XXI.
o M. (1990). Report to congress on the nature and effectiveness offederal, state and lo-
cal drug prevention/education programs. Washington D.C. Prepared for the U.S. Depart-
ment of Education Office of Planning, Budget and Evaluation.
Patton, M. Q. (1984). Data collection: Options, strategies, and cautions. En L. Rutman (dir.),
Evaluation research methods: A basic guide. Newbury Park. Sage Publications Ltd.
Patton, M. Q. (1986). Utilization-focused evaluation (2* ed.). Berverly Hills. Sage.
Rossi, P. y Freeman, H. (1993). Evaluation: A systematic approach. Newbury Park. Sage.
Vedung, E. (1995). Utilización de la evaluación de programas. En R. Fernández-Ballesteros
(dir.), Evaluación de programas. Una guía práctica en ámbitos sociales, educativos y de sa-
lud. Madrid. Síntesis.
Wholey, J. S. (1979). Evaluation: Promise and performance. Washington, D.C. Urban Insti-
tute.
Buela-Casal, G. y Arco, J. L. (1998). Metodología en evaluación de programas. En M. A. Si-

món (dir.), Manual de psicología de la salud. Madrid. Siglo XXL
Cronbach, L. J. y Shapiro, K. C. (1982). Designing evaluations of educational and social pro-
grams. San Francisco. Jossey-Bass.
Hernández, J. M. (1996). Evaluación de programas de salud. En G. Buela-Casal, V. E. Caba-
llo y J. C. Sierra (dirs.), Mannal de evaluación en psicología clínica y de la salud. Madrid.
Siglo XXI.
Rossi, P. y Freeman, H. (1993). Evaluation: A systematic approach. Newbury Park. Sage.
ÍNDICE ANALÍTICO
Actitudes, 881-897, 899 estabilidad de, 562-564, 572, 577-579, 582

Actividad interacción entre aptitud y tratamiento,
cardiovascular, 391, 394 569
cerebral espontánea, 401-403 Aptitudes, 525, 527-529, 535-536, 553, 556
cerebral evocada, 402 Aptitudes intelectuales, 970
de sudoración, 391, 400-401 Archivos institucionales, 808-809
electrodérmica, 388, 391, 397-399, 415-416, 419 Artefactos, 405, 407-410
electromiográfica, 391-392, 414 Atención, 428, 430-432, 435-437, 441-442, 444,
electrooculográfica, 391-392 446
gastrointestinal, 391, 400 cambiante, 644
mental, 422 concepto, 631, 642, 644, 648
motora, 369-371, 373, 375,377, 379-383 pruebas de, 631-632, 634-637, 639-641, 645,
pupilográfica, 391, 400, 419 648-649
respiratoria, 391, 393, 407 pruebas de medida indirecta, 645, 649
salivar, 391, 400, 416 selectiva, 642-644, 649
sexual, 391, 396, 419 sostenida, 642, 644
Adecuación de modalidad tareas de, 633, 635-636, 638-639, 645, 648
elaboración secuencial, 565, 569 Atribuciones de conducta, 856
elaboración simultánea, 575 Atributo psicológico, 116-117, 131
elaboración sucesiva, 575 Autobservación, 255, 261
modelo neuropsicológico, 568, 570-571 Autoconcepto, 853, 865, 867-869, 871, 875
modelo perceptivo-motor, 565-566, 582 Autocontrol, 706-708, 712, 716, 719-721, 724-
modelo psicolingúístico, 565-566, 582 726, 728
Adjetivos Autoestima, 794, 800-801, 813-814, 853, 859,
listados de adjetivos depresivos, 485 865, 867, 869-872
Alteraciones, 421-422, 425, 427-430, 439-442, Autoinformes, 261, 297-305, 307-312, 314, 778,
444-445 780
Ambiente, 981-990, 992-996, 998-999 Autoinstrucciones, 712, 725
Analista de conducta, 493, 500-502, 504, 511 Automatización, 590, 595, 598-599, 601-602,
Análisis 606
aplicado de la conducta, 89-90 Autoobservación, 343, 345, 347, 349, 351, 353,
componencial, 594 355, 357, 359, 361, 363, 365-367
conductual, 89-90 Autorregistro, 343-361
factorial, 830-832 Autorregulación, 705-725, 727, 729
funcional, 265-266 Axioma, 107
de la conducta, 89-90 493-503, 505, 507,
509, 511-513, 515-517, 519, 521 BAT (Test de ajuste corporal), 688-689, 698
secuencial, 316, 322, 335-336, 340-341 Baterías neuropsicológicas, 431, 439, 447
Análogos del comportamiento (test), 652 Biofeedback, 385-386, 395, 405-407, 416-420
Aprendizaje, 705-706, 710-711, 713-716, 719,
722-724, 726-727 Características de la mediación, 619
Aprendizaje mediado, 559, 571, 573-576, 579-581 Carreras profesionales, 904, 910, 913, 915
Aptitud Categorías de conducta, 317, 320, 323, 325-326,
cambio de, 560, 562, 564, 571-572, 576-579, 328-330, 333
581-582 Ciencia, 147-148, 150, 153-155, 157, 160-162
1052 Índice analítico
Circumgrids, 472, 488 de caso único, 943

Clasificación psiquiátrica, 113 dúplex, 1021-1024, 1030
Cociente intelectual, 525, 692 matriciales múltiples, 1006, 1016, 1018, 1026,
Componentes de adquisición-conocimiento, 1029-1030
597, 604 matriciales simples, 1002, 1004, 1029
Componentes de rendimiento, 593, 595-597 mixto, 1022-1023, 1027
Comportamiento social, 778-779, 782 Documentos personales, 458, 485-486
Comunicación, 222-224, 226, 237-238 DSM, 371
humana, 733
Conducta de riesgo, 950-951, 953, 956-960, Eclecticismo, 131-133
964, 974 Edad mental, 527, 540, 543, 667, 670
Congresos de Evaluación Psicológica, 61 Eficiencia relativa, 217
Conocimiento EFT (Test de figuras enmascaradas), 688-690,
científico, 147, 149-150, 154, 157, 161 699, 703
estilos cognoscitivos, 568-570, 575 Enfoque idiográfico, 130
modificabilidad cognoscitiva, 562, 564-565, nomotético, 123
571-578 Entrevista, 795, 797-798
procesos cognoscitivos, 559-569, 574, 576, clínica, 271, 276, 279
579, 581-582 conductual, 280-281, 293, 295-296
productos cognoscitivos, 563, 578-579, 582 de selección, 276, 283, 292
Constructo, 104, 106, 114, 117-118, 125, 131 diagnóstica, 276, 278-279
Constructos personales, 852-854, 856, 877 estructurada, 274, 278-279, 296
Consumo de oxígeno, 938-939 no estructurada, 274
Contexto, 981, 983-984, 986-988, 990, 994, 996 semiestructurada, 274, 278
Coordinación visomotriz, 971, 973 Epistemología, 103, 109, 127, 143-144
Código deontológico, 236-237 Escala
Crisis de la evaluación psicológica, 20 de intervalo, 195, 200
Cuestionarios, 298, 305, 312, 314, 793, 795-796, de razón, 195
802-804, 819 nominal, 195
Curva característica del ítem, 205, 210, 212 ordinal, 195, 201
semántica, 476
Dependencia-independencia de campo, 683- Escala de inteligencia infantil, 676
688, 690, 701-704 Escalas, 305, 309, 312
Desarrollo de actitudes, 885-886, 888-889, 897
cognitivo, 670, 672 de desarrollo, 740-743, 767
del lenguaje, 679 de distancia social, 888-889, 897
intelectual, 660, 672-674 de Guttman, 887, 892-894, 897
perceptivomotor, 660, 666 de intervalos, 887-888, 890-891
psicosocial, 773-777, 779, 781-783, 785, 787, 789 de Likert, 887-888, 891-892
sensoriomotor, 659, 661, 663, 665, 667, 669, de razón, 887-888
671,673, 675, 677, 679, 681 de Thurstone, 888, 890-893, 897
Deseabilidad social, 309-310, 313 heterogéneas, 903, 907
Devolución de información, 223-224 homogéneas, 903, 908-910, 912-914
Diagnóstico, 792, 795-800, 813, 815, 818 nominales, 887
Diferencial semántico, 475-478, 889, 895, 897 ordinales, 887
Diferencias Espacio
en el individuo mismo, 581 latente, 208-210
entre individuos, 560, 573, 581 semántico, 476-478, 480-481
individuales, 115-117 Estilos
Dificultad del ítem, 212-214 cognitivos, 683-687, 689, 691, 693, 695, 697-
Dificultades de aprendizaje, 697 699, 701-704, 970
Diseño de evaluación, 1037 de aprendizaje, 713-714
Diseños Estrategia de muestreo, 1047
de bloques incompletos balanceados (BIB), Estrategias teórico-racionales, 835
1018, 1030 Evaluación, 251-269, 981-983, 985-999
Indice analítico 1053
conductual, 15, 24-31, 33, 36, 41, 43-47, 58, Impulsividad, 693, 695-697, 700-701
67-68, 70, 71, 81, 85, 89, 91-92, 95, 97, 99- Independencia local, 209, 213
101, 113, 117-119, 122-124, 130-131, 133- Indicador
135, 140-142, 144-145, 164, 167-168, 171, cognitivo, 925-927, 941, 943
385-386, 411, 419-420 conductual, 925, 941-942
computarizada, 35 _ fisiológico-bioquímico, 926, 934-935, 942
continua rendimiento deportivo, 934, 942 Índice
de programas, 1001-1003, 1005, 1007, 1009, de dificultad de un ítem, 174
JOLIE AIO1S ADS LOLAGSLO19, 1021, 1023, de discriminación de un ítem, 176-177, 179
1025, 1027-1031, 1033-1037, 1039-1043, Informe
1045-1047, 1049-1050 escrito, 224, 226-228
del desarrollo, 659, 661-663, 665, 667, 669, oral, 223
671-675, 677,679, 681 psicológico, 221-225, 227, 229-233, 235, 237-
dinámica, 562, 564, 571-574, 576-582 238
del potencial de aprendizaje, 609, 614, 616- Insight, 590, 595, 598-599, 601, 605-607
617, 626-628 Instrumentos de recogida de datos, 1043, 1047
estadística, 506, 509-510 Integración, 111, 122, 129, 133-136, 141
estandarizada, 564, 566, 572-573, 582 Inteligencia, 523, 525-553, 555, 557, 559-561,
intuitiva, 506 564, 568, 573-574, 577, 580-581
neuropsicológica, 421-431, 438, 441, 450, cristalizada, 529, 539, 546
452, 732 fluida, 529, 539, 546
psicofisiológica, 397, 405-406, 413, 419 general, 525-531, 533, 535, 537-539, 541, 543-
psicológica, 71-75, 77-89, 91-99, 101 547, 549-551, 553, 555-557
en España, 49, 51, 53, 55, 57, 59, 61-66, 69 Interaccionismo, 832-833, 849
tradicional, 25-27, 32, 37, 44, 81, 89, 97, 101, Interdisciplinar, 131, 137-138
125, 130, 132, 144-145, 164, 168 Intereses, 901-917, 919
Exactitud, 343, 345, 349-356, 360-361 Intervención ambiental, 989, 994-995
Expectativas, 851, 853, 857, 862-865, 873 Introspección, 297
Experiencia de aprendizaje mediado, 609 Inventario de intereses, 902-907, 910, 912-916
Experimentación, 150, 152-153 Inventarios, 305, 312
Explicación científica, 103, 108 Investigación, 904, 912, 915, 917
Ipsativa, 474
Falsabilidad, 108, 115
Fiabilidad, 173, 176, 179-182, 184-189, 303, Juicio diagnóstico, 165-167
307, 311, 313, 315, 330-333, 370, 374-376,
410-411, 1039-1040, 1042-1045, 1047-1048 Lactato sanguíneo, 939-940, 944
de la entrevista, 289 Lenguaje, 422, 427, 430-431, 433, 435-436, 438,
Flujo sanguíneo, 390-391, 394-396, 419 440-442, 444, 447-448, 451-452
Formalización, 103, 107, 111, 114, 116, 120, escrito, 749, 753, 759-761, 767
128 no verbal, 736, 767
Función de información, 216-217 verbal, 733-737, 740-742, 747-748, 750-753,
Funcionamiento prosocial, 793, 817-819 756, 758, 767, 769-770
Funciones cognitivas, 614-615, 620, 624, 626 Lugar de control, 859, 862-866, 877, 880
Habilidades Macroanálisis, 330, 334-335

grafomotoras, 766, 768 Macroestrategias, 713, 716, 722
psicolingúísticas, 749, 769, 771 Medicina conductual, 113
psicofísicas, 951-952, 960, 972 Medidas
sociales, 711-712, 727 conductuales, 321, 327, 329
Heteroinformes, 778-780 escalares, 193, 195, 197, 199, 201, 203
Hiperactividad, 370-371, 381 indirectas, 896-897
Historia Medidor
clínica, 429, 431, 450 de aceleración, 369, 373-375, 377
de la evaluación psicológica, 7, 12, 40 de inclinación, 372, 375-377
Ideográfica, 466, 487 de movimiento, 369, 371-372, 375-377, 380
Memoria, 428, 430-431, 433-436, 438, 441-442, conductual del entrenador (CBAS), 930, 932
445-447 sistemática, 315-316, 321-323
baterías de, 635 Orientación, 429-433, 437, 441-442, 444-445
cotidiana, 636, 638-639
no verbal, 634-635, 639-640 Paradigma, 109-111, 115, 127-130, 134, 136,
verbal, 634-635, 648 143
Metaanálisis, 567 constructivista, 111, 127-130, 143
Metacognición, 711, 714-716, 721-722 Pensamiento en voz alta, 304-306
Metacomponentes, 593, 595-597 Percepción, 951, 956-957, 966, 970, 973, 975,
Metamemoria, 631, 634, 636-638, 641 978, 980
Metodología observacional, 315-318, 329-333, de la verticalidad, 686, 688, 698-699
336, 338-341 Pletismografía, 391, 393-394, 396-397, 419
Método Poder discriminativo del ítem, 206
científico, 149, 151, 153, 155, 157, 159, 161- Podómetro, 372
162 Potencial de aprendizaje, 609-617, 619-621,
correlacional, 152 623-628
de clasificación del rasgo, 847 Precisión, 315, 318, 330-333
de descripción libre, 847 Predicción científica, 108
de inferencia del rasgo, 846 Presión sanguínea, 388, 390-391, 394-395, 407,
deductivo, 160-161 419
factorial, 830-832, 842-844, 848 Prevención, 662, 673-674
hipotético-deductivo, 163 de accidentes, 951, 968
inductivo, 158-160 Principios deontológicos, 240, 244
MFF-MFF20 (Test de emparejamiento de figuras Probabilidad
familiares), 693
condicionada, 496, 508-510, 512, 514-515
Microestrategias, 713-714, 722
de acierto al azar, 213
Modalidad, 568, 570
Problemas :
Modelo
conductuales, 791-801, 803-805, 807, 809,
causal analítico-funcional, 512-513, 515-516
811-813, 815, 817-819, 821, 823, 825
conductual, 106, 110-113, 116-126, 128, 130- de aprendizaje, 697
137, 139-142, 144-145
de enfermedad, 110-114, 118, 130 de lenguaje, 734, 753
de «evitación de amenaza», 953, 960 emocionales, 791-799, 801, 803-805, 807,
de «riesgo cero», 957, 964 809, 811-813, 815, 817-819, 821, 823, 825
español, 961, 967, 969-970, 972 Procesamiento de la información, 683-684
homeostático del riesgo, 956 Proceso
logístico, 205, 213-214, 216 de evaluación, 221, 223, 226-227, 229
médico, 111-113, 135, 140, 145 de evaluación psicológica, 163, 165, 167, 169,
psicodinámico, 111-116, 128, 132, 134, 140, 145 171
psicométrico, 17, 20, 24, 30, 110-111, 115- psicomotor, 665-667, 675
118, 124-125, 129-130, 133-135 Procesos
Modificabilidad estructural cognitiva, 609, 613, cognitivos, 713-715
626 representacionales, 475
Motivación intrínseca, 711-714, 723-724 Pruebas
Muestreo de evaluación psicológica, 239-247
de tiempo, 345-348 psicométricas, 80
observacional, 322 Psicodiagnóstico, 18, 32, 34, 40-41, 44-45, 55-
Multidisciplinar, 137 59, 64-65, 67, 69-70, 71, 73, 79-84, 86, 94, 96-
101, 252, 268-269
Narraciones, 346 Psicofisiología clínica, 385, 420
Psicología
Objetividad científica, 147-148 científica, 8-9, 49, 51, 54, 56, 65
Observación, 150-152, 155, 252-253, 255, 257, cognitiva, 852
260-261, 264-26, 423, 429, 737, 739-741, 744, de la personalidad, 829, 833-834, 847, 849
746, 759-760, 778-779, 796, 806-808, 812 de la Salud, 113, 123
Indice analítico 1055
del deporte, 923, 925-927, 929, 931, 933-937, del observador, 332-333, 338-339
939-945,
947 Sesiones de observación, 321-322, 335-337
Psicometría, 10-11, 54, 56, 69 Simulación, 308
Psicotecnia, 49-50, 52-55, 69, 78, 80 Sistema
Publicaciones periódicas, 62 nervioso autónomo, 391, 393, 416, 419
nervioso central, 391, 393, 401, 419
Q, metodología, Sistemas de categorías, 319-321, 333
clasificaciones Q, 459-460, 464, 486 Situacionismo, 832
perfil-modelo, 462-463, 465 Socialización, 773-778, 780-783, 787-788
Sociograma, 784-786
Rasgo Solución de problemas, 708, 710, 713, 715-716,
latente, 205, 208-210 720-722
psicológico, 116, 135 STAT (test de Sternberg para medir habilidades
Rasgos psicológicos, 831, 833, 835, 837, 839, de la inteligencia triárquica), 589, 595, 600,
841, 843, 845, 847, 849-850 604, 606
Reestructuración cognitiva, 686, 688, 699 Subteoría
Reflexividad-impulsividad, 684-687, 692-693, componencial, 595, 605
696, 703 contextual, 595, 599, 605
Registro práctica, 606
de duración, 347
de frecuencias, 347, 354 Tasa cardíaca, 394, 407, 414-415, 418-419
de sonido, 746 Telemetría, 405-406
observacional, 321, 325, 340 Temperatura corporal, 388, 391, 396
Rejilla, técnica de, Tendencia de respuesta, 308, 313
complejidad cognitiva, 473 Teoría, 103-110, 112, 114-115, 117-118, 120-
índice de intensidad, 474 121, 127-128, 130, 133, 140, 143
ordenada por rangos, 471-472 clásica, 205-208, 216-218
significatividad, 473 de respuesta al ítem, 202, 205, 207-211, 213,
Relaciones 215217219
funcionales causales, 496-497, 500, 502-506, triárquica, 589-591, 593-595, 597, 599-601,
IMEI 603, 605, 607-608
sociales, 794 Terapia de conducta, 58, 89, 91, 99, 101
Rendimiento, 559-562, 564-567, 570, 572, 574- Test, 252, 256-257, 262-264, 266, 268
576, 580-582 clasificación de, 461, 479
académico, 691, 693, 697, 703 de aprendizaje de posición, 620, 622
escolar, 711-712, 714, 723 de atención (K-T), 647
máximo, 254-255, 259 de bandejas o Plateaux, 622
típico, 254-255, 259 de desarrollo, 659-677, 679, 681
REP-test, 466, 469-470 de diseño de patrones, 620, 623
Resolución de problemas (procesos y tareas), de ejecución continua (CPT), 646
684, 691-692, 696 de figura compleja, 620-622
Respuestas endocrinas, 940 de figuras enmascaradas, 688-689, 699, 702-
RFT (Test del marco y la varilla), 688, 698 703
Rol de entrevistado, 272, 274-275, 282-288 de memoria asociativa, 620, 622, 625
Rol de entrevistador, 272, 274-276, 282-290, de organización de puntos, 614-615, 618-620
295-296 de organizador, 620-621, 623
RRT (Test de la habitación rotatoria), 688-689, de progresiones numéricas, 620-621, 623
698 de Raven, 612, 616, 620, 622, 624, 626-627
de selección, 665, 667-668, 671-672
Seguridad vial, 949, 951, 953, 955-957, 959, 961, Tests
963-965, 967-969, 971-973, 975-980 adaptados al sujeto, 217-218
Selección de personal, 901, 915 de estado, 925-926, 930
Series temporales, 511 de inteligencia, 525-526, 529-532, 539, 544,
Sesgos 546-547, 549, 551-553
de la observación, 333 de rasgos, 940
específicos al deporte, 941 Unidades de conducta, 319-321

psicológicos, 12, 24, 32, 40, 71, 78-79, 83, 85,
96-97 Valencia de conducta, 353, 357-358, 367
Técnica Q, 868 Validez, 173, 179, 189-191, 298-299, 307-308,
Técnicas 341, 313, 330, 332, 370-371: 976-377,9/9=
de evaluación psicológica, 71-75, 77-89, 91- 380, 406, 410-411, 1038-1040, 1043-1045,
99, 101 1047-1048
individuales, 252, 256, 259, 266 de la entrevista, 271
neuropsicológicas, 266 de tratamiento, 559, 563, 565, 569-570, 581-582
objetivas, 264-265, 267 externa, 153
“papel y lápiz”, 255, 260 interna, 153
proyectivas, 15, 17-18, 22, 29, 33, 35, 44, 46, predictiva, 668, 672-673
80-82, 88, 99, 101, 257, 263, 265-267 Valoración, 71, 73, 78, 86-89, 91, 95-96, 98,
psicofisiológicas, 265 100, 981, 994-997
psicométricas, 266 Variable
subjetivas, 263, 265 dependiente, 152
verbales, 254, 256, 261 independiente, 152-153
Tiempo de reacción, 973-975 Variables
Toma de decisiones, 163, 166, 171 cognitivas de la personalidad, 852
Topografía de la conducta, 496-497, 499, 505 contaminadoras, 152-153
Transferencia psicofisiológicas, 386, 389-391, 407-409, 412,
distante, 564, 572, 574-576, 581 414-415
proximal, 563-564, 573-575, 581 Verificación científica, 150, 154, 157
PSICOLOGIA, ETOLOGIA Y PSICOANALISIS
PSICOLOGIA
ALARCON, D.—/dentidad de la psiquiatría latinoamericana. 672 pp.

ARDILA, R.—Psicología del aprendizaje. 240 pp. (19.* ed.)
BASAGLIA, F., y otros—Los crímenes de la paz. 352 pp. (2.? ed.)
BASAGLIA, F., y otros—Razón, locura y sociedad. 200 pp. (10.* ed.)
BORNAS, X., y SERVERA, M.—La impulsividad infantil. Un enfoque cognitivo-conductual.
216 pp.
BOWER, T. G. R.—Psicología del desarrollo. 448 pp.
BRAUNSTEIN, N., y otros—Psicología: ideología y ciencia. 434 pp. (11.* ed.)
BUENDIA, J. (comp.)—Envejecimiento y psicología de la salud. 504 pp.
CABRERA, M. C., y SANCHEZ PALACIOS, C.—La estimulación precoz: un enfoque prác-
tico. 144 pp. (10.* ed.)
CANTON, J., y CORTES, M.* R.—Malos tratos y abuso sexual infantil. Causas, consecuencias
e intervención, 488 pp. 424 pp.
COLL, C., y otros —Psicología genética y aprendizajes escolares. Recopilación de textos sobre
aplicaciones pedagógicas de las teorías de Piaget. 236 pp. (4.* ed.)
COLODRON, A.—Las esquizofrenias. 472 pp. (2.* ed.)
DELVAL, J.—El desarrollo humano. 648 pp. (2.* ed.)
DENIS, M.—Las imágenes mentales. 256 pp.
DEVEREUX, G.—De la ansiedad al método en las ciencias del comportamiento. 416 pp.
(7.2 ed.)
FERNANDEZ BERROCAL, P., y MELERO, M. A.—La interacción social en contextos edu-
cativos. 440 pp.
GARATE, M.—La comprensión de cuentos en los niños. Un enfoque cognitivo y sociocultural,
272 pp.
GARCIA MADRUGA, J. A., y otros. —Comprensión y adquisición de conocimientos a partir
de textos. 184 pp.
GARCIA VEGA, L., y otros—Historia de la Psicología I. Introducción. 216 pp.
GARCIA VEGA, L., y MOYA, J.—Historia de la Psicología I1. Teorías y sistemas psicológi-
cos contemporáneos. 448 pp.
GARCIA VEGA, L.—Historia de la Psicología 111. La psicología rusa: reflexología y psicolo-
gía soviética. 192 pp.
GIL ROALES-NIETO, J., y DELGADO, M. A.—Psicología y pedagogía de la actividad físi-
ca y el deporte. 200 pp.
HALL, E. T.—La dimensión oculta. Enfoque antropológico del uso del espacio. 262 pp. Hlus-
trado. (9.? ed.)
KAIL, R.—El desarrollo de la memoria en los niños. 248 pp. (2.* ed. modificada y ampliada.)
KENT, L., y otros—P.A.P.E.L. Programa para la adquisición de las primeras etapas del len-
guaje. Manual, 96 pp.; fichas, 112 pp. (3.* ed.)
LEBOVICL S., y WEIL-HALPERN, F. (comps.)—La psicopatología del bebé. 536 pp.
LEGA, L. I., CABALLO, V. E., y ELLIS, A.—Teoría y práctica de la terapia racional emoti-
vo-conductual. 176 pp.
LEON, A.—Psicopedagogía de los adultos. 200 pp. (8.* ed.)
LURIA, A. R., y YUDOVICH, F.—Lenguaje y desarrollo intelectual en el niño. 96 pp.
(6.* ed.)
MELERO MARTIN, J.—Conflictividady violencia en los centros escolares. 128 pp.
MONEDERO, C.— Psicopatología humana. 464 pp.
MONTMOLLIN, M. DE—Los psicofarsantes. 112 pp.
NAVARRO, ]. F., y ESPERT, R.—Neuropsicología: casos clínicos y pruebas razonadas de an-
toevaluación. 280 pp.
ORTONY, A., CLORE, G. L., y COLLINS, A.—La estructura cognitiva de las emociones.
272 pp.
PEINE, H., y HOWARTH, R.—Padres e hijos: problemas cotidianos de conducta. 144 pp.
(8.2 ed.)
PEREZ ALVAREZ, M.—Cindad, individuo y psicología. Freud, detective privado. 328 pp.
PEREZ ALVAREZ, M.—La superstición en la ciudad. 384 pp.
PIAGET, J.—Adaptación vital
ypsicología de la inteligencia. 200 pp. (5.* ed.)
PIAGET, J.—Biología y conocimiento. 354 pp. (8.* ed.)
PIAGET, J.—La equilibración de las estructuras cognitivas. Problema central del desarrollo.
208 pp. (2.* ed.)
PIAGET, J., y GARCIA, R.—Psicogénesis e historia de la ciencia. 256 pp. (2.* ed.)
PIAGET, J., y otros—Investigaciones sobre la contradicción. 352 pp.
POLAINO-LORENTE, A., y GIL ROALES-NIETO, J.—Psicología y diabetes infantojuvenil.
240 pp.
RIVIERE, A.—Razonamaiento y representación. 440 pp.
ROBLES RODRIGUEZ, F. J.—Para aprehender la psicología. Un análisis histórico-epistemo-
lógico del campo psicológico. 360 pp.
ROVIRA, F. M.*—£]l Rorscharch. Nuevas aportaciones de J. E. Exner al sistema compren-
sivo. Estudio sistemático y análisis interrelacionado. 148 pp.
SMIRNOV, A. A., y otros—Fundamentos de psicofisiología. 384 pp.
URIZ, J.—La subjetividad de la organización. El poder más allá de las estructuras. 392 pp.
URRA, J.—Menores, la transformación de la realidad. Ley Orgánica 4/1992. 336 pp.
URRA,J.—Violencia. Memoria amarga. 328 pp.
VASTA, R.—Cómo estudiar al niño. Introducción a los métodos de investigación. 152 pp.
(2isedi)
VAZQUEZ MEZQUITA, B.—Agresión sexual. Evaluación y tratamiento en menores.
120 pp.
VURPILLOYT, E.—El mundo visual del niño. 400 pp.
WALLON, PH.—E£l dibujo del niño. 200 pp.
WOLFE, S.—Trastornos psíquicos del niño: causas y tratamientos. 186 pp. (7.* ed.)
ETOLOGIA
DE LANNOY,]., y FEYEREISEN, P.—La etología humana. 136 pp.

LORENZ, K.—Evolución y modificación de la conducta. 136 pp. (11.* ed.)
LORENZ, K., y LEYHAUSEN, P.—Biología del comportamiento. 336 pp. Ilustrado. (10.* ed.)
ORTEGA, J. E. (comp.), y otros—Lecturas sobre comportamiento animal. 264 pp.
PERINAT, A.—Comunicación animal, comunicación humana. 272 pp.
TINBERGEN, N.—£l estudio del instinto. 260 pp. Hustrado. (8.* ed.)
PSICOANALISIS
AMARA, G.—El hombre imposible: anatomía de un psicoanálisis. 224 pp.

ANZIEU, D.—El antoanálisis de Freudy el descubrimiento del psicoanálisis.
Vol. 1.392 pp. (2.* ed.)
Vol. 2. 342 pp.
ANZIEU, D.—El cuerpo de la obra. Ensayos psicoanalíticos sobre el trabajo creador. 408 pp.
ASSOUN, P. L.—Introducción a la epistemología freudiana. 216 pp.
AULAGNIER, P.—Un intérprete en busca de sentido. 448 pp.
BAR DIN, A.—La madre deprimida y el niño. 168 pp.
BLOCH, D.—<Para que la bruja no me coma». Fantasía y miedo de los niños al infanticidio.
264 pp. (3.* ed.)
BRAUNSTEIN, N.—£l discurso del psicoanálisis. 192 pp.
BRAUNSTEIN, N.—Goce. 248 pp.
BRAUNSTEIN, N.—Psiquiatría, teoría del sujeto, psicoanálisis (hacia Lacan). 248 pp. (4.* ed.)
BRAUNSTEIN, N. (comp.)—A medio siglo de «El malestar en la cultura» de Sigmund Freud.
224 pp. (3.* ed.)
BRAUNSTEIN, N. (comp.)—£l lenguaje y el inconsciente freudiano. 336 pp.
BRAUNSTEIN, N. (comp.)—La re-flexión de los conceptos de Freud en la obra de Lacan. 328 pp.
CARUSO, I.—La separación de los amantes. 316 pp. (12.* ed.)
CARUSO, l.—Narcisismo y socialización. Fundamentos psicogenéticos de la conducta social.
120 pp.
CARUSO, I.—Psicoanálisis, marxismo y utopía.
CASTILLA DEL PINO, C.—Patografías. I. Neurosis de angustia, impotencia sexual, 240 pp.
(3.* ed.)
CIFALLI, M.—;Freud pedagogos Psicoanálisis y educación. 208 pp.
DEJOURS, CH.—/Investigaciones psicoanalíticas sobre el cuerpo. Supresión y subversión en
psicosomática. 159 pp.
DOLTO, F.—Autobiografía de una psicoanalista (1934-1988). 196 pp.
DOLTO, F.—El caso Dominique. 264 pp. (11.* ed.)
DOLTO, F.—£En eljuego del deseo. 328 pp. (4.* ed.)
DOLTO, F.—Psicoanálisis y pediatría. Las grandes nociones del psicoanálisis. Dieciséis obser-
vaciones de infantes. 280 pp. Ilustrado. (15.* ed.)
DOLTO, F.—Seminario de psicoanálisis de niños.
Tomo 1.232 pp.
Tomo 2. 224 pp. (3.* ed.)
Tomo 3. Inconscientey destinos.
ERIKSON, E. H.—Sociedady adolescencia. 192 pp. (15.* ed.)
FROMM, E.—Anatomía de la destructividad humana. 512 pp.(11.* ed.)
FROMM, E.—Grandeza y limitaciones del pensamiento de Freud. 168 pp. (9.* ed.)
FRUTOS, A. DE—Los Escritos de Jacques Lacan. Variantes textuales. 464 pp.
GOMEZ PIN, V.—El reino de las leyes. 202 pp.
GONZALEZ, F. M.—Ilusión y grupalidad. Acerca del claro oscuro objeto de los grupos. 228 pp.
GREENSON, R. R.—Técnica y práctica delpsicoanálisis. 424 pp. (10.* ed.)
LACAN, J.—Escritos.
Vol. 1.528 pp.(18.* ed.)
Vol. 2.384 pp. (11.* ed.)
LAMAS, M., y SAAL, F.—La bella (in)diferencia. 168 pp.
LECLAIRE, S.—El país del otro. 120 pp.
MANNONI, M.—El psiquiatra, su «loco» y el psicoanálisis. 256 pp. (6.* ed.)
MANNONL, M.—La educación imposible. 272 pp. (8.* ed.)
MARCOS, P.—Psicoanálisis antiguo y moderno. 232 pp.
MENDEL, G.—El psicoanálisis revisitado. 200 pp.
MITCHELL, S. A.—Conceptos relacionales en psicoanálisis: una integración. 372 pp.
PONTALIS, J. B.—La fuerza de atracción. 96 pp.
RAMIREZ, S.—Infancia es destino. 216 pp. (8.* ed.)
RATTNER, J.—Psicología y psicopatología de la vida amorosa. 272 pp. (18.* ed.)
REICH, W.—Materialismo dialéctico y psicoanálisis. 173 pp. (15.* ed.)
RICOEUR, P.—Freud, una interpretación de la cultura. 448 pp. (5.* ed.)
ROUSTANG, F.—A quien el psicoanálisis atrapa... ya no lo suelta. 280 pp.
ROUSTANG, F.—Lacan: del equívoco al callejón sin salida. 168 pp.
ROZITCHNER, L.—Freudy los límites del individualismo burgués. 504 pp. (2.* ed.)
SAAVEDRA, V.—La promesa incumplida de Erich Fromm. 176 pp.
SCHATZMAN, M.—El asesinato del alma: la persecución del niño en la familia autoritaria.
208 pp. (6.* ed.)
SCHNEIDER, M.—Neurosis y lucha de clases. Crítica materialista del psicoanálisis para cons-
tituirlo en fuerza liberadora. 388 pp. (2.* ed.)
SIBONY, D.—Perversiones. Diálogos sobre locuras «actuales». 300 pp.
SUAREZ, A. (coord.) —Psicoanálisis y realidad. 192 pp.
VV.AA.—Lacan con los filósofos.
PSICOLOGIA MORAL
PEREZ-DELGADO, E.—Psicología, ética, religión. ¿Etica versus religión? 438 pp.

PEREZ-DELGADO, E., y GARCIA-ROS, R.—La psicología del desarrollo moral. Historia,
teoría e investigación actual. 224 pp-
MANUALES
PSICOLOGIA
ALDAZ, J. A, y VAZQUEZ, C. (comps.)—Esquizofrenia Fundamentos psicológi-
cos y psiquiátricos de la rehabilitación. 488 pp.
AVILA, A., y POCH, J. (comps.) —Manual de técnicas de psicoterapia. Un enfoque
psicoanalítico. 792 pp. Empastado.
BUELA-CASAL, G., y CABALLO, V. E. (comps.)— Manual de psicología clínica
aplicada. 562 pp.
BUELA-CASAL, G., CABALLO, V. E., y SIERRA, ]J. C. (dirs.)—Manual de eva-
Inación en psicología clínica y de la salud. 1.152 pp. Empastado.
BUELA-CASAL, G., y NAVARRO, F. J. (comps.)—Avances en la investigación
del sueño y sus trastornos. 480 pp.
CABALLO, V. E.—Manual de evaluación y entrenamiento de las habilidades so-
ciales. 432 pp. Empastado.
CABALLO, V. E. (comp.)—Manual de técnicas de terapia y modificación de con-
ducta. 1.016 pp. Empastado. (3.* ed.)
CABALLO, V. E. (dir.)—Manual para el tratamiento cognitivo-conductual de los
trastornos psicológicos.
Vol. 1. Trastornos por ansiedad, sexuales, afectivos y psicóticos.. 776 pp.
CABALLO, V. E., BUELA-CASAL, G., y CARROBLES, J. A. (dirs.)—Manual
de psicopatología y trastornos psiquiátricos.
Vol. 1. Fundamentos conceptuales; trastornos por ansiedad, afectivos y psicóticos.
864 pp.
Vol. 2. Trastornos de la personalidad, medicina conductual y problemas de rela-
ción. 824 pp.
FERNANDEZ RIOS, L.—Manual de psicología preventiva. Teoría y práctica.
608 pp.
GARCIA CUETO, E.—/Introducción a la psicometría. 264 pp.
GARCIA MADRUGA, J. A.—Desarrollo y conocimiento. 144 pp.
LEON-CARRION, J.— Manual de neuropsicología humana. 576 pp. Empastado.
URRA, J., y VAZQUEZ MEZQUITA, B.—Manual de psicología forense. 472 pp.
VERDUGO, M. A. (dir.)—Evaluación curricular. Una guía para la intervención
psicopedagógica. 784 pp. Empastado.
VERDUGO, M. A. (dir.)—Personas con discapacidad. Perspectivas psicopedagógi-
cas y rehabilitadoras. 1.464 pp. Empastado.
SALUD Y SOCIEDAD
AHLBOM, A., y NORELL, S.—Fundamentos de epidemiología. 152 pp.

(4.* ed.)
ALARCON, D., y otros —Fundamentos de la investigación clínica. 232 pp.
BASTIDE, R.—Sociología de las enfermedades mentales. 374 pp. (8.* ed.)
CANGUILHEM, G.—Lo normaly lo patológico. 280 pp. (6.* ed.)
ERLMIGER,.J.—La medicina reencontrada. Las nuevas ambiciones de la
homeopatía.. 312 pp.
FOUCAULT, M.—El nacimiento de la clínica. Una arqueología de la mira-
da médica. 304 pp. (15.* ed.)
GONZALEZ DE CHAVEZ, M.* A.—Cuerpo y subjetividad femenina.
Saludy género. 312 pp.
KNOX, E. G.—La epidemiología en la planificación de la atención de la
salud. 225 pp.
LEON-CARRION, J.—Daño cerebral. Guía para familiares y cuidadores.
176 pp.
LLAMAS, R. (comp.)—Construyendo sidentidades. Estudios desde el cora-
zón de una pandemia. 312 pp.
LOPEZ ACUÑA, D.—La salud desigual en México. 256 pp. (3.* ed.)
LOPEZ SANCHEZ, F.—Educación sexual de adolescentes y jóvenes. Ree-
laboración de Cómo planear mi vida. 344 pp.
MARQUEZ MOREIN, L.—La desigualdad ante la muerte en la ciudad de
México. El tifo y el cólera (1813-1833). 360 pp.
MCcKEOWN, T., y LOWE, C. R.—Introducción a la medicina social. 368
pp. (2 ed.)
NORELL, S.—Diseño de estudios epidemiológicos. 192 pp.
PEREZ TAMAYO, R.—Enfermedades viejas y enfermedades nuevas.
184 pp.
PEREZ TAMAYO, R.—Serendipia. Ensayo sobre ciencia, medicina y otros
sueños. 240 pp.
SIGERIST, H.—Hitos en la historia de la salud pública. 104 pp. (2.* ed.)
TORRE, J. DE LA—Pediatría accesible: Guía para el cuidado del niño. 560
pp (5Fed:)
Ye Y AAA De
e.
AA
La evaluación psicológica constituye un claro ejemplo de la evolución que ha
experimentado durante los últimos años la psicología en general. En la
actualidad, la evaluación psicológica hace referencia a un concepto que
engloba la aplicación de tests y el psicodiagnóstico. La aplicación de tests
constituye únicamente una pequeña parte del proceso de recogida de
información que supone la evaluación psicológica; esta última disciplina va
más allá de la simple recogida de información, pues exige la formulación de
hipótesis, su contrastación, así como la toma de decisiones con respecto a los
instrumentos con el fin de alcanzar unos objetivos preestablecidos
(descripción, clasificación, predicción y/o cambio). Por otro lado, una
segunda característica de la actual evaluación psicológica es que va más allá
de un simple diagnóstico, pues sus objetivos se ampliaron de una persona en
concreto a un grupo, a un ambiente o a un programa o tratamiento. El libro
está estructurado en seis partes (aspectos conceptuales y metodológicos,
técnicas de evaluación psicológica, evaluación de la inteligencia, evaluación
del aprendizaje y desarrollo, evaluación de la personalidad y evaluación en
otras áreas), participando más de cuarenta destacados especialistas
españoles y extranjeros que lo convierten en un significativo exponente de la
actual evaluación psicológica.
Gualberto Buela-Casal es licenciado en Psicología y diplomado en

Criminología por la Universidad de Santiago de Compostela, y doctor en
Psicología por la Universidad Autónoma de Madrid. Ha trabajado como
investigador en el Servicio de Evaluación del Centro Nacional de Investigación
y Evaluación Educativa del mec (Madrid), posteriormente fue profesor de
Psicología en la Universidad de Málaga, en la Universidad de Jaén y profesor
invitado en la University of California Ucss. En la actualidad trabaja en la
Universidad de Granada. Es autor y/o director de varios libros en el ámbito de
la psicología clínica como, por ejemplo, el Manual de evaluación en psicología
clínica y de la salud (Ed. Siglo XXI) y de diversos artículos en revistas
internacionales. Está especializado en técnicas de evaluación psicológica,
psicofisiología clínica, los trastornos del sueño, peritajes psicológicos,
evaluación de programas y psicología de la salud.
J. Carlos Sierra es licenciado en Psicología por la Universidad de Santiago de

Compostela y doctor en Psicología por la Universidad de Granada. Sus
intereses como investigador y docente se centran en el campo de la
sexualidad humana y en la evaluación de los trastornos del sueño y de los
efectos residuales del tratamiento farmacológico de dichos trastornos. Es
coautor del libro Los trastornos del sueño (1994), codirector del Manual de
evaluación en psicología clinica y de la salud (1996) y de diversos trabajos en
revistas internacionales sobre evaluación de la activación y la vigilancia. En la
actualidad es profesor titular de la Facultad de Psicología de la Universidad
de Granada, en donde imparte docencia de evaluación psicológica.
ISBN 84-323-0953-2
| 000 |
9"788432"309533

Psicológica: Manual de Evaluación

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Psicológica: Manual de Evaluación

Cargado por

Copyright:

Formatos disponibles

Gualberto BuelaCasal y

J. Canos Sierra (dirs.)

Fundamentos, técnicas y aplicaciones

siglo veintiuno de españa editores, sa

Todos los derechos reservados. Prohibida la reproducción total

Primera edición, noviembre de 1997

Impreso y hecho en España

1. EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA,

Vis ¿Crisis dela evaluatión conductual cancer pasos

2. EVOLUCIÓN HISTÓRICA DE LA EVALUACIÓN PSICOLÓGICA

IV. CONSTITUCIÓN DE LA EVALUACIÓN PSICOLÓGICA COMO DISCIPLINA

3. CONCEPTO DE EVALUACIÓN PSICOLÓGICA, Gualberto Buela-

Ma. Importancia de la A at ea (aio 71

H:--APLIGACIÓN DETESTS PSICOLÓCIOOSA A A 78

VIL1. Medida psicológica. E 92

IX. LAEVALUACIÓN PSICOLÓGICA A TRAVÉS DESUS ACTIVIDADES cccoococoncnno. 94

4. MODELOS DE EVALUACIÓN PSICOLÓGICA, Gualberto Buela-Casal y

IL5. Explicación y predicción científica Pr rr rr rr rr rr rr rro rr rr rro

V. MODELO PSICOMÉTRICO Pr rr rr rr rr rro rr rr rr rr rr rr rr rr ros rr rr orar c rr oo rr cr cororcrro coso.

(rr rr rr rr rr rr rr rr rr rr reso rr rr rro rr rro roo rro rro 029

Pr rr rr rro rr rr rr rro rro rr rr rra rr rro rr rr raro

Pr rr rr rr rro rr rr rr rr rr rro rr rr ros rr rr rr roo rr rr rro

ar Erecncismonslida o oso de AS. o

PRRERENGIAS MIS IOGRACICAS nn inata aa

5. MÉTODO CIENTÍFICO Y EVALUACIÓN PSICOLÓGICA, Gualberto

TENA RO DEAON O a ada

IV.1.- La verificación en el proceso.de cOnOCiMiENtO..a.caccnaconoconconconionocanesa

EE metodo dui E A A pp sista nas

REFERENCIAS BORA ee emermeneanroiDrareccnsbadaS

6. EL PROCESO DE EVALUACIÓN PSICOLÓGICA, Gualberto Buela-

7. PRINCIPIOS PSICOMÉTRICOS DE LA EVALUACIÓN PSICOLÓGICA,

111. Fiabilidad absoluta y relativVa.....ooononosamarsosnsnssorinosscareosacensenaacagaso 179

TIL. EA VALIDEZ DE UN/TESTE oonaoqonocnosananasoooocoo oaronoarnsncenaronannaarana cacon orsasoncasasnosoccncao 189

REFERENCIAS BIBLIOGRÁFICAS rr rr rr rr rr rr rr rr rr rr rr rro 192

8. MEDIDAS ESCARARES Euiz Pasqualt y EoCArlos SEXTA score astas 193

E INTRODUCCIÓN parara aa ai EA A A a 193

IL. TAMEDIDA EN PSICOLOCIA aa 194

VEL Analisis delrasoo io a pro tcoceneri iones mortis 214

VILA FUNCIÓN DE INFORMACIÓN Iori bs 216

VIIL1.- Tests adaptados al sujeto (Tailored Tests) caroninciaricisanenseriiniiencenees 217

10. EL INFORME PSICOLÓGICO, Fernando Jiménez .......ccoaammmnmm.. 221

IV. CARACTERÍSTICAS FUNDAMENTALES DEL INFORME PSICOLÓGICO .ccncoos. 227

11. DEONTOLOGÍA Y EVALUACIÓN PSICOLÓGICA, Leandro S. Almeida

LE INTRODUCE E across 239

111. Los procedimientos, el material y las condiciones de evaluación... 240

12. CLASIFICACIÓN DE LAS TÉCNICAS DE EVALUACIÓN PSICOLÓ-

1. INTRODUCCION AS cti ito dd a o ten 2301

TIL. EL«STATUS» ACTUAL DELAS TÉCNICAS DE EVALUACIÓN PSICOLÓGICA . 264

Pr rr rr rr rr rr rr rr rr rr rra rr rr rr rr rro ron roscar sarro roo 271

LA ENTREVISTA EN SELECCIÓN DE PERSONAL rr rr rr rro rr rr rr rr 281

MT Cuestionarios inventarios escala ar rerrni 305

IV. FACTORES QUE AFECTAN LA BONDAD DE LOS AUTOINFORMES occronnconnoooss 307

151 LA OBSERVACIÓN, Vicens Quera y Júlia Bebar incaico SL)

La DEFINICIÓN Y CARACTERÍSTICAS DE LA METODOLOGÍA OBSERVACIONAL . SS

mt. - Elección delas conductas a Observar ..icoonccoionaniononónonnaconconnniananonancnnoos 317

nro Medidas conductuales agp ARA ea: 321

CONTRO DETACAMDADDE LOS DATOS das air barca dineros 329

IV3. Validez. anciana A A LD A trio 332

16. LA AUTOOBSERVACIÓN, James D. Herbert y Rosemery O. Nelson-Gray.. 343

Iv.1. Exactitud de la conducta externa autorregistrada ....ucnoncnnoesens»*m”. 349

W.ts= Conciencia de la evaluación de la exactitud ..oncenooncnorerencrcacmssorenecess 351

IX-1... Motivación para el cambio de CONdUCTA. 2 cntrcacrianarepirenracaonsaaracn

EU MMomenito del torres ACA LAA LAIA 359