Manual de Pruebas de Inteligenc - Costa Neiva, Kathia Maria (Autho

MANUAL DE
PRUEBAS
DE INTELIGENCIA
Y APTITUDES
Kathia Maria Costa Neiva

MANUAL DE
PRUEBAS
DE INTELIGENCIA
Y APTITUDES

Diseo de portada: Fernando A. Colmenero
Primera edicin: junio de 1996
MANUAL DE PRUEBAS DE
INTELIGENCIA Y APTITUDES
Universidad Iberoamericana
Plaza y Valds, S.A. de C.V.
Derechos exclusivos de edicin reservados para

todos los pases de habla espaola. Prohibida la reproduccin
total o parcial por cualquier medio, sin autorizacin
escrita por los editores.
Este libro es una coedicin entre

la Editorial Plaza y Valds y la
Universidad Iberoamericana
Editado en Mxico por Plaza y Valds editores

Manuel Mara Contreras No. 73 Col. San Rafael
Mxico D.F. Tel. 705-00-30
ISBN: 968-856-466-4
HECHO EN MEXICO
A mi padre
de quien hered el gusto por leer y escribir
A mi madre
de quien hered el ser emprendedora y
perseverante
A Edi, Tais y Tiago
quienes siempre me han apoyado en mis
proyectos profesionales
NDICE GENERAL
Prlogo 9
Introduccin 11
Agradecimientos 13
PRIMERA PARTE: Aspectos mtricos de las

pruebas psicolgicas 15
Captulo I Las pruebas psicolgicas 17
Captulo II Construccin y evaluacin de las
pruebas psicolgicas 27
Captulo III Unidades de calificacin de las pruebas
psicolgicas 47
SEGUNDA PARTE: Inteligencia 59

Captulo IV La inteligencia 61
Captulo V Escala de Inteligencia Stanford-Binet 67
Captulo VI Escala de Inteligencia para adultos
de Wechsler (WAIS) 75
Captulo VII Escala de Inteligencia para el nivel
escolar de Wechsler (WISC) 105
Captulo VIII Escala de Inteligencia para los niveles
preescolar y primario de Wechsler (WPPSI) 127
Captulo IX Beta II-R 137
Captulo X Test de Matrices Progresivas (Raven) 145
Captulo XI Test de Domins 153
Captulo XII Test de Goodenough 159
TERCERA PARTE: Aptitudes 171

Captulo XIII Las Aptitudes 173
Captulo XIV Pruebas de Aptitud Diferencial (DAT) 177
7
Captulo XV Prueba de Clasificacin de Aptitudes
de Flanagan (FACT) 195
BIBLIOGRAFA 203
PROLOGO
Con el propsito de que los estudiantes de psicologa
pongan en prctica los conocimientos tericos adquiridos
previamente sin ambigedades ni contradicciones, el presente
manual de pruebas de inteligencia y aptitudes, pretende
organizar y aclarar dos de las variables ms investigadas
dentro de la psicologa.
Cabe sealar que los tests psiclogicos son de las
herramientas ms utilizadas en el quehacer profesional, por
lo que resulta imprescindible conocer el orden y desarrollo
de las pruebas, aplicar los aspectos metodolgicos implicados
en la medida, aplicar, interpretar e integrar a una batera
de pruebas y desarrollar una posicin tica con respecto a
su utilizacin.
Deseo felicitar a la Dra. Kathia Ma. Costa Neiva, ya que
ha podido transmitirnos su experiencia acumulada como
profesora de psicometra por 4 aos y medio en esta
Universidad.
Estoy seguro que el presente manual facilitar la
comunicacin entre maestros y alumnos y promover un
aprendizaje significativo a todo aquel que lo consulte.
Antonio Tena Suck
9
INTRODUCCIN
La idea de construir un manual sobre pruebas psicolgicas
surgi de mi experiencia como profesora de Psicometra de
la Universidad Iberoamericana - Mxico D.F. La necesidad
de textos claros, organizados y resumidos que facilitaran la
tarea de los profesores me llev a la elaboracin de este
primer manual sobre Pruebas de Inteligencia y Aptitudes.
Mi inters es que ste sea el primer manual de una serie sobre
Pruebas Psicolgicas.
Los tests psicolgicos constituyen uno de los instrumentos
bsicos de trabajo del Psiclogo. Son utilizados en las distintas
reas de la Psicologa: Clnica, Educativa, Industrial,
Comunitaria. Son necesarios en tareas como: psicodiagnstico,
orientacin vocacional, seleccin de personal, investigacin,
entre otras. Por ello, conocerlos, saber aplicarlos, evaluarlos,
interpretarlos, y criticarlos es imprescindible.
El objetivo del presente manual es proveer a los Psiclogos y
alumnos de Psicologa una fuente de consulta, clara, sucinta y
organizada sobre algunas de las pruebas de inteligencia y aptitudes
ms utilizadas. No se pretende, de manera alguna, que ste sustituya
a los manuales de las pruebas. La intencin es que sirva como
una primera aproximacin al conocimiento de stas y que facilite
la tarea de los psiclogos, en los momentos en que necesiten decidir
sobre la utilizacin de una u otra prueba psicolgica, proporcionando
la informacin esencial para la toma de una decisin.
Este manual est dividido en tres partes. La primera parte
Aspectos mtricos de las pruebas psicolgicas tiene
como objetivo introducir al tema proveyendo la informacin
bsica sobre los tipos de pruebas y los procedimientos de
construccin, evaluacin y calificacin de las mismas. Estas
11
informaciones son de gran importancia para la comprensin

y anlisis de las distintas pruebas que sern presentadas en
las dos otras partes del manual.
La segunda parte Inteligencia provee una introduccin
al concepto de inteligencia y la informacin bsica sobre
varias de las pruebas de inteligencia frecuentemente utilizadas
por los psiclogos.
La tercera parte Aptitudes esclarece sobre el concepto
de aptitud y proporciona la informacin bsica sobre algunas
de las bateras de aptitudes mltiples ms utilizadas.
Se espera que la presente obra, sea de gran utilidad a todos
los profesionistas interesados en el campo de la Psicometra
y que facilite su quehacer profesional.

Noviembre 1995
12
AGRADECIMIENTOS
Deseo manifestar mi agradecimiento a la Universidad
Iberoamericana y en especial al Dr. Jos Gmez del Campo,
director del Departamento de Psicologa, por apoyar la
publicacin de este manual; al Mtro. Antonio Tena Suck,
coordinador del Departamento de Psicologa, por animarme
a escribirlo, por revisar cuidadosamente el manuscrito origi-
nal y aportar sugerencias interesantes y al Arq. Alejandro
Robles Oyarzun, subdirector de Difusin Universitaria, por
agilizar la publicacin del mismo.
Deseo tambin agradecer a la Direccin General de
Orientacin Vocacional de la UNAM y muy especialmente
a su director, Dr. Ramn Alberto Ruiz Tapia, por permitir
el acceso al material sobre la Prueba Diferencial de Apti-
tudes "PROUNAM" y autorizar la mencin de dicha prueba
en este manual. Asimismo, agradezco al Dr. Lucio Crdenas,
Jefe del Proyecto del PROUNAM, por su disponibilidad en
proveerme la informacin necesaria y revisar la parte del
manuscrito relacionada a esta prueba.
Por ltimo, quisiera manifestar mi profundo agradecimiento
a todos mis alumnos de Psicometra que con sus comentarios,
dudas y cuestionamientos me motivaron e incentivaron a
escribir este manual.
13
PRIMERA PARTE
ASPECTOS METRICOS DE
LAS PRUEBAS
PSICOLOGICAS
CAPITULO I
LAS PRUEBAS PSICOLGICAS
Son muchas las definiciones propuestas para el trmino
"prueba psicolgica". Sintetizndolas, puede considerarse
que una prueba psicolgica es un instrumento de medicin
psicolgica que posee tres caractersticas fundamentales:
1. Sirve de estmulo para extraer un segmento de la
conducta de un sujeto.
2. Es rigurosamente estandarizado, o sea se construye,
se administra y se califica segn reglas preestablecidas.
3. Permite comparar estadsticamente la conducta de un
sujeto con un grupo de sujetos de una poblacin definida
y clasificarla cuantitativa, cualitativa y/o tipolgicamente.
As, la medicin de una conducta implica " l a utilizacin
de determinados procedimientos (operaciones), segn reglas
especificadas, para obtener como resultado la asignacin de
valores numricos a la ejecucin de una persona" (Brown,
1980, p.8)
La funcin bsica de las pruebas psicolgicas es medir diferencias
de conducta entre los individuos o diferencias en la conducta de
un mismo individuo en distintos momentos (Anastasi, 1978).
A. ORGENES
Aunque puede considerarse que Platn y Aristteles fueron

los pioneros de la medicin psicolgica, sta adquiri
importancia en el siglo XIX, con el aumento de la preocupacin
por la identificacin y clasificacin de retrasados mentales.
La obra publicada en 183 8, por el mdico francs Esquirol,
17
sobre retraso mental, sus procedimientos para constituir

algn sistema de clasificacin de los diferentes grados de
retraso y las tcnicas de adiestramiento muscular y de los
sentidos propuestos por Seguin en 1866, constituyeron los
primeros pasos para la elaboracin de una medida de la
inteligencia.
Sin embargo, fue Galton, en Inglaterra, quin, interesado
en estudiar la herencia humana, ide las primeras pruebas,
para que fueran utilizadas en el laboratorio antropomtrico
que estableci en la Exposicin Internacional de 1884. Estas,
eran pruebas sensomotoras que medan bsicamente agudeza
visual y auditiva, energa muscular, tiempo de reaccin, etc.
El crea que las mismas podan servir para medir la capacidad
intelectual. Galton contribuy aun al desarrollo de mtodos
estadsticos para anlisis de datos sobre las diferencias
individuales y estuvo entre los primeros a aplicar las escalas
de estimacin (rating scales), los mtodos de cuestionario y
la tcnica de asociacin libre. En sus libros El genio Heredado
e Investigacin del desarrollo de las facultades humanas
relat sus ideas sobre las diferencias individuales y sus
primeros intentos por medirlas.
La expresin test mental apareci por primera vez en un
artculo escrito por el psiclogo americano Cattell en 1890,
donde describa las pruebas aplicadas a estudiantes
universitarios para evaluar su nivel intelectual. Estas pruebas
medan capacidades sensoriales y otras funciones simples
como: velocidad de movimiento, sensibilidad al dolor, energa
muscular, agudeza de la vista y del odo, discriminacin de
pesos, tiempo de reaccin, memoria, etc.
En este mismo perodo, el psiclogo experimental Alfred
Binet, investig activamente, junto con sus colaboradores,
mtodos de evaluacin de la capacidad intelectual. Pero fue
en 1905 que, comisionado por la Secretaria de Educacin
Pblica del gobierno francs para estudiar la educacin de
18
MANUAL DE PRUEBAS DE INTELIGENCIA Y APTITUDES
nios retrasados mentales, elabor junto con Simon la primera

escala Binet-Simon. Esta escala contena 30 problemas en
orden creciente de dificultad que medan, entre otras, funciones
como: razonamiento, juicio y comprensin. En la segunda
escala (1908), se aument el nmero de tests, aunque se
eliminaron algunos de la primera versin considerados no
satisfactorios. Adems, se agruparon los tests en niveles de
edad, lo que permiti que la puntuacin obtenida por un nio
pudiera ser expresada como una edad mental (edad de los
nios normales cuya ejecucin se igualaba). La 3 a versin
(1911) present cambios menores: se aadieron tests en
varios niveles de edad y la escala se extendi hasta el nivel
adulto. El Binet-Simon obtuvo gran xito, habiendo sido
traducido y adaptado a varios idiomas. La revisin ms
conocida fue realizada en E. U. A. por Terman en la Universidad
de Stanford y se llam Stanford-Binet (1916). En esta ltima
fue utilizada por primera vez la nocin de cociente de
inteligencia (C.I.) obtenido por la frmula: C.I.= Edad Mental/
Edad cronolgica x 100. Otra revisin fue hecha en 1912
por Kuhlmann, quin extendi la escala hasta el nivel de
edad de 3 meses.
Con el desarrollo de los tests surgieron las primeras
oficinas de Orientacin Vocacional: Munich (1902), Francia
(1906), E.U.A. (1908), Blgica (1914), Espaa (1916),
Inglaterra (1920), etc.
Los tests colectivos de inteligencia aparecieron en 1917,
cuando los E. U. A. decidieron participar en la primera guerra
mundial y necesitaron clasificar intelectualmente milln y
medio de reclutas. Los ms utilizados fueron el Alfa y Beta,
el primero se destinaba a la poblacin general y el segundo
era empleado con analfabetos y extranjeros que no dominaban
el ingls. La segunda revisin del Beta (Beta II-R) es utilizada
actualmente.
A partir de la primera guerra las pruebas psicolgicas
19
experimentaron un gran avance. Adems de los tests de
inteligencia, que eran principalmente verbales, se
desarrollaron tests de aptitudes especficas, de rendimiento
y de personalidad.
Los tests de aptitudes especficas fueron construidos
sobre todo para la orientacin y seleccin profesional. Los
ms utilizados medan aptitudes mecnicas, burocrticas,
musicales y artsticas. Los avances metodolgicos,
principalmente el anlisis factorial, aportaron mucho a la
elaboracin de tests y en especial al desarrollo de las bateras
de aptitud mltiple, que aparecieron a partir de 1945. Otra
vez la labor de los psiclogos militares en la segunda guerra
mundial fue determinante para la evolucin de las pruebas
psicolgicas.
B. TIPOS DE PRUEBAS
Las pruebas psicolgicas pueden clasificarse desde diversos

puntos de vista. Compilando las ideas de algunos autores
(Morales, 1973; Anastasi, 1978; Brown, 1980) se proponen
las siguientes dimensiones de clasificacin:
1) Segn la conducta que miden:

Pruebas de inteligencia
Pruebas de aptitudes/habilidades
Pruebas de personalidad/temperamento
Pruebas de intereses/preferencias
Pruebas de valores
Pruebas de actitudes
Pruebas de rendimiento
Pruebas psicomotoras
Pruebas situacionales
2) Segn el objetivo:
. Pruebas de potencia o ejecucin mxima - Exigen del
20
examinado su mximo rendimiento en las distintas tareas

que componen la prueba. Este es el caso de las pruebas de
inteligencia, habilidades, aptitudes especficas o mltiples
y de rendimiento.
- Pruebas de ejecucin o rasgos (ejecucin tpica) -
Estas tambin son llamadas pruebas de clasificacin tipolgica
o cualitativa. En esta clasificacin se sitan las escalas o
inventarios de personalidad, tests de ajuste, de temperamento,
de intereses o preferencias, de valores, de actitudes, tcnicas
proyectivas, pruebas situacionales, etc.
3) Segn la forma o el tipo de respuesta exigida:

Pruebas objetivas - Son aquellas en que el examinado
elige una respuesta entre varias alternativas (reactivos de
comparacin, verdadero/falso o eleccin mltiple). Este es
el caso de las pruebas de inteligencia y aptitudes.
- Pruebas subjetivas - Son aquellas en que el sujeto
proporciona libremente la respuesta, como en las pruebas
de personalidad, especialmente en las proyectivas como
Rorschach, TAT (Prueba de Apercepcin Temtica), Frases
Incompletas de Sacks, etc.
4) Segn la forma de administracin:

Pruebas de aplicacin individual
Pruebas de aplicacin colectiva
Pruebas autoadministrables
5) Segn la libertad de ejecucin:

Pruebas de poder - Son aquellas que exigen que el
sujeto emplee toda su capacidad, realice lo ms que pueda.
El tiempo lmite a veces es controlado, pero cuando esto
sucede, se considera que ste es suficiente para que el sujeto
demuestre su mxima capacidad.
. Pruebas de velocidad - Son las que exigen que el sujeto
21
ejecute la tarea asignada, lo ms rpido posible. La duracin

de la prueba es rigurosamente controlada, existe un tiempo
lmite estricto.
6) Segn el material utilizado en la prueba:

Prueba de lpiz-papel
Prueba completamente verbal
Prueba de ejecucin (material visomotor)
Pruebas mixtas (combinacin de diferentes materiales)
7) Segn la forma de dar las instrucciones:

Orales
Escritas
8) Segn la forma de calificacin:

Manual
Informatizada
9) Segn la poblacin a la que se destina:

Pruebas para bebs (baby-tests)
Pruebas para nios preescolares
Pruebas para nios escolares
Pruebas para adolescentes
Pruebas para adultos
Pruebas que se aplican a dos o ms etapas del desarrollo
Una prueba psicolgica combina varias de estas dimensiones

(de inteligencia, para adultos, de poder, verbal, etc.) o diferentes
aspectos de una misma dimensin (prueba verbal y de ejecucin,
para adolescentes y adultos, etc.)
C. USOS DE LAS PRUEBAS
Una pruebapsicolgica puede ser empleada con diferentes finalidades:
22
Evaluacin: por ejemplo en el caso de evaluarse el

rendimiento acadmico de alumnos.
Clasificacin: cuando, por ejemplo, se clasifica
intelectualmente a los nios de un determinado grado escolar.
Seleccin: cuando se seleccionan candidatos para un
puesto o alumnos para la universidad.
Diagnstico: cuando se busca estudiar reas del
comportamiento de un sujeto para detectar o no dificultades
especficas.
Investigacin: cuando se busca verificar hiptesis, como
por ejemplo, si el nivel de ansiedad de jvenes drogadictos
es ms alto que el de jvenes no drogadictos.
Se constata pues, que las pruebas psicolgicas pueden
ser utilizadas en las distintas reas de la Psicologa: clnica,
educacional, industrial y social. Algunas son especficas de
una sola rea, otras pueden servir a cualquiera de ellas.
En el rea clnica, las pruebas no solo son utilizadas bsi-
camente para diagnosticar aspectos del comportamiento
normal y patolgico, sino tambin para evaluar intervenciones
teraputicas.
En el rea escolar, son muchos los empleos: clasificacin
de alumnos (nivel intelectual, rendimiento escolar),
homogeneidad de los grupos, deteccin de problemas de
aprendizaje, orientacin vocacional, evaluacin psicomotora,
etc.
En el rea industrial son utilizadas para seleccin,
clasificacin y promocin de personal, evaluacin de
capacitacin, evaluacin de productividad y calidad del
trabajo, evaluacin de la propia organizacin, etc.
En el rea social son empleadas sobre todo para comprender
y evaluar los procesos grupales y los patrones culturales y sociales.
Finalmente, en cualquiera de estas reas las pruebas
psicolgicas pueden ser utilizadas con fines de investigacin
cientfica.
23
D. ASPECTOS TICOS
Son muchas las medidas adoptadas para controlar el uso

inadecuado de las pruebas psicolgicas. El Cdigo de Etica
Profesional del Psiclogo Ethical Principles of Psycholo-
gists and Code of Conduct y el Standards for Educational
and Psychological Testing, ambos editados por la A.P.A.
(American Psychological Association), contienen varios
principios que reglamentan la publicacin, distribucin y
utilizacin de las pruebas psicolgicas. Todo psiclogo debe
tener conocimiento de estos principios y cuidar que los mismos
sean rigurosamente cumplidos, puesto que, son stos los que
permiten conservar la credibilidad en las pruebas. En seguida
se mencionan algunos puntos ticos importantes apuntados
por Anastasi (1978):
La venta, distribucin y utilizacin de los tests debe
restringirse a personas calificadas para ello.
No debe venderse un test en el mercado sin que ste
est suficientemente validado a travs de investigaciones.
No deben publicarse en peridico, revista o libro popular,
ni tests ni parte de ellos.
No deben realizarse tests por correo, ni tampoco enviar
resultados de los mismos.
La aplicacin, calificacin, interpretacin y
comunicacin de los resultados de tests debe ser realizada
por persona debidamente calificada y entrenada.
Todo test debe disponer de un manual que contenga
informaciones detalladas sobre su aplicacin, calificacin e
interpretacin, datos precisos de confiabilidad y validez,
adems de tablas de normas con informacin sobre el nmero
y naturaleza de los sujetos a partir de los cuales las mismas
se establecieron. El manual debe ser una exposicin objetiva
sobre el test y no un instrumento de publicidad que busque
presentarlo de manera ms favorable.
24
Es imprescindible aclarar al examinado sobre el objetivo
del test y la forma en que sern utilizados sus resultados.
Los resultados obtenidos en un test solo pueden ponerse
a disposicin de terceros bajo dos condiciones: a) el examinado
debe consentir que se proporcione la informacin; b) la
persona a la que se transmite debe tener una necesidad
legtima de la informacin (por ejemplo, profesores o futuros
patrones). Sin embargo, hay algunos casos especiales, como:
a) en circunstancias que puedan implicar peligro para un
individuo o sociedad, el psiclogo tiene obligacin de revelar
la informacin a profesionales o autoridades pblicas; b)
el psiclogo est obligado a revelar la informacin de un
test a los padres o guardianes de un menor o a las autoridades
de su escuela.
Los puntos arriba mencionados no agotan las medidas
propuestas en el Cdigo de Etica Profesional del Psiclogo.
Adems, cada uno de ellos implica discusiones ticas
importantes y debe ser sujeto de reflexin por parte de todo
psiclogo o estudiante de Psicologa. Proteger la intimidad
de sus clientes y la credibilidad de su material de trabajo
es parte del quehacer profesional del psiclogo.
Referencias bibliogrficas
Anastasi, A. (1978). Tests psicolgicos (3a ed., 4a reimpresin)

Madrid: Editorial Aguilar.
Brown, F.G. (1980). Principios de medicin en Psicologa
y Educacin. Mxico D.F.: Editorial El Manual Moderno.
Morales, M.L. (1993). Psicometra Aplicada (2a ed., 2a reimpre-
sin) Mxico D.F.: Editorial Trillas.
25
CAPITULO II
CONSTRUCCIN Y EVALUACIN DE LAS

PRUEBAS PSICOLGICAS
Toda prueba psicolgica es construida de tal manera que
represente o pueda predecir una determinada conducta. Segn
Brown (1980) una prueba psicolgica es una representacin cuando
sus reactivos son similares a la conducta que desea medir y es
predictiva cuando sus reactivos, aunque no son similares a la
conducta, pueden predecirla.
Por lo tanto, la construccin de los reactivos de una prueba es
fundamental, as como su anlisis y comprobacin. Conocer
exactamente lo que se quiere medir es muy importante para la
construccin de "buenos reactivos". Al elaborarse una prueba,
se proponen inicialmente una buena cantidad de reactivos, de los
cuales solo se quedan aquellos que realmente miden lo que se
pretende medir. Bacher (1981) advierte sobre los errores sistemticos
queocurren en la construccin de reactivos y hace varias sugerencias,
entre ellas: (a) el vocabulario debe ser simple, accesible a todos,
(b) se deben evitar los trminos tcnicos y palabras cuyo sentido
vare segn la regin o el grupo social, (c) se deben evitar formulaciones
muy abstractas pues pueden ser mal comprendidas, (d) se deben
evitar reactivos muy largos, sobre todo cuando son formulados en
la forma interrogativa o cuando contengan negaciones, (d) en la
formulacin de los reactivos, se debe evitar favorecer determinadas
respuestas volviendo las dems menos probables, (e) no debe
figurar en la formulacin de un reactivo ms de una idea pues,
es imposible saber a cul de ellas contesta el sujeto.
27
No es el propsito de este manual proveer mayores detalles sobre

la construccin de las pruebas sino informar sobre los diferentes
procedimientos de evaluacin y comprobacin de las mismas, para
que se puedan analizar los lmites de stas.
A. ANLISIS Y COMPROBACIN DE LOS REACTIVOS
El primer procedimiento para analizar los reactivos de una prueba

consiste en aplicrsela a una muestra de personas, similares a las
que se pretenden examinar con la misma, para verificar la reaccin
de stas ante el instrumento. Con esta aplicacin puede verificarse
el nivel de dificultad de la prueba, el poder de discriminacin de
sus reactivos as como ambigedades en stos.
El nivel de dificultad de la prueba depende de sus reactivos y
de su distribucin en la prueba (Anastasi, 1978). Este puede ser
verificado a travs de la distribucin de las puntuaciones totales
de una muestra de sujetos. Un nivel de dificultad normal proporciona
una curva de distribucin de las puntuaciones semejante a la curva
normal (figura 2.1), donde hay una acumulacin de sujetos en el
centro (puntuaciones medianas) y una disminucin gradual de
sujetos al acercarse de los extremos de la curva (puntuaciones altas
o bajas).
Figura 2.1: Curva de distribucin normal
Si la prueba es muy difcil, la curva de distribucin de las

puntuaciones de los sujetos presenta una acumulacin en el extremo
28
inferior o sea gran nmero de sujetos con puntuaciones bajas (figura

2.2). Esto indica que faltan a la prueba suficientes reactivos fciles.
Sin embargo, cuando la prueba es muy fcil, la acumulacin de
puntuaciones se da en el extremo superior (puntuaciones altas) y
por lo tanto le faltan reactivos difciles (figura 2.3).
Figura 2.2 Figura 2.3

Distribucin desviada Distribucin desviada
(a la izquierda) (a la Derecha)
Cuando sucede uno de los dos casos arriba mencionados suele

modificarse el nivel de dificultad de la prueba hasta que la grfica
de distribucin de las puntuaciones se aproxime a la curva normal.
Para tal, se pueden aadir reactivos ms fciles o ms difciles,
cambiar la posicin de reactivos, eliminar o modificar reactivos,
revisar pesos o ponderaciones de las puntuaciones asignadas a
determinadas respuestas, etc. (Anastasi, 1978).
La verificacin del poder discriminative de los reactivos es
hecha a travs de un anlisis estadstico que "indica la amplitud
con la que el reactivo mide lo que debe medir" (Brown, 1980,
p. 31). El procedimiento ms comn es el que, utilizando la calificacin
de la prueba como medida de criterio, correlaciona las respuestas
a los reactivos individuales con las calificaciones totales obtenidas
en la prueba. Se supone que las personas que obtuvieron calificaciones
totales altas respondieron a un reactivo en forma correcta con mayor
frecuencia que aquellas que obtuvieron calificaciones totales bajas.
Si esto ocurre, el reactivo es considerado "bueno", o sea que
discrimina relativamente bien lo que se desea medir.
29
Un tercer procedimiento en el que se verifica el porcentaje de

personas que seleccionan cada una de las respuestas alternativas
de un reactivo. Las respuestas que son muy poco o nunca escogidas
debern ser revisadas, pues indican que no contribuyen al poder
discriminativo del reactivo (Brown, 1980).
Algunos otros procedimientos tambin son tiles dependiendo
del objetivo y tipo de prueba como: interrelaciones entre reactivos;
interrelaciones entre reactivos y las diferentes subescalas de una
prueba; efectos de diferentes lmites de tiempo, etc.
En general, estos procedimientos son realizados en dos muestras
independientes (validacin cruzada) para eliminar variaciones
provenientes de errores en el muestreo.
B. ANALISIS Y COMPROBACIN DE LA PRUEBA
El anlisis de laprueba, como un todo, supone distintos procedimientos,

que objetivan la minimizacin de los efectos de variables que
pudieron intervenir en la medicin. En otras palabras supone el
control de los errores.
1. Estandarizacin
Este proceso, tambin llamado por algunos autores tipificacin,

implica la utilizacin del mismo material de prueba (o equivalente)
bajo un procedimiento uniforme de aplicacin y puntuacin (Anastasi,
1978). Solo as pueden compararse los resultados obtenidos por
distintos sujetos en una misma ocasin o por un mismo sujeto en
distintas ocasiones.
En primer lugar, el material de la prueba debe ser siempre el
mismo, o comprobadamente equivalente.
En segundo lugar, las condiciones de aplicacin deben tambin
ser, en la medida de lo posible idnticas. Para tal, las instrucciones
de aplicacin, las demostraciones previas, los lmites de tiempo, las
formas de resolver dudas, la disposicin del material, etc. deben
30
ser rigurosamente las mismas para todos los sujetos. Por ello, el
manual de una prueba debe proveer estas informaciones con el
mximo de detalles. Adems, el aplicador debe cuidar aspectos
como: tono e inflexin de voz, expresin facial, reacciones verbales
del tipo "s" o "bien" quepueden dar la connotacin de "correcto",
entre otros. El ambiente de la aplicacin debe proporcionar las
condiciones fsicas adecuadas para que el resultado del sujeto no
se vea afectado por variables extraas como: falta o exceso de luz,
ruidos, intervenciones, etc.
Finalmente, el procedimiento de calificacin debe ser lo ms
uniforme posible. Se necesita para tal un alto grado de objetividad
en la puntuacin y calificacin de las respuestas de los sujetos.
En pruebas que utilizan reactivos de eleccin mltiple es ms fcil
garantizar esta objetividad. Sin embargo, los reactivos que suponen
una respuesta libre del sujeto son ms vulnerables. En este caso,
es importante que el manual de la prueba proporcione indicaciones
detalladas para la asignacin de calificaciones y que los calificadores
sean debidamente entrenados para esta tarea.
Otro aspecto importante de la estandarizacin del procedimiento
de puntuacin es el establecimiento de normas. "Una norma es
la actuacin media o normal" (Anastasi, 1978, p. 24) de un grupo
de personas similar al que se destina la prueba. Al aplicarse la
prueba a este grupo llamado norma de estandarizacin, muestra
de tipicacin o grupo normativo, se obtiene el promedio de actuacin
del grupo, as como los grados de desviacin por arriba y por abajo
del promedio. La comparacin del resultado de un sujeto con la
norma, permite determinar la posicin del mismo con respecto a
este grupo. Muchas veces se necesita comparar el resultado de un
sujeto con diferentes grupos (segn el sexo, la edad, el nivel de
escolaridad, la ocupacin, etc.) y por lo tanto son necesarios varios
grupos normativos. Adems, las normas pueden estar expresadas
en diferentes unidades de calificacin: CI de desviacin, percentil,
estanina, puntuacin T, puntuacin Z, etc. El prximo captulo
tratar con detalles las distintas unidades de calificacin.
31
2. Validez
La validez de una prueba es el grado en que sta mide lo que se
quiere medir y solo lo que se quiere medir (Anastasi, 1978). Existen
tres procedimientos que permiten verificar la validez de una prueba.
La utilizacin de uno u otro depende del objetivo y tipo de prueba.
2.1. Validez de contenido
Este tipo de validez es utilizado sobre todo en pruebas de rendimiento/

aprovechamiento, aunque tambin se aplica a otros tipos de pruebas
psicolgicas (Brown, 1980). A travs de la validez de contenido
se verifica si los reactivos de la prueba realmente constituyen "una
muestra representativa del universo de las conductas o de los
contenidos" (idem, p. 154) que se quiere medir. El procedimiento
utilizado para verificar la validez de contenido de una prueba
consiste en:
1) Precisar las habilidades, conocimientos y comprensiones que
corresponden al contenido enseado y que ha sido el objetivo de
un curso o entrenamiento.
2) Examinar cuidadosamente la prueba (muestra de tareas) para
ver qu conocimientos, habilidades y comprensiones requiere.
3) Verificar qu tanto contenido de la prueba representa el
contenido y los objetivos del curso o entrenamiento.
Una prueba vlida debe estar compuesta de tareas que representen
al mximo los contenidos y metas de la enseanza. Este procedimiento
no utiliza ningn ndice cuantitativo para verificar la adecuacin
de la muestra de tareas; la evaluacin se da a travs de un examen
detallado y cuidadoso de la misma y por lo tanto implica un proceso
de juicio y razonamiento por parte del evaluador. Brown (1980)
presenta algunos de los inconvenientes que puede presentar este tipo
de validez: a) no poder utilizar un ndice cuantitativo para verificar
el grado de relacin, b) distintos evaluadores pueden no estar de
acuerdo en cuanto a la validez del contenido de la prueba y c) la
falta de claridad en la precisin del dominio dificultar los juicios
32
de validez de contenido. Murphy y Davidshofer (1994) hacen adems

hincapi en el hecho de que "los estudios de validez de contenido no
pueden, por ellos mismos, garantizar la validez de la medida"(p. 113).
2.2. Validez de criterio
Este tipo de validez est relacionado con la prediccin de un

resultado especfico futuro por ejemplo, el xito en una futura
ocupacin o en un futuro programa de capacitacin. Por ello, se
aplica a pruebas utilizadas para pronosticar resultados por medidas
de criterios muy claras y definidas (e .g. tests de seleccin y clasificacin
de personal). Se elige as una medida como criterio (e.g. desempeo
en el empleo) y se verifica cunto la medida en la prueba (e.g. prueba
de habilidad numrica) se relaciona con la medida del criterio.
Existen varios mtodos para verificar la validez de criterio. El ms
utilizado supone el siguiente procedimiento:
1) Aplicar la prueba a un grupo, antes de iniciar el desempeo
en un trabajo o de ingresar en un programa de capacitacin o curso.
2) Definir un criterio que sirva de valoracin del xito en el
empleo, programa de capacitacin o curso y obtener ms tarde,
junto al mismo grupo, una medida de este criterio.
3) Calcular la correlacin entre la calificacin en la prueba y
la calificacin en el criterio de valoracin del xito. El coeficiente
de correlacin puede variar de -1 a +1. Cuando el valor es cercano
a 0 indica que no existe correlacin entre las dos medidas. Tanto
un coeficiente positivo cuanto un coeficiente negativo indican una
relacin entre las medidas. Un coeficiente positivo indica que ambas
medidas varan en la misma direccin (ambas altas o ambas bajas),
mientras que un coeficiente negativo indica que si una medida es
alta, la otra es baja o viceversa. Tanto mayor es esta correlacin,
ms efectiva ser la prueba para predecir este criterio y
consecuentemente ms vlida.
La gran dificultad de este procedimiento est en la eleccin de
un criterio adecuado de valoracin. Thorndike (1975) propone
cuatro cualidades que debe tener un criterio de valoracin:
33
Adecuacin - Un criterio es adecuado cuando la calificacin

de ste est determinada por los mismos factores que determinan
el xito en el trabajo/curso/tarea. No hay ninguna prueba que permita
verificar la adecuacin o no del criterio. Hay que confiar en el juicio
del profesional para elegirlo.
Exencin de prejuicios - la medida del criterio debe
proporcionar, a cada persona, la misma oportunidad de obtener una
buena calificacin. Por ello, debe ser exenta de prejuicios del
evaluador.
Conflabilidad - La medida del criterio debe ser estable y
reproducible para que una prueba cualquiera pueda predecirla. Si
la medida del criterio vara de una situacin a otra o de tiempo en
tiempo, sta no podr relacionarse con otras medidas y por lo tanto
no habr prueba que la pueda predecir.
Disponibilidad - En la eleccin del criterio debe tomarse en
cuenta los problemas prcticos de su utilizacin: disponibilidad,
tiempo, costo, etc.
Un segundo mtodo para determinar la validez de criterio es ' 'ver
si las calificaciones predictoras diferencian a los grupos especficos
por su ejecucin en el criterio" (Brown, 1980, p. 133). Por ejemplo,
para determinar si una prueba de habilidad numrica es un buen
predictor del xito de alumnos en un curso de lgebra, se debe
proceder de la siguiente manera:
1) Dividir los alumnos en dos grupos: los aprobados y reprobados
en el curso de lgebra
2) Comparar las calificaciones, de esos dos grupos, en la prueba
de Habilidad Numrica para verificar si hay una diferencia
estadsticamente significativa entre sus calificaciones. El
procedimiento generalmente utilizado para verificar si la diferencia
es significativa es la obtencin de la estadstica t. Esta estadstica
"compara la diferencia en las medias con la medida del error de
muestreo" (Brown, 1980,p. 132). Si el valor/obtenido es significativo
(segn las tablas), quiere decir que los dos grupos tienen calificaciones
significativamente diferentes en la prueba. Un valor t no significativo
indica que las calificaciones de la prueba no discriminan entre los
34
grupos definidos segn el criterio y consecuentemente, que la prueba

no es vlida.
Un tercer mtodo es la utilizacin de ndices de exactitud en
la toma de decisiones (Brown, 1980). El procedimiento, en este
caso, consiste en:
1) Clasificar las calificaciones de la prueba en dos o ms
categoras independientes (ejemplo: fracaso V xito o aceptable
vs inaceptable)
2) Clasificar, segn las mismas categoras, las calificaciones
del criterio
3) Comparar el conjunto de datos
4) Obtener la proporcin de decisiones correctas (Pdc)
Por ejemplo, el cuadro 2.1 indica las predicciones correctas
(aciertos) e incorrectas (fallas). Se consideran en el cuadro cuatro
grupos formados a travs de la comparacin de dos categoras de
criterio y dos categoras de la prueba predictiva (xito vs fracaso).
CUADRO 2.1
Predicciones en las decisiones
Ejecucin del criterio
Prediccin de la Prueba Psicolgica XITO FRACASO
XITO Aciertos (A) Falla (B)
FRACASO Falla (C) Aciertos (D)
Cuando los grupos obtienen xito o fracaso en ambas medidas,

la de la prueba y la del criterio, se considera una prediccin o
decisin correcta o sea un acierto (grupos A y D). Los dems
casos son considerados una falla (grupos B y C). Un ndice importante
en la toma de decisiones es la proporcin de decisiones correctas(P.)
en el total de decisiones. Esta proporcin se obtiene a travs de
la siguiente frmula:
35
Los valores A, B, C y D corresponden al nmero de sujetos

de cada uno de los cuatro grupos y N al total de sujetos. La
proporcin de decisiones correctas (Pdc) indica la exactitud de las
decisiones y puede ser utilizada como ndice de validez de
la prueba.
Brown (1980) comenta sobre las variaciones en este procedimiento,
como la que supone la determinacin de la calificacin lmite
ptima, calificacin que separa a los grupos para producir el nmero
mximo de decisiones correctas.
2.3. Validez de construccin (o validez interna o estructural)
Este tipo de validez verifica el grado en que una prueba mide un

constructo o rasgo terico. En realidad, no existe un ndice cuantitativo
nico o slo un procedimiento de validez de construccin. La validez
se evala mediante un conjunto de evidencias y mtodos. Brown
(1980) agrupa en cinco categoras la variedad de tcnicas y
procedimientos utilizados para establecer la validez de construccin:
a) Mtodos intrapruebas
En esta categora se encuentran las tcnicas utilizadas para estudiar

la estructura interna de una prueba: su contenido, los procesos
utilizados para contestar a las preguntas, la relacin entre sus
reactivos, la relacin entre las subescalas. Se incluyen en esta
categora desde procedimientos de validez de contenido hasta estudios
de homogeneidad de la prueba (coeficiente alfa, coeficiente Kuder-
Richardson), que sern examinados ms adelante. Estos ndices
indican si la prueba mide un solo o varios rasgos.
b) Mtodos interpruebas
Estos mtodos estn diseados para verificar las relaciones entre

varias pruebas o sea, si stas miden o no el mismo rasgo. Algunos
de los procedimientos utilizados son:
36
Validez congruente - En este caso se verifica la correlacin

entre las calificaciones de una nueva prueba y las obtenidas en una
otra, ya validada, que mida el mismo rasgo. Si la correlacin es
alta significa que ambas pruebas miden el mismo rasgo y que pueden
interpretarse los resultados de la nueva prueba como los de aquella
ya validada.
Validez factorial - Este es considerado uno de los tipos ms
importantes de validez. Es verificada a travs de un procedimiento
estadsticoel anlisis factorialque permite determinar "cuantos
factores (construcciones) se necesitan para explicar las
intercorrelaciones entre un conjunto de calificaciones de varias
pruebas" (Brown, 1980, p. 165). El anlisis factorial permite
obtener: 1) el nmero de factores que explican las intercorrelaciones
entre las pruebas, 2) los factores que componen cada prueba y 3)
la cantidad de varianza en las calificaciones de las pruebas que
explican los factores. As, pueden determinarse las pruebas que
comparten una varianza comn y que por lo tanto miden el mismo
factor o sea la misma construccin. Adems, la proporcin de
varianza total en las calificaciones de la prueba que es atribuida
al factor, puede ser utilizada como ndice de validez de construccin.
Validez discriminante - En este caso el objetivo es verificar
que las calificaciones de una nueva prueba no se correlacionen con
las obtenidas en otras pruebas que miden otros rasgos distintos.
Se demuestra as que la medida de esta nueva prueba es independiente
de la medida de otras construcciones o rasgos.
c) Estudios relacionados con criterios
Este mtodo se basa en la prediccin acerca de diferencias entre

grupos, naturalmente separados o diseados experimentalmente.
Por ejemplo, una teora sugiere que algunas clases de grupos deben
obtener puntuaciones elevadas o bajas respecto al rasgo medido
por una nueva prueba. Al aplicrsela se verificar cuanto las
calificaciones en esta prueba separan a estos grupos, o sea pueden
predecir las diferencias entre ellos.
37
d) Manipulacin experimental
En este procedimiento se manipula experimentalmente una variable

y se observa sus efectos sobre las calificaciones de la prueba o la
relacin de stas con algn criterio. Por ejemplo, una teora puede
sugerir que la expresin de un rasgo o conducta se modificar a
consecuencia de algunas condiciones o tratamientos experimentales.
Se aplica entonces la nueva prueba en la condicin experimental
para verificar si las modificaciones previstas ocurren. Sera el caso
de aplicarse una prueba de ansiedad a personas que estn por
someterse una operacin quirrgica para verificar si esta prueba
puede detectar el nivel de ansiedad que supuestamente debe encontrarse
aumentado por la inminencia de la ciruga.
e) Estudios de capacidad de generalizacin
Segn Brown (1980) se encuentran en esta categora los estudios

que "analizan sistemticamente la prueba sobre una gama de
condiciones o dimensiones por ejemplo en una variedad de
poblaciones (transferibilidad) o con diferentes condiciones de
administracin"(p. 167). El explica con detalles el mtodo propuesto
por Campbell y Fiske llamado Matriz de Multirasgo y Multimtodo.
Este procedimiento consiste bsicamente en examinar las correlaciones
entre los mismos rasgos medidos por diferentes mtodos (validez
convergente) y las correlaciones entre diferentes rasgos, medidos
por un mismo mtodo (validez discriminante).
3. Confiabilidad
La confiabilidad es el "grado de consistencia de las

mediciones "(Brown, 1980, p.80). Es la consistencia de las
puntuaciones obtenidas por los mismos sujetos cuando son
examinados con la misma prueba o una forma paralela de sta,
en diferentes ocasiones.
38
Toda medida implica un cierto error. El objetivo de una prueba

psicolgica es reducir, al mnimo, el error de medicin. Al reducirlo
se eleva el nivel de confabilidad de la prueba.
Thorndike (1975) apunta cuatro fuentes principales de error que
resultan de:
1) Variaciones surgidas dentro del procedimiento mismo de medicin,
que pueden estar relacionadas con las condiciones de aplicacin de la
prueba, tales como: la situacin fsica, las instrucciones, los errores
en el registro de tiempo, los factores de distraccin, etc.
2) Variaciones en el sujeto mismo, a corto plazo (salud, atencin,
motivacin, ansiedad, experiencia con la prueba, etc.) o a largo
plazo (maduracin, aprendizaje, cambios en su ambiente, etc.).
3) Variaciones procedentes de la muestra especfica de tareas
(reactivos) elegidas para representar el rea de la conducta que
mide la prueba.
4) Variaciones en la velocidad de trabajo del sujeto.
Existen diferentes procedimientos para examinar la cantidad de
error en la medicin, o sea, estimar el grado de consistencia de
la misma. Brown (1980) diferencia dos tipos de consistencia, que
aunque estn relacionados, considera til separar para fines didcticos.
La confiabilidad verifica la consistencia de la medida a travs del
tiempo (estabilidad) y a lo largo de formas equivalentes de la prueba
(equivalencia). La homogeneidad o consistencia interna verifica
si todos los reactivos de la prueba miden o no el mismo rasgo.
Sern analizados, por separado, los distintos procedimientos.
3.1. Procedimientos para verificar la confiabilidad de una prueba

psicolgica
Existen diferentes procedimientos que permiten verificar el nivel

de confiabilidad de una prueba psicolgica:
a) Repeticin de la misma prueba (Test/Retest)
Este procedimiento consiste en aplicar la misma prueba dos veces.

39
La medida de confiabilidad es la correlacin entre las calificaciones

obtenidas en la primera aplicacin y en la reaplicacin. Esta medida
se denomina coeficiente de estabilidad. Este procedimiento puede
ser realizado de dos maneras distintas:
Sin intervalo de tiempo entre las dos mediciones, o sea, la
reaplicacin es realizada en seguida de la aplicacin. En este caso
son controlados dos tipos de errores provenientes de: (a) variaciones
en el procedimiento mismo de medicin y (b) variaciones en la
velocidad de trabajo del sujeto.
Con intervalo de tiempo entre las dos mediciones, o sea, la
reaplicacin se hace despus de cierto tiempo, que puede ser de
das o de aos. Tres errores son controlados en este procedimiento,
que resultan de: (a) variaciones en el procedimiento mismo de
medicin, (b) variaciones en el sujeto de una vez a otra y (c)
variaciones en la velocidad de trabajo del sujeto.
Este tipo de procedimiento no debe ser utilizado en el caso de
rasgos que sean, por principio, inestables o cuando se produzca algn
tipo de aprendizaje diferencial entre las dos aplicaciones (por ejemplo
un programa de estudios o entrenamiento). Otro problema es el del
efecto de la prctica, sobre todo cuando la aplicacin y reaplicacin
son realizadas sin intervalo de tiempo o con un intervalo muy corto
entre las dos. En este caso "algunas personas pueden recordar sus
respuestas o aprender algo sobre la tcnica de pasar una prueba"
(Brown, 1980, p. 85).
b) Aplicacin de formas paralelas (o equivalentes) de la prueba
Para este procedimiento hay que disponer de formas equivalentes

de la prueba, que sigan la misma especificacin pero que sean
compuestas de muestras separadas de la conducta que se pretende
medir. Las formas paralelas deben por tanto cubrir el mismo
contenido, utilizar el mismo nmero de reactivos y poseer el mismo
grado de dificultad. La medida de confiabilidad es la correlacin
entre las puntuaciones obtenidas en las dos formas de la prueba.
40
Este procedimiento tambin puede ser realizado de dos maneras:

Sin intervalo de tiempo entre la aplicacin de las dos formas
equivalentes de la prueba. En este caso la correlacin entre las dos
medidas ofrece un coeficiente de equivalencia. Los tipos de errores
tomados en cuenta son los que provienen de: (a) variaciones en el
procedimiento mismo de medicin, (b) variaciones en la velocidad de
trabajo del sujeto y (c) variaciones procedentes de la muestra de tareas.
Con intervalo de tiempo entre la aplicacin de las dos formas
paralelas de la prueba. La correlacin entre las dos medidas ofrece,
en este caso, un coeficiente de estabilidad y equivalencia. Con
este procedimiento puede controlarse los cuatro tipo de errores
mencionados anteriormente, que provienen de: (a) variaciones en
el procedimiento mismo de medicin, (b) variaciones en el sujeto
de una vez a otra, (c) variaciones en la velocidad de trabajo y (d)
variaciones procedentes de la muestra de tareas.
El procedimiento que utiliza la aplicacin de formas paralelas
con intervalo de tiempo es el que proporciona el coeficiente de
confiabilidad ms preciso y riguroso pues permite controlar las
distintas fuentes de error. Por esta misma razn el provee el
coeficiente de confiabilidad ms bajo. Sin embargo, l plantea
problemas prcticos importantes, puesto que exige que se disponga
de dos formas paralelas de la prueba y del tiempo necesario para
aplicrselas por separado.
c) Confiabilidad por mitades
Este procedimiento, tambin llamado de test subdivide (split half),

es el ms ampliamente utilizado para estimar la confiabilidad a
partir de una sola administracin de la prueba (Thorndike, 1975).
Segn Murphy y Davidshofer (1994), este procedimiento soluciona
los dos problemas prcticos del mtodo de formas paralelas: la
dificultad de desarrollar formas paralelas y la necesidad de tiempo

para las aplicaciones.
41
Para realizarlo se aplica la prueba y despus se divide en dos

mitades supuestamente equivalentes y equilibradas en relacin al
contenido y nivel de dificultad. Para la divisin puede precederse
de distintas maneras. La ms comn es la que utiliza los reactivos
pares, en una de las formas, y los impares en la otra. Sin embargo,
este tipo de divisin no puede ser manejada cuando existe alguna
desviacin sistemtica en la prueba como por ejemplo, los tipos
alternativos de reactivos o reactivos en que la respuesta depende
de la anterior (Brown, 1980).
La correlacin entre las calificaciones de las dos mitades de la
prueba proporciona una estimacin de la confiabilidad. Mientras
tanto, como cada conjunto de calificaciones est basado en la mitad
de los reactivos de la prueba original completa y la confiabilidad
de una prueba depende de su longitud, la correlacin entre las dos
mitades proporciona una estimacin de la confiabilidad inferior a
la que podra esperarse de la prueba original. Para estimar la
confiabilidad de la prueba original completa se utiliza la siguiente
frmula, propuesta por Spearman-Brown:
en d o n d e c o n f i a b i l i d a d de la prueba original completa

correlacin entre las mitades de la prueba
Este procedimiento toma en cuenta solamente dos tipos de errores

provenientes de variaciones en el procedimiento mismo de medicin
y variaciones procedentes de la muestra de tareas. Adems, presenta
algunas limitaciones como: (a) dos medias pruebas pueden ser ms
semejantes que dos formas paralelas separadas; por ejemplo, cuando
los reactivos estn basados en un mismo material de referencia
texto, experimento pueden provocar distorsiones en el coeficiente
de confiabilidad y (b) este tipo de coeficiente no tiene significado
en pruebas de tiempo limitado donde influya la rapidez; el factor
42
velocidad tender a inflar el coeficiente de confiabilidad (Brown,

1980).
Sin embargo, la utilizacin de este procedimiento presenta ventajas
prcticas importantes relacionadas a la aplicacin de un mismo
material de prueba, slo una vez. Hay que tomarse tambin en cuenta
que cuanto mayor sea la muestra de conducta de la persona, tanto
ms confiable ser la medida. Adems, entre mayor sea la muestra
de conducta registrada menos depender la medida de elementos
fortuitos en la conducta del sujeto o en la muestra especfica de
tareas. Por ello, la utilizacin de un gran nmero de reactivos es
un medio utilizado para garantizar la confiabilidad de una prueba.
3.2. Interpretacin de coeficientes de confiabilidad
Brown (1980) propone tres modos de interpretacin de los coeficientes

de confiabilidad:
Correlacin entre calificaciones reales y obtenidas - Se
puede interpretar un coeficiente de confiabilidad tomando como
base que la proporcin de la variancia en las calificaciones obtenidas
representa la variacin de las calificaciones reales. Por ejemplo
si r = 0.80, entonces 80% de la variabilidad en las calificaciones
obtenidas se debe a diferencias en las calificaciones reales y 20%
se debe a errores de medicin.
Comparacin con la confiabilidad de otras pruebas - Este
es un criterio muy utilizado para decidir si la prueba puede o no
ser considerada confiable. En este caso se compara el coeficiente
de confiabilidad de la prueba con el nivel de confiabilidad de pruebas
similares ya existentes.
Errores en las calificaciones individuales - Puede interpretarse
el coeficiente de confiabilidad evaluando el cambio que podr pasar
en la calificacin de un sujeto al volver a contestar la prueba. Para
eso hay que verificar cul es el error estndar de la medicin.
Thorndike (1975, p. 204) presenta un cuadro del error estndar
de medicin para diferentes valores del coeficiente de confiabilidad.
43
Es importante en la interpretacin de un coeficiente de confiabilidad

tener en mente que ste es especfico de la muestra utilizada, de
la situacin de prueba y del mtodo utilizado para su clculo. Por
eso hay que verificar la confiabilidad de una prueba en una gran
variedad de situaciones y con diferentes muestras y procedimientos.
3.3. Procedimientos para verificar la homogeneidad de una

prueba psicolgica
Los procedimientos para verificar la homogeneidad o consistencia

interna de una prueba buscan determinar el grado de las relaciones
recprocas entre los reactivos que la componen. Brown (1980, p.
102) afirma que "se puede definir la homogeneidad como la
consistencia en la ejecucin de todos los reactivos de una prueba
psicolgica". Una correlacin positiva entre las calificaciones de
los distintos reactivos de una prueba indica que sta es homognea.
Si la prueba est compuesta de subpruebas heterogneas, se procede
al estudio de la homogeneidad de cada subprueba, cuyos reactivos
deben por tanto ser homogneos.
Los procedimientos ms comunes para verificar la homogeneidad
o consistencia interna de una prueba son:
a) Coeficiente alfa
Este coeficiente, propuesto por Cronbach (1951), es utilizado con

bastante frecuencia . Su utilizacin es limitada a las pruebas cuyos
reactivos no son calificados de forma dictoma (correcto o incorrecto).
Su frmula es:
44
en d o n d e : n m e r o de reactivos de la prueba
sumatoria
desviacin estndar de cada reactivo
desviacin estndar de la prueba
b) Frmula de Kuder - Richardson (KR-20)
Esta frmula, propuesta por Kuder y Richardson en 1937, es

utilizada cuando se califican los reactivos de la prueba de forma
dictoma y suele ser considerada como un caso especial del coeficiente
alfa:
en donde:
nmero de reactivos de la prueba
desviacin estndar de la prueba
sumatoria
proporcin de individuos que contestan bien un reactivo
1- p= proporcin de individuos que fallan en este reactivo
Esta frmula no se aplica a pruebas psicolgicas de velocidad

pues, para el clculo del componente pq, es necesario que cada
reactivo sea probado por todas las personas, lo que no siempre
ocurre en las pruebas de velocidad.
Estos mismos autores propusieron una segunda frmula
(KR-21) que supone que todos los reactivos de la prueba
tienen el mismo grado de dificultad. Esta frmula es menos
utilizada puesto que tal situacin raramente ocurre.
c) Anlisis factorial
Este procedimiento es uno de los ms utilizados y en general es

considerado como el mejor por varios autores (Brown, 1980).
45
Mientras tanto, es un proceso complejo que supone la utilizacin

de varios mtodos de clculo. Estos mtodos utilizan la matriz de
intercorrelaciones entre los reactivos de la prueba y permiten
verificar si existe un nico factor o varios que expliquen estas
intercorrelaciones. Si existe un slo factor la prueba es considerada
homognea. Si son varios factores que explican las intercorrelaciones
significa que, aunque la prueba es heterognea, existen subpruebas
compuestas por conjuntos de reactivos homogneos. Este
procedimiento permite tambin detectar los reactivos que no tienen
relacin con el factor principal, ni con ninguno de los factores que
componen la prueba.
Finalmente, todos los puntos discutidos en este captulo deben
ser examinados cuando se pretende utilizar una determinada prueba
psicolgica para estar seguro, no slo de sus cualidades mtricas,
sino tambin de sus lmites. Todo manual de prueba debe proveer
informacin suficiente sobre estos aspectos y todo psiclogo debe
saber cmo interpretarlos.
Anastasi, A. (1978). Tests psicolgicos (3 a ed., 4a reimpresin)

Bacher, F. (1981). Les etiquetes en Psychologie. Tesis indita
de Doctorado en Psicologa, Universit de Pars V, Pars
Brown, F.G. (1980). Principios de medicin en Psicologa y
Educacin. Mxico D.F.: Editorial El Manual Moderno.
Cronbach, L.J. (1951). Alpha and the internal structure of tests.
Psychometrika, 16, 297-334.
Murphy, K. R. y Davidshofer, CO. (1994). Psychological Tes-
ting - Principles Applications. New Jersey: Prentice Hall.
Thorndike, L. R. Y Hagen, E. (1973). Tests y tcnica de medi-
cin en psicologa y educacin. Mxico: Editorial Trillas.
46
CAPITULO III
UNIDADES DE CALIFICACIN DE LAS
PRUEBAS PSICOLGICAS
Las respuestas de un individuo a una prueba psicolgica
determinan su calificacin bruta, tambin llamada original
o directa. Esta calificacin carece de significado si no es
comparada a una norma, o sea a la ejecucin promedio de
un grupo de individuos. Esta comparacin permite determinar
la posicin exacta del individuo con respecto a este grupo.
Para tal, las calificaciones brutas son transformadas, mediante
diferentes procedimientos estadsticos, en calificaciones
derivadas (o transformadas o ponderadas). Las calificaciones
derivadas tienen como objetivo fundamental propiciar la
comparacin de las calificaciones obtenidas en diferentes
pruebas, expresndolas en un mismo tipo de unidad.
Existen varios tipos de puntuaciones derivadas, que suponen
diferentes procedimientos estadsticos para su obtencin.
Anastasi (1978) las clasifica en tres tipos principales: de
edad o cronolgicas, percentiles y tpicas.
Para comprender e interpretar estas calificaciones se
requiere de nociones bsicas de estadsticas como: media,
mediana, moda, desviacin estndar, curva normal y rango.
No es objetivo de este manual aportar este tipo de informacin,
que puede ser encontrada en cualquier libro de estadstica.
A. PUNTUACIONES DE EDAD
1. Cociente intelectual de razn (CI)
El CI de razn se emple por primera vez en la forma del

47
Stanford-Binet de 1916, aunque su idea surgi anteriormente

con Stern y Kuhlmann. La frmula para obtenerlo es:
donde: EM= edad mental

EC= edad cronolgica
La edad mental es el nivel de edad que corresponde a la

calificacin recibida por el nio en la ejecucin de la prueba.
Por ejemplo, un nio de 8 aos que obtiene una puntuacin
que corresponde a la puntuacin promedio de los nios de
10 aos, posee una edad mental de 10 aos.
El CI de razn fue muy utilizado en las primeras pruebas
de inteligencia, lo que ya no ocurre actualmente, debido a
sus limitaciones e inconvenientes. Algunos de stos son: (a)
las normas de edad dejan de tener un significado claro cuando
utilizadas con adultos normales o superiores, (b) la distribucin
de los CI proporciona desviaciones estndar variables (de 12
a 20 puntos) segn la edad (Terman y Merril, 1937 en Brown,
1980), lo que no permite comparar, de manera confiable, CI
obtenidos a distintas edades, (c) el CI no es aplicable a las
funciones que no muestran un cambio claro y consistente con
la edad.
2. Cociente educacional
Este cociente, aplicado a las pruebas de rendimiento escolar,

se obtiene de manera similar al cociente intelectual, pero en
este caso se utiliza la edad educacional en lugar de la edad
mental. Su frmula es: CE = EE x 100 / EC.
El cociente educacional posee las mismas limitaciones del
CI y por lo tanto " n o se pueden hacer comparaciones entre
una materia y otra, aun cuando las pruebas hayan sido
estandarizadas con el mismo grupo" (Morales, 1993, p. 65).
48
B. RANGOS PERCENTILES
Este tipo de puntuacin derivada es una de las ms utilizadas

por su facilidad de interpretacin. Esta se expresa en funcin
del porcentaje de personas del grupo normativo, que obtienen
calificaciones ms bajas. As, un percentil de 65 indica que
6 5 % de los sujetos del grupo normativo obtuvieron
calificaciones inferiores. Es importante no confundir el uso
del porcentaje de personas, en el caso del percentil, con la
idea de porcentaje de respuestas correctas. En otras palabras,
un percentil de 65 no significa que el sujeto respondi
correctamente a 65% de los reactivos, sino que 65% de los
sujetos obtuvieron calificaciones inferiores a la suya. La
forma grfica utilizada para expresar los rangos percentiles
es llamada ojiva.
La obtencin de los rangos percentiles supone el siguiente
procedimiento:
1) Ordenar las calificaciones brutas obtenidas por el grupo
normativo de la menor hasta la mayor.
2) Calcular la frecuencia de cada calificacin
3) Calcular la frecuencia acumulada (F A) a cada aplicacin,
sumando la frecuencia de la calificacin ms baja con la
frecuencia de la calificacin siguiente y as sucesivamente
hasta la calificacin ms alta.
4) Determinar el punto medio de cada frecuencia acumulada
(FA ). Para la FA ms baja, se aade a sta un cero y se
divide entre dos. El resultado es el punto medio de esta FA.
En seguida se pasa a la FA siguiente, a la cual se suma la
FA ms baja, dividiendo el resultado entre dos. Se sigue este
procedimiento hasta la FA ms alta.
5) Convertir la frecuencia acumulada a cada punto medio
(FApm) a porcentaje acumulada a cada punto medio (PApm),
a travs de la frmula: P A p m = 100 x FApm / N, donde N
es el nmero total de casos.
49
6) Hallar los rangos percentiles, convirtiendo los valores

de los PApm a nmeros enteros, a excepcin del 1 para el 0
y del 99 para el 100.
La tabla 3.1. ofrece un ejemplo de este procedimiento,
utilizando los resultados, en una prueba, de una muestra de
100 personas.
As, puede decirse que un sujeto que obtuvo una calificacin
bruta de 34 est situado en el rango percentil 80, lo que
significa que 80% de los sujetos obtuvieron calificaciones
inferiores a la suya en la prueba y 20%, calificaciones
superiores.
TABLA 3.1
Obtencin de rangos percentilares
21 2 2 1.0 1.0 1
22 2 4 3.0 3.0 3
23 6 10 7.0 7.0 7
24 3 13 115 11.5 11
25 5 18 15.5 15.5 15
26 5 23 20.5 20.5 20
27 7 30 26.5 26.5 26
28 6 36 33.0 33.0 33
29 8 44 40.0 40.0 40
30 13 57 50.5 50.5 50
31 7 64 60.5 60.5 60
32 6 70 67.0 67.0 67
33 7 77 73.5 73.5 73
34 6 83 80.0 80.0 80
35 4 87 85.0 85.0 85
36 3 90 88.5 88.5 88
37 5 95 92.5 92.5 92
38 2 97 96.0 96.0 96
39 2 99 98.0 98.0 98
40 1 100 99.5 99.5 99+
50
La gran ventaja de los percentiles es la facilidad de su

clculo e interpretacin. Adems, pueden ser empleados con
nios y adultos y con distintos tipos de tests (aptitud,
inteligencia, personalidad).
Mientras tanto, presentan dos limitaciones importantes
(Brown, 1980). Primero, por ser una escala ordinal, sus
valores no se pueden sumar, restar, multiplicar o dividir, lo
que impide la utilizacin de ciertos anlisis estadsticos.
Segundo, presentan una distribucin rectangular, en las que
las puntuaciones brutas, en general, se aproximan de la curva
normal, lo que provoca que: (a) las diferencias de las
puntuaciones brutas, prximas al centro de la distribucin, se
exageren en la transformacin a percentil y (b) las diferencias de
las puntuaciones brutas, cerca de los extremos de la distribucin,
se reduzcan considerablemente en la transformacin a percentil.
Con eso, los rangos percentilares pueden, a veces, ser mal
interpretados. Anastasi (1978, p.55), advierte: "los percen-
tiles presentan un cuadro correcto de la posicin relativa de
cada individuo en el grupo normativo, pero no de la cuanta
de la diferencia entre su puntuacin y la de otra persona".
Para resolver esta limitacin algunas pruebas como el D. A.T.
(Test de Aptitud Diferencial) utilizan, para presentar los
resultados en percentiles, un papel probabilstico aritmtico
que proporciona una representacin visual correcta de las
diferencias entre las puntuaciones de las distintas subescalas.
Este papel es " u n papel cuadriculado en el cual las lneas
verticales se encuentran espaciadas de la misma forma que
los percentiles en una distribucin normal..., mientras que
las lneas horizontales se encuentran uniformemente
espaciadas, o viceversa" (dem, p.55).
C. CALIFICACIONES TPICAS (o estndar)
Este tipo de puntuacin es muy utilizado en pruebas
51
psicolgicas por sus ventajas, principalmente por la de ser

una escala de intervalo y permitir, por lo tanto, la realizacin
de varios anlisis estadsticos.
Las calificaciones tpicas expresan, en unidades de
desviacin estndar, la distancia del sujeto con respecto al
promedio del grupo.
1. Calificaciones tpicas lineales
Estas calificaciones son obtenidas a travs de una

transformacin lineal de las calificaciones brutas. Por eso,
muestran la misma estructura de la distribucin de las
calificaciones brutas.
1.1. Calificacin z
La calificacin tpica lineal bsica es la calificacin z. Su

frmula es:
z = X - X
S
donde: X= calificacin del sujeto

X= promedio de la calificacin de la muestra
s = desviacin estndar de esta muestra
La calificacin z se expresa en una escala que tiene una

media de 0 y una desviacin estndar de 1. El valor de z indica
la distancia en que se encuentra la calificacin bruta del
promedio. Si z tiene un signo positivo indica que la calificacin
bruta est arriba del promedio, mientras que un z negativo
indica que la calificacin bruta est abajo del promedio. En
una distribucin normal z varia aproximadamente de -3 a +3.
52
Para evitar los valores negativos y decimales proporcionados

por la calificacin z, se han diseado otras calificaciones
estndar lineales, obtenidas a partir de sta, a travs de una
nueva transformacin lineal. Para convertir la calificacin
z a la nueva escala se multiplica aqulla por la desviacin
estndar deseada y a este resultado se aade la media deseada.
En seguida sern presentadas algunos tipos de calificaciones
que utilizan este procedimiento.
1.2. Calificacin T
En estas calificaciones se considera una media de 50 y una

desviacin estndar de 10, lo que proporciona la siguiente
frmula:
T = l0z + 50
1.3. Calificaciones AGCT
Estas calificaciones fueron originalmente usadas en la prueba

de inteligencia general ARMY (Army General Classification
Test), de donde proviene su denominacin. Esta prueba fue
utilizada para seleccionar soldados para la Primera Guerra
Mundial. En esta situacin la media fue de 100 y la desviacin
estndar de 20. Por eso su frmula es:
AGCT = 20z + 100
1.4. Calificaciones CEEB
La sigla utilizada para denominar estas calificaciones proviene del

College Entrance Examination Board, donde stas fueron utilizadas
por primera vez. En este caso, se considera una media de 500 y
una desviacin estndar de 100. Su frmula es:
53
CEEB = l00z + 500
1.5. CI de desviacin estndar (CIs)
Estos CI, muy distintos de los CI originales, basados en la

relacin entre edad mental y edad cronolgica, son otro tipo
de puntuacin tpica con una media de 100 y una desviacin
estndar prxima a la de la distribucin de la prueba de
inteligencia Stanford-Binet (revisin de 1960). En el caso de
esta revisin la desviacin estndar obtenida fue de 16 y por
lo tanto la frmula del CI de desviacin proporcionada por
esta prueba es:
CIs = 16z + 100
Mientras tanto, se ha observado que la desviacin estndar

puede variar de una prueba a otra, aunque se utilice la misma
unidad de medida. Por ejemplo, la desviacin estndar de las
pruebas de inteligencia Wechsler (WAIS, WISC, WPPSI) es
de 15, y la frmula del CI obtenido con estas pruebas es:
CIs = 15z + 100
Por eso, hay que tener cuidado al comparar los CI de

desviacin de pruebas diferentes. Estos, slo pueden ser
comparados cuando emplean valores iguales o muy parecidos
de desviacin estndar. Por ejemplo, al interpretar los resultados
de un nio que, a los 8 aos, obtuvo un CI de desviacin de
124 en una prueba cuya desviacin estndar es de 12 y que,
a los 10 aos, obtuvo un CI de desviacin de 136 en una prueba
cuya desviacin estndar es de 18, se puede errneamente
pensar que este nio ha desarrollado su capacidad intelectual
en este periodo. En realidad, los dos CI resultan de una misma
calificacin z (+2), como indican las operaciones abajo,
representando as la misma medida de la capacidad intelectual.
54
12 x (+2) + 100 = 124 18 x (+2) + 100 = 136
El inconveniente de las puntuaciones tpicas lineales se

presenta cuando se necesita comparar puntuaciones obtenidas
en diferentes pruebas. Estas, solamente podrn ser utilizadas
cuando la forma de la distribucin de las puntuaciones de
las distintas pruebas es similar. Para poder comparar
puntuaciones obtenidas en distribuciones de forma distinta,
se emplean transformaciones no lineales, como las
calificaciones tpicas normalizadas.
2. Calificaciones tpicas normalizadas
Estas calificaciones "estn expresadas en funcin de una

distribucin que se ha transformado para que se adapte a una
curva normal" (Anastasi, 1978, p. 57) y son calculadas a
travs del siguiente procedimiento:
1) Ordenar las calificaciones brutas
2) Hallar la frecuencia de cada calificacin
3) Calcular la frecuencia acumulada a cada calificacin (FA)
4) Determinar el punto medio de la frecuencia acumulada
de cada calificacin (FApm)
5) Convertir la frecuencia acumulada a cada punto medio
a porcentaje acumulada (PApm)
6) En el cuadro de zonas de la curva normal 1 , hallar la
calificacin z correspondiente a cada porcentaje acumulado.
Las cinco primeras etapas de este procedimiento son idnticas
a las utilizadas en el clculo de rangos percentiles (ver tabla
3.1). Las calificaciones tpicas normalizadas tambin pueden
ser transformadas a otras escalas, utilizando cualquier media
y cualquier desviacin estndar arbitraria.
1
Este cuadro puede ser encontrado en diversos manuales de estadstica.
55
2.1. Calificaciones T escaladas

Se utilizan los mismos valores usados en la calificacin T, media
de 50 y desviacin estndar de 10, entonces, T = l0z + 50
2.2. CI de desviacin
La media utilizada es de 100 y la desviacin estndar puede

ser establecida por el autor de la prueba, siendo, en general,
cercana de 16. Por ejemplo: CI = 16z + 100.
2.3. Calificaciones estaninas
La escala estanina es una calificacin estndar de 9 intervalos,

con una media de 5 y una desviacin estndar de 2. Para
convertir las puntuaciones brutas en estaninas debe procederse
de la siguiente manera:
1) Disponer las puntuaciones brutas por orden de tamao.
2) Calcular el nmero de casos correspondientes a cada
estanina, de acuerdo con los porcentajes de la curva normal,
como indica la tabla 3.2. Por ejemplo, si el grupo es de 100
personas, a las cuatro de puntuaciones ms bajas se atribuye
la estanina 1, a las siete siguientes, la estanina 2 y as
sucesivamente.
TABLA 3.2
Porcentaje de la curva normal utilizada para la conversin a estaninas
Porcentaje 4 7 12 17 20 17 12 7 4
Estanina 1 2 3 4 5 6 7 8 9
2.4. Calificaciones estn
Son similares a las anteriores, siendo que en este caso son

diez unidades estndar (1-10). "Tienen cinco unidades
56
normalizadas de cada lado de la media y poseen media desviacin

estndar de amplitud, excepto en los extremos 1 y 10 que son
abiertos" (Morales, 1993, p. 62). El procedimiento de obtencin
es anlogo al de las estaninas, aunque los porcentajes asignados
son diferentes.
2.5. Calificaciones C escaladas
Tambin similares a las dos ltimas, pero tienen once unidades

estndar, con valores de 0 a 10. Son obtenidas de modo
similar, pero los porcentajes se distribuyen diferente.
Las calificaciones tpicas normalizadas son las que mejor
se aplican a la mayora de los casos. Mientras tanto, Anastasi
(1978) hace nfasis en las objeciones tcnicas provenientes
de la normalizacin de distribuciones. Segn ella, este tipo
de calificaciones debe ser solamente utilizado cuando la
muestra es grande y representativa y cuando existen motivos
para creer que la desviacin de la normalidad proviene de
defectos en la prueba y no de la muestra o de otros factores
que afecten la conducta medida.
D. TABLAS DE NORMAS DE CALIFICACIN
Los manuales de pruebas deben ser siempre acompaados

de tablas de normas de calificacin que permiten ubicar la
ejecucin de un individuo dentro de un grupo o de diferentes
grupos ( por sexo, por edad, por grado, etc.). Estas tablas
pueden ser construidas a partir de diferentes tipos de
calificaciones: normas de edad, normas percentilares, normas
de calificaciones tpicas, etc.
Una tabla de normas deber contener las calificaciones
brutas y sus correspondientes calificaciones derivadas y ser
acompaada de la descripcin de la muestra de sujetos a
partir de la cual fue elaborada.
57
Anastasi, A. (1978). Tests psicolgicos (3 a ed., 4a reimpresin).

y Educacin. Mxico D.F.: Editorial El Manual Moderno.
Morales, M.L. (1993). Psicometra Aplicada (2a ed., 2a reimpresin).
Mxico D.F.: Editorial Trillas.
SEGUNDA PARTE
INTELIGENCIA
II I I .1 I I 11
CAPITULO IV
LA INTELIGENCIA
A. LA DEFINICIN DE INTELIGENCIA
lVluchos tericos como Binet, Spearman, Thurstone, Guilford,

Piaget, Wechsler, entre otros, propusieron definiciones para el
concepto de inteligencia. Dorsch (1976), en su Diccionario de
Psicologa, seala que la mayora de las definiciones apunta como
caracterstica principal de la inteligencia ''la capacidad de orientarse
en situaciones nuevas a base de comprensiones, o de resolver tareas
con la ayuda del pensamiento, no siendo la experiencia lo decisivo,
sino mas bien la comprensin de lo planteado y de sus relaciones"
(p. 506).
Pueden distinguirse tres enfoques tericos en la medida de la
inteligencia (Aubret y col., 1991):
1. El enfoque emprico
Se basa en una definicin amplia de la inteligencia, prxima a la

del sentido comn. Est representado en las primeras pruebas de
inteligencia (Binet-Simon), que fueron construidas a partir de la
experiencia prctica, sobre todo con el objetivo de diagnstico o
de resolver dificultades escolares (ver captulo I).
2. El enfoque factorial
El mtodo estadstico de anlisis factorial, introducido por Spearman

en 1904, ha permitido grandes avances en la investigacin y
medicin de la inteligencia.
61
La Teora de los Dos Factores o Teora Bifactorial,

formulada por Spearman, fue el primero de los modelos que
representaran al enfoque factorial. Esta teora seala que
todas las habilidades del hombre tienen un factor comn
(factor g) y uno especfico a cada una de ellas (factor e). El
factor g, de inteligencia general, es intraindividualmente
constante e interindividualmente variable. El factor e, es
variable intra e interindividualmente, por lo tanto es especfico
de cada habilidad particular (Raven, 1987). Varias pruebas
fueron pues construidas para medir, lo mejor posible el factor
g, como es el caso de la Prueba de Matrices Progresivas de
Raven y del Test de Domins de Anstey.
Otro modelo, el multifactorial, defendido principalmente
por Thurstone, considera que la inteligencia es compuesta por
un nmero limitado de habilidades primarias llamadas factores
de grupo, sin que resulte necesaria la existencia de un factor
comn. Sin embargo, la verificacin de que estos factores de
grupo son slo relativamente independientes llev a la idea
de que la correlacin entre dos de estos factores implica la
existencia de un factor general, que la correlacin entre dos
factores generales implica otro factor ms general, etc. La
inteligencia, en este caso, es concebida como un conjunto de
factores distribuidos jerrquicamente de la siguiente manera:
uno o ms generales, algunos de grupo y varios especficos.
El modelo tridimensional de Guilford (1956, 1967, 1970)
considera que la estructura intelectual es compuesta de
habilidades que son clasificadas de tres maneras: (a) en trminos
de operaciones: cognicin, memoria, pensamiento divergente,
pensamiento convergente o evaluacin; (b) en trmino de
contenidos de estas operaciones: figurativo, simblico
semntico o conductual; (c) en trmino de producto: unidades,
clases, relaciones, sistemas, transformaciones o implicaciones.
Cuando se combinan las tres clasificaciones se obtiene un
modelo cbico, con 120 celdillas (5 operaciones X 4 contenidos
X 6 productos), cada una de las cuales representa una habilidad.
62
La mayora de estas habilidades ya ha sido demostrada en

investigaciones (Guilford y Hoepfner, 1971).
3) El enfoque gentico
Este enfoque tiene origen en la teora de Jean Piaget. Segn

este autor " l a inteligencia constituye el estado de equilibrio
hacia el cual tienden todas las adaptaciones sucesivas de
orden sensomotor y cognoscitivo, as como todos los
intercambios asimiladores y acomodadores entre el organismo
y el medio" (Piaget, 1972, p.23). Segn Ginsburg y Opper
(1977) el concepto de inteligencia propuesto por Piaget supone
"una serie de adaptaciones biolgicas, un equilibrio entre
el individuo y el medio ambiente, una evolucin gradual y
una actividad mental"(p. 13). Piaget no se preocupa en
describir las diferencias individuales, ni el nivel medio de
funcionamiento cognoscitivo, pero s el nivel ptimo en una
determinada etapa del desarrollo.
Piaget (1972) toma en cuenta tres aspectos en su concepcin
de la inteligencia: el contenido, la funcin y la estructura.
El contenido, uno de los aspectos ms sencillos del
pensamiento, es el que el individuo expresa en un determinado
momento. La estructura est representada, de un lado, por
los factores biolgicos hereditarios, las estructuras fsicas
(ejemplo: el sistema nervioso) y las reacciones conductuales
automticas (ejemplo: los reflejos) y del otro, por las
estructuras psicolgicas, estructuras organizadas de conducta
que no pueden ser explicadas completamente por lo hereditario
pues se basan en alguna experiencia (ejemplo: esquema de
chupar el dedo). La funcin se refiere a los principios generales
de funcionamiento que afectan la inteligencia: la organizacin
y la adaptacin. La organizacin es " l a tendencia que tienen
todas las especies a sistematizar u organizar sus procesos
en sistemas coherentes que pueden ser fsicos o psicolgicos
63
(p. 16). La adaptacin, que implica la interaccin del individuo

con su medio ambiente, es descrita en funcin de dos procesos
complementarios: la asimilacin y la acomodacin. En el
primero, el individuo utiliza sus estructuras para incorporar,
asimilar, elementos del medio ambiente. En el segundo, el
individuo modifica o acomoda su estructura para enfrentarse
a las exigencias del medio.
Finalmente, el individuo tiende a buscar un equilibrio con
el medio ambiente, utilizando para este fin las funciones de
organizacin y adaptacin. A lo largo de las diferentes etapas
del desarrollo intelectual, son utilizadas distintas estructuras
psicolgicas, con el objetivo de alcanzar una mayor eficacia
en la interaccin con la realidad.
Piaget nunca se preocup en estandarizar las pruebas que
construy para estudiar las estructuras lgicas del pensamiento.
Un investigador francs del I.N.E.T.O.P. (Institu National
du Travail et de IOrientation Professionnelle), F. Longeot,
interesado en la teora de Piaget, desarroll la escala E.P.L.
(Echelle du Dveloppement de la Pense Logique), presentada
en 1965 (Aubret y col., 1991).
B. LA MEDICIN DE LA INTELIGENCIA
Son muchas las pruebas de inteligencia construidas hasta el

presente momento. Algunas de fcil aplicacin y calificacin,
otras ms complicadas que requieren un examinador
suficientemente entrenado y con amplia experiencia. Algunas
que slo pueden ser aplicadas en forma individual y otras que
pueden tambin ser aplicadas colectivamente. Unas para nios
y adultos, otras construidas especficamente para nios o para
adultos. Unas estandarizadas en una nica muestra y otras
estandarizadas en distintas muestras. Unas ms vlidas y
confiables que otras. De cualquier manera, toda prueba tiene
sus ventajas y desventajas que dependen tambin del uso que
64
el psiclogo va a hacer de ella. Lo importante es disponer

de la informacin bsica sobre las distintas pruebas para que
uno pueda decidir cul de ellas es la que conviene ms a
un determinado fin.
Este manual tiene como objetivo principal proporcionar
el conocimiento bsico con respecto a las pruebas de
inteligencia ms comnmente utilizadas, facilitando as la
eleccin de un instrumento de medida adecuado, cuando se
hace necesario la evaluacin de la capacidad intelectual. Es
importante sealar que la informacin aportada por el presente
manual no sustituye, en hiptesis alguna, la informacin
proporcionada por los manuales de las pruebas. La informacin
presentada en este manual sirve como una primera
aproximacin al conocimiento de algunas de las pruebas de
inteligencia. La utilizacin de una prueba requiere de la
consulta de su manual.
Los captulos de esta segunda parte sern dedicados a la
presentacin, sucinta y organizada, de distintas pruebas de
inteligencia. Sern analizados, en cada prueba, los siguientes
aspectos: aspectos histricos, descripcin de la prueba,
material, poblacin con la que se utiliza, forma de
administracin, tiempo de administracin, procedimiento de
administracin, procedimiento de calificacin, normas,
confiabilidad y validez. Adems, se incluir un apartado de
"Comentarios", cuyo objetivo es aportar opiniones expresadas
por distintos tericos, as como observaciones del propio
autor, provenientes de su experiencia en la utilizacin de la
prueba.
Aubret, F., Aubret, J, Chartier, D., Chaudagne, H., Francequin-

Chartier, G., Huetau, M., Porlier, J - C , Rozencwajg,
P. y Vrignaud, P. (1991). Evaluer I'intelligence.
Manuscrito no publicado, I.N.E.T.O.P., Pars, Francia.
65
Dorsch, F.(1976). Diccionario de Psicologa. Barcelona:

Editorial Herder.
Ginsburg, H. Y Opper, S. (1977). Piaget y la teora del
desarrollo intelectual. Madrid: Editorial Paids.
Guilforf, J.P. (1956). The structure of intellect. Psychologi-
cal Bulletin, 53, 267-293.
,(1967). The nature of human intelligence. Nueva York:
McGraw Hill.
, (1970). Creativity: Retrospect and Prospect. Journal
of Creative Behavior, 4(3), 149-168.
, y Hoepfner, R. (1971). The analysis of intelligence.
Nueva York: McGraw Hill.
Piaget, J. (1972). Psicologa de la inteligencia. Buenos Aires:
Editorial Psique.
Rapaport, D. (1965). Test de diagnstico psicolgico. Buenos
Aires: Editorial Paids.
Raven, J. C. (1987). Test de Matrices Progresivas. Buenos
Aires: Paids
66
CAPITULO V
ESCALA DE INTELIGENCIA
STANFORD-BINET
1. ASPECTOS HISTORICOS
Esta escala es derivada de la Escala de Inteligencia Binet-

Simon, creada en 1905 y revisada en 1908 y 1911. La primera
versin del Stanford-Binet fue publicada por Terman en 1916
y obtuvo gran xito sobre todo por introducir el concepto
de CI (Cociente Intelectual), por proporcionar instrucciones
detalladas de aplicacin y calificacin y por utilizar una
muestra representativa de la poblacin americana de cerca
de 1,400 sujetos para su estandarizacin (Terman y Merrill,
1973).
En 1937 fue publicada la segunda revisin. En sta, se
construyeron dos formas paralelas, L y M, que cubran
rangos de edades de los 2 aos hasta la edad adulta y que
fueron estandarizadas en una muestra de ms de 3,000 sujetos.
La tercera revisin, realizada en 1960, presentaba una
nica forma LM, que inclua los mejores reactivos de las
formas L y M publicadas anteriormente. En esta revisin
no se utiliz una nueva muestra de estandarizacin, sino que
se aprovecharon las respuestas de 4,498 personas, entre 2
y 18 aos, que haban contestado una de las dos formas, L
o M, entre 1950 y 1954. La seleccin de los mejores reactivos
fue realizada a travs de varios procedimientos. Las
modificaciones realizadas consistieron en la eliminacin de
algunos reactivos y reubicacin de otros, proporcionando
67
una nueva distribucin de stos en los diferentes niveles de

edad. No se introdujo nuevos materiales, aunque en algunos
reactivos se actualizaron los dibujos. Un aspecto importante
de esta revisin fue el inicio de la utilizacin del CI de
desviacin para eliminar los inconvenientes estadsticos del
CI de razn (Terman y Merrill, 1973).
En 1972, se llev a cabo una reestandarizacin sistemtica
de la forma LM. El material se mantuvo prcticamente el
mismo, fueron cambiados un diseo de una tarjeta (mueca)
y una palabra de la subprueba Semejanzas. Los procedimientos
de administracin y calificacin no fueron alterados. Se
utiliz una muestra representativa de la poblacin americana
de cerca de 100 sujetos para cada nivel de edad.
2. DESCRIPCIN DE LA PRUEBA
La prueba Stanford-Binet es compuesta de varias subpruebas

agrupadas segn niveles de edad. La prueba considera 20
niveles de edad, desde la edad de 2 aos hasta la adulta
superior. Entre 2 y 5 aos las subpruebas se agrupan por
intervalos de medio ao y entre 5 y 14 aos, se agrupan por
intervalos anuales. Hay adems un nivel adulto promedio y
tres niveles adulto superiores (I, II y III). Para cada nivel
de edad existen seis subpruebas, excepto para el nivel adulto
promedio que tiene ocho. La dificultad de las subpruebas es
uniforme en cada nivel. Para cada nivel, existe una subprueba
extra que puede ser utilizada en caso de anulacin de una
de las subpruebas originales. Sin embargo, la subprueba
extra no debe sustituir una subprueba original en la cual
fracasa el sujeto.
Una determinada subprueba puede aparecer slo en un
nivel de edad o en varios. Las subpruebas utilizadas en los
niveles de edad ms bajos hacen hincapi en las capacidades
sensoriales y motoras. Algunas de stas son: identificacin
68
de partes del cuerpo u objetos, torre de cubos de construccin,

vocabulario de imgenes, comparacin de barras, copia de
crculo, combinacin de palabras, etc. Para nios mayores,
las subpruebas empiezan a exigir capacidades verbales y
conceptos numricos. En este caso las subpruebas son del
tipo: vocabulario, palabras abstractas, repeticin de dgitos,
orientacin, memoria (palabras y dibujos), cuenta de cubos,
juicio prctico, etc. Para los adultos, son utilizadas sobre
todo subpruebas de contenido verbal, simblico y abstracto,
como: vocabulario, analogas, interpretacin de proverbios,
frases desordenadas, entre otras.
3. MATERIAL
La prueba es compuesta de distintos materiales que son

utilizados en las diferentes subpruebas. Se encuentran
juguetes, tarjetas impresas, cubos, objetos de diferentes
tipos (coches, muecos, animales) que estn acondicionados
en una maleta, junto con el manual de la prueba y el cuaderno
de respuestas.
4. POBLACIN CON LA QUE SE UTILIZA
La prueba puede ser utilizada desde dos aos de edad hasta

la edad adulta.
5. FORMA DE ADMINISTRACIN
La administracin debe ser individual. Se exige un examinador

entrenado y con amplia experiencia, puesto que la aplicacin
y la puntuacin de la mayora de las subpruebas son
relativamente complejas. Un problema adicional est en el
hecho de que cada subprueba debe ser calificada
inmediatamente despus de su aplicacin, pues la realizacin
69
subsecuente depende de la actuacin del sujeto en la subprueba

anterior.
6. TIEMPO DE ADMINISTRACIN
En nios pequeos, la aplicacin completa requiere no ms que 30

o 40 minutos y en nios mayores y adultos cerca de hora y media.
En casos excepcionales, la administracin requiere demasiado tiempo
y es conveniente dividirla en dos sesiones.
7. PROCEDIMIENTO DE ADMINISTRACIN
El primer paso es llenar los datos personales del examinado

en el cuaderno de respuestas. Nadie contesta todas las
subpruebas del Stanford-Binet, solamente las que correspondan
a una amplitud de niveles de edad adecuados a su nivel
intelectual. Se inicia la aplicacin por un nivel de edad
ligeramente inferior al de la edad mental que se espera tenga
el sujeto. Si el sujeto fracasa en alguna de las subpruebas
de este nivel, se le aplica el nivel inmediatamente inferior.
La aplicacin sigue hasta llegar a un nivel en que todas las
subpruebas sean resueltas con xito. Este nivel es denominado
edad basal. En seguida, se contina la aplicacin hasta el
nivel en que ninguna de las subpruebas es contestada
correctamente. Este nivel es llamado edad tope. Aqu se
suspende la aplicacin.
Es importante mencionar la existencia de una escala
abreviada. En cada nivel de edad, fueron elegidas cuatro
subpruebas para constituir la escala abreviada, tomando en
cuenta la validez y representatividad. Estas subpruebas estn
marcadas con un asterisco en el cuaderno de respuestas. La
escala reducida solamente debe ser utilizada cuando no hay
tiempo suficiente para una aplicacin completa.
70
8. PROCEDIMIENTO DE CALIFICACIN
La respuesta a un reactivo es calificada comparndola a una

lista de respuestas correctas presentadas en el manual de la
prueba. La calificacin no proporciona crditos parciales,
utiliza el sistema de todo o nada. En general, las subpruebas
correctamente contestadas por un individuo se extienden a
varios niveles de edad, limitados en un extremo por su edad
basal y en el otro por su edad tope. Para calcular la edad
mental de un sujeto en esta prueba, se parte de su edad basal
y se aade a sta los meses correspondientes por cada
subprueba que realice correctamente ms all de este nivel.
Para hallar su CI, se utilizan las tablas que se encuentran
en el manual (Terman y Merrill, 1973). Se busca la tabla
correspondiente a la edad mental del sujeto, se localiza su
edad cronolgica en la respectiva columna y se halla su CI
de desviacin. En el manual se encuentran dos conjuntos de
normas, uno que corresponde a la revisin de 1960 y otro
a la reestandarizacin de 1972.
9. NORMAS
Los inconvenientes observados en la utilizacin del CI de

razn (ver primer captulo y Terman y Merrill, 1973) llevaron
a la utilizacin del CI de desviacin a partir de la revisin
de 1960. Estos CI de desviacin, como se ha explicado
anteriormente, son calificaciones estandarizadas con una
media de 100 y desviacin estndar de 16 puntos. Su prin-
cipal ventaja es presentar resultados comparables en todos
los niveles de edad.
Las normas obtenidas en la reestandarizacin de 1972
provienen de una muestra representativa de la poblacin
americana de cerca de 100 sujetos en cada uno de los 20
niveles de edad.
71
10. CONFIABILIDAD Y VALIDEZ
Distintos estudios han demostrado el alto nivel de confabilidad

del Stanford-Binet. Los valores obtenidos para el coeficiente
de equivalencia y estabilidad de las formas L y M, aplicadas
con una semana de intervalo o menos, son de .90 o ms. En
general, se ha observado que el coeficiente de confabilidad
es ms alto en las muestras de nios mayores y en aquellas
de nios que presentan CI ms bajos. Los ndices de confabilidad
obtenidos indican que el error estndar de la medida es de
cinco puntos de CI (Brown, 1980; Anastasi, 1978).
El estudio de las subpruebas de la forma LM, realizado
en 1960, utilizando la correlacin biserial (correlacin entre
cada subprueba y la escala total) indica una correlacin
biserial promedio de 0.66, lo que asegura que la prueba tiene
una buena consistencia interna (Terman y Merrill, 1973).
La validez estructural ha sido tambin comprobada por
varios anlisis factoriales, que constataron la existencia de
un factor general aunque no excluyeron la posibilidad de que
existan factores de grupo en algunos niveles de edad. La
validez predictiva o de criterio fue tambin estudiada. Los
coeficientes de correlacin encontrados entre el CI del Stanford-
Binet y calificaciones escolares, evaluaciones de maestros y
resultados en pruebas de rendimiento varan entre .40 y .75
(Anastasi, 1978).
11. COMENTARIOS
No se puede negar la importancia histrica de la prueba Stan-

ford-Binet en la medida de la inteligencia. Tampoco la calidad
tcnica de su proceso de construccin, su eficiencia y amplia
aceptacin a lo largo de los aos.
Sin embargo, Anastasi (1978) apunta algunos lmites de
la prueba, a los cuales uno debe estar atento:
72
La medida est muy cargada de funciones verbales,

sobre todo en los niveles de edad superiores, lo que llevara
a los individuos con deficiencia de lenguaje a obtener resultados
relativamente bajos.
La prueba es inadecuada para medir aptitudes diferenciales
pues: (a) no se encuentran las mismas subpruebas a todos los niveles
de edad; (b) el nmero de subpruebas de cada tipo es muy reducido
para que se pueda determinar, de manera precisa, la realizacin
de un individuo en un grupo especfico de subpruebas y (c) es
difcil determinar cuales son las funciones medidas por una subprueba,
solamente a travs de la observacin de su contenido.
La prueba es inadecuada para adultos sobre todo en
la amplitud normal y superior. Aunque se utilicen tres niveles
de adulto superior es muy difcil establecer, para la mayora
de los adultos superiores, la edad tope (la edad en que
ninguna subprueba es resuelta). Adems, el contenido de las
subpruebas del Stanford-Binet es ms apropiado para nios
que para adultos.
Anastasi, A. (1978). Tests psicolgicos (3a ed., 4a reimpresin).

Educacin. Mxico D.F.: Editorial El Manual Moderno.
Terman, L.M. y Merrill, M.A. (1972). Stanford-Binet intelli-
gence scale. Form L-M. Boston: Houghton Mifflin Com-
pany.
73
CAPITULO VI
ESCALA DE INTELIGENCIA PARA
ADULTOS (WAIS)
1. ASPECTOS HISTRICOS
La primera escala individual para la medida de la inteligencia

del adolescente y del adulto fue publicada en 1939 en Baltimore
por David WECHSLER, jefe de clnica del hospital
psiquitrico de Bellevue (New York). Esta escala era llamada
"Wechsler-Bellevue". Su construccin tom como base la
concepcin global de la inteligencia definida por Wechsler
como ' 'la capacidad agregada o global del individuo para
actuar con propsito, para pensar racionalmente y para
habrselas de manera efectiva con su medio ambiente^
(Wechsler, 1955, p.3).
El desarrollo de esta escala ha sido impulsado por el hecho
de que las escalas existentes, no proporcionaban una medida
adecuada de la inteligencia en el adulto. No solamente el uso
de la edad mental era inapropiado para medir la inteligencia
en el adulto, sino que la mayora de los reactivos de estas
escalas estaban orientados hacia los intereses infantiles.
Adems, los adultos eran frecuentemente penalizados por el
nfasis dado a la velocidad de respuesta, en comparacin con
la exactitud, puesto que las personas ms grandes generalmente
trabajan ms despacio que los nios. Las escalas existentes
tambin presentaban fallas importantes en los procedimientos
de estandarizacin. La nueva escala tena como objetivo
superar estas dificultades.
La escala Wechsler-Bellevue dio origen, despus de algunas
75
revisiones, a la escala WAIS (Wechsler Adulte Intelligence

Scale) que surgi en 1955 en Estados Unidos. Esta nueva
escala no contena cambios significativos en cuanto a su
contenido general, construccin y organizacin. Las
modificaciones ms importantes estaban relacionadas a: a)
la muestra normativa, b) las instrucciones y calificaciones
c) el contenido para situaciones especiales (evaluacin de
sujetos con un bajo nivel intelectual). Algunos reactivos de
la escala original fueron conservados; otros fueron sustituidos
por reactivos menos ambiguos y presentados en un mejor
orden de dificultad.
En 1981, El WAIS sufri una revisin y pas a llamarse
WAIS-R (Wechsler, 1981a). El objetivo de esta ltima revisin
fue actualizar algunos contenidos y proveer nuevas normas
basadas en las puntuaciones obtenidas por muestras ms
actuales de la poblacin. Cerca del 80% de los reactivos del
WAIS-R provinieron del WAIS, intactos o modificados. Los
dems reactivos fueron nuevos. Adems, se realizaron pequeos
cambios en el procedimiento de aplicacin y de puntuacin.
El WAIS ha sido traducido y adaptado a varios idiomas,
demostrando mucha utilidad y aceptacin. La versin francesa
fue realizada por Pichot y presentada en 1968 (Vrignaud, en
Aubret y col, 1991). La versin para el idioma espaol se
llama WAIS-espaol y fue presentada en 1981 (Wechsler,
1981b).
EL WAIS ha dado origen a las dems escalas Wechsler,
WISC y WPPSI, utilizadas con nios, que sern presentadas
en los prximos captulos.
Las pruebas de Wechsler estn compuestas por dos subescalas,

una verbal y otra de ejecucin, que estn constituidas por
una serie de tests especficos (subtests). Segn Morales (1993),
76
estas escalas "son, por una parte, escalas heterogneas

intertest, debido a que miden diferentes funciones y, por
tanto, distintos factores ...; y por otra parte, son escalas
homogneas intratest, porque cada subtest mide un slo
factor en toda su amplitud"(p. 107).
Los reactivos de cada subtest son organizados en orden
creciente de dificultad. Los reactivos de los subtests se
clasifican en tres grupos: 1) reactivos que toda persona puede
contestar, tenga o no instruccin escolar, 2) reactivos que
se espera sean contestados por sujetos de instruccin escolar
media y 3) reactivos que slo pueden ser contestados por
sujetos con una instruccin especial (idem).
La escala verbal del WAIS est compuesta de seis subtests:
1) Conocimientos o Informacin, 2) Comprensin, 3)
Aritmtica, 4) Semejanzas, 5) Vocabulario y 6) Repeticin
de dgitos o retencin de dgitos. La escala de ejecucin se
compone de 5 subtests: 1) Dibujos Incompletos o Figuras
Incompletas, 2) Diseo con cubos, 3) Ordenacin de dibujos,
4) Composicin de objetos y 5) Dgitos y Smbolos o Claves.
2.1. Caractersticas de los subtests
Cada subtest solicita funciones intelectuales distintas y por

lo tanto difiere en sus caractersticas y contenidos. Las dos
medidas verbal y de ejecucin representan las diferentes
formas en que puede expresarse la inteligencia. En seguida,
sern presentadas las caractersticas especficas de cada
subtest mencionadas por Wechsler (1955), Rapaport (1965),
Vrignaud (en Aubret y col., 1991) y Morales (1993).
a. Escala verbal:
Conocimientos o Informacin: Este subtest propone

cuestiones que permiten verificar la extensin de los
77
conocimientos del sujeto. Dos funciones son solicitadas: 1)

capacidad de retencin (memoria) y 2) asociacin y
organizacin de experiencias. Los resultados estn ligados
al medio ambiente cultural, a la estabilidad emocional y a
los intereses. Mientras tanto, proporcionan una buena
indicacin de la capacidad intelectual. Este subtest presenta
una buena correlacin con la escala total y sus resultados
en general se mantienen bien con la edad.
Comprensin: Este subtest depende de un cierto aprendizaje
de informaciones prcticas aunado a la habilidad de evaluar
y utilizar la experiencia. Es una prueba de juicio. Mide la
inteligencia social, la aptitud para evaluar la experiencia.
Adems, el factor verbal contribuye considerablemente al
buen desempeo en este subtest. Las funciones solicitadas
son: 1) razonamiento abstracto, 2) organizacin del
conocimiento (anlisis y sntesis), 3) capacidad de utilizar
en la prctica las experiencias y aprendizajes obtenidos y 4)
manejo de smbolos, nmeros y lenguaje. Los factores
influyentes son: a) las oportunidades culturales, b) la capacidad
para colocarse en situaciones reales y c) el juicio social y
sentido comn. Proporciona muchos datos clnicos, es sen-
sible a las psicopatas, esquizofrenias y a las actitudes
reaccionales. Presenta una buena correlacin con la escala
total y con los subtests de Conocimientos y Semejanzas. Sus
resultados se mantienen bien con la edad.
Aritmtica: Este subtest es una seal de vivacidad intelectual.
Solicita las siguientes funciones: 1) razonamiento abstracto,
2) formacin de conceptos numricos, 3) retencin de procesos
aritmticos. Los resultados son influenciados por: a) la
concentracin, b) la atencin inmediata y automtica, c) las
oportunidades ambientales para adquirir los procesos
aritmticos fundamentales y d) las reacciones emocionales y
de inhibicin escolar. Este subtest evala el saber de origen
escolar y familiar, la concentracin con relacin a la atencin,
78
la abstraccin y la memoria. Presenta una buena correlacin

con la escala total y sus resultados se mantienen medianamente
con la edad.
Semejanzas: El tipo de respuestas ofrecidas proporciona

indicios sobre el proceso de pensamiento del sujeto y su nivel
de generalizacin y abstraccin. Segn Rapaport (1965),
los sujetos buscan sus respuestas en tres planes diferentes:
concreto, funcional y abstracto. La correlacin de este subtest
con la escala total es muy buena. Sin embargo, es uno de
los tests menos estables de los subtests del grupo esencialmente
verbal. Son exigidas funciones como: 1) anlisis de relaciones
y 2) formacin de conceptos verbales (calidad). Los factores
influyentes son: a) un mnimo de oportunidades culturales,
b) la capacidad para relacionar hechos y c) la adaptacin
adecuada al medio ambiente.
Vocabulario: Subtest constituido de palabras que se sacaron
de una serie experimental, presentadas en orden de dificultad
creciente. Segn Rapaport (1965, p. 40), " l a riqueza e
integracin del Vocabulario depende, en parte, de la capacidad
de la dotacin natural y, en parte, de la riqueza cultural de
los primeros aos". El Vocabulario es refractario a la
disminucin por inadaptacin y tambin al progreso por la
instruccin o experiencia de vida. Inicialmente, Wechsler
lo utiliz como subtest complementario, y posteriormente
lo incluy regularmente. El ha constatado que este subtest
es un muy buen ndice de la inteligencia y que permite
observaciones clnicas importantes: proceso de pensamiento
del sujeto (calidad, extensin de las ideas y de la expresin),
rasgos particulares, errores sutiles, aspecto convencional,
perseveracin, redundancia, incoherencia, pudiendo llegar a
aspectos patolgicos (esquizo-epilepsia). Presenta una
correlacin muy elevada con la escala total y se mantiene
bien con la edad. Solicita funciones del tipo: 1) adquisicin
79
y desarrollo del lenguaje y 2) adquisicin y organizacin de

significados verbales. Los resultados son influenciados por:
a) las potencialidades naturales y 3) las oportunidades
culturales.
Repeticin de dgitos: Uno de los subtests ms mediocres.
Su correlacin con la escala total es mediana. Inicialmente,
Wechsler propuso que este subtest fuera utilizado como
complementario, pero despus lo incorpor a la subescala
verbal. Requiere: 1) concentracin y memoria inmediata, 2)
imaginacin auditiva y 3) imaginacin visual simultnea. Los
factores influyentes son: a) atencin inmediata, b) atencin
dirigida c) nivel de ansiedad. El fracaso en este subtest
presenta frecuentemente significacin diagnstica, siendo el
mismo utilizado para detectar deficiencia mental o defectos
orgnicos. Cuando se obtienen bajas calificaciones y stas
no estn asociadas con problemas de deficiencia u organicidad,
pueden deberse a un cierto grado de ansiedad. Sus resultados
disminuyen con la edad.
b. Escala de ejecucin:
Figuras incompletas: La tarea del sujeto es discernir la

parte esencial tomando en cuenta la forma o la funcin del
objeto. Este subtest discrimina bien los niveles mediocres e
inferiores de la inteligencia. Su correlacin con la escala total
es alta. Los resultados en este subtest se mantienen relativamente
bien con la edad. Las funciones solicitadas son: 1) percepcin
visual fina (anlisis), 2) concentracin visual, 3) atencin
selectiva, 4) imgenes visuales. Los factores influyentes son:
a) esfuerzo sistemtico voluntario y selectivo, b) enfoque
activo de la atencin, c) agudeza visual y d) experiencia
ambiental.
Diseo con cubos: Es considerado el mejor subtest de
ejecucin, mide lo mismo que miden los tests verbales, est
80
saturado en g y revela las perturbaciones antiguas o recientes

de los procesos de percepcin superiores. Es importante
analizar el proceso de trabajo y las actitudes. Se detectan
comportamientos caractersticos en el caso de deterioro mental.
Sus resultados no se mantienen con la edad. Este subtest
presenta una buena correlacin con la escala total y tambin
con los subtests verbales. Requiere: 1) percepcin de forma, 2)
percepcin visual: anlisis y sntesis, y 3) integracin
visomotora. Los resultados pueden ser influenciados por: a)
el nivel de actividad motora, b) un mnimo de discriminacin
del color, c) la agudeza y velocidad del anlisis visual y d)
la organizacin visual.
Ordenacin de dibujos: Subtest de construccin difcil
debido al contenido de las historias (rol social o afectivo).
Exige la comprensin de la situacin en su totalidad y su
organizacin en el tiempo y en el espacio. Raramente es
realizado por un deficiente mental. Este subtest presenta una
correlacin mediana con la escala total y sus resultados no
se mantienen con la edad. Es el subtest ms vulnerable de
la escala. Requiere las funciones siguientes: 1) percepcin
visual de relaciones, 2) sntesis de material no verbal y 3)
anticipacin y organizacin visual. Los factores influyentes
son: a) la exactitud visual y b) un mnimo de oportunidades
culturales.
Composicin de objetos: Este subtest proporciona indicios
sobre el modo de percepcin, el mtodo de investigacin
y la reaccin delante de la dificultad o de un error. Su
correlacin con la escala total es mediocre y vara segn la
edad (baja entre 15 y 30 aos). Las funciones exigidas son:
1) percepcin visual, 2) integracin visomotora y 3)
anticipaciones adecuadas. Los factores influyentes son: a)
velocidad de la actividad motora, b) precisin de la actividad
motora, c) inters y d) atencin.
Dgitos y Smbolos o Claves: Excepto casos particulares,
81
el aspecto motor no interviene en los resultados obtenidos en

esta escala. Requiere: 1) recuerdo inmediato, 2) integracin
visomotora 3) imaginacin visual y 4) capacidad de
reproduccin e imitacin. Puede sufrir influencia de los
factores: a) velocidad de la actividad motora, b) rapidez en
la asociacin, c) aprendizaje en funcin de entrenamiento de
la atencin, d) instabilidad y e) emotividad. La correlacin
de este subtest con la escala global es relativamente buena
pero sus resultados no se mantienen con la edad.
Los subtests pueden ser clasificados en cuatro grupos,
segn los factores especficos que evalan y su vulnerabilidad
(sensibilidad) (Rapaport, 1965).
1) Esencialmente verbal: Conocimientos, Vocabulario,
Semejanzas y Comprensin . "Su rasgo comn es que requieren
la explicacin verbal de los problemas y la formulacin verbal
de las respuestas" (dem, p. 38). Son los tests menos
vulnerables. La disminucin considerable ante cualquiera de
estas cuatro pruebas sugiere la presencia de una inadaptacin
grave.
2) Atencin y concentracin: Retencin de dgitos y
Aritmtica. En ambos, la verbalizacin es slo una forma de
comunicacin. Son los subtests verbales ms vulnerables y
variables.
3) Coordinacin Visomotora: Diseo con c u b o s ,
Composicin de objetos, Dgitos y smbolos. "Un rasgo comn
en estos subtests es que tras la conducta que estimulan subyacen
funciones tanto motrices como visuales" (dem, p.39). Estos
subtests son ms resistentes que los dems de ejecucin , pero
ms vulnerables que los subtests esencialmente verbales.
4) Organizacin Visual: Ordenacin de dibujos y Figuras
incompletas. Se basan en la organizacin visual, no suponiendo
ninguna accin motriz en especial. Estos subtests son los ms
vulnerables.
Segn Morales (1993), desde el punto de vista de la
82
vulnerabilidad, se considera que el subtest de Vocabulario

es el menos sensible de todos y por lo tanto el que mejor
sirve como parmetro de comparacin de la ejecucin de los
dems subtests. Los ms sensibles son: repeticin de dgitos
(escala verbal) y figuras incompletas (escala de ejecucin),
siendo el primero ms vulnerable que el segundo. En general,
los subtests de ejecucin son ms vulnerables que los verbales.
3. MATERIAL
Para la aplicacin del WAIS se requieren: 1) el manual, 2)

un protocolo donde se registran las respuestas del examinado,
3) una tarjeta con una lista de palabras para Vocabulario,
4) una libreta que contiene los reactivos de Figuras incompletas
y los modelos para Diseo con cubos, 5) una caja con tarjetas
para Ordenacin de dibujos, 6) una caja con cubos rojos/
blancos para Diseo con cubos, 7) cuatro cajas que contienen
las partes de los reactivos de Composicin de objetos, 8)
un diagrama para Composicin de Objetos, y 9) una plantilla
de correccin para Dgitos y Smbolos. El examinador necesita
tambin un cronmetro y dos lpices, sin goma, para Dgitos
y Smbolos (Wechsler, 1981b).
El WAIS es utilizado con personas a partir de los 16 aos

(dem).
Esta prueba slo debe ser administrada individualmente. La

complejidad de su aplicacin y calificacin no permite la
administracin en forma colectiva.
83
Se requieren entre 50 y 90 minutos para la aplicacin completa

del WAIS. Sin embargo, las diferencias individuales respecto
al estilo particular de cada sujeto para contestar y la tcnica
de aplicacin del examinador pueden alargar o abreviar el
tiempo de administracin. El ideal es aplicar todos los subtests
en una misma sesin. Si esto resulta imposible por problemas
de horario, motivacin u otra razn, pueden programarse dos
sesiones con un intervalo mximo de una semana.
No se debe reducir el nmero de subtests aplicados para
ahorrar tiempo. La reduccin en el nmero de stos slo puede
ser contemplada cuando no sea posible la aplicacin de ciertos
subtests debido a incapacidades que impiden su realizacin
como: inadecuada comprensin del lenguaje o deficiencias
sensorio-motrices. Por ejemplo, es posible aplicar solamente
la subescala verbal a individuos con incapacidades motoras
o solamente la subescala de ejecucin, en el caso de sujetos
imposibilitados de comprender o utilizar el lenguaje (Wechsler,
1981a)
Algunos subtests de las escalas Wechsler suponen un tiempo
lmite estricto para su ejecucin y otros no. Por ejemplo, en
el WAIS, cada reactivo del subtest de Aritmtica debe ser
contestado en un tiempo lmite que vara de 15 a 120 segundos.
Adems, en algunos subtests se bonifica la ejecucin rpida
del sujeto, concedindole puntos extras dependiendo del tiempo
de ejecucin. En los subtests que no suponen un tiempo lmite,
el examinador debe conceder al sujeto el tiempo adecuado para
que ste exprese su respuesta. Generalmente se considera de
10 a 15 segundos como suficiente.
El procedimiento de administracin de las escalas Wechsler

es relativamente complejo y supone un buen entrenamiento.
84
El examinador debe leer las instrucciones y preguntas

directamente del manual, sin cambiar trminos ni apartarse
de los procedimientos estandarizados. Para sacar dudas,
repetir instrucciones y hacer preguntas que esclarezcan una
respuesta ambigua o incompleta, el examinador debe seguir
las indicaciones especificadas en el manual. Adems, debe
tener muy claro los procedimientos de puntuacin de cada
subtest para que pueda discontinuar la aplicacin, despus
de un determinado nmero de errores, o regresar a la aplicacin
del primer reactivo del subtest, cuando sea el caso.
El registro, de los datos personales y de las respuestas,
en el protocolo es realizado por el examinador. El subtest
de Dgitos y Smbolos es contestado por el sujeto directamente
en el espacio destinado del protocolo.
En el WAIS, primero se aplican todos los subtests verbales y
en seguida todos los subtests de ejecucin (Wechsler, 1981b). La
secuencia de aplicacin fue alterada en el W AIS-R, subtests verbales
y de ejecucin son sistemticamente alternados (Wechsler, 198 la).
Para cada subtest, se indica el reactivo donde debe iniciarse la
aplicacin y en que situacin debe retornarse a la aplicacin del
primer reactivo. Para algunos subtests, un cierto nmero de errores
consecutivos conduce a la discontinuacin del subtest.
Para la mayora de los subtests de las escalas Wechsler la

puntuacin es objetiva. Sin embargo, la evaluacin de los
subtests de Semejanzas, Vocabulario y Comprensin y de
algunos de los reactivos de Conocimientos requiere un criterio
considerable por parte del examinador. El manual del WAIS
proporciona, para estos subtests, ejemplos de respuestas
para cada reactivo, adems de un criterio general de
puntuacin. El examinador debe estar familiarizado con este
criterio general para poder calificar correctamente. En estos
85
subtests se recomienda apuntar las respuestas completas del

sujeto para facilitar la calificacin.
Pueden asignarse uno o ms puntos a las respuestas correctas
dependiendo del subtest, de la calidad de la respuesta o del
tiempo en que el sujeto ha contestado el reactivo. Para cada
subtest se calcula la puntuacin natural, que en seguida es
convertida a puntuacin normalizada, utilizando la tabla de
conversin presentada en el manual. En seguida, se calcula
el total de las puntuaciones normalizadas de cada subescala
Verbal y de Ejecucin de la escala total. Con estas
puntuaciones totales se hallan los respectivos CI (verbal, de
ejecucin y total). En el manual del WAIS, existen varias
tablas de conversin (puntuacin normalizada - CI) que estn
divididas por rangos de edad. Deben registrarse las
puntuaciones naturales y normalizadas en el protocolo de
respuestas, la suma de puntuaciones de cada subescala, la
puntuacin total y los tres valores de CI.
Es importante sealar que cuando un subtest es anulado
o cuando, por impedimento del sujeto, se hizo inadmisible
la aplicacin de toda la escala, es necesario prorratear la suma
de las puntuaciones normalizadas de la subescala. Si se anula
un subtest de la subescala verbal, la suma de las puntuaciones
normalizadas debe ser multiplicada por 6/5 para obtener la
puntuacin prorrateada. Si el subtest omitido es de la subescala
de ejecucin, la suma de las puntuaciones normalizadas de
los otros cuatro subtests debe ser multiplicada por 5/4
(Wechsler, 1981b).
Obtenido el CI total se utiliza la tabla de clasificacin de
inteligencia, presentada a continuacin, para establecer el
diagnstico.
El examinador puede tambin hacer la grfica de las
puntuaciones del sujeto en el protocolo (primera hoja),
encerrando en un crculo las puntuaciones naturales obtenidas
en cada subtest y conectando los crculos con una lnea.
86
CI CLASIFICACIN
130 y por encima Muy superior
120-129 Superior
110-119 Arriba del normal (brillante)
90-109 Normal
80-89 Abajo del normal (torpe)
70-79 Limtrofe
69 y hacia abajo Deficiente Mental
Adems del diagnstico de la capacidad intelectual, pueden

realizarse otros anlisis, cuantitativos y cualitativos, que
permiten profundizar el diagnstico de habilidades o
incapacidades especficas. En seguida, sern presentados
otros tipos de anlisis que pueden ser llevados a cabo con
los resultados del WAIS.
8.1. Comparacin por edad
Puede ser interesante comparar los resultados de un individuo,

en cada uno de los subtests, con los resultados de personas
del mismo grupo de edad. Para realizar este tipo de comparacin,
el manual del WAIS provee 10 cuadros de puntuaciones
normalizadas por edad. Estos cuadros no deben ser utilizados
para computar el CI.
En cada cuadro comparativo por edad, una puntuacin normali-
zada de 10 para un subtest representa la puntuacin normalizada
media para este grupo de edad. La desviacin estndar de puntuacio-
nes normalizadas para cada subtest es de 3 puntos (Wechsler,
1981a, 1981b).
El procedimiento es el siguiente {dem):
Se localiza el cuadro que corresponde a la edad del
individuo y se buscan las puntuaciones normalizadas para
cada subtest
Las puntuaciones normalizadas por edad son apuntadas,
87
entre parntesis, en la columna situada al lado de la columna

destinada a puntuaciones normalizadas, en el protocolo.
Estas puntuaciones permiten al examinador evaluar la
actuacin del individuo en relacin con personas de su misma
edad y comparar los resultados de una primera aplicacin
con los de una reaplicacin, permitiendo verificar cambios
en la ejecucin de los distintos subtests, adems de las
variaciones causadas por la edad. Estas puntuaciones son
tambin utilizadas para el clculo del coeficiente de deterioro
mental (ver ms adelante en el apartado 8.3).
8.2. Dispersin de los resultados
El anlisis de la dispersin de los resultados obtenidos en

las escalas Wechsler provee datos importantes sobre las
funciones intelectuales ms y menos desarrolladas.
Discrepancias fuertes pueden tambin estar asociadas a ciertos
tipos de patologas mentales.
a. Diferencia entre el CI Verbal y el CI de Ejecucin
El CI Verbal indica la facilidad del sujeto en utilizar palabras y

smbolos y el CI de Ejecucin, su habilidad para manipular objetos
y para percibir patrones visuales. En general, puede existir una
diferencia de algunos puntos entre estos dos CI. En el caso del
WAIS, esta diferencia solamente tiene importancia a partir de 10
puntos (Wechsler, 1955). En el WAIS-R tambin se observ que
una diferencia de 10 puntos corresponde a un nivel de significancia
de .05 (Wechsler, 1981a).
b. Interpretacin de las diferencias entre el CI Verbal y

el CI de Ejecucin
Cuando se encuentra una diferencia significativa entre los

dos CI, hay que ser prudente en su interpretacin antes de
88
considerar que el sujeto tiene realmente una funcin

intelectual ms desarrollada que la otra. Wechsler (1955)
afirma, respecto al WAIS, que la cantidad y direccin de
la diferencia vara segn la edad y el nivel global de inteligencia
del individuo. El apunta que "sujetos de inteligencia superior
generalmente lo hacen mejor en la parte verbal del examen,
y sujetos de inteligencia inferior lo hacen mejor en la parte
de ejecucin" (p.213). El, tambin hace incapi en las
diferencias raciales y culturales.
c. Dispersin intraindividual
El clculo de la dispersin de las puntuaciones obtenidas

por un sujeto en los diferentes subtests permite apreciar
la homogeneidad de sus resultados y establecer un perfil
de stos. El estudio de la dispersin responde a la pregunta
siguiente: Cundo podemos decidir que la puntuacin
obtenida en un subtest se desva significativamente del
promedio de los resultados del sujeto?
Vrignaud (en Aubret y col., 1991) menciona el siguiente
procedimiento para calcular la dispersin intraindividual en
el WAIS:
Calcular el promedio de las puntuaciones normalizadas
(Suma de puntuaciones normalizadas/Nmero de escalas).
Si la diferencia entre el CI verbal y el CI de Ejecucin es
considerada significativa, es recomendable calcular, por
separado, el promedio de las puntuaciones normalizadas de
la subescala verbal y de la subescala de ejecucin.
Calcular la dispersin hallando la diferencia entre la
puntuacin normalizada de cada subtest y el promedio de
puntuaciones normalizadas (total o por subescala).
Este mismo autor aade que Wechsler propuso, para la
escala Wechsler-Bellevue, un mtodo para determinar cuales
son los subtests que presentan desviaciones significativas.
89
Aunque Wechsler no ha comentado sobre la utilizacin de

este mtodo en el caso del WAIS, ste es generalmente utilizado
por los clnicos.
Segn este mtodo, para determinar si la diferencia, entre
la puntuacin normalizada obtenida en un subtest y el promedio,
es significativa, debe examinarse la suma total de las
puntuaciones normalizadas o el CI total del sujeto.
Para sumas totales comprendidas entre 80 y 110, que
corresponden a CI totales comprendidos entre 85 y 115. es
significativa toda diferencia de ms de 2 puntos entre la
puntuacin del subtest y el promedio de las puntuaciones
normalizadas. Este intervalo representa ms o menos una
desviacin tpica.
Para los CI superiores a 115 o inferiores a 85, el valor
de la diferencia significativa vara en funcin del promedio
de las puntuaciones normalizadas del sujeto. La diferencia,
entre la puntuacin normalizada obtenida en un subtest y el
promedio de las puntuaciones normalizadas, es significativa
si su valor es superior a este promedio divido entre 4. Por
Ejemplo: para un sujeto cuyo promedio de puntuaciones
norma'izadas es 5.6, la diferencia es significativa si es mayor
que 5.6/4 = 1.4; para otro sujeto cuyo promedio es 13.2, la
diferencia es significativa si es mayor que 13.2/4 = 3.3.
Adems de este procedimiento, Wechsler propuso la tabla
presentada abajo, donde define, para diferentes valores de la
diferencia, smbolos que caracterizan el sentido e importancia
de la desviacin:
+ desviacin del subtest de 1.5 a 2.5 unidades arriba

de la puntuacin promedio.
++ desviacin del subtest de 3 o ms unidades arriba
desviacin del subtest de 1.5 a 2.5 unidades abajo
90
desviacin del subtest de 3 o ms unidades abajo de

la puntuacin promedio.
0 desviacin del subtest de +1.5 a -1.5 unidades de la
puntuacin promedio.
Vrignaud (en Aubret y col., 1991) seala la ambigedad,

de la parte de Wechsler, en la determinacin de la importancia
de la diferencia. De un lado, propuso el mtodo expuesto
inicialmente para determinar el valor de la diferencia
significativa y de otro, propuso una tabla con valores fijos
(que no dependen del CI del sujeto) para la determinacin
de la importancia de la diferencia.
d. Anlisis e interpretacin de la dispersin
Dos tipos de anlisis pueden ser realizados a travs del

estudio de la dispersin del WAIS.
1) Anlisis de las funciones intelectuales ms desarrolladas
o deficientes. En este caso deben analizarse las escalas que
presentan una dispersin significativa (para arriba o para
abajo) verificando a cuales funciones intelectuales
corresponden. Se determinan as cuales funciones intelectuales
el sujeto tiene ms desarrolladas y cuales son las ms
deficientes. Este anlisis proporciona una interpretacin
cualitativa de los resultados numricos obtenidos a travs
del clculo de la dispersin.
2) Establecimiento de relaciones entre las dispersiones y
diferentes entidades clnicasEste anlisis, propuesto por
Rapaport (1965), permite establecer asociaciones entre las
divergencias de las puntuaciones de subtests particulares y
las entidades clnicas especficas. Consiste en relacionar el
perfil del sujeto con perfiles correspondientes a tipos
particulares de problemas o disfunciones mentales.
Rapaport (dem), a partir de una investigacin realizada
91
con la escala Wechsler-Bellevue, que fue aplicada a 261

casos clnicos y de control, propone un anlisis de la dispersin
de los diferentes subtests y describe las vicisitudes de cada
uno de ellos en los distintos grupos clnicos. El utiliza las
siguientes medidas de la dispersin: a) Dispersin del
Vocabulario: el Vocabulario es el subtest menos vulnerable
o sea es donde los sujetos muestran la mxima tendencia a
no sufrir disminuciones en el rendimiento; sirve de referencia
para medir la disminucin de los otros subtests; b) Dispersin
media: desviacin de los subtests verbales con respecto al
promedio y verbal de los subtests de ejecucin con respecto
al promedio de ejecucin; los subtests verbales y de ejecucin
son tratados separadamente pues difieren en el grado de
vulnerabilidad; c) Puntuaciones normalizadas extremada-
mente altas o bajas.
El anlisis de la dispersin permite evaluar la eficiencia
desigual de las diferentes funciones y a partir de estas
diferencias de la eficiencia funcional pueden inferirse las
categoras clnicas en que puede esperrselas. Rapaport (1965,
pp. 50-61) propone, para cada grupo y sus respectivos subtests,
el anlisis siguiente:
Grupo esencialmente verbal
Vocabulario: Este subtest se halla profundamente disminuido

en los neurastnicos, en los depresivos psicticos y en los
esquizofrnicos deteriorados. Los promedios ms altos para
el Vocabulario se encuentran en las condiciones paranoideas,
en los preesquizofrnicos sobreideacionales y en los
compulsivos obsesivos. Un puntaje en este subtest, inferior
en dos o ms unidades a la tendencia central de los otros
subtests esencialmente verbales, indica un retardo significativo
del desarrollo o disminucin del Vocabulario.
Conocimientos: En general las puntuaciones son semejantes
92
a las de Vocabulario; slo en tres grupos se observa una

puntuacin significativamente ms baja que la de Vocabulario:
histeria, depresiones involucionadas y en algunas
esquizofrenias paranoideas crnicas. En estos dos ltimos
grupos tambin se hallan disminuidas las puntuaciones en
el resto de los subtests verbales, lo que no ocurre con los
histricos. En las neurosis y psicosis intelectuali-
zantes, especialmente en los preesquizofrnicos sobre-
ideacionales y los compulsivos obsesivos los Conocimientos
se encuentran preservados. Cuando el puntaje en Cono-
cimientos est tres o ms unidades abajo del puntaje en
Vocabulario significa una disminucin significativa de la
disponibilidad del conocimiento general.
Semejanzas: Este subtest permite distinguir los diferentes
tipos de depresiones. En las neurosis depresivas la puntuacin
en este subtest no est afectada; en las psicosis depresivas
ella est por debajo del Vocabulario y aun ms por debajo
del promedio de los puntajes del grupo esencialmente verbal.
De la misma manera, en las esquizofrenias paranoideas este
puntaje no se ve afectado, mientras que en los casos crnicos
y deteriorados su puntaje es inferior al de Vocabulario y al
promedio de los puntajes verbales. Los puntajes ms altos
son obtenidos por los grupos "intelectualizantes". Una
puntuacin inferior en tres o ms unidades a la de Vocabulario
indica una disminucin significativa de la formacin verbal
de conceptos.
Comprensin: Cuando la puntuacin en este subtest est
ms de dos unidades por debajo de la de Vocabulario o de
Conocimientos constituye un ndice grave. Indica una
significativa disminucin del juicio. Esto se observa, con
frecuencia, en los compulsivos obsesivos, esquizofrnicos,
preesquizofrnicos y depresivos. Se constata que, mientras
los histricos represivos presentan una disminucin en el
subtest de Conocimientos y un puntaje normal en el de
93
Comprensin, los compulsivos obsesivos presentan un excelente

puntaje en Conocimientos y una cada en Comprensin.
Grupo de atencin y concentracin
Repeticin de dgitos: En los neurticos y depresivos se

observa una baja de puntuacin, especialmente en aquellos
casos en que la ansiedad adquiere una mayor importancia,
provocando una disminucin de la atencin. Se considera este
subtest como un test especfico de ansiedad. Un puntaje
inferior de 4 o ms unidades al del Vocabulario indica una
significativa disminucin de la atencin.
Aritmtica: El puntaje a este subtest se ve seriamente
disminuido en el caso de los esquizofrnicos, especialmente
de los deteriorados y de los psicticos depresivos. Los neurticos
y normales presentan disminuciones pequeas. Tambin aqu
los grupos "intelectualizantes" presentan altos puntajes,
superiores al de Vocabulario. El puntaje en este subtest inferior
en 4 o ms unidades al de Vocabulario indica una significativa
disminucin de la concentracin.
Grupo de coordinacin visomotora
Composicin de objetos: La puntuacin en este subtest se

ve disminuida sobre todo por la depresin o ansiedad intensa.
Es uno de los subtests ms vulnerables. En las depresiones,
en general, los puntajes bajan en la mayora de los subtests
de ejecucin. Cuando el puntaje es normal en los dems
subtests de ejecucin y la cada se da solamente en este subtest
indica una ansiedad neurtica normal. Los esquizofrnicos
generalmente presentan un desempeo normal en este subtest.
Un puntaje inferior en 5 o ms unidades al de Vocabulario
indica una significativa disminucin de la organizacin y
coordinacin visomotora.
94
Diseo con cubos: Este subtest es el ms slido de los

de ejecucin y en general se mantiene prximo al nivel del
Vocabulario. El factor que genera disminucin en este subtest
es la depresin. En este caso la disminucin es igual o ms
importante que la de los dems subtests de ejecucin y cuanto
mayor la disminucin ms grave es la depresin. Un puntaje,
en este subtest y en el de Composicin de objetos, superior
a una tendencia central baja para los tests de ejecucin puede
indicar una esquizofrenia. En general en estos dos subtests
los esquizofrnicos crnicos y deteriorados pueden
desempearse perfectamente bien. Un puntaje en Diseo con
cubos inferior en tres o ms unidades al de Vocabulario indica
una baja significativa de la organizacin y coordinacin
visomotora.
Dgitos y Smbolos: Este es el subtest de ejecucin ms
sensible al retardo psicomotor producido por las depresiones.
En los esquizofrnicos, es la disminucin de la concentracin
que perjudica el desempeo en esta prueba, aunque algunos
tipos (los blandos) la realizan sin ansiedad y obtienen buenas
puntuaciones. Las personas acostumbradas a realizar trabajos
semejantes al requerido en este subtest, como los taqugrafos,
suelen obtener puntuaciones altas no solamente en este subtest
pero tambin en los dems de ejecucin. Una puntuacin en
Dgitos y Smbolos, tres o ms unidades inferior a la de
Vocabulario, indica una disminucin significativa de la
coordinacin y velocidad visomotora.
Grupo de organizacin visual
Ordenamiento de dibujos: Este es un subtest muy vulnera-

ble, aun en neurticos y normales. Tambin se halla disminuido
en los esquizofrnicos paranoideos y ms profundamente en
los deteriorados y psicticos depresivos. Un puntaje inferior
al de Vocabulario en 4 o ms unidades revela una baja
95
significativa de la aptitud para realizar anticipaciones correctas

y/o de la organizacin visual.
Figuras incompletas: Este es el subtest que presenta la serie
de disminucin ms sistemtica. La disminucin ms importante
es observada en los psicticos depresivos, luego vienen los
esquizofrnicos deteriorados sin clasificar, luego los
esquizofrnicos agudos y crnicos seguidos de los compulsivos
obsesivos, luego los neurticos depresivos, en seguida los
normales con tendencias depresivas y finalmente los normales
no depresivos. Para diferenciar los psicticos depresivos de
los esquizofrnicos se verifica el desempeo en los dems
subtests de ejecucin que debe estar mucho ms disminuido
entre los primeros.
Completando el anlisis de la dispersin, Rapaport (1965,
pp.68-81) comenta sobre los patrones de dispersin especficos
y caractersticos de diferentes grupos clnicos. Presentamos
en seguida algunas caractersticas de tres de estos grupos:
Grupo de esquizofrnicos:
Los esquizofrnicos agudos sin clasificar presentan puntajes

inferiores al de Vocabulario en prcticamente todos los subtests.
El subtest de Conocimientos es el que presenta menor dispersin
con respecto al de Vocabulario. El patrn diagnstico para
los esquizofrnicos agudos es el siguiente, en los subtests
verbales se observa disminucin en el de Comprensin y
sobretodo en el de Aritmtica y poca baja en el de Repeticin
de Dgitos; en los de ejecucin se observa gran disminucin
en los subtests de Organizacin Visual (Ordenamiento de
figuras y Figuras incompletas) y en el de Composicin de
Objetos. Los casos crnicos presentan puntuaciones en los
subtests inferiores a la de Vocabulario, excepto en
Conocimientos; pero casi ninguna de ellas es tan baja cuanto
las obtenidas por los casos agudos. En general, los casos
96
crnicos se desempean mejor que los agudos, excepto en

Comprensin, Aritmtica y Repeticin de Dgitos.
Los esquizofrnicos deteriorados sin clasificar muestran
una baja importante en casi todos los subtests. Comprensin
y Repeticin de Dgitos sufren una disminucin considerable,
Aritmtica aun ms y los peores son Ordenamiento de figuras,
Figuras incompletas y Dgitos y Smbolos.
El diagnstico diferencial del carcter agudo, crnico o
deteriorado de una esquizofrenia paranoica se basa en: 1)
los casos agudos conservan muy bien su desempeo en
Semejanzas, bien en Conocimientos, pero son los peores en
Composicin de objetos y Dgitos y Smbolos. 2) los casos
crnicos presentan una dispersin ms blanda que la de los
agudos y se distinguen de ellos sobre todo por la disminucin
en Conocimientos y Semejanzas, 3) los casos deteriorados
son los que presentan la mayor disminucin del juicio
(Comprensin), de la atencin (Repeticin de dgitos), de la
concentracin (Aritmtica) y de la capacidad de planeamiento
y anticipacin (Ordenamiento de figuras).
Tanto en los esquizofrnicos sin clasificar como en los
paranoideos la dispersin es mayor en los grupos deteriorados,
seguidos de los agudos y finalmente de los crnicos.
Grupo de depresivos
La gravedad de la depresin corre paralela a la medida

de la disminucin de los subtests de ejecucin. Los psicticos
depresivos son los que presentan mayor disminucin. El
desempeo de los psicticos depresivos difiere del de los
neurticos depresivos en: el subtest de Semejanzas se halla
bien conservado en los neurticos y muy disminuido en los
psicticos; los subtests de Conocimientos y Repeticin de
dgitos se hallan mejor conservados en los neurticos.
La diferenciacin entre psicticos depresivos,
97
esquizofrnicos y preesquizofrnicos se halla en la ausencia

de una disminucin especial en los subtests de organizacin
visual (Ordenamiento de figuras y Figuras incompletas), en
la disminucin de Diseo de cubos y en la falta de la relacin
Repeticin de dgitos/Aritmtica, puesto que en el primero el
desempeo est seriamente disminuido mientras que en el
segundo est apenas un poco menos.
La diferencia entre depresivos neurticos y esquizofrnicos
agudos se basa en la baja sistemtica de los primeros en los
subtests de ejecucin, en la ausencia de verbalizaciones
extravagantes y en la lentitud, bloqueo y pobreza de produccin.
Grupo de neurticos
Los grupos histeroides difieren de los obsesivos puesto que

los primeros presentan puntajes en Comprensin ms altos
que en Conocimientos, lo que sucede al revs en los ltimos.
En los grupos histeroides los puntajes en Conocimientos,
Comprensin y Semejanzas se hallan bien conservados,
cercanos o superiores a los de Vocabulario, ya los de Repeticin
de dgitos y Aritmtica sufren una disminucin considerable.
Estos son los grupos ms ansiosos de los neurticos y
observamos en estos dos ltimos subtests los efectos de la
ansiedad.
Los grupos neurticos de tipo obsesivo se caracterizan por
una disminucin en Comprensin, aunque el desempeo en
Conocimientos se halla conservado. Tambin en estos grupos
la ansiedad es fuerte, lo que provoca una fuerte disminucin
en Repeticin de dgitos.
Los neurastnicos presentan un nivel de eficiencia sumamente
bajo en los tests de ejecucin resultante de su pereza y apata.
Sus puntajes verbales parecen permanecer en un nivel
relativamente parejo, aunque bajo.
En los compulsivos obsesivos se constata una baja en
98
Aritmtica mayor que en cualquier otro grupo neurtico. Se

observa aun una disminucin del juicio (Comprensin), de
la organizacin visual (Ordenamiento de figuras y Figuras
Incompletas) y de los conceptos verbales (Semejanzas) como
sucede en los esquizofrnicos agudos sin clasificar. La
distincin est en el hecho de que la dispersin, en los
primeros, se da en un nivel de puntuaciones normalizadas
ms altas, siendo raras las respuestas peculiares o los errores
en los reactivos fciles.
Finalmente, cabe mencionar que estos anlisis provienen
de una investigacin realizada con la escala Wechsler-Bellevue
y que por lo tanto debemos tener cuidado en generalizarlos
para las dems escalas de Wechsler. Este tipo de anlisis
deja abierto un sinnmero de problemas tanto en el dominio
estadstico como en el de la interpretacin clnica de los
perfiles. Sin embargo, permite la elaboracin de hiptesis
diagnsticas que deben ser verificadas con la aplicacin de
pruebas psicolgicas especficas.
8.3. Coeficiente de deterioro mental
Wechsler (1955) considera seal de deterioro mental cualquier

cada significativa o prdida de las habilidades intelectuales.
Esta declinacin mental puede ocurrir como resultado de una
enfermedad mental especfica o de una lesin orgnica o
cerebral, pero tambin resulta del proceso senil, del aumento
natural de la edad.
Partiendo de la observacin de que ciertas habilidades
declinan ms despacio con la edad que otras, Wechsler (dem)
propuso un procedimiento para el clculo del coeficiente de
deterioro. En ste, se utilizan las puntuaciones ponderadas
obtenidas en los subtests que "se mantienen" con la edad
(Conocimientos, Vocabulario, Dibujos incompletos y
Composicin de objetos) y aquellas obtenidas en los subtests
que "no se mantienen" con la edad (Repeticin de dgitos,
99
Aritmtica, Diseo con cubos y Dgitos y smbolos). El

procedimiento propuesto es el siguiente:
1) Transformar las puntuaciones brutas obtenidas en cada
uno de estos subtests en puntuaciones normalizadas utilizando
los cuadros de transformacin por edades (ver manual)
2) Sumar las cuatro puntuaciones normalizadas obtenidas en los
subtests que se mantienen con la edad (Conocimientos, Vocabulario,
Dibujos incompletos y Composicin de objetos)
3) Sumar las cuatro puntuaciones normalizadas obtenidas en los
subtests que declinan con la edad (Repeticin de dgitos, Aritmtica,
Diseo con cubos y Dgitos y smbolos).
4) Calcular el coeficiente de deterioro mental cuya frmula es:
Suma (punt. norm, subtests que se mantienen)
-Suma (punt. norm, subtests que declinan)
Suma puntuaciones normalizadas subtests que se mantienen
5) Interpretacin: un coeficiente positivo es indicador de deterioro

mental. El estudio de la dispersin de este coeficiente muestra que
uno tiene 20 posibilidades entre 100 de obtener un CD > .12 y 1
posibilidad entre 100 de obtener un CD > .35. En general, se obtiene
un valor cercano a 0, independientemente de la edad (Vrignaud en
Aubret y col, 1991).
Es importante sealar que para el clculo del coeficiente
de deterioro deben utilizarse las puntuaciones ponderadas
obtenidas en las tablas por edad. Este procedimiento elimina
la deterioracin psicolgica provocada por la edad y evala
nicamente la deterioracin patolgica.
9. NORMAS
Las normas del WAIS son presentadas en CI de desviacin,

considerando una media de 100 y una desviacin estndar de
15 puntos. Estas provienen de una muestra de 1,700 adultos
100
de E.U.A (16-64 aos), prorrateados de acuerdo con el censo

de 1950. Los sujetos fueron tomados de cuatro reas
geogrficas en que se dividi a los Estados Unidos y se
establecieron 18 centros de aplicacin en diferentes sitios.
Las aplicaciones fueron realizadas por examinadores,
supervisados por psiclogos profesionales (Wechsler, 1955).
Las normas del WAIS-R fueron extradas de una muestra
de 1,880 adultos (entre 16 y 74 aos y 11 meses), estratificada
de acuerdo con el censo de E.U.A. realizado en 1970. Los
sujetos fueron examinados entre 1976 y 1980 en 115 centros
localizados en 39 estados y Washington DC. Un grupo de
individuos de esta muestra fue sometido a ambas formas de
la escala (WAIS y WAIS-R) (Wechsler, 1981a).
Anastasi (1978) resume los resultados reportados sobre la

confabilidad y validez del WAIS. La confiabilidad de los
subtests, de las subescalas y de la escala total fue verificada
con los grupos de edad de 18-19, 24-34 y 45-54. En general,
se utiliz el procedimiento de divisin en mitades, excepto
en los casos en que este procedimiento no era apropiado:
Repeticin de Dgitos y Dgitos y Smbolos. Para Dgitos
y Smbolos se utiliz el procedimiento de test-retest y para
Repeticin de dgitos se obtuvo la correlacin entre las
puntuaciones de Dgitos en Orden Progresivo y Dgitos en
Orden Inverso, corregida por la frmula de Spearman-Brown.
Fueron calculados coeficientes de confiabilidad de las
subescalas y de la escala total a partir de los coeficientes
obtenidos para los subtests. El CI de la escala total present
coeficientes de confiabilidad de .97 en los tres grupos de
edad, el CI de la subescala verbal, coeficientes de .96 en
los tres grupos y el de la subescala de ejecucin, coeficientes
entre .93 y .94. Los subtests presentaron coeficientes ms
101
bajos, variando de .60 a .90. Vocabulario demostr ser el

subtest ms confiable. El error estndar de la medida es de
3 puntos (en cada grupo) para el CI Verbal, de 4 puntos para
el CI de Ejecucin y de 2.60 para el CI Total.
La validez del WAIS fue demostrada por distintos
procedimientos. Muchos estudios fueron realizados para
estudiar la validez de criterio, utilizando: correlaciones con
evaluaciones de realizacin en el trabajo, con calificaciones
acadmicas, etc. La validez estructural fue testada a travs
de intercorrelaciones entre los distintos subtests y subescalas
y de anlisis factoriales. Uno de los estudios factoriales,
realizado por Cohen, identific tres factores bsicos: un
factor de comprensin verbal, un factor de organizacin
perceptual y un factor de memoria. Segn Wechsler (1981a)
estos resultados confirman la adecuacin de la divisin en
dos subescalas: una verbal y otra de ejecucin. Fueron tambin
obtenidos coeficientes de correlacin con otras pruebas de
inteligencia. Con el Stanford-Binet, los coeficientes de
correlacin variaron entre .80 y .90 dependiendo de la muestra.
Con los tests colectivos las correlaciones fueron un poco ms
bajas, variando de .40 a .80 (Anastasi, 1978). Anastasi (dem)
relata, con detalles, varios de los estudios realizados para
testar la validez de esta escala.
El WAIS-R present tambin coeficientes de confiabilidad
elevados en nueve grupos de edad. Estos fueron obtenidos
a travs de los mismos procedimientos utilizados para el
WAIS. Los coeficientes promedio obtenidos fueron: .97 para
la subescala verbal, .93 para la subescala de ejecucin y .97
para la escala total. Los coeficientes de confiabilidad de los
subtests variaron entre .52 y .96, la escala de vocabulario
obtuvo el coeficiente ms alto. En general, los subtest verbales
presentaron una mayor confiabilidad que los de ejecucin.
El subtest de Repeticin de dgitos present un coeficiente
significativamente superior al obtenido en la versin anterior
102
del WAIS. Este resultado puede ser atribuido a los cambios

realizados en este subtest. El error estndar de la medida
es de 2.74 para la subescala verbal, de 4.14 para la subescala
de ejecucin y de 2.53 para la escala total (Wechsler, 1981a).
El manual del WAIS-R no presenta ningn estudio
especfico sobre la validez de esta prueba. El autor comenta
que como el WAIS-R mide las mismas habilidades que sus
precursores (WAIS y WECHSLER-BELLEVUE), los
resultados de los estudios realizados con estos ltimos pueden
ser considerados relevantes para la escala revisada (dem).
11. COMENTARIOS
El WAIS ha demostrado gran utilidad y aceptacin. Su gran

ventaja es proporcionar un diagnstico mucho ms fino de
las habilidades intelectuales de un individuo, comparado al
ofrecido por la mayora de las pruebas de inteligencia. Adems,
posibilita otros anlisis, a nivel cuantitativo y cualitativo,
que enriquecen enormemente la interpretacin de sus
resultados, posibilitando hasta la formulacin de hiptesis
diagnsticas de disfunciones orgnicas y mentales.
Mientras tanto, sta es una prueba que slo puede ser
aplicada individualmente y que requiere un tiempo de
aplicacin importante. Necesita tambin, examinadores
altamente entrenados.
Una observacin importante, en la utilizacin de WAIS-
espaol, es el hecho de que todava no existen normas para
la poblacin mexicana. En Mxico, desde 1964, vienen
siendo realizados los primeros pasos para la estandarizacin
de la escala, bajo la direccin del doctor. Rogelio Daz-
Guerrero (Morales, 1993).
103
Anastasi, A. (1978). Tests psicolgicos (3 a ed., 4a reimpresin).

Aubret, F., Aubret, J., Chartier, D., Chaudagne, H.,Francequin-
Chartier, G., Huetau, M., Porlier, J - C , Rozencwajg,
P. y Vrignaud, P. (1991). Evaluer I'intelligence. Manus-
crito no publicado, I.N.E.T.O.P., Pars, Francia.
Morales, M.L. (1993). Psicometria Aplicada (2a ed., 2a reimpre-
sin) Mxico D.F.: Editorial Trillas.
Wechsler, D. (1955). La medicin de la inteligencia del adulto.
La Habana: Cultural, S.A.
, D . (1981a). WA1S-R Manual: Wechsler Adult Intelligence
Scale-Revised. Nueva York: The psychological Corpora-
tion
, D. (1981b). WAIS-Espaol - Escala de Inteligencia
para Adultos -Manual. Mxico D.F.: Editorial El Manual
Moderno.
CAPITULO VII
ESCALA DE INTELIGENCIA PARA EL
NIVEL ESCOLAR DEfWECHSLER
(WISC)
La escala WISC (Escala de Inteligencia para el Nivel

Escolar) fue presentada en 1949, como una extensin de la
escala Wechsler-Bellevue, para ser utilizada con nios de 5
a 15 aos 11 meses (Wechsler, 1981c). En 1974, surgi la
escala revisada del WISC (WISC-R) que es fundamentalmente
similar, pero tcnicamente superior, a la original. Los cambios
bsicos fueron: 1) eliminacin de los reactivos ambiguos,
obsoletos o injustos e inclusin de reactivos nuevos para
incrementar la confiabilidad de la escala; 2) cambio en el
rango de edad para 6 a 16 aos 11 meses; 3) cambios en
la estandarizacin (ejemplo: ms amplia representacin de
los blancos); 4) cambio en el contenido de algunos reactivos;
5) cambio en la secuencia de aplicacin de los subtests; 6)
cambio en las instrucciones de aplicacin; 7) cambio en los
criterios de calificacin (Wechsler, 1981d).
Una nueva edicin del WISC fue presentada recientemente
(WISC-III). Como en el caso de la revisin anterior, esta
ltima representa un desarrollo tcnico de la versin original.
Incluye reactivos actualizados, dibujos ms modernos, mejores
normas y ms investigaciones con respecto a la validez.
Esta escala fue traducida y adaptada para varios idiomas.
Las dos primeras versiones fueron traducidas para el espaol
105
WISC-espaol y WISC-R espaol y presentadas en

1981. Adems, desde 1964 est siendo realizada la
estandarizacin de esta prueba para la poblacin mexicana
(WISC-RM), por el equipo de investigaciones del INCCAPAC
(Instituto Nacional de Ciencias del Comportamiento y de la
Actitud Pblica, Asociacin Civil), bajo la direccin del
doctor Rogelio Daz-Guerrero. Para elaborar esta versin se
tom la traduccin de Puerto Rico, se le compar con el
original de Wechsler, se hicieron correcciones en la traduccin
y se adaptaron aquellos reactivos considerados no adecuados
a la cultura mexicana, cuidando de no alterar ni el contenido,
ni el grado de dificultad de los mismos (Morales, 1993).
El WISC se compone de dos subescalas: Verbal y de Ejecucin.

Cada subescala es compuesta de 6 subtests: 1) Verbal:
Conocimientos o Informacin, Comprensin, Aritmtica,
Semejanzas, Vocabulario y Repeticin de dgitos o retencin
de dgitos; 2) De ejecucin: Figuras Incompletas o Dibujos
Incompletos, Diseo con cubos, Ordenacin de dibujos,
Composicin de objetos, Dgitos y Smbolos o Claves, y
Laberintos. Los subtests del WISC son los mismos del WAIS,
la diferencia es que se agreg el subtest de Laberintos a la
subescala de ejecucin. Dos de estos subtests son considerados
complementarios: en la escala verbal, el subtest Repeticin
de dgitos y en la de ejecucin, es subtest de Laberintos. Los
subtests complementarios tienen como objetivo sustituir un
subtest, que por algn motivo especfico quede invalidado
(Wechsler, 1981c, 198 Id).
3. MATERIAL
Para la aplicacin del WISC se requieren: 1) el manual, 2)

106
un protocolo donde se registran las respuestas del examinado,

3) un protocolo de Claves y Laberintos, 4) una libreta con
algunos problemas de Aritmtica, Figuras Incompletas y
Diseos con Cubos, 5) una caja con tarjetas para Ordenacin
de Dibujos, 6) una lmina con rboles y una lmina blanca
para problemas de Aritmtica, 7) una caja con cubos
rojiblancos para Diseo con Cubos, 8) cinco cajas con
diferentes "rompecabezas" para Composicin de Objetos y
9) una plantilla de Claves. Adems, se necesita un cronmetro,
dos lpices rojos sin goma y un lpiz color negro para Claves
y Laberintos.
El WISC es indicado para nios entre 5 y 15 aos y 11 meses

y el WISC-R para nios de 6 a 16 aos y 11 meses.
Esta prueba slo debe ser administrada individualmente.
Se requieren entre 50 y 75 minutos para la aplicacin de

10 subtests del WISC. El ideal es aplicar toda la prueba en
una nica sesin. Pero, si esto resulta imposible debido a
problemas de horario, motivacin del nio o algn otro
motivo, puede dividirse en dos sesiones, con un intervalo
mximo entre ellas de una semana. Lo que no se puede hacer
es disminuir el nmero de escalas para ahorrar tiempo
En el WISC, tambin debe estarse atento a los subtests
107
que suponen un lmite estricto de tiempo, as como a los

subtests que bonifican la ejecucin rpida del individuo.
La complejidad de la aplicacin exige del examinador un buen

entrenamiento. El examinador debe seguir exactamente las
instrucciones del manual, las indicaciones para sacar dudas,
para formular y contestar preguntas y para repetir
instrucciones. Es importante que el examinador sepa que las
instrucciones utilizadas en el WISC-R son, algunas veces,
distintas a las del WISC y que l debe estar muy atento a
estas diferencias. La aplicacin del WISC requiere an ms
cuidado puesto que sta se realiza con nios. Los nios, sobre
todo los muy jvenes, son ms inquietos, curiosos con el
material, hacen preguntas, pueden cansarse ms rpido, etc.
El examinador debe prepararse para enfrentar situaciones de
este tipo y seguir las instrucciones del manual para manejarlas.
El examinador inicia la aplicacin llenando los datos
personales y calculando la edad exacta del individuo. En el
manual se indica la forma correcta de realizar este clculo.
En el WISC se aplican primero los subtests de la subescala
verbal y despus los subtests de la subescala de ejecucin
(Wechsler, 198 le). En el WISC-R se alternan subtests verbales
y de ejecucin. El orden recomendado es el siguiente: 1)
Informacin, 2) Figuras Incompletas, 3) Semejanzas, 4)
Ordenacin de dibujos, 5) Aritmtica, 6) Diseo con cubos,
7) Vocabulario, 8) Composicin de Objetos, 9) Comprensin,
10) Claves, 11) Retencin de Dgitos (subtest complementario)
y 12) Laberintos (subtest complementario). Este orden no es
estricto pudiendo ser adaptado a las necesidades de un nio
especfico. Si el nio se rehusa a ejecutar un subtest en
particular el examinador puede dejarlo para el final de la
sesin (Wechsler, 198Id).
108
Los subtests complementarios pueden usarse: (a) cuando

el tiempo lo permita, (b) como subtest alternativo cuando
uno de los subtests, de la misma subescala, se quede invalidado
y (c) cuando el sujeto presente una limitacin especfica que
impida la ejecucin de uno de los subtests. Mientras tanto,
la sustitucin no puede ser realizada simplemente porque el
sujeto obtuvo una puntuacin baja en un determinado subtest
(Wechsler, 1981c).
Para cada subtest, se indica el reactivo donde debe iniciarse
la aplicacin; el reactivo inicial depende, en varios subtests,
de la edad del examinado. Por ello, es muy importante hacer
el clculo exacto de la edad del nio antes de iniciar la
aplicacin. Al aplicarse a nios con sospecha de deficiencia
mental, perturbados emocionalmente o atpicos es
recomendable iniciar con el primer reactivo.
El procedimiento bsico de calificacin es muy similar al

del WAIS, aunque los criterios de calificacin de los subtests,
cuya puntuacin no es objetiva (Semejanzas, Vocabulario
y Comprensin y algunos de los reactivos de Conocimientos),
son muy distintos. Por ello, un examinador entrenado en el
WAIS no debe creerse capaz de aplicar o calificar un WISC
sin el debido entrenamiento. Los criterios utilizados en el
WISC y en el WISC-R tambin tienen diferencias importantes.
En el WISC, se asignan uno o ms puntos a las respuestas
correctas dependiendo del subtest, de la calidad de la respuesta
o del tiempo en que el sujeto ha contestado el reactivo. Para
cada subtest, se calcula la puntuacin natural y se la convierte
en puntuacin normalizada. Las tablas de conversin
(puntuacin natural - puntuacin normalizada) estn divididas
por edades, con intervalos de 4 meses. Estas, son presentadas
en el manual. En seguida, se calcula el total de las puntuaciones
109
normalizadas de cada subescala Verbal y de Ejecucin

y de la escala total. Con estas puntuaciones totales se hallan
los respectivos CI (verbal, de ejecucin y total) en la tabla
de conversin presentada en el manual. Todas las puntuaciones
deben ser apuntadas en el protocolo, en sus respectivos espacios.
All tambin se debe trazar la grfica de las puntuaciones.
Es importante sealar que, en esta prueba, cuando se
incluyen en la aplicacin los subtests complementarios, debe
prorratearse la suma de las puntuaciones normalizadas (Ver-
bal y/o de Ejecucin) antes de convertirla a CI. Esto se hace
necesario, puesto que, la construccin de la tabla de CI fue
basada en la suma de las puntuaciones normalizadas de cinco
subtests verbales y cinco de ejecucin. Para prorratear se
multiplica la suma de puntuaciones normalizadas de la
subescala por 5/6. Si ocurre la invalidacin de un subtest,
o sea, en el caso que slo se tomen en cuenta cuatro de los
subtests de una subescala, se multiplica la suma de puntuaciones
normalizadas de esta subescala por 5/4 (Wechsler, 198Id).
Obtenido el CI total se utiliza la tabla de clasificacin de
inteligencia para establecer el diagnstico (ver Captulo VI).
Tambin con el WISC pueden realizarse otros anlisis para
profundizar el diagnstico de habilidades o incapacidades
especficas.
a. Diferencia entre el CI Verbal y el CI de Ejecucin
Segn Kaufman (1982), en el WISC-R, la diferencia entre

el CI Verbal y el CI de Ejecucin es considerada significativa
cuando es superior o igual a 12 puntos. El apunta que cuando
la diferencia es mayor que 25 puntos puede ser indicativo de
disfuncin neurolgica (dao cerebral). Mientras tanto, aade
que "las discrepancias en los CI V-E no deben utilizarse para
inferir una disfuncin neurolgica si no se cuenta con un
110
apoyo convincente de otros datos y observaciones

suplementarias" (dem, p.30).
b. Interpretacin de las diferencias entre el CI Verbal v

el CI de Ejecucin
Kaufman (1982, pp. 26-50) analiza posibles explicaciones

para las diferencias significativas entre los CI Verbal y de
Ejecucin en el WISC-R.
Inteligencia verbal contra inteligencia no verbal
Algunos individuos pueden tener una facilidad desigual para

expresar su inteligencia: dando mayor nfasis a la expresin
de la inteligencia verbal en respuesta a estmulos verbales
o expresndola mejor en forma manipulativa en respuestas
a estmulos visuales concretos. Las verdaderas diferencias
entre la inteligencia verbal y la no verbal pueden reflejar
un mayor desarrollo de uno de los hemisferios cerebrales.
El hemisferio izquierdo est especializado en el procesamiento
de estmulos lingsticos mientras que el derecho es experto
en el manejo de estmulos visuales-espaciales. Entonces: E > V
puede sugerir un mayor desarrollo del hemisferio derecho en tanto
que V > E puede sugerir un mayor desarrollo del hemisferio
izquierdo.
Capacidad fluida y capacidad cristalizada
Las discrepancias entre el CI Verbal y el de Ejecucin pueden

indicar diferencias entre las capacidades fluida y cristalizada
ms que entre el pensamiento verbal y de ejecucin. "La
capacidad fluida implica solucin de problemas en los que
el punto crtico es la adaptacin y flexibilidad para enfrentar
estmulos desconocidos; la capacidad cristalizada se refiere
111
al funcionamiento intelectual en tareas que requieren

entrenamiento, educacin y aculturacin previos" (dem, p.
32). La primera es reflejo del aprendizaje incidental, obtenido
indirectamente de las experiencias de la vida, mientras que
la segunda implica un entrenamiento directo y deliberado. No
hay una correspondencia perfecta entre las dicotomas V-E
y fluida-cristalizada. Aunque la escala verbal puede ser
considerada una buena medida del Pensamiento cristalizado,
la escala de ejecucin evala adems del Pensamiento fluido,
la Visualizacin amplia (factor anlogo a Organizacin
perceptual) y otras capacidades menores. Estas escalas no
son medidas puras de estos pensamientos.
Un nio proveniente de un medio privilegiado y cuyos
padres dan mucha importancia al xito escolar es probable
que obtenga V > E, como tambin los nios que logran su
xito escolar con un trabajo excesivo. Es frecuente que los
nios con problemas de aprendizaje obtengan E > V. La
relacin E > V en los nios con desventaja cultural puede
indicar una verdadera capacidad intelectual potencial a pesar
de la falta de experiencia de aprendizajes adecuadas. El CI
de ejecucin considerablemente ms alto indica que el nio
puede abordar la solucin de problemas de forma adaptable
y flexible, lo que sugiere que l podra llegar a una situacin
de xito escolar si fuera debidamente estimulado en estas
habilidades.
Deficiencias psicolingsticas
Deficiencias en el funcionamiento psicolingstico generan

problemas de aprendizaje y seguramente afectan las
puntuaciones de un test de inteligencia. Como el WISC-R
evala la inteligencia por medio de los transmisores
correspondientes a las formas de comunicacin auditiva-
vocal y visual-motora, si uno de estos transmisores est
112
daado, una parte del test ya no est midiendo la inteligencia

del sujeto. Por ejemplo, un nio con deficiencia en las vas
de comunicacin auditiva-visual probablemente realizar una
ejecucin deficiente en la mayora de los subtests verbales
y podr tener dificultades en los subtests no verbales que
requieren la comprensin de extensas instrucciones verbales.
Los nios con problemas psicolingsticos graves podrn
presentar una fuerte discrepancia V-E. Los nios con
problemas receptivos no tienen la oportunidad de demostrar
su inteligencia en el canal afectado, mientras que los que
tienen problemas en el rea de expresin no pueden comunicar
sus procesos de pensamiento. Si la discrepancia V-E es
resultado de una deficiencia psicolingstica, el CI total no
tiene significado.
Bilingismo
Es probable que los nios que aprenden dos idiomas

simultneamente en la infancia obtengan una puntuacin ms
alta en la escala de Ejecucin que en la Verbal. "Varias
investigaciones han encontrado que los nios mexicanos
norteamericanos y los puertorriqueos que viven en los Estados
Unidos obtienen puntuaciones significativamente mayores en
las medidas de capacidad mental no verbal que en la verbal"
(Kaufman, 1982,p.36). Este hecho es generalmente observado
independientemente de que la prueba sea aplicada en ingls
o espaol. No se pueden atribuir las bajas calificaciones en
la escala verbal a un dficit intelectual pues las puntuaciones
en las tareas cristalizadas son influenciadas por la capacidad
de lenguaje, por la cultura y por el estilo cognoscitivo.
Kaufman (dem) recomienda que, al evaluar un nio bilinge
a travs del WISC-R, no se compute o interprete el CI global
y se proceda a una interpretacin juiciosa de la discrepancia
CI V-E.
113
Dialecto de los negros
Se ha observado que la pronunciacin, estructura gramatical

y vocabulario del nio negro tienen sus peculiaridades. Aunque
el examinador est familiarizado con el lenguaje y la cultura
negra posiblemente sentir el impacto del dialecto de los
negros en el CI del WISC-R. Tanto el CI verbal cuanto el
de Ejecucin pueden ser afectados, sin embargo el CI verbal
es el ms vulnerable. Cuando los examinadores desconocen
el dialecto de los negros puede haber una profunda influencia
de las diferencias de lenguaje sobre el CI verbal. Hay muchas
diferencias de pronunciacin que pueden provocar dificultades
en los estmulos de Vocabulario y Semejanzas. Adems, al
contestar los reactivos verbales el nio puede usar palabras
y conceptos especficos a la cultura negra. Muchas de estas
respuestas, que pueden ser correctas o parcialmente correctas,
pueden ser tomadas como incorrectas por un examinador que
no tenga los conocimientos pertinentes. As, cuando un nio
negro presenta una puntuacin de ejecucin mucho ms alta
que la verbal, debe considerarse la posibilidad que su puntuacin
verbal est disminuida por las diferencias lingsticas.
Problema de coordinacin
Un CI Verbal ms alto que uno de Ejecucin no necesariamente

indica que el nio ha desarrollado mejor su capacidad mental
verbal que no verbal. Muchos subtests de ejecucin exigen
una coordinacin motora considerable para un rendimiento
acertado. Nios con un desarrollo motor deficiente tienden
a obtener una baja puntuacin en la Escala de Ejecucin. Los
subtests Diseo con cubos, Composicin de objetos, Laberintos
y Dgitos y Smbolos son los que ms coordinacin motora
exigen. Siempre que el examinador observe que las puntuaciones
normalizadas del nio en los primeros cinco subtests de
114
ejecucin muestran una disminucin constante, debe considerar

la posibilidad de un problema motor. Si el nio no manifiesta
alguna dificultad de coordinacin durante la aplicacin, sobre
todo de la escala de ejecucin, la hiptesis debe ser rechazada.
Cuando esta hiptesis no es rechazada, es importante aplicar
tests suplementarios especficos que permitan verificarla
(Ejemplo: Bender).
Exigencias de tiempo
Las discrepancias de tipo V > E tambin pueden ser explicadas

por la incapacidad del nio de conducirse adecuadamente
bajo situaciones de apremio. En todos los subtests de ejecucin
se toma el tiempo y en muchos se dan bonificaciones por una
rpida ejecucin. Sin embargo, en la escala verbal slo se
controla el tiempo en Aritmtica. Un nio con este tipo de
problema tendr no solamente una puntuacin de ejecucin
baja pero tambin la de Aritmtica. En general, la conducta
del nio proporciona indicios de su problema. Algunos emiten
respuestas claramente negativas hacia el cronmetro o
comportamientos que indican ansiedad con respecto al mismo;
otros harn caso omiso del cronmetro o de la importancia
del tiempo. El rendimiento deficiente en los subtests
cronometrados puede ser debido a (adems de problemas de
coordinacin motora): inmadurez, ansiedad, distraccin,
reflexin o compulsin.
Un mtodo para verificar la capacidad no verbal de solucin
de problemas sin presiones de tiempo, es el probar los lmites
al terminar la aplicacin del WISC-R completo. En este caso
se elimina el cronmetro y se presenta otra vez aquellos
reactivos que el nio no pudo contestar correctamente,
analizando su conducta bajo estas nuevas condiciones.
115
Dependencia e independencia del campo
Segn Kaufman (1982) el estilo cognoscitivo bipolar

dependencia-independencia del campo "se refiere al proceso
o forma de una actividad cognoscitiva (es decir, se interesa
en cmo percibimos, aprendemos, nos relacionamos con la
gente, etc.), ms que al contenido; es difuso, abarca los
dominios sociales, intelectivos y personales, y es estable con
el tiempo; adems, a diferencia de los extremos de la
inteligencia, cada polo tiene un valor adaptativc bajo
circunstancias especficas" (p.46).
El aade que, en general, las personas independientes del
campo son flexibles en situaciones que exigen la resolucin
de problemas, imponen una estructura cuando se carece de
ella al manejar materiales verbales y perceptuales, tienen una
orientacin impersonal, son interesadas por los aspectos
tericos y abstractos y utilizan la intelectualizacin como
mecanismo de defensa. Las dependientes del campo estn en
armona con los aspectos sociales de su medio ambiente, echan
mano del orden social predominante, se interesan por la gente
y gustan de estar con ella, no estructuran de forma espontnea
a los estmulos (los dejan como estn), tienen un concepto
corporal global y no detallado y utilizan defensas inespecficas
como la represin.
Las personas independientes del campo, por su forma
analtica tienen mayor facilidad en los subtests Figuras
incompletas, Diseo con cubos y Composicin de objetos. En
consecuencia, puede atribuirse una discrepancia E > V al
hecho que el sujeto sea del tipo independiente del campo, as
como la relacin V > E puede estar asociada a un tipo
dependiente del campo. El mismo autor apunta que pueden
comprobarse las hiptesis relacionadas al estilo cognoscitivo:
1) analizando el perfil de los subtests que debe indicar que
las puntuaciones normalizadas obtenidas en Figuras
116
incompletas, Diseo con cubos y Composicin de objetos son

radicalmente distintas (mayores o menores) al promedio de
las dems puntuaciones (verbales y no verbales); 2) aplicando
instrumentos especficos para discriminar el estilo cognoscitivo
(Ejemplo: Test de Figuras Ocultas); 3) integrando la
informacin referente al medio del nio con las observaciones
del comportamiento del nio en las reas social y personal.
Operacin de evaluacin de GUILFORT
Las escalas verbal y de ejecucin difieren en el grado en que

miden la operacin de ' 'evaluacin'' descrita por Guilfort.
Esta operacin est relacionada con la capacidad para emitir
juicios tomando como base una norma conocida. Este proceso
mental es requerido para que se obtengan buenas puntuaciones
en los cinco subtests de ejecucin normalmente aplicados,
pero slo es necesario para un subtest verbal Comprensin.
Luego, las discrepancias V-E pueden deberse a la capacidad
de evaluacin excelente o deficiente y no a diferencias entre
las habilidades de Comprensin Verbal y Organizacin
Perceptual. Segn Kaufman (1982), dos condiciones son
importantes para la formulacin de esta hiptesis: 1) que
exista poca variacin en las puntuaciones normalizadas de
la Escala de Ejecucin, 2) que la puntuacin de Comprensin
difiera significativamente del promedio de las puntuaciones
verbales y que sea consistente con el promedio de las
puntuaciones normalizadas obtenidas en la Escala de
Ejecucin.
Influencias socioeconmicas
Las discrepancias V-E pueden ser atribuidas, en parte, al

medio socioeconmico del nio. La investigacin ha
demostrado que los hijos de profesionistas tienden a obtener
117
puntuaciones superiores en la Escala Verbal, mientras que

en los hijos de trabajadores no especializados sucede el opuesto.
Kaufman comenta: "aunque los datos son muy variables para
cada categora socioeconmica, estas tendencias son dignas
de atencin ya que sugieren que las experiencias que el nio
tiene en su medio pueden ayudar a conformar sus habilidades
relativas en las esferas verbal y no verbal" (dem, p.50).
Kaufman (1982) menciona algunas situaciones en que la
discrepancia CI V-E carece de importancia:
Los cocientes de inteligencia no corresponden a las

puntuaciones del factor
No hay un acuerdo perfecto entre el CI de la escala y el factor

(verbal o no verbal). El subtest Aritmtica realmente no
pertenece al factor verbal, tampoco hay datos que apoyen la
inclusin de Dgitos y Cdigos en el factor perceptual. En
consecuencia, hay que analizar el impacto que tienen estos
dos subtests sobre la discrepancia V-E. Discrepancias V-E
que aparentemente no son significativas (inferiores a 12)
pueden en realidad ser importantes, o viceversa.
Compensacin Verbal de la deficiencia en Ejecucin
Los nios que tienen habilidades verbales excepcionalmente

desarrolladas pueden utilizarlas para compensar habilidades
no verbales deficientes. En este caso hay que observar el
rendimiento del nio en dos tests no verbales, que tienen
cargas secundarias de Comprensin Verbal - Ordenacin de
figuras y Figuras incompletas - y su discrepancia de los dems
tests de ejecucin. Muchas veces se observa que los nios
altamente verbales vocalizan sus estrategias de resolucin de
problemas.
118
Dispersin en el perfil
Siempre que se observe una dispersin considerable en el

perfil de puntuaciones normalizadas, en la Escala Verbal,
en la Escala de Ejecucin o en ambas, la discrepancia V-
E suele perder significado. La existencia de dispersin de
las puntuaciones normalizadas obtenidas en la Escala Verbal
indica que la capacidad global de Comprensin Verbal del
nio no es la causa principal de las puntuaciones normalizadas
que obtuvo en los distintos subtests de esta escala, sino que
existen otras variables que han contribuido; por lo tanto el
CI Verbal no corresponde a una entidad unitaria. El mismo
tipo de razonamiento debe ser realizado en cuanto a la Escala
de Ejecucin. En este caso la discrepancia entre los CI V-
E tiene poco significado.
Efectos de la repeticin del test
Varias situaciones pueden llevar a una reaplicacin del test

con un intervalo de unos cuantos meses. "En ningn caso
en que se vuelva a aplicar el WISC-R despus de uno o varios
meses son de fiar las discrepancias V-E y los CI globales
obtenidos por los nios en segunda aplicacin'' (Kaufman,
1982, p.56). Cuando se realiza un retest despus de un mes,
se espera que cualquier nio logre un incremento cercano
a los 7 puntos en su CI total. Sin embargo, este incremento
no se distribuye igualmente entre el CI Verbal y el CI de
Ejecucin. El primero obtiene un incremento de 3 puntos
mientras que el segundo aumenta de 9 puntos. Este
incremento desigual puede provocar una discrepancia
significativa en la reaplicacin. Es probable que el mayor
incremento del CI de Ejecucin se deba a una familiaridad
relativa con las tareas. Si es posible, es conveniente aplicar
un instrumento de retest diferente (Ejemplo: el Stanford-
Binet). En el caso que se reaplique el WISC-R, se debe
119
proceder a una interpretacin prudente, sin dar importancia

indebida al CI global o a la discrepancia V-E. "Cuando la
discrepancia V > E casi es significativa, se debe suponer que
probablemente refleje una diferencia significativa; sin em-
bargo, se deben ignorar aquellas discrepancias E > V que
apenas son significativas. En caso que se encuentren grandes
discrepancias E > V, es pertinente mantener como hiptesis
viable que la magnitud de esas discrepancias se puede atribuir
parcialmente al retest" (dem, p. 57).
c. Dispersin intra-individual
Kaufinan (1982, p. 64) propone el siguiente procedimiento para

calcular fluctuaciones internas significativas en el WISC-R:
1) Compute la puntuacin normalizada promedio de todos los
subtests de la Escala Verbal aplicados (5 o 6) y la puntuacin
normalizada promedio de los subtests de la Escala de Ejecucin.
Redondee cada promedio al nmero entero ms prximo.
2) Examine las puntuaciones normalizadas de la Escala
Verbal y anote todos los valores que estn 3 puntos por arriba
del promedio de esta escala. Estas son las ventajas significativas
del nio y deben sealarse con " V " . En seguida anote los
valores que estn 3 puntos por abajo del promedio de la Escala
Verbal y selelos con " D " (desventaja).
3) Realice el mismo procedimiento arriba mencionado con
las puntuaciones de la Escala de Ejecucin.
4) Todas las puntuaciones normalizadas cuyas desviaciones
no son significativas deben considerarse como fluctuaciones
al azar
Deben interpretarse las ventajas y desventajas del nio con
base a las funciones intelectuales medidas por los subtests
cuya dispersin es significativa. En la sesin del WAIS, se
mencionan las funciones intelectuales medidas por cada uno
de los subtests de la escala.
120
9. NORMAS
Las normas para ambas versiones del WISC son presentadas

en CI de desviacin, considerando una media de 100 y una
desviacin estndar de 15 puntos. Los manuales presentan
tablas de normas para 11 grupos de edad.
El WISC fue estandarizado en una muestra de 2,200 nios
de E.U.A., distribuidos en 11 grupos de edad (100 nios y
100 nias de cada edad), de 5 aos 0 meses a 15 aos 11
meses. Todos los nios fueron examinados dentro de un mes
y medio de su medio ao; por ejemplo los nios de 5 aos,
ya haban cumplido 5 aos, 4 meses y 15 das, sin embargo
no haban pasado de los 5 aos, 5 meses y 15 das. Los
requisitos de muestreo fueron basados, en gran medida, en
los datos del Censo de E.U.A de 1940, tomndose en cuenta
la edad, el sexo, el rea geogrfica, la residencia urbana-
rural y la ocupacin de los padres. Se incluyeron en la
muestra 55 casos de dbiles mentales, la mayora provenientes
de escuelas especiales (Wechsler, 1981c).
Las normas del WISC-R provienen de una muestra de
2,200 nios de E.U.A., 200 de cada uno de los 11 grupos
de edad, desde los 6 hasta los 16 aos. Cada nio fue
examinado hasta seis semanas de su medio ao cumplido,
como en el WISC. El plan de muestreo fue estratificado y
se seleccionaron variables de acuerdo con los datos del Censo
de 1970. Las variables utilizadas fueron: edad, sexo, raza
(blancos y no blancos), regin geogrfica, ocupacin de los
jefes de la familia y residencia rural-urbana. La muestra de
estandarizacin se limit a nios ' 'normales"; no se tomaron
en cuenta nios institucionalizados con anormalidades
mentales o con problemas emocionales graves. Un total de
202 examinadores aplicaron la prueba a lo largo de E.U.A.,
entre diciembre de 1971 y enero de 1973 (Wechsler, 1981d).
La estandarizacin de la versin mexicana (WISC-RM)
121
se inici en 1964, con una muestra de nios residentes en la

ciudad de Mxico. La muestra incluy nios escolares urbanos,
de ambos sexos y de tres niveles de sistemas escolares, que
representaban tres niveles econmicos de la ciudad de Mxico
(Morales, 1993).
Para estudiar la confabilidad de las dos versiones del WISC,

se utiliz el procedimiento de divisin en mitades, excepto
en los casos en que este procedimiento no era apropiado:
Repeticin de Dgitos y Dgitos y Smbolos. Para Dgitos y
Smbolos se utiliz el procedimiento de test-retest y para
Repeticin de dgitos se obtuvo la correlacin entre las
puntuaciones de Dgitos en Orden Progresivo y Dgitos en
Orden Inverso, corregida por la frmula de Spearman-Brown.
Fueron calculados coeficientes de confabilidad de las
subescalas y de la escala total a partir de los coeficientes
obtenidos para los subtests.
En el caso del WISC, la confabilidad de los subtests, de las
subescalas y de la escala total ha sido testada con los grupos de
edad de 7 , 10 y 13 aos, considerados los ms representativos
de los rangos de edades para los cuales fue diseada la prueba. Los
coeficientes de confabilidad para la Subescala Verbal variaron, en
funcin del grupo de edad, entre .88 y .96; los de la Subescala de
Ejecucin, entre .86 y .90; y los de la Escala Total entre .92 y .94.
Los coeficientes de confabilidad fueron ms elevados en los
grupos de edades ms altas. El Error Estndar vari tambin
con el grupo de edad: para la Subescala Verbal entre 3.00
y 5.19, para la Subescala de Ejecucin, entre 4.74 y 5.61 y
para la Escala Total entre 3.68 y 4.25. El Error Estndar fue
siempre menor en los grupos de edades ms altas (Wechsler,
1981c).
Para estudiar la confabilidad del WISC-R, se tomaron en
122
cuenta los 11 grupos de edad. Para la Subescala Verbal el

coeficiente promedio fue .94, para la Subescala de Ejecucin
fue .90 y para la Escala Total fue .96. Los valores promedio
observados de Error Estndar fueron de 3.6, 4.66 y 3.19,
para las escalas verbal, de ejecucin y total, respectivamente.
Con el WISC-R se sacaron tambin coeficientes de estabilidad,
reaplicando la prueba despus de un intervalo de cerca de
un mes. Una comparacin en la media de los CI en la primera
y en la segunda aplicacin revela un aumento de alrededor
3 puntos en la Escala Verbal, 9 puntos en la escala
de Ejecucin y de 7 puntos en la escala Total. Estos resultados
deben ser tomados en cuenta cuando se reaplica la prueba
despus de un breve intervalo de tiempo (Wechsler, 198Id).
La confiabilidad del WISC-RM fue verificada a travs del
procedimiento de test-retest, con un intervalo de 12 meses,
en tres grupos de edades: 6-7 (133 casos), 9-10 (118 casos)
y 12-13 (133 casos). Los coeficientes de confiabilidad
obtenidos variaron, segn el grupo, entre .72 y .76 para la
subescala verbal, entre .64 y .70 para la subescala de ejecucin
y entre .77 y .79 para la escala total (Morales, 1993).
La validez, del WISC y del WISC-R, fue estudiada a travs
de las intercorrelaciones entre los diferentes subtests. En el
caso del WISC, en tres grupos de edad (7 , 10 y 13
) y en el caso del WISC-R en todos los 11 grupos de edad.
Los coeficientes obtenidos son presentados en los respectivos
manuales e indican que, en general, cada subtest verbal se
correlaciona mejor con la subescala verbal que con la de
ejecucin y que cada subtest de ejecucin se correlaciona
mejor con la subescala de ejecucin que con la verbal
Fueron realizados tambin estudios para determinar la
relacin entre el WISC-R y otras medidas de inteligencia,
de aplicacin individual: el WPPSI, el WAIS y el Stanford-
Binet. La correlacin entre el CI total del WISC-R y el del
123
WPPSI, obtenida con un grupo de 50 nios de 6 aos 0 meses

fue de .82. La correlacin obtenida entre el CI total del WISC-
R y el del WAIS, en un grupo de 40 nios con edades de 16
aos 11 meses, fue .95. La correlacin entre el WISC-R y
el Stanford-Binet fue estudiada en cuatro grupos de nios (6,
9 , 12 y 16 aos). Los coeficientes de correlacin
promedio, entre los CI de la subescala verbal, de la subescala
de ejecucin y de la escala total y los CI del Stanford-Binet,
fueron .71, .60 y .73, respectivamente. Estos valores son
similares a aquellos obtenidos en estudios que comparan el
Stanford-Binet al WISC (Wechsler, 198Id).
La validez del WISC-RM fue estudiada mediante un anlisis
factorial por edades. Los resultados confirmaron aquellos
obtenidos por Wechsler y otros investigadores con la escala
WISC. Adems, fue realizado un anlisis de varianza (ANOVA)
con el objetivo de probar el poder discriminative de cada
subtest, por edad, y de verificar la hiptesis de diferenciacin
por sexo y nivel socioeconmico (Morales, 1993).
11. COMENTARIOS
Las ventajas del WISC son similares a las atribuidas al WAIS,

sobre todo respecto a la posibilidad de elaborar un diagnstico
ms fino de las habilidades intelectuales, ms y menos
desarrolladas, del nio. La aplicacin y puntuacin del WISC-
R es relativamente ms fcil que la del WISC. Los cambios
realizados en el WISC-R fueron de gran utilidad para los
examinadores.
Las dificultades encontradas en la utilizacin del WISC
se refieren a aspectos prcticos: aplicacin estrictamente
individual, tiempo de aplicacin considerable, material costoso,
etc. Tanto el WISC como el WISC-R no han sido estandarizados
para la poblacin mexicana, solamente traducidos para el
espaol. La versin mexicana, construida bajo la direccin
124
de Daz-Guerrero (WISC-RM), es la que presenta una

estandarizacin para la poblacin mexicana. Sin embargo,
hay que llevar en consideracin que la muestra utilizada se
limit a la ciudad de Mxico, no siendo por lo tanto
representativa de toda la poblacin mexicana.
Kaufman, A.(1982) Psicometra razonada con el WISC-R.

Mxico D.F.: Editorial El Manual Moderno.
Magnuson, P. (1979). Teora de los tests Mxico: Editorial
Trillas.
Morales, M.L. (1993). Psicometra Aplicada (2a ed., 2a re-
impresin) Mxico D.F.: Editorial Trillas.
Wechsler, D. (1981c). WISC-Espaol - Escala de Inteligencia
para el nivel escolar -Manual. Mxico D.F.: Editorial
El Manual Moderno.
, D. (1981d). WISC-R-Espaol - Escala de Inteligen-
cia revisada para el nivel escolar - Manual. Mxico
D.F.: Editorial El Manual Moderno.
125
CAPITULO VIII
ESCALA DE INTELIGENCIA PARA LOS

NIVELES
PREESCOLAR Y PRIMARIO (WPPSI)
La escala WPPSI (Wechsler Preschool and Primary Scale

of Intelligence), fue presentada en 1963. La idea original era
elaborar una escala que fuera una extensin descendiente del
WISC. Sin embargo, despus de un estudio preliminar, y
por razones tericas y prcticas, se consider que el WPPSI
"era una escala independiente, adaptada de manera ptima
al examen mental de los nios de 4 a 6 aos" (Wechsler,
198 le, p. 1). Asimismo, ocho de los once subtests del WPPSI
y casi la mitad de sus reactivos provienen directamente del
WISC. Las modificaciones bsicas que se hicieron en los
subtests provenientes del WISC son: adicin de elementos
ms fciles y eliminacin de otros ms difciles, algunos
cambios en el contenido de reactivos y en la forma de la
aplicacin.
Posteriormente se present una versin revisada (WPPSI-
R) que puede ser utilizada con nios de 3 a 7 aos de edad.
La versin en espaol WPPSI espaol surgi en 1981
(Wechsler, 198 le). En Mxico, fue realizado un estudio para
la traduccin, adaptacin, confiabilidad y validez del WPPSI
127
en un grupo de 60 nios de nivel socio econmico medio alto

(Coto Villa y Llano de la Torre, 1981).
El WPPSI consta de un total de once subtests, seis

pertenecientes a la subescala verbal y cinco a la subescala
de ejecucin. Ocho de los subtests provienen del WISC:
Informacin, Vocabulario, Aritmtica, Semejanzas,
Comprensin, Figuras Incompletas, Laberintos y Diseo con
Prismas y tres son nuevos: Frases, Casa de los Animales y
Diseos Geomtricos. El subtest de Frases es complementario
y slo debe ser utilizado como alternativa, cuando no se puede
aplicar o se queda invalidado uno de los subtests verbales.
Las subescalas, verbal y de ejecucin estn compuestas por
los siguientes subtests (Wechsler, 198le):
Subescala verbal Subescala de ejecucin

Informacin Casa de Animales
Vocabulario Figuras Incompletas
Aritmtica Laberintos
Semejanzas Diseos geomtricos
Comprensin Diseos con prismas (o con cubos)
Frases (complementario)
3. MATERIAL
El material del WPPSI se compone de: (1) un manual, (2)

un protocolo, (3) una hoja con laberintos, (4) una hoja de
Diseos Geomtricos, (5) un tablero de 28 cilindros de colores
para Casa de los Animales, (6) una libreta con espiral que
contiene los reactivos de Figuras Incompletas y algunos de
Diseo con Prismas, (7) una libreta con espiral que contiene
128
algunos de los problemas de Aritmtica y los de Diseos

Geomtricos, (8) una caja con 14 prismas, rojo y blancos
para Diseo con Prismas y para algunos de los problemas
de Aritmtica. El examinador necesitar tambin un
cronmetro y dos lpices de color rojo (Wechsler, 198le).
El WPPSI puede ser utilizado con nios de 4 a 6 aos

y el WPPSI-R con nios de 3 a 7 aos.
La administracin es exclusivamente individual.
La aplicacin del WPPSI requiere entre 50 y 75 minutos.

Si posible, la prueba debe ser aplicada en una nica sesin.
Caso el nio de muestra de cansancio o desmotivacin, puede
aplicrsela en dos sesiones, con un intervalo mximo de una
semana.
En el WPPSI tambin existen subtests con tiempo
estrictamente limitado y otros que no tienen lmite de tiempo.
En estos ltimos, se considera que 15 segundos son suficientes
para que el nio inicie su respuesta.
7. PROCEDIMIENTO DE APLICACIN
Como en las dems escalas de Wechsler, las instrucciones

de aplicacin y calificacin, presentadas en el manual, deben
ser seguidas con la mayor precisin posible. Siendo el WPPSI
utilizado con nios muy pequeos, su aplicacin requiere
del examinador mucha simpata, objetividad y paciencia. Es
129
muy importante mantener el inters y motivacin del nio,

pero deben ser evitadas manifestaciones de efusividad o
sobreproteccin. Con frecuencia, los nios pequeos quieren
manejar el material, situacin que debe ser debidamente
controlada por el examinador.
Llenar los datos personales del sujeto es el primer paso
de la aplicacin, seguido del clculo exacto de la edad del
nio, cuyo procedimiento viene descrito en el manual. En la
aplicacin, se alternan los subtests verbales y de ejecucin,
as como los "fciles" y "difciles". El orden de aplicacin
indicado, en el manual, es el siguiente: 1) Informacin, 2) Casa
de Animales, 3) Vocabulario, 4) Figuras Incompletas, 5)
Aritmtica, 6) Laberintos, 7) Diseos Geomtricos, 8)
Semejanzas, 9) Diseo con Prismas y 10) Comprensin. Este
orden puede ser alterado, si el nio presenta alguna dificultad
especial o manifiesta alguna resistencia a un determinado
subtest (Wechsler, 198le).
El subtest de Casa de Animales puede ser reaplicado,
despus de todos los dems, con el objetivo de ayudar al
examinador en la evaluacin cualitativa de la habilidad del
nio para aprender una tarea simple. La reaplicacin permite,
muchas veces, diferenciar a los sujetos de aprendizaje rpido
o lento. El subtest de Frases es aplicado cuando se invalida
o no se puede aplicar alguno de los subtests verbales.
En la mayora de los subtests se inicia la aplicacin por
el reactivo 1, con excepcin de los subtests de Aritmtica,
Diseo con Prismas y Frases cuyo reactivo inicial depende
de la edad del nio.
El procedimiento bsico de calificacin, aunque muy similar

al del WISC, supone criterios distintos, sobre todo en los
subtests que implican una calificacin no objetiva. Se asignan
130
uno o ms puntos a las respuestas correctas y se calcula,

para cada subtest, la puntuacin natural. Cada puntuacin
natural es convertida en puntuacin normalizada, utilizndose
los cuadros de conversin, presentados en el manual, que
estn divididos por rangos de edades. Se halla la Puntuacin
Verbal, que es la suma de las puntuaciones normalizadas de
los cinco subtests verbales, y la Puntuacin de Ejecucin,
que Se obtiene sumando las cinco puntuaciones de los subtests
de ejecucin. Es importante sealar que caso se reaplique
el subtest Casa de Animales, no se incluye en la suma de
la Puntuacin de Ejecucin la puntuacin normalizada de la
reaplicacin, slo la de la primera aplicacin. Si solamente
se pueden tomar en cuenta cuatro de los subtests de una
subescala (por problemas de invalidez), debe prorratearse
la suma de puntuaciones normalizadas de esta subescala,
multiplicndola por cinco cuartos (5/4) (Wechsler, 198le).
En seguida, se calcula la puntuacin total, sumando la
Puntuacin de Ejecucin con la Puntuacin Verbal. Estas
tres puntuaciones son convertidas a CI mediante los cuadros
de conversin presentados en el manual. Todas las
puntuaciones son apuntadas en el protocolo, en los espacios
correspondientes. Adems, puede trazarse la grfica de las
puntuaciones del sujeto en el protocolo. Para establecer el
diagnstico, se utiliza la tabla de clasificacin de la inteligencia,
ya presentada anteriormente (ver Captulo VI ).
8.1. Aspectos cualitativos
Analizando las respuestas del nio, puede llegarse a una

mayor y mejor comprensin de ste, puesto que, sus respuestas
reflejan, no slo las influencias culturales o familiares, sino
tambin algunas caractersticas de personalidad como:
motivacin, persistencia, impulsividad, ansiedad, necesidad
de realizacin, independencia, etc. Sin embargo, hay que
tener el cuidado de no hacer demasiadas inferencias a partir
de una sola respuesta.
131
Kathia Mara Costa Neiva
8.2. Diagnstico de deficiencia mental en nios de edad

preescolar
Aunque el diagnstico de deficiencia mental en nios pequeos
puede ser una tarea relativamente fcil, "su diferenciacin
de otras incapacidades o deficiencia similares (por ejemplo,
esquizofrenia y lesin cerebral), en muchas ocasiones es
realmente difcil(Wechsler, 198 le, p.26). La dificultad mayor
est en distinguir las perturbaciones congnitas del desarrollo
mental interrumpido y tambin en evaluar, de manera objetiva,
las deficiencias. Esta evaluacin se vuelve an ms importante
a la medida en que se acerca la entrada del nio en la edad
escolar.
a. Diferencia entre el CI verbal y el CI de ejecucin
Wechsler (198le) considera que la diferencia entre el CI

verbal y el CI de ejecucin es significativa, a un nivel de
confianza de 5%, cuando es mayor que 11 puntos. Segn l,
una diferencia de 15 o ms puntos es importante y debe ser
investigada.
b. Diferencia entre las puntuaciones normalizadas de los

distintos subtests
Wechsler presenta en el manual del WPPSI un cuadro con

las diferencias entre las puntuaciones normalizadas requeridas
para la obtencin de una significancia estadstica al nivel de
confianza de 15%. Segn l, una diferencia de 3 puntos entre
las puntuaciones normalizadas de cualquier par de subtests
es significativa a este nivel de confianza (dem).
132
9. NORMAS
Las normas del WPPSI son presentadas en CI de desviacin,

considerando una media de 100 y una desviacin estndar
de 15 puntos. En el manual se encuentran tablas de normas
para 6 grupos de edad.
Las normas del WPPSI fueron derivadas de una muestra
considerada representativa de los nios estadounidenses de
4 a 6 aos de edad. El total de la muestra fue de 1,200
nios, 100 nios y 100 nias para cada uno de los seis grupos
de edad, que estn divididos por intervalo de seis meses. Cada
nio fue examinado dentro de las seis semanas anteriores o
posteriores a su cumpleaos o dentro de las seis semanas
anteriores o posteriores a su medio ao cumplido. La muestra
fue basada en los datos del Censo de E.U.A. de 1960 y fue
estratificada segn los siguientes criterios: edad, sexo, regin
geogrfica, residencia (urbana-rural), color (blancos-no
blancos) y ocupacin del padre (Wechsler, 198le).
La confiabilidad fue estudiada mediante las correlaciones

entre las puntuaciones naturales de los reactivos pares y
aquellas de los reactivos nones, que fueron en seguida
corregidas a travs de la frmula de Spearman-Brown. Como
este procedimiento no es apropiado para subtests que son
cronometrados, como el subtest Casa de Animales, se utiliz
en este caso el procedimiento de test-retest. Los coeficientes
fueron obtenidos para los seis niveles de edad. Los coeficientes
promedios obtenidos para los distintos subtests variaron de
.77 a .87. Los coeficientes promedio de las escalas fueron,
.94, .93 y .96, para la escala verbal, de ejecucin y total,
respectivamente (Wechsler, 198le)
Fue tambin estudiada la estabilidad de las puntuaciones
133
del WPP SI. A un grupo de 50 nios, entre 5 y 5 aos

de edad, se les aplic la escala dos veces con un intervalo
de 48 hasta 117 das. Los coeficientes de estabilidad (corregidos)
de los subtests variaron de .60 a .93. Los coeficientes obtenidos
para la subescala verbal, de ejecucin y la escala total fueron,
.86, .89 y .92, respectivamente (dem).
Se estudi tambin el Error Estndar de la medida para
cada subtest y escala, en los distintos grupos de edad. El
manual del WPPSI presenta un cuadro indicando los distintos
valores obtenidos. En la subescala verbal el Error Estndar
vara, segn el grupo de edad, entre 3.40 y 3.69; en la
subescala de ejecucin vara entre 3.44 y 4.35 y en la escala
total vara entre 2.66 y 3.12 (Wechsler, 1981e).
La validez del WPPSI fue estudiada a travs de las
intercorrelaciones entre: a) los 11 subtests, b) cada subtest
y las subescalas, c) cada subtest y la escala total y d)las
subescalas verbal y de ejecucin. Se tomaron en cuenta los
seis grupos de edad. Se observ, de un lado, que los subtests
verbales se correlacionan mejor con su propia subescala que
con la de ejecucin, y del otro, que los subtests de ejecucin
se correlacionan mejor con su propia subescala que con la
verbal. La correlacin promedio obtenida entre las dos
subescalas verbal y de ejecucin fue de .66 (dem).
La validez fue tambin verificada mediante la correlacin
con otras pruebas de inteligencia de aplicacin individual: la
Escala de Stanford-Binet (Forma LM), el Peabody Picture
Vocabulary Test (Forma A) y el Pictorial Test of Intelligence;
los coeficientes de correlacin obtenidos fueron .75, .58 y .64,
respectivamente. La muestra utilizada fue de 98 nios entre
los 5 y 6 aos de edad. Los coeficientes de correlacin
obtenidos entre los CI del WPPSI y el del Stanford-Binet son
de la misma magnitud que los observados entre el los CI del
WISC y el del Stanford-Binet. Se observ tambin, que el
CI verbal del WPPSI se correlaciona ms con el CI del
134
Stanford-Binet, que el CI de ejecucin, lo que tambin fue

observado en las investigaciones que se interesaron a la
correlacin entre el WISC y el Stanford-Binet (Wechsler,
198 le). La correlacin entre el CI total del WISC-R y el del
WPPSI, obtenida con un grupo de 50 nios de 6 aos 0 meses
fue de .82 (Wechsler, 1981d).
11. COMENTARIOS
El WPPSI tiene las mismas ventajas de las dems escalas

Wechsler, adems de ser una de las pocas escalas que permite
la evaluacin de la capacidad intelectual de nios tan pequeos.
Las dificultades encontradas en la utilizacin del WPPSI
se refieren a los mismos aspectos ya mencionados respecto
a las escalas Wechsler: aplicacin estrictamente individual,
tiempo de aplicacin considerable, material costoso, etc. Esta
prueba tampoco ha sido estandarizada para la poblacin
mexicana, solamente traducida para el espaol. La versin
mexicana, desarrollada por Coto Villa y Llano de la Torre
(1981), no ha sido estandarizada. Estos investigadores
solamente realizaron un primer estudio sobre la traduccin
y adaptacin del WPPSI, limitado a una pequea muestra
(N=60) de nios mexicanos de nivel socio econmico medio
alto.
Coto Villa, M. J. y Llano de la Torre, A. (1981). Estudio

sobre la traduccin, adaptacin, conflabilidad y validez
del test para preescolares y primara de Wechsler
(WPPSI) en un grupo de nios de nivel socioeconmico
medio alto. Tesis indita de Licenciatura en Psicologa.
Universidad Iberoamericana, Mxico D.F.
Wechsler, D. (1981d). WISC-R-Espaol-Escala de Inteligen-
135
cia revisada para el nivel escolar-Manual. Mxico

., D. (1981e). WPPSl-Espaol - Escala de
Inteligencia para los niveles preescolar y primario -
Manual. Mxico D.F.: Editorial El Manual Moderno.
136
CAPITULO IX
BETA II-R
El Beta II-R (Segunda Edicin Revisada) tiene su origen

en el Examen Beta Grupal (Group Examination Beta)
desarrollado por la Armada de los Estados Unidos de
Norteamrica durante la primera guerra mundial para
seleccionar reclutas extranjeros o analfabetos. La versin
original, que fue la primera prueba colectiva de inteligencia,
fue revisada en 1934 por Kellogg y Morton, con el objetivo
de adaptarla a poblaciones civiles (Examen Beta Revisado).
Esta prueba se qued conocida como el Beta I (Primera
edicin). Posteriormente, apareci la edicin utilizada
actualmente (Beta II-R) (Kellogg y Morton, 1974).
Entre una edicin y otra, fueron realizadas varias revisiones
del manual. En 1946, Lindner y Gurvitz llevaron a cabo una
reestandarizacin, utilizando procedimientos basados en la
escala de inteligencia Wechsler-Bellevue. Aunque no se
introdujeron cambios importantes en los procedimientos de
aplicacin y calificacin, es a partir de esta revisin que se
empez a utilizar el CI de desviacin. Se desarrollaron tablas
de conversin para nueve niveles de edad. En 1957, fue
realizada otra revisin del manual que aport nueva
informacin sobre la confiabilidad de la prueba (dem).
Los cambios introducidos en el Beta II-R estn relacionados
al contenido de los reactivos y a la estandarizacin. Aunque
137
la naturaleza de las tareas no cambi, el orden de stas fue

alterado ligeramente. El material sufri modificaciones
(reactivos mayores o redibujados), los reactivos obsoletos,
ambiguos o inadecuados fueron reemplazados por nuevos y
fueron revisadas las instrucciones para que se volvieran ms
comprensibles. Adems, fueron utilizados procedimientos de
estandarizacin ms sofisticados; la muestra estudiada siendo
ms representativa de toda la poblacin norteamericana, de
las mismas edades a las que se destina el instrumento (dem).
El Beta II-R es una prueba de inteligencia no verbal diseada

especialmente para adultos que tienen problemas de lectura
y escritura. Est compuesta de seis tareas, cada una de ellas
mide como uno puede resolver determinados problemas. Las
tareas son: Laberintos, Claves, Figuras Geomtricas, Figuras
Incompletas, Pares Iguales vs Desiguales y Objetos
Equivocados.
3. MATERIAL
El material consta de: 1) un folleto de tareas, donde son

presentadas y contestadas, una a una, las seis tareas; 2) una
lmina complementaria para los ejercicios de prctica de la
tarea 3 (Figuras Geomtricas), 3) una plantilla de calificacin
y 4) el manual de la prueba. Se necesita tambin un cronmetro.
Esta prueba es indicada para adultos que presentan problemas

de lectura (no leen o la lectura es deficiente) y escritura, as
138
como para extranjeros. Es utilizada frecuentemente en prisiones

y en industrias que emplean sobre todo obreros no calificados.
Esta prueba fue construida para posibilitar la aplicacin

colectiva, pudiendo ser tambin administrada en forma in-
dividual. Para la aplicacin grupal se requiere de un
examinador para cada 15 examinados. Se necesitan ms
asistentes cuando en el grupo existan sujetos que requieran
ayuda especial para la ejecucin de los ejercicios de prctica.
Cada tarea tiene un tiempo lmite para su realizacin, que

no incluye el tiempo necesario para las instrucciones y para
la ejecucin de los ejercicios de prctica. El examinador debe
contar, por lo tanto, con un cronmetro o con un reloj con
segundero. Para la aplicacin completa se necesitan cerca
de 30 minutos. Los tiempos lmites para cada tarea son:
TAREA TIEMPO
Tarea 1 (Laberintos) 1 min. 30 seg.
Tarea 2 (Claves) 2 min.
Tarea 3 (Figuras Geomtricas) 4 min.
Tarea 4 (Figuras Incompletas) 2 min. 30 seg.
Tarea 5 (Pares Iguales vs Desiguales) 2 min.
Tarea 6 (Objetos Equivocados) 3 min.
Cada examinado debe contar con dos lpices y una goma; y empezar
139
llenando, en el folleto de tareas, sus datos personales. En el caso

de analfabetos, el examinador debe encargarse de anotarlos.
Cada tarea tiene una instruccin especfica que debe ser leda
atentamente por el examinador. Antes de cada una de ellas, hay
algunos ejercicios de prctica que aclararn cmo hacerlas. Las
tareas son realizadas en orden y contestadas directamente en el folleto
de tareas.
La plantilla de calificacin facilita la correccin de las tareas.

Los criterios de puntuacin varan de una tarea a otra y deben
ser seguidos rigurosamente. En el caso de las tareas 2, 3, 4
y 6, se asigna un punto para cada respuesta correcta. En la
tarea 1 (laberintos) se asigna un punto a la ejecucin correcta
de la mitad de cada uno de los laberintos; la puntuacin
mxima de cada laberinto es de dos puntos. En el manual
vienen los casos en que se considera incorrecta la mitad de
un laberinto. En la tarea 5 (Pares Iguales vs Desiguales) se
atribuye un " + " a las respuestas contestadas correctamente
y un " - " a las respuestas contestadas en forma incorrecta.
Se resta, el total de las respuestas contestadas incorrectamente
(-), del total de las respuestas contestadas correctamente (+).
Unicamente se toman en cuenta los reactivos contestados por
el examinado (Kellogg y Morton, 1974).
Para cada tarea, se convierte la puntuacin bruta o natural
en puntuacin normalizada utilizando un cuadro de conversin
presentado en el manual. En el Sumario de Puntuaciones
(ltima hoja del folleto de tareas), se anotan los valores en
los debidos espacios. La suma de las puntuaciones normalizadas
puede ser convertida a CI de desviacin o percentil, mediante
cuadros de conversin disponibles en el manual. Estos cuadros
140
toman en cuenta el grupo de edad del sujeto. El manual provee

tambin una tabla de clasificacin de la inteligencia, en
funcin del CI obtenido.
9. NORMAS
Las normas son expresas en CI de desviacin y en percentil.

Se determin que los CI, en cada grupo de edades, tendran
una media con valor de 100 y una desviacin estndar con
valor de 15. Las tablas de CI de desviacin y de percentil
estn dividas en siete grupos de edad: (16-17), (18-19),
(20-24), (25-34), (35-44), (45-54) y (55-64).
Las normas provienen de una muestra considerada
representativa de la poblacin norteamericana, compuesta
por 1,050 personas entre 16 y 64 aos de edad. Se utiliz
un procedimiento de muestreo estratificado y se tomaron en
cuenta las siguientes variables: sexo, edad, regin geogrfica,
raza y ocupacin. Aunque el nivel de escolaridad no fue
controlado, se procur que en la muestra existiera una
proporcin semejante de sujetos que haban completado
determinado nmeros de aos escolares en relacin con la
existente en la poblacin norteamericana. La aplicacin de
la prueba se llev a cabo entre abril de 1974 y mayo de 1976
(dem).
La confiabilidad del Beta II-R fue testada en una muestra

de 79 sujetos (40 hombres y 39 mujeres) de 16-17 aos. Como
las tareas de esta prueba deben ser resueltas con rapidez,
el procedimiento de confiabilidad utilizado fue el de Test-
Retest con intervalo de 3 semanas. El coeficiente de estabilidad
obtenido fue de .91. El Error Estndar de la medida es de
4.6, lo que significa que existe una probabilidad de 2 sobre
141
3 de que el CI real del examinado se encuentre dentro de 4.6

puntos del CI obtenido (Kellogg y Morton, 1974).
La validez ha sido estudiada mediante la correlacin entre
la puntuacin obtenida en el Beta y la puntuacin obtenida
en otras medidas de inteligencia. La Primera Edicin del Beta
presentaba una correlacin de .80 con el Alpha, de .73 con
el Stanford-Binet (Anastasi, 1974) y correlaciones variando
entre .37 y .83 con el WAIS, dependiendo de la muestra
utilizada (Kellogg y Morton, 1974). Es importante sealar
que estos coeficientes fueron obtenidos con muestras muy
especficas.
La correlacin entre el CI del Beta II-R y el CI del WAIS
fue estudiada en una muestra ms amplia y general que tom
dos de los grupos de edad del Beta II-R: 18-19 y 35-44 aos.
Se observ una correlacin entre el CI del Beta II-R y el CI
total del WAIS de .64 (18-19 aos) y de .66 (35-44 aos).
Las correlaciones ms altas se obtuvieron entre los CI del
Beta II-R y los CI de la escala de ejecucin del WAIS: .68
(18-19 aos) y .73 (35-44 aos) (dem).
Fue tambin estudiada la relacin entre la Primera Edicin
del Beta y el Beta II-R. La muestra utilizada fue de 267 sujetos
entre 18 y 54 aos. A 132 sujetos se les aplic primero la
Primera Edicin del Beta y 7 a 10 das despus el Beta II-
R. Al resto de los sujetos se procedi de manera inversa.
Los coeficientes de correlacin obtenidos fueron:. 84 (Primera
Edicin - Beta II-R) y .93 (Beta II-R - Primera Edicin). Este
estudio permiti detectar que, en general, los CI de la Primera
Edicin resultan ms bajos que los obtenidos en el Beta II-
R. Esta diferencia puede ser explicada de dos maneras: (a)
diferencias en las estrategias de muestreo utilizadas en las
dos estandarizaciones y (b) la posibilidad que la poblacin
adulta norteamericana, ejecute mejor actualmente las tareas
en comparacin con los sujetos que participaran de la
normalizacin en 1946 (dem).
142
11. COMENTARIOS
Algunas de las ventajas del Beta 1I-R son: ser una medida
no verbal de inteligencia, permitir una aplicacin colectiva,
poder ser aplicado a personas analfabetas o con problemas
de escritura y lectura, no requerir mucho tiempo para su
administracin.
Entre los inconvenientes est el hecho de que el valor
mximo de este instrumento no es muy alto, no diferenciando
bien entre sujetos de capacidades muy altas. Por este motivo,
se recomienda que los individuos que puntan muy alto en
esta prueba deberan ser examinados con otros instrumentos,
para que se pueda obtener una medida ms exacta de su
capacidad (Kellogg y Morton, 1974).
Otro aspecto importante est en las normas. Las tablas
presentadas en el manual son adecuadas solamente para la
poblacin norteamericana, de donde fueron extrados los
datos normativos.
Anastasi, A (1978). Tests Psicolgicos, (3 a ed., 4a reimpre-

sin). Madrid: Editorial Aguilar.
Kellogg, C E . y Morton, N.W. (1974). Instrumento no ver-
bal de inteligencia - Beta II-R. Manual. Mxico D.F.:
Editorial El Manual moderno.
143
CAPITULO X
TEST DE MATRICES PROGRESIVAS
(RAVEN)
Esta prueba fue desarrollada por el psiclogo ingls J.C.

Raven e impresa por primera vez en 1936. Dos aos despus,
la prueba ya tena su forma definitiva y estaba tipificada
(Progressive Matrices 1938 Series A, B, C, D, E).
Posteriormente fueron publicadas: (a) una escala para nios
de 3 a 10 aos y adultos deficientes (1938), (b) una revisin
de la escala general de 1938 (1956) y (c) una escala general
para niveles superiores. La revisin de 1956 present como
cambios el reemplazo de un reactivo y modificacin de la
ubicacin de otros siete (Raven, 1987).
El Test de Matrices Progresivas es una prueba no verbal que

busca medir la inteligencia general. La escala general es
compuesta de 60 problemas, dispuestos en cinco series de
doce problemas (A, B, C, D y E) en orden de dificultad
progresiva. Las dos primeras series plantean problemas de
educcin de relaciones y las dems, problemas de educcin
de correlatos. Es un test de matrices lacunarios pues cada
reactivo es compuesto de una lmina de figuras geomtricas
abstractas lacunarias que exige una tarea de completamiento.
145
Cada figura geomtrica es la matriz de un sistema de

pensamiento. Para descubrir la matriz de pensamiento implicada
en cada figura, el sujeto realiza una tarea de observacin,
comparacin y razonamiento analgico. El completamiento
de la matriz es realizado a travs de eleccin mltiple entre
una serie de 6 o 8 respuestas (dem).
La escala especial es compuesta de 36 lminas dispuestas
en tres series: A, Ab y B. La primera y la ltima son las
mismas de la escala general, la serie Ab es de un nivel de
dificultad intermediario.
3. MATERIAL
El material bsico consta de: (1) un cuaderno de matrices,

donde vienen encuadernadas las lminas en negro y blanco;
(2) un protocolo de prueba, donde se registran los datos y
las respuestas del sujeto; (3) una plantilla de correccin (clave
matriz); (4) una carpeta de evaluacin, donde vienen varias
tablas normativas (baremos) obtenidas con distintas muestras
y una tabla de diagnstico de la capacidad intelectual, y (5)
el manual del autor.
La escala especial es presentada en la forma de tablero
o de cuadernillo y las lminas son coloridas. En la forma de
tablero, las lminas estn encuadernadas sobre planchas de
cartn con excavaciones, de manera que pueden ser manejadas
como un test de tipo encaje. Cada serie viene en una carpeta
y las tres carpetas en un estuche.
La escala general es utilizada con sujetos normales o poco

daados intelectualmente, de 12 a 65 aos. La escala especial
es indicada para nios menores de 12 aos o adultos daados
intelectualmente (reducida capacidad intelectual, serios
trastornos de lenguaje o audicin). La forma de cuadernillo
146
es indicada para nios entre 9 y 11 aos y sujetos deficitarios,

mientras que la forma de tablero es recomendada para nios
menores de 9 aos y sujetos muy deficitarios (Raven, 1987)
En nios menores de 9 aos o adultos muy deficitarios la

aplicacin es individual. En nios mayores de 9 aos o
adultos, la aplicacin puede ser individual o colectiva. Con
estos ltimos, la prueba puede tambin ser autoadministrada.
El tiempo de administracin no es limitado. En general, se

necesitan entre 30' y 40' para la ejecucin de la prueba.
Inicialmente, deben llenarse los datos del examinado en el protocolo

de prueba. El procedimiento de administracin consiste en presentar
a la inspeccin del sujeto, uno a uno, los 60 problemas de
completamiento e instruirle para hallar la respuesta correcta entre
varias soluciones presentadas (6 o 8). Cada respuesta debe ser
anotada en su respectivo espacio en el protocolo de prueba. Las
anotaciones pueden ser realizadas por el examinador (aplicacin
individual) o por el propio examinado (aplicacin colectiva o
autoaplicacin). En el caso de una aplicacin colectiva, el examinador
debe vigilar para asegurarse de que los examinados no se salten
ningn problema, anoten sus respuestas en las respectivas casillas
y no copien entre s.
Para calificar la prueba se utiliza una clave matriz de

correccin que permite verificar las respuestas correctas e
147
incorrectas. Se atribuye un punto para cada respuesta correcta.

Se calculan los puntajes parciales (de cada serie) y el puntaje
total (suma de puntajes parciales). Se convierte la puntuacin
bruta a puntaje ponderado (percentil), buscando en la carpeta
de evaluacin la tabla de normas (baremo) ms adecuada a
los datos del examinado (edad, nacionalidad, etc.). Finalmente,
se convierte el percentil en rango, estableciendo as el
diagnstico de la capacidad intelectual del sujeto.
8.1. Consistencia del puntaje
Un segundo procedimiento de evaluacin es la verificacin

de la consistencia del puntaje, cuyo objetivo es comprobar
si la composicin del puntaje del sujeto es ajustada al esperado.
Raven ha calculado los puntajes medios, de cada una de las
series, que deberan componer cada uno de los posibles puntajes
totales. Estos puntajes medios son los puntajes parciales
esperados para cada puntaje total. Para verificar la consistencia
del puntaje de un sujeto, se calcula, por sustraccin, la
discrepancia entre los puntajes obtenidos por el sujeto en cada
una de las cinco series (puntajes parciales) y los puntajes
parciales esperados en razn de su puntaje total. El puntaje
de un sujeto es considerado consistente cuando la discrepancia
entre puntajes parciales y puntajes parciales esperados, no
es mayor que +2 o -2. En el manual se encuentran las tablas
que presentan los puntajes parciales esperados para cada
puntaje total (Raven, 1987).
8.2. Evaluacin de errores
Una forma adicional de evaluacin es la que toma en cuenta

la cantidad de errores. Los errores indican las fallas en el
razonamiento. La ejecucin satisfactoria, de los problemas
propuestos en esta prueba, exige la educcin de tres correlatos:
148
(a) correlato numrico: cantidad de figuras, (b) correlato de

figuras: forma de las figuras y (c) correlato lineal: disposicin
de las figuras (recta, oblicua curva). Al dar una solucin
errada, el sujeto puede estar omitiendo uno, dos o tres
correlatos. As, se distinguen tres tipos de errores: (1) finos
(F) - educcin de dos correlatos; (2) medios (M) - educcin
de un correlato y (3) grosero (G) - completa ausencia de
educcin. En el manual (Raven, 1987, p. 27), se presenta
una tabla de graduacin de errores para los 60 problemas.
Para expresar cuantitativamente cada error, se acreditan
a: errores groseros = 1 puntos, errores medios = 1 punto
y errores finos = punto. Se suman los valores hallando
as el puntaje de error (P.E.). Este puntaje es muy til en
la seleccin de clases de escolares y de cuadros militares
para desempatar percentiles iguales. Tambin es importante
en diagnstico diferencial, para detectar fallas y dficits en
las funciones mentales (dem).
9. NORMAS
Las normas son expresas en percentiles. El manual ofrece

varias tablas de normas (baremos) obtenidas con distintas
muestras: de Argentina, Uruguay, Espaa e Inglaterra. El
nmero de sujetos vara de una muestra normativa a otra,
as como la edad de stos. Algunas normas fueron establecidas
a partir de una aplicacin individual, otras a partir de una
aplicacin colectiva.
El coeficiente de estabilidad (test-retest) del Raven vara

segn la edad, entre .83 y .93. (Raven, 1987; Anstey, 1974).
La validez de criterio ha sido comprobada comparando
los resultados de un grupo de sujetos con la opinin de los
149
maestros acerca de su inteligencia y verificando el xito o

fracaso en el aprendizaje escolar de un grupo de alumnos en
el ao siguiente al de su medicin.
La validez estructural ha sido estudiada a travs de anlisis
factoriales. Raven encontr una saturacin g de .82 (Raven,
1987), aunque otros estudios han llegado a valores entre .75
y .79 (Anstey, 1974). El estudio realizado por Vernon en 1947
(citado por Anstey, 1974) ha detectado un factor especfico
del grupo visual perceptivo, factor espacial, y un residuo
compuesto por otros factores especficos no identificados.
Otro procedimiento, para el estudio de la validez estructural,
obtuvo una correlacin de .86 con el test de Terman - Binet.
11. COMENTARIOS
Las principales ventajas del Test de Matrices Progresivas

(Raven) son: (a) es una prueba no verbal, supuestamente
independiente de factores culturales; (b) es de fcil
administracin y evaluacin; (c) no requiere demasiado tiempo
para ser contestado ni calificado y (d) la tarea motiva tanto
a jvenes cuanto a adultos mayores.
Cuanto a las desventajas, Raven (1987) menciona las
detectadas por M. Madruga en 1958. Algunas de ellas son:
(a) validez deficiente, (b) no mide el factor g con pureza, (c)
permite dar soluciones acertadas por otras vas distintas a
la que se pretende medir (por ejemplo, su probabilidad de
respuestas al azar el de 1/6 o 1/8 segn el reactivo) y (d)
presenta excesiva dificultad para personas de nivel intelectual
mediocre. Anastasi (1978) comenta que estudios realizados
en algunas culturas no europeas llevaron a dudar de la
adecuacin de esta prueba para grupos con ambientes muy
diferentes. Adems, en estos grupos se ha verificado que el
test refleja una cierta educacin y que est susceptible a la
prctica.
150
Anastasi, A. (1978). Tests psicolgicos (3a ed., 4a reim-

presin). Madrid: Editorial Aguilar.
Anstey, E. (1974). Test de domins - manual. Buenos Aires:
Editorial Paids.
' Aires: Paids
151
CAPITULO XI
TEST DE DOMINOS
El test de Domins fue construido para la armada britnica

por el psiclogo ingls Edgar Anstey en 1944. Esta prueba
fue ideada para servir como test paralelo del test de Matrices
Progresivas de Raven y para superar algunos de sus
inconvenientes (Anstey, 1974).
La versin original, que constaba de 44 reactivos, ha
quedado como un "closed test" con uso oficial o exclusivo.
En 1955, Anstey public una nueva versin con carcter de
"open test'', ligeramente diferente de la primera en su material.
Esta, constaba de 48 reactivos de complejidad creciente,
agrupados en ocho pginas segn diferentes principios. Anstey
confi esta nueva versin al investigador uruguayo W. L.
Risso, de la Universidad del Trabajo del Uruguay, para
estandarizacin. La prueba fue entonces tipificada, fueron
elaboradas normas para el Uruguay, estudiada su validez y
confabilidad y preparado su manual (dem).
El test de Domins ha tenido dos adaptaciones: la inglesa
(Group Test 100) y la francesa (D48). La primera, realizada
por el Instituto de Psicologa Industrial de Londres, utiliza
el test de Domins dentro de una batera que incluye tambin
pruebas verbales. La segunda, que alcanz gran difusin, fue
elaborada por P. Pichot y publicada por el Centre de
Psychologie Applique de Pars. Esta adaptacin difiere de
la original sobre todo en la disposicin de los reactivos.
153
Adems de distribuir las fichas de Domins en columnas, en

estrella y en espiral, como el test de Anstey, las dispone
tambin en elipse. El D48 fue estandarizado para sujetos de
12, a 39 aos y proporciona normas para seis niveles culturales
diferentes. En algunos pases de Amrica Latina tambin se
realizaron estudios y adaptaciones del test (Anstey, 1974).
El test de Domins es una prueba no verbal de inteligencia,

que no depende en un grado considerable del ambiente, de
la educacin o de la experiencia del individuo. Se basa en
la teora factorial de Spearman y busca por lo tanto medir
el factor de inteligencia general g.
Es un test de educcin de leyes o principios de relaciones
y de completamiento de series numricas. Los principios que
regulan las secuencias en las series son los siguientes: Simetra,
Alternancia y progresin simple, Asimetra, Progresin
circular, Progresin compleja, Combinacin de principios
previos, Adicin y Sustraccin.
Es un test de figuras numricas de puntos dispuestos en
grupos segn un patrn, las fichas de Domins. Los estudios
han demostrado que la experiencia previa con el juego de
Domins no interviene en el resultado del sujeto (dem).
El test es compuesto de 48 reactivos, impresos en ocho
pginas, a razn de seis reactivos por pgina. Los reactivos,
pertenecientes a un mismo principio, estn dispuestos en orden
de dificultad creciente. Sin embargo, el primer reactivo
correspondiente a un nuevo principio, en general, es ms fcil
que el ltimo reactivo correspondiente al principio anterior.
3. MATERIAL
El material bsico est constituido por: 1) un cuaderno de
154
prueba, donde vienen las instrucciones bsicas, cuatro

ejemplos y 48 reactivos; 2) una hoja de respuestas, 3) una
clave matriz de correccin; 4) una carpeta de instrucciones
y evaluacin, donde se encuentran tambin las tablas de
normas (baremos) y la tabla de diagnstico y 5) el manual
del autor.
Esta prueba puede ser utilizada con sujetos de 12 aos en

adelante, aunque es posible aplicrsela individualmente a
partir de los 10 aos. El autor de la prueba ha comprobado
una cierta dificultad de ejecucin cuando aplic la prueba
a sujetos de ms de 65 aos. El considera que puede aplicrsela
individualmente a enfermos mentales, sin embargo, en ste
caso, la interpretacin de los resultados debe basarse ms
en criterios cualitativos que cuantitativos (Anstey, 1974).
Esta prueba puede ser aplicada en forma individual y colectiva.
Para la realizacin de esta prueba se establece un tiempo

lmite de 30 minutos, con una tolerancia de 12 a 15 minutos
adicionales. Aunque se limite el tiempo, no se considera sta
una prueba de velocidad sino de poder (power test), pues
pretende medir solamente la habilidad de los sujetos y no
su velocidad de trabajo. El autor de la prueba considera que
el tiempo establecido es suficiente para que los sujetos tengan
la oportunidad de intentar la resolucin de todos los problemas.
Los sujetos menos inteligentes nunca resolvern los problemas
ms difciles aunque se les permita dedicar ms tiempo a
155
ellos. En una aplicacin colectiva, la reduccin del grupo a

1/5 o 1/6 de su tamao original puede sealar el tiempo lmite
para la finalizacin de la prueba (Anstey, 1974).
El procedimiento se inicia llenando los datos personales del

examinado en la hoja de respuestas. En seguida, con el cuaderno
de pruebas abierto en la pgina preliminar, se explican las
instrucciones, se discuten los ejemplos ya resueltos (A y B)
y se le pide al examinado que conteste los ejemplos C y D.
La tarea consiste en observar bien un grupo de Domins
y calcular cuantos puntos le corresponden a la ficha que est
en blanco. El sujeto debe llenar, en el debido espacio de la
hoja de respuestas, las cifras que corresponden a la ficha en
blanco. Dentro de cada mitad de la ficha, los puntos pueden
variar de 0 a 6.
La clave matriz de correccin permite una calificacin rpida y

precisa. Se coloca la hoja de respuestas dentro de la clave matriz,
que posee ventanillas por donde se pueden ver las respuestas. Se
hace una marca visible sobre las respuestas correctas. Se adjudica
un punto para cada respuesta totalmente correcta. Una respuesta
totalmente correcta es la que se compone de las cifras exactas en
cada una de las mitades de la ficha en blanco, estando las cifras
ubicadas en la posicin correcta. Se consideran soluciones erradas:
(a) las inversiones de posiciones y (b) las respuestas que omiten
el 0 (cero) y simplemente dejan en blanco la mitad de la ficha (Anstey,
1974).
Con el puntaje total, se busca en la tabla de normas adecuada
el percentil correspondiente. En seguida, se verifica el rango
al cual corresponde el nivel intelectual del examinado.
156
8.1. Porcentaje de eficiencia
Este ndice permite verificar el sistema de trabajo del sujeto:

aproximacin cuidadosa a los problemas, sacrificio de la
exactitud en beneficio de la rapidez, etc. La frmula utilizada
para calcularlo es (dem):
% eficiencia = C / T
donde: C= nmero de respuestas correctas

T= nmero de respuestas que el sujeto ha intentado
resolver, o sea, correctas ms incorrectas.
9. NORMAS
Las normas son expresadas en percentil. El manual ofrece

tres tablas de normas: (a) un baremo ingls para la poblacin
general, (b) un baremo uruguayo: 1 2 - 3 0 aos y poblacin
general, y (c) un baremo argentino provisorio: 1 2 - 1 7 aos
y poblacin general.
La estandarizacin que parece ms consistente es la realizada
en Montevideo, con 1736 sujetos de 12 a 30 aos de edad,
alumnos de escuelas industriales de la Universidad del Trabajo
del Uruguay y del Instituto Crandon. Las normas argentinas
fueron extradas de una muestra de 583 estudiantes de 12
a 17 aos (Anstey, 1974).
Los estudios han encontrado que el coeficiente de confiabilidad

(Kuder-Richardson) del test de Domins tiende a crecer con
la edad, variando de .85 a .91. Para la poblacin general el
es de .85 (dem).
La validez ha sido estudiada por el mtodo de anlisis
157
factorial. Dos estudios obtuvieron una saturacin de g de .82

y un tercero de .90, lo que indica que el test es una buena
medida de la capacidad intelectual general. Un factor especfico
de tipo numrico ha sido detectado en dos de estos estudios
(dem).
Como la idea original es que el test de Domins fuera una
prueba paralela al de Raven, muchos estudios comparativos,
entre las dos pruebas, fueron llevados a cabo. El coeficiente
de correlacin, entre las dos pruebas, obtenido por Anstey
fue de .55, lo que llev a pensar que en realidad los dos tests
son complementarios, pero no paralelos.
11. COMENTARIOS
El test de Domins tiene las ventajas de un test no verbal,

no dependiendo de factores culturales. Es tambin econmico
(su aplicacin puede limitarse a 30 minutos), es confiable
(sobre todo para edades ms altas) y dificulta la respuesta
al azar, pues la probabilidad de respuestas de este tipo es
de 1/49.
Con respecto a desventajas, se considera que las tablas de
normas son muy limitadas en cuanto a los rangos de edad que
utilizan, no existiendo normas de edad especficas para per-
sonas mayores de 30 aos. Para stas, se deben utilizar las
normas de la poblacin general. Otro aspecto importante, est
en el hecho de poseer el test un factor numrico. Se puede
suponer que ste pueda afectar los resultados de personas que
poseen dificultades especficas en el rea de razonamiento
numrico, pero no en otras reas intelectuales.
Anstey, E. (1974). Test de Domins - manual. Buenos Aires:

Editorial Paids.
158
CAPITULO XII
EL TEST DE GOODENOUGH
El Test del dibujo de un hombre de Goodenough fue publicado

por primera vez en 1926. En castellano, su primera publicacin
fue realizada en 1951. Este test "ha sido muy empleado para
examinar el nivel intelectual de los nios pequeos y para estudiar
a aquellos nios que tienen disminuciones auditivas o en los que
se sospecha la existencia de deficiencias neurolgicas" (Harris,
1991, p. 17). Asimismo, ha sido utilizado para estudiar problemas
de personalidad y adaptacin, as como la delincuencia y otros
defectos del carcter.
La hiptesis bsica de este test es que el dibujo que hace
un nio de cualquier objeto, muestra las discriminaciones que
l ha efectuado respecto al mismo, como un concepto. As,
su concepto de un objeto, como el ser humano, "resulta un
ndice til para la creciente complejidad de sus conceptos
en general" (dem, p.23).
El 1963 fue publicada la versin revisada, ampliada y
actualizada del test, por Dale B. Harris. Esta revisin tuvo
por objetivo: (1) extender la escala a los aos de adolescencia
y (2) desarrollar una forma alternativa de la escala de la
figura del hombre, la escala de la figura de la mujer. Se
hicieron algunos otros cambios como: (a) se incluy el dibujo
de s mismo con el objetivo de facilitar un mejor estudio del
autoconcepto, del afecto y del inters, (b) se hizo la
estandarizacin de las escalas de puntos para la figura del
159
hombre y de la mujer y (c) se desarrollaron escalas cualitativas

para una rpida aproximacin a la puntuacin. Para la revisin
del test se reexamin la bibliografa emprica y terica, llegando
a la conclusin de que esta prueba evala la madurez intelectual
o conceptual de nios entre cuatro y catorce aos, teniendo
mucho menos valor como instrumento proyectivo para estudiar
la personalidad y el rea afectiva.
Esta prueba tiene como tarea el diseo de la figura humana.

Segn Harris (1991), Goodenough tom en cuenta los siguientes
aspectos al elegir el tema del dibujo: (a) un tema con el cual
todos los nios estuvieran familiarizados por igual, (b) un
tema que presentara la menor variabilidad posible en sus
caractersticas esenciales, (c) un tema sencillo que permitiera
que aun los nios pequeos pudiesen hacerlo, pero al mismo
tiempo suficientemente complejo para poner a prueba las
capacidades de un joven o de un adulto y (d) un tema de inters
universal y que motivara a todos. Basado en estos criterios,
l seleccion la figura humana, tema relativamente comn en
dibujos espontneos de nios. En la versin original, el dibujo
solicitado era el de un hombre. La eleccin del dibujo de un
hombre se debe al hecho de considerar la vestimenta masculina
ms uniforme.
En esta primera versin, el dibujo del hombre era evaluado
segn una escala de cuarenta tems. El anlisis de una muestra
de dibujos de nios de diferentes edades y niveles escolares,
permiti discernir los cambios que se producen en los dibujos
infantiles con el aumento de la edad y el desarrollo intelectual.
Cada tem fue escogido de manera emprica, pudiendo basarse
"en la presencia o en la ausencia de un determinado elemento,
en el mtodo de representacin de una relacin dada, especial
o cuantitativa, o en la coordinacin ojo-mano" (Harris, 1991,
p. 83). Se hicieron 5 revisiones de la escala original, donde
se reevaluaron los tems y se aadieron otros.
160
La versin actual (test de la figura humana de Goodenough-

Harris), incluye tres dibujos la figura de un hombre, la figura
de una mujer y el dibujo de s mismo que deben ser realizados
en este orden. En cada una de ellas se analizan determinados tems,
que fueron elegidos segn criterios determinados y validados a
travs de investigaciones.
3. MATERIAL
Se requiere para la aplicacin de esta prueba el cuadernillo del test

(protocolo) y un lpiz nmero 2 o 2H (no debe utilizarse crayones).
Para la calificacin se necesita el manual de la prueba.
Esta prueba puede ser utilizada con sujetos entre 3 y 15 aos de

edad.
El test del dibujo de la figura humana de Goodenough-Harris puede

ser administrado en forma individual o colectiva, utilizndoos
mismas instrucciones. Los preescolares y los nios bajo estudio
clnico deben ser examinados individualmente.
No hay lmite de tiempo para la realizacin del test. Los nios

pequeos, en general, no tardan ms de 10 o 15 minutos para hacer
los tres dibujos.
El primer paso de la aplicacin es llenar los datos personales
161
solicitados en el protocolo, que puede ser realizado por el propio

nio, a menos que l aun no sepa escribir. En seguida, el
protocolo debe ser doblado, de manera que solamente la hoja
que corresponde al primer dibujo figura de un hombre
se quede a la vista. Realizado este dibujo, se pasa a la hoja
siguiente, la de la figura de la mujer. Finalmente, se pasa
a la hoja final, la del dibujo de s mismo.
A los nios, menores de ocho o nueve aos, se recomienda
dar un breve descanso entre el segundo y tercer dibujos. En
los grupos de nios mayores (quinto o sexto grado), puede
ser necesario incentivar a los nios renuentes a emprender
la tarea. El autor advierte para algunas situaciones especiales
que pueden ocurrir en la aplicacin del test, como el nio
puede dibujar solamente un busto o arruinar el dibujo y querer
reempezarlo. En ambos casos, el examinador debe dar un
nuevo protocolo, pero guardar ambos dibujos para una
comparacin posterior.
Mientras la aplicacin es muy sencilla, la calificacin requiere

estudio, paciencia y el seguimiento de las instrucciones al pie
de la letra. Cada una de las tres figuras es evaluada en una
escala de puntos, que corresponde a un nmero determinado
de tems: Figura del hombre -73 tems, Figura de la mujer
-71 tems y Dibujo de s mismo -73 tems. En el manual vienen
las instrucciones detalladas para la evaluacin de los distintos
tems; algunos de ellos requieren un juicio ms subjetivo del
examinador. Algunos ejemplos de tems analizados: presencia
de cabeza, presencia de cuello, puente de la nariz, nariz y
labios en dos dimensiones, representacin del nmero correcto
de dedos, proporcin de los brazos, proporcin de las piernas,
vestimenta, coordinacin motriz (lneas), etctera (Harris,
1991)
162
Cada tem, de cada figura, es evaluado como aprobado

o reprobado. A cada tem aprobado se asigna un punto, no
existiendo medios puntos. El total de estos puntos corresponde
al puntaje bruto de la figura, el cual se convierte en puntaje
estndar mediante las tablas presentadas en el manual. Para
esta conversin se toman en cuenta el sexo y la edad del
sujeto. Para cada figura se halla un puntaje estndar. Puede
obtenerse una medida promedio de los dibujos de un hombre
y de una mujer sumando los puntajes estndar y dividiendo
el resultado entre dos. El puntaje estndar promedio representa
una estimacin combinada de la madurez intelectual del nio.
El dibujo de s mismo puede ser evaluado mediante la escala
de puntos del sexo correspondiente. Sin embargo, el
autorretrato no ha sido estandarizado y por lo tanto, debe
ser considerado slo como una medida tentativa de la madurez
intelectual (Harris, 1991).
Finalmente cada puntaje estndar es convertido en rango
percentil, a travs de la tabla de conversin adecuada, tambin
disponible en el manual.
En el protocolo, al lado de cada dibujo, hay espacios para
registrar el puntaje. Se recomienda apuntar un " + " para cada
tem aprobado y un "cero" para cada tem reprobado para
facilitar el control de la calificacin. Hay tambin un espacio
para registrar el puntaje bruto de cada figura. En la primera
hoja hay un cuadro resumen donde deben apuntarse los
puntajes brutos, los puntajes estndar y los rangos percen-
tiles de los tres dibujos, adems del puntaje estndar
promediado.
Para los dibujos de la figura del hombre y de la figura
de la mujer se puede tambin realizar una evaluacin
cualitativa. Las escalas cualitativas permiten una evaluacin
mucho ms rpida de los dibujos que la escala de puntos.
Mientras tanto, sus resultados no son tan exactos,
proporcionando solamente una estimacin aproximada de la
163
madurez intelectual del nio. Para esta evaluacin, debe

utilizarse una muestra de 12 dibujos (disponibles en el manual)
clasificados segn el nivel de madurez del " 1 "(menos maduro)
al "12" (ms maduro). El examinador debe comparar el dibujo
que evala con los dibujos de la muestra y decidir con cual
se parece ms. Atribuir al dibujo que evala el puntaje
correspondiente al dibujo de la muestra que es ms similar.
Este valor debe ser registrado en el espacio correspondiente
del cuadro resumen del protocolo, segn sea la figura de un
hombre o de una mujer. No fue elaborada ninguna escala
cualitativa para el dibujo de s mismo y el autor no cree
conveniente utilizar las muestras de las figuras de un hombre
o de una mujer para evaluarlo.
Los valores obtenidos en la escala cualitativa son convertidos
a puntaje estndar mediante tablas disponibles en el manual.
En esta conversin tambin son tomadas en cuenta la edad
y el sexo del sujeto. Este puntaje estndar es comparable al
obtenido a travs de la escala de puntos y por consiguiente
puede ser convertido en rango percentil mediante la misma
tabla.
Harris (1991) propone aun, en forma experimental, una
gua para el anlisis del dibujo de s mismo. Esta gua tiene
como objetivo detectar rasgos especiales de la personalidad:
intereses, actitudes, preocupaciones, etc. Consta de una
sucesin de preguntas, que van de generales a especficas.
9. NORMAS
Las normas de esta prueba son presentadas en puntaje estndar

con una media de 100 y una desviacin de 15 (CI de
Goodenough) y en percentil. En las tablas de puntaje estndar
se toman en cuenta el sexo y la edad del sujeto.
La estandarizacin y las normas de la escala revisada estn
basadas en 2,975 nios, representativos de la distribucin
164
ocupacional de los Estados Unidos en 1950, pertenecientes

a cuatro reas geogrficas. Se incluyeron 75 nios de cada
nivel de edad provenientes de cada una de estas reas. La
edad de los nios vari de los 5 a los 15 aos y stos fueron
distribuidos de tal manera "que la muestra se centrara
alrededor de los seis meses, con un nmero aproximadamente
igual de nios escogidos por cada mes dentro de ese intervalo
de edad" (Harris, 1991, p. 113). Se busc que la cantidad
de varones y nias en cada estrato ocupacional fueran
siempre igual.
El primer paso para validar la escala revisada consisti en

la validacin de los tems tomados en cuenta en la escala
de puntos. Se utiliz una muestra de 100 nios (50 varones
y 50 nias) con edades entre: 5 aos y 9 meses y 6 aos
8 meses, 6 aos 9 meses y 7 aos 8 meses, y as sucesivamente.
Los nios tenan como edad media, al momento de la realizacin
de la prueba, 6 aos 3 meses, 7 aos 3 meses, etc. Las
muestras de cada edad representaban la distribucin de
ocupaciones paternas en los E.U.A. Los tems fueron
seleccionados segn los siguientes criterios: 1) acusar un
incremento regular y bastante rpido en los nios que aprueban
el tem, 2) mostrar una relacin con alguna medida general
de inteligencia, 3) diferenciar entre los nios que obtenan
un puntaje total alto en la escala y aquellos que obtenan
un puntaje total bajo. Para el dibujo del hombre se ensayaron
100 tems y se seleccionaron 73; para el dibujo de la mujer
se ensayaron 90 de los cuales se mantuvieron 71. En estos
tems "se incluyeron algunos que son inoperantes en la niez
pero tienen cierta incidencia en la pubertad" (Harris, 1991,
p. 89).
Utilizando la misma muestra, fueron seleccionados y
165
validados los dibujos que componen la escala cualitativa. Se

eligieron, de cada grupo de edad, 20 dibujos, 10 de varones
y 10 de nias de acuerdo con una tabla de nmeros al azar.
Estos dibujos fueron dispuestos en un orden fortuito y as
presentados a doce examinadores. Estos, deban clasificar los
dibujos en una escala del " 1 " al "11", el " 1 " correspondiendo
a una menor excelencia y el "11" a una mayor excelencia.
Se incluyeron tambin otras dos categoras para los dibujos
que se apartaban suficientemente de los dems, sea por una
extraordinaria inferioridad (0) o por una extraordinaria
superioridad (12). La escala cualitativa final fue constituida
por 23 dibujos, dispuestos en una escala de 23 puntos de
intervalo, que pueden tambin ser utilizados como una escala
de 12 puntos, si se emplean los valores alternos (Harris,
1991).
La confiabilidad de la escala de puntos fue estudiada
mediante la concordancia en la evaluacin de distintos
examinadores y la coherencia en el rendimiento del nio en
la tarea del dibujo, segn la evaluacin de la escala. La
correlacin entre los puntajes totales obtenidos por distintos
examinadores vari entre .80 y .96. Las correlaciones entre
los puntajes de dibujos infantiles separados por un intervalo
de hasta tres meses variaron entre .60 y .70. Uno de los
estudios considerados ms consistentes por Harris, fue
realizado por McCarthy con 386 nios de tercero y cuarto
grado, siendo la prueba aplicada dos veces con un intervalo
de una semana. La confiabilidad por el mtodo de divisin
por mitades fue de .89, por el mtodo de test-retest fue de
.68. (dem).
En el estudio de la confiabilidad de la escala cualitativa
fueron obtenidas correlaciones, entre los puntajes asignados
por tres examinadores, de .86 a .92 para el dibujo de un
hombre y de .74 a .88 para el dibujo de una mujer. Las
correlaciones entre los puntajes obtenidos en la escala de
166
puntos y en la escala cualitativa variaron, segn la edad,

entre .72 y .94 para la figura de un hombre y entre .73 y
.89 para la figura de una mujer (dem).
La validez de esta prueba fue evaluada mediante dos
procedimientos: 1) estudiando los efectos que determinadas
experiencias o aprendizajes ejercen sobre el rendimiento en
el dibujo, 2) correlacionando estadsticamente la escala con
otras medidas de inteligencia. En el primer caso se estudi
el efecto del examinador, de la enseanza artstica, de ciertos
tipos de instruccin formal, etc. Se observ, en general, que
la influencia del examinador y de la enseanza artstica es
insignificante (Anastasi, 1978, Harris, 1991). En el segundo,
se correlacion la prueba con varias medidas de inteligencia:
Test de habilidades mentales primarias, Test de Stanford-
Binet, WISC, WAIS y otros. Las investigaciones fueron
llevadas a cabo con distintas muestras y los resultados han
proporcionado coeficientes de correlacin muy variados, a
veces altos, a veces bajos. Por ejemplo,' 'con nios pequeos,
el puntaje del Test de Goodenough se asocia de modo notable
con la madurez intelectual tal como la evala el Test de
Stanford-Binet o el WISC" (Harris, 1991, p. 109). Ya la
correlacin obtenida con el Raven, en alumnos de jardn de
infantes fue muy baja (.22). El manual presenta un cuadro
de las correlaciones obtenidas en distintas investigaciones
entre los puntajes en el Test de Goodenough y los puntajes
en otros tests de inteligencia.
Se estudi tambin la correlacin entre la escala original
y la escala revisada obtenindose coeficientes altos que
variaron, segn la edad, entre .91 y .98 (Anastasi, 1978,
Harris, 1991). La correlacin entre la escala del hombre y
la de la mujer tambin es bastante elevada, variando de .71
a .79, segn la edad (Harris, 1991).
167
11. COMENTARIOS
Este test es de muy fcil aplicacin, motiva en general a los

nios y por ello viene siendo aplicado ampliamente en la
clnica.
Sin embargo, hay que estar atento a algunas limitaciones
de la prueba:
Aunque originalmente esta prueba ha sido considerada
como independiente del ambiente cultural, las investigaciones
han demostrado que esta idea no es muy verdadera (Anastasi,
1974). La figura femenina parece ms vinculada con la cultura,
menos estereotipada y menos susceptible a la interpretacin
individual (Harris, 1991).
La prueba no discrimina bien la madurez intelectual de
nios a partir de los doce aos; los puntajes dejan de mostrar
un aumento con la edad, a partir de la pubertad. Goodenough
y otros investigadores llegaron a la conclusin de que este
test es ms apropiado para los nios pequeos (Harris, 1991).
Las nias de las culturas occidentales se desempean
mejor que los nios en la prueba. La diferencia es ms
acentuada en la escala de la figura de la mujer, que en la
de la figura de un hombre (dem).
El dibujo de s mismo parece ms til para el estudio
de los factores psicolgicos no intelectuales (dem).
Las escalas cuantitativas ofrecen mayor precisin en la
evaluacin, que las escalas cualitativas. Estas ltimas no son
medidas tan sensibles, especialmente despus de los ocho o
nueve aos, y aumentan las diferencias entre los sexos
observadas en las escalas cuantitativas. Sin embargo, las
escalas cualitativas, adems de ms fciles y ms rpidas,
"proporcionan una impresin total o global del desarrollo de
la conducta en el dibujo reflejada grficamente en la figura
humana, que las tablas de porcentajes correspondientes a los
tems de las escalas de puntos no ofrecen" (Harris, 1991,
p. 127). Por lo tanto, cada mtodo de evaluacin proporciona
diferentes ventajas y desventajas.
168
El manual de la prueba presenta solamente normas

estandarizadas para la poblacin americana.
Anastasi, A. (1978). Tests psicolgicos (3a ed., 4a reimpre-

Harris, D.B. (1991). El Test de Goodenough-Revisin, Am-
pliacin y Actualizacin (2a ed., 3a reimpresin). M-
xico D.F.: Ediciones Paids.
169
TERCERA PARTE
APTITUDES
CAPITULO XIII
LAS APTITUDES
A. LA DEFINICIN DE APTITUD
La definicin del trmino "aptitud''' proporcionada por

el Diccionario de Psicologa de Warren (1934, en Bennett,
Seashore y Wesman, 1990) dice:
Condicin o conjunto de caractersticas consideradas sintomticas
de la capacidad de un individuo de adquirir mediante entrenamiento
algn conocimiento, tcnica o conjunto de respuestas (generalmente
especificadas) como la habilidad para hablar un idioma, producir
msica., .(p. 1)
Esta definicin indica que las aptitudes son producto de una interaccin
entre la herencia y el ambiente y que pueden ser desarrolladas.
Brown (1980) diferencia los trminos habilidad y aptitud, sealando
que la habilidad indica "el poder para realizar una tarea" y la
aptitud "el poder para aprender a realizar una tarea" (p.282). El
primer trmino se refiere a un estado actual y el segundo a un estado
futuro. En el trmino aptitud se incluye la idea de previsin, de
probabilidad de que se adquieran o aprendan conductas.
Desde 1928, con la publicacin del libro de Kelley, Cross-
roads in the Mind of Man, ya se observaba la preocupacin
por investigar los diferentes factores que componen la
inteligencia. El modelo multifactorial, defendido sobre todo
por Thurstone, profundiz esta idea. A partir de varias
investigaciones, l propuso 12 factores grupales a los cuales
denomin de capacidades mentales primarias. De stos, los
que ms se confirmaron en los estudios subsecuentes fueron:
173
(1) Comprensin verbal, (2) Fluencia verbal, (3) Nmero, (4)

Espacio, (5) Memoria Asociativa, (6) Rapidez Perceptual y
(7) Induccin (o Razonamiento general) (Anastasi, 1978).
Posteriormente, Guilford (1956, 1967, 1970) propuso un
modelo para la estructura intelectual, donde lleg a calcular
la existencia de 120 habilidades.
Antes de que fueran construidas bateras de aptitudes
mltiples, se hicieron tentativas de comparar la posicin
relativa de un individuo en diferentes subtests o grupo de
reactivos de pruebas de inteligencia. Como estas pruebas no
fueron desarrolladas con este objetivo, generalmente, los
subtests no permitan una comparacin intraindividual
adecuada.
El desarrollo de bateras de aptitud mltiple fue estimulado
por las limitaciones de las pruebas de inteligencia que, en
general, se concentraban en la medida de la capacidad verbal,
no proporcionando medidas de otras capacidades (abstracta,
mecnica, etc.). Adems, la creciente actividad de los psiclogos
en las reas de seleccin y clasificacin de personal y de
orientacin vocacional llevaron a la necesidad de disponer de
instrumentos ms especficos que facilitaran estas tareas.
Pero, fue sobre todo el desarrollo del mtodo estadstico del
anlisis factorial que impuls la investigacin en esta rea
y permiti el desarrollo de los primeros instrumentos de
medida de las aptitudes.
B. LA MEDICIN DE APTITUDES
Hay pruebas de aptitudes construidas para medir aptitudes

especficas o especiales que pueden ser de tipo cognoscitivo
(habilidad para matemticas, creatividad), de tipo vocacional
(velocidad y precisin perceptual, destreza manual) y de tipo
musical o artstico.
Existen tambin las bateras de pruebas de aptitudes
174
mltiples, que se componen de una serie de pruebas de

aptitudes especficas. La construccin de estas bateras
presupone que: (a) la batera debe contener tantas pruebas
cuanto el nmero de aptitudes que se quiera medir, (b) cada
prueba debe medir solamente una aptitud y (c) debe utilizarse
la misma muestra normativa para todas las pruebas para que
se pueda hacer comparaciones intra e interindividuales
adecuadas. Otro problema est en la utilizacin del mtodo
apropiado para combinar las calificaciones de las pruebas.
Se sugiere el mtodo de regresin mltiple para determinar
el peso ptimo de cada factor (Brown, 1980).
En los prximos captulos sern presentadas las
informaciones bsicas sobre algunas bateras de aptitudes
mltiples ampliamente utilizadas, principalmente en las reas
Anastasi, A. (1978). Tests psicolgicos (3 a ed.,4 a reim-

presin). Madrid: Editorial Aguilar.
Bennett, G.K. ; Seashore, H. G. y Wesman, A. G. (1990/
Pruebas de Aptitud Diferencial-(DAT) Manual del
Instructor, Mxico D.F. : Ed. El Manual Moderno.
y Educacin. Mxico D.F.: Editorial El Manual Mo-
derno.
, J.P. (1967). The nature of human intelligence.
Nueva York: McGraw Hill.
, J.P. (1970). Creativity: Retrospect and Prospect.
Journal of Creative Behavior, 4(3),
175
CAPITULO XIV
PRUEBAS DE APTITUD DIFERENCIAL

(DAT)
Las Pruebas de Aptitud Diferencial (DAT), desarrolladas

en Estados Unidos por G. Bennett, H. Seashore y A. Wesman,
fueron publicadas en sus formas originales (A y B) en 1947.
Fueron diseadas para atender a la demanda de los orientadores
educacionales y vocacionales, que necesitaban de un
instrumento que permitiera medir rigurosamente las apti-
tudes mltiples de los alumnos de secundaria y preparatoria.
(Bennett, Seashore y Wesman, 1990).
Estas pruebas fueron revisadas y reestandarizadas en 1962
(Formas L y M), en 1972 (Formas S y T), en 1980 (Formas
V y W) y en 1990 (Formas C y D). En la primera revisin,
el objetivo principal fue facilitar la administracin y
calificacin de las pruebas y para tal se cambi el formato
y extensin de las mismas. En la segunda, se conservaron
los cambios anteriores y se actualizaron algunas pruebas.
La tercera, tuvo como meta principal elaborar reactivos con
el mismo nivel de dificultad para varones y mujeres. Se
hicieron tambin cambios en las instrucciones para volverlas
ms comprensibles (dem). La ltima revisin (5a edicin)
incluye reactivos nuevos y utiliza dos formas paralelas (C
y D) para dos niveles diferentes (Nivel 1 y Nivel 2), aumentando
as su utilidad y confiabilidad.
177
En Mxico, fue publicada en 1990 la versin en espaol

del DAT basada en la revisin de 1980 (Bennett y cols., 1990).
En esta versin no se incluyeron las pruebas de Razonamiento
Verbal, Ortografa y Uso del lenguaje.
En 1994, surgi la Prueba Diferencial de Aptitudes
PROUNAM, basada en la quinta versin del DAT (DAT
1990), desarrollada mediante la colaboracin de la Universidad
Nacional Autnoma de Mxico, el Instituto de Evaluacin en
Gran Escala y The Psychological Corporation (Universidad
Nacional Autnoma de Mxico [UNAM], 1994a). Esta prueba
est compuesta de las ocho subpruebas del DAT, siendo que
tres de ellas fueron elaboradas totalmente en Mxico
(Razonamiento Verbal, Uso del Lenguaje y Ortografa). La
elaboracin de las dos primeras sigui los principios
establecidos en la prueba original, aunque en el caso de la
prueba Uso del Lenguaje se utilizaron las reglas del Idioma
Espaol. Sin embargo " l a prueba de Ortografa fue diseada
en su totalidad para el 'PROUNAM' siguiendo modelos
escolares utilizados en Mxico para este tipo de evaluacin"
(Universidad Nacional Autnoma de Mxico [UNAM], 1994b,
p.5), en sustitucin de la prueba original de "Spelling" que
no era aplicable a Mxico.
Aunque la pruebas de la batera DAT son independientes,
stas fueron desarrolladas y reestandarizadas como una batera
integrada, la estandarizacin de las distintas pruebas fue
realizada con una misma muestra. Como el rango de niveles
es el mismo para todas las pruebas de la batera, se pueden
hacer comparaciones intra e interindividuales consistentes.
Por ejemplo, si un estudiante obtiene un percentil 50 en tres
pruebas de la batera, estamos seguros que la clasificacin
"promedio" tiene el mismo significado para tal estudiante
en las tres reas de habilidades.
178
Las pruebas de la batera DAT "fueron diseadas para

valorar habilidades intelectuales fundamentales y evitar en
la medida del posible que stas dependan del aprendizaje
de materias escolares especificas'' (Bennett y cols., 1990,
p. 2). Las habilidades medidas en stas son consideradas
importantes en varias situaciones educativas y profesionales.
La batera DAT se compone de 8 pruebas: Razonamiento
Verbal, Habilidad Numrica, Razonamiento Abstracto,
Velocidad y Exactitud Secretariates, Razonamiento
Mecnico, Relaciones Espaciales, Uso del Lenguaje y
Ortografa. La versin en espaol, publicada en 1990 (forma
V y W), incluye slo cinco de stas (Habilidad Numrica,
Razonamiento Abstracto, Velocidad y Exactitud Secretariales,
Razonamiento Mecnico y Relaciones Espaciales), mientras
que en el PROUNAM estn incluidas todas las ocho pruebas.
Es importante sealar que en el PROUNAM la prueba de
Velocidad y Exactitud Secretariales se denomina Velocidad
y Precisin Perceptual. Aunque cada prueba mide una
habilidad especfica, el agrupamiento de algunas de ellas
puede proporcionar informacin adicional, como veremos
ms adelante. A continuacin se describen las diversas pruebas.
Razonamiento Verbal
Esta prueba tiene como objetivo medir " l a habilidad para

comprender conceptos encerrados en palabras,...para pensar
constructivamente, para encontrar la identificacin entre
conceptos aparentemente diferentes y para manejar las ideas
en un nivel abstracto"(Bennett y cols., 1990, p.3). Sus
reactivos son planteados como una doble analoga en que el
primero y ltimo trminos estn ausentes y deben ser
seleccionados de entre cinco pares de palabras. Los contenidos
179
de los reactivos son relativamente familiares y cubren distintas

reas: historia, geografa, literatura, ciencia, etc. El vocabulario
es generalmente simple.
Esta prueba busca predecir el xito en reas que requieren
" l a comprensin de relaciones verbales complejas y la destreza
para manejar conceptos verbales" (dem, p.3). Se puede decir
que la prueba indica la posibilidad del estudiante para seguir
estudios universitarios y pronostica, en cierta medida, el xito
acadmico en la mayora de los campos. Algunas reas
especficas que requieren de esta habilidad son: comunicaciones,
periodismo, traduccin, produccin editorial, literatura,
filosofa, psicologa, pedagoga, derecho, correccin de pruebas
tipogrficas, ventas, etc.
Habilidad Numrica
Esta prueba mide la comprensin de relaciones numricas y

el manejo de los conceptos y relaciones numricas. Sus reactivos
son bsicamente problemas de "clculo numrico", que
requieren el manejo de una gran variedad de conceptos
matemticos. Esta prueba busca predecir el xito en los
campos donde se hace necesario el pensamiento cuantitativo
como: matemtica, fsica, qumica, estadstica, ingeniera,
contadura, actuada, economa, arquitectura, computacin...y
en trabajos especializados del tipo: carpintera, fabricacin
de herramientas, etc.
Razonamiento Abstracto
Esta prueba provee una medida no verbal de la habilidad de

razonamiento caracterizada por la percepcin de relaciones
entre patrones abstractos. Su medida indica la capacidad de
reflexin del sujeto. Cada reactivo requiere el reconocimiento
del principio o principios operantes en una serie de diagramas
y la identificacin del diagrama que sigue lgicamente en la
180
serie. En la seleccin de los diseos, se busc utilizar diseos

grandes y claros que mostraran diferencias obvias entre los
sucesivos diagramas.
Esta prueba predice el xito en actividades que requieren
de la percepcin entre cosas, ms que entre nmeros o palabras.
Esta, "complementa los aspectos de inteligencia general de
las pruebas de Razonamiento Verbal y Habilidad Numrica"
(Bennett y cols., 1990, p.4). Sin embargo, no puede sustituir
ni ser sustituida por la prueba de Razonamiento Verbal,
aunque en los casos de deficiencia de lenguaje pueda ser til
para la comprobacin de las puntuaciones de Razonamiento
Verbal.
Esta aptitud es necesaria para el estudio de las carreras
profesionales, especialmente para carreras como: computacin,
ingeniera, matemticas, arquitectura, ciencias qumico-
biolgicas, etc.
Velocidad y Exactitud Secretariates
El objetivo de esta prueba es medir la' 'velocidad de percepcin,

la retencin momentnea, y la velocidad y exactitud de la
respuesta" (Bennett y cols., 1990, p.4) en una tarea percep-
tual simple. La tarea es seleccionar, de entre un grupo de
combinaciones de nmeros y letras, aquella que est subrayada,
retenerla, e identificarla en un segundo grupo de combinaciones
similares.
La habilidad exigida en esta prueba es necesaria para
tareas administrativas como: archivar, clasificar, codificar,
catalogar, perforar tarjetas, tareas de almacenaje, etc. Se
requiere tambin de esta aptitud para realizar actividades que
involucren informacin cientfica y tcnica y para aquellas
que exijan memoria inmediata y la habilidad para trabajar
rpido y sin errores.
Aunque esta habilidad no es muy importante para los
181
objetivos educativos, un estudiante cuya puntuacin es baja

puede tener dificultades en cumplir algunas exigencias escolares
de organizacin, velocidad y precisin. Si la puntuacin baja
es obtenida por un estudiante cuyas habilidades son en general
superiores puede indicar una precisin exagerada, ms que
una falta de velocidad.
Razonamiento Mecnico
En esta prueba cada reactivo presenta, en imgenes, una

situacin mecnica acompaada de una pregunta sencilla cuya
respuesta debe ser seleccionada de una serie de respuestas
de opcin mltiple. Se considera que "la puntuacin est
afectada por la experiencia previa del sujeto, pero no a tal
grado que cause dificultades para su interpretacin" (Bennett
y cols., 1990, p.4). Una alta puntuacin indica una facilidad
para aprender los principios de operacin y reparacin de
instrumentos o mecanismos relativamente complejos. La prueba
pronostica el xito en las reas que requieren la comprensin
de los principios de las fuerzas fsicas. Algunas ocupaciones
como carpintero, mecnico, encargado de mantenimiento,
ensamblador y muchas otras tareas de fbricas y oficinas
requieren el tipo de habilidad que mide esta prueba. Adems,
esta habilidad es necesaria para campos como: ingeniera,
fsica, computacin, medicina, odontologa, etc.
Relaciones Espaciales
Esta prueba tiene como objetivo medir la habilidad para

manejar objetos concretos a travs de su visualizacin en un
espacio tridimensional. Cada reactivo requiere el examen de
un patrn que al doblarse forma una figura y la identificacin
de sta. Los patrones son en general amplios y claros. Esta
habilidad es necesaria en campos como: arquitectura, diseo
182
grfico, diseo industrial, diseo de modas, diseo textil,

artes, decoracin, odontologa, medicina...y en trabajos
especializados del tipo: carpintera, fabricacin de
herramientas, etc.
Uso del Lenguaje
Esta prueba evala la capacidad para expresarse correctamente

en forma verbal o escrita segn las reglas y caractersticas
del idioma. Cada reactivo es compuesto de una oracin que
puede contener o no errores (gramaticales, de puntuacin,
de uso de maysculas y minsculas). La tarea es identificar
la parte incorrecta de la oracin o bien si la misma est
correcta. Esta es una aptitud necesaria a todas las actividades
acadmicas y muy importante en reas como: literatura,
periodismo, comunicacin, leyes, pedagoga, traduccin,
docencia, investigacin, etc.
Ortografa
Esta prueba mide la capacidad para identificar y reconocer

errores ortogrficos dentro de una oracin. Cada reactivo
requiere identificar, entre las respuestas posibles, la palabra
que complete correctamente la oracin. Esta habilidad es
importante para cualquier rea acadmica, sobre todo aquellas
que requieren de la elaboracin y revisin de textos, reportes
y manuscritos.
Aptitud Acadmica (Razonamiento Verbal y

Habilidad Numrica)
Los aspectos del funcionamiento cognoscitivo derivados de

las pruebas Razonamiento Verbal y Habilidad Numrica son
semejantes a los proporcionados por la mayora de las pruebas
de aptitud acadmica. Al combinarse las puntuaciones de
183
estas dos pruebas se obtiene una evaluacin de la habilidad

general del sujeto o sea de su aptitud acadmica. Esta medida
es til para pronosticar el xito acadmico en general, e
identificar los sujetos que deberan continuar su educacin
ms all de la preparatoria.
3. MATERIAL
El material bsico de la forma V y W (Bennett y cols., 1990) se

compone de: a) folleto de aplicacin para cada una de las pruebas,
b) hojas de respuestas, c) plantillas de calificacin, d) forma de
reporte individual, donde son presentados los resultados y la grfica
derivada de los mismos, e) manual. Para su aplicacin se necesitan
dos lpices con goma y un cronmetro.
El material bsico del PROUNAM (UNAM, 1994b) incluye,
entre otros: a) cuadernillo de prueba (cinco formas diferentes)
con los reactivos para las ocho pruebas y las respectivas
instrucciones, b) cuadernillo de respuestas con espacios
especficos para contestar cada una de las ocho pruebas y
diseado para ser calificado en forma automatizada (lectora
ptica), c) hoja de respuestas para la parte I de la prueba
de Velocidad y Precisin Perceptual, d) manual del aplicador,
e) manual del orientador y f) hoja de interpretacin de resultados
del alumno. Adems, se necesitan dos lpices con goma, un
cronmetro y hojas de papel en blanco, tamao carta, para
las operaciones de la prueba de Razonamiento Numrico.
Las formas V y W fueron construidas para ser utilizadas con

adolescentes entre segundo de secundaria y tercero de
preparatoria. Sin embargo, pueden tambin ser aplicadas a
adultos.
Las pruebas que componen el PROUNAM fueron diseadas
para el nivel de 2o ao de preparatoria.
184
Las pruebas de la batera DAT pueden ser administradas

individualmente o en forma colectiva. Cuando la aplicacin
es colectiva se requiere generalmente un examinador para
cada grupo de 30 estudiantes.
Cada prueba tiene un tiempo mximo para su ejecucin. Los

lmites de tiempo de las pruebas incluidas en la versin
mexicana del DAT (forma V) y de aquellas incluidas en el
PROUNAM son presentados en la tabla 14.1.
T A B L A 14.1
LIMITE DE TIEMPO DE LAS PRUEBAS
PRUEBA FORMA V PROUNAM
Razonamiento Verbal 30 minutos
Habilidad Numrica 30 minutos 35 minutos
Razonamiento Abstracto 20 minutos 20 minutos
Velocidad y Exactitud Secretariates Parte I- 3 minutos Partel - 3 minutos
(Velocidad y Precisin Perceptual) Parte II-3 minutos Parte II -3 minutos
Razonamiento Mecnico 30 minutos 25 minutos
Relaciones Espaciales 25 minutos 25 minutos
Ortografa 10 minutos
Uso del Lenguaje 20 minutos
La administracin de las pruebas de la forma V y W debe

ser realizada con un intervalo de tiempo relativamente corto
entre una y otra, de preferencia en un perodo mximo de
una o dos semanas. La aplicacin puede ser realizada en dos,
tres o cinco sesiones. En el manual son sugeridas distintas
programaciones para la aplicacin (Bennett y cois., 1990).
Las pruebas que componen el PROUNAM son aplicadas en
una misma sesin de aproximadamente 3 horas 45 minutos;
la secuencia de aplicacin de las pruebas debe ser estrictamente
respetada (UNAM, 1994b)
185
La administracin de las pruebas de la batera DAT (Forma

V y W) es relativamente sencilla. Primero, se distribuye la
hoja de respuestas donde el sujeto debe llenar los datos
personales y en seguida, el folleto de prueba. En el folleto
de cada prueba vienen las instrucciones acompaadas de
ejemplos, as como el tiempo de duracin mximo de la
prueba. Las instrucciones deben ser ledas en voz alta por
el examinador mientras que el examinado las lee en voz baja
en su folleto. Antes de empezar deben sacarse las dudas que
se presenten, siempre siguiendo las instrucciones. Se le debe
explicar al examinado el propsito de las pruebas y advertirle
que no se desanime cuando alguna pregunta le parezca muy
difcil.
La administracin de las pruebas PROUNAM se inicia
tambin llenando los datos sociodemogrficos incluidos en el
cuadernillo de respuestas. Las instrucciones especficas de
cada prueba, as como los ejemplos, vienen en el cuadernillo
de prueba. El procedimiento de aplicacin es similar al
mencionado con respecto a las formas V y W; los detalles
de este procedimiento vienen en el manual del aplicador
(UNAM, 1994b).
8.1. Las pruebas de las formas V y W
Para calificar las pruebas de las formas V y W se utilizan

plantillas de calificacin. Es importante observar que en la
prueba de Velocidad y Exactitud Secretariales solamente se
califica la Parte II. Cada respuesta correcta es calificada con
un punto. La puntuacin bruta de cada prueba es la suma
de las respuestas correctas.
186
La puntuacin bruta de cada prueba es convertida en

percentil o estanina utilizndose para tal efecto los cuadros
de conversin disponibles en el manual. Estos cuadros toman
en cuenta el sexo y el grado escolar del sujeto.
Los resultados deben ser apuntados en la hoja de "Reporte
Individual", donde se llenan los datos personales del sujeto,
sus puntuaciones brutas, las puntuaciones percentiles
obtenidas por comparacin con una muestra de su mismo
sexo y grado escolar, y las puntuaciones percentiles obtenidas
por comparacin con una muestra de su grado escolar pero
de sexo opuesto. En esta misma hoja es trazado el perfil de
aptitudes del sujeto, cuyo procedimiento ser explicado en seguida.
a. Comparacin con muestras de cada uno de los sexos
En el DAT es importante sacar el percentil obtenido por el

sujeto en una prueba comparndolo, por un lado, con una
muestra de sujetos de su mismo sexo, y por otro, con una
muestra de sujetos del sexo opuesto. Lo que sucede es que
los sexos califican tpicamente en algunas pruebas del DAT
en forma muy diferente. Por ejemplo, los varones tienden
a tener puntuaciones ms altas que las mujeres, en
Razonamiento Mecnico y Relaciones Espaciales, aunque
que en este ltimo caso la diferencia sea menor. Adems,
las mujeres suelen tener mejores puntuaciones que los varones,
en la prueba de Velocidad y Exactitud Secretariales. Siendo
as, es importante comparar al sujeto con una muestra de
su mismo sexo pero tambin, en muchas casos, es esencial
la comparacin con una muestra de sexo opuesto al suyo.
Por ejemplo, si una joven (2 o semestre de 2 o ao de
preparatoria) obtiene una puntuacin bruta de 43 en
Razonamiento Mecnico, cuando comparada a una muestra
femenina tendr como percentil P50, mientras que cuando
comparada a una muestra masculina tendr un percentil P20.
187
La interpretacin de la prueba cambia substancialmente si

tomamos como referencia uno o otro valor de percentil.
Suponiendo que esta joven tenga inters en seguir el rea
de Ingeniera Mecnica, donde la poblacin es bsicamente
masculina, el percentil obtenido a travs de la comparacin
con la muestra masculina va a ser de gran importancia. Este
es el que va a permitir pronosticar sus posibilidades en la
competencia escolar y profesional con esta mayora masculina.
En el caso mencionado, aunque lajoven, comparada con otras
jvenes de su mismo grado escolar, presenta una habilidad
mecnica promedio, esta habilidad es baja cuando se compara
con los varones de su mismo grado escolar. Esto, probablemente
le traer dificultades al tener que enfrentar la competencia
masculina en la carrera de Ingeniera Mecnica.
b. El perfil de aptitudes
En la hoja de Reportes Individuales se explica como trazar

la grfica correspondiente al perfil de aptitudes del sujeto.
Primero, se traza la grfica correspondiente a los percentiles
obtenidos comparando al sujeto con una muestra de su mismo
sexo. Para cada resultado se traza una barra, en la columna
referente a la prueba. Partiendo del punto correspondiente
al percentil obtenido, se mide 1.2 cm. para arriba y 1.2 cm.
para abajo obtenindose as una barra que debe ser rellenada
en color. Esta barra indica que podemos estar relativamente
seguros de que la puntuacin del sujeto est en algn punto
dentro del rea cubierta por la misma.
Trazadas todas las barras que indican la habilidad del
sujeto al compararlo con una muestra de su mismo sexo,
hacemos el mismo procedimiento pero ahora tomando como
referencia las puntuaciones percentil obtenidas comparando
al sujeto con una muestra del sexo opuesto. Para cada prueba
se trazar una segunda barra, paralela a la primera, que ser
rellenada de color distinto.
188
Para interpretar el perfil de aptitudes se debe proceder

de la siguiente manera (Bennett y col, 1990):
1) Comparar las barras trazadas teniendo como base la
puntuacin obtenida a partir de la norma del mismo sexo
del sujeto (primeras barras, que son del mismo color). Esta
comparacin indica cul es el desempeo del sujeto en cada
prueba; cules son sus aptitudes ms fuertes y ms dbiles.
2) Comparar cada par de barras correspondiente a una
misma aptitud: la barra obtenida a partir de la norma de
mismo sexo con aquella obtenida a travs de la norma de
sexo opuesto (primera y segunda barras, de colores diferentes).
Esta comparacin permite verificar si hay una discrepancia
en el desempeo del sujeto comparado con muestras de
distintos sexos.
3) La diferencia entre dos aptitudes (o resultados) es
considerada significativa cuando las dos barras no se
sobreponen. Cuando se sobreponen pero no en ms de la
mitad de su longitud, la diferencia puede o no ser importante.
En este caso se deben buscar, en otras informaciones sobre
el sujeto, indicios que ayuden a tomar una decisin. Si las
barras se sobreponen en ms de la mitad, no se considera
significativa la diferencia, o sea la habilidad del sujeto en
estas dos reas es ms o menos la misma.
8.2. Las pruebas PROUNAM
La calificacin de las pruebas PROUNAM es realizada en

forma automatizada por el IEGE y la UNAM. Las
calificaciones tambin son expresadas en percentil y estanina,
comparando el sujeto con una muestra de su mismo sexo y
con una muestra mixta (de ambos sexos). Un reporte
informatizado de los resultados, que incluye un perfil de
aptitudes, es entregado al alumno (UNAM, 1994a).
189
9. NORMAS
Las normas para las formas V y W del DAT fueron extradas

de una muestra de ms de 61,000 estudiantes de 2 o . de
secundaria a 3 o . de preparatoria, de 64 sistemas escolares
pblicos y parroquiales de los Estados Unidos de Amrica.
Las dos formas V y W son consideradas paralelas lo que
significa que sus puntuaciones brutas son equivalentes y por
lo tanto permiten la utilizacin de las mismas tablas de normas
para su interpretacin (Bennett y cols., 1990).
Los normas se expresan tanto en percentil como en estanina,
para cada sexo y nivel escolar (de 2 o . de secundaria a 3 o .
de preparatoria). Para cada nivel escolar, se presentan normas
para el primer y para el segundo semestre.
El PROUNAM est estandarizado solamente para el 5 o .
ao de bachillerato (2 o . de preparatoria). Sus normas fueron
extradas de una muestra de 3,027 alumnos, hombres y mujeres,
estudiantes de distintos sistemas: Escuela Nacional
Preparatoria, CCH y Escuelas Incorporadas a la UNAM,
siendo que las escuelas estaban ubicadas en distintas regiones
geogrficas (UNAM, 1994a).
10.1. Las pruebas de las formas V y W
La confiabilidad de las pruebas de la batera DAT ha sido

estudiada a travs del procedimiento de divisin por mitades,
cuyo coeficiente fue corregido utilizando la frmula de
Spearman-Brown, con excepcin de Velocidad y Exactitud
Secretariales. Siendo esta ltima una prueba de velocidad,
se utiliz el procedimiento de formas paralelas. Los coeficientes
de confiabilidad fueron calculados para cada una de las
formas V y W, en cada nivel escolar y para cada sexo. En
190
general, se obtuvieron los coeficientes usando submuestras

de la muestra de estandarizacin, con excepcin de la prueba
de Velocidad y Exactitud Secretariates (Bennett y cols.,
1990).
Los coeficientes de confiabilidad obtenidos fueron
relativamente elevados variando, en la muestra masculina de
2o. de secundaria a 3o. de preparatoria de .89 a .97 (forma
V) y de .87 a .97 (Forma W) y en la muestra femenina de
.83 a .96 (forma V) y de .84 a .96 (forma W) (dem).
En el manual del DAT son tambin presentados los Errores
Estndar de Medida para cada prueba (formas V y W), por nivel
escolar y sexo. El procedimiento recomendado para trazar la grfica
del perfil de aptitudes (la construccin de barras) tiene como
objetivo tomar en cuenta el error estndar de medida. En general,
cada 1.2 cm. equivale a cerca de una y media unidades de error
estndar de medida, lo que significa que, para la mayora de las
pruebas, las probabilidades son aproximadamente de nueve en diez
de que la puntuacin real del sujeto caiga dentro del intervalo
delimitado por las barras (dem).
10.2. Las pruebas PROUNAM
El proceso de desarrollo y validacin de las pruebas

PROUNAM incluy varios procedimientos. Para validar el
PROUNAM se utilizaron cinco formas diferentes de la prueba
(A, B, C, D, y E) conformadas con 250 reactivos de
Razonamiento Verbal, 360 de Ortografa, 250 de Uso del
Lenguaje, 250 de Razonamiento Numrico, 200 de
Razonamiento Abstracto, 500 de Velocidad y Precisin
Perceptual, 300 de Razonamiento Mecnico y 250 de
Relaciones Espaciales. Las pruebas verbales, Razonamiento
Verbal, Uso del Lenguaje y Ortografa fueron desarrolladas
en Mxico y especficamente para la Prueba Diferencial de
Aptitudes PROUNAM. Para las dems pruebas se utilizaron
191
los reactivos de la quinta edicin del DAT (1990), formas

C y D, niveles 1 y 2. Los reactivos fueron analizados a travs
de varios procedimientos estadsticos como: valores P
(porcentaje de la muestra que respondieron de forma correcta
al reactivo) para determinar el nivel de dificultad, correlacin
biserial para establecer el nivel de discriminacin, rango de
omisin de los reactivos (porcentaje de sujetos de la muestra
que no contestaron el reactivo) y anlisis de Rasch que
determina el nivel de dificultad del reactivo dentro de una
escala mtrica logstica anloga a la calificacin z (UNAM,
1994a).
Se estudi la confiabilidad de las cinco diferentes formas
de la batera, obtenindose coeficientes Kuder-Richardson
(KR-20) entre .79 y .96 para las ocho pruebas. Las medias,
desviaciones estndar y percentiles seleccionados (cuartiles)
mostraron variaciones moderadas entre las diferentes formas
de la prueba. Se obtuvieron para la forma final de cada una
de las pruebas (con excepcin de Velocidad y Precisin
Perceptual) coeficientes KR-20. Estos variaron de .71 a .90
segn la prueba, lo que indica que las pruebas poseen un
alto grado de consistencia interna. Se obtuvieron tambin
los errores estndar de medida para cada una de las pruebas,
cuyos valores estuvieron entre 2.33 y 3.51 (UNAM, 1994).
Para demostrar la validez del PROUNAM se
correlacionaron los valores en percentil obtenidos por la
poblacin de EUA en la 5a. edicin del DAT y los obtenidos
por los estudiantes mexicanos en el PROUNAM. Como las
pruebas verbales no son comparables, se limit la comparacin
a las pruebas no verbales. Se compar as "el rendimiento
de ambas poblaciones considerando tanto a la poblacin
general de ambos sexos (mixto), como las diferencias por
g n e r o " (dem, p . 3 6 ) . Se examinaron tambin las
intercorrelaciones entre las distintas pruebas que componen
el PROUNAM, para verificar cunto miden estas distintas
aptitudes. "En general las intercorrelaciones entre las pruebas
muestran un rango que va de bajo a moderado" {dem, p.
11. COMENTARIOS
La batera DAT es considerada una gran contribucin a la

medida de las aptitudes. Morales (1993) cita un comentario
de Carroll (1960) sobre las cualidades mtricas de esta
prueba: "Los autores han hecho un trabajo tan completo y
tcnicamente satisfactorio, que cualquier revisor lo encontrara
difcil de hacerlo parecer suficientemente crtico para l
mismo"(p.l31).
Las pruebas fueron traducidas y adaptadas a varios idiomas
y demostraron gran utilidad, tanto en el rea de la orientacin
escolar y profesional como en el rea de seleccin de per-
sonal.
Su utilizacin en la realidad mexicana ha convivido hasta
hace poco tiempo con una limitacin importante. Como fue
mencionado anteriormente, la versin en espaol del DAT
publicada en Mxico (forma V y W) no incluye las pruebas
Bennett, G.K. ; Seashore, H. G. y Wesman, A. G. (1990;.

Pruebas de Aptitud Diferencial (DAT) - Manual del
Instructor, Mxico D.F. : Ed. El Manual Moderno.
Morales, M.L. (1993). Psicometra Aplicada, Mxico D.F.:
Ed. Trillas (2a. Edicin, 2a. Reimpresin).
Universidad Nacional Autnoma de Mxico [UNAM] (1994a).
Prueba Diferencial de Aptitudes PROUNAM- Manual
tcnico, Mxico D.F.
, (1994b).Prueba Diferencial de Aptitudes PROUNAM
- Manual del aplicador, Mxico D.F.
193
CAPITULO XV
PRUEBAS PARA LA CLASIFICACIN
DE APTITUDES
DE FLANAGAN (FACT)
Las Pruebas para la Clasificacin de Aptitudes (FACT)

fueron desarrolladas por J.C. Flanagan y dieron continuidad
a su proyecto de construccin de pruebas de clasificacin
para la Fuerza Area durante la Segunda Guerra Mundial
(Anastasi, 1978). A partir de anlisis sistemticos de puestos
se identificaron elementos comunes a ciertas actividades
profesionales as como las aptitudes necesarias para la buena
ejecucin de las mismas. Se construyeron entonces pruebas
para evaluar las aptitudes necesarias para que se realicen
con xito tareas ocupacionales especficas (Brown, 1980).
Las pruebas FACT fueron publicadas por primera vez en
1953, su publicacin en espaol fue realizada en 1970, y
en 1989 fue presentada la primera edicin mexicana. Esta
batera es destinada fundamentalmente a la orientacin
vocacional y profesional y a la seleccin y clasificacin de
personal (Flanagan, 1989).
La batera est compuesta de catorce pruebas, cada una

destinada a medir una habilidad especfica (dem):
Inspeccin - Mide la habilidad necesaria para
195
inspeccionar artculos manufacturados y para detectar fallas

o imperfecciones en stos. La rapidez y la exactitud son
importantes en esta prueba.
Claves - Mide la rapidez y exactitud en el manejo de
claves utilizadas en el trabajo de oficina.
Memoria - Mide la habilidad para recordar las claves
aprendidas en el test de claves.
Precisin - Mide la habilidad para hacer tareas de
precisin con objetos relativamente pequeos; mide la rapidez
y precisin en la ejecucin de movimientos circulares pequeos,
con los dedos de una o de ambas las manos al mismo tiempo.
Ensambles - Mide la habilidad para visualizar la forma
de un objeto mirando solamente sus partes.
Escalas - Mide la habilidad para la lectura de material
grfico (escalas, grficos, mapas), requerida en trabajos de
ingeniera y ocupaciones tcnicas semejantes.
Coordinacin - Mide la habilidad para coordinar los
movimientos de brazo y mano y controlarlos de una manera
progresiva y exacta.
Comprensin y discernimiento - Mide la habilidad
para leer de manera comprensiva, pensar lgicamente y utilizar
el sentido comn cuando es necesario.
Aritmtica - Mide la habilidad para el clculo.
Modelos - Mide la habilidad para reproducir bosquejos
de modelos sencillos y en forma invertida.
Componentes - Mide la habilidad para identificar partes
importantes en situaciones complejas. Utiliza como ejemplos
dibujos lineales y bosquejos de planos.
Tablas - Mide el rendimiento en la lectura de dos tipos
de tablas: a) formada nicamente por dgitos, b) formada por
palabras y letras del alfabeto.
Comprensin Mecnica - Mide la habilidad para
comprender principios mecnicos.
Expresin Idiomtica - Mide el dominio del idioma, la
habilidad para manejar la expresin de ideas en forma escrita y oral.
196
3. MATERIAL
El material bsico para la aplicacin se compone de: a)

folletos de prueba que funcionan tambin como hojas de
respuestas, b) dos lpices (uno del No. 3), c) cronmetro
, d) hoja de clasificacin de aptitudes y d) manual.
Las pruebas FACT pueden ser utilizadas con adolescentes

y adultos.
Las pruebas de la batera pueden ser administradas en forma

individual y colectiva. En este ltimo caso es conveniente
utilizar un ayudante por cada 25 examinados (Flanagan,
1989).
Cada prueba requiere un tiempo de administracin diferente.

En el manual se recomienda un orden de aplicacin de las
pruebas que permite llevar a cabo la aplicacin de todas ellas
en dos perodos de medio da cada uno. El orden propuesto
busca evitar la monotona alternando pruebas verbales,
numricas y de ejecucin. Las pruebas de Comprensin y
discernimiento y de Expresin vienen al final de la sesin
puesto que no tienen tiempo lmite, permitiendo al sujeto la
oportunidad de contestar todos los reactivos de stas. Se
presenta a seguir un cuadro con el orden recomendado para
cada sesin y el tiempo requerido para cada prueba (Flanagan,
1989).
Los lmites de tiempo de cada prueba de la batera, con
excepcin de las pruebas 8 (Comprensin y Discernimiento)
197
Primera sesin- Tiempo total: 2 horas y 46 minutos aproximadamente

Prueba Tiempo instrucciones Tiempo Prueba Tiempo Total
1.- Inspeccin 6 min. 6 min. 12 min.

2.- Claves 20 min. 10 min. 30 min.
3.- Memoria 1 min. 4 min. 5 min
4 - Precisin 7 min. 8 min 15 min.
5 - Ensambles 6 min. 12 min. 18 min.
Receso 10 min.
6.- Escalas 12 min. 16 min. 28 min.
7 - Coordinacin 5 min. 3 min. 8 min.
8- Comprensin y
Discernimiento 5 min. 35 min. aprox. 40 min. aprox.
Segunda sesin- Tiempo total: 2 horas y 42 minutos a proximadamente

9 - Aritmtica 10 min. 10 min. 20 min.
1 0 - Modelos 8 min. 20 min. 28 min.
1 1 - Componentes 4 min. 20 min. 24 min.
Receso 10 min.
12.- Tablas 5 min. 10 min. 15 min.
1 3 - Comprensin
Mecnica 5 min. 20 min. 25 min.
1 4 - Expresin
Idiomtica 5 min. 35 min. aprox. 40 min. aprox.
y 14 (Expresin Idiomtica), deben ser cumplidos estrictamente

y por lo tanto deben ser cronometrados. Puede aplicarse la
batera completa o pueden combinarse pruebas de distintas
maneras, de acuerdo con las habilidades requeridas por una
determinada actividad profesional.
Es importante proveer una breve explicacin a los examinados

sobre el propsito de las pruebas, antes de empezar su
administracin.
La administracin empieza solicitando al examinado que
llene sus datos personales en el folleto de prueba. Las
instrucciones de cada prueba vienen en el folleto de prueba,
seguidas de ejemplos o ejercicios de ensayo. El examinador
debe leerlas en voz alta mientras el examinado las leer en
voz baja.
198
Las instrucciones que estn en la portada de cada folleto

son semejantes para todas las pruebas, por lo tanto el
examinador necesitar leerlas solamente una vez, al iniciar
la serie. Sin embargo, las instrucciones impresas en la portada
de los folletos de las pruebas "Comprensin y Discernimiento''
y "Expresin Idiomtica" son distintas y deben ser ledas
por el examinador. El examinador debe leer las instrucciones
especficas de cada prueba exactamente como vienen impresas.
Si hay dudas por parte de los examinados, el examinador
debe leer otra vez la parte de la instruccin que permita
esclarecerlas.
La mayora de las pruebas fueron diseadas para facilitar

su correccin. Debajo de la hoja donde el examinado marca
sus respuestas, hay una hoja carbn y abajo de sta, una
parrilla con casillas. La posicin de las casillas corresponde
a la de las respuestas correctas. Cuando el examinado pone
una X en la casilla correspondiente a su respuesta, sta
automticamente se reproduce en la parrilla. Este
procedimiento permite una evaluacin rpida y precisa de
la prueba. En el caso de las pruebas que no traen parrillas,
los resultados son computados sobre los mismos folletos.
La frmula utilizada para el clculo de la puntuacin total
vara de una prueba a otra: total de repuestas correctas,
total de respuestas correctas menos las equivocadas, etc. En
el manual se presenta un cuadro que contiene la frmula que
debe ser utilizada en cada prueba.
El puntaje bruto debe ser apuntado en el espacio designado
en cada folleto de prueba. All mismo puede determinarse,
a travs de una tabla, el puntaje ponderado del sujeto,
expresado en estanina.
Obtenidos todos los puntajes brutos y ponderados, stos
199
deben ser apuntados en la Hoja de Clasificacin de Apti-

tudes, donde tambin deben ser llenados los espacios
correspondientes a los datos de identificacin del sujeto.
La interpretacin de las puntuaciones obtenidas puede ser
realizada a dos niveles (Flanagan, 1989):
Comparando las aptitudes del individuo y verificando
sus aptitudes ms altas y ms bajas, sus capacidades y
limitaciones, y
Evaluando las aptitudes de un individuo para una
determinada actividad ocupacional segn el siguiente
procedimiento:
1) En la Hoja de Clasificacin de Aptitudes, aparecen 30
ocupaciones. Para cada ocupacin estn determinadas cules
aptitudes son necesarias. Al lado de cada ocupacin deben
ser llenadas las casillas solicitadas con las respectivos
calificaciones en estaninas.
2) Para cada ocupacin se suman las calificaciones en
estanina y se marca con un crculo el resultado obtenido
(puntaje total). En caso que el nmero correspondiente al
puntaje total no aparezca en la hoja, debe aproximrselo al
nmero mayor.
3) El puntaje total tambin es convertido en estanina
mediante la tabla de conversin que aparece en esta misma
hoja. En este caso, cada valor de estanina tiene un valor ms
y un valor menos, por ejemplo, 1-, 1, 1+, 2-, 2, 2+, ... hasta
9-, 9 y 9+. La puntuacin estanina obtenida debe ser apuntada
al lado de la ocupacin, en la casilla de calificacin
ocupacional.
4) Se compara el rendimiento del sujeto en distintas reas
ocupacionales (calificaciones ocupacionales).
9. NORMAS
Las pruebas FACT utilizan como puntuacin normalizada la

estanina. La conversin de las puntuaciones brutas a estaninas
200
no toma en cuenta ni el sexo ni el grado escolar del examinado

(Flanagan, 1989).
Las normas fueron extradas de una muestra de
aproximadamente 11,000 estudiantes americanos, cuyos
grados escolares variaban de tercer de secundaria a tercer
de preparatoria (Anastasi, 1978). Con respecto a la edicin
mexicana, el manual del FACT no ofrece datos sobre la
muestra de estandarizacin utilizada.
Los comentarios de Anastasi (1978) sobre la confiabilidad de este

instrumento apuntan que aunque es elevada la fabilidad de las
puntuaciones compuestas de aptitud ocupacional, "/os tests
individuales tienen /labilidad ms bien baja y algunas de las
distribuciones de las puntuaciones sugieren diferenciaciones
inadecuadas entre los individuos''(p. 352).
En cuanto a la validez, este mismo autor comenta que
las interrelaciones entre las pruebas indican que stas miden
aptitudes bastante distintas. Sin embargo, muchas ocupaciones
exigen combinaciones semejantes de aptitudes, hasta aquellas
cuyas actividades son substancialmente diferentes. Por
ejemplo, la existencia de una alta correlacin entre los
resultados de piloto-aviador y diseador sugiere una validez
diferencial inadecuada. Por otro lado, Anastasi (dem) apunta
que la prueba ha demostrado tener una buena validez de
prediccin, con respecto a los criterios de capacitacin
profesional. Mientras tanto, los datos sobre la validez de
prediccin con relacin a la admisin y xito en el trabajo
son escasos y menos consistentes, sobre todo debido a la
inadecuacin de los criterios y a la influencia de factores
fortuitos.
201
11. COMENTARIOS
Las pruebas FACT pueden ser tiles para la orientacin

profesional y para la seleccin de personal pues permiten
evaluar las habilidades del sujeto y proveer una cierta
prediccin con respecto al xito en determinadas tareas
ocupacionales. Sin embargo, son varias las restricciones a
las mismas:
Los resultados sobre la confiabilidad y la validez de la
batera parecen poco consistentes e inclusive en el manual
de la edicin mexicana no se proporcionan datos a respecto.
La representatividad de la muestra normativa de la versin
original es considerada discutible (Anastasi, 1978). En cuanto a
la edicin mexicana, no se presentan en el manual datos sobre la
muestra de estandarizacin utilizada.
No se toman en cuenta en las normas ni el sexo ni el
grado escolar. Investigadores como Bennett y cois. (1990)
observaron diferencias importantes, en algunas aptitudes,
con respecto a estas variables.
La edicin mexicana del FACT considera solamente 30
ocupaciones, lo que es un nmero relativamente reducido comparado
al nmero de ocupaciones existentes en la actualidad.
Anastasi, A. (1978). Tests psicolgicos (3 a ed., 4 a reimpre-

Bennett, G.K.; Seashore, H.G. y Wesman, A.G. (1990).Prue-
bas de Aptitud Diferencial (DAT) - Manual del Ins-
tructor, Mxico D.F.: Editorial El Manual Moderno.
Educacin. Mxico, D.F.: Editorial El Manual Moderno.
Flanagan, J.C. (1989). Manual del Examinador - FACT.
202
BIBLIOGRAFA
Anastasi, A. (1978). Tests psicolgicos (3a ed., 4a reimpre-
Anstey, E. (1974). Test de Domins - manual. Buenos Aires:
Editorial Paids.
Aubret, F., Aubret, J, Chartier, D., Chaudagne, H., France-
quin-Chartier, G., Huetau, M., Porlier, J-C, Rozen-
cwajg, P.y Vrignaud, P. (1991). Evaluer I'intelligence.
Manuscrito no publicado, I.N.E.T.O.P., Paris, Francia.
Bacher, F. (1981). Les enqutes en Psychologic Tesis indi-
ta de Doctorado en Psicologa, Universit de Pars V,
Pars.
Bennett, G.K.; Seashore, H.G., Wesman, A.G. (1990). Prue-
bas de aptitud diferencial (D.. T) - Manual del instruc-
tor. Mxico D.F.: Editorial El Manual Moderno.
y Educacin. Mxico D.F.: Editorial El Manual Moder-
no.
Coto Villa, M.J. y Llano de la Torre, A. (1981). Estudio sobre
la traduccin, adaptacin, conflabilidad y validez del
test para preescolares y primaria deWechsler (WPPSI) en
un grupo de nios de nivelsocioeconmico medio alto.
Tesis indita de Licenciatura en Psicologa. Universidad
Iberoamericana.
Cronbach, L.J. (1951). Alpha and the internal structure of
tests. Psychometrika, 16, 297-334.
Dorsch, F.(1976). Diccionario de Psicologa. Barcelona:
Editorial Herder.
Flanagan, J. (1989). Manual del examinador: FACT. Mxico
D.F.: El Manual Moderno.
Ginsburg, H. Y Opper, S. (1977). Piaget y la teora del
desarrollo intelectual. Madrid: Editorial Paids.
203

, J . P . (1967). The nature of human intelligence. Nue-
va York: McGraw Hill.
,J.P. (1970). Creativity: Retrospect and Prospect. Jour-
nal of Creative Behavior, 4(3), 149-168.
Guilfort,J.P. y Hoepfner, R. (1971). The analysis of in-
telligence. Nueva York: McGraw Hill.
Harris, D.B. (1991). El Test de Goodenough - Revisin,
Ampliacin y Actualizacin (2 a ed., 3a reimp.). Mxico
D.F.: Ediciones Paids.
Huteau, M. (1990). La variet des formes et des composantes
de Iintelligence. En M. Reuchlin y col. (Eds.),Cogni-
tion: 'individual et 'universe!. Paris: P.U.F.
Kaufman, A. (1982) Psicometra razonada con el WISC-R.
Mxico D.F.;Editorial El Manual Moderno.
Kellogg, C E . y Morton, N.W. (1974). Instrumento no verbal
de inteligencia - Beta II-R. Manual. Mxico D.F.: Edi-
torial El Manual Moderno.
Magnuson, P. (1979) Teorade los tests. Mxico, D.F. Trillas.
Morales, M.L. (1993). Psicometra Aplicada (2 a ed., 2a reim-
presin). Mxico D.F.: Editorial Trillas.
Murphy, K. R. y Davidshofer, C O . (1994). Psychological Tes-
ting - Principles Applications. New Jersey: Prentice Hall.
Pasquasy, R. (1974). Las aptitudes y su medida. Madrid:
Ediciones Marova.
Piaget, J. (1972). Psicologa de la inteligencia. Buenos
Aires: Editorial Psique.
Aires: Paids.
Terman, L.M. y Merrill, M.A. (1972). Stanford-Binet inte-
lligence scale. Form L-M. Boston: Houghton Mifflin
Company.
204
Thorndike, L. R. Y Hagen, E. (1975). Tests y tcnica de

medicin en psicologa y educacin. Mxico: Editorial
Trillas.
Universidad Nacional Autnoma de Mxico [UNAM].(1994a).
Prueba Diferencial de Aptitudes PROUNAM - Manual
tcnico, Mxico D.F. UNAM.
, (1994b). Prueba Diferencial de Aptitudes PROUNAM
- Manual del aplicador, Mxico D.F.: UNAM.
Wechsler, D. (1955). La medicin de la inteligencia del
adulto. La Habana: Cultural, S.A.
, D. (1981a). WAIS-R Manual: Wechsler Adult Ite-
lligence Scale-Revised. Nueva York: The Psychologi-
cal Corporation.
, D. (1981b). WAIS-Espaol - Escala de Inteligencia
para Adultos - Manual. Mxico D.F.: Editorial El
Manual Moderno.
, D. (1981c). WISC-Espaol - Escala de Inteligencia
para el nivel escolar - Manual. Mxico D.F.: Editorial
El Manual Moderno.
, D. (198 Id). WISC-R-Espaol - Escala de Inteligen-
cia revisada para el nivel escolar- Manual. Mxico
, D. (198le). WPPSI-Espaol - Escala de Inteligen-
cia para los niveles preescolar y primario - Manual.
205
Se termin de imprimir
en el mes de junio de 1996.
Tiraje 2,000 ejemplares.

Manual de Pruebas de Inteligenc - Costa Neiva, Kathia Maria (Autho

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Manual de Pruebas de Inteligenc - Costa Neiva, Kathia Maria (Autho

Cargado por

Copyright:

Formatos disponibles

MANUAL DE

Kathia Maria Costa Neiva

Kathia Maria Costa Neiva

Primera edicin: junio de 1996

Derechos exclusivos de edicin reservados para

Este libro es una coedicin entre

Editado en Mxico por Plaza y Valds editores

PRIMERA PARTE: Aspectos mtricos de las

SEGUNDA PARTE: Inteligencia 59

TERCERA PARTE: Aptitudes 171

Antonio Tena Suck

informaciones son de gran importancia para la comprensin

Kathia Maria Costa Neiva

Aunque puede considerarse que Platn y Aristteles fueron

sobre retraso mental, sus procedimientos para constituir

nios retrasados mentales, elabor junto con Simon la primera

Las pruebas psicolgicas pueden clasificarse desde diversos

1) Segn la conducta que miden:

examinado su mximo rendimiento en las distintas tareas

3) Segn la forma o el tipo de respuesta exigida:

4) Segn la forma de administracin:

5) Segn la libertad de ejecucin:

ejecute la tarea asignada, lo ms rpido posible. La duracin

6) Segn el material utilizado en la prueba:

7) Segn la forma de dar las instrucciones:

8) Segn la forma de calificacin:

9) Segn la poblacin a la que se destina:

Una prueba psicolgica combina varias de estas dimensiones

C. USOS DE LAS PRUEBAS

Una pruebapsicolgica puede ser empleada con diferentes finalidades:

Evaluacin: por ejemplo en el caso de evaluarse el

Son muchas las medidas adoptadas para controlar el uso

Anastasi, A. (1978). Tests psicolgicos (3a ed., 4a reimpresin)

CONSTRUCCIN Y EVALUACIN DE LAS

No es el propsito de este manual proveer mayores detalles sobre

A. ANLISIS Y COMPROBACIN DE LOS REACTIVOS

El primer procedimiento para analizar los reactivos de una prueba

Figura 2.1: Curva de distribucin normal

Si la prueba es muy difcil, la curva de distribucin de las

inferior o sea gran nmero de sujetos con puntuaciones bajas (figura

Figura 2.2 Figura 2.3

Cuando sucede uno de los dos casos arriba mencionados suele

Un tercer procedimiento en el que se verifica el porcentaje de

B. ANALISIS Y COMPROBACIN DE LA PRUEBA

El anlisis de laprueba, como un todo, supone distintos procedimientos,

Este proceso, tambin llamado por algunos autores tipificacin,

2.1. Validez de contenido

Este tipo de validez es utilizado sobre todo en pruebas de rendimiento/

de validez de contenido. Murphy y Davidshofer (1994) hacen adems

2.2. Validez de criterio

Este tipo de validez est relacionado con la prediccin de un

Adecuacin - Un criterio es adecuado cuando la calificacin

grupos definidos segn el criterio y consecuentemente, que la prueba

Cuando los grupos obtienen xito o fracaso en ambas medidas,

Los valores A, B, C y D corresponden al nmero de sujetos

2.3. Validez de construccin (o validez interna o estructural)

Este tipo de validez verifica el grado en que una prueba mide un

En esta categora se encuentran las tcnicas utilizadas para estudiar

Estos mtodos estn diseados para verificar las relaciones entre

Validez congruente - En este caso se verifica la correlacin

Este mtodo se basa en la prediccin acerca de diferencias entre

En este procedimiento se manipula experimentalmente una variable

e) Estudios de capacidad de generalizacin