Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Confiabilidad y Validez Stanfor Binet PDF
Confiabilidad y Validez Stanfor Binet PDF
Confiabilidad y Validez Stanfor Binet PDF
3
4
INDICE
INTRODUCCIÓN
OBJETIVOS
I UNIDAD
TEORÍAS Y MEDICIÓN DE LA INTELIGENCIA
1.1 DEFINICIONES DE INTELIGENCIA. 09
PRIMERA ACTIVIDAD 13
II UNIDAD
EVALUACIÓN DE LAS CAPACIDADES DE LACTANTES Y
PREESCOLARES.
2.1 EVALUACIÓN DE LA CAPACIDAD DEL LACTANTE 14
2.2 EVALUACIÓN DE LA INTELIGENCIA DEL PREESCOLAR 23
2.3 UTILIDAD PRÁCTICA DE LA EVALUACIÓN DE LACTANTES Y
PREESCOLARES 52
SEGUNDA ACTIVIDAD 60
III UNIDAD
PRUEBAS INDIVIDUALES DE INTELIGENCIA
5
3.6 ESCALA DE INTELIGENCIA STANFORD – BINET: CUARTA
EDICIÓN. 101
3.7 PRUEBAS DETROIT DE APTITUD PARA EL APRENDIZAJE – 4 114
3.8 TEST BREVE DE INTELIGENCIA DE KAUFMAN (K BIT) 118
TERCERA ACTIVIDAD 121
IV UNIDAD
PRUEBAS GRUPALES DE INTELIGENCIA
4.1 ORÍGENES Y CARACTERÍSTICAS DE LAS PRUEBAS
GRUPALES. 123
4.2 BATERÍA MULTIDIMENSIONAL DE APTITUD (MAB) 127
4.3 ESCALA DEL SHIPLEY INSTITUTE OF LIVING (SILWS). 134
4.4 BATERÍA MULTINIVEL: PRUEBAS DE CAPACIDAD COGNITIVA
(CogAt). 139
4.5 PRUEBA DE INTELIGENCIA CULTURALMENTE JUSTA (CFIT). 144
4.6 MATRICES PROGRESIVAS DE RAVEN (RPM) 149
4.7 PERSPECTIVA SOBRE LAS PRUEBAS CULTURALMENTE
JUSTAS. 156
6
OBJETIVOS
GENERAL:
Entender las bases teóricos- conceptuales de la medición de la
inteligencia dentro de principios éticos y legales a fin de que la
interpretación de los resultados refleje en buena medida la realidad
mesurada.
ESPECÍFICOS:
7
PRUEBAS PSICOLÓGICAS DE EFICIENCIA
INTRODUCCIÓN
Entre otros, uno de los objetivos del presente fascículo es investigar
los diferentes significados que se le han dado al término inteligencia y
analizar la manera en que las definiciones y teorías han influido en la
estructura y contenido de las pruebas de inteligencia. Una
justificación importante para este tema es que la comprensión de que
estas teorías de la inteligencia se tornan importantes para
establecer la validez de constructo de las medidas de C.I. en las
paginas siguientes se revisa la naturaleza y aplicación de los
principales instrumentos de evaluación de los lactantes,
posteriormente se investiga una cuestión fundamental: la utilidad
practica de estos instrumentos.
La inteligencia es pues, uno de los temas que mas se han investigado
en psicología sin embargo pese a la cantidad de tratados al respecto,
no existe una definición universalmente aceptada, sin embargo resulta
conveniente, detallar algunas definiciones que a nuestro entender
tiene mejor elaboración.
8
DEFINICIONES DE INTELIGENCIA
Sperman (1904-1923): Una capacidad general que implica
principalmente la deducción de correlaciones y correlatos.
Bient y Simon (1905): La capacidad para juzgar bien, para
comprender su impotencia.
Terman (1916): La capacidad para formar conceptos y para
comprender su importancia.
Pintner: (1921): La capacidad del individuo para adaptarse de manera
adecuada a las situaciones relativamente nuevas de la vida.
Throndike (1921): el poder de dar buenas respuestas, desde el punto
de vista de la verdad o el hecho.
Thurstone (1921) la capacidad para inhibir las adaptaciones
instintivas, para imaginar de manera flexible, diferentes respuestas y
para realizar adaptaciones instintivas modificadas en conducta
manifiesta.
Wecheler (1939) El conjunto o capacidad global del individuo para
actuar de manera propositiva, pensar de manera racional y
enfrentarse de manera efectiva con el ambiente.
Humphreys (1971) El repertorio completo de habilidades,
conocimiento, inclinación para el aprendizaje y tendencias a la
generalización adquiridos, considerados de naturaleza intelectual y
que están disponibles en un momento determinado.
Piaget (1972): un termino genérico que indican las formas superiores
de organización o equilibrio de la estructura cognitiva que se utiliza
para la adaptación al ambiente físico y social.
Sternberg (1985): la capacidad mental para automatizar el
procesamiento de información y para emitir en un contexto la
conducta adecuada en respuesta a situaciones novedosas; la
inteligencia también incluye metacomponentes de ejecución y de
adquisición del conocimiento (los cuales analizan después)
9
Eysenck (1986): transmisión correcta de la información a trabes de la
corteza.
Garder (1986): La capacidad o habilidad para resolver problemas o
para crear productos que se consideran valiosos dentro de uno o más
entornos culturales.
Cesi (1994): Capacidades innatas múltiples que dan un rango de
posibilidades; estas se desarrollan (o dejan de desarrollarse o se
desarrollan después se atrofian) dependiendo de la motivación y
exposición a experiencias educativas relevantes.
Como podemos apreciar son distintos los puntos de vista al respecto
sin embargo existen criterios generalizados en función a: 1.- la
capacidad para aprender de la experiencia y 2.- la capacidad para
adaptarse al propio ambiente. El hecho de que tanto el aprendizaje
como la adaptación sean importantes para la inteligencia se destaca
en gran medida en ciertos casos de discapacidad mental, donde las
personas no poseen una u otra capacidad en grado suficiente.
Los conceptos de los expertos acerca de la inteligencia son muy
semejantes, en orden de importancia, consideran a la capacidad de
solución de problemas prácticos , la capacidad verbal y la competencia
social como los ingredientes fundamentales; ellos señalan que la
inteligencia verbal, la capacidad de solucionar problemas y la
inteligencia practica son importantes.
Las primeras teorías acerca de la inteligencia, propuestas a finales del
siglo XX enfatizan la agudeza sensorial. Tanto Sir Francis Galton como
J. McKeen Cattell consideraban que la inteligencia se sustenta en las
capacidades sensoriales agudas: ambos desarrollaban varias medidas
sensoriales en sus fallidos intentos por medir la inteligencia.
A inicios del siglo XX Charles Spearman propuso que la inteligencia
constaba de dos tipos de factores; un solo factor general, g y
numerosos factores específicos, s1, s2, s3 y así sucesivamente.
10
Spearman ayudo a inventar el análisis factorial como auxiliar para sus
investigaciones acerca de la naturaleza de la inteligencia.
L.L. Thurstone, favoreció la perspectiva de que la inteligencia consta
aproximadamente de siete factores grupales en vez de un solo factor
general. Estos eran comprensión verbal, fluidez de palabra, numero,
espacio, memoria asociativa, velocidad perceptual y razonamiento
inductivo. En última instancia, Thurswtone reconoció la existencia de
g como factor de primer orden.
Raymond Catell propuso que la inteligencia esta formada por factores
principales: la inteligencia fluida (g) e inteligencia crisatalizada. La
primera no es verbal en su mayor parte y es una forma de eficiencia
mental relativamente independiente de la cultura, la inteligencia
cristalizada tiene una fuerte dependencia de la cultura y se emplea
para tareas que requieran de una respuesta aprendida o habitual.
Jean Piaget, propuso una tesis del desarrollo en su teoría acerca de
la inteligencia. Sugirió que los esquemas -patrones organizados de
conducta o estructuras mentales que conducen al conocimiento de
cómo hacer las cosas- evolucionan hacia la maduración cada vez
mayor a trabes de un proceso denominado equilibración.
En la teoría de Piaget, la asimilación es la aplicación de un esquema a
un objeto, persona o acontecimiento. Si un esquema funciona, surge
un estado de equilibrio, de lo contrario el resultado es el equilibrio –
un estado de tensión dinámica. Es este último caso, la persona debe
adaptar el esquema para que funcione- un proceso denominado
acomodación.
J.P: Guilford propuso un modelo de estructura intelectual (EI) para
resumir sus puntos de vista acerca de la naturaleza multifacética de
la inteligencia. Clasifico las capacidades intelectuales en tres
dimensiones llamadas operaciones (cinco tipos) y productos (seis
tipos) de esta manera, Guilford propuso en total 150 tipos diferentes
de inteligencia.
11
Según la teoría del procesamiento simultáneo y sucesivo, el cerebro
humano tiene dos formas específicas de procesamiento de
información: simultanea, en la que se procesan a un mismo tiempo
grupos de información principalmente espacial, y sucesiva, en la que
la información se organiza de manera temporal en una serie lineal.
Algunos investigadores han estudiado los fundamentos biológicos de
la inteligencia. Por ejemplo, varios estudios indican que la inteligencia
psicometrica se correlacionan con los patrones de la onda cerebral
evocada (el potencial evocado promedio o PEP) se correlaciona a
niveles de .70 a .80 con el CI medio.
H. Garden propuso una teoría de la inteligencias múltiples basada de
manera aproximada en el estudio de las relaciones cerebro conducta.
Afirma la existencia de varias inteligencias relativamente
independientes que incluyen la inteligencia lingüística, musical, lógico
matemático, espacial, corporal cenestésica y personal.
R. Sterberg propone una teoría triarquica de la inteligencia con los
siguientes aspectos: inteligencia componencial (los mecanismos
internos responsables de la conducta inteligente); inteligencia basada
en la experiencia (la capacidad de manejar de manera eficaz las
tareas novedosas) e inteligencia contextual (adaptación,
moldeamiento y selección del ambiente de la vida real).
12
Responda según corresponda:
1.- Pese a la diversidad de puntos de vista respecto a la definicion
de la inteligencia, existen dos conceptos generales comunes
entre la mayoria de autores, estas son:
a.-
b.-
13
EVALUACIÓN DE LA CAPACIDADES DE
LACTANCIA Y PREESCOLARES
Lenguaje
Usa “da da” con dignificado.
Responde a la palabra “no no”.
Personal-social
Extiende un juguete, pero no lo suelta.
Para los brazos por el vestido, si se le ayuda a iniciar el movimiento.
El rango de edades del Inventario Gesell del desarrollo es del
nacimiento a los 60 meses. El genio de Gesell se encuentra en haber
identificado situaciones que ocurren de manera natural en el hogar o
la clínica y en utilizar objetos o tareas con enorme atractivo para
lactantes y preescolares. En algunos casos, es necesaria la
información de uno de los padres o de la persona encargada del
cuidado del niño para calificar los reactivos individuales. A pesar del
ambiente naturalista de la prueba, los observadores, con el
entrenamiento adecuado, pueden lograr confiabilidades
interobservadores a la mitad del rango de .90 (Knobloch, Stevens y
Malone, 1987).
Los pedíatras y otros especialistas en niños son quienes empleen
principalmente los Inventarios Gesell del Desarrollo para identificar a
17
lactantes y niños en riesgo de presentar alteración neurológica y
retraso mental. Gesell nunca tuvo la intención de que su inventario
fuera una prueba de inteligencia. Tenía una fuerte orientación
biológica en su investigación y suponía que el desarrollo normal era
una evolución madurativa que ocurría en una secuencia fácil de
predecir. Gesell determinó que el desarrollo normal es un fenómeno
con límites temporales: la variabilidad de edades para el logro de los
hitos del desarrollo en la lactancia es generalmente pequeña, en el
rango de unas cuantas semanas para muchas tareas. Por tanto, la
demora grave para alcanzar a los hitos del desarrollo, establecidos por
Gesell de manera concienzudamente cronológica, puede indicar
alteración neurológica o retraso mental (Honzik, 1983; Lewis y
Sullivan, 1985). Varios estudios indican que los Inventarios Gesell del
Desarrollo funcionan bien en la detección de lactantes en riesgo
(Knobloch, Stevens y Malone, 1987).
Aunque los Inventarios Gesell del Desarrollo se emplean
principalmente para la detección y diagnóstico clínico, Knobloch,
Stevens y Malone (1987) proporcionan una bese más o menos
definida para la obtención de Cocientes del Desarrollo para las cinco
áreas y el desarrollo general. La fórmula es la siguiente:
18
Las pruebas Gesell son muy respetadas debido a que proporcionan
descripciones detalladas de los hitos del desarrollo en la lactancia que
no tienen paralelo en la bibliografía sobre evaluación infantil (Nuttall,
Romero y Kalesnik, 1992). Sin embargo, el empleo de los inventarios
Gesell como instrumento psicométrico recibido agudas críticas en años
recientes. problema básico parece residir en una falta de atención a
los criterios formales de confiabilidad y validez. Por ejemplo, en los
primeros manuales de Gesell los informes sobre la confiabilidad test-
retest son mínimos o nulos. Cuado los investigadores contemporáneos
examinaron esta propiedad de las pruebas Gesell, los resultados
fueron sorprendentes. Lichtenstein (1990 informó de una correlación
test-retest de sólo .73 con una muestra de 46 niños, lo cual cae muy
por debajo del nivel recomendado de .90 para la toma de decisiones
sobre individuos (Nunnally, 1978; Salvia & Ysseldyke, 1991). Banerji
(1992) concluyó que las pruebas Gesell funcionaban de manera
deficiente como instrumentos de detección de la preparación para la
escuela. En general, los especialistas en educación se muestran
cautelosos en cuanto a la utilización de estas pruebas para la toma de
decisiones sobre asignación o retención escolar.
20
del desarrollo para niños con discapacidad. Recientemente, Auer y
Reisberg (1996) han hecho surgir la fascinante posibilidad de que las
Escalas Ordinales puedan emplearse para la evaluación cognitiva de la
demencia grave en ancianos.
21
. Formación de conceptos matemáticos.
22
fuerte concordancia entre esta prueba y la primera, lo cual sustenta la
validez clínica de la revisión (Goldstein, Fogle, Wieber y O’Shea,
1995). Un estudio con la lactancia australianos sanos informó que las
puntuaciones de la BSID-II eran apropiadamente más bajas que las
de la BSID, lo cual indica que las normas para la primera edición en
verdad eran obsoletas (Tasbihsazan, Nettelbeck y Kirby, 1997). A
pesar de estos estudios en apoyo a su validez, Nellis y Gridley (1994)
sugieren precaución con la BSID-ll basta obtener mayor información.
Las escalas Bayley requieren mayor habilidad y tiempo (45 a 75
minutos) para aplicar e interpretar la prueba que instrumentos
comparables como la Denver-2. En consecuencia, se reservan para
evaluaciones especiales y para aplicaciones de investigación; por lo
común no se les utiliza como instrumentos rutinarios de detección.
23
Developmental Assessment of Young Children (Evaluación del
Desarrollo de Niños Pequeños DAYS, Voress y Maddox, 1998).
Del nacimiento a los seis años de edad; la evaluación en cinco
dominios (cognición comunicación, socioemocional, físico y
adaptativo) se realiza a través de observación, entrevistas con los
encargados del cuidado del niño y evaluación directa. La DAYS
proporciona una evaluación breve (20 minutos con base en datos
normativos sobresalientes (1300 niños divididos en 23 grupos por
edad que se aproximan a los datos del censo de 1996). Los cinco
índices resultantes y el índice global son sumamente confiables (con
coeficientes que van de .90 a .99).
Developmental lndicators for the Assessment of Learning-3
(Indicadores del Desarrollo para la Evaluación del
Aprendizaje—3 DIAL-3; Mardell-Czudnowsid y Goldenberg, 1998).
De los 3 a los 6 años de edad; los dominios que se evalúan incluyen
Motor (p. ej., atrapar, cortar, escribir), Conceptos (p. ej., nombrar,
contar, clasificar) y Lenguaje (p. ej.. sustantivos/verbos, solución de
problemas, extensión de la oración). La confiabilidad test-retest la
parte alta del rango de .80 es extraordinaria para un instrumento de
este tipo. En el mismo que se tienen disponibles versiones en inglés y
español.
Early Screening lnventory (Inventario de Detección Temprana,
ESI; Melseis, Wiske y Tivnan, 1984). Edades de 3 a 6 años; es un
instrumento breve de detección que proporciona puntuaciones en
cuatro áreas –dibujo de la Figura Humana, Visomotora/Adaptativa;
Lenguaje y Cognición y Motora Gruesa/Consciencia Corporal. La
puntuación total se utiliza para clasificar a los niños en uno de tres
grupos de canalización: “Bien” (de superior al promedio a menos 1
DE); “reevaluar” (entre menos 1 y menos 2 DE) y “canalizar” (inferior
a menos 2 DE).
24
Early Screening Profiles (Perfiles de Detección Temprana, ESP;
Harrison, Kaufman, Kaufman y col., 1190). Edades de 2 a 6 años; los
dominios que se evalúan incluyen Cognitivo/Lenguaje, Motor y
autoayuda/Social; cuatro Exámenes (Articulación, Conducta, Historial
de salud y Hogar) complementan la evaluación. Este instrumento
tiene fuertes cualidades psicométricas; el manual proporciona
información detallada en siete estudios de validación llevados a cabo
de manera independiente con respecto al estudio de estandarización.
Barnett (1996) ofrece una revisión escéptica; Telzrow (1995) se
muestra más positivo.
Gesell child Development Age Scale (Escala Gesell de Edad del
Desarrollo Infantil, GCDAS; Cassell; 1990). De los 18 meses a loa
10 años de edad; esta prueba intenta poner en términos
operacionales la teoría de etapas del desarrollo infantil de Gesell al
pedirle a la madre, maestro o clínico que respondan a 100 reactivos
de falso-verdadero, apropiados para cada edad, dentro de un conjunto
más amplio de 240 reactivos. Se pueden utilizar hasta tres
calificadores para valorar a un niño; los resultados Incluyen una
gráfica de la edad cronológica contra la edad del desarrollo en 10
áreas del desarrollo. La GCDAS es una prueba prueba prometedora
que requiere de mayor investigación en cuanto a cualidades
psicométricas (Lang. 1996).
25
Cuando se mide el funcionamiento cognitivo de un niño, también se
mide la cooperación, atención, persistencia, capacidad para estarse
quieto y receptividad social ante una situación de evaluación.
26
Las Diferrential Ability Scales.
ESCALA WECHSLER DE INTELIGENCIA PARA LOS NIVELES
ESCOLARES Y PRIMARIA-REVISADA (WPPSI-R)
El WPPSI-R es muy similar a su antecesor, pero ofrece una
actualización de normas y aplicación para un rango más amplio de
edades —de los 3 a los 7 años, 3 meses (Wechsler, 1989) Además, se
revisaron varios reactivos obsoletos y parciales y se añadió una
versión de Composición de objetos a las 11 subpruebas originales. La
confiabilidad y validez del WPPSI-R son muy similares a las de la
versión anterior de esta prueba. Salvia e Ysseldyke (1991) resumen
las confiabilidades de división en mitades como sigue: CI Verbal (.86
a .96), CI de Ejecución (.85 a .93) y Cl Total (.90 a .97). Las
confiabilidades de las subpruebas del WPPSI-R son sustancialmente
más débiles; sus interpretaciones deben restringirse a las
puntuaciones mixtas de CI. Las normas para el WPPSI-R se basan en
una muestra cuidadosamente estratificada de 1 700 niños y en edad,
sexo, región geográfica, origen étnico y educación y ocupación de los
padres; su validez se basa, en parte, en su parecido con el WPPSI,
que obtuvo grandes alabanzas de los revisores. Sattler (1988) revisó
varias docenas de estudios en apoyo de la validez concurrente y
predictiva del WPPSI, y concluyó que la prueba sirve como un
excelente medio de predicción a largo plazo de la inteligencia y del
desempeño escolar en la adolescencia.
28
Tres de estas 12 subpruebas (Frases, Diseños geométricos y Casa de
los animales) se encuentran sólo en el WPPSI-R y se resumen a
continuación (las otras nueve subpruebas, comunes en todas las
escalas Wecbsler, se analizan en el Tema 6A: Pruebas individuales de
inteligencia). Frases es una subprueba complementaria en el WPPSI-
R. Ésta requiere que el niño repita al pie de la letra una oración que le
ha leído en voz alta el examinador. El reactivo más fácil se encuentra
al nivel de “Juan tiene un coche verde”, mientras el más difícil es
mucho más largo y consta de dos oraciones conectadas como éstas:
31
Cuadro 02. Subpruebas y áreas de la Escala de Inteligencia
Stanford-Binet, cuarta edición
Razonamiento Verbal
Vocabulario*
Comprensión*
Absurdos*
Relaciones Verbales
Razonamiento Abstracto/Visual
Análisis de Patrones*
Copiado*
Matrices*
Doblado y cortado de papel
Razonamiento Cuantitativo
Cuantiflcación*
Series de números
Construcción de ecuaciones
Memoria a Corto Plazo
Memoria de cuentas*
Memoria de oraciones*
Memoria de dígitos
Memoria de objetos
Movimientos manuales*
Recuerdo de número
Orden de palabras
Puntuación Escala de
Mixta de Procesamiento Ventana mágica
Procesamiento Simultáneos Reconocimiento de rostros*
Mental Cierre gestáltico
Triángulos*
Analogías con matrices*
Memoria espacial*
Series de fotografías*
Vocabulario expresivo
Escala de Rostros y lugares
Rendimiento Aritmética
Acertijos
Lectura/decodificación
Lectura/comprensión
34
Kaufman, Kaufman y Goldsmith (1984) proporcionan pautas y
ejemplos para la enseñanza de la lectura, ortografía y aritmética a
niños con base en las fortalezas secuenciales o simultáneas en la K-
ABC. Aunque la teoría convincente, la sustentación para la supuesta
interacción entre aptitud y tratamiento de la K-ABC es dispar en el
mejor de los casos. por ejemplo, Fisher, Jenkins, Bancroft y Kraft
(1988) equipararon estrategias de enseñanza con los estilos
cognitivos secuencial/simultáneo (como se determinan a partir de la
K-ABC) para 57 estudiantes de educación primaria inscritos en una
clínica de discapacidad para el aprendizaje. Aunque, en general, los
resultados prestaron apoyo a la interacción predicha entre aptitud y
tratamiento, los efectos fueron pocos y no tuvieron ninguna
importancia práctica.
Ambas escalas de la Puntuación Mixta de Procesamiento Mental (PPM)
se diseñaron reducir los efectos de la parcialidad de sexo y raza, y
según la mayor parte de los informe, los autores de la prueba
tuvieron éxito en estos objetivos (Notan, Watlington y Willson, 1989).
Con base en los datos de estandarización, Kaufman, Kamphaus y
Kaufman (1985) informaron de diferencias pequeñas (del orden de
cinco puntos) entre la PPM de personas de raza blanca y de miembros
de grupos minoritarios en la K-ABC. Ésta es una diferencia mucho más
pequeña que la que se encuentra por lo común con pruebas como el
WISC-II y la Stanford-Binet, donde son comunes las diferencias del
orden de 15 puntos de CI a favor de las personas de raza blanca.
Movimientos manuales.
Reconocimiento de rostros.
Triángulos.
Analogías con matrices.
Memoria espacial.
Series de fotografías.
37
Cuadro 03. Descripción de las subpruebas de la K-ABC
Escala de Procesamiento Secuencial
38
Triángulos: el niño debe ensamblar varios triángulos idénticos de
goma (amarillos en un lado, azules en el otro) para equipararlos con
una ilustración de un diseño abstracto.
Escala de Rendimiento
Vocabulario expresivo: el niño debe nombrar el objeto representado
en una fotografía.
39
Lectura/Decodificación: una prueba de identificación de letras y de
reconocimiento/pronunciación de palabras.
40
La validez de esta prueba se sustenta también en los 43 estudios
citados y resumidos en el Manual Interpretativo, incluyendo
numerosos estudios de correlación con otras pruebas (Kaufman y
Kaufman, 1983). Estas correlaciones varían de manera amplia, pero
en general dan apoyo a la validez de la K-ABC, al menos en cuanto a
la puntuación mixta de procesamiento mental. En este sentido, las
conclusiones de Obrzut, Obrzut y Shaw (1984) y de Naglieri (1985)
son típicas. Con muestras independientes de estudiantes con
discapacidad para el aprendizaje y con retraso mental educable, estos
dos estudios informaron correlaciones casi idénticas de .80 y .83,
respectivamente, entre el CI del WISC-R y las puntuaciones mixtas de
la K-ABC.
Una segunda crítica tiene que ver con la designación de las seis
subpruebas como pruebas de rendimiento. Anastasi (1985) señala que
una prueba puede considerarse apropiadamente como prueba de
rendimiento sólo cuando se le vincula de manera estrecha con un
contenido educativo específico. No obstante, los autores de la K-ABC
hicieron esfuerzos especiales para separar las pruebas de rendimiento
42
de cualquier contenido curricular específico. Estas subpruebas se
parecen más a las medidas tradicionales de inteligencia que a las de
rendimiento académico. ¡De hecho, con base en las cargas factoriales
en el primer factor sin rotación, muchos investigadores han concluido
que las subpruebas de Rendimiento proporcionan una mejor medida
de la inteligencia general que aquéllas de procesamiento mental!
(Mine, Guilmette, Snyder y Castellanos, 1992). Esta controversia se
basa, en parte, en posturas filosóficas divergentes en cuanto a la
naturaleza de la inteligencia y no es probable que se resuelva a través
de la investigación (Reynolds, l994b).
44
Cuadro 04. Subpruebas y escalas de las Escalas McCarthy de
Aptitudes y Psicomotricidad para Niños
Escalas
Subpruebas Ver Ejecu Cuant Mem Motora Índice
bal ción itativ oria cognitiv
perce a o
ptual general
Memoria V Mem ICG
pictórica
Conocimiento V ICG
de palabras
Memoria V Mem ICG
verbal
Fluidez verbal V ICG
Analogías V ICG
opuestas
P
Construcción P ICG
con cubos
Solución de P Mem ICG
rompecabeza
s
Secuencia P ICG
rítmica
Orientación P ICG
derecha -
Izquierda
Dibujo de un P ICG
diseño
Dibujo de un P Mot ICG
niño
Agrupamiento P Mot ICG
conceptual
45
Preguntas C ICG
con números
Memoria C Mem ICG
numérica
Conteo y C ICG
clasificación
Coordinación Mot
de piernas
Coordinación Mot
de brazos
Acción Mot
imitativa
46
La confusión acerca de la estructura factorial de las escalas McCarthy
indica que los examinadores deben ser precavidos en el análisis de un
perfil que se base en las cinco escalas antes mencionadas (Verbal,
Perceptual-Ejecución, Cuantitativa, Memoria y Motora). En muchas
muestras y para algunos grupos por edad, las escalas pueden ser
mejores como medidas de la capacidad cognitiva general que de las
capacidades específicas designadas por los nombres de las escalas
(Sattler, 1988).
48
ESCALAS DE CAPACIDAD DIFERENCIAL
Las Differential Abiltty Scales (DAS) son una adición reciente a la
evaluación individual de la inteligencia que es digna de un breve
comentario (Elliott, 1990, 1997). La DAS cubre un rango de edades de
los 2 años y medio a lo 18 años en tres baterías superpuestas:
preescolar inferior (edades de 2:6 a 3:5), preescolar superior (edades
de de 3:6 a 5:11) y edad escolar (edades de 6:0 a 17:11). Aquí se
presenta la batería pre-escolar superior.
49
Cuadro 06. Subpruebas de la Batería Preescoiar DAS
Subpruebas Capacidades Medidas Contribución a la
puntuación mixta
Subpruebas Lenguaje receptivo, Verbal CCG
esenciales comprensión de
instrucciones verbales
Vocabulario de Lenguaje expresivo, Verbal CCG
nombres conocimiento de nombres
semejanzas Razonamiento no verbal, No verbal, CCG
con dibujos equiparación de
ilustraciones con temas
comunes
Construcción Visualización no verbal, No verbal, CCG
de patrones espacial, con cubos y
cuadrados de colores
Copiado Copiado de diseños, No verbal, CCG
coordinación motora fina;
equiparación visoespacial
Primeros Conocimiento de conceptos CCG
conceptos de de número y cuantitativos
número
subpruebas
diagnósticas
Construcción Orientación espacial, n/a
de cubos equiparación visoper-
ceptual con cubos
Equiparación Relaciones espaciales, n/a
de formas discriminación visual de
parecidas a formas similares
letras
Recuerdo de Memoria auditiva a corto n/a
dígitos plazo de secuencias
50
numéricas
Recuerdo de Aprendizaje a corto plazo y n/a
objetos recuerdo verbal de
ilustraciones
Reconocimiento Memoria visual a corto n/a
de dibujos plazo, reconocimiento de
objetos familiares
51
Los estudios sobre validez concurrente prestan un fuerte apoyo a la
DAS, con correlaciones en los rangos de .70 y .80 con otras
correlaciones en los rangos de .70 y .80 con otras medidas
preescolares de la inteligencia y rendimiento (Elliott, 1990ab). Un
estudio de Dumont, Cruse, Price y Whelley (1996) provee una muy
fuerte sustentación para la validez de la DAS al proporcionar un
patrón confirmatorio de las correlaciones entre este instrumento y el
WISC-III con 53 niños en los que se había identificado discapacidad
para el aprendizaje. Los resultados se resumen el cuadro 5-11 y
muestran que los componentes similares se correlacionan en mayor
medida que aquellos diferentes en las dos pruebas. También, dicho
cuadro revela que las puntuaciones totales con muy similares, en
promedio, entre la DAS (CCG media de 87.2) y el WISC-III (CI medio
89.7). Elliott (1997) describe estudios adicionales de validez para este
magnífico instrumento.
53
Cuadro 08. Resumen de correlaciones entre puntuaciones de
pruebas de inteligencia para lactantes y niños en individuos
normales
Edad de la prueba Edad de prueba en la infancia
inicial en la (año)
lactancia (meses) 3-4 5-7 8-18
1-6 .21 .09 .06
7-12 .32 .32 .26
13-18 .50 .50 .32
19-30 .59 .59 .49
Fuente: Adaptado con autorización de McCall, R. B. (1979). The
development of intellectual functioning in infancy and the prediction of
later IQ. En J.D. Osofsky (Ed.), Handbook of infant development.
Nueva York: John Wiley.
55
UTILIDAD PRACTICA DE LAS ESCALAS BAYLEY-lI Y DE OTRAS
ESCALAS PARA LACTANTES
El empleo más importante y justificable de las pruebas con lactantes
es la detección de discapacidades del desarrollo. Aunque las pruebas
existentes para la etapa de la lactancia son deficientes como medios
de predicción de la inteligencia en la infancia, una excepción a esta
regla se encuentra en el caso de lactantes que obtienen una
puntuación muy baja en pruebas como la Bayley-ll y otros
instrumentos de detección. Por ejemplo, los lactantes que tienen
puntuaciones a dos desviaciones estándar por debajo de la media en
la escala Bayley, en particular en la Escala Mental, tienen una elevada
probabilidad de obtener después en su vida resultados de prueba en
¡os rangos de retraso mental (Self y Horowitz, 1979; Goodman,
Malizia, Durieux -Smith, MacMurray y Bernard, 1990).
Con niños en situación de riesgo, la correlación entre-las puntuaciones
de prueba en la lactancia y el CI posterior en la niñez es mucho más
fuerte que para las muestras de niños normales. McCall (1983)
determiné que la correlación mediana entre las puntuaciones de
prueba en la lactancia y el CI en la infancia en un seguimiento a siete
años era un robusto .48. La conclusión más consistente es que una
puntuación muy baja en una prueba para lactantes —dos desviaciones
estándar por debajo de la media o más baja— predice de manera
precisa un CI bajo en la infancia (Frankenburg, 1 985). Por ejemplo,
los estudios con la Denver Developmental Screening Test-Revised
(Prueba Denver de Detección del Desarrollo—Revisada; desde
entonces publicada como Denver—II) reveló una tasa falsa positiva de
sólo 5 a 11%, lo cual significa que los lactantes y preescolares
identificados como niños en riesgo pocas veces lograban un
funcionamiento en el rango normal. Los estudios con las escalas
Bayley también se conforman a este patrón (p. ej., VandrVeer y
Schweid, 1974).
56
NUEVOS ENFOQUES DE LA EVALUACIÓN CON LACTANTES
Lewis ha afirmado que las pruebas tradicionales para lactantes pasan
por alto las conductas iniciales de procesamiento de información,
como la memoria de reconocimiento y la atención hacia el ambiente,
que podrían predecir mejor la función cognitiva en la infancia (Lewis y
Sullivan, 1985). En un estudio, la simple habituación visual a un
estímulo novedoso (medida por la duración de la fijación), evaluada a
los tres meses de edad, se correlacionó en .61 con la puntuación
obtenida en la Escala Mental de las escalas Bayley a los 24 meses de
edad (Lewis y Brooks-Gunn, 1981). Con un paradigma similar, Fagan
ha informado de resultados comparables (Fagan, 1984; Fagan y
Shepherd, 1986). Por ejemplo, en un estudio, este investigador
sometió a prueba con el método todo de habituación la memoria de
reconocimiento de lactantes a las edades de 4 a 7 meses (Fagan y
McGrath, 1981). En este estudio, los lactantes observaron primero
una fotografía del rostro de un bebé durante un periodo corto y
después se les mostró la misma fotografía junto con una desconocida
(p. ej., la imagen de un hombre calvo). Los investigadores llevaron un
registro cuidadoso de cuál era la fotografía que los lactantes miraban
más; la lógica detrás del procedimiento es sencilla: Mirar
principalmente la nueva fotografía significa que el lactante reconoce la
anterior; es decir, un lactante con buena memoria de reconocimiento
prefiere mirar algo nuevo. Por tanto, la preferencia por la novedad -
como se mide a través del tiempo de fijación visual en la nueva
imagen- se vuelve un índice de la memoria inicial de reconocimiento.
Años después, los investigadores aplicaron la Peabody Picture
Vocabulary Test (Prueba Peabody de Vocabulario con Figura; PTB)
para estimar la inteligencia en la infancia temprana. Las puntuaciones
de memoria de reconocimiento en la lactancia y las puntuaciones en la
PPVT en la infancia temprana se correlacionaron en .37 a los cuatro
años de edad y en .57 a los siete. Es probable que estas correlaciones
57
subestimen la validez predictiva de las pruebas de memoria para
lactantes, en el sentido de que el índice de memoria en la lactancia
fue un procedimiento poco confiable basado en un pequeño número
de reactivos de prueba. Lo que es más, los investigadores evaluaron a
lactantes normales, lo cual diminuyó las correlaciones entre el medio
de predicción y el criterio.
59
RESPONDA SEGÚN CORRESPONDA:
1.- Los inventarios Gesell del desarrollo proporcionan un
procedimiento estandarizado para la obsrvacion y valoración de
los logros en el desarrollo del niño en cinco areasw especificas:
a.-
b.-
c.-
d.-
e.-
2.- El rango de edades del Inventario Gesell del desarrollo es del
nacimiento hasta los 60 meses
V( ) F( )
60
PRUEBAS INDIVIDUALES
DE INTELIGENCIA
Introducción:
El examen de la inteligencia es uno de los principales logros de la
psicología de este siglo. En respuesta al éxito de las escalas Bidet-
Simon a principios del siglo XX, los psicólogos desarrollaron y
depuraron docenas de pruebas individuales de inteligencia diseñadas
con base en este instrumento innovador. También se observó un gran
crecimiento en las pruebas grupales de indigencia, fomentadas por la
entusiasta aceptación de las pruebas Army Alfa y Beta durante y
después de la primera Guerra Mundial. Sólo con algunas excepciones,
las pruebas actuales de inteligencia, tanto individuales sobresalientes
y se termina el capítulo con una reseña de las pruebas grupales de
inteligencia en el Tema 6B
61
Aunque esta obra dedica tres capítulos completos al fascinante y
emocional tema del examen de la inteligencia, no se afirma que la
cobertura sea exhaustiva. Un análisis completo de las pruebas de
inteligencia se encuentra simplemente más allá del campo de acción
de ésta o cualquier otra referencia básica. Casi cada mes aparecen
pruebas nuevas y revisadas, y cada año se publican miles de
novedosos descubrimientos de investigación. Aquí se reseñan las
pruebas más utilizadas o que ilustran avances interesantes en la
teoría o el método. Los lectores pueden encontrar información acerca
de pruebas adicionales en la serie del Mental Measurements Yearbook,
que ahora publica cada 3 o 4 años el Buros Institute (p.ej., Mitchell,
1985; Conoley e Impara, 1995; Conoley y Kramer, 1989, 1992). La
Encyclopedia of Human Intelligence (Stemberg, 1994) también es una
buena fuente de información acerca de las pruebas individuales y
grupales de inteligencia.
CI = edad mental .
edad cronológica
por una fórmula nueva relacionada con la edad
CI = puntuación obtenida o real .
puntuación media esperada para esa edad
69
Cuadro 10. Composición de subpruebas de las escalas Wechsler
WPPSI- WISC- WAIS-
R III III
Escalas Verbales
Información X X X
Retención de Dígitos X X
Vocabulario X X X
Aritmética X X X
Comprensión X X X
Semejanzas X X X
Frases X
Sucesión de Letras y X
Números
Escalas de ejecución
Figuras Incompletas X X X
Ordenación de Dibujos X X
Diseño con cubos X X X
Matrices X
Composición de objetos X X X
Claves/Símbolos y Dígitos X X
Laberintos X X
Diseños Geométricos X
Búsqueda de Símbolos X X
Casa de los animales X
Nota: Las subpruebas “principales”, comunes a todas las escalas
Wechsler, se encuentran en tipografía negrita.
INFORMACIÓN
En esta subprueba se examina el conocimiento real acerca de
personas, lugares y fenómenos comunes. Las preguntas para niños
son como las siguientes:
“¿Cuántos ojos tienes?”
“¿Quién inventó el teléfono?”
‘¿Qué produce un eclipse solar?”
“¿Cuál es el planeta más grande?”
Las preguntas para adultos son similares, pero progresan a mayores
niveles de dificultad. Las preguntas difíciles en la subprueba de
información para adultos se asemejan a:
“¿Cuál es el elemento más común aire?”
“¿Cuál es la población mundial?”
71
‘¿Cómo se convierte el jugo de fruta en vino?”
‘¿Quién escribió Madame Bovary?
RETENCIÓN DE DÍGITOS
Retención de Dígitos consta de dos pruebas independientes, Dígitos
en Orden Progresivo y Dígitos en Orden Inverso. En la primera, el
examinador lee una serie de números a una velocidad de uno por
segundo y después le pide al sujeto que los repita. Si el paciente
72
responde correctamente en dos ensayos consecutivos de la misma
extensión, el examinador prosigue a la siguiente serie que tiene un
dígito adicional, hasta una extensión máxima de nueve dígitos. Para
Dígitos en Orden Inverso se utiliza un procedimiento similar, sólo que
la persona examinada debe repetir los dígitos en orden inverso, hasta
una extensión máxima de ocho dígitos. Por ejemplo, el examinador
lee:
“6-1-3-4-2-8-5”
y la persona trata de repetir los números en orden inverso:
“5-8-2-4-3-1-6”
VOCABULARIO
Se pide al individuo que defina hasta varias docenas de palabras que
tienen un nivel cada vez mayor de dificultad, mientras el examinador
escribe la respuesta al pie de la letra. Por ejemplo, en un reactivo fácil
el examinador podría preguntar “¿qué es una taza?”, y la persona
evaluada obtendría crédito parcial por responder: “una cosa para
beber”, y crédito completo por responder “tiene un asa, condene
líquido en su interior y bebes de ella”. Para los adultos y niños
inteligentes, los reactivos avanzados en la subprueba de Vocabulario
de Wechsler pueden ser muy desafiantes, al nivel de tintura,
vocinglero y atroz.
ARITMÉTICA
Excepto por los reactivos más fáciles para niños pequeños o personas
con retraso, la subprueba de Aritmética está formada por problemas
matemáticos presentados de manera oral. El individuo examinado
debe resolver los problemas sin papel o lápiz dentro de un límite de
tiempo (por lo general 30060 segundos). Los reactivos sencillos
destacan operaciones fundamentales de suma o resta, por ejemplo:
“Si tienes 15 manzanas y regalas 7, ¿cuántas te quedan?”
“¿Qué quiere decir este dicho?: ‘Más vale pájaro en mano que ciento
volando?.
“¿Por qué los jueces del Tribunal Superior de Justicia conservan su
puesto de por vida?”
FIGURAS INCOMPLETAS
Para esta subprueba, el examinador pide al individuo identifique la
“parte importante” que falta una ilustración. Por ejemplo, un reactivo
simple podría ser de este tipo: un dibujo de una mesa a la que le falta
una pata. Los reactivos van aumentando en grado de dificultad; la
subprueba continúa hasta que la persona evaluada falla en cinco
reactivos consecutivos. La figura 6-1 representa un reactivo similar a
aquéllos encontrados en el WAIS-IIl.
ORDENACIÓN DE DIBUJOS
En esta subprueba, el examinador coloca en desorden varios
recuadros de una tira de caricaturas no verbales. La tarea de la
persona evaluada consiste en colocar los recuadros juntos en el orden
conecto, a fin de describir una historia que tenga sentido. La figura 6-
2 presenta una tarea de ordenación de dibujos como la que podría
encontrarse en el WAIS-III.
79
Aunque Ordenación de Dibujos se agrupa junto con las tareas de
ejecución, tiene cargas aproximadamente iguales en ¡os componentes
verbal y de ejecución revelados en los estudios analítico-factoriales de
intercorrelación de subpruebas (p.ej., Silverstein, 1982a). Las
capacidades detectadas son complejas y multifacéticas. Antes de
ordenar los dibujos, la persona examinada debe tener la capacidad de
descifrar la gestalt de la historia conecta, a partir de sus elementos
desordenados. Esta subprueba también mide pensamiento secuencial
y la capacidad para ver relaciones entre acontecimientos sociales, En
el WAIS-III, varias de las historias de Ordenación de Dibujos tienen
temas humorísticos. Como resultado, se requiere de refinamiento
social y sentido del humor para tener un desempeño exitoso.
MATRICES
Matrices una nueva subprueba que se encuentra sólo en el WAIS-III.
Se añadió para mejorar la evaluación del razonamiento no verbal en
la prueba para adultos. La subprueba consiste en 26 problemas de
razonamiento figurativo dispuesto en orden de dificultad creciente
(figura 6-3). Para encontrar la respuesta correcta, la persona
evaluada tiene que identificar un patrón o relación recurrente entre
los estímulos figurativos dibujados a lo largo de una línea recta
(reactivos sencillos) o en una rejilla de 3 x 3 (reactivos difíciles) en los
que falta el último elemento. Con base en el razonamiento no verbal
acerca de patrones y relaciones, la persona debe inferir el estímulo
faltante y seleccionarlo de entre cinco opciones que se proporcionan
en la parte inferior de la tarjeta.
81
Figura 3-3: Reactivo de Matrices similar a los encontrados en el
WAIS-III
COMPOSICIÓN DE OBJETOS
Para cada reactivo, la persona evaluada debe armar las piezas de un
rompecabezas para formar un objeto común (figura 6-4). Por ejemplo,
Composición de objetos en el WAIS-IlI consiste en cinco
rompecabezas: un maniquí (seis piezas), un perfil (siete piezas), un
elefante (seis piezas), una casa (nueve piezas) y una mariposa (siete
82
piezas). El examinador no identifica los reactivos, de modo que la
persona evaluada debe discernir primero el objeto para identificar
cada reactivo a partir de sus panes desordenadas. El éxito en esta
subprueba requiere altos niveles de organización perceptual; es decir,
la persona debe captar el patrón general o gestalt, con base en la
percepción de las relaciones entre las partes individuales.
LABERINTOS
Esta subprueba sólo aparece en el WPPSI-R Y WISC-III, y consiste en
laberintos de lápiz y papel que el niño debe resolver dentro de un
límite de tiempo. Al individuo evaluado se le pide que no levante el
lápiz y se le aconseja que “intente no entrar en callejones sin salida”.
Se da crédito completo para cada laberinto si el niño lo resuelve
dentro del límite de tiempo (30 a 150 segundos, dependiendo de la
85
dificultad) sin entrar en algún callejón sin salida. Se resta un punto de
puntuación natural por cada vez que haya entrado en un callejón sin
salida.
La subprueba de Laberintos detecta habilidades perceptomotoras,
velocidad motora, planificación visual y la capacidad para inhibir las
respuestas impulsivas. Esta subprueba es una medida deficiente de la
inteligencia general, pero mide razonablemente bien la organización
perceptual. En el WISC-III, Laberintos es una subprueba
complementada que no se utiliza para el cálculo del CI.
BÚSQUEDA DE SÍMBOLOS
a Búsqueda de Símbolos es una medida complementaria de ejecución
que se encuentra en el WISC-III y el WAIS-III. Es una subprueba con
fuerte influencia de los límites de tiempo, en la que el niño observa un
grupo blanco de símbolos, después examina con rapidez un grupo de
búsqueda con símbolos y finalmente marca la casilla de “SI” o “NO”
para indicar si uno o más de los símbolos dentro del grupo blanco
ocurrieron dentro del grupo de búsqueda. Un reactivo de Búsqueda de
Símbolos se representa en la figura 6-6. Esta subprueba parecería ser
una medida de la velocidad de procesamiento.
CI Verbal
Vocabulario
Semejanzas
Aritmética
87
Retención de Dígitos
Información
Comprensión
CI de Ejecución
Figuras Incompletas
Claves, símbolos y Dígitos
Diseño con Cubos
Matrices
Ordenación de Dibujos.
CONFIABILIDAD
La confiabilidad del WAIS-III es excepcionalmente buena. El promedio
de las confiabilidades mixtas de división en mitades entre todos los
grupos por edad son: CI Verbal, 0.97; CI de Ejecución, 0.94; y CI
Total, 0.98. Los coeficientes de estabilidad en test-retest para 394
examinandos confirman en mucho la misma imagen: CI Verbal, 0.96;
CI de Ejecución, 0.91; y CI Total, 0.96. Las confiabilidades y
coeficientes de estabilidad para las cuatro puntuaciones Índice tienden
a ser un tanto inferiores, pero aún se encuentran en o cerca de .90 en
todos los casos.
VALIDEZ
Con base en un número de diferentes líneas de evidencia revisadas
aquí, la validez del WAIS-III parece ser bastante satisfactoria. En
numerosos estudios que correlacionan el WAIS-III con pruebas
establecidas de inteligencia y también con medidas del rendimiento
académico, se ha demostrado su buena validez relacionada con el
criterio. Por ejemplo, el CI Total del WAIS-III tiene una fuerte
correlación con las puntuaciones globales en otras medidas: .93 el
92
WAIS-R, .88 con el WISC-III (en el caso de los jóvenes de 16 años en
los grupos donde se superponen las edades), .64 con Matrices
Progresivas Estándar y .88 con la Prueba de Inteligencia Stanford-
Binet: Cuarta Edición. El CI del WAIS-III también tiene una fuerte
correlación con las ocho subpruebas de la Prueba Wechsler de
Rendimiento Individual, al revelar una correlación mediana de .70
(Tulsky, Zhu y Ledbetter, 1997). No existe duda de que el WAIS-R
capta los mismos aspectos de la inteligencia global que miden otros
instrumentos de amplia utilización.
93
Cuadro 11. Correlaciones entre el lugar académico en la
secundaria, las calificaciones universitarias y las puntuaciones
del WAIS
Subpruebas del Educación Universidad
WAIS y CI media (N=335)
superior
(N=98)
Información 0.54 0.48
Comprensión 0.55 0.33
Aritmética 0.45 0.19
Semejanzas 0.50 0.69
Retención de Dígitos 0.37 0.04
Vocabulario 0.65 0.46
Símbolos y dígitos 0.34 0.15
Figuras incompletas 0.33 0.20
Diseño con Cubos 0.29 0.19
Ordenación de 0.22 0.07
Dibujos
Composición de 0.17 0.12
Objetos
CI Verbal 0.63 0.47
CI de Ejecución 0.43 0.24
CI Total 0.62 0.44
Fuente: Adaptado con autorización de Conry, R. y Plant, W. T. (1965).
WAIS and group test predictions o fan academia success criterion:
High Schoool and colege. Educational and Psychological Measurement,
25, 493-500.
Wechsler:
100
relación mínima con medidas independientes de atención en una
muestra de niños con supuestos problemas de atención.
La solución de cuatro factores para el WISC-III da la posibilidad del
informe opcional de Puntuaciones de Índice -similares a las
puntuaciones de CI- para cada uno de los cuatro factores. Estas
puntuaciones se basan en la media familiar de 100 y desviación
estándar de 15. Las Puntuaciones de Índice (Índice de Comprensión
verbal, ICV, Índice de Libertad de la Distractibilidad, ILD, etc.) se
derivan de la asignación de las subpruebas que se lista antes y sirven
para complementar los CI Verbal y de Ejecución. Este análisis factorial
del WISC-III es particularmente útil en la evaluación discapacidades
para el aprendizaje y trastornos relacionados. En particular, los niños
con discapacidad para el aprendizaje tienen la probabilidad de obtener
puntuaciones bajas en el tercer factor, lo cual sugiere que la
distracción puede subyacer a algunas formas de este trastorno
(Farnham-Diggory, 1978; Kaufman, 1979 Smith, 1983). Parker y
Atkinson (1994 proporcionan una fundamentación y métodos
específicos para el cálculo preciso (por el contrario de la mera
estimación) de las puntuaciones factoriales del WISC-III.
102
MODELO DE INTELIGENCIA DE LA SB:CE
La más importante de las alteraciones de la SB:CE es un modelo
jerárquico de la inteligencia con múltiples subpruebas. En ediciones
anteriores, el examinador sólo obtenía una puntuación mixta de CI.
Aunque podía analizarse de manera cualitativa el patrón de
respuestas correctas e incorrectas, las pruebas anteriores no
proporcionaban una base para el análisis cuantitativo de los
subcomponentes de toda la escala. Esta deficiencia se corrige en la
SB:CE, que está formada por 15 subpruebas diseñadas para evaluar la
capacidad en cuatro áreas: verbal, abstracta/visual, cuantitativa y de
memoria a largo plazo. Debido a que las diferentes subpruebas son
adecuadas pana distintas edades, a un individuo sólo se le aplican de
8 a 10 subpruebas. Por tanto, la SB:CE produce hasta 10
puntuaciones de subprueba, cuatro puntuaciones de área y una
puntuación mixta (que ya no se denomina CI) basada en toda la
prueba.
103
g
Primer nivel
SUBPRUEBAS DE LA SS:CE
La última edición de la Stanford-Binet incluye 15 subpruebas, pero no
todas se aplican a todos los grupos por edad. Por ejemplo, Relaciones
Verbales y Construcción de Ecuaciones son demasiado difíciles para
niños pequeños y, por lo común, se aplican a personas de ocho años
en adelante. En contraste, Absurdos y Copiado son demasiado fáciles
para personas mayores y, por lo común, se aplican sólo a individuos
menores de 10 años de edad. Seis subpruebas abarcan todos los
grupos por edad: Vocabulario, Comprensión, Cuantificación, Análisis
de Patrones, Memoria de Cuentas y Memoria de Oraciones.
Razonamiento verbal
Vocabulario: Comienza con 14 reactivos pictóricos de vocabulario en
los que la tarea del niño pequeño consiste en identificar el objeto
representado en el dibujo; continúa con 32 palabras que er sujeto
debe definir. Las palabras difíciles de vocabulario son similares a:
renuente teratogénico pusilánime
Comprensión: Reactivos sencillos incluyen la identificación de partes
del cuerpo humano, mientras que los difíciles requieren juicio social,
razonamiento y evaluación. Un ejemplo de un reactivo difícil es:
¿Cuáles son algunas de las razonas por las que debe requerirse que
un trabajador nuevo se una al sindicato de trabajadores que
representa a sus compañeros?’
Absurdos: Esta subprueba se extiende sólo hasta los 9 años de edad
y requiere que la persona examinada identifique la incongruencia en
las ilustraciones Esta tarea demanda percepción de los detalles,
concentración y comprensión social. Un reactivo característico podría
representar a una persona que claramente camina hacia adelante en
la arena, con huellas al frente de olla, pero sin ninguna huella detrás.
106
Relaciones verbales: A la persona examinada se le lee (y también
puede ver) una lista de cuatro palabras, con instrucciones de expresar
la semejanza entre las primeras tres cosas, pero la diferencia con
respecto a una cuarta, Esta subprueba requiere formación de
conceptos y razonamiento verbal. Ejemplo: “¿En qué se diferencian
una marsopa un delfín y una ballena de un tiburón?”
Razonamiento abstracto/visual
Análisis de patrones: Los reactivos fáciles implican colocar formas
recortadas en los huecos de un tablero de formas, mientras que los
reactivos difíciles demandan que la persona reproduzca diseños
complejos por medio de cubos. Los reactivos difíciles requieren
organización perceptual y visualización, espacial, mientras que los
reactivos de tablero de formas requieren capacidades visomotoras y
de manipulación.
Copiado: En el caso de niños menores de 10 años, el sujeto debe
reproducir un modelo simple de cubos sólidos (para individuos muy
pequeños) o copiar un diseño con papel y lápiz. Esta subprueba
requiere que la Porsons integre los procesos perceptual y motor.
Matrices: La tarea de la persona consiste en seleccionar el objeto,
diseño o letra que complete mejor la matriz. Esta subprueba requiere
razonamiento perceptual y tiene fuertes cargas en inteligencia fluida.
Doblado y cortado de papel: Es una prueba de opción múltiple en la
que la persona examinada debe identificar cómo se vería un trozo de
papel que se ha doblado y cortado si se le desdoblara Esta subprueba
demanda visualización pensamiento espaciar y atención a señales
visuales. Doblado y cortado de papel contribuye de manera sustancial
al factor de Razonamiento no verbal/visualización.
Razonamiento cuantitativo
Cuantificación: Las tareas en esta subprueba van desde el conteo
simple hasta los conceptos y operaciones aritméticas más completos,
107
Esta subprueba es similar a Aritmética en las escalas Wechsler pero
depende menos de la educación formal. Un ejemplo de un reactivo
difícil es: “¿Cuántas losetas de 10cm por 10cm se necesitan para
cubrir una sección de piso de 1 m por 1 m?”
Series de números: La persona examinada debe llenar una
secuencia numérica con el siguiente número lógico. Esta subprueba
mide razonamiento lógico y requiere persistencia flexibilidad y un
enfoque de ensayo-error para los problemas difíciles. Un ejemplo de
un reactivo difícil es: “¿Cuales son los números siguientes?” 5,10, 9,
18, 17, 34, 33, _____, ____.
Construcción de Ecuaciones: El sujeto debe reordenar
correctamente una ecuación aritmética desordenada Como en el caso
de números, esta subprueba demanda lógica. Flexible y persistencia.
Un ejemplo de un reactivo difícil es:1/4 4 6 10 - / =
Memoria a corto plazo
Memoria de cuentas: Utilizando cuatro formas de cuentas de tres
diferentes colores (un total de 12 tipos da cuentas), la persona
examinada debe reproducir un diseño en fotografía colocando cuentas
reales en una estaca. Sin embargo, el diseño está a la vista sólo
durante cinco segundos de modo qué la tarea debe llevarse a cabo de
memoria. No tiene límite de tiempo.
Memoria de frases: La persona debe repetir al pie de la letra frases
presentadas de manera oral. Esta subprueba tiene fuertes cargas en
Comprensión verbal a edades de 2 a 7 años, pero es una buena
medidas factor de Memoria para sujetos mayores. Ejemplo de una
frase difícil es: “A medida que los profesores se hacen más viejos, en
general les parece cada vez menos importante publicar muchos
artículos breves cada año.
Memoria de dígitos: Esta subprueba es esencialmente idéntica a
Retención de Dígitos de las pruebas Wechsler. Mide memoria auditiva
108
a corto plazo y libertad de la distractibilidad. Incluye dígitos en orden
progresivo y dígitos en orden inverso.
Memoria de objetes: En esta subprueba, a la persona se le ¡nuestra
una serte de ilustraciones de objetos individuales a una frecuencia de
una por segundo. Después de que se han presentado todas las
tarjetas para un reactivo, al Individuo debe elegir los objetos
mostrados entre aquéllos presentados en una tarjeta que contiene de
5 a 13 elementos. Para obtener un crédito completo, el sujeto debe
señalar a los objetas cortados en el mismo orden en queso le
mostraron. Esta subprueba contribuye de manera sustancial al factor
di Memoria en todos los niveles de edad.
Nota: Estos reactivos se parecen a los de la Stanford-Binet, pero
en realidad no se encuentran dentro de la prueba.
109
los datos normativos para la SB:CE son bastante representativos de la
población blanco.
Con excepción de Memoria de Objetos, la confiabilidad de las
subpruebas de la SB:CE es buena, a juzgar por los coeficientes Kuder
Richardsin de consistencia interna dentro de los rangos de .80 y .90
obtenidos con casi todos los grupos por edad. La confiabilidad de
Memoria de objetos fue sólo regular, con coeficientes de consistencia
interna que por lo general se encuentran en la parte baja del tango de
.10. La confiabilidad de las puntuaciones de área es sobresaliente, en
especial cuando se utiliza un complemento Integro de subpruebas
para obtener una puntuación de área (los coeficientes de consistencia
interna se encuentran en la paste superior del rango de .90). La
puntuación mixta es excepcionalmente confiable, con coeficientes KR-
20 que van de .95, a la edad de dos años, a .99 a edades de 18 a 23
años. La confiabilidad test-retest se evaluó en muestras de niños de 5
y 8 años de edad. Con un intervalo promedio de 16 semanas entre
sesiones las confiabilidades en el retest se colocaron dentro del rango
de .90 para la puntuación mixta, mientras las puntuaciones de área y
de subprueba demostraron un patrón más variable por ejemplo,
muchas de las confiabilidades en el retest se colocaron en los rangos
de .60 y .70. que es demasiado bajo para la torna de decisiones
acerca de los individuos. En pocos casos, las confiabilidades de
subprueba fueron extremadamente bajas: .28 para Cuantificación, .46
para copiado y .51 para Razonamiento Cuantitativo, en la muestra de
niños de ocho dos de edad, y .56 para Memoria de Cuentas en el caso
de la muestra de niños de cinco años. Los examinadores harían bien
en interpretar con precaución las puntuaciones en estas subpruebas.
La SB:CE es, sin lugar a dudas, mejor que las ediciones anteriores de
esta prueba. Uno de los principales cambios -el desglose del
desempeño general en puntuaciones de área y subprueba- es una
adición bienvenida y útil al examen de la inteligencia; además,
incorpora una buena cantidad de reactivos muy fáciles en la mayor
parte de las subescalas. En consecuencia, el examinador obtiene una
imagen mucho más precisa del funcionamiento de bajo nivel en niños
y adultos jóvenes. Para la evaluación del retaso mental o el daño
cerebral significativo, la SB:CE es superior a casi todos sus
competidores, en especial aquéllos corno el WAIS-R cuyo CI Total
“toca fondo” a mitad en las puntuaciones 50. Otra ventaja de la SB:CE
es que cuatro subpruebas evalúan memoria a corto plazo. Cuando el
problema de referencia implica memoria a corto plazo. Cuando el
probable que la SB:CE sea el instrumento a elegir.
116
La DTLA-4 se estandarizó con 1350 estudiantes cuyos antecedentes
eran muy semejantes a los datos del censo en cuanto a sexo, raza,
residencia urbana/rural, ingreso familiar, Jopos educativos de los
padres y área geográfica. La confiabilidad de este instrumento es
similar a la de otras pruebas individuales de inteligencia, con
coeficientes de consistencia interna que por lo general superan a .80
en el caso de las subpruebas, y a .90 en el caso de las puntuaciones
mixtas. Asimismo, los coeficientes test-retest para las subpruebas y
puntuaciones mixtas se encuentran en los rangos de .80 y .90. La
validez relacionada con el criterio se estableció adecuadamente a
través de estudios correlativos con otros instrumentos establecidos,
como el WISC-III, K-ABC y la Batería Woodcock-Johnson.
117
TEST BREVE DE INTELIGENCIA DE KAUFMAN (K-BIT)
Las pruebas de inteligencia analizadas antes y en el tema anterior son
medidas excelentes de la capacidad intelectual, pero no dejan detener
defectos. Un problema es el tiempo que se requiere para aplicarlas.
Las sesiones de prueba con las Escalas Wecbsler, la Batería Kaufman
de Evaluación para Niños y la Stanford-Binet pueden durar una hora y
no es poco común que se utilicen dos horas si el niño es inteligente y
propenso a hablar demasiado. Una segunda desventaja de estas
pruebas tan conocidas es la cantidad de entrenamiento que se
requiere para aplicarlas. La aplicación adecuada de la mayoría de las
pruebas individuales de inteligencia se basa en la suposición de que el
examinador tiene un título a nivel avanzado en psicología o en un
campo relacionado y que ha tenido amplia experiencia bajo
supervisión con los instrumentos en cuestión.
120
RESPONDA SEGÚN CORRESPONDA:
1.- La primera escala de inteligencia Wechsler – Bellevue (1939) se
diseño para rectificar varios defectos que se habian observado
en las pruebas anteriores entre ellas:
a.-
b.-
c.-
d.-
2.- Señale Ud. Dos características comunes de la prueba Wechsler:
a.-
b.-
3.- Wechsler en 1939, definió la inteligencia como: “la capacidad
total o global del individuo para actuar de manera propositiva,
pensar de manera racional y manejar de manera eficaz su
ambiente:
V( ) F( )
4.- Refierase brevaemnte a la estandarizacion del Wais III:
------------------------------------------------------------------------
---------------------------------------------------------------------------
---------------------------------------------------------------------------
---------------------------------------------------------------------------
---------------------------------------------------------------------------
---------------------------------------------------------------------------
-----------------------------------
121
PRUEBAS GRUPALES DE
INTELIGENCIA
Una prueba grupal de inteligencia permite evaluar de manera rápida y
eficiente a docenas o cientos de personas al mismo tiempo. En este
tema se presenta al lector una muestra de pruebas grupales destacas.
Para bien o para mal, el número de pruebas grupales que se
comercializan en la actualidad es simplemente sorprendente –se
encuentran disponibles veintenas de ellas. En los números recientes
del Mental Measurements Yearbook (Mitchell, 1985; Conoley y
Kramer, 1989, 1992) y de la serie de Test Critiques (Keyser y
Sweetland, 1984-1988) se presentan varias docenas de registros,
además de que cada año se publican instrumentos nuevos. La
cobertura amplia de este campo en crecimiento es simplemente
imposible. En consecuencia, aquí la información se centra en las
122
interrogantes surgidas de las pruebas grupales y después se revisará
un muestrario ecléctico de estos diversos instrumentos.
126
obtenerse, como se señaló antes, Información valiosa acerca de la
actitud de las personas hacia la prueba.
ANTECEDENTES DESCRIPCIÓN
La MAB se diseñé para producir subpruebas y factores paralelos a los
del WAIS-R, pero con el empleo de un formato de opción múltiple que
puede calificarse por computadora. El objetivo aparente en el diseño
de esta prueba consistió en producir un instrumento que pudiera
aplicarse a docenas o cientos de personas con la presencia de un solo
examinador (y quizá unos cuetos supervisores de examen) con el
mínimo entrenamiento. Además, la MAB se diseñó para obtener
puntuaciones de CI que tienen propiedades psicométricas similares a
las encontradas en el WAIS-R. La MAB es apropiada para individuos
de 16 a 74 años de edad y proporciona 10 puntuaciones de
subprueba, así como CI Verbal, de Ejecución y Total.
128
Aunque utiliza reactivos originales de pruebe la MAB es principalmente
un clon elaborado del WAIS-R, idéntico en todas las subpruebas. Las
10 subpruebas de la MAB se muestran a continuación:
Verbal Ejecución
Información Símbolos y Dígitos
Comprensión Figuras Incompletas
Aritmética Espacial
Semejanzas Ordenación de Dibujos
Vocabulario Composición de Objetos
129
Figura 4.1: Reactivos de dmostración de tres pruebas de ejecución
de la MAB.
Fuente: Reproducido con autorización de Jackson D.N. (1984ª).
Manual for the Multimensional Aptitude Battery Port Huron MI: Sigma
Assessment Systems, Inc. (800) 256-1285.
CARACTERÍSTICAS TÉCNICAS
La primera publicación de la MAB (Jackson, 1984a) no se estandarizó
de la manera tradicional, donde las puntuaciones se vinculan con el
desempeño de muestras grandes y representativas, estratificadas
según variables como sexo, raza, residencia urbana-rural, ocupación
de los padres, región geográfica y similares. En lugar de ello, los
autores siguieron una estrategia de calibración de las puntuaciones de
la MAB con el WAIS-R como prueba de referencia. Para derivar la
fórmula lineal de calibración, se aplicaron tanto el WAIS-R como la
MAB, en forma contrabalanceada, a una nuestra de estudiantes
universitarios (n = 18), estudiantes del último año de educación
media superior (n = 74), pacientes psiquiátricos hospitalizados (n =
58) e individuos bajo libertad condicional (n = 10). Los examinados,
117 varones y 43 mujeres, tenían edades de los 16 a los 35 años. Los
coeficientes de correlación entre los CI de la MAB y del WAIS-R fueron
de .82, .65 y .91 para los CI Verbal, de Ejecución y Total,
respectivamente. De hecho, las tablas normativas presentadas en el
Manual reflejan una transformación lineal simple de las puntuaciones
naturales de la MAb a los CI del WAIS-R para esta muestra inicial de
160 personas
El Manual presenta varios estudios de confiabilidad de consistencia
interna y test-retest; en general, los resultados son bastante
notables. Por ejemplo, en un estudio con más de 500 adolescentes
entre 16 y 20 años de edad, la confiabilidad de consistencia interna de
131
los CI Verbal, de Ejecución y Total se colocó en la parte superior del
rango de SO. En un estudio test- retest con 52 pacientes psiquiátricos
jóvenes, las subpruebas individuales mostraron confiabilidades que
iban de .83 a .97 (mediana .90) para la escala Verbal, y de .87 a .97
(mediana .91) para la escala de Ejecución. Estos resultados se
comparan de manera bastante favorable con los estándares
presentados para el WAIS-R (Wechsler. 1981).
Los análisis factoriales de la MAB ofrecen un fuerte apoyo a la validez
de constructo de este instrumento (Lee, Wallbrown y BIaha, 1990;
Wallbrown, Carmin y Barnett, 1988). En un análisis factorial con las
puntuaciones de 3121 varones y mujeres, estudiantes de bachillerato,
el Manual presenta un factor general con cargas de moderadas a altas
para todas las sub-pruebas (de .53 a .82). En un análisis factorial
independiente con los datos de los individuos de estandarización, Lee,
Wallbrown y BIaha (1990) encontraron dos factores ortogonales
después del primer factor general. Estos dos factores rotados pueden
identificarse con toda claridad como factores Verbal y de Ejecución.
Además, otros investigadores han señalado la congruencia
extremadamente fuerte entre los análisis factoriales del WAIS-R (sin
Retención de Dígitos) y de la MAB. En una muestra de gran tamaño de
internos, Ahrens, Evans y Barnett (1990) observaron cambios
confirmatorios de validez en las puntuaciones de la MAB en relación
con el nivel educativo. Así, existen buenas justificaciones para utilizar
las escalas independientes Verbal y de Ejecución en la MAB.
En general, la validez de la MAB depende de su muy fuerte semejanza
física y empírica con su prueba madre, el WAIS-R. Los datos,
correlativos entre las puntuaciones de ambas son importantes en este
sentido. Para 145 personas heterogéneas a las que se les aplicaron la
MAB y el WAIS-R en forma contrabalanceada, las correlaciones entre
ellas fueron de a.44 (Espacial/Diseño con Cubos) a .89 (Aritmética y
Vocabulario), con una mediana de .78. Las correlaciones entre los CI
132
del WAIS-R y MAB fueron muy saludables; es decir, .92 para CI
Verbal, .79 para el CI de Ejecución y .91 para el CI Total (Jackson,
1984a). Sólo con algunas excepciones, las correlaciones entre las
puntuaciones de la MAB y del WAIS-R aquéllas entre el WAIS y el
WAIS-R.
ANTECEDENTES Y DESCRIPCIÓN
La SILS se conforma de dos subpruebas, vocabulario y abstracciones.
La intención original de la prueba era detectar el deterioro orgánico
intelectual al contrastas el desempeño en las secciones de vocabulario
134
y abstracciones. Se consideraba que el deterioro orgánico tenía
relativamente poco efecto sobre el vocabulario, y que la capacidad de
abstracción mostrarla una disminución significativa. Por tanto, una
gran discrepancia en favor de vocabulario sobre abstracciones
parecería significar la presencia de alteración orgánica. Sin embargo,
numerosos estudios y revisiones concluyeron que la SILS tiene un
desempeño deficiente como índice del daño orgánico (p. ej., Yates.
l954; Johnson, 1987) por lo que se utiliza pocas veces con este
propósito.
La SILS consiste en 40 reactivos de opción múltiple para vocabulario y
20 para pensamiento abstracto; cada reactivo se califica como
correcto o incorrecto. Los reactivos abstractos cuentan doble, de
modo que la máxima puntuación en cada mitad de la prueba es de 40
puntos. También se presenta una puntuación mixta. La prueba se
autoaplica con un límite de tiempo de 10 minutos para cada una de
las dos secciones. Algunos usuarios favorecen el uso de la prueba sin
límite de tiempo y se han elaborado normas independientes para este
enfoque (Heinemann, Harper, Friedman y Whitney. 1985). Pocas
personas necesitan más de 10 minutos por sección; la mayoría de los
examinadores consideran que la SILS puede ser completamente una
medida de poder. También existe una versión de la prueba para
microcomputadora; la computadora aplica y califica la prueba y
produce un informe narrativo y una representación gráfica de las
puntuaciones.
En la sección de vocabulario, la tarea de la persona examinada
consiste en seleccionar el sinónimo de una palabra entre cuatro
alternativas. Los 40 reactivos se parecen a los siguientes:
• NAVE casa árbol tenedor barco
• PUERIL gordo oportuno necio seco
La puntuación de vocabulario es el número correcto más un punto por
cada cuatro reactivos omitidos. Sumar los puntos pan los reactivos
135
omitidos proporciona una corrección para la negativa a adivinar. Como
resultado de este factor de corrección, la puntuación mínima es
aproximadamente de 10 entre 40 puntos.
La intención era que los reactivos de abstracción deberían requerir
que la persona examinada obtuviera por inducción algún principio
común para una serie dada de componentes y después demostrara su
comprensión de este principio terminado la serie. Cada reactivo es
una serie de letras o números seguidos de espacios en blanco para
indicar el número de caracteres en la respuesta. Los 20 reactivos se
parecen a los siguientes:
• A B D G K
• nao pan arar sara 2 6 8 ___ ___ ___
• 135 341 52 12___
La persona debe terminar cada serie y colocar la respuesta apropiada
en los espacios en blanco. (Las respuestas a los reactivos anteriores
son P, 962 y 3). Por supuesto, para obtener la respuesta correcta, el
individuo debe inferir la regla que determina la progresión de los
estímulos en cada reactivo y después utilizar la regla para determinar
la continuación. (En el reactivo 1, la distancia entre letras aumenta
aritméticamente; en el reactivo 2, los pares son imágenes de espejo
una de la otra, excepto por la última y la primera letra que aumentan
por uno -de o-p. r-s; en el reactivo 3, cada grupo de números suma
uno menos que el grupo anterior - 9, 8, 7, …).
CARACTERÍSTICAS TÉCNICAS
Zachary (1986) ha publicado normas recientes para la SILS con base
en 290 pacientes psiquiátricos diversos que también realizaron el
WAIS. La muestra contiene números aproximadamente iguales de
varones y mujeres; esta muestra normativa es de jóvenes: la mayoría
se encuentran entre 16 y 54 años, con una mediana de edad de 30
años. Con base en esta muestra, el manual contiene tablas de
136
puntuaciones T corregidas según edad (media de 50, DE de 10) para
vocabulario y abstracciones. Contra el consejo de numerosos
investigadores anteriores, el autor del Manual de la SILS también
introdujo el Cociente de Abstracción (CA), un nuevo índice de
deterioro basado en la diferencia entre las puntuaciones de
Vocabulario y Abstracciones. El CA se obtiene al comparar la
puntuación pronosticada contra la puntuación obtenida en
abstracciones. La puntuación pronosticada se obtiene de una ecuación
de regresión que utiliza la puntuación de vocabulario, la edad Y el
nivel educativo. El CA es una mejoría sobre los índices anteriores de
deterioro en cuanto’ que, para su cálculo, se toman en cuenta 1$
disminuciones que ocurren de manera natural con la edad. Las
personas con esquizofrenia y otros individuos con disminución en su
eficiencia intelectual tienden a obtener bajos CA. Sin embargo, existen
causas no patológicas para un CA bajo (p. ey, desagrado por los
conceptos abstractos) y, por tanto, la utilidad de este índice está
sujeta a dudas.
ANTECEDENTES Y DESCRIPCIÓN
La CogAT se derivó de las Pruebas de inteligencia Lorge-Thorndike,
una de las primeras pruebas grupales de inteligencia que tenía el
propósito de utilizarse ampliamente dentro de los sistemas escolares.
La CogAT es, en primer término, una medida de la capacidad escolar,
pero también incorpora una batería de razonamiento no verbal con
reactivos que no tienen relación dinas con la educación formal en la
escuela. Las dos baterías principales, adecuadas para alumnos desde
jardín de niños hasta tercer grado, se analizan de manen breve al
final de esta sección. Aquí se revisa la edición multinivel dirigida a
estudiantes de 3º al 10º grados.
Las nueve subpruebas de la CogAT Multinivel se agrupan en tres
baterías como sigue:
140
Batería Batería Batería
verbal cuantitativa no verbal
Razonamiento Relaciones Gasificación
Verbal Cuantitativas de Figuras
Frases Series de Analogías de
Incompletas Números Figuras
Analogías Construcción Análisis de
Verbales de Ecuaciones Figuras
CARACTERÍSTICAS TÉCNICAS
La CogAT se normó conjuntamente (estandarización concurrente) con
tres pruebas de aprovechamiento, las Iowa Tests of Basic Skills
(Pruebas Iowa de Habilidades Básicas), las Test of Achievement and
Profidency (Pruebas de Ejecución y Rendimiento) y las Iowa Tests of
Educational Development (Pruebas Iowa de Desarrollo Educativo). La
estandarización concurrente con medidas de rendimiento es una
práctica común y deseable en el establecimiento de normas para
pruebas de inteligencia con niveles múltiples. La virtud particular de la
normatización conjunta es que se determina con gran precisión la
correspondencia esperada entre las puntuaciones de inteligencia y de
rendimiento. Como consecuencia, los examinadores pueden identificar
con exactitud a los estudiantes de bajo rendimiento que necesitan
regularización o de mayor evaluación para descartar una posible
discapacidad para el aprendizaje.
143
Verbal, Cuantitativa y No verbal son sustanciales. Los valores
medianos en todos los grados son los siguientes:
Verbal y Cuantitativa: .78
No verbal y Cuantitativa .78
Verbal y no verbal .72
Dado que la batería Cuantitativa ofrece pocos aspectos únicos, desde
un punto de vista puramente psicométrico no existe justificación para
incluirla. Sin embargo, los autores de la prueba recomiendan utilizar
todas las baterías con la esperanza de que las diferencias en
desempeño ayudarán a los profesores en la planificación de
estrategias de regularización. Sin embargo, los autores no defienden
mucho esta afirmación.
ANTECEDENTES Y DESCRIPCIÓN
La CFIT ha atravesado por varias revisiones, surgiendo en su
apariencia actual en 1961. La prueba consiste en tres versiones: la
Escala 1 se utiliza con adultos con retraso mental y niños entre 4 y 8
años de edad; la Escala 2 se emplea con adultos dentro del rango
promedio de inteligencia y con niños entre 8 y 13 años de edad; y la
Escala 3 es para adultos con alto nivel de capacidad y para
estudiantes de bachillerato y universidad. La Escala 1 implica una
considerable interacción entre el examinador y la persona evaluada —
cuatro de las subpruebas se deben aplicar de manera individual. Así,
en algunos aspectos la Escala 1 es más una prueba individual de
inteligencia que una prueba grupal. Aquí se analizan sólo ¡as Escalas 2
y 3, dado que atas son en realidad pruebas grupales de inteligencia.
Estas dos pruebas difieren principalmente en el nivel de dificultad.
Para cada escala se encuentran disponibles dos formatos equivalentes
llamados Forma A y Forma B. Los autores de la prueba recomiendan
aplicar ambas formas a cada individuo para retener lo que se
denomina prueba completa. Cada forma en si misma se conoce como
forma corta. A pesar de la recomendación de utilizar ambas formas
como una prueba combinada, es muy común que los usuarios de la
CFIT dependan de una sola forma breve con propósitos de detección.
Cada forma incluye cuatro subpruebas, Series, Clasificación, Matrices
y Condiciones. En la figura 6-9 se presentan reactivos de muestra. Por
supuesto, cada subprueba está precedida por varios reactivos de
práctica. La prueba completa está hábilmente organizada en un
protocolo de ocho páginas.
145
Figura 4.2. Reactivos de muestra de Prueba de inteligencia
culturalmente justa.
CARACTERÍSTICAS TÉCNICAS
Las muestras de estandarización para las Escalas 2 y 3 fueron
respetablemente grandes, pero no se describen con suficiente detalle
como para determinar el grado en que reflejan a la población general.
Las muestras de estandarización se caracterizan como sigue:
El grupo de estandarización para la Escala 2 está por 4 328 varones y
mujeres tomados como muestra en diversas regiones de EUA y Gran
Bretaña. Las normas de la Escala 3 se basan en 3140 casos, que
Incluyen a alumnos estadounidenses de bachillerato, divididos por
igual entre los últimos cuatro años de educación medía superior, y
jóvenes adultos en una muestra laboral estratificada (IPAT, 1973).
Las puntuaciones naturales se convienen a una puntuación estándar
normalizada de CI con media de 100 y desviación estándar de 16.
Las confiabilidades test-retest de formas alternas y de consistencia
interna se encuentran en general en el rango de .70 para las formas
individuales de las Escalas 2 y 3. Las confiabilidades de la prueba
completa son más altas, en general a la mitad del rango de .80. Estos
resultados se basan en docenas de estudios con miles de personas e
indican un grado respetable de confiabilidad para un instrumento tan
corto (IPAT, 1973).
148
…Las culturas difieren con respecto a la Importancia que le dan a la
competencia con los compañeros en la ejecución de tareas o en la
solución, de problemas, a la velocidad o calidad de la ejecución y a
una variedad de otras conductas relacionadas con pruebas. Algunas
culturas enfatizan la solución concrete de los problemas más que la
abstracta, llegando con frecuencia al grado deque un problema carece
de significado excepto en un entorno concreto. El mero concepto de
contestar una prueba inventada de manera artificial carece de sentido
en dichas situaciones (Koch, 1984).
ANTECEDENTES Y DESCRIPCIÓN
En un principio, la prueba RPM se diseñó como una medida del factor
g de Spearman (Raven, 1938). Por esta razón, Rayen eligió un
formato especial de prueba que supuestamente requería el ejercicio
de g. Se recuerda al lector que Spearman definió a g como la
“deducción de correlatos”. El término deducción se refiere al proceso
de inferencia de relaciones con base en semejanzas fundamentales
percibidas entre estímulos. En particular, para responder de manera
correcta a las RPM, los individuos examinados deben identificar un
patrón recurrente de relación entre los estímulos figurativos
organizados en una matriz de 3 x 3. Los reactivos le clasifican en
orden de dificultad creciente, de aquí la referencia a las matrices
progresivas.
CARACTERÍSTICAS TÉCNICAS
En Raven y Summers (1986) se presentan las normas para Matrices
Progresivas en Color y Estándar, obtenidas con grandes muestras en
EUA. Se incluyen normas independientes para mexicano-
estadounidenses y afroestadounidenses. Aunque no se hizo el intento
de utilizar un procedimiento de muestreo aleatorio estratificado, la
selección de distritos escolares fue tan ampliamente variada que las
normas estadounidenses para niños parecen sólidas en un nivel
razonable. Sattler (1988) resume las normas pertinentes para todas
las versiones de la RPM. Recientemente. Rayen, Court y Rayen (1992)
produjeron nuevas normas para la prueba de Matrices Progresivas
Estándar, pero Gudjonsson (1995) ha hecho surgir la duda deque
estos datos se hayan visto comprometidos debido a que no hubo
vigilancia durante la prueba.
153
(a)
(b)
157
1.- Las pruebas grupales de inteligencia difieren de las individuales en
cinco aspectos:
a.-
b.-
c.-
d.-
e.-
Ventaja:
Desventaja:
V( ) F( )
V() F( )
158
5.- Describa brevemente la escala Shipley Institute of Living ( SILS)
--------------------------------------------------------------------------
------------------------------------------------------------------------------
------------------------------------------------------------------------------
------------------------------------------------------------------------------
------------------------------------------------------------------------------
------------------------------------------------------------------------------
-----------------
6.- El Test de Matrices Progresivas de Raven (RPM) se diseño
originalmente como una medida del factor g de separman y es una
prueba no verbal de razonamiento inductivo que se basa en estimulos
figurativos.................
V( ) F( )
159
RESPUESTAS DE LAS ACTIVIDADES
PRIMERA ACTIVIDAD:
1.-
A.- La capacidad para aprender de la experiencia.
b.- La capacidad para adaptarse al propio ambiente.
2.-
Jean Piaget
3.-
a.- Sensorio – Motora. (nacimiento a los dos años)
b.- Pre operacional. (2 a 6 años).
c.- Operaciones Concretas (7 a 12 años)
d.- Operaciones Formales. (12 años en adelante)
4.-
V (X ) F( )
5.-
V() F(X)
160
SEGUNDA ACTIVIDAD
1.-
a.- Motora Gruesa.
b.- Motora Fina
c.- Desarrollo del Lenguaje.
d.- Conducta Adaptativa y Personal Social.
2.-
V(X) F()
3.-
V(X) F( )
4.-
a.- Exploracion Visual y Permanencia del Objeto
b.- Desarrollo de Medios – Fines-
c.- Imitación Vocal y de Ademanes
d.- Desarrollo de la Causalidad Operacional.
e.- Construcción de Relaciones de Objeto en el
Espacio.
f.- Desarrollo de Esquemas Para Relacionarse con
Objetos.
5.-
V( ) F (X )
161
TERCERA ACTIVIDAD
1.-
a.- Los reactivos de prueba que no tenian atractivo para
las personas adultas.
b.- Demasiadas preguntas enfatizaban la mera
manipulación de las palabras.
c.- Las instrucciones enfatizaban la velocidad a
expensas de la precision.
d.- Depender de la edad mental era irrelevante en el
caso de las pruebas con adultos.
2.-
a.- De 10 a 14 sub pruebas, el enfoque de sub pruebas
multiples permite que el examinador analice las fortalezas
intraindividuales, en lugar de calcular una sola puntuación global.
b.- Una prueba verbal compuesta de cinco a seis sub
pruebas y una escala de ejecución que tambien incluye cinco o seis
sub pruebas. Con esta división el examinador puede evaluar las
habilidades de comprensión verbal y organización perceptual por
separado..........entre otras.
3.-
V(X) F( )
4.-
5.-
V( ) F(X)
162
CUARTA ACTIVIDAD
1.-
a.- Formato de opcion multiple, contra formato de
preguntas abiertas.
b.- Calificación mecanioca objetiva contra calificacio del
examinador.
c.- Aplicación grupal contra individual.
d.- Empleo con fines de detección contra empleo para
planificación y regularizacion.
e.- Muestreos enormes de estandarizacion contra
muestras simplemente grandes.
2.-
Ventaja:
Puede examinarse con rapidez y eficacia a grandes grupos de
personas.
Desventajas:
El individuo evaluado puede tener puntuaciones muy por debajo de
su verdadera capacidad debido a problemas motivacionales o
dificultad para seguir instrucciones.
3.-
V(X) F( )
4.-
V( ) F(X)
5.-
6.-
V(x ) F( )
164
• Robert J. Gregory, “EVALUACIÓN PSICOLÓGICA” – Editorial:
Manual Moderno, 4ª Edición – México, 2006.
• Bem, D. Funder D. Test Psicologicos de Inteligencia
Editorial American Psychological – 1999
. Campbell, D. P. Manual de medicion de la inteligencia
Editorial Mineapolis – E.U.A. 1997.
. Golberg, p. Evaluacion psicologica
Baterias Psicologicas
Editorial : Allyn y Bacon – E.U.A. 1998.
165